CN108805958A - 一种图片处理方法和装置 - Google Patents

一种图片处理方法和装置 Download PDF

Info

Publication number
CN108805958A
CN108805958A CN201810266755.4A CN201810266755A CN108805958A CN 108805958 A CN108805958 A CN 108805958A CN 201810266755 A CN201810266755 A CN 201810266755A CN 108805958 A CN108805958 A CN 108805958A
Authority
CN
China
Prior art keywords
character string
picture
add
ins
strings
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810266755.4A
Other languages
English (en)
Inventor
刘双喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810266755.4A priority Critical patent/CN108805958A/zh
Publication of CN108805958A publication Critical patent/CN108805958A/zh
Priority to PCT/CN2019/070040 priority patent/WO2019184539A1/zh
Priority to TW108101009A priority patent/TWI698835B/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本说明书实施例公开了一种图片处理方法和装置,所述方法包括:在用户打开图片之后,响应于用户操作,接收用户的语音;从所述语音识别出第一字符串,作为添加项;以及在所述图片上添加所述添加项。

Description

一种图片处理方法和装置
技术领域
本说明书实施例涉及图像处理领域,更具体地,涉及一种图片处理方法和装置。
背景技术
随着互联网技术的发展,人们越来越多的在社交平台中发布图片或者向好友发送图片。例如,在朋友圈发布物品的图片以推广该物品。在该情况中,需要在图片中标注物品的一些特征,如尺寸、材料、细节、外观等等。再例如,在朋友圈发布自己的照片。在该情况中,人们可能希望在图片中标注出自己的心情、感受等。目前的方案是,通过一些图片编辑软件手工标注尺寸、材质、心情、感受等信息。因此,需要一种更有效的图片处理方法,以方便、快速地在图片中进行标注打标签。
发明内容
本说明书实施例旨在提供一种更有效的,以解决现有技术中的不足。
为实现上述目的,本说明书一个方面提供一种图片处理方法,包括:在用户打开图片之后,响应于用户操作,接收用户的语音;从所述语音识别出第一字符串,作为添加项;以及在所述图片上添加所述添加项。
本说明书另一方面提供一种图片处理方法,包括:在用户打开图片之后,响应于用户操作,接收用户的语音;从所述语音识别出第一字符串;根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项;以及在所述图片上分别添加所述至少一个添加项。
在一个实施例中,在上述图片处理方法中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的字符串,作为添加项。
在一个实施例中,在上述图片处理方法中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第三字符串,其中,所述第三字符串为表示量的单位的字符串,并且在所述第一字符串中,在所述第三字符串之前为数字字符串,以及,获取顺序包括所述数字字符串和所述第三字符串的字符串作为添加项。
在一个实施例中,在上述图片处理方法中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第四字符串作为添加项,其中,所述第四字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
在一个实施例中,在上述图片处理方法中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第五字符串,其中,所述第五字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
在一个实施例中,上述图片处理方法还包括,在用户打开图片之后,根据用户选择的图片应用场景,获取预设为与所述场景对应的至少一个图形作为至少一个添加项,以及在所述图片上分别添加根据所述场景获取的至少一个添加项。
在一个实施例中,在上述图片处理方法中,所述图片应用场景为商品营销场景,以及,其中,预设为与所述商品营销场景对应的至少一个图形包括:标尺、标签、图框和箭头。
在一个实施例中,在上述图片处理方法中,所述根据预设的关键字符串库包括,根据与用户选择的图片应用场景对应的关键字符串库。
在一个实施例中,在上述图片处理方法中,所述场景为商品营销场景,以及,其中,与所述场景对应的关键字符串库包括关于以下属性的关键字符串:材质、尺寸、颜色、价格和外观。
在一个实施例中,上述图片处理方法还包括,在接收用户的语音之前或之后,在屏幕上显示与所述图片应用场景对应的语音输入内容提示。
在一个实施例中,上述图片处理方法还包括,在图片中添加所述添加项之后,根据用户手势或输入进行以下至少一种修改:改变所述添加项的位置、改变所述添加项的尺寸、编辑所述添加项的内容、以及删除所述添加项。
在一个实施例中,在上述图片处理方法中,所述用户打开图片包括,用户在其终端的相册中打开图片、用户在社交APP中打开图片、或者用户在用于执行所述方法的APP中打开图片。
本说明书另一方面提供一种图片处理装置,包括:接收单元,配置为,在用户打开图片之后,响应于用户操作,接收用户的语音;识别单元,配置为,从所述语音识别出第一字符串,作为添加项;以及添加单元,配置为,在所述图片上添加所述添加项。
本说明书另一方面提供一种图片处理装置,包括:接收单元,配置为,在用户打开图片之后,响应于用户操作,接收用户的语音;识别单元,配置为,从所述语音识别出第一字符串;获取单元,配置为,根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项;以及添加单元,配置为,在所述图片上分别添加所述至少一个添加项。
本说明书另一方面提供一种计算机可读的存储介质,其上存储有指令代码,所述指令代码在计算机中执行时,令计算机上述图像处理方法。
附图说明
通过结合附图描述本说明书实施例,可以使得本说明书实施例更加清楚:
图1示意示出了根据本说明书实施例的系统100;
图2示出了根据本说明书实施例的一种图片处理方法的流程图;
图3示出了根据本说明书实施例的一种图片处理方法的流程图;
图4示出了商品营销场景的示例;
图5示意示出在商品营销场景下,屏幕上的语音输入内容提示;
图6示出了在图片上分别添加的文本添加项、标签添加项、及标尺添加项的示意图;
图7示出了根据本说明书实施例的一种图片处理装置700;以及
图8示出了根据本说明书实施例的一种图片处理装置800。
具体实施方式
下面将结合附图描述本说明书实施例。
图1示意示出了根据本说明书实施例的系统100。如图1所示,系统100包括显示单元11、语音接收单元12、语音识别单元13、获取单元14、关键字符串库15以及图片编辑单元16。首先,用户通过显示单元11打开图片。在打开图片之后,用户可通过语音接收单元12的接口触发语音接收单元12。例如,通过长按屏幕上显示的麦克风图标,从而触发语音接收单元12开始接收语音。在用户断开语音接收单元12的接口(例如,松开所述麦克风图标)之后,语音接收单元12将接收到的语音发送给语音识别单元13。语音识别单元13通过语音识别功能将接收的语音识别为字符串,该字符串可包括文字、数字、字母、符号等。在一个实施例中,语音识别单元13将识别出的字符串发送给图片编辑单元16,从而图片编辑单元16在图片上添加所述字符串。在另一个实施例中,语音识别单元将识别出的字符串发送给获取单元14,获取单元14通过调用关键字符串库15,而将所述字符串与所述词库中的关键字符串进行匹配,从而获取所述字符串中的关键字符串、或对应的字符串组合、或对应的图形作为添加项,并将该添加项发送给图片编辑单元16。之后,图片编辑单元16在图片上添加所述添加项。
图2示出了根据本说明书实施例的一种图片处理方法的流程图。所述方法包括:在步骤S21,在用户打开图片之后,响应于用户操作,接收用户的语音;在步骤S22,从所述语音识别出字符串,作为添加项;以及在步骤S23,在所述图片上添加所述添加项。
首先,在步骤S21,在用户打开图片之后,响应于用户操作,接收用户的语音。这里,不限定用户打开图片的设备,例如,用户可在便携式智能设备中打开图片,或者,用户可在计算机中打开图片。当用户在例如手机中打开图片时,不限定用户具体的打开位置。例如,用户可在带有根据本说明书实施例的图片处理功能的手机相册中打开图片、可在带有根据本说明书实施例的图片处理功能的社交APP(例如朋友圈、生活圈等)中打开图片,或者可在用于执行根据本说明书实施例的图片处理方法的APP中打开图片。
用户在打开图片之后,可进行用于打开语音接收的接口的操作。例如,在用户通过计算机打开图片的情况中,用户可通过打开麦克风以开始计算机的语音接收。在用户使用手机打开图片的情况中,用户可长按屏幕上的麦克风图标,以开始手机的语音接收。在一个实施例中,用户可单点屏幕上的麦克风图标(该图标位于图片外部),然后长按图片中的特定位置,进行语音输入。从而可以在图片中的特定位置插入通过语音识别获得的标签。
在步骤S22,从所述语音识别出字符串,作为添加项。这里,可通过已有的语音识别功能进行语音识别。从而从输入的语音识别出对应的字符串。所述对应的字符串可包括汉子字符、数字字符、字母字符、或符合字符等。
在步骤S23,在所述图片上添加所述添加项。即,将上述字符串作为文本框添加到图片中。在一个实施例中,用户长按屏幕中的麦克风图标进行语音输入,在该情况中,系统将所述添加项随机添加到图片中的一个位置。在另一个实施例中,用户在单点麦克风图标之后,长按图片中的特定位置进行语音输入,在该情况中,系统将所述添加项添加到图片中的特定位置。
在一个实施例中,在用户打开图片之后,根据用户选择的图片应用场景,获取预设为与所述场景对应的至少一个图形作为至少一个添加项,以及在所述图片上分别添加根据所述场景获取的至少一个添加项。例如,当在根据本说明书实施例的图片处理APP中进行所述图片处理时,APP可提供多个场景的选择按钮。所述多个场景例如包括:商品营销场景、自拍场景、教学场景、婚介场景等。在该APP中,用户可在打开图片之前预先选择好场景,也可以在打开图片之后选择场景。在该APP中,对部分场景预设对应的图形,例如,对于商品营销场景,预设对应的图形包括,标尺、标签、图片、箭头等。从而,在用户打开图片之后,在用户选择了商品营销场景的情况下,APP自动获取对应的图形标尺、标签等,并在图片上自动添加标尺和标签。本领域技术人员可以理解,这里在APP中打开图片只是为了示例说明,例如,用户也可以在手机相册中打开图片,并在图片打开之后选择图片应用场景。
在一个实施例中,在接收用户的语音之前或之后,在屏幕上显示与所述图片应用场景对应的语音输入内容提示。
在添加了所述添加项之后,用户可对该添加项进行各种操作。例如,在用户使用手机的情况中,用户可以通过手势,改变所述添加项的位置、改变所述添加项的尺寸,例如通过按着添加项在屏幕上滑动,以将添加项调整到新的位置,通过两个手指对所述添加项进行旋转,而调整添加项的角度,通过在添加项的对角线方向滑动两个手指,从而调整添加项的大小等。另外,用户可在所述添加项中输入新的字符或删除已有的字符,或者,用户通过长按所述添加项,以显示更多的操作按钮,例如,删除按钮,从而进行更多的对该添加项的编辑操作。
图3示出了根据本说明书实施例的一种图片处理方法的流程图。所述方法包括:在步骤S31,在用户打开图片之后,响应于用户操作,接收用户的语音;在步骤S32,从所述语音识别出第一字符串;在步骤S33,根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项;以及在步骤S34,在所述图片上分别添加所述至少一个添加项。
该方法中的步骤S31和S32与图2中的步骤S21和S22基本相同,在此不再赘述。
在步骤S33,根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项。
在一个实施例中,所述第二字符串为所述第一字符串。
所述关键字符串库可通过人工整理、或机器学习获得。其可以包括对应于各个具体场景的关键字符串。例如,一个具体的场景为商品营销场景,在该场景中,用户为了推广图片中的物品,需要对物品的各种属性打上标签,例如,所述属性包括材质、尺寸、颜色、价格、外观等。因此,在对应于商品营销场景的关键字符串库中,可包括关于上述各个属性的关键字符串。例如,在材质这类中,可包括“纯铜”、“塑料”、“玻璃”等表示材料的关键字符串,在尺寸这类中,可包括“cm”、“m”、“公分”等表示尺寸单位的关键字符串,在颜色这类中,可包括“红色”、“藕荷色”、“洋红色”等表示颜色的关键字符串,在价格这类中,可包括“元”、“美元”等表示货币单位的关键字符串,以及,在外观这类中,可包括“金属拉丝”、“抛光”等表示外观的关键字符串。
再例如,所述场景为婚介场景,在该场景中,用户为了介绍图片中的人物,需要给人物打上各种人物属性标签。例如,所述属性包括年龄、专业、工作单位等。则与婚介场景对应的关键字符串库中可包括与上述属性对应的关键字符串,如年龄单位(岁)、物理、生物、自动化、公司、事务所等等。
再例如,所述场景为自拍场景。在该场景中,用户可以给自拍图打上心情、感受标签等。从而,与该场景对应的关键字符串库中可包括“开心、愤怒、焦虑”等关键字符串。
在一个实施例中,用户可选择图片应用场景。例如,在用户打开图片之后,可在屏幕上显示场景选项按钮,用户可通过所述按钮选择希望的图片应用场景,或者,用户可在打开图片之前预先选择好图片应用场景。在用户选择了场景之后,系统根据与该场景对应的预设关键字符串库,获取所述添加项。例如,图4示出了商品营销场景的示例。用户在打开如图4所示的图片之后,可选择“商品营销场景”。从而,系统在对用户的语音输入语音识别为字符串之后,调用对应于商品营销场景的关键字符串库与所述字符串进行匹配。
在一个实施例中,系统在接收用户选择的图片应用场景之后,在接收用户的语音之前或之后,在屏幕上显示与所述场景对应的语音输入内容提示。图5示意示出在商品营销场景下,屏幕上的语音输入内容提示,包括“长120里面”(尺寸)、“金属是拉丝抛光纯铜材质”(材质)、“春季新款”、“50元拿货价”(价格)等。可对应于特定的场景预先设定所述语音输入内容提示。
在一个实施例中,例如用户在如上所述选择商品营销场景之后,用户通过长按屏幕上的麦克风输入语音“高30cm,宽35cm,五金材质是纯铜五金磨砂,装饰物为圆头钉打孔,价格120元”。系统在将该语音识别为字符串之后,将该字符串与对应于商品营销场景的关键字符串库中的关键字符串相匹配。在所述关键字符串库的关于材质的分类中包括关键字符串“纯铜五金磨砂”、在关于外观的分类中包括关键字符串“圆头钉打孔”,因此,获取“纯铜五金磨砂”和“圆头钉打孔”作为将要添加到图片上的添加项。在一个实施例中,在关键字符串库中将关于材质和外观的关键字符串预设为对应于标签图形。从而在获取添加项“纯铜五金磨砂”和“圆头钉打孔”之后,系统还自动获取标签图形作为添加项。所述标签图形用于在图片中标注出“纯铜五金磨砂”材质对应的具体位置,以及“圆头钉打孔”外观对应的具体位置。
在一个实施例中,从上述字符串可获取,与所述关键字符串库的关于尺寸的分类中的关键字符串“cm”匹配的“cm”,并且可判断出在上述字符串中,“cm”之前为数字字符串,因此获取字符串中的“30cm”和“35cm”作为添加项分别添加到图片上。在一个实施例中,在关键字符串库中将“cm”设定为对应于标尺图形,从而在获取添加项“30cm”和“35cm”之后,系统还自动获取标尺图形作为添加项。
在一个实施例中,在所述关键字符串库的关于价格的分类中包括关键字符串“元”,从而可从上述字符串中获取关键字符串“元”。并且可判断,在上述字符串中,“元”的之前为数字字符串,因此获取上述字符串中的“120元”作为添加项添加到图片上。
在一个实施例中,在所述关键字符串中的关于尺寸的分类中包括关键字符串“高”和“宽”,而在关键字符串库中将“高”设定为对应于标尺图形。因此,在获取字符串中的关键字符串“高”和“宽”之后,系统获取标尺图形作为添加项。
所述添加的图形不限于上述标签和标尺,还可以是箭头、各种用于圈注的几何形状、图框等等。例如,可将标签设置为与关键字符串库中的颜色、材质等关键字符串对应,将标尺设置为与关键字符串中的表示长度或长度单位的字符串对应。而在例如自拍场景中,还可以根据关键字符串匹配,添加与对话内容对应的图框,与心情对应的表情图标等。
再回到图3,在步骤S34,在所述图片上分别添加所述至少一个添加项。图6示出了在图片上分别添加的文本添加项、标签添加项、及标尺添加项的示意图。在添加了所述添加项之后,用户可根据手势或输入进行以下至少一种修改:改变所述添加项的位置、改变所述添加项的尺寸、编辑所述添加项的内容、以及删除所述添加项。例如,如图6所示,对于图中的标尺,用户可通过手势移动标尺的两端,改变标尺的长度,可通过手势旋转标尺,改变标尺的角度,通过手势删除所述标尺等。
在一个实施例中,如参考图2中所述,在用户打开图片之后,根据用户选择的图片应用场景,获取预设为与所述场景对应的至少一个图形作为至少一个添加项,以及在所述图片上分别添加根据所述场景获取的至少一个添加项。其具体实例如参考图2所述,在此不再赘述。
另外,在完成上述编辑之后,用户还可以通过例如屏幕上的添加二维码的接口对图片添加二维码,从而可以保存图片,并分享图片。在该分享图片中,通过图中的标签准确明了地展现了商品的各个属性,便于购买者对该商品进行快速地了解,从而促进了对商品的营销。
图7示出了根据本说明书实施例的一种图片处理装置700,包括:接收单元71,配置为,在用户打开图片之后,响应于用户操作,接收用户的语音;识别单元72,配置为,从所述语音识别出第一字符串,作为添加项;以及添加单元73,配置为,在所述图片上添加所述添加项。
图8示出了根据本说明书实施例的一种图片处理装置800,包括:接收单元81,配置为,在用户打开图片之后,响应于用户操作,接收用户的语音;识别单元82,配置为,从所述语音识别出第一字符串;第一获取单元83,配置为,根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项;以及第一添加单元84,配置为,在所述图片上分别添加所述至少一个添加项。
在一个实施例中,在上述图片处理装置800中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的字符串,作为添加项。
在一个实施例中,在上述图片处理装置800中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第三字符串,其中,所述第三字符串为表示量的单位的字符串,并且在所述第一字符串中,在所述第三字符串之前为数字字符串,以及,获取顺序包括所述数字字符串和所述第三字符串的字符串作为添加项。
在一个实施例中,在上述图片处理装置800中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第四字符串作为添加项,其中,所述第四字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
在一个实施例中,在上述图片处理装置800中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第五字符串,其中,所述第五字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
在一个实施例中,上述图片处理装置800还包括:第二获取单元85,配置为,在用户打开图片之后,根据用户选择的图片应用场景,获取预设为与所述场景对应的至少一个图形作为至少一个添加项,以及第二添加单元86,配置为,在所述图片上分别添加根据所述场景获取的至少一个添加项
在一个实施例中,上述图片处理装置800还包括,提示单元87,配置为,在接收用户选择的图片应用场景之后,在屏幕上显示与所述场景对应的语音输入内容提示。
在一个实施例中,上述图片处理装置800还包括修改单元88,配置为,在图片中添加所述添加项之后,根据用户手势或输入进行以下至少一种修改:改变所述添加项的位置、改变所述添加项的尺寸、编辑所述添加项的内容、以及删除所述添加项。
本说明书实施例还提供一种计算机可读的存储介质,其上存储有指令代码,所述指令代码在计算机中执行时,令计算机执行如上所述的图片处理方法。
在根据本说明书实施例的图片处理方法和装置中,通过以语音输入的方式对图片打标签,降低了图片处理难度,大大提高了图片处理效率,满足了用户的需求。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执轨道,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执轨道的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (27)

1.一种图片处理方法,包括:
在用户打开图片之后,响应于用户操作,接收用户的语音;
从所述语音识别出第一字符串,作为添加项;以及
在所述图片上添加所述添加项。
2.一种图片处理方法,包括:
在用户打开图片之后,响应于用户操作,接收用户的语音;
从所述语音识别出第一字符串;
根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项;以及
在所述图片上分别添加所述至少一个添加项。
3.根据权利要求2所述的图片处理方法,其中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的字符串,作为所述添加项。
4.根据权利要求2所述的图片处理方法,其中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第三字符串,其中,所述第三字符串为表示量的单位的字符串,并且在所述第一字符串中,在所述第三字符串之前为数字字符串,以及,获取顺序包括所述数字字符串和所述第三字符串的字符串作为所述添加项。
5.根据权利要求2所述的图片处理方法,其中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第四字符串作为添加项,其中,所述第四字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
6.根据权利要求2所述的图片处理方法,其中,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项包括,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第五字符串,其中,所述第五字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
7.根据权利要求1或2所述的图片处理方法,还包括,在用户打开图片之后,根据用户选择的图片应用场景,获取预设为与所述场景对应的至少一个图形作为至少一个添加项,以及在所述图片上分别添加根据所述场景获取的至少一个添加项。
8.根据权利要求7所述的图片处理方法,其中所述图片应用场景为商品营销场景,以及,其中,预设为与所述商品营销场景对应的至少一个图形包括:标尺、标签、图框和箭头。
9.根据权利要求2所述的图片处理方法,其中,所述根据预设的关键字符串库包括,根据与用户选择的图片应用场景对应的关键字符串库。
10.根据权利要求9所述的图片处理方法,其中,所述场景为商品营销场景,以及,其中,与所述场景对应的关键字符串库包括关于以下属性的关键字符串:材质、尺寸、颜色、价格和外观。
11.根据权利要求7或9所述的图片处理方法,还包括,在接收用户的语音之前或之后,在屏幕上显示与所述图片应用场景对应的语音输入内容提示。
12.根据权利要求1、2和7中任一项所述的图片处理方法,还包括,在图片中添加所述添加项之后,根据用户手势或输入进行以下至少一种修改:改变所述添加项的位置、改变所述添加项的尺寸、编辑所述添加项的内容、以及删除所述添加项。
13.根据权利要求1或2所述的图片处理方法,其中,所述用户打开图片包括,用户在其终端的相册中打开图片、用户在社交APP中打开图片、或者用户在用于执行所述方法的APP中打开图片。
14.一种图片处理装置,包括:
接收单元,配置为,在用户打开图片之后,响应于用户操作,接收用户的语音;
识别单元,配置为,从所述语音识别出第一字符串,作为添加项;以及
添加单元,配置为,在所述图片上添加所述添加项。
15.一种图片处理装置,包括:
接收单元,配置为,在用户打开图片之后,响应于用户操作,接收用户的语音;
识别单元,配置为,从所述语音识别出第一字符串;
第一获取获取单元,配置为,根据预设的关键字符串库,获取与所述第一字符串对应的至少一个第二字符串、和/或与所述第一字符串对应的至少一个图形,作为至少一个添加项;以及
第一添加单元,配置为,在所述图片上分别添加所述至少一个添加项。
16.根据权利要求15所述的图片处理装置,其中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的字符串,作为添加项。
17.根据权利要求15所述的图片处理装置,其中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第三字符串,其中,所述第三字符串为表示量的单位的字符串,并且在所述第一字符串中,在所述第三字符串之前为数字字符串,以及,获取顺序包括所述数字字符串和所述第三字符串的字符串作为添加项。
18.根据权利要求15所述的图片处理装置,其中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第四字符串作为添加项,其中,所述第四字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
19.根据权利要求15所述的图片处理装置,其中,所述第一获取单元还配置为,从所述第一字符串中获取与所述关键字符串库中的关键字符串匹配的第五字符串,其中,所述第五字符串预设为对应于特定图形,以及,获取所述特定图形作为添加项。
20.根据权利要求14或15所述的图片处理装置,还包括,第二获取单元,配置为,在用户打开图片之后,根据用户选择的图片应用场景,获取预设为与所述场景对应的至少一个图形作为至少一个添加项,以及第二添加单元,配置为,在所述图片上分别添加根据所述场景获取的至少一个添加项。
21.根据权利要求20所述的图片处理装置,其中所述图片应用场景为商品营销场景,以及,其中,预设为与所述商品营销场景对应的至少一个图形包括:标尺、标签、图框和箭头。
22.根据权利要求15所述的图片处理装置,其中,所述根据预设的关键字符串库包括,根据与用户选择的图片应用场景对应的关键字符串库。
23.根据权利要求22所述的图片处理装置,其中,所述场景为商品营销场景,以及,其中,与所述场景对应的关键字符串库包括关于以下属性的关键字符串:材质、尺寸、颜色、价格和外观。
24.根据权利要求20或22所述的图片处理装置,还包括提示单元,配置为,在接收用户的语音之前或之后,在屏幕上显示与所述图片应用场景对应的语音输入内容提示。
25.根据权利要求14、15和20中任一项所述的图片处理装置,还包括,修改单元,配置为,在图片中添加所述添加项之后,根据用户手势或输入进行以下至少一种修改:改变所述添加项的位置、改变所述添加项的尺寸、编辑所述添加项的内容、以及删除所述添加项。
26.根据权利要求14或15所述的图片处理装置,其中,所述用户打开图片包括,用户在其终端的相册中打开图片、用户在社交APP中打开图片、或者用户在用于执行所述方法的APP中打开图片。
27.一种计算机可读的存储介质,其上存储有指令代码,所述指令代码在计算机中执行时,令计算机执行权利要求1-13中任一项所述的方法。
CN201810266755.4A 2018-03-28 2018-03-28 一种图片处理方法和装置 Pending CN108805958A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201810266755.4A CN108805958A (zh) 2018-03-28 2018-03-28 一种图片处理方法和装置
PCT/CN2019/070040 WO2019184539A1 (zh) 2018-03-28 2019-01-02 图片处理
TW108101009A TWI698835B (zh) 2018-03-28 2019-01-10 圖片處理方法和裝置以及電腦可讀的儲存媒體

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810266755.4A CN108805958A (zh) 2018-03-28 2018-03-28 一种图片处理方法和装置

Publications (1)

Publication Number Publication Date
CN108805958A true CN108805958A (zh) 2018-11-13

Family

ID=64095398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810266755.4A Pending CN108805958A (zh) 2018-03-28 2018-03-28 一种图片处理方法和装置

Country Status (3)

Country Link
CN (1) CN108805958A (zh)
TW (1) TWI698835B (zh)
WO (1) WO2019184539A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019184539A1 (zh) * 2018-03-28 2019-10-03 阿里巴巴集团控股有限公司 图片处理
CN114467140A (zh) * 2020-08-05 2022-05-10 互动解决方案公司 基于语音来改变图像的系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0329504D0 (en) * 2003-12-19 2004-01-28 Nokia Corp Image handling
CN103365970A (zh) * 2013-06-25 2013-10-23 广东小天才科技有限公司 自动获取学习资料信息的方法和装置
CN105302786A (zh) * 2015-11-10 2016-02-03 百度在线网络技术(北京)有限公司 数据的编辑方法和装置
CN107707836A (zh) * 2017-09-11 2018-02-16 广东欧珀移动通信有限公司 图像处理方法和装置、电子装置和计算机可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7921037B2 (en) * 2002-04-01 2011-04-05 Hewlett-Packard Development Company, L.P. Personalized messaging determined from detected content
TWI402767B (zh) * 2008-11-28 2013-07-21 Hon Hai Prec Ind Co Ltd 具有圖片編輯功能的電子裝置及方法
CN104766353B (zh) * 2015-04-25 2018-03-30 陈包容 背景中添加文字内容的方法及装置
TWI534647B (zh) * 2015-07-07 2016-05-21 中華電信股份有限公司 自訂圖片樣版系統
CN108805958A (zh) * 2018-03-28 2018-11-13 阿里巴巴集团控股有限公司 一种图片处理方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0329504D0 (en) * 2003-12-19 2004-01-28 Nokia Corp Image handling
CN103365970A (zh) * 2013-06-25 2013-10-23 广东小天才科技有限公司 自动获取学习资料信息的方法和装置
CN105302786A (zh) * 2015-11-10 2016-02-03 百度在线网络技术(北京)有限公司 数据的编辑方法和装置
CN107707836A (zh) * 2017-09-11 2018-02-16 广东欧珀移动通信有限公司 图像处理方法和装置、电子装置和计算机可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
3DMGAME: "《小红书》添加图片标签的方法介绍", 《BAIJIAHAO.BAIDU.COM/S?ID=1577153651180758002&WFR=SPIDER&FOR=PC》 *
GILL谈谈: "浅谈小红书图片标签", 《ZHUANLAN.ZHIHU.COM/P/24464458》 *
知乎用户: "nice标签的推荐逻辑是什么", 《ZHIHU.COM/QUESTION/52483416》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019184539A1 (zh) * 2018-03-28 2019-10-03 阿里巴巴集团控股有限公司 图片处理
CN114467140A (zh) * 2020-08-05 2022-05-10 互动解决方案公司 基于语音来改变图像的系统
US11568877B2 (en) 2020-08-05 2023-01-31 Interactive Solutions Corp. System to change image based on voice

Also Published As

Publication number Publication date
WO2019184539A1 (zh) 2019-10-03
TWI698835B (zh) 2020-07-11
TW201942873A (zh) 2019-11-01

Similar Documents

Publication Publication Date Title
CN105830011B (zh) 用于交叠手写文本输入的用户界面
US10353997B1 (en) Freeform annotation transcription
US9589200B2 (en) Handwriting input conversion apparatus, computer-readable medium, and conversion method
TW513656B (en) Handwriting information processing system comprising a character segmentation user interface
US8381088B2 (en) Flagging, capturing and generating task list items
JP2020017285A (ja) ユーザ構成可能グラフィック構造体の共有
CN110135411A (zh) 名片识别方法和装置
US20120083294A1 (en) Integrated image detection and contextual commands
WO2013089668A2 (en) Content-based automatic input protocol selection
CN102289322A (zh) 手写笔迹处理方法及系统
JP2003162687A (ja) 手書き文字入力装置、手書き文字認識プログラム
CN106104594A (zh) 对消息样式进行规范化同时保持意图
US20190188281A1 (en) Cognitive Data Descriptors
CN107992545A (zh) 一种搜索方法、装置、终端及可读存储介质
CN104184798B (zh) 基于穿戴式电子设备的电子名片管理系统及交换方法
CN108805958A (zh) 一种图片处理方法和装置
CN104978577B (zh) 信息处理方法、装置及电子设备
TW200539017A (en) Character displaying method
CN106775337A (zh) 桌面应用程序图标的整理方法和移动终端
CN114863906B (zh) 一种文本转语音处理的别名标记方法及装置
US20190222702A1 (en) Using labels in a document processing system
CN108664945A (zh) 图像文本及形音义特征识别方法和装置
CN107563465A (zh) 一种获取礼品信息的系统和方法
CN110738031A (zh) 读书笔记的生成方法、装置及设备
JP6862331B2 (ja) 思考・議論支援システムおよび思考・議論支援装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201021

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201021

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181113