CN110178130B - 一种生成相册标题的方法及设备 - Google Patents

一种生成相册标题的方法及设备 Download PDF

Info

Publication number
CN110178130B
CN110178130B CN201780083441.4A CN201780083441A CN110178130B CN 110178130 B CN110178130 B CN 110178130B CN 201780083441 A CN201780083441 A CN 201780083441A CN 110178130 B CN110178130 B CN 110178130B
Authority
CN
China
Prior art keywords
album
primitive
language model
corpus
model library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780083441.4A
Other languages
English (en)
Other versions
CN110178130A (zh
Inventor
唐忠樑
庄光庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN110178130A publication Critical patent/CN110178130A/zh
Application granted granted Critical
Publication of CN110178130B publication Critical patent/CN110178130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

一种生成相册标题的方法及设备,涉及计算机技术领域,可以提高生成的相册标题与相册中的图片内容的契合度。具体方案包括:根据第一相册中的图片的内容生成该第一相册的相册标签(S301);根据该第一相册的相册标签确定第一语言模型库,该第一语言模型库与上述第一相册的标签相对应,该第一语言模型库包括多个基元分词(S302);查找第一语言模型库中,与该第一相册的相册标签匹配的基元分词(S303);根据上述匹配的基元分词,生成第一相册的相册标题(S304)。

Description

一种生成相册标题的方法及设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种生成相册标题的方法及设备。
背景技术
随着智能终端的普及,用户已经习惯使用终端(如手机)拍摄图片,来记录生活的点点滴滴。为了方便用户管理终端中的图片,终端的“照片”应用或者其他类似的应用中都配置了图片管理功能。例如,终端中的“照片”应用可以根据图片拍摄的时间和地点等信息,将终端中的图片进行归类生成相册,然后根据相册中的图片拍摄的时间和地点等信息,自动为相册设置相册标题或者添加描述信息。
但是,根据图片拍摄的时间和地点等信息生成的相册标题,不能体现出相册中的图片内容,即生成的相册标题与相册中的图片内容的契合度较低。
发明内容
本申请实施例提供一种生成相册标题的方法及设备,可以提高生成的相册标题与相册中的图片内容的契合度。
第一方面,本申请实施例提供一种生成相册标题的方法,该方法包括:根据第一相册中的图片的内容生成该第一相册的相册标签;根据该第一相册的相册标签确定与该第一相册的标签相对应的第一语言模型库,该第一语言模型库包括多个基元分词;查找该第一语言模型库中,与上述第一相册的相册标签匹配的基元分词;根据匹配的基元分词,生成第一相册的相册标题。
本申请实施例中,由于第一相册的相册标签是根据第一相册中的图片内容生成的,因此第一相册的相册标签可以用于描述该第一相册中的图片内容;因此,设备根据与第一相册的相册标签对应的第一语言模型库中的基元分词,生成第一相册的相册标题,可以提高生成的相册标题与第一相册的内容的契合度。
在一种可能的设计方式中,上述根据第一相册的标签确定第一语言模型库,包括:根据第一相册的相册标签,从预存的语言模型库中确定第一语言模型库;预存的语言模型库中包括预设多个场景中每个场景的语言模型库,该第一语言模型库是第一相册的相册标签对应的场景的语言模型库。
其中,本申请实施例中可以预设多个场景,然后针对预设多个场景中的每个场景保存一个语言模型库,每个语言模型库中包括用于描述对应场景的图片的基元分词。例如,上述预设多个场景可以包括:旅行场景、美食场景、运动场景、购物场景、娱乐场景、亲子生活场景等。上述第一语言模型库与第一相册的标签相对应,具体可以为:第一语言模型库是第一相册的相册标签对应的场景的语言模型库。
在另一种可能的设计方式中,上述第一语言模型库中不仅包括多个基元分词,还包括每个基元分词相对另一基元分词的条件概率。一个基元分词相对另一基元分词的条件概率为:在该第一语言模型库所包含的词组中,当另一个基元分词出现在词组中时,一个基元分词出现在该词组中的另一个基元分词之后的概率。上述查找第一语言模型库中,与第一相册的相册标签匹配的基元分词,包括:从第一语言模型库的多个基元分词中,查找与第一相册的相册标签匹配的第一基元分词;从第一语言模型库的多个基元分词中,查找第二基元分词,该第二基元分词相对第一基元分词的条件概率大于第一预设阈值。上述根据所述匹配的基元分词,生成第一相册的相册标题,包括:将包含第一基元分词和第二基元分词的词组作为该第一相册的相册标题。
其中,以第一语言模型库中的其他基元分词相对第一基元分词的条件概率为例。其他基元分词相对第一基元分词的条件概率为:在第一语言模型库所包含的词组中,当第一基元分词出现在词组中时,其他基元分词出现在词组中的第一基元分词之后的概率。即其他基元分词相对第一基元分词的条件概率可以反映出第一语言模型库中的其他基元分词出现在第一基元分词之后、与第一基元分词组成词组的概率。如此,上述设备在确定出与第一相册的相册标签匹配的第一基元分词后,便可以确定出相对第一基元分词的条件概率高于第一预设阈值的第二基元分词,进而将包含第一基元分词和第二基元分词的词组作为第一相册的相册标题。
在另一种可能的设计方式中,上述设备可以针对上述预设多个场景中每个场景,分别收集语料数据,得到多个语料库,即每个场景可以包括一个语料库。具体的,在上述根据第一相册的标签确定第一语言模型库之前,本申请实施例的方法还可以包括:获取预设多个场景中每个场景的语料库,一个场景的语料库包括该一个场景的多个语料数据;针对每个语料库执行以下操作:对一个语料库的所有语料数据进行分词,得到多个第三基元分词;统计多个第三基元分词中每个第三基元分词在所述一个语料库出现的频率,以及多个词组对中的每个词组对在一个语料库出现的频率,该词组对由同一语料数据中,按照预设顺序相邻的两个第三基元分词组成;根据每个第三基元分词在一个语料库出现的频率,以及每个词组对在所述一个语料库出现的频率,计算每个第三基元分词相对其他第三基元分词的条件概率;生成一个语料库所处的场景对应的语言模型库,该对应的语言模型库包括多个第三基元分词和每个第三基元分词相对其他第三基元分词的条件概率。
本申请实施例中,设备可以针对上述预设多个场景中每个场景分别收集语料数据,得到多个语料库;然后,分析每个语料库中的语料数据,得到各个场景对应的语言模型库。
在另一种可能的设计方式中,上述根据第一相册中的图片的内容生成上述第一相册的相册标签,包括:生成上述第一相册,上述第一相册包括多个图片;根据上述第一相册中的每个图片生成对应图片的图片标签;统计获取到的图片标签的总数,并统计获取到的所有图片标签中每一种图片标签的个数;计算每一种图片标签的个数与图片标签的总数的比值,并将比值高于第二预设阈值的图片标签确定为上述第一相册的相册标签。
其中,第一相册的相册标签是第一相册中的图片的图片标签中,个数与图片标签的总数的比值,高于第二预设阈值的图片标签。也就是说,第一相册的相册标签是第一相册中的图片标签中出现频率最高的图片标签。因此,该第一相册的相册标签可以体现出第一相册中的图片的内容。
在另一种可能的设计方式中,用户可能会手动为相册设置相册标题,本申请实施例中,上述设备还可以分析用户手动设置的相册标题,并采用分析结果更新本申请实施例中的语言模型库。具体的,本申请实施例的方法还包括:获取用户为第二相册设置的相册标题,对第二相册的相册标题进行分词,得到多个第四基元分词;根据第二相册中的图片的内容生成第二相册的相册标签;根据第二相册的相册标签确定第二语言模型库,第二语言模型库与第二相册的相册标签相对应;根据多个第四基元分词,更新第二语言模型库。
本申请实施例中,上述设备还可以分析用户手动设置的相册标题,并采用分析结果更新语言模型库。如此,本申请实施例中的语言模型库中的基元分词及其条件概率,可以随着用户的喜好以及习惯的变化而变化,因此根据更新后的语言模型库中的基元分词生成的相册标题与拍摄相册中的图片时所处场景的契合度则更高,该相册标题更加符合对应相册的内容以及用户语言风格。
在另一种可能的设计方式中,不同用户描述或者介绍同一事物(如相册)时所喜好的语言风格不同。基于此,在上述根据第一相册的相册标签,从预存的语言模型库中确定第一语言模型库之前,本申请实施例的方法还包括:获取第一语言风格,所述第一语言风格是用户喜好的语言风格。其中,每个场景包括多个语言模型库,每个语言模型库的基元分词对应于一种语言风格,不同语言模型库的基元分词对应的语言风格不同;第一语言模型库的基元分词与所述第一语言风格相对应。
其中,上述设备可以周期性统计用户在该设备中输入的文本信息和/或语音信息的语言风格,以便于可以及时更新上述设备中保存的语言风格。
在另一种可能的设计方式中,上述所述获取第一语言风格,包括:统计用户编辑文字的风格,确定所述第一语言风格。或者,显示风格选择界面,该风格选择界面中包括多个语言风格选项,响应于用户对多个语言风格选项中任一语言风格选项的选择操作,将用户选择的语言风格选项对应的语言风格确定为第一语言风格。
可选的,上述设备在获取到上述第一语言风格后,可以在该设备中保存该第一语言风格,以便于在为相册生成相册标题时,可以直接从该设备中获取该第一语言风格,而不需要在生成相册标题时,才统计用户在该设备中输入的文本信息和/或语音信息的语言风格或者显示上述风格选择界面,来确定上述第一语言风格。其中,在为相册生成相册标题时,直接获取终端中保存的语言风格,可以减少设备生成相册标题时设备的计算量,提高生成相册标题的效率。
在另一种可能的设计方式中,本申请实施例中第一语言模型库不仅是第一相册的相册标签对应的场景的语言模型库,并且,第一语言模型库中的基元分词与第一语言风格对应。具体的,在根据上述第一相册的相册标签,从预存的语言模型库中确定第一语言模型库之前,本申请实施例的方法还包括:获取上述每个场景的多个语料库,上述多个语料库中的每个语料库包括一种语言风格的语料数据,不同语料库中包括的语料数据的语言风格不同;针对上述每个语料库执行以下操作:对一个语料库的所有语料数据进行分词,得到多个第五基元分词;统计上述多个第五基元分词中每个第五基元分词在上述一个语料库出现的频率,以及多个词组对中的每个词组对在上述一个语料库出现的频率,上述词组对由同一语料数据中,按照预设顺序相邻的两个第五基元分词组成;根据上述每个第五基元分词在上述一个语料库出现的频率,以及上述每个词组对在上述一个语料库出现的频率,计算上述每个第五基元分词相对其他第五基元分词的条件概率;生成上述一个语料库所处的场景以及上述一个语料库的语言风格对应的语言模型库,上述对应的语言模型库包括上述多个第五基元分词和上述每个第五基元分词相对其他第五基元分词的条件概率。
本申请实施例中,上述设备生成第一相册的相册标题时,不仅可以参考根据第一相册的相册标签确定的场景,还可以参考用户喜好的语言风格。这样,不仅可以提高生成的相册标题与第一相册的内容的契合度,还可以使相册标题更加符合用户语言风格。
第二方面,本申请实施例提供一种生成相册标题的装置,该装置包括:标签生成单元、确定单元、查找单元和标题生成单元。标签生成单元,用于根据第一相册中的图片的内容生成上述第一相册的相册标签;确定单元,用于根据上述标签生成单元生成的上述第一相册的相册标签确定第一语言模型库,上述第一语言模型库与上述第一相册的标签相对应,上述第一语言模型库包括多个基元分词;查找单元,用于查找上述确定单元确定的上述第一语言模型库中,与上述第一相册的相册标签匹配的基元分词;标题生成单元,用于根据上述查找单元查找到的上述匹配的基元分词,生成上述第一相册的相册标题。
在另一种可能的设计方式中,上述确定单元,具体用于:根据上述标签生成单元生成的上述第一相册的相册标签,从预存的语言模型库中确定上述第一语言模型库;上述预存的语言模型库中包括预设多个场景中每个场景的语言模型库,上述第一语言模型库是上述第一相册的相册标签对应的场景的语言模型库。
在另一种可能的设计方式中,上述确定单元确定的上述第一语言模型库还包括:上述第一语言模型库中的一个基元分词相对另一基元分词的条件概率;上述一个基元分词相对另一基元分词的条件概率为:在上述第一语言模型库所包含的词组中,当上述另一个基元分词出现在词组中时,上述一个基元分词出现在上述词组中的上述另一个基元分词之后的概率。上述查找单元,具体用于:从上述确定单元确定的上述第一语言模型库的多个基元分词中,查找与上述第一相册的相册标签匹配的第一基元分词;从上述确定单元确定的上述第一语言模型库的多个基元分词中,查找第二基元分词,上述第二基元分词相对上述第一基元分词的条件概率大于第一预设阈值。上述标题生成单元,具体用于:将包含上述查找单元查找到的上述第一基元分词和上述第二基元分词的词组作为上述第一相册的相册标题。
在另一种可能的设计方式中,上述装置还包括:语料获取单元和模型生成单元。上述语料获取单元,用于在上述确定单元根据上述第一相册的标签确定上述第一语言模型库之前,获取预设多个场景中每个场景的语料库,一个场景的语料库包括上述一个场景的多个语料数据。上述模型生成单元,用于针对上述语料获取单元获取的上述每个语料库执行以下操作:对一个语料库的所有语料数据进行分词,得到多个第三基元分词;统计上述多个第三基元分词中每个第三基元分词在上述一个语料库出现的频率,以及多个词组对中的每个词组对在上述一个语料库出现的频率,上述词组对由同一语料数据中,按照预设顺序相邻的两个第三基元分词组成;根据上述每个第三基元分词在上述一个语料库出现的频率,以及上述每个词组对在上述一个语料库出现的频率,计算上述每个第三基元分词相对其他第三基元分词的条件概率;生成上述一个语料库所处的场景对应的语言模型库,上述对应的语言模型库包括上述多个第三基元分词和上述每个第三基元分词相对其他第三基元分词的条件概率。
在另一种可能的设计方式中,上述装置还包括:分词获取单元和更新单元。上述分词获取单元,用于获取用户为第二相册设置的相册标题,对上述第二相册的相册标题进行分词,得到多个第四基元分词;上述标签生成单元,还用于根据上述第二相册中的图片的内容生成上述第二相册的相册标签;上述确定单元,还用于根据上述标签生成单元生成的上述第二相册的相册标签确定第二语言模型库,上述第二语言模型库与上述第二相册的相册标签相对应;上述更新单元,用于根据上述分词获取单元获取的上述多个第四基元分词,更新上述确定单元确定的上述第二语言模型库。
在另一种可能的设计方式中,上述装置还包括:风格获取单元。上述风格获取单元,用于在上述确定单元根据上述第一相册的相册标签,从预存的语言模型库中确定上述第一语言模型库之前,获取第一语言风格,上述第一语言风格是用户喜好的语言风格。其中,上述每个场景包括多个语言模型库,每个语言模型库的基元分词对应于一种语言风格,不同语言模型库的基元分词对应的语言风格不同;上述第一语言模型库的基元分词与上述第一语言风格相对应。
在另一种可能的设计方式中,上述装置还包括:语料获取单元和模型生成单元。上述语料获取单元,用于在上述确定单元根据上述第一相册的相册标签,从预存的语言模型库中确定上述第一语言模型库之前,获取上述每个场景的多个语料库,上述多个语料库中的每个语料库包括一种语言风格的语料数据,不同语料库中包括的语料数据的语言风格不同;上述模型生成单元,用于针对上述语料获取单元生成的上述每个语料库执行以下操作:对一个语料库的所有语料数据进行分词,得到多个第五基元分词;统计上述多个第五基元分词中每个第五基元分词在上述一个语料库出现的频率,以及多个词组对中的每个词组对在上述一个语料库出现的频率,上述词组对由同一语料数据中,按照预设顺序相邻的两个第五基元分词组成;根据上述每个第五基元分词在上述一个语料库出现的频率,以及上述每个词组对在上述一个语料库出现的频率,计算上述每个第五基元分词相对其他第五基元分词的条件概率;生成上述一个语料库所处的场景以及上述一个语料库的语言风格对应的语言模型库,上述对应的语言模型库包括上述多个第五基元分词和上述每个第五基元分词相对其他第五基元分词的条件概率。
在另一种可能的设计方式中,上述标签生成单元,用于根据第一相册中的图片的内容生成上述第一相册的相册标签,包括:上述标签生成单元,具体用于:生成上述第一相册,上述第一相册包括多个图片;根据上述第一相册中的每个图片生成对应图片的图片标签;统计获取到的图片标签的总数,并统计获取到的所有图片标签中每一种图片标签的个数;计算每一种图片标签的个数与图片标签的总数的比值,并将比值高于第二预设阈值的图片标签确定为上述第一相册的相册标签。
在另一种可能的设计方式中,上述风格获取单元具体用于:统计用户编辑文字的风格,确定上述第一语言风格;或者,显示风格选择界面,上述风格选择界面中包括多个语言风格选项,响应于用户对上述多个语言风格选项中任一语言风格选项的选择操作,将用户选择的语言风格选项对应的语言风格确定为上述第一语言风格。
第三方面,本申请实施例提供一种设备,包括:处理器、存储器和显示器;上述存储器、上述显示器与上述处理器耦合,上述存储器用于存储计算机程序代码,上述计算机程序代码包括计算机指令,上述存储器包括非易失性存储介质,当上述处理器执行上述计算机指令时,上述处理器,用于根据第一相册中的图片的内容生成上述第一相册的相册标签;根据上述第一相册的相册标签确定第一语言模型库,上述第一语言模型库与上述第一相册的标签相对应,上述第一语言模型库包括多个基元分词;查找上述第一语言模型库中,与上述第一相册的相册标签匹配的基元分词;根据上述匹配的基元分词,生成上述第一相册的相册标题;上述显示器,用于根据上述处理器的指示,显示上述第一相册的中的图片,显示上述处理器生成的上述第一相册的相册标题。
在一种可能的设计方式中,上述存储器,还用于保存上述第一语言模型库。
在另一种可能的设计方式中,上述处理器,用于根据上述第一相册的标签确定第一语言模型库,包括:上述处理器,用于根据上述第一相册的相册标签,从预存的语言模型库中确定上述第一语言模型库;上述预存的语言模型库中包括预设多个场景中每个场景的语言模型库,上述第一语言模型库是上述第一相册的相册标签对应的场景的语言模型库。
在另一种可能的设计方式中,上述第一语言模型库还包括:上述第一语言模型库中的一个基元分词相对另一基元分词的条件概率;上述一个基元分词相对另一基元分词的条件概率为:在上述第一语言模型库所包含的词组中,当上述另一个基元分词出现在词组中时,上述一个基元分词出现在上述词组中的上述另一个基元分词之后的概率。上述处理器,用于查找上述第一语言模型库中,与上述第一相册的相册标签匹配的基元分词,包括:上述处理器,用于从上述第一语言模型库的多个基元分词中,查找与上述第一相册的相册标签匹配的第一基元分词;从上述第一语言模型库的多个基元分词中,查找第二基元分词,上述第二基元分词相对上述第一基元分词的条件概率大于第一预设阈值。上述处理器,用于根据上述匹配的基元分词,生成上述第一相册的相册标题,包括:上述处理器,用于将包含上述第一基元分词和上述第二基元分词的词组作为上述第一相册的相册标题。
在另一种可能的设计方式中,上述处理器,还用于在根据上述第一相册的标签确定上述第一语言模型库之前,获取预设多个场景中每个场景的语料库,一个场景的语料库包括上述一个场景的多个语料数据;针对上述每个语料库执行以下操作:对一个语料库的所有语料数据进行分词,得到多个第三基元分词;统计上述多个第三基元分词中每个第三基元分词在上述一个语料库出现的频率,以及多个词组对中的每个词组对在上述一个语料库出现的频率,上述词组对由同一语料数据中,按照预设顺序相邻的两个第三基元分词组成;根据上述每个第三基元分词在上述一个语料库出现的频率,以及上述每个词组对在上述一个语料库出现的频率,计算上述每个第三基元分词相对其他第三基元分词的条件概率;生成上述一个语料库所处的场景对应的语言模型库,上述对应的语言模型库包括上述多个第三基元分词和上述每个第三基元分词相对其他第三基元分词的条件概率。
在另一种可能的设计方式中,上述处理器,还用于获取用户为第二相册设置的相册标题,对上述第二相册的相册标题进行分词,得到多个第四基元分词;根据上述第二相册中的图片的内容生成上述第二相册的相册标签;根据上述第二相册的相册标签确定第二语言模型库,上述第二语言模型库与上述第二相册的相册标签相对应;根据上述多个第四基元分词,更新上述第二语言模型库。
在另一种可能的设计方式中,上述处理器,还用于在根据上述第一相册的相册标签,从预存的语言模型库中确定上述第一语言模型库之前,获取第一语言风格,上述第一语言风格是用户喜好的语言风格。其中,上述每个场景包括多个语言模型库,每个语言模型库的基元分词对应于一种语言风格,不同语言模型库的基元分词对应的语言风格不同;上述第一语言模型库的基元分词与上述第一语言风格相对应。
在另一种可能的设计方式中,上述处理器,还用于在根据上述第一相册的相册标签,从预存的语言模型库中确定上述第一语言模型库之前,获取上述每个场景的多个语料库,上述多个语料库中的每个语料库包括一种语言风格的语料数据,不同语料库中包括的语料数据的语言风格不同;针对上述每个语料库执行以下操作:对一个语料库的所有语料数据进行分词,得到多个第五基元分词;统计上述多个第五基元分词中每个第五基元分词在上述一个语料库出现的频率,以及多个词组对中的每个词组对在上述一个语料库出现的频率,上述词组对由同一语料数据中,按照预设顺序相邻的两个第五基元分词组成;根据上述每个第五基元分词在上述一个语料库出现的频率,以及上述每个词组对在上述一个语料库出现的频率,计算上述每个第五基元分词相对其他第五基元分词的条件概率;生成上述一个语料库所处的场景以及上述一个语料库的语言风格对应的语言模型库,上述对应的语言模型库包括上述多个第五基元分词和上述每个第五基元分词相对其他第五基元分词的条件概率。
在另一种可能的设计方式中,上述存储器,还用于保存上述语料库。
在另一种可能的设计方式中,上述处理器,用于根据第一相册中的图片的内容生成上述第一相册的相册标签,包括:上述处理器,用于生成上述第一相册,上述第一相册包括多个图片;根据上述第一相册中的每个图片生成对应图片的图片标签;统计获取到的图片标签的总数,并统计获取到的所有图片标签中每一种图片标签的个数;计算每一种图片标签的个数与图片标签的总数的比值,并将比值高于第二预设阈值的图片标签确定为上述第一相册的相册标签。
在另一种可能的设计方式中,上述处理器,用于获取第一语言风格,包括:上述处理器,用于统计用户编辑文字的风格,确定上述第一语言风格。或者,上述显示器,还用于显示风格选择界面,上述风格选择界面中包括多个语言风格选项;上述处理器,还用于响应于用户对上述显示器显示的上述多个语言风格选项中任一语言风格选项的选择操作,将用户选择的语言风格选项对应的语言风格确定为上述第一语言风格。
第四方面,本申请实施例提供一种控制设备,该控制设备包括处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,执行如第一方面及其任一种可能的设计方式所述的生成相册标题的方法。
第五方面,本申请实施例提供一种计算机存储介质,包括计算机指令,当所述计算机指令在设备上运行时,使得所述设备执行如第一方面及其任一种可能的设计方式所述的生成相册标题的方法。
第六方面,本申请实施例提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如第一方面及其任一种可能的设计方式所述的生成相册标题的方法。
可以理解,上述提供的第二方面及其可能的设计方式所述的装置、第三方面及其可能的设计方式所述的设备、第四方面所述的控制设备、第五方面所述的计算机存储介质,以及第六方面所述的计算机程序产品均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
附图说明
图1为本申请实施例提供的一种设备的硬件结构实例示意图;
图2为本申请实施例提供的一种生成相册标题的方法的系统原理框架示意图一;
图3为本申请实施例提供的一种生成相册标题的方法流程图一;
图4为本申请实施例提供的一种手机的显示界面实例示意图一;
图5为本申请实施例提供的一种正态分布曲线示意图;
图6为本申请实施例提供的一种生成相册标题的方法流程图二;
图7为本申请实施例提供的一种生成相册标题的方法的系统原理框架示意图二;
图8为本申请实施例提供的一种语言模型库的实例示意图;
图9为本申请实施例提供的一种生成相册标题的方法流程图三;
图10为本申请实施例提供的一种手机的显示界面实例示意图二;
图11为本申请实施例提供的一种手机的显示界面实例示意图三;
图12为本申请实施例提供的一种生成相册标题的方法流程图四;
图13为本申请实施例提供的一种生成相册标题的方法的系统原理框架示意图三;
图14为本申请实施例提供的一种语料库、词典和语言模型库的对应关系实例示意图一;
图15为本申请实施例提供的一种生成相册标题的方法的系统原理框架示意图四;
图16为本申请实施例提供的一种语料库、词典和语言模型库的对应关系实例示意图二;
图17为本申请实施例提供的一种生成相册标题的装置的结构示意图一;
图18为本申请实施例提供的一种生成相册标题的装置的结构示意图二;
图19为本申请实施例提供的一种设备的结构示意图。
具体实施方式
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本申请实施例提供一种生成相册标题的方法及设备,可以应用于设备为相册设置相册标题的过程中。具体可以应用于设备将多个图片划分至不同的相册后,为相册设置相册标题的过程中。
本申请实施例中,为了提高生成的相册标题与拍摄相册中的图片时所处场景的契合度,以生成第一相册的相册标题为例,上述设备可以根据第一相册中的图片内容生成第一相册的标签,然后根据第一相册的标签确定第一语言模型库,根据第一语言模型库中与第一相册的相册标签匹配的基元分词,生成第一相册的相册标题。其中,由于第一相册的相册标签是根据第一相册中的图片内容生成的,即第一相册的相册标签可以用于描述该第一相册中的图片内容;因此,设备根据第一相册的相册标签生成第一相册的相册标题,可以提高生成的相册标题与第一相册的内容的契合度。
本申请实施例中的基元分词是可以用于描述相册的相册标题的字或者词语。这些用于描述相册标题的字或者词语可以是上述设备对“人们为相册命名时所使用的相册标题”(即语料数据)进行分词得到的。例如,上述设备收集得到相册标题“背包浪迹天涯”和“美食集锦”后,可以对“背包浪迹天涯”和“美食集锦”进行分词,得到基元分词“背包”、“狼藉”、“天涯”、“美食”和“集锦”。其中,上述设备收集语料数据的具体方法可以参考本申请实施例S1201和S1201a中的详细描述,本申请实施例这里不予赘述。
举例来说,本申请实施例中的设备可以是手机(如图1所示的手机100)、平板电脑、个人计算机(Personal Computer,PC)、个人数字助理(personal digital assistant,PDA)、上网本、可穿戴电子设备等终端设备。
例如,上述设备可以用于管理该设备中保存的图片,并执行本申请实施例提供的方法,为由图片组成的相册生成相册标题。或者,上述设备中可以安装用于管理图片的客户端,该客户端可以在登录一图片管理账户后,管理保存在云服务器中的图片;并且,该客户端还可以用于执行本申请实施例提供的方法,为由图片组成的相册生成相册标题。
或者,本申请实施例中的设备还可以是用于存储和管理图片的云服务器,该云服务器可以接收终端上传的图片,然后执行本申请实施例提供的方法,为由图片组成的相册生成相册标题。本申请实施例对上述设备的具体形式不做特殊限制。
如图1所示,以手机100作为上述设备为例,手机100具体可以包括:处理器101、射频(Radio Frequency,RF)电路102、存储器103、触摸屏104、蓝牙装置105、一个或多个传感器106、Wi-Fi装置107、定位装置108、音频电路109、外设接口110以及电源装置111 等部件。这些部件可通过一根或多根通信总线或信号线(图1中未示出)进行通信。本领域技术人员可以理解,图1中示出的硬件结构并不构成对手机的限定,手机100可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对手机100的各个部件进行具体的介绍:
处理器101是手机100的控制中心,利用各种接口和线路连接手机100的各个部分,通过运行或执行存储在存储器103内的应用程序,以及调用存储在存储器103内的数据,执行手机100的各种功能和处理数据。在一些实施例中,处理器101可包括一个或多个处理单元。在本申请实施例一些实施例中,上述处理器101还可以包括指纹验证芯片,用于对采集到的指纹进行验证。
射频电路102可用于在收发信息或通话过程中,无线信号的接收和发送。特别地,射频电路102可以将基站的下行数据接收后,给处理器101处理;另外,将涉及上行的数据发送给基站。通常,射频电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频电路102还可以通过无线通信和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统、通用分组无线服务、码分多址、宽带码分多址、长期演进、电子邮件、短消息服务等。
存储器103用于存储应用程序以及数据,处理器101通过运行存储在存储器103的应用程序以及数据,执行手机100的各种功能以及数据处理。存储器103主要包括存储程序区以及存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等);存储数据区可以存储根据使用手机100时所创建的数据(比如音频数据、电话本等)。此外,存储器103可以包括高速随机存取存储器(RAM),还可以包括非易失存储器,例如磁盘存储器件、闪存器件或其他易失性固态存储器件等。存储器103 可以存储各种操作系统,例如,
Figure GDA0002129480830000091
操作系统,
Figure GDA0002129480830000092
操作系统等。上述存储器103可以是独立的,通过上述通信总线与处理器101相连接;存储器103也可以和处理器101集成在一起。
触摸屏104具体可以包括触控板104-1和显示器104-2。
其中,触控板104-1可采集手机100的用户在其上或附近的触摸事件(比如用户使用手指、触控笔等任何适合的物体在触控板104-1上或在触控板104-1附近的操作),并将采集到的触摸信息发送给其他器件(例如处理器101)。其中,用户在触控板104-1附近的触摸事件可以称之为悬浮触控;悬浮触控可以是指,用户无需为了选择、移动或拖动目标(例如图标等)而直接接触触控板,而只需用户位于设备附近以便执行所想要的功能。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型来实现触控板104-1。
显示器(也称为显示屏)104-2可用于显示由用户输入的信息或提供给用户的信息以及手机100的各种菜单。可以采用液晶显示器、有机发光二极管等形式来配置显示器104-2。触控板104-1可以覆盖在显示器104-2之上,当触控板104-1检测到在其上或附近的触摸事件后,传送给处理器101以确定触摸事件的类型,随后处理器101可以根据触摸事件的类型在显示器104-2上提供相应的视觉输出。虽然在图1中,触控板104-1与显示屏104-2是作为两个独立的部件来实现手机100的输入和输出功能,但是在某些实施例中,可以将触控板104-1与显示屏104-2集成而实现手机100的输入和输出功能。可以理解的是,触摸屏104是由多层的材料堆叠而成,本申请实施例中只展示出了触控板(层)和显示屏(层),其他层在本申请实施例中不予记载。另外,触控板104-1可以以全面板的形式配置在手机100的正面,显示屏104-2也可以以全面板的形式配置在手机100的正面,这样在手机的正面就能够实现无边框的结构。
另外,手机100还可以具有指纹识别功能。例如,可以在手机100的背面(例如后置摄像头的下方)配置指纹识别器112,或者在手机100的正面(例如触摸屏104的下方)配置指纹识别器112。又例如,可以在触摸屏104中配置指纹采集器件112来实现指纹识别功能,即指纹采集器件112可以与触摸屏104集成在一起来实现手机100的指纹识别功能。在这种情况下,该指纹采集器件112配置在触摸屏104中,可以是触摸屏104的一部分,也可以以其他方式配置在触摸屏104中。本申请实施例中的指纹采集器件112的主要部件是指纹传感器,该指纹传感器可以采用任何类型的感测技术,包括但不限于光学式、电容式、压电式或超声波传感技术等。
手机100还可以包括蓝牙装置105,用于实现手机100与其他短距离的设备(例如手机、智能手表等)之间的数据交换。本申请实施例中的蓝牙装置可以是集成电路或者蓝牙芯片等。
手机100还可以包括至少一种传感器106,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节触摸屏104的显示器的亮度,接近传感器可在手机100移动到耳边时,关闭显示器的电源。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机 100还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
无线保真(Wireless Fidelity,Wi-Fi)装置107,用于为手机100提供遵循Wi-Fi相关标准协议的网络接入,手机100可以通过Wi-Fi装置107接入到Wi-Fi接入点,进而帮助用户收发电子邮件、浏览网页和访问流媒体等,它为用户提供了无线的宽带互联网访问。在其他一些实施例中,该Wi-Fi装置107也可以作为Wi-Fi无线接入点,可以为其他设备提供Wi-Fi 网络接入。
定位装置108,用于为手机100提供地理位置。可以理解的是,该定位装置108具体可以是全球定位系统(Global Positioning System,GPS)或北斗卫星导航系统、俄罗斯GLONASS 等定位系统的接收器。定位装置108在接收到上述定位系统发送的地理位置后,将该信息发送给处理器101进行处理,或者发送给存储器103进行保存。在另外的一些实施例中,该定位装置108还可以是辅助全球卫星定位系统(Assisted Global PositioningSystem,AGPS)的接收器,AGPS系统通过作为辅助服务器来协助定位装置108完成测距和定位服务,在这种情况下,辅助定位服务器通过无线通信网络与设备例如手机100的定位装置108(即GPS接收器)通信而提供定位协助。在另外的一些实施例中,该定位装置108也可以是基于Wi-Fi 接入点的定位技术。由于每一个Wi-Fi接入点都有一个全球唯一的媒体访问控制(Media Access Control,MAC)地址,设备在开启Wi-Fi的情况下即可扫描并收集周围的Wi-Fi接入点的广播信号,因此可以获取到Wi-Fi接入点广播出来的MAC地址;设备将这些能够标示 Wi-Fi接入点的数据(例如MAC地址)通过无线通信网络发送给位置服务器,由位置服务器检索出每一个Wi-Fi接入点的地理位置,并结合Wi-Fi广播信号的强弱程度,计算出该设备的地理位置并发送到该设备的定位装置108中。
音频电路109、扬声器113、麦克风114可提供用户与手机100之间的音频接口。音频电路109可将接收到的音频数据转换后的电信号,传输到扬声器113,由扬声器113转换为声音信号输出;另一方面,麦克风114将收集的声音信号转换为电信号,由音频电路109接收后转换为音频数据,再将音频数据输出至RF电路102以发送给比如另一手机,或者将音频数据输出至存储器103以便进一步处理。
外设接口110,用于为外部的输入/输出设备(例如键盘、鼠标、外接显示器、外部存储器、用户识别模块卡等)提供各种接口。例如通过通用串行总线(Universal Serial Bus,USB) 接口与鼠标连接,通过用户识别模块卡卡槽上的金属触点与电信运营商提供的用户识别模块卡(Subscriber Identification Module,SIM)卡进行连接。外设接口110可以被用来将上述外部的输入/输出外围设备耦接到处理器101和存储器103。
在本发明实施例中,手机100可通过外设接口110与设备组内的其他设备进行通信,例如,通过外设接口110可接收其他设备发送的显示数据进行显示等,本发明实施例对此不作任何限制。
手机100还可以包括给各个部件供电的电源装置111(比如电池和电源管理芯片),电池可以通过电源管理芯片与处理器101逻辑相连,从而通过电源装置111实现管理充电、放电、以及功耗管理等功能。
尽管图1未示出,手机100还可以包括摄像头(前置摄像头和/或后置摄像头)、闪光灯、微型投影装置、近场通信(Near Field Communication,NFC)装置等,在此不再赘述。
其中,本申请实施例提供的生成相册标题的方法的执行主体可以为生成相册标题的装置,该生成相册标题的装置是可以用于管理图片的设备(如图1所示的手机100),或者该设备的中央处理器(Central Processing Unit,CPU),或者该设备中的用于生成相册标题的控制模块,或者该设备中用于管理图片的客户端。本申请实施例中以上述设备执行生成相册标题的方法为例,对本申请提供的生成相册标题的方法进行说明。
请参考图2,其示出了本申请实施例提供的一种生成相册标题的方法的系统原理框架示意图。其中,设备可以分析第一相册中的图片,得到图2中201所示的多个图片中每个图片 (包括图片a、图片b、图片c、图片d等图片)的图片标签。例如,图2所示的图片a的图片标签可以包括:海边、沙滩和天空;图2所示的图片b的图片标签可以包括:海边、天空和垂钓;图2所示的图片c的图片标签可以包括:海边、落日和沙滩;图2所示的图片d的图片标签可以包括:沙滩、游泳和漫步。
可选的,设备在确定图片的图片标签时,还可以参考该图片的联合图像专家小组(Joint Photographic Experts Group,JPEG)格式信息。例如,如图2所示,图片a的图片标签还可以包括图片a的JPEG标签,图片b的图片标签还可以包括图片b的JPEG标签,图片c的图片标签还可以包括图片c的JPEG标签,图片d的图片标签还可以包括图片d的JPEG标签。
随后,如图2所示,设备可以执行图2所示的202,从待管理的所有图片的图片标签中确定出第一相册的相册标签。即从待管理的所有图片的图片标签中,选择出可以用于描述第一相册中的图片内容的图片标签,并将选择出的一个或多个图片确定为第一相册的相册标签。
然后,设备可以根据第一相册的相册标签,从预存的语言模型库203中确定出目标语言模型库204(即第一语言模型库)。其中,预存的语言模型库203中包括至少两个语言模型库。例如,图2所示的预存的语言模型库203中包括语言模型库1、语言模型库2、语言模型库3 和语言模型库4。
最后,设备可以根据第一相册的标签,从目标语言模型库204中查找与第一相册的相册标签匹配的基元分词,并根据查找到的基元分词,生成第一相册的相册标题。例如,如图2 所示,上述设备可以生成相册标题“沙滩漫步”和“海边落日”。
以下通过具体实施例对本申请实施例提供的一种生成相册标题的方法进行详细说明:
本申请实施例提供一种生成相册标题的方法,如图3所示,该生成相册标题的方法包括 S301-S304:
S301、设备根据第一相册中的图片的内容生成第一相册的相册标签。
其中,本申请实施例中,上述设备可以响应于用户的操作,执行S301及后续方法流程,以生成相册标题。举例来说,上述用户的操作可以是用户对上述设备中用于管理图片的功能键或者功能按钮的点击操作。例如,以手机100是上述设备为例,如图4中的(a)所示,手机100的“相册”应用的显示界面401中包括用于控制手机100执行本申请实施例提供的生成相册标题的方法的功能按钮402,如“一键生成相册”按钮402。当手机100接收到用户对该功能按钮402的点击操作后,可以响应于用户的点击操作,执行S301及后续方法流程。
或者,上述设备(如手机或者手机中的客户端)可以周期性检测该设备中新增的图片个数,并在新增的图片个数超过预设图片阈值时,执行S301及后续方法流程,为新增的图片组成的相册生成相册标题。
又或者,上述设备(如云服务器)可以周期性检测不同的用户账户中新增的图片个数,如果检测到一个用户账户中的新增的图片个数超过预设图片阈值,则可以执行S301及后续方法流程,为该用户账户中的新增的图片组成的相册生成相册标题。
示例性的,本申请实施例中,上述设备生成上述第一相册的相册标签的方法可以包括 S301a-S301d:
S301a、设备生成第一相册,该第一相册包括多个图片。
本申请实施例中的第一相册,可以是由设备根据待管理的图片(保存在该设备中的图片或者保存在云服务器中的图片)的拍摄时间和拍摄地址等信息,自动将待管理的图片划分至不同的相册后得到的。如图4中的(a)所示,当手机100接收到用户对功能按钮402的点击操作后,该手机100则可以根据手机100中保存的图片的拍摄时间和拍摄地址等信息,自动图片划分至不同的相册,得到一个或多个第一相册。
可选的,本申请实施例中的第一相册,还可以是设备响应于用户对上述待管理的图片的管理操作,将待管理的图片划分至不同的相册后得到的。本申请实施例对设备生成第一相册的具体方法不作限制。
S301b、设备根据第一相册中的每个图片生成对应图片的图片标签。
可以理解,由于每个图片的图片标签是根据对应图片的图片内容生成的;因此,每个图片的图片标签用于描述对应图片的图片内容。
其中,设备可以针对上述第一相册中的每个图片,执行以下操作以获取该图片的图片标签:识别一个图片的图像内容,获得该图片中包括的对象信息,并将获得的对象信息确定为该图片的图片标签。其中,图片中包括的对象信息可以是图片中包括的人物图像、建筑图像 (如房屋、桥梁等)、风景图像(如海洋、沙滩、湖泊、大山、落日等),以及人物正在进行的事件的图像(如垂钓、游泳、划船等)。
S301c、设备统计获取到的图片标签的总数,并统计获取到的所有图片标签中每一种图片标签的个数。
示例性的,假设第一相册中包括图片a、图片b、图片c、图片d、图片e和图片f。图片a有2个图片标签,图片a的2个图片标签分别为:海边和沙滩;图片b有2个图片标签,图片b的2个图片标签分别为:沙滩和天空;图片c有2个图片标签,图片c的2个图片标签分别为:沙滩和散步;图片d有2个图片标签,图片d的2个图片标签分别为:沙滩和日光浴;图片e有2个图片标签,图片d的2个图片标签分别为:沙滩和排球;图片f有2个图片标签,图片d的2个图片标签分别为:黄昏和沙滩。那么,上述设备可以统计得到图片标签的总数为12(即2+2+2+2+2+2=12),图片标签“海边”的个数为1,图片标签“沙滩”的个数为6,图片标签“天空”的个数为1,图片标签“散步”的个数为1,图片标签“日光浴”的个数为1,图片标签“排球”的个数为1,图片标签“黄昏”的个数为1。
S301d、设备计算每一种图片标签的个数与图片标签的总数的比值,并将比值高于第二预设阈值的图片标签确定为该第一相册的相册标签。
示例性的,结合上述实例,假设第二预设阈值为45%,设备可以计算得到:图片标签“海边”的个数与图片标签的总数的比值为(1÷12)×100%=8.33%,图片标签“沙滩”的个数与图片标签的总数的比值为(6÷12)×100%=50%,图片标签“天空”的个数与图片标签的总数的比值为(1÷12)×100%=8.33%,图片标签“散步”的个数与图片标签的总数的比值为(1÷12)×100%=8.33%,图片标签“日光浴”的个数与图片标签的总数的比值为(1÷12)×100%=8.33%,图片标签“排球”的个数为1,图片标签“黄昏”的个数为与图片标签的总数的比值为(1÷12)×100%=8.33%。由于图片标签“沙滩”的个数与图片标签的总数的比值50%高于45%(即第二预设阈值),因此,设备可以将图片标签“沙滩”确定为该第一相册的相册标签。
可以理解,本申请实施例中,第一相册的相册标签可以包括上述一个或多个图片标签。例如,如图2所示的相册标签包括两个图片标签:“海边”和“沙滩”。
可选的,上述设备还可以在获取到所有图片标签中每一种图片标签的个数后,获取图5 所示的图片标签个数的正太分布曲线图,图5所示的正太分布曲线图的x轴为图片标签的种类,y轴为图片标签的个数,μ为正太分布的期望值,σ为正太分布的标准差。然后上述设备可以将位于图5所示的正太分布曲线图的中心位置的图片标签,确定为第一相册的相册标签。例如,由于图片标签“海边”和“沙滩”位于图5所示的正太分布曲线图的中心位置,因此,上述设备可以将“海边”和“沙滩”确定为第一相册的相册标签。
S302、设备根据第一相册的相册标签确定第一语言模型库,该第一语言模型库与第一相册的标签相对应,该第一语言模型库包括多个基元分词。
本申请实施例中可以预存多个语言模型库,并且针对每个语言模型库可以预先保存多个相册标签,以便于设备可以根据第一相册的相册标签,从预存的语言模型库中确定第一语言模型库。
可以理解,本申请实施例中,上述针对每个语言模型库预先保存的多个相册标签可以保存在上述设备中。或者,上述针对每个语言模型库预先保存的多个相册标签可以保存在用于管理相册标签和语言模型库对应关系的服务器中。上述设备可以向服务器发送携带上述第一相册的相册标签的语言模型库查询消息,请求该服务器根据该服务器保存的语言模型库与相册标签的对应关系,从预存的语言模型库中确定该第一相册对应的语言模型库;然后,该设备可以接收服务器发送的响应消息,该响应消息携带用于指示该第一相册对应的语言模型库的指示信息;该设备可以根据该指示信息确定该第一相册对应的语言模型库(即第一语言模型库)。
示例性的,请参考表1,其示出了本申请实施例提供的一种语言模型库与相册标签的对应关系实例表。上述设备或者服务器中可以采用表1所示的“语言模型库与相册标签的对应关系表”的方式,针对上述每个语言模型库预先保存多个相册标签。
表1
Figure GDA0002129480830000131
如表1所示,语言模型库1可以对应于相册标签a、相册标签b和相册标签c等多个相册标签;语言模型库2可以对应于相册标签d、相册标签e和相册标签f等多个相册标签;语言模型库3可以对应于相册标签g、相册标签h和相册标签k等多个相册标签;语言模型库4 可以对应于相册标签a、相册标签i和相册标签f等多个相册标签。
需要说明的是,在本申请实施例中,同一相册标签可以对应于一个或多个语言模型库。例如,表1所示的相册标签b对应于语言模型库1,而相册标签a对应于语言模型库1和语言模型库4。其中,当一个相册标签对应于多个语言模型库时,上述设备可以针对该相册标签对应的每个语言模型库,执行S303-S304。
可选的,在一种可能的实现方式中,本申请实施例中可以预设多个场景,然后针对预设多个场景中的每个场景保存一个语言模型库,每个语言模型库中包括用于描述对应场景的图片的基元分词。
在这种实现方式中,上述第一语言模型库与第一相册的标签相对应,具体可以为:第一语言模型库是第一相册的相册标签对应的场景的语言模型库。如图6所示,图3所示的S302 可以包括S302a:
S302a、设备根据第一相册的相册标签,从预存的语言模型库中确定第一语言模型库;该预存的语言模型库中包括预设多个场景中每个场景的语言模型库,该第一语言模型库是第一相册的相册标签对应的场景的语言模型库。
示例性的,上述预设多个场景可以包括:旅行场景、美食场景、运动场景、购物场景、娱乐场景、亲子生活场景等。当然,本申请实施例中的场景包括但不限于上述示出的场景实例,其他的场景本申请实施例这里不予赘述。
假设上述预设多个场景包括场景1、场景2、场景3和场景4。结合表1,如表2所示,本申请实施例提供一种场景与相册标签的对应关系实例表。表2所示的上述设备或者服务器中可以采用表1所示的“场景与相册标签的对应关系表”的方式,针对上述每个场景预先保存多个相册标签。
表2
Figure GDA0002129480830000141
如表2所示,场景1可以对应于相册标签a、相册标签b和相册标签c等多个相册标签;场景2可以对应于相册标签d、相册标签e和相册标签f等多个相册标签;场景3可以对应于相册标签g、相册标签h和相册标签k等多个相册标签;场景4可以对应于相册标签a、相册标签i和相册标签f等多个相册标签。并且,语言模型库1是场景1中的语言模型库,语言模型库2是场景2中的语言模型库,语言模型库3是场景3中的语言模型库,语言模型库4 是场景4中的语言模型库。
例如,假设上述场景1是旅游场景,上述场景1中的相册标签a、相册标签b和相册标签c等相册标签可以包括:景点的名称(如,天安门、故宫、兵马俑和长城等人文历史景点的名称,杭州西湖、黄山、三亚和九寨沟等自然风景的名称)、自然景观的名称(如海边、沙滩、草原、湖泊夕阳等),以及用于描述上述景点的词组(如山清水秀、景色怡人和历史悠久等)等。
结合图2,如图7所示,上述设备可以从预设多个场景701中确定第一相册的相册标签对应的场景(如旅行场景),然后再确定该场景中的语言模型库。如图7所示,假设上述第一相册的相册标签包括“海边”和“沙滩”,设备则可以确定第一相册的相册标签对应的场景为“旅行场景”。
S303、设备查找第一语言模型库中,与第一相册的相册标签匹配的基元分词。
其中,由于上述每个语言模型库(包括第一语言模型库)中都包括多个基元分词;因此,上述设备可以在确定第一语言模型库后,从该第一语言模型库的多个基元分词中,查找与上述第一相册的相册标签匹配的基元分词。
可以理解,本申请实施例中,相册标签与基元分词匹配,可以包括:相册标签与基元分词相同,或者相册标签与基元分词互为近义词。
示例性的,上述设备可以在上述第一语言模型库中查找与上述第一相册的相册标签相同的基元分词。如果查找到与上述第一相册的相册标签相同的基元分词,那么查找到的基元分词则是与该第一相册的相册标签匹配的基元分词。如果未查找到与上述第一相册的相册标签相同的基元分词,则查找该第一相册的相册标签的近义基元分词(即与该第一相册的相册标签互为近义词的基元分词)。此时,查找到的近义基元分词则是与该第一相册的相册标签匹配的基元分词。
例如,假设上述第一语言模型库中包括“夕阳”、“西下”和“美好”等基元分词。当上述第一相册的相册标签为“夕阳”时,上述设备则可以从第一语言模型库中查找到第一基元分词“夕阳”。当上述第一相册的相册标签为“落日”时,由于第一语言模型库中不包括基元分词“落日”,因此上述设备可以从第一语言模型库中查找该相册标签“落日”的近义基元分词,如“夕阳”和“夕照”等;这样,上述设备则可以从第一语言模型库中查找到“落日”的近义基元分词“夕阳”(即第一基元分词)。
S304、设备根据上述匹配的基元分词,生成第一相册的相册标题。
本申请实施例提供一种生成相册标题的方法,上述设备可以根据第一相册中的图片的内容生成第一相册的相册标签,然后根据第一相册的标签确定与所述第一相册的相册标签相对应的第一语言模型库,再查找第一语言模型库中,与第一相册的相册标签匹配的基元分词,最后根据匹配的基元分词,生成第一相册的相册标题。
其中,由于第一相册的相册标签是根据第一相册中的图片内容生成的,因此第一相册的相册标签可以用于描述该第一相册中的图片内容;因此,设备根据与第一相册的相册标签对应的第一语言模型库中的基元分词,生成第一相册的相册标题,可以提高生成的相册标题与第一相册的内容的契合度。
可选的,上述第一语言模型库还包括:该第一语言模型库中的一个基元分词相对另一基元分词的条件概率。
例如,如图8所示,语言模型库数据库203中包括:场景1(如旅行场景)中的语言模型库1,以及场景2(如美食场景)中的语言模型库2等语言模型库。以图8所示的语言模型库1为例,语言模型库1中包括:基元分词a、基元分词b和基元分词c等基元分词;基元分词a相对基元分词a的条件概率1、基元分词a相对基元分词b的条件概率2和基元分词a 相对基元分词c的条件概率3等条件概率;基元分词b相对基元分词a的条件概率4、基元分词b相对基元分词b的条件概率5和基元分词b相对基元分词c的条件概率6等条件概率;基元分词c相对基元分词a的条件概率7、基元分词c相对基元分词b的条件概率8和基元分词c相对基元分词c的条件概率9等条件概率。
其中,一个基元分词相对另一基元分词的条件概率为:在第一语言模型库所包含的词组中,当另一个基元分词出现在词组中时,一个基元分词出现在词组中的另一个基元分词之后的概率。
例如,如图8所示,基元分词b相对基元分词a的条件概率4为:当基元分词a出现在语言模型库1中的词组中时,基元分词b出现在该词组中的基元分词a之后的概率。基元分词a相对基元分词b的条件概率2为:当基元分词b出现在语言模型库1中的词组中时,基元分词a出现在该词组中的基元分词b之后的概率。基元分词c相对基元分词b的条件概率 8为:当基元分词b出现在语言模型库1中的词组中时,基元分词c出现在该词组中的基元分词b之后的概率。
请参考表3,其示出了本申请实施例提供的一种语言模型库实例表。如表 3所示的语言模型库(如旅行场景中的语言模型库)中包括“夕阳”、“西下”、“的”“美好”和“唯美”等基元分词。
表3
Figure GDA0002129480830000161
举例来说,在表3所示的语言模型库中,当基元分词“夕阳”出现在表3所示的语言模型库中的词组中时,基元分词“夕阳”出现在该词组中的基元分词“夕阳”之后的概率是4%,即生成的相册标题中出现“夕阳夕阳”的概率是4%;当基元分词“夕阳”出现在表3所示的语言模型库中的词组中时,基元分词“西下”出现在该词组中的基元分词“夕阳”之后的概率是79%。
相应的,上述设备可以根据第一语言模型库中的其他基元分词相对第一基元分词的条件概率,生成第一相册的相册标题。具体的,上述S303可以包括S303a-S303b,上述S304可以包括S304a。如图9所示,图3所示的S303可以包括S303a-S303b,图3所示的S304可以包括S304a:
S303a、设备从第一语言模型库的多个基元分词中,查找与第一相册的相册标签匹配的第一基元分词。
其中,相册标签与基元分词匹配,可以包括:相册标签与基元分词相同,或者相册标签与基元分词互为近义词。即上述设备可以从第一语言模型库的多个基元分词中,查找与第一相册的相册标签相同的第一基元分词,或者与第一相册的相册标签互为近义词的第一基元分词。
S303b、设备在第一语言模型库中查找第二基元分词,该第二基元分词相对第一基元分词的条件概率大于第一预设阈值。
S304a、设备将包含第一基元分词和第二基元分词的词组作为第一相册的相册标题。
假设上述第一基元分词为表3所示的“夕阳”,上述第一预设阈值为45%。如表3所示,当“夕阳”出现在表3所示的语言模型库中的词组中时,“夕阳”出现在该词组中的“夕阳”之后的概率是4%,“西下”出现在该词组中的“夕阳”之后的概率是79%,“的”出现在该词组中的“夕阳”之后的概率是1%,“美好”出现在该词组中的“夕阳”之后的概率是2%,“唯美”出现在该词组中的“夕阳”之后的概率是8%。
由于当“夕阳”出现在表3所示的语言模型库中的词组中时,“西下”出现在该词组中的“夕阳”之后的概率79%高于上述第一预设阈值(45%),因此,可以确定上述第二基元分词包括条件概率79%对应的基元分词“西下”。如此,上述设备可以生成相册标题“夕阳西下”。
本申请实施例中的语言模型库可以是一元模型库、二元模型库或者三元模型库等。当上述语言模型库是一元模型库时,上述设备在获取到第一基元分词(如“夕阳”)出现的条件下,出现概率最高的基元分词(如“西下”)后,则可以生成由该第一基元分词(如“夕阳”)和该出现概率最高的基元分词(如“西下”)组成的相册标题(如“夕阳西下”)。
当语言模型库是二元模型时,上述设备在确定上述第二基元分词包括基元分词“西下”之后,还可以从表3所示的多个基元分词中,确定当“西下”出现在表3所示的语言模型库中的词组中时,出现在该词组中的“西下”之后的概率高于第一预设阈值的基元分词。例如,当“西下”出现在表3所示的语言模型库中的词组中时,“的”出现在该词组中的“西下”之后的概率86%高于上述第一预设阈值(如45%),上述设备可以生成的相册标题“夕阳西下的”。
进一步的,上述设备还可以对其生成的相册标题进行语义分析,分析生成的相册标题的语义是否完整。由于上述相册标题“夕阳西下的”语义不完整,因此该设备可以继续从表3 所示的多个基元分词中,确定当“的”出现在表3所示的语言模型库中的词组中时,出现在该词组中的“的”之后的概率高于上述第一预设阈值的基元分词。例如,当“的”出现在表 3所示的语言模型库中的词组中时,“美好”和“唯美”出现在该词组中的“的”之后的概率48%和47%高于上述第一预设阈值(如45%),上述设备可以生成相册标题“夕阳西下的美好”和“夕阳西下的唯美”。
综上所述,上述设备可以生成如下相册标题:“夕阳西下”、“夕阳西下的美好”和“夕阳西下的唯美”。
本申请实施例提供一种生成相册标题的方法,上述第一语言模型库中不仅包括多个基元分词,还包括每个基元分词相对另一基元分词的条件概率。以第一语言模型库中的其他基元分词相对第一基元分词的条件概率为例。其他基元分词相对第一基元分词的条件概率为:在第一语言模型库所包含的词组中,当第一基元分词出现在词组中时,其他基元分词出现在词组中的第一基元分词之后的概率。即其他基元分词相对第一基元分词的条件概率可以反映出第一语言模型库中的其他基元分词出现在第一基元分词之后、与第一基元分词组成词组的概率。如此,上述设备在确定出与第一相册的相册标签匹配的第一基元分词后,便可以确定出相对第一基元分词的条件概率高于第一预设阈值的第二基元分词,进而将包含第一基元分词和第二基元分词的词组作为第一相册的相册标题。
进一步的,如果上述设备执行S304,为第一相册生成了一个相册标题;那么,在上述所示的S304之后,本申请实施例的方法还可以包括S901:
S901、当设备为第一相册生成了一个相册标题时,上述设备在第一相册中显示获得的相册标题。
进一步的,如果上述设备执行S304,为第一相册生成了至少两个相册标题,该设备可以在生成至少两个相册标题后,随机从这至少两个相册标题中选择一个相册标题,并在上述第一相册中显示选择的相册标题。具体的,在S304之后,本申请实施例的方法还可以包括S902:
S902、当设备为第一相册生成了至少两个相册标题时,该设备从至少两个相册标题随机选择一个相册标题,并在第一相册中显示选择的相册标题。
示例性的,以手机100是上述设备为例,手机100在为第一相册生成相册标题之后,如果接收到用户对图10中的(a)所示的“相册”应用的图标1003的点击操作,则可以响应于用户对“相册”应用的图标1003的点击操作,显示图10中的(b)所示的相册列表界面1004。该相册列表界面1004中包括该手机100生成的多个相册,如相册1005、相册1006和相册1007。并且,每一个相册的图标上可以显示该相册的相册标题。例如,如图10中的(b)所示,相册1005的相册标题为“沙滩风光”,相册1006的相册标题为“婚礼幸福时刻”,相册1007 的相册标题为“夕阳西下”。
进一步的,手机100可以响应于用户对相册列表界面1004中任一相册的图标的点击操作,显示对应相册的图片列表界面。例如,当用户点击图10中的(b)所示的相册1006的图标后,手机100可以响应于用户对相册1006的图标的点击操作,显示图10中的(c)所示的相册1006的图片列表界面1008,该图片列表界面1008中包括相册1006的相册标题“婚礼幸福时刻”1009。
可以理解,由于本申请实施例生成的相册标题与相册中的图片内容的契合度较高;因此,在第一相册中显示为第一相册生成的相册标题,不仅可以标识该第一相册,还可以提高用户查看该第一相册时的用户体验。
可选的,为了进一步提高第一相册的相册标题与用户喜好的符合度,如果上述设备执行 S304,为第一相册生成了至少两个相册标题,上述设备还可以显示上述至少两个相册标题,以供用户选择,并将用户选择的相册标题,确定为该第一相册的相册标题。具体的,在上述 S304之后,本申请实施例的方法还可以包括S1101:
S1101、设备显示为第一相册生成的至少两个相册标题,响应于用于对该至少两个相册标题中任一相册标题的选择操作,在上述第一相册中显示用户选择的相册标题。
举例来说,假设上述至少两个相册标题包括上述实例中生成的相册标题“夕阳西下”、“夕阳西下的美好”和“夕阳西下的唯美”。以手机100是上述设备为例,手机100可以在生成上述至少两个相册标题后,显示图11所示的标题选择界面1102。该标题选择界面1102中包括提示信息(如“请选择您喜欢的相册标题”)、“夕阳西下”标题选项、“夕阳西下的美好”标题选项、“夕阳西下的唯美”标题选项和“OK”按钮。手机100可以响应于用户对标题选择界面1102的标题选项的选择操作,以及用户对“OK”按钮的点击操作,确定该用户选择的相册标题。
其中,设备在第一相册中显示用户选择的相册标题的具体方法,可以参考本申请实施例 S901和S902中的相关描述,本申请实施例这里不再赘述。
本申请实施例中,上述设备可以在为第一相册生成多个相册标题后,在该设备上显示该多个相册标题,以供用户选择,然后将用户选择的相册标题作为第一相册的相册标题。这样,可以提高第一相册的相册标题与用户喜好的符合度。
在本申请实施例中,上述设备可以针对上述预设多个场景中每个场景,分别收集语料数据,得到多个语料库,即每个场景可以包括一个语料库。然后,上述设备可以针对每个语料库,统计的多个基元分词(即对语料库中的语料数据进行分词得到的多个基元分词),以得到对应的语言模型库。具体的,在上述S302之前,本申请实施例的方法还可以包括S1201-S1205。例如,如图12所示,在图6所示的S302之前,本申请实施例的方法还可以包括S1201-S1205:
S1201、设备获取预设多个场景中每个场景的语料库,一个场景的语料库包括一个场景的多个语料数据。
本申请实施例中的语料数据可以包括:人们在为相册命名时所使用的相册标题。例如,“背包浪迹天涯”、“夕阳西下的唯美”、“美食集锦”、“宝宝周岁相册”、“猫咪的日常”和“故宫一日游”等。其中,上述设备可以通过一些爬虫工具,从网络获取用户上传的相册标题。爬虫工具是一种按照一定的规则,自动地抓取网络信息的程序或者脚本。
本申请实施例中的语料数据还可以包括:上述设备从开源的语料数据库(如搜狗语料库) 中获取的语料数据。其中,该设备可以针对每个场景,分别从上述开源的语料数据库中抽取与场景对应的语料数据,并将其保存在对应的语料库中。
本申请实施例中的语料数据还可以包括:上述设备从唐诗宋词、国内外文学著作、国内外著名期刊日报、网络文学作品等文学书报中获取的语料数据。其中,该设备可以针对每个场景中的每种语言风格,分别从上述文学书报中抽取与场景对应的语料数据,并将其保存在对应的语料库中。
可以理解,本申请实施例中的语料数据的来源包括但不限于上述来源,本申请实施例对上述设备收集语料数据的来源不作限制。
其中,在S1201之后,上述设备可以针对每个语料库执行以下S1202-S1205,以分析每个语料库中的语料数据,得到多个语言模型库:
S1202、设备对一个语料库的所有语料数据进行分词,得到多个第三基元分词。
其中,上述设备可以调用预先设定的算法对上述语料数据进行分词,得到多个基元分词。例如,假设上述语料库中包括语料数据“背包浪迹天涯”,上述设备可以对该语料数据进行分词,并提取出如下分词:“背包”、“浪迹”和“天涯”。假设上述语料库中包括语料数据“夕阳西下的美好”,上述设备可以对该语料数据进行分词,并提取出如下分词:“夕阳”、“西下”、“的”和“美好”。
S1203、设备统计多个第三基元分词中每个第三基元分词在所述一个语料库出现的频率,以及多个词组对中的每个词组对在所述一个语料库出现的频率,该词组对由同一语料数据中,按照预设顺序相邻的两个第三基元分词组成。
举例来说,假设一个语料库(语料库a)中包括以下语料数据:“海上风光”、“海上的夕阳”、“夕阳下的大海”、“夕阳西下”和“夕阳西下的美好”。上述设备对语料库a中的语料数据进行分词,可以得到如下基元分词:“海上”、“风光”、“夕阳”、“下”、“的”、“大海”、“西下”和“美好”。
并且,上述设备可以统计得到:基元分词“海上”在语料库a中出现的次数为2次,基元分词“风光”在语料库a中出现的次数为1次,基元分词“夕阳”在语料库a中出现的次数为4次,基元分词“下”在语料库a中出现的次数为1次,基元分词“的”在语料库a中出现的次数为3次,基元分词“大海”在语料库a中出现的次数为1次,基元分词“西下”在语料库a中出现的次数为2次,基元分词“美好”在语料库a中出现的次数为1次。如表 4所示,其示出了本申请实施例提供的一种基元分词出现次数表实例。
表4
Figure GDA0002129480830000201
语料库a中的词组对可以包括:由语料数据“海上风光”中的“海上”和“风光”组成的词组对“海上风光”(记为词组对A);由语料数据“海上的夕阳”中的“海上”、“的”和“夕阳”组成的词组对“海上的”(记为词组对B)和“的夕阳”(记为词组对C);由语料数据“夕阳下的大海”中的“夕阳”、“下”、“的”和“大海”组成的词组对“夕阳下”(记为词组对D)、“下的”(记为词组对E)和“的大海”(记为词组对F);由语料数据“夕阳西下”中的“夕阳”和“西下”组成的词组对“夕阳西下”(记为词组对G);由语料数据“夕阳西下的美好”中的“夕阳”、“西下”、“的”和“美好”组成的词组对“夕阳西下”(词组对G)、“西下的”(记为词组对H)和“的美好”(记为词组对I)。
其中,上述词组对“海上风光”(即词组对A)在语料库a中出现的次数为1次,上述词组对“海上的”(词组对B)在语料库a中出现的次数为1次,上述词组对“的夕阳”(词组对C)在语料库a中出现的次数为1次,上述词组对“夕阳下”(词组对D)在语料库a中出现的次数为1次,上述词组对“下的”(词组对E)在语料库a中出现的次数为1次,上述词组对“的大海”(词组对F)在语料库a中出现的次数为1次,上述词组对“夕阳西下”(词组对G)在语料库a中出现的次数为2次,上述词组对“西下的”(词组对H)在语料库a中出现的次数为1次,上述词组对“的美好”(词组对I)在语料库a中出现的次数为1次。如表5所示,其示出了本申请实施例提供的一种词组对出现次数表实例。
表5
Figure GDA0002129480830000202
其中,如果上述语料库a中未出现一个词组对,那么该词组对在上述语料库a中出现的次数则为0次。例如,如表5所示,词组对“海上海上”(记为词组对J)在语料库a中出现的次数为0次。
举例来说,结合图7,如图13所示,上述多个语料库包括在语料库集合1310中。并且,上述设备可以将对语料库集合1310中的每个预料库中的语料数据进行分词得到的多个基元分词,以及每个基元分词在对应语料库中出现的次数和上述多个词组对中的每个词组对在该语料库中出现的次数,保存在一个词典中。例如,基于上述实例,上述设备可以将对预料库 a中的语料数据进行分词得到的多个基元分词,以及每个基元分词在语料库a中出现的次数和上述多个词组对中的每个词组对在语料库a中出现的次数,保存在词典a中。例如,词典 a中可以保存表4所示的基元分词出现次数表和表5所示的词组对出现次数表。
即上述多个语料库中的每个预料库对应于一个词典,这些词典保存在图13所示的词典数据库1320中。上述设备可以针对词典数据库1320中的每个词典执行以下操作:分词一个词典中保存的数据,计算该词典中每个基元分词的多个条件概率,并生成保存基元分词及其条件概率的语言模型库。上述设备可以统计分词词典数据库1320中的多个词典中保存的数据,得到如图13所示的预存的语言模型库数据库203。
可以理解,图13所示的语料库集合1310中的语料库与词典数据库1320中的词典一一对应,词典数据库1320中的词典与预存的语言模型库数据库203中的语言模型库一一对应。例如,如图14所示,语料库1对应于词典1,词典1对应于语言模型库1;语料库2对应于词典2,词典2对应于语言模型库2;语料库3对应于词典3,词典3对应于语言模型库3;语料库4对应于词典4,词典4对应于语言模型库4。
本申请实施例这里以语料库1、词典1和语言模型库1为例,对语料库、词典和语言模型库的关系进行举例说明:
语料库1中包括场景1的语料数据。其中,语料库1中的语料数据是上述设备统计的用于描述场景1的图片时,被经常使用的词句(即相册标题)。词典1中包括:对语料库1中的语料数据进行分词得到的多个基元分词、每个基元分词在上述语料库1中出现的次数、以及词典1中的每个词组对在上述语料库1中出现的次数。语言模型库1中包括:对语料库1中的语料数据进行分词得到的多个基元分词、每个基元分词相对其他基元分词的条件概率。语言模型库1中的多个条件概率的根据词典1中保存的数据得到的。其中,上述设备根据词典1中保存的数据,计算得到多个条件概率的方法参见S1204中的详细描述,本申请实施例这里不再赘述。
需要说明的是,表4仅以举例方式给出上述实例中各个基元分词在语料库a中出现的次数,表5仅以举例方式给出上述实例中各个词组对在语料库a中出现的次数。一般而言,一个语料库中的语料数据较多,上述基元分词和词组对在一个语料库中出现的次数不止是图4 和表5所示的1次或者2次。
例如,如表6所示,基元分词“夕阳”在一个语料库中出现的次数可以为2533次,基元分词“西下”在该语料库中出现的次数可以为927次,基元分词“的”在该语料库中出现的次数可以为2417次,基元分词“唯美”在该语料库中出现的次数可以为746次。
表6
Figure GDA0002129480830000211
如表7所示,词组对“夕阳夕阳”在一个语料库中出现的次数可以为5次,词组对“夕阳西下”在该语料库中出现的次数可以为827次,基元分词“夕阳的”在该语料库中出现的次数可以为0次,基元分词“夕阳唯美”在该语料库中出现的次数可以为9次等。
表7
Figure GDA0002129480830000221
由表7所示的多个基元分词所组成的词组对中,部分词组对在语料库中出现的次数可能为0次。例如,如表7所示,词组对“夕阳的”在语料库中出现的次数为0次。基于语言的多变性,可能会有一些用户喜欢使用不同于其他用户的语言习惯的词组对来描述相册。如此,词典中部分词组对出现的次数为0次的情况,不能覆盖所有用户的语言习惯。针对这个问题,本申请实施例中,上述设备在获取到上述词组对在语料库中出现的次数后,可以对获取到的上述词组对出现的次数进行平滑处理。
举例来说,上述设备对词组对出现的次数进行平滑处理的方法可以包括:Add-one平滑处理和Good-Turning平滑处理。例如,以上述设备采用Add-one平滑处理方式,对表7所示的词组对出现的次数进行平滑处理为例,上述设备可以为表7所示的出现次数为0的词组对的出现次数加1,得到表8所示的平滑后的词组对出现次数表。
表8
Figure GDA0002129480830000222
S1204、设备根据每个第三基元分词在所述一个语料库出现的频率,以及每个词组对在一个语料库出现的频率,计算每个第三基元分词相对其他第三基元分词的条件概率。
举例来说,本申请实施例中,上述设备可以采用N-Gram算法,根据一个词典中的每个基元分词在对应语料库中出现的次数,以及该词典中的每个词组对在对应语料库中出现的次数,计算上述每个基元分词相对其他基元分词的条件概率。相应的,本申请实施例中的语言模型库则为N-Gram模型库。
在二元N-Gram模型库中,对于一个由M(M≥2)个基元分词(如W1,W2,……, WM)组成的序列(即一句话),根据链式法则,并依据马尔科夫假设,可以计算得到该序列出现的概率为:P(W1,W2,……,WM)=P(W1)P(W2|W1)P(W3|W2)……P(WM|WM-1)。其中,P(Wi|Wi-1)用于表示基元分词Wi相对基元分词Wi-1的条件概率,即当基元分词Wi-1出现在词组“Wi-1Wi”中时,基元分词Wi出现在词组“Wi-1Wi”中的基元分词Wi-1之后的概率。本申请实施例中,将P(Wi|Wi-1)称为Wi-1的一个条件概率,i=2,3,……,M。
其中,上述马尔科夫假设是指一个词组中的一个基元分词出现的可能性仅与该词组中在该基元分词前相邻的基元分词有关。例如,假设一个词组为“夕阳西下的美好”,该词组中包括以下基元分词“夕阳”、“西下”、“的”和“美好”。依据马尔科夫假设,基元分词“西下”出现的可能性仅与基元分词“夕阳”有关,基元分词“的”出现的可能性仅与基元分词“西下”有关,基元分词“美好”出现的可能性仅与基元分词“的”有关。
上述单个基元分词出现的概率
Figure GDA0002129480830000231
条件概率
Figure GDA0002129480830000232
Figure GDA0002129480830000233
其中,C(Wi)用于表示基元分词Wi出现的次数,C(Wi-1)用于表示基元分词Wi-1出现的次数,C(Wi-1Wi)用于表示词组对“Wi-1Wi”出现的次数。例如, C(西下)用于表示基元分词“西下”出现的次数,C(夕阳)用于表示基元分词“夕阳”出现的次数,C(夕阳西下)用于表示词组对“夕阳西下”出现的次数。
示例性的,结合表6和表8,上述设备可以计算得到基元分词“夕阳”相对基元分词“夕阳”的条件概率为
Figure GDA0002129480830000234
基元分词“西下”相对基元分词“夕阳”的条件概率为
Figure GDA0002129480830000235
基元分词“的”相对基元分词“夕阳”的条件概率为
Figure GDA0002129480830000236
Figure GDA0002129480830000237
基元分词“唯美”相对基元分词“夕阳”的条件概率为
Figure GDA0002129480830000238
Figure GDA0002129480830000239
结合表6和表8,上述设备可以计算得到基元分词“夕阳”相对基元分词“西下”的条件概率为
Figure GDA00021294808300002310
基元分词“西下”相对基元分词“西下”的条件概率为
Figure GDA00021294808300002311
基元分词“的”相对基元分词“西下”的条件概率为
Figure GDA00021294808300002312
基元分词“唯美”相对基元分词“西下”的条件概率为
Figure GDA00021294808300002313
Figure GDA00021294808300002314
其中,上述设备可以按照同样的计算方法,计算基元分词“夕阳”、“西下”、“的”和“唯美”相对基元分词“的”的条件概率和基元分词“夕阳”、“西下”、“的”和“唯美”相对基元分词相对基元分词“唯美”的条件概率。结合表6和表8,上述设备可以计算得到如表9 所示的条件概率实例表。
表9
Figure GDA00021294808300002315
S1205、设备生成一个语料库所处的场景对应的语言模型库,该对应的语言模型库包括多个第三基元分词和每个第三基元分词相对其他第三基元分词的条件概率。
其中,上述设备可以生成包括表9所示的多个基元分词和每个基元分词的多个条件概率的语言模型库。
本申请实施例提供的一种生成相册标题的方法,上述设备可以针对上述预设多个场景中每个场景分别收集语料数据,得到多个语料库;然后,分析每个语料库中的语料数据,得到各个场景对应的语言模型库。
可以理解,用户可能会手动为相册设置相册标题,本申请实施例中,上述设备还可以分析用户手动设置的相册标题,并采用分析结果更新本申请实施例中的语言模型库。具体的,在S1205之后,本申请实施例的方法还可以包括S1401-S1405:
S1401、设备获取用户为第二相册设置的相册标题,对第二相册的相册标题进行分词,得到多个第四基元分词。
其中,上述设备对第二相册的相册标题进行分词,得到多个第四基元分词的具体方法,可以参考上述实施例中的详细描述,本申请实施例这里不再赘述。
S1402、设备根据第二相册中的图片的内容生成第二相册的相册标签。
其中,上述设备根据第二相册中的图片的内容生成第二相册的相册标签的方法,可以参考上述实施例中设备根据第一相册中的图片的内容生成第一相册的相册标签的具体方法,本申请实施例这里不再赘述。
S1403、设备根据所述第二相册的相册标签确定第二语言模型库,所述第二语言模型库与所述第二相册的相册标签相对应。
其中,上述设备根据上述第二相册的相册标签,从上述预设多个场景中确定第二相册对应的场景,然后确定该场景的语言模型库(即第二语言模型库)。其中,上述设备确定第二语言模型库的方法,可以参考上述实施例中设备根据第一相册的相册标签,从上述预设多个场景中确定第一相册对应的场景的具体方法,本申请实施例这里不再赘述。
S1404、设备根据多个第四基元分词,更新所述第二语言模型库。
其中,如图14所示,由于本申请实施例中的语料库、词典和语言模型库一一对应;因此,上述设备可以采用以下方式更新第二语言模型库:该设备根据上述多个第四基元分词,更新第二语言模型库对应的词典(记为词典X)中的基元分词、各个基元分词出现的次数和各个词组对出现的次数;根据更新后的词典X中保存的各个基元分词出现的次数和各个词组对出现的次数,计算词典X中的各个基元分词相对其他基元分词的条件概率;根据词典X中保存的多个基元分词以及计算得到的各个基元分词相对其他基元分词的条件概率,更新上述第二语言模型库中的基元分词和条件概率。
示例性的,假设更新前的词典X中包括3个基元分词:基元分词1、基元分词2和基元分词3;上述第二相册设置的相册标题为“海边落日”,上述设备对该相册标题“海边落日”进行分词,得到“海边”(基元分词1)和“落日”(基元分词4)这两个第三基元分词。更新前的词典X中保存有表10所示的基元分词出现次数表和表11所示的词组对出现次数表。
表10
Figure GDA0002129480830000241
如表10所示,基元分词1出现的次数为a次,基元分词2出现的次数为b次,基元分词3出现的次数为c次。
表11
Figure GDA0002129480830000242
Figure GDA0002129480830000251
如表11所示,基元分词1和基元分词1组成的词组对出现的次数为d次,基元分词1和基元分词2组成的词组对出现的次数为e次,基元分词1和基元分词3组成的词组对出现的次数为f次,基元分词2和基元分词1组成的词组对出现的次数为g次,基元分词2和基元分词2组成的词组对出现的次数为h次,基元分词2和基元分词3组成的词组对出现的次数为i次,基元分词3和基元分词1组成的词组对出现的次数为j次,基元分词3和基元分词 2组成的词组对出现的次数为k次,基元分词3和基元分词3组成的词组对出现的次数为m 次。
其中,由于上述设备对该相册标题进行分词,得到基元分词1和基元分词4;因此,上述设备可以根据该基元分词1和基元分词4更新表10所示的基元分词出现次数表,得到表12所示的基元分词出现次数表:
表12
Figure GDA0002129480830000252
上述设备可以根据该基元分词1和基元分词4更新表11所示的词组对出现次数表,得到表13所示的词组对出现次数表:
表13
Figure GDA0002129480830000253
随后,上述设备则可以根据词典X中保存的多个基元分词,执行S1204计算得到多个条件概率,然后更新上述第二语言模型库中的基元分词和条件概率。可选的,上述设备还可以对表13所示的词组对出现次数进行平滑处理。
本申请实施例中,上述设备还可以分析用户手动设置的相册标题,并采用分析结果更新语言模型库。如此,本申请实施例中的语言模型库中的基元分词及其条件概率,可以随着用户的喜好以及习惯的变化而变化,因此根据更新后的语言模型库中的基元分词生成的相册标题与拍摄相册中的图片时所处场景的契合度则更高,该相册标题更加符合对应相册的内容以及用户语言风格。
可以理解,不同用户描述或者介绍同一事物(如相册)时所喜好的语言风格不同。基于此,本申请实施例中,如图15所示,上述设备生成第一相册的相册标题时,不仅可以参考根据第一相册的相册标签确定的场景,还可以参考用户喜好的语言风格1510。这样,不仅可以提高生成的相册标题与第一相册的内容的契合度,还可以使相册标题更加符合用户语言风格。具体的,在S302或S302a之前,本申请实施例的方法还可以包括S1501:
S1501、设备获取第一语言风格,该第一语言风格是用户喜好的语言风格。
其中,本申请实施例中的语言风格可以包括:文艺风格、白话风格、幽默风趣风格、拟人式风格等。
在一种可能的实现方式中,上述设备可以统计用户在该设备中编辑文字的风格,来确定上述第一语言风格。具体的,上述S1501可以包括S1501a:
S1501a、设备统计用户在该设备中输入的文本信息和/或语音信息的语言风格,确定上述第一语言风格。
其中,上述设备可以在接收用户在该设备中输入的文本信息(即文字)或者语音信息后,分析接收到的文本信息或者语音信息,以确定该文本信息或者语音信息的语言风格;然后,该设备可以统计预设时间段(例如,一个月、三个月或者半年)内,该设备分析上述文本信息和语音信息得到的结果(即语言风格)中,各种语言风格出现的概率,并将概率最高的语言风格确定为上述第一语言风格。其中,一种语言风格出现的概率是这种语言风格在上述分析结果中出现的次数与上述分析结果的总数的比值。
可选的,上述设备在执行S1501a获取到上述第一语言风格后,可以在该设备中保存该第一语言风格,以便于在为相册生成相册标题时,可以直接读取该设备中保存的第一语言风格;而不需要在生成相册标题时,才执行S1501a确定上述第一语言风格。其中,上述设备直接读取该设备中保存的语言风格,可以减少设备生成相册标题过程中的计算量,提高生成相册标题的效率。
当然,上述设备也可以在生成相册标题时,执行S1501a,实时获取上述第一语言风格。本申请实施例对上述设备获取第一语言风格的具体方法不作限制。
可以理解,上述设备可以周期性统计用户在该设备中输入的文本信息和/或语音信息的语言风格,以便于可以及时更新上述设备中保存的语言风格。
可选的,上述设备在执行S1501a获取到上述第一语言风格后,可以在该设备中保存该第一语言风格,以便于在为相册生成相册标题时,可以直接读取该设备中保存的第一语言风格。其中,直接读取终端中保存的语言风格,可以减少设备生成相册标题过程中的计算量,提高生成相册标题的效率。当然,上述设备也可以在生成相册标题时,执行S1501a,实时获取上述第一语言风格。本申请实施例对上述设备获取第一语言风格的具体方法不作限制。
在另一种可能的实现方式中,上述设备可以显示用于供用户选择用户喜好的语言风格的风格选择界面,由用户在该风格选择界面中选择该用户所喜好的语言风格。具体的,在S302 或S302a之前,本申请实施例的方法还可以包括S1501b-S1501c,即上述S1501可以包括 S1501b-S1501c:
S1501b:设备显示风格选择界面,该风格选择界面中包括多个语言风格选项。
示例性的,上述设备可以在该设备出厂后第一次拍摄图片或下载并保存图片之后,显示图4中的(b)所示的风格选择界面403,提示用户选择该用户所喜好的语言风格。或者,上述设备还可以周期性统计该设备中新增的图片个数,并在新增的图片个数超过预设图片阈值时,显示图4中的(b)所示的风格选择界面403,提示用户选择该用户所喜好的语言风格。其中,图4中的(b)所示的风格选择界面403中包括“文艺风格”选项、“白话风格”选项、“诙谐幽默风格”选项等语言风格选项和“OK”按钮。手机100可以响应于用户对风格选择界面403中的语言风格选项的选择操作,以及用户对“OK”按钮的点击操作,确定该用户喜好的语言风格(即第一语言风格)。
可选的,图4中的(b)所示的风格选择界面403中还可以包括提示信息404,该提示信息404用于提示用户选择用户喜好的语言风格。例如,该提示信息404可以为“请选择您喜好的语言风格,手机将使用您选择的语言风格,自动为您生成相册标题!”。
再或者,该设备的“相册”应用的显示界面中可以包括用于触发该设备显示上述风格选择界面的功能选项或者功能按钮。该设备可以响应于用户对该功能选项或者功能按钮的点击操作,显示上述风格选择界面。例如,如图4中的(a)所示,以手机100是上述设备为例,当手机100接收到用户对功能按钮402的点击操作后,该手机100可以响应于用户对功能按钮402的点击操作,显示图4中的(b)所示的风格选择界面403。
S1501c、设备响应于用户对上述多个语言风格选项中任一语言风格选项的选择操作,将用户选择的语言风格选项对应的语言风格确定为上述第一语言风格。
需要说明的是,本申请实施例中设备可以先执行S301,再执行S1501;或者,设备可以先执行S1501,再执行S301;又或者,设备可以同时执行S301和S1501。本申请实施例对设备执行S301和S1501的先后顺序不作限制。
可选的,上述设备在获取到上述第一语言风格后,可以在该设备中保存该第一语言风格,以便于在为相册生成相册标题时,可以直接从该设备中获取该第一语言风格,而不需要在生成相册标题时,才统计用户在该设备中输入的文本信息和/或语音信息的语言风格或者显示上述风格选择界面,来确定上述第一语言风格。其中,在为相册生成相册标题时,直接获取终端中保存的语言风格,可以减少设备生成相册标题时设备的计算量,提高生成相册标题的效率。
当然,上述设备也可以在生成相册标题时,执行S1501a或者S1501b-S1501c,实时获取上述第一语言风格。本申请实施例对上述设备获取第一语言风格的具体方法不作限制。
相应的,本申请实施例中第一语言模型库不仅是第一相册的相册标签对应的场景的语言模型库,并且,第一语言模型库中的基元分词与第一语言风格对应。也就是说,图15所示的预设的语言模型库203中包括上述预设多个场景中每个场景中的一个或多个语言模型库;并且,每个场景中的每个语言模型库对应于一种语言风格。其中,一个语言模型库对应于一种语言风格(如语言风格a)是指该语言模型库中的基元分词符合该语言风格a。
例如,如图16所示,结合图14,语料库1中包括场景1中、语言风格1对应的语料数据。其中,语料库1中的语料数据是上述设备统计的、采用语言风格1描述场景1的图片被经常使用的词句(即相册标题)。相应的,语言模型库1是场景1中、语言风格1对应的语言模型库。语料库3中包括场景1中、语言风格3对应的语料数据。其中,语料库3中的语料数据是上述设备统计的、采用语言风格3描述场景1的图片被经常使用的词句。相应的,语言模型库3是场景1中、语言风格3对应的语言模型库。
如图16所示,结合图14,语料库2中包括场景2中、语言风格2对应的语料数据。其中,语料库2中的语料数据是上述设备统计的、采用语言风格2描述场景2的图片被经常使用的词句。相应的,语言模型库2是场景2中、语言风格2对应的语言模型库。语料库4中包括场景2中、语言风格4对应的语料数据。其中,语料库4中的语料数据是上述设备统计的、采用语言风格4描述场景2的图片被经常使用的词句。相应的,语言模型库4是场景2 中、语言风格4对应的语言模型库。相应的,上述S1201可以替换为S1201a:
S1201a、设备获取每个场景的多个语料库,该多个语料库中的每个语料库包括一种语言风格的语料数据,不同语料库中包括的语料数据的语言风格不同。
需要说明的是,上述语言风格1与语言风格3不同,语言风格2与语言风格4不同;语言风格1与语言风格2以及语言风格4可以相同,也可以不同;语言风格3与语言风格2以及语言风格4可以相同也可以不同。
本申请实施例中,上述设备生成第一相册的相册标题时,不仅可以参考根据第一相册的相册标签确定的场景,还可以参考用户喜好的语言风格。这样,不仅可以提高生成的相册标题与第一相册的内容的契合度,还可以使相册标题更加符合用户语言风格。
可以理解的是,上述设备等为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本发明实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
本申请实施例可以根据上述方法示例对上述设备等进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,如图17所示,本申请实施例提供一种生成相册的装置1700,该生成相册的装置1700包括在本申请实施例所述的设备中。该生成相册的装置1700包括:标签生成单元1701、确定单元1702、查找单元1703和标题生成单元1704。
其中,上述标签生成单元1701用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S301、S301a-S301d、S1402,和/或用于本文所描述的技术的其它过程。上述确定单元1702用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S302、S302a、S1403,和/或用于本文所描述的技术的其它过程。上述查找单元1703用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S303、S303a-S303b,和/或用于本文所描述的技术的其它过程。上述标题生成单元1704用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S304、S304a,和/或用于本文所描述的技术的其它过程。
进一步的,如图18所示,上述生成相册的装置1700还可以包括:语料获取单元1705和模型生成单元1706。该语料获取单元1705用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S1201、S1201a,和/或用于本文所描述的技术的其它过程。该模型生成单元1706用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S1202-S1205,和/或用于本文所描述的技术的其它过程。
进一步的,上述生成相册的装置1700还可以包括:分词获取单元和更新单元。该分词获取单元用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S1401,和/或用于本文所描述的技术的其它过程。该更新单元用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S1404,和/ 或用于本文所描述的技术的其它过程。
进一步的,上述生成相册的装置1700还可以包括:风格获取单元。该风格获取单元用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S1501、S1501a、S1501c,和/或用于本文所描述的技术的其它过程。
进一步的,上述生成相册的装置1700还可以包括:显示单元和选择单元。该显示单元用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S901、S902中显示相册标题的操作、S1101、S1501b,和/或用于本文所描述的技术的其它过程。该选择单元用于支持生成相册的装置1700或者包括该生成相册的装置1700的设备执行上述方法实施例中的S902中的选择操作,和/或用于本文所描述的技术的其它过程。
当然,上述生成相册的装置1700包括但不限于上述所列举的单元模块,例如,上述生成相册的装置1700还可以包括:通信单元。其中,通信单元用于向其他设备发送消息或者信息,接收其他设备发送的消息或者信息。并且,上述功能单元的具体所能够实现的功能也包括但不限于上述实例所述的方法步骤对应的功能,生成相册的装置1700的其他单元的详细描述可以参考其所对应方法步骤的详细描述,本申请实施例这里不再赘述。
在采用集成的单元的情况下,上述标签生成单元1701、确定单元1702、查找单元1703、标题生成单元1704、语料获取单元1705、模型生成单元1706、分词获取单元、更新单元、风格获取单元和选择单元等可以集成在一个处理模块中实现,上述通信单元可以是终端的RF 电路、WiFi模块或者蓝牙模块,上述存储单元可以是终端的存储模块,上述显示单元可以是显示模块,如显示器(触摸屏)。
图19示出了上述实施例中所涉及的设备的一种可能的结构示意图。该设备1900包括:处理模块1901、存储模块1902和显示模块1903。处理模块1901用于对设备进行控制管理。显示模块1903用于显示处理模块1901生成的图像。存储模块1902,用于保存设备的程序代码和数据。进一步的,该设备1900还可以包括通信模块。该通信模块用于与其他设备通信。如通信模块用于接收或者向其他设备发送的图片。
其中,处理模块1901可以是处理器或控制器,例如可以是中央处理器(CentralProcessing Unit,CPU),通用处理器,数字信号处理器(Digital Signal Processor,DSP),专用集成电路 (Application-Specific Integrated Circuit,ASIC),现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。通信模块可以是收发器、收发电路或通信接口等。存储模块1902可以是存储器。
当处理模块1901为处理器(如图1所示的处理器101),通信模块为RF电路(如图1所示的射频电路102),存储模块1902为存储器(如图1所示的存储器103),显示模块1903 为触摸屏(包括图1所示的触控板104-1和显示器104-2)时,本申请所提供的设备可以为图 1所示的手机100。其中,上述通信模块不仅可以包括RF电路,还可以包括WiFi模块和蓝牙模块。RF电路、WiFi模块和蓝牙模块等通信模块可以统称为通信接口。其中,上述处理器、通信接口、触摸屏和存储器可以通过总线耦合在一起。
本申请实施例还提供一种控制设备,包括处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,执行如上述方法实施例所述的输入信息的方法。
本申请实施例还提供一种计算机存储介质,该计算机存储介质中存储有计算机程序代码,当上述处理器执行该计算机程序代码时,该设备执行图3、图6、图9和图12中任一附图中的相关方法步骤实现上述实施例中的方法。
本申请实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行图3、图6、图9和图12中任一附图中的相关方法步骤实现上述实施例中的方法。
其中,本申请提供的生成相册的装置1700、生成相册的装置1800和终端1900、计算机存储介质或者计算机程序产品均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:快闪存储器、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (31)

1.一种生成相册标题的方法,其特征在于,所述方法包括:
根据第一相册中的图片的内容生成所述第一相册的相册标签;
根据所述第一相册的相册标签确定第一语言模型库,所述第一语言模型库与所述第一相册的标签相对应,所述第一语言模型库包括多个基元分词;
查找所述第一语言模型库中,与所述第一相册的相册标签匹配的基元分词;
根据所述匹配的基元分词,生成所述第一相册的相册标题。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一相册的标签确定第一语言模型库,包括:
根据所述第一相册的相册标签,从预存的语言模型库中确定所述第一语言模型库;所述预存的语言模型库中包括预设多个场景中每个场景的语言模型库,所述第一语言模型库是所述第一相册的相册标签对应的场景的语言模型库。
3.根据权利要求1或2所述的方法,其特征在于,所述第一语言模型库还包括:所述第一语言模型库中的一个基元分词相对另一基元分词的条件概率;所述一个基元分词相对另一基元分词的条件概率为:在所述第一语言模型库所包含的词组中,当所述另一个基元分词出现在词组中时,所述一个基元分词出现在所述词组中的所述另一个基元分词之后的概率;
所述查找所述第一语言模型库中,与所述第一相册的相册标签匹配的基元分词,包括:
从所述第一语言模型库的多个基元分词中,查找与所述第一相册的相册标签匹配的第一基元分词;
从所述第一语言模型库的多个基元分词中,查找第二基元分词,所述第二基元分词相对所述第一基元分词的条件概率大于第一预设阈值;
所述根据所述匹配的基元分词,生成所述第一相册的相册标题,包括:
将包含所述第一基元分词和所述第二基元分词的词组作为所述第一相册的相册标题。
4.根据权利要求1或2所述的方法,其特征在于,在所述根据所述第一相册的标签确定第一语言模型库之前,所述方法还包括:
获取预设多个场景中每个场景的语料库,一个场景的语料库包括所述一个场景的多个语料数据;
针对所述每个语料库执行以下操作:
对一个语料库的所有语料数据进行分词,得到多个第三基元分词;
统计所述多个第三基元分词中每个第三基元分词在所述一个语料库出现的频率,以及多个词组对中的每个词组对在所述一个语料库出现的频率,所述词组对由同一语料数据中,按照预设顺序相邻的两个第三基元分词组成;
根据所述每个第三基元分词在所述一个语料库出现的频率,以及所述每个词组对在所述一个语料库出现的频率,计算所述每个第三基元分词相对其他第三基元分词的条件概率;
生成所述一个语料库所处的场景对应的语言模型库,所述对应的语言模型库包括所述多个第三基元分词和所述每个第三基元分词相对其他第三基元分词的条件概率。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取用户为第二相册设置的相册标题,对所述第二相册的相册标题进行分词,得到多个第四基元分词;
根据所述第二相册中的图片的内容生成所述第二相册的相册标签;
根据所述第二相册的相册标签确定第二语言模型库,所述第二语言模型库与所述第二相册的相册标签相对应;
根据所述多个第四基元分词,更新所述第二语言模型库。
6.根据权利要求2所述的方法,其特征在于,在所述根据所述第一相册的相册标签,从预存的语言模型库中确定所述第一语言模型库之前,所述方法还包括:
获取第一语言风格,所述第一语言风格是用户喜好的语言风格;
其中,所述每个场景包括多个语言模型库,每个语言模型库的基元分词对应于一种语言风格,不同语言模型库的基元分词对应的语言风格不同;所述第一语言模型库的基元分词与所述第一语言风格相对应。
7.根据权利要求6所述的方法,其特征在于,在所述根据所述第一相册的相册标签,从预存的语言模型库中确定所述第一语言模型库之前,所述方法还包括:
获取所述每个场景的多个语料库,所述多个语料库中的每个语料库包括一种语言风格的语料数据,不同语料库中包括的语料数据的语言风格不同;
针对所述每个语料库执行以下操作:
对一个语料库的所有语料数据进行分词,得到多个第五基元分词;
统计所述多个第五基元分词中每个第五基元分词在所述一个语料库出现的频率,以及多个词组对中的每个词组对在所述一个语料库出现的频率,所述词组对由同一语料数据中,按照预设顺序相邻的两个第五基元分词组成;
根据所述每个第五基元分词在所述一个语料库出现的频率,以及所述每个词组对在所述一个语料库出现的频率,计算所述每个第五基元分词相对其他第五基元分词的条件概率;
生成所述一个语料库所处的场景以及所述一个语料库的语言风格对应的语言模型库,所述对应的语言模型库包括所述多个第五基元分词和所述每个第五基元分词相对其他第五基元分词的条件概率。
8.根据权利要求1或2或6或7所述的方法,其特征在于,所述根据第一相册中的图片的内容生成所述第一相册的相册标签,包括:
生成所述第一相册,所述第一相册包括多个图片;
根据所述第一相册中的每个图片生成对应图片的图片标签;
统计获取到的图片标签的总数,并统计获取到的所有图片标签中每一种图片标签的个数;
计算每一种图片标签的个数与图片标签的总数的比值,并将比值高于第二预设阈值的图片标签确定为所述第一相册的相册标签。
9.根据权利要求6或7所述的方法,其特征在于,所述获取第一语言风格,包括:
统计用户编辑文字的风格,确定所述第一语言风格;
或者,
显示风格选择界面,所述风格选择界面中包括多个语言风格选项,响应于用户对所述多个语言风格选项中任一语言风格选项的选择操作,将用户选择的语言风格选项对应的语言风格确定为所述第一语言风格。
10.一种生成相册标题的装置,其特征在于,所述装置包括:标签生成单元、确定单元、查找单元和标题生成单元;
标签生成单元,用于根据第一相册中的图片的内容生成所述第一相册的相册标签;
确定单元,用于根据所述标签生成单元生成的所述第一相册的相册标签确定第一语言模型库,所述第一语言模型库与所述第一相册的标签相对应,所述第一语言模型库包括多个基元分词;
查找单元,用于查找所述确定单元确定的所述第一语言模型库中,与所述第一相册的相册标签匹配的基元分词;
标题生成单元,用于根据所述查找单元查找到的所述匹配的基元分词,生成所述第一相册的相册标题。
11.根据权利要求10所述的装置,其特征在于,所述确定单元,具体用于:
根据所述标签生成单元生成的所述第一相册的相册标签,从预存的语言模型库中确定所述第一语言模型库;所述预存的语言模型库中包括预设多个场景中每个场景的语言模型库,所述第一语言模型库是所述第一相册的相册标签对应的场景的语言模型库。
12.根据权利要求10或11所述的装置,其特征在于,所述确定单元确定的所述第一语言模型库还包括:所述第一语言模型库中的一个基元分词相对另一基元分词的条件概率;所述一个基元分词相对另一基元分词的条件概率为:在所述第一语言模型库所包含的词组中,当所述另一个基元分词出现在词组中时,所述一个基元分词出现在所述词组中的所述另一个基元分词之后的概率;
所述查找单元,具体用于:从所述确定单元确定的所述第一语言模型库的多个基元分词中,查找与所述第一相册的相册标签匹配的第一基元分词;从所述确定单元确定的所述第一语言模型库的多个基元分词中,查找第二基元分词,所述第二基元分词相对所述第一基元分词的条件概率大于第一预设阈值;
所述标题生成单元,具体用于:将包含所述查找单元查找到的所述第一基元分词和所述第二基元分词的词组作为所述第一相册的相册标题。
13.根据权利要求10或11所述的装置,其特征在于,所述装置还包括:语料获取单元和模型生成单元;
所述语料获取单元,用于在所述确定单元根据所述第一相册的标签确定所述第一语言模型库之前,获取预设多个场景中每个场景的语料库,一个场景的语料库包括所述一个场景的多个语料数据;
所述模型生成单元,用于针对所述语料获取单元获取的所述每个语料库执行以下操作:
对一个语料库的所有语料数据进行分词,得到多个第三基元分词;
统计所述多个第三基元分词中每个第三基元分词在所述一个语料库出现的频率,以及多个词组对中的每个词组对在所述一个语料库出现的频率,所述词组对由同一语料数据中,按照预设顺序相邻的两个第三基元分词组成;
根据所述每个第三基元分词在所述一个语料库出现的频率,以及所述每个词组对在所述一个语料库出现的频率,计算所述每个第三基元分词相对其他第三基元分词的条件概率;
生成所述一个语料库所处的场景对应的语言模型库,所述对应的语言模型库包括所述多个第三基元分词和所述每个第三基元分词相对其他第三基元分词的条件概率。
14.根据权利要求10或11所述的装置,其特征在于,所述装置还包括:分词获取单元和更新单元;
所述分词获取单元,用于获取用户为第二相册设置的相册标题,对所述第二相册的相册标题进行分词,得到多个第四基元分词;
所述标签生成单元,还用于根据所述第二相册中的图片的内容生成所述第二相册的相册标签;
所述确定单元,还用于根据所述标签生成单元生成的所述第二相册的相册标签确定第二语言模型库,所述第二语言模型库与所述第二相册的相册标签相对应;
所述更新单元,用于根据所述分词获取单元获取的所述多个第四基元分词,更新所述确定单元确定的所述第二语言模型库。
15.根据权利要求11所述的装置,其特征在于,所述装置还包括:风格获取单元;
所述风格获取单元,用于在所述确定单元根据所述第一相册的相册标签,从预存的语言模型库中确定所述第一语言模型库之前,获取第一语言风格,所述第一语言风格是用户喜好的语言风格;
其中,所述每个场景包括多个语言模型库,每个语言模型库的基元分词对应于一种语言风格,不同语言模型库的基元分词对应的语言风格不同;所述第一语言模型库的基元分词与所述第一语言风格相对应。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:语料获取单元和模型生成单元;
所述语料获取单元,用于在所述确定单元根据所述第一相册的相册标签,从预存的语言模型库中确定所述第一语言模型库之前,获取所述每个场景的多个语料库,所述多个语料库中的每个语料库包括一种语言风格的语料数据,不同语料库中包括的语料数据的语言风格不同;
所述模型生成单元,用于针对所述语料获取单元生成的所述每个语料库执行以下操作:
对一个语料库的所有语料数据进行分词,得到多个第五基元分词;
统计所述多个第五基元分词中每个第五基元分词在所述一个语料库出现的频率,以及多个词组对中的每个词组对在所述一个语料库出现的频率,所述词组对由同一语料数据中,按照预设顺序相邻的两个第五基元分词组成;
根据所述每个第五基元分词在所述一个语料库出现的频率,以及所述每个词组对在所述一个语料库出现的频率,计算所述每个第五基元分词相对其他第五基元分词的条件概率;
生成所述一个语料库所处的场景以及所述一个语料库的语言风格对应的语言模型库,所述对应的语言模型库包括所述多个第五基元分词和所述每个第五基元分词相对其他第五基元分词的条件概率。
17.根据权利要求10或11或15或16所述的装置,其特征在于,所述标签生成单元,用于根据第一相册中的图片的内容生成所述第一相册的相册标签,包括:
所述标签生成单元,具体用于:
生成所述第一相册,所述第一相册包括多个图片;
根据所述第一相册中的每个图片生成对应图片的图片标签;
统计获取到的图片标签的总数,并统计获取到的所有图片标签中每一种图片标签的个数;
计算每一种图片标签的个数与图片标签的总数的比值,并将比值高于第二预设阈值的图片标签确定为所述第一相册的相册标签。
18.根据权利要求15或16所述的装置,其特征在于,所述风格获取单元具体用于:
统计用户编辑文字的风格,确定所述第一语言风格;
或者,
显示风格选择界面,所述风格选择界面中包括多个语言风格选项,响应于用户对所述多个语言风格选项中任一语言风格选项的选择操作,将用户选择的语言风格选项对应的语言风格确定为所述第一语言风格。
19.一种设备,其特征在于,包括:处理器、存储器和显示器;所述存储器、所述显示器与所述处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述存储器包括非易失性存储介质,当所述处理器执行所述计算机指令时,
所述处理器,用于根据第一相册中的图片的内容生成所述第一相册的相册标签;根据所述第一相册的相册标签确定第一语言模型库,所述第一语言模型库与所述第一相册的标签相对应,所述第一语言模型库包括多个基元分词;查找所述第一语言模型库中,与所述第一相册的相册标签匹配的基元分词;根据所述匹配的基元分词,生成所述第一相册的相册标题;
所述显示器,用于根据所述处理器的指示,显示所述第一相册的中的图片,显示所述处理器生成的所述第一相册的相册标题。
20.根据权利要求19所述的设备,其特征在于,所述存储器,还用于保存所述第一语言模型库。
21.根据权利要求19或20所述的设备,其特征在于,所述处理器,用于根据所述第一相册的标签确定第一语言模型库,包括:
所述处理器,用于根据所述第一相册的相册标签,从预存的语言模型库中确定所述第一语言模型库;所述预存的语言模型库中包括预设多个场景中每个场景的语言模型库,所述第一语言模型库是所述第一相册的相册标签对应的场景的语言模型库。
22.根据权利要求19或20所述的设备,其特征在于,所述第一语言模型库还包括:所述第一语言模型库中的一个基元分词相对另一基元分词的条件概率;所述一个基元分词相对另一基元分词的条件概率为:在所述第一语言模型库所包含的词组中,当所述另一个基元分词出现在词组中时,所述一个基元分词出现在所述词组中的所述另一个基元分词之后的概率;
所述处理器,用于查找所述第一语言模型库中,与所述第一相册的相册标签匹配的基元分词,包括:
所述处理器,用于从所述第一语言模型库的多个基元分词中,查找与所述第一相册的相册标签匹配的第一基元分词;从所述第一语言模型库的多个基元分词中,查找第二基元分词,所述第二基元分词相对所述第一基元分词的条件概率大于第一预设阈值;
所述处理器,用于根据所述匹配的基元分词,生成所述第一相册的相册标题,包括:
所述处理器,用于将包含所述第一基元分词和所述第二基元分词的词组作为所述第一相册的相册标题。
23.根据权利要求19或20所述的设备,其特征在于,所述处理器,还用于在根据所述第一相册的标签确定所述第一语言模型库之前,获取预设多个场景中每个场景的语料库,一个场景的语料库包括所述一个场景的多个语料数据;针对所述每个语料库执行以下操作:对一个语料库的所有语料数据进行分词,得到多个第三基元分词;统计所述多个第三基元分词中每个第三基元分词在所述一个语料库出现的频率,以及多个词组对中的每个词组对在所述一个语料库出现的频率,所述词组对由同一语料数据中,按照预设顺序相邻的两个第三基元分词组成;根据所述每个第三基元分词在所述一个语料库出现的频率,以及所述每个词组对在所述一个语料库出现的频率,计算所述每个第三基元分词相对其他第三基元分词的条件概率;生成所述一个语料库所处的场景对应的语言模型库,所述对应的语言模型库包括所述多个第三基元分词和所述每个第三基元分词相对其他第三基元分词的条件概率。
24.根据权利要求19或20所述的设备,其特征在于,所述处理器,还用于获取用户为第二相册设置的相册标题,对所述第二相册的相册标题进行分词,得到多个第四基元分词;根据所述第二相册中的图片的内容生成所述第二相册的相册标签;根据所述第二相册的相册标签确定第二语言模型库,所述第二语言模型库与所述第二相册的相册标签相对应;根据所述多个第四基元分词,更新所述第二语言模型库。
25.根据权利要求21所述的设备,其特征在于,所述处理器,还用于在根据所述第一相册的相册标签,从预存的语言模型库中确定所述第一语言模型库之前,获取第一语言风格,所述第一语言风格是用户喜好的语言风格;
其中,所述每个场景包括多个语言模型库,每个语言模型库的基元分词对应于一种语言风格,不同语言模型库的基元分词对应的语言风格不同;所述第一语言模型库的基元分词与所述第一语言风格相对应。
26.根据权利要求25所述的设备,其特征在于,所述处理器,还用于在根据所述第一相册的相册标签,从预存的语言模型库中确定所述第一语言模型库之前,获取所述每个场景的多个语料库,所述多个语料库中的每个语料库包括一种语言风格的语料数据,不同语料库中包括的语料数据的语言风格不同;针对所述每个语料库执行以下操作:对一个语料库的所有语料数据进行分词,得到多个第五基元分词;统计所述多个第五基元分词中每个第五基元分词在所述一个语料库出现的频率,以及多个词组对中的每个词组对在所述一个语料库出现的频率,所述词组对由同一语料数据中,按照预设顺序相邻的两个第五基元分词组成;根据所述每个第五基元分词在所述一个语料库出现的频率,以及所述每个词组对在所述一个语料库出现的频率,计算所述每个第五基元分词相对其他第五基元分词的条件概率;生成所述一个语料库所处的场景以及所述一个语料库的语言风格对应的语言模型库,所述对应的语言模型库包括所述多个第五基元分词和所述每个第五基元分词相对其他第五基元分词的条件概率。
27.根据权利要求26所述的设备,其特征在于,所述存储器,还用于保存所述语料库。
28.根据权利要求19或20或25或26或27所述的设备,其特征在于,所述处理器,用于根据第一相册中的图片的内容生成所述第一相册的相册标签,包括:
所述处理器,用于生成所述第一相册,所述第一相册包括多个图片;根据所述第一相册中的每个图片生成对应图片的图片标签;统计获取到的图片标签的总数,并统计获取到的所有图片标签中每一种图片标签的个数;计算每一种图片标签的个数与图片标签的总数的比值,并将比值高于第二预设阈值的图片标签确定为所述第一相册的相册标签。
29.根据权利要求25或26所述的设备,其特征在于,所述处理器,用于获取第一语言风格,包括:
所述处理器,用于统计用户编辑文字的风格,确定所述第一语言风格;
或者,
所述显示器,还用于显示风格选择界面,所述风格选择界面中包括多个语言风格选项,
所述处理器,还用于响应于用户对所述显示器显示的所述多个语言风格选项中任一语言风格选项的选择操作,将用户选择的语言风格选项对应的语言风格确定为所述第一语言风格。
30.一种控制设备,其特征在于,所述控制设备包括处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,执行如权利要求1-9中任一项所述的生成相册标题的方法。
31.一种计算机存储介质,其特征在于,包括计算机指令,当所述计算机指令在设备上运行时,使得所述设备执行如权利要求1-9中任一项所述的生成相册标题的方法。
CN201780083441.4A 2017-12-04 2017-12-04 一种生成相册标题的方法及设备 Active CN110178130B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/114499 WO2019109223A1 (zh) 2017-12-04 2017-12-04 一种生成相册标题的方法及设备

Publications (2)

Publication Number Publication Date
CN110178130A CN110178130A (zh) 2019-08-27
CN110178130B true CN110178130B (zh) 2021-08-13

Family

ID=66750672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780083441.4A Active CN110178130B (zh) 2017-12-04 2017-12-04 一种生成相册标题的方法及设备

Country Status (4)

Country Link
US (1) US20200265081A1 (zh)
EP (1) EP3703059A4 (zh)
CN (1) CN110178130B (zh)
WO (1) WO2019109223A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052375B (zh) * 2020-09-30 2024-06-11 北京百度网讯科技有限公司 舆情获取和词粘度模型训练方法及设备、服务器和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528450A (zh) * 2015-12-23 2016-04-27 北京奇虎科技有限公司 一种相册命名方法和装置
CN105956080A (zh) * 2016-04-29 2016-09-21 乐视控股(北京)有限公司 一种照片命名处理方法和装置
CN106339479A (zh) * 2016-08-30 2017-01-18 深圳市金立通信设备有限公司 一种图片命名方法及终端
CN106708813A (zh) * 2015-07-14 2017-05-24 阿里巴巴集团控股有限公司 一种标题处理方法及设备
CN106776821A (zh) * 2016-11-25 2017-05-31 维沃移动通信有限公司 一种相册生成方法及终端

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH083815B2 (ja) * 1985-10-25 1996-01-17 株式会社日立製作所 自然言語の共起関係辞書保守方法
US7394947B2 (en) * 2003-04-08 2008-07-01 The Penn State Research Foundation System and method for automatic linguistic indexing of images by a statistical modeling approach
JP2006293985A (ja) * 2005-03-15 2006-10-26 Fuji Photo Film Co Ltd アルバム作成装置、アルバム作成方法、及びプログラム
US8477994B1 (en) * 2009-02-26 2013-07-02 Google Inc. Creating a narrative description of media content and applications thereof
US8396287B2 (en) * 2009-05-15 2013-03-12 Google Inc. Landmarks from digital photo collections
US8886576B1 (en) * 2012-06-22 2014-11-11 Google Inc. Automatic label suggestions for albums based on machine learning
US20140022572A1 (en) * 2012-07-17 2014-01-23 Xerox Corporation Method and system for assigning filename to digital image
CN103631819B (zh) * 2012-08-27 2017-04-05 华为技术有限公司 一种图片命名的方法及系统
KR20140100727A (ko) * 2013-02-07 2014-08-18 엘지전자 주식회사 전자 기기 및 전자 기기의 제어 방법
US9286546B2 (en) * 2013-03-15 2016-03-15 Google Inc. Identifying labels for image collections
US8923551B1 (en) * 2014-07-16 2014-12-30 Interactive Memories, Inc. Systems and methods for automatically creating a photo-based project based on photo analysis and image metadata
US9811765B2 (en) * 2016-01-13 2017-11-07 Adobe Systems Incorporated Image captioning with weak supervision

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106708813A (zh) * 2015-07-14 2017-05-24 阿里巴巴集团控股有限公司 一种标题处理方法及设备
CN105528450A (zh) * 2015-12-23 2016-04-27 北京奇虎科技有限公司 一种相册命名方法和装置
CN105956080A (zh) * 2016-04-29 2016-09-21 乐视控股(北京)有限公司 一种照片命名处理方法和装置
CN106339479A (zh) * 2016-08-30 2017-01-18 深圳市金立通信设备有限公司 一种图片命名方法及终端
CN106776821A (zh) * 2016-11-25 2017-05-31 维沃移动通信有限公司 一种相册生成方法及终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于标注词语义与图像视觉的标签丰富算法;孙登第等;《小型微型计算机系统》;20170415(第04期);第886-890页 *
基于视觉内容语义相关度的图像标签自动排序方法;赵英海等;《中国科学技术大学学报》;20110215(第02期);第108-115页 *

Also Published As

Publication number Publication date
EP3703059A1 (en) 2020-09-02
EP3703059A4 (en) 2020-12-16
WO2019109223A1 (zh) 2019-06-13
CN110178130A (zh) 2019-08-27
US20200265081A1 (en) 2020-08-20

Similar Documents

Publication Publication Date Title
US11328008B2 (en) Query matching to media collections in a messaging system
US10353975B2 (en) Terminal, server and event suggesting methods thereof
CN109522538B (zh) 表格内容的自动分列方法、装置、设备及存储介质
KR101466027B1 (ko) 이동 단말기 및 그 통화내용 관리 방법
KR101753031B1 (ko) 이동 단말기 및 이것의 메타데이터 설정 방법
CN108886574B (zh) 一种拍摄引导方法、设备及系统
CN104123937A (zh) 提醒设置方法、装置和系统
CN102792664A (zh) 计算设备上的语音动作
CN104135716A (zh) 一种兴趣点信息的推送方法及系统
EP3493130A1 (en) Image processing method, image processing device, computer device, and computer readable storage medium
CN103646052A (zh) 一种图片信息的处理方法及装置
CN110989847B (zh) 信息推荐方法、装置、终端设备及存储介质
CN108628985B (zh) 一种相册的处理方法及移动终端
CN107690781A (zh) 用于推荐答复消息的方法和设备
CN109218982A (zh) 景点信息获取方法、装置、移动终端以及存储介质
CN111625737B (zh) 一种标签展示方法、装置、设备和存储介质
CN110555102A (zh) 媒体标题识别方法、装置及存储介质
CN111339737A (zh) 实体链接方法、装置、设备及存储介质
CN109917988B (zh) 选中内容显示方法、装置、终端及计算机可读存储介质
CN110837557A (zh) 摘要生成方法、装置、设备及介质
CN110929137B (zh) 文章推荐方法、装置、设备及存储介质
CN104572830A (zh) 推荐拍摄信息的处理方法及装置
CN110720104B (zh) 一种语音信息处理方法、装置及终端
CN111950255A (zh) 诗词生成方法、装置、设备及存储介质
CN108241678B (zh) 兴趣点数据的挖掘方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant