CN112784085A - 利用共享图片生成文件的方法、服务器端及可读存储介质 - Google Patents

利用共享图片生成文件的方法、服务器端及可读存储介质 Download PDF

Info

Publication number
CN112784085A
CN112784085A CN202110070452.7A CN202110070452A CN112784085A CN 112784085 A CN112784085 A CN 112784085A CN 202110070452 A CN202110070452 A CN 202110070452A CN 112784085 A CN112784085 A CN 112784085A
Authority
CN
China
Prior art keywords
picture
target
pictures
file
shot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110070452.7A
Other languages
English (en)
Inventor
徐青松
李青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Ruisheng Software Co Ltd
Original Assignee
Hangzhou Ruisheng Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Ruisheng Software Co Ltd filed Critical Hangzhou Ruisheng Software Co Ltd
Priority to CN202110070452.7A priority Critical patent/CN112784085A/zh
Publication of CN112784085A publication Critical patent/CN112784085A/zh
Priority to PCT/CN2022/070348 priority patent/WO2022156538A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/176Support for shared access to files; File sharing support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供一种利用共享图片生成文件的方法、服务器端及可读存储介质,接收来自用户端的拍摄图片,并根据接收的所述拍摄图片的图片特征信息对所有所述拍摄图片进行分类,以将属于同一文件的所述拍摄图片存储在同一候选集中;对同一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片,形成目标图片集;以及,根据预设排序规则,对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果,合成目标文件。即,本发明基于多方用户所拍照上传的图片合成目标文件,如此,便可解决在利用拍照对文件进行记录时,拍摄的照片缺少连贯性,文件的内容展示不完整的问题。

Description

利用共享图片生成文件的方法、服务器端及可读存储介质
技术领域
本发明涉及人工智能技术领域,特别涉及一种利用共享图片生成文件的方法、服务器端及可读存储介质。
背景技术
目前在参加各种会议时,都会用到使用PPT的情况,参会者为了记录会议中的重要内容,往往会采取拍照的方式,将有用内容的PPT拍下来,然而很多参会者会由于距离较远、遮挡等而存在拍的照片模糊不清的情况。另外由于拍摄的照片缺少连贯性,很多内容展示的并不完整。
发明内容
本发明的目的在于提供一种利用共享图片生成文件的方法、服务器端及可读存储介质,以解决在利用拍照对文件进行记录时,拍摄的照片缺少连贯性,文件的内容展示不完整的问题。
为解决上述技术问题,本发明提供一种利用共享图片生成文件的方法,包括:
接收来自用户端的拍摄图片,并根据接收的所述拍摄图片的图片特征信息对所有所述拍摄图片进行分类,以将属于同一文件的所述拍摄图片存储在同一候选集中;
对同一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片形成目标图片集;以及,
根据预设排序规则,对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果合成目标文件。
可选的,在所述的利用共享图片生成文件的方法中,所述对同一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片,形成目标图片集的方法包括:
对同一所述候选集中的多个所述拍摄图片的图片内容进行识别,以选择出边缘完整度和清晰度满足条件的所述拍摄图片;
对边缘完整度和清晰度满足条件的多个所述拍摄图片的图片内容进行比对,以将图片内容不同的所述拍摄图片纳入所述候选集的不同子候选集中;以及,
利用预设选择规则,从每一所述子候选集中选择一所述拍摄图片作为目标图片纳入目标图片集中。
可选的,在所述的利用共享图片生成文件的方法中,所述对同一所述候选集中的多个所述拍摄图片的图片内容进行识别,以选择出边缘完整度和清晰度满足条件的所述拍摄图片的方法包括:
利用边缘识别模型,对各所述拍摄图片的边缘完整度进行识别,以选择出边缘完整度满足条件的所述拍摄图片;
利用模糊度识别模型,对边缘完整度满足条件的所述拍摄图片的清晰度进行识别,以选择出边缘完整度和清晰度满足条件的所述拍摄图片。
可选的,在所述的利用共享图片生成文件的方法中,所述对一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片,相应形成目标图片集的方法还包括:
对于同一图片内容的所有所述拍摄图片,若完整度和清晰度均不满足条件,则向所述用户端发送完整度和清晰度不满足条件的所述拍摄图片的请求信息,以获取图片内容相同的新的拍摄图片;
若被请求的所述拍摄图片在设定时间内未发生更新,则将清晰度与满足条件的清晰度之间的差值小于设定值的所有所述拍摄图片中,完整度最高的所述拍摄图片纳入所述目标图片集中。
可选的,在所述的利用共享图片生成文件的方法中,所述对边缘完整度和清晰度满足条件的多个所述拍摄图片的图片内容进行比对,以将图片内容不同的所述拍摄图片纳入所述候选集的不同子候选集中的方法包括:
利用字符识别模型,识别多个所述拍摄图片的图片内容的重复率,当重复率超过预设重复率阈值,则判定为图片内容相同,纳入同一子候选集中;
利用字符识别模型,识别多个所述拍摄图片的页码是否相同,若是,则判定为图片内容相同,纳入同一子候选集中;和/或,
利用图片特征提取模型,提取多个所述拍摄图片的图片特征值的相似度,当图片特征值的相似度达到预设相似度阈值,则判定为图片内容相同,纳入同一子候选集中。
可选的,在所述的利用共享图片生成文件的方法中,所述预设选择规则包括:
根据图片内容的完整度和/或清晰度对同一所述子候选集中的多个所述拍摄图片进行排名;以及,
将排名最高的所述拍摄图片作为所述目标图片。
可选的,在所述的利用共享图片生成文件的方法中,所述预设排序规则包括:根据图片之间拍摄时间、页码和/或标题的关联度进行排序。
可选的,在所述的利用共享图片生成文件的方法中,所述对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果,合成目标文件的方法包括:
实时对当前所述目标图片集中的所有所述目标图片进行排序,并合成目标文件;
在所述目标图片集更新后,利用所述目标图片集中新的所述目标图片对所述目标文件更新,以得到更新后的所述目标文件,直至在设定时间内所述目标图片集不再发生更新。
可选的,在所述的利用共享图片生成文件的方法中,所述对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果合成目标文件的方法还包括:
若所述目标图片集中出现至少完整度大于当前所述目标文件中相同图片内容的新的目标图片,则利用新的所述目标图片对当前所述目标图片进行替换,以对当前所述目标文件进行更新。
可选的,在所述的利用共享图片生成文件的方法中,所述对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果合成目标文件的方法包括:
在所述目标图片集中出现结束页,或在设定时间内所述目标图片集不再发生更新后,对所述目标图片集中的所有所述目标图片进行排序,并合成目标文件。
可选的,在所述的利用共享图片生成文件的方法中,根据字符识别模型识别各所述目标图片中是否存在结束标识字符,以判断所述目标图片是否为结束页。
可选的,在所述的利用共享图片生成文件的方法中,所述拍摄图片的图片特征信息包括:图片位置信息、用户输入信息和图片内容信息中的一种或多种。
可选的,在所述的利用共享图片生成文件的方法中,所述利用共享图片生成文件的方法还包括:
利用预设输出模板将合成的所述目标文件输出,和/或,对合成的所述目标文件进行修正。
可选的,在所述的利用共享图片生成文件的方法中,在对所有所述目标图片进行排序后,所述利用共享图片生成文件的方法还包括:
将排序结果显示给用户端,待用户端确认之后,再根据排序结果合成目标文件。
本发明还提供一种服务器端,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如上所述的利用共享图片生成文件的方法。
可选的,在所述的服务器端中,所述服务器端具有分享入口,所述分享入口用于将合成的文件分享至公共平台或其它终端。
本发明还提供一种可读存储介质,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的利用共享图片生成文件的方法。
综上所述,在本发明提供的利用共享图片生成文件的方法、服务器端及可读存储介质中,接收来自用户端的拍摄图片,并根据接收的所述拍摄图片的图片特征信息对所有所述拍摄图片进行分类,以将属于同一文件的所述拍摄图片存储在同一候选集中;对同一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片,形成目标图片集;以及,根据预设排序规则,对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果,合成目标文件。即,本发明基于多方用户所拍照上传的图片合成目标文件,如此,便可解决在利用拍照对文件进行记录时,拍摄的照片缺少连贯性,文件的内容展示不完整的问题。
附图说明
图1为本发明实施例提供的利用共享图片生成文件的方法的流程图;
图2为本发明实施例中形成目标图片集的流程图;
图3为本发明实施例中根据标题的顺序来进行排序的示例图。
具体实施方式
为使本发明的目的、优点和特征更加清楚,以下结合附图和具体实施例对本发明作详细说明。需说明的是,附图均采用非常简化的形式且未按比例绘制,仅用以方便、明晰地辅助说明本发明实施例的目的。此外,附图所展示的结构往往是实际结构的一部分。特别的,各附图需要展示的侧重点不同,有时会采用不同的比例。
为解决在利用拍照对文件进行记录时,拍摄的照片缺少连贯性,文件的内容展示不完整的问题,本发明实施例提供一种利用共享图片生成文件的方法、服务器端及可读存储介质。
图1为本发明实施例提供的利用共享图片生成文件的方法的流程图,如图1所示,本发明实施例提供一种利用共享图片生成文件的方法,包括如下步骤:
S11,接收来自用户端的拍摄图片,并根据接收的所述拍摄图片的图片特征信息对所有所述拍摄图片进行分类,以将属于同一文件的所述拍摄图片存储在同一候选集中;
S12,对同一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片形成目标图片集;
S13,根据预设排序规则,对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果合成目标文件。
本发明实施例的利用共享图片生成文件的方法可应用于本发明实施例的服务器端。其中,该服务器端为公共服务器端,例如可以是个人计算机、移动终端等,该移动终端可以是手机、平板电脑等具有各种操作系统的硬件设备。此外,需要说明的是,本文中的合成目标文件包括word文档、PDF文档、excel文档、ppt文档以及txt文档等。
在多个拍摄者将所拍摄文件的图片上传至服务器端后,服务器端即可对获取的所有照片依次进行分类、识别和/或比对、排序,最终合成目标文件,如此,便可解决在利用拍照对文件进行记录时,拍摄的照片缺少连贯性,文件的内容展示不完整的问题。
以下对本发明实施例提供的利用共享图片生成文件的方法作进一步详细描述。
步骤S11中,所述拍摄图片的图片特征信息包括图片位置信息、用户输入信息和图片内容信息中的一种或多种。具有相同位置信息的图片被初步认定为同一文件的图片,当然也有可能在相同位置具有不同的文件被拍摄上传,例如相同建筑的不同房间,这时需要结合其他图片特征信息来判断。其中,所述用户输入信息例如为用户上传图片时输入的会议地点、会议名称、会议内容等,不同用户输入信息相同,则认为他们是在拍摄相同的文件,需要放入同一候选集中。所述图片内容信息例如为文件的题目等,还可以可根据预先训练的识别模型对用户上传的图片特征进行识别,若不同用户拍摄的图片特征近似,则认为他们在拍摄相同的文件,同时同一用户在设定时间内拍摄上传的图片视为同一文件的图片(超过设定时候后可能其又去拍摄别的文件),将其放入同一候选集中,因此将全部不同用户拍摄的相同文件图片都放入同一候选集中。
步骤S12中,通过对同一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以对所述拍摄图片进行筛选,从而可使得所述目标图片集中的目标图片均为清晰、完整的目标图片。
具体的,如图2所示,所述对同一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片,形成目标图片集的方法可包括如下步骤:
S121,对同一所述候选集中的多个所述拍摄图片的图片内容进行识别,以选择出边缘完整度和清晰度满足条件的所述拍摄图片;
S122,对边缘完整度和清晰度满足条件的多个所述拍摄图片的图片内容进行比对,以将图片内容不同的所述拍摄图片纳入所述候选集的不同子候选集中;以及,
S123,利用预设选择规则,从每一所述子候选集中选择一所述拍摄图片作为目标图片纳入目标图片集中。
可选的,步骤S121中,对同一所述候选集中的多个所述拍摄图片的图片内容进行识别,以选择出边缘完整度和清晰度满足条件的所述拍摄图片的方法包括:
利用边缘识别模型,对各所述拍摄图片的边缘完整度进行识别,以选择出边缘完整度满足条件的所述拍摄图片;
利用模糊度识别模型,对边缘完整度满足条件的所述拍摄图片的清晰度进行识别,以选择出边缘完整度和清晰度满足条件的所述拍摄图片。
其中,可通过定义边缘完整度阈值及模糊度阈值,分别用以判断所述拍摄图片的边是否满足条件。具体的,利用边缘识别模型,对各所述拍摄图片的边缘完整度进行识别,若所述拍摄图片的边缘完整度大于所述边缘完整度阈值,则判断为边缘完整度满足条件,利用模糊度识别模型,对各所述拍摄图片的模糊值进行识别,若所述拍摄图片的模糊值小于所述模糊度阈值,则判断为清晰度满足条件。另外,较佳的,设置所述边缘完整度阈值为一相对较低值,以避免例如因为遮挡造成所有拍摄的图片均为不完整的图片而没被选取,最终导致获取的目标文件缺页。同样的,在进行模糊度阈值的设置时,也可设置一相对较高值,以避免例如因为拍摄场景问题(例如光线较暗)造成所有拍摄的图片均为不十分清楚的图片而没被选取,最终导致获取的目标文件缺页。本实施例中,在进行拍摄图片的筛选时,在图片完整度和图片清晰度之间,优先考虑图片完整度,以保证至少文件内容不缺失,同时提高筛选速率。在另外一些实施例中,也可利用边缘识别模型识别出所有边缘完整度满足条件的所述拍摄图片,同时,利用模糊度识别模型识别出所有清晰度满足条件的所述拍摄图片,而后,对于同一图片内容的所有所述拍摄图片,在其中选择出完整度和清晰度均满足条件的所述拍摄图片。
所述边缘识别模型可通过预先训练得到,在利用边缘识别模型识别图片中ppt区域的边缘时,若存在缺失部分,则可以根据已识别的边缘线条将缺失部分补全,而后可根据已识别面积和完整面积的比值来判断,或者已识别边缘线条的长度占据整体边缘线条的长度比值来判断边缘完整度。
所述模糊度识别模型例如可采用OpenCV和拉普拉斯算子来计算图片方差,亦即拉普拉斯方差算法(Variance of the Laplacian),将图片中的某一通道(一般采用灰度值)用拉普拉斯掩模做卷积运算,然后计算方差(即标准差的平方),图片方差越大,图片清晰度越高。如果图片方差小于预先定义的阈值,那么该图片就可以被认为清晰度不满足条件;如果图片方差高于预先定义的阈值,那么该图片就可以被认为清晰度满足条件。在实际操作时,也可采用清晰度阈值,即,将计算出来的图片方差转换为图片清晰度,当图片清晰度小于预先定义的清晰度阈值,那么该图片就被认为清晰度不满足条件,如果图片清晰度大于预先定义的清晰度阈值,那么该图片就被认为清晰度满足条件。其中,所述清晰度阈值在保证人眼能够识别图片内容的情况下,可根据实际情况人为调整。在另外一些实施例中,所述模糊度识别模型还可采用本领域技术人员所熟知的灰度方差算法、灰度差分平方和方差算法、Brenner函数等来判断拍摄图片的清晰度是否满足条件,在此不再赘述。
在另外一些实施例中,步骤S121之后,较佳的,所述对获取的多个所述拍摄图片的图片内容进行识别和/或比对,选择出目标图片形成目标图片集的方法还包括:
对于同一图片内容的所有所述拍摄图片,若完整度和清晰度均不满足条件,则向所述用户端发送完整度和清晰度不满足条件的所述拍摄图片的请求信息,以获取图片内容相同的新的拍摄图片;
若被请求的所述拍摄图片在设定时间内未发生更新,则将清晰度与满足条件的清晰度之间的差值小于设定值的所有所述拍摄图片中,完整度最高的所述拍摄图片纳入所述目标图片集中。
例如,设置完整度阈值为阈值A,图片清晰度阈值为阈值B,以及,设置最低清晰度条件:图片清晰度与阈值B之间的差值小于阈值C,若图片内容为D的所有所述拍摄图片的完整度小于阈值A,清晰度小于阈值B,则再次向客户端发送图片内容为D的图片的请求信息,若在设定时间内所述客户端未发送图片内容为D的图片,则将清晰度与阈值B的差值小于阈值C的所有所述拍摄图片中,完整度最高的所述拍摄图片纳入所述目标图片集中。
该实施例中,通过对不满足条件的图片的再次获取,可以避免出现之后生成的目标文件缺页。故而,步骤S121中,在进行边缘完整度阈值及模糊度阈值的设置时,相对于上一实施例,可设置相对较高值,以使得初步筛选出来的图片均为质量相对较高的图片。
实际操作时,边缘完整度阈值也可根据实际情况人为调整,例如,若文件边缘区域为空白区域,或者,边缘区域的文本不影响对文件的阅读等,则可将边缘完整度的完整度阈值降低,例如为80%,85%等。即,当所述拍摄图片的边缘完整度超过80%,85%等时,即可纳入所述候选集中。
由上面描述可知,在从客户端获取图片时,相同内容的图片可能会获取多张,因此,本实施例步骤S12中,除了通过步骤S121识别图片内容,使得所述目标图片集中的目标图片均为清晰、完整的目标图片外,还通过步骤S122对获取的多个所述拍摄图片的图片内容进行比对,以保证所述目标图片集中,所述目标图片的单一性。
具体的,步骤S121中,对边缘完整度和清晰度满足条件的多个所述拍摄图片的图片内容进行比对,以将图片内容不同的所述拍摄图片纳入所述候选集的不同子候选集中的方法包括:
利用字符识别模型,识别多个所述拍摄图片的图片内容的重复率,当重复率超过预设重复率阈值,则判定为图片内容相同,纳入同一子候选集中;
利用字符识别模型,识别多个所述拍摄图片的页码是否相同,若是,则判定为图片内容相同,纳入同一子候选集中;和/或,
利用图片特征提取模型,提取多个所述拍摄图片的图片特征值的相似度,当图片特征值的相似度达到预设相似度阈值,则判定为图片内容相同,纳入同一子候选集中。
应当理解,除了以上所列举的,其它可以用于判定图片相似度的方式,也应当在本申请的保护范围之内。
通过步骤S122,同一子候选集中可能会存在多张图片,因此,通过步骤S123对相同内容的图片进行筛选,以保证同一图片内容的多个所述拍摄图片,只有一张被选入所述目标图片集中。
步骤S123中,所述预设选择规则可包括:根据图片内容的完整度和/或清晰度对同一所述候子选集中的多个所述拍摄图片进行排名;以及,将排名最高的所述拍摄图片作为所述目标图片。实际操作时,可设置不同的选择模式,例如包括模式一、模式二和模式三,模式一表示用户更倾向于完整度最优,模式二表示用户更倾向于清晰度最优,模式三表示用户更倾向于完整度和清晰度综合效果最优。在步骤S11中,用户在输入目标文件请求信息时,同时可进行选择模式的选取,若用户选择模式一,则在本步骤,对同一拍摄图片中的多个所述拍摄图片进行排名时,按照图片内容的完整度进行排名,完整度越大,则排名越高,若用户选择模式二,则在本步骤,对同一拍摄图片中的多个所述拍摄图片进行排名时,按照图片内容的清晰度进行排名,清晰度越大,则排名越高。
步骤S13中,所述预设排序规则包括:根据图片之间拍摄时间、页码和/或标题的关联度进行排序。具体如下:
(1)所述预设排序规则可以是按照图片的拍摄时间顺序进行排序
具体流程包括:
利用时间获取模型获取用户图片的创建时间;
利用图片排列模型根据图片的创建时间,按照时间顺序对图片进行排列。
(2)所述预设排序规则还可以是按照图片中的页码进行排序
利用字符识别模型,识别共享图片集中的页码数,按照页码的升序进行排列。
(3)所述预设排序规则还可以是按照图片中内容的关联度进行排序
在具体的实施过程中,内容关联性,具体的是指与当前图片内容属于相邻的,且位于当前图片内容之后的下一内容。如大标题、小标题的顺序,或者用文字识别模型,识别图片中前后内容的衔接程度以及其它可以使目标图片保持前后连贯性的排序规则。
请参考图3,在根据标题的顺序来进行排序时,先确认一级标题,如图2中所示1、2、3,再确认每个一级标题下面的子标题,将子标题与一级标题一一对应,例如一级标题1的子标题为1.1、1.2、1.3…,二级标题2的子标题的子标题为2.1、2.2、2.3…,二级标题3的子标题的子标题为3.1、3.2、3.3…,而且进行排序形成如图2所示的目标文件。
在另外的实施例中,所述预设排序规则,还可为以上几种排序规则的结合。例如,为了提高识别的准确性,除了通过标题之外,还可利用文字识别模型对文本中前后页内容的连贯性(上下文内容的衔接程度)进行识别。
步骤S13中,可采用以下两种实施方式来对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果合成目标文件。
实施方式1:
实时对当前所述目标图片集中的所有所述目标图片进行排序,并合成目标文件,在所述目标图片集更新后,利用所述目标图片集中新的所述目标图片对所述目标文件更新,以得到更新后的所述目标文件,直至在设定时间内所述目标图片集不再发生更新。
通过该实施方式1,展示给用户的始终为最新的按顺序整理好的目标文件。另外,若所述目标图片集中出现至少完整度大于当前所述目标文件中相同图片内容的新的目标图片,则利用新的所述目标图片对当前所述目标图片进行替换,以对当前所述目标文件进行更新。即,当服务器端的图片更新后,若更新后的图片比当前文档中的完整度大于图片内容相同的当前所述目标图片且清晰度满足条件,则对图片进行更换,以对目标文件进行更新。
实施方式2:
在所述目标图片集中出现结束页,或在设定时间内所述目标图片集不再发生更新后,对所述目标图片集中的所有所述目标图片进行排序,并合成目标文件。
即,与目标文件相匹配的所有图片更新完成之后,在目标图片集中查找不重复且质量最好的图片按照预设排序进行排序,而后合成。
可根据字符识别模型识别各所述目标图片是否存在结束标识字符,以判断所述目标图片是否为结束页。所述结束标识字符例如为:谢谢、联系方式、感谢聆听等表示结束的字符。
除了上述步骤S11~S13,本实例中,所述利用共享图片生成文件的方法还可包括:利用预设输出模板将合成的所述目标文件输出,和/或,对合成的所述目标文件进行修正。
所述修正包括:图片的旋转、缩放、移动、翻转、阴影、背景、标注等的去除以及倾斜度的修正等等。较佳的,所述预设输出模板为可编辑模板,包括至少一个模板处理区域,每个模板处理区域可以填充文本、填充图片,添加批注等,从而可将获取到的字符信息、图片等按照位置填入相应的模板页面。在另外一些实施例中,所述预设输出模板也可为不可编辑模板,本申请对此不作限制。
步骤S13中,较佳的,在对所有所述目标图片进行排序后,先将排序结果显示给用户端,待用户端确认之后,再根据排序结果合成目标文件。
本实施例中,所述目标文件的输出形式可以是PDF文本,Word文本、Txt文本、PPT文本或者其它输出形式,且较佳的,与目标文件原本展示的形式相匹配,例如,若是对PPT文本进行拍照,则最终合成的目标文件以PPT形式输出,若是对word文本进行拍照,则最终合成的目标文件以word形式输出。
如前所述,本发明实施例的利用共享图片生成文件的方法可应用于本发明实施例的服务器端。具体的,本实施例提供的所述服务器端包括:处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如本实施例所述的利用共享图片生成文件的方法。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分。
所述存储器可用于存储所述计算机程序,所述处理器通过运行或执行存储在所述存储器内的计算机程序,以及调用存储在存储器内的数据,实现所述服务器端的各种功能。
所述存储器可以包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
除了处理器和存储器,所述服务器端还可包括用户接口、网络接口及通信总线。用户接口用于接收用户输入的信息,例如触摸屏、摄像装置等。网络接口用于服务器端与外部进行互相通信。网络接口主要包括有线接口和无线接口,例如RS232模块、射频模块、WIFI模块等等。通信总线用于服务器端中各组成部件之间的通信,通信总线可以是外设部件互连标准(Peripheral Component Interconnect,PCI)总线或扩展工业标准结构(ExtendedIndustry Standard Architecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
可选的,所述服务器端具有分享入口,所述分享入口用于将合成的所述目标文件分享至公共平台或其它终端。即,服务器端生成合成文本之后,用户可以将生成的合成文本通过分享入口分享至指定的分享平台中,供其他用户浏览。同时,该用户还可以将合成的文本通过分享入口分享至指定的终端。
本实施例还提供一种可读存储介质,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本实施例提供的利用共享图片生成文件的方法。
所述可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备,例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备以及上述的任意合适的组合。
综上所述,本发明提供的利用共享图片生成文件的方法、服务器端及可读存储介质,接收来自用户端的拍摄图片,并根据接收的所述拍摄图片的图片特征信息对所有所述拍摄图片进行分类,以将属于同一文件的所述拍摄图片存储在同一候选集中;对同一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片,形成目标图片集;以及,根据预设排序规则,对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果,合成目标文件。即,本发明基于多方用户所拍照上传的图片合成目标文件,如此,便可解决在利用拍照对文件进行记录时,拍摄的照片缺少连贯性,文件的内容展示不完整的问题。
此外还应该认识到,虽然本发明已以较佳实施例披露如上,然而上述实施例并非用以限定本发明。对于任何熟悉本领域的技术人员而言,在不脱离本发明技术方案范围情况下,都可利用上述揭示的技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围。

Claims (17)

1.一种利用共享图片生成文件的方法,其特征在于,包括:
接收来自用户端的拍摄图片,并根据接收的所述拍摄图片的图片特征信息对所有所述拍摄图片进行分类,以将属于同一文件的所述拍摄图片存储在同一候选集中;
对同一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片形成目标图片集;以及,
根据预设排序规则,对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果合成目标文件。
2.如权利要求1所述的利用共享图片生成文件的方法,其特征在于,所述对同一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片,形成目标图片集的方法包括:
对同一所述候选集中的多个所述拍摄图片的图片内容进行识别,以选择出边缘完整度和清晰度满足条件的所述拍摄图片;
对边缘完整度和清晰度满足条件的多个所述拍摄图片的图片内容进行比对,以将图片内容不同的所述拍摄图片纳入所述候选集的不同子候选集中;以及,
利用预设选择规则,从每一所述子候选集中选择一所述拍摄图片作为目标图片纳入目标图片集中。
3.如权利要求2所述的利用共享图片生成文件的方法,其特征在于,所述对同一所述候选集中的多个所述拍摄图片的图片内容进行识别,以选择出边缘完整度和清晰度满足条件的所述拍摄图片的方法包括:
利用边缘识别模型,对各所述拍摄图片的边缘完整度进行识别,以选择出边缘完整度满足条件的所述拍摄图片;
利用模糊度识别模型,对边缘完整度满足条件的所述拍摄图片的清晰度进行识别,以选择出边缘完整度和清晰度满足条件的所述拍摄图片。
4.如权利要求3所述的利用共享图片生成文件的方法,其特征在于,所述对一所述候选集中的多个所述拍摄图片的图片内容进行识别和/或比对,以从所述候选集中选出目标图片,相应形成目标图片集的方法还包括:
对于同一图片内容的所有所述拍摄图片,若完整度和清晰度均不满足条件,则向所述用户端发送完整度和清晰度不满足条件的所述拍摄图片的请求信息,以获取图片内容相同的新的拍摄图片;
若被请求的所述拍摄图片在设定时间内未发生更新,则将清晰度与满足条件的清晰度之间的差值小于设定值的所有所述拍摄图片中,完整度最高的所述拍摄图片纳入所述目标图片集中。
5.如权利要求2所述的利用共享图片生成文件的方法,其特征在于,所述对边缘完整度和清晰度满足条件的多个所述拍摄图片的图片内容进行比对,以将图片内容不同的所述拍摄图片纳入所述候选集的不同子候选集中的方法包括:
利用字符识别模型,识别多个所述拍摄图片的图片内容的重复率,当重复率超过预设重复率阈值,则判定为图片内容相同,纳入同一子候选集中;
利用字符识别模型,识别多个所述拍摄图片的页码是否相同,若是,则判定为图片内容相同,纳入同一子候选集中;和/或,
利用图片特征提取模型,提取多个所述拍摄图片的图片特征值的相似度,当图片特征值的相似度达到预设相似度阈值,则判定为图片内容相同,纳入同一子候选集中。
6.如权利要求2所述的利用共享图片生成文件的方法,其特征在于,所述预设选择规则包括:
根据图片内容的完整度和/或清晰度对同一所述子候选集中的多个所述拍摄图片进行排名;以及,
将排名最高的所述拍摄图片作为所述目标图片。
7.如权利要求1所述的利用共享图片生成文件的方法,其特征在于,所述预设排序规则包括:根据图片之间拍摄时间、页码和/或标题的关联度进行排序。
8.如权利要求1所述的利用共享图片生成文件的方法,其特征在于,所述对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果,合成目标文件的方法包括:
实时对当前所述目标图片集中的所有所述目标图片进行排序,并合成目标文件;
在所述目标图片集更新后,利用所述目标图片集中新的所述目标图片对所述目标文件更新,以得到更新后的所述目标文件,直至在设定时间内所述目标图片集不再发生更新。
9.如权利要求8所述的利用共享图片生成文件的方法,其特征在于,所述对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果合成目标文件的方法还包括:
若所述目标图片集中出现至少完整度大于当前所述目标文件中相同图片内容的新的目标图片,则利用新的所述目标图片对当前所述目标图片进行替换,以对当前所述目标文件进行更新。
10.如权利要求1所述的利用共享图片生成文件的方法,其特征在于,所述对所述目标图片集中的所有所述目标图片进行排序,并根据排序结果合成目标文件的方法包括:
在所述目标图片集中出现结束页,或在设定时间内所述目标图片集不再发生更新后,对所述目标图片集中的所有所述目标图片进行排序,并合成目标文件。
11.如权利要求10所述的利用共享图片生成文件的方法,其特征在于,根据字符识别模型识别各所述目标图片中是否存在结束标识字符,以判断所述目标图片是否为结束页。
12.如权利要求1所述的利用共享图片生成文件的方法,其特征在于,所述拍摄图片的图片特征信息包括:图片位置信息、用户输入信息和图片内容信息中的一种或多种。
13.如权利要求1所述的利用共享图片生成文件的方法,其特征在于,所述利用共享图片生成文件的方法还包括:
利用预设输出模板将合成的所述目标文件输出,和/或,对合成的所述目标文件进行修正。
14.如权利要求1所述的利用共享图片生成文件的方法,其特征在于,在对所有所述目标图片进行排序后,所述利用共享图片生成文件的方法还包括:
将排序结果显示给用户端,待用户端确认之后,再根据排序结果合成目标文件。
15.一种服务器端,其特征在于,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1至14任一项所述的利用共享图片生成文件的方法。
16.如权利要求15所述的服务器端,其特征在于,所述服务器端具有分享入口,所述分享入口用于将合成的文件分享至公共平台或其它终端。
17.一种可读存储介质,其特征在于,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1至14任一项所述的利用共享图片生成文件的方法。
CN202110070452.7A 2021-01-19 2021-01-19 利用共享图片生成文件的方法、服务器端及可读存储介质 Pending CN112784085A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110070452.7A CN112784085A (zh) 2021-01-19 2021-01-19 利用共享图片生成文件的方法、服务器端及可读存储介质
PCT/CN2022/070348 WO2022156538A1 (zh) 2021-01-19 2022-01-05 利用共享图片生成文件的方法、服务器端及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110070452.7A CN112784085A (zh) 2021-01-19 2021-01-19 利用共享图片生成文件的方法、服务器端及可读存储介质

Publications (1)

Publication Number Publication Date
CN112784085A true CN112784085A (zh) 2021-05-11

Family

ID=75757694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110070452.7A Pending CN112784085A (zh) 2021-01-19 2021-01-19 利用共享图片生成文件的方法、服务器端及可读存储介质

Country Status (2)

Country Link
CN (1) CN112784085A (zh)
WO (1) WO2022156538A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022156538A1 (zh) * 2021-01-19 2022-07-28 杭州睿胜软件有限公司 利用共享图片生成文件的方法、服务器端及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573070A (zh) * 2018-05-08 2018-09-25 深圳市万普拉斯科技有限公司 图片识别整理方法、装置和图片文件夹建立方法
CN109325219A (zh) * 2018-08-24 2019-02-12 维沃移动通信有限公司 一种生成记录文档的方法、装置及系统
CN109492206A (zh) * 2018-10-10 2019-03-19 深圳市容会科技有限公司 Ppt演示文档录制方法、装置、计算机设备和存储介质
WO2020112738A1 (en) * 2018-11-26 2020-06-04 Photo Butler Inc. Presentation file generation

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199933B (zh) * 2014-09-04 2017-07-07 华中科技大学 一种多模态信息融合的足球视频事件检测与语义标注方法
CN112784085A (zh) * 2021-01-19 2021-05-11 杭州睿胜软件有限公司 利用共享图片生成文件的方法、服务器端及可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573070A (zh) * 2018-05-08 2018-09-25 深圳市万普拉斯科技有限公司 图片识别整理方法、装置和图片文件夹建立方法
CN109325219A (zh) * 2018-08-24 2019-02-12 维沃移动通信有限公司 一种生成记录文档的方法、装置及系统
CN109492206A (zh) * 2018-10-10 2019-03-19 深圳市容会科技有限公司 Ppt演示文档录制方法、装置、计算机设备和存储介质
WO2020112738A1 (en) * 2018-11-26 2020-06-04 Photo Butler Inc. Presentation file generation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022156538A1 (zh) * 2021-01-19 2022-07-28 杭州睿胜软件有限公司 利用共享图片生成文件的方法、服务器端及可读存储介质

Also Published As

Publication number Publication date
WO2022156538A1 (zh) 2022-07-28

Similar Documents

Publication Publication Date Title
CN110348294B (zh) Pdf文档中图表的定位方法、装置及计算机设备
RU2651144C2 (ru) Ввод данных с изображений документов с фиксированной структурой
US20200175062A1 (en) Image retrieval method and apparatus, and electronic device
US20190108202A1 (en) Generating digital document content from a digital image
CN107977390B (zh) 绘本识别方法、装置、系统及电子设备
KR102048638B1 (ko) 콘텐츠 인식 방법 및 시스템
Kumar et al. A dataset for quality assessment of camera captured document images
CN107885430B (zh) 一种音频播放方法、装置、存储介质及电子设备
CN109766778A (zh) 基于ocr技术的发票信息录入方法、装置、设备及存储介质
US11715316B2 (en) Fast identification of text intensive pages from photographs
CN115630236A (zh) 无源遥感影像的全球快速检索定位方法、存储介质及设备
CN112784085A (zh) 利用共享图片生成文件的方法、服务器端及可读存储介质
CN110169055B (zh) 一种生成镜头信息的方法和装置
CN113628181A (zh) 图像处理方法、装置、电子设备及存储介质
US20140205194A1 (en) Information processing apparatus and computer-readable medium
CN111291619A (zh) 一种在线识别理赔单据中文字的方法、装置及客户端
CN112990206B (zh) 一种图案设计方法、终端及计算机可读存储介质
CN111260623B (zh) 图片评价方法、装置、设备及存储介质
CN110781345B (zh) 视频描述生成模型的获取方法、视频描述生成方法及装置
CN111738248B (zh) 字符识别方法、字符译码模型的训练方法及电子设备
CN111353063B (zh) 图片显示方法、装置及存储介质
CN111143626B (zh) 团伙识别方法、装置、设备及计算机可读存储介质
CN113705552A (zh) 一种文本数据处理方法、装置和相关设备
CN111737500A (zh) 电子页面的检索方法及装置、学习设备、可读存储介质
CN112036342A (zh) 单证抓拍方法、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination