CN107133644B - 数字化图书馆内容分析系统及方法 - Google Patents

数字化图书馆内容分析系统及方法 Download PDF

Info

Publication number
CN107133644B
CN107133644B CN201710304569.0A CN201710304569A CN107133644B CN 107133644 B CN107133644 B CN 107133644B CN 201710304569 A CN201710304569 A CN 201710304569A CN 107133644 B CN107133644 B CN 107133644B
Authority
CN
China
Prior art keywords
words
picture
information
analysis
coalignment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710304569.0A
Other languages
English (en)
Other versions
CN107133644A (zh
Inventor
付佳
石丹
闫实
金松根
陈新红
孙常丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mudanjiang Medical University
Original Assignee
Mudanjiang Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mudanjiang Medical University filed Critical Mudanjiang Medical University
Priority to CN201710304569.0A priority Critical patent/CN107133644B/zh
Publication of CN107133644A publication Critical patent/CN107133644A/zh
Application granted granted Critical
Publication of CN107133644B publication Critical patent/CN107133644B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种数字化图书馆内容分析方法和系统。该系统包括:信号接收装置,判断装置,第一匹配装置,分类装置,第二匹配装置,实时分享交流装置。该方法包括:信号接收步骤,判断步骤,第一匹配步骤,分类步骤,第二匹配步骤,实时分享交流步骤。通过该系统和方法,能够方便用户多样化的输入,快速提取信息,以及基于不同的内容特点进行建模和分析,从而提高内容分析的速度和准确度。

Description

数字化图书馆内容分析系统及方法
技术领域
本发明涉及内容技术领域,特别涉及一种数字化图书馆内容分析系统及方法。
背景技术
数字化图书馆内容分析方法在现实生活中具有重要的意义。现有技术中面临着海量数据,用户查找分析相关内容往往比较粗糙,得到的结果不尽人意,简单的关键词查找往往漏掉很多重要内容,扩展相关的关键词查找又往往引入大量的噪声,大量浏览又会浪费用户的时间。因此,如何结合内容的特点进行分析和建模,提高内容分析的速度和准确度,是数字化图书馆内容分析面临的主要问题
发明内容
为了解决上述问题,本发明的目的在于提供一种数字化图书馆内容分析系统及方法,能够方便用户多样化的输入,快速提取信息,以及基于不同的内容特点进行二度建模和分析,从而提高内容分析的速度和准确度。
本发明采用的技术方案如下:
一种数字化图书馆内容分析系统,该系统包括:信号接收装置,判断装置,第一匹配装置,分类装置,第二匹配装置,实时分享交流装置;
所述第一匹配装置包括文本装置、语音装置;
所述第二匹配装置包括图片分析装置、字词分析装置、图片字词综合分析装置,其中所述字词分析装置包括中文分析装置和外文分析装置;
所述实时分享交流装置包括记录和评论装置。
优选地,所述信号接收装置,包括获取用户输入信号,所述输入信号包括通过触摸装置输入关键字词信息,或者通过语音输入音频信息;
优选地,所述判断装置,判断获取的输入信号是关键字词信息还是音频信息,并发送给第一匹配装置;
优选地,所述第一匹配装置,接收判断装置发送的结果信息,如果判断装置发送的是关键字词信息,则将关键字词信息发送到第一匹配装置中的文本装置,如果判断装置发送的是音频信息,则将音频信息发送到第一匹配装置中的语音装置,语音装置通过对音频信息进行识别转化为文本信息;根据文本装置中的关键字词信息或语音装置中转化而来的文本信息进行初步查找,得到第一结果,将第一结果发送给分类装置;
优选地,所述分类装置,对第一结果进行信息提取,将第一结果分为以下几类:图片、字词、图片字词综合;
优选地,所述第二匹配装置,分类装置将分类结果分别发送到第二匹配装置中的图片分析装置、字词分析装置、图片字词综合分析装置进行分析查找;
优选地,所述实时分享交流装置包括记录和评论装置,用户在该装置中作记录或评论,可实时上传到服务器,与其他用户共享。
优选地,所述图片分析装置,针对分类结果中的图片进行人工判断,找出最接近的图片作为目标图片,将目标图片通过以下算法和其他图片进行比较,得到一系列相似图片。
优选地,所述字词分析装置,包括分析字词的空间距离大小、存在性、关联度。
优选地,所述图片字词综合分析装置,将图片和字词分别在上述图片分析装置和字词分析装置中进行分析,将分析结果汇总到该装置。
优选地,语音装置通过对音频信息进行识别转化为文本信息。
一种数字化图书馆内容分析方法,该方法包括:信号接收步骤,判断步骤,第一匹配步骤,分类步骤,第二匹配步骤,实时分享交流步骤;
所述第一匹配步骤,包括文本处理、语音处理步骤;
所述第二匹配步骤,包括通过图片分析装置、字词分析装置、图片字词综合分析装置进行分析,其中所述字词分析装置包括中文分析装置和外文分析装置;
所述实时分享交流步骤,包括记录和评论步骤。
优选地,所述信号接收步骤,包括获取用户输入信号,所述输入信号包括通过触摸装置输入关键字词信息,或者通过语音输入音频信息;
优选地,所述判断步骤,通过判断装置判断获取的输入信号是关键字词信息还是音频信息,并发送给第一匹配装置;
优选地,所述第一匹配步骤,第一匹配装置接收判断装置发送的结果信息,如果判断装置发送的是关键字词信息,则将关键字词信息发送到第一匹配装置中的文本装置,如果判断装置发送的是音频信息,则将音频信息发送到第一匹配装置中的语音装置,语音装置通过对音频信息进行识别转化为文本信息;根据文本装置中的关键字词信息或语音装置中转化而来的文本信息进行初步查找,得到第一结果,将第一结果发送给分类装置;
优选地,所述分类步骤,将分类装置接收到的数据对第一结果进行信息提取,将第一结果分为以下几类:图片、字词、图片字词综合;
优选地,所述第二匹配步骤,分类装置将分类结果分别发送到第二匹配装置中的图片分析装置、字词分析装置、图片字词综合分析装置进行分析查找;
优选地,所述实时分享交流装置包括记录和评论装置,用户在该装置中作记录或评论,可实时上传到服务器,与其他用户共享。
优选地,所述图片分析装置,针对分类结果中的图片进行人工判断,找出最接近的图片作为目标图片,将目标图片通过以下算法和其他图片进行比较,得到一系列相似图片。
优选地,所述字词分析装置,包括分析字词的空间距离大小、存在性、关联度。
优选地,所述图片字词综合分析装置,将图片和字词分别在上述图片分析装置和字词分析装置中进行分析,将分析结果汇总到该装置。
优选地,语音装置通过对音频信息进行识别转化为文本信息。
附图说明
下面结合附图及实施方式对本发明作进一步详细的说明:
图1为数字化图书馆内容分析系统的示意图。
图2为数字化图书馆内容分析方法的流程图。
图3为数字化图书馆内容分析方法的实施例1。
图4为数字化图书馆内容分析方法的实施例2。
图5为数字化图书馆内容分析方法的实施例3。
图6为数字化图书馆内容分析方法的实施例4。
图7为数字化图书馆内容分析方法的实施例5。
图8为数字化图书馆内容分析方法的实施例6。
图9为数字化图书馆内容分析方法的实施例7。
图10为数字化图书馆内容分析方法的实施例8。
图11为数字化图书馆内容分析方法的实施例9。
图12为数字化图书馆内容分析方法的实施例10。
具体实施方式
本发明公开了一种数字化图书馆内容分析系统,该系统包括:信号接收装置,判断装置,第一匹配装置,分类装置,第二匹配装置,实时分享交流装置;
所述第一匹配装置包括文本装置、语音装置;
所述第二匹配装置包括图片分析装置、字词分析装置、图片字词综合分析装置,其中所述字词分析装置包括中文分析装置和外文分析装置;
所述实时分享交流装置包括记录和评论装置。
优选地,所述信号接收装置,包括获取用户输入信号,所述输入信号包括通过触摸装置输入关键字词信息,或者通过语音输入音频信息;
优选地,所述判断装置,判断获取的输入信号是关键字词信息还是音频信息,并发送给第一匹配装置;
优选地,所述第一匹配装置,接收判断装置发送的结果信息,如果判断装置发送的是关键字词信息,则将关键字词信息发送到第一匹配装置中的文本装置,如果判断装置发送的是音频信息,则将音频信息发送到第一匹配装置中的语音装置,语音装置通过对音频信息进行识别转化为文本信息;根据文本装置中的关键字词信息或语音装置中转化而来的文本信息进行初步查找,得到第一结果,将第一结果发送给分类装置;
优选地,所述分类装置,对第一结果进行信息提取,将第一结果分为以下几类:图片、字词、图片字词综合;
优选地,所述第二匹配装置,分类装置将分类结果分别发送到第二匹配装置中的图片分析装置、字词分析装置、图片字词综合分析装置进行分析查找;
优选地,所述实时分享交流装置包括记录和评论装置,用户在该装置中作记录或评论,可实时上传到服务器,与其他用户共享。
优选地,所述图片分析装置,针对分类结果中的图片进行人工判断,找出最接近的图片作为目标图片,将目标图片通过以下算法和其他图片进行比较,得到一系列相似图片。
优选地,所述字词分析装置,包括分析字词的空间距离大小、存在性、关联度。
优选地,所述图片字词综合分析装置,将图片和字词分别在上述图片分析装置和字词分析装置中进行分析,将分析结果汇总到该装置。
优选地,语音装置通过对音频信息进行识别转化为文本信息。
优选地,所述图片分析装置,针对分类结果中的图片进行判断,找出最接近的图片作为目标图片,将目标图片通过以下算法和其他图片进行比较,得到一系列相似图片,具体为将计算得到的d(xij,xst)与第一预设阈值相比较,如果在阈值范围内,则为相似图片:
xij和xst分别是相比较的两个像素集,al和bl分别是像素集xij和xst的第l个像素,l为索引,d(xij,xst)为像素集xij和xst中像素的相似性参量,d(al,b)为像素al和b相似性的参量,d(bl,a)为像素bl和a相似性的参量,ω2为最大像素数量。
优选地,所述字词分析装置,包括分析字词的空间距离大小、存在性、关联度,具体为将计算得到的d(xi,xj)和与第二预设阈值相比较,如果在阈值范围内,则为相似文本:
w=aA+bB+cC
其中,w为权重值,xi,xj分别为两个不同内容的向量,d(xi,xj)为内容相似度,xiq和xjq分别为向量的位置,q为索引,A代表单个字词的存在参量,B代表两个字词共同出现的频率,C代表字词的同义词的多少,a,b,c为系数,n为最大索引值。
本发明还公开了一种数字化图书馆内容分析方法,该方法包括:信号接收步骤,判断步骤,第一匹配步骤,分类步骤,第二匹配步骤,实时分享交流步骤;
所述第一匹配步骤,包括文本处理、语音处理步骤;
所述第二匹配步骤,包括通过图片分析装置、字词分析装置、图片字词综合分析装置进行分析,其中所述字词分析装置包括中文分析装置和外文分析装置;
所述实时分享交流步骤,包括记录和评论步骤。
优选地,所述信号接收步骤,包括获取用户输入信号,所述输入信号包括通过触摸装置输入关键字词信息,或者通过语音输入音频信息;
优选地,所述判断步骤,通过判断装置判断获取的输入信号是关键字词信息还是音频信息,并发送给第一匹配装置;
优选地,所述第一匹配步骤,第一匹配装置接收判断装置发送的结果信息,如果判断装置发送的是关键字词信息,则将关键字词信息发送到第一匹配装置中的文本装置,如果判断装置发送的是音频信息,则将音频信息发送到第一匹配装置中的语音装置,语音装置通过对音频信息进行识别转化为文本信息;根据文本装置中的关键字词信息或语音装置中转化而来的文本信息进行初步查找,得到第一结果,将第一结果发送给分类装置;
优选地,所述分类步骤,将分类装置接收到的数据对第一结果进行信息提取,将第一结果分为以下几类:图片、字词、图片字词综合;
优选地,所述第二匹配步骤,分类装置将分类结果分别发送到第二匹配装置中的图片分析装置、字词分析装置、图片字词综合分析装置进行分析查找;
优选地,所述实时分享交流装置包括记录和评论装置,用户在该装置中作记录或评论,可实时上传到服务器,与其他用户共享。
优选地,所述图片分析装置,针对分类结果中的图片进行人工判断,找出最接近的图片作为目标图片,将目标图片通过以下算法和其他图片进行比较,得到一系列相似图片。
优选地,所述字词分析装置,包括分析字词的空间距离大小、存在性、关联度。
优选地,所述图片字词综合分析装置,将图片和字词分别在上述图片分析装置和字词分析装置中进行分析,将分析结果汇总到该装置。
优选地,语音装置通过对音频信息进行识别转化为文本信息。
优选地,所述图片分析装置,针对分类结果中的图片进行判断,找出最接近的图片作为目标图片,将目标图片通过以下算法和其他图片进行比较,得到一系列相似图片,具体为将计算得到的d(xij,xst)与第一预设阈值相比较,如果在阈值范围内,则为相似图片:
xij和xst分别是相比较的两个像素集,al和bl分别是像素集xij和xst的第l个像素,l为索引,ω2为最大像素数量,d(xij,xst)为像素集xij和xst中像素的相似性参量,d(al,b)为像素al和b相似性的参量,d(bl,a)为像素bl和a相似性的参量。
优选地,所述字词分析装置,包括分析字词的空间距离大小、存在性、关联度,具体为将计算得到的d(xi,xj)和与第二预设阈值相比较,如果在阈值范围内,则为相似文本:
w=aA+bB+cC
其中,w为权重值,xi,xj分别为两个不同内容的向量,d(xi,xj)为内容相似度,xiq和xjq分别为向量的位置,q为索引,n为最大索引值,A代表单个字词的存在参量,B代表两个字词共同出现的频率,C代表字词的同义词的多少,a,b,c为系数。
通过本发明数字化图书馆内容分析的系统和方法,能够根据数据特点初步查找,对结果进行分类建模和精确匹配,以及即时和其他用户进行交流,从而提高了数字化图书馆内容分析的效率和精确度,提高了系统性能,节省了用户时间。
上述实施例阐明的内容应当理解为这些实施例仅用于更清楚地说明本发明,而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

Claims (10)

1.一种数字化图书馆内容分析系统,其特征在于,该系统包括:信号接收装置,判断装置,第一匹配装置,分类装置,第二匹配装置,实时分享交流装置;
所述第一匹配装置包括文本装置、语音装置;
所述第二匹配装置包括图片分析装置、字词分析装置、图片字词综合分析装置,其中所述字词分析装置包括中文分析装置和外文分析装置;
所述实时分享交流装置包括记录和评论装置;
所述信号接收装置,包括获取用户输入信号,所述输入信号包括通过触摸装置输入关键字词信息,或者通过语音输入音频信息;
所述判断装置,判断获取的输入信号是关键字词信息还是音频信息,并发送给第一匹配装置;
所述第一匹配装置,接收判断装置发送的结果信息,如果判断装置发送的是关键字词信息,则将关键字词信息发送到第一匹配装置中的文本装置,如果判断装置发送的是音频信息,则将音频信息发送到第一匹配装置中的语音装置,语音装置通过对音频信息进行识别转化为文本信息;根据文本装置中的关键字词信息或语音装置中转化而来的文本信息进行初步查找,得到第一结果,将第一结果发送给分类装置;
所述分类装置,对第一结果进行信息提取,将第一结果分为以下几类:图片、字词、图片字词综合;
所述第二匹配装置,分类装置将分类结果分别发送到第二匹配装置中的图片分析装置、字词分析装置、图片字词综合分析装置进行分析查找;
所述实时分享交流装置包括记录和评论装置,用户在该装置中作记录或评论,可实时上传到服务器,与其他用户共享。
2.如权利要求1所述的一种数字化图书馆内容分析系统,所述图片分析装置,针对分类结果中的图片进行判断,找出最接近的图片作为目标图片,将目标图片通过以下算法和其他图片进行比较,得到一系列相似图片,具体为将计算得到的d(xij,xst)与第一预设阈值相比较,如果在阈值范围内,则为相似图片,
d(xij,xst)为像素集xij和xst中像素的相似性参量,xij和xst分别是相比较的两个像素集,al和bl分别是像素集xij和xst的第l个像素,l为索引,d(al,b)为像素al和b相似性的参量,d(bl,a)为像素bl和a相似性的参量。
3.如权利要求2所述的一种数字化图书馆内容分析系统,所述字词分析装置,包括分析字词的空间距离大小、存在性、关联度,具体为将计算得到的d(xi,xj)和与第二预设阈值相比较,如果在阈值范围内,则为相似文本,
w=aA+bB+cC
其中,w为权重值,xi,xj分别为两个不同内容的向量,d(xi,xj)为内容相似度,xiq和xjq分别为向量的位置,q为索引,A代表单个字词的存在参量,B代表两个字词共同出现的频率,C代表字词的同义词的多少,a,b,c为系数。
4.如权利要求1至3中任一权利要求所述的一种数字化图书馆内容分析系统,所述图片字词综合分析装置,将图片和字词分别在上述图片分析装置和字词分析装置中进行分析,将分析结果汇总到该图片字词综合分析装置。
5.如权利要求4中任一权利要求所述的一种数字化图书馆内容分析系统,语音装置通过对音频信息进行识别转化为文本信息。
6.一种数字化图书馆内容分析方法,其特征在于,该方法包括:信号接收步骤,判断步骤,第一匹配步骤,分类步骤,第二匹配步骤,实时分享交流步骤;
所述第一匹配步骤,包括文本处理、语音处理步骤;
所述第二匹配步骤,包括通过图片分析装置、字词分析装置、图片字词综合分析装置进行分析,其中所述字词分析装置包括中文分析装置和外文分析装置;
所述实时分享交流步骤,包括记录和评论步骤;
所述信号接收步骤,包括获取用户输入信号,所述输入信号包括通过触摸装置输入关键字词信息,或者通过语音输入音频信息;
所述判断步骤,通过判断装置判断获取的输入信号是关键字词信息还是音频信息,并发送给第一匹配装置;
所述第一匹配步骤,第一匹配装置接收判断装置发送的结果信息,如果判断装置发送的是关键字词信息,则将关键字词信息发送到第一匹配装置中的文本装置,如果判断装置发送的是音频信息,则将音频信息发送到第一匹配装置中的语音装置,语音装置通过对音频信息进行识别转化为文本信息;根据文本装置中的关键字词信息或语音装置中转化而来的文本信息进行初步查找,得到第一结果,将第一结果发送给分类装置;
所述分类步骤,将分类装置接收到的数据对第一结果进行信息提取,将第一结果分为以下几类:图片、字词、图片字词综合;
所述第二匹配步骤,分类装置将分类结果分别发送到第二匹配装置中的图片分析装置、字词分析装置、图片字词综合分析装置进行分析查找;所述实时分享交流装置包括记录和评论装置,用户在该装置中作记录或评论,可实时上传到服务器,与其他用户共享。
7.如权利要求6所述的一种数字化图书馆内容分析方法,所述图片分析装置,针对分类结果中的图片进行判断,找出最接近的图片作为目标图片,将目标图片通过以下算法和其他图片进行比较,得到一系列相似图片,具体为将计算得到的d(xij,xst)与第一预设阈值相比较,如果在阈值范围内,则为相似图片,
xij和xst分别是相比较的两个像素集,al和bl分别是像素集xij和xst的第l个像素,l为索引,d(xij,xst)为像素集xij和xst中像素的相似性参量,d(al,b)为像素al和b相似性的参量,d(bl,a)为像素bl和a相似性的参量。
8.如权利要求7所述的一种数字化图书馆内容分析方法,所述字词分析装置,包括分析字词的空间距离大小、存在性、关联度,具体为将计算得到的d(xi,xj)和与第二预设阈值相比较,如果在阈值范围内,则为相似文本,
w=aA+bB+cC
其中,w为权重值,xi,xj分别为两个不同内容的向量,d(xi,xj)为内容相似度,xiq和xjq分别为向量的位置,q为索引,A代表单个字词的存在参量,B代表两个字词共同出现的频率,C代表字词的同义词的多少,a,b,c为系数。
9.如权利要求6至8中任一权利要求所述的一种数字化图书馆内容分析方法,所述图片字词综合分析装置,将图片和字词分别在上述图片分析装置和字词分析装置中进行分析,将分析结果汇总到该图片字词综合分析装置。
10.如权利要求9中任一权利要求所述的一种数字化图书馆内容分析方法,语音装置通过对音频信息进行识别转化为文本信息。
CN201710304569.0A 2017-05-03 2017-05-03 数字化图书馆内容分析系统及方法 Active CN107133644B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710304569.0A CN107133644B (zh) 2017-05-03 2017-05-03 数字化图书馆内容分析系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710304569.0A CN107133644B (zh) 2017-05-03 2017-05-03 数字化图书馆内容分析系统及方法

Publications (2)

Publication Number Publication Date
CN107133644A CN107133644A (zh) 2017-09-05
CN107133644B true CN107133644B (zh) 2019-04-23

Family

ID=59716234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710304569.0A Active CN107133644B (zh) 2017-05-03 2017-05-03 数字化图书馆内容分析系统及方法

Country Status (1)

Country Link
CN (1) CN107133644B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021939A (zh) * 2017-11-30 2018-05-11 安徽理工大学 一种旧图书的自动分类方法
CN110321966B (zh) * 2019-07-11 2022-02-15 同方知网数字出版技术股份有限公司 一种加快图书相似性分析速度的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320375A (zh) * 2008-07-04 2008-12-10 浙江大学 基于用户点击行为的数字图书搜索方法
CN102819601A (zh) * 2012-08-15 2012-12-12 中国联合网络通信集团有限公司 信息检索方法和信息检索设备
CN103716372A (zh) * 2013-11-22 2014-04-09 浙江大学 一种数字图书馆即服务的云计算平台构建方法
CN106384108A (zh) * 2016-08-31 2017-02-08 上海斐讯数据通信技术有限公司 文字内容检索方法及词语解读装置和移动终端

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150365725A1 (en) * 2014-06-11 2015-12-17 Rawllin International Inc. Extract partition segments of personalized video channel

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320375A (zh) * 2008-07-04 2008-12-10 浙江大学 基于用户点击行为的数字图书搜索方法
CN102819601A (zh) * 2012-08-15 2012-12-12 中国联合网络通信集团有限公司 信息检索方法和信息检索设备
CN103716372A (zh) * 2013-11-22 2014-04-09 浙江大学 一种数字图书馆即服务的云计算平台构建方法
CN106384108A (zh) * 2016-08-31 2017-02-08 上海斐讯数据通信技术有限公司 文字内容检索方法及词语解读装置和移动终端

Also Published As

Publication number Publication date
CN107133644A (zh) 2017-09-05

Similar Documents

Publication Publication Date Title
CN109284729B (zh) 基于视频获取人脸识别模型训练数据的方法、装置和介质
CN110019782B (zh) 用于输出文本类别的方法和装置
CN112347244B (zh) 基于混合特征分析的涉黄、涉赌网站检测方法
CN107193962B (zh) 一种互联网推广信息的智能配图方法及装置
CN111460153B (zh) 热点话题提取方法、装置、终端设备及存储介质
CN103608826B (zh) 利用网络信息挖掘的视频内产品注释
WO2019169872A1 (zh) 搜索内容资源的方法、装置和服务器
CN112559800B (zh) 用于处理视频的方法、装置、电子设备、介质和产品
WO2020155750A1 (zh) 基于人工智能的语料收集方法、装置、设备及存储介质
CN102855317B (zh) 一种基于演示视频的多模式索引方法及系统
CN111814770A (zh) 一种新闻视频的内容关键词提取方法、终端设备及介质
CN107590150A (zh) 基于关键帧的视频分析实现方法及装置
CN107229731B (zh) 用于分类数据的方法和装置
CN107862058B (zh) 用于生成信息的方法和装置
JP2018509664A (ja) モデル生成方法、単語重み付け方法、装置、デバイス及びコンピュータ記憶媒体
CN113239807B (zh) 训练票据识别模型和票据识别的方法和装置
CN112926621B (zh) 数据标注方法、装置、电子设备及存储介质
CN112464036B (zh) 一种违规数据的审核方法及装置
US20190258629A1 (en) Data mining method based on mixed-type data
CN110941978A (zh) 一种未识别身份人员的人脸聚类方法、装置及存储介质
CN113486664A (zh) 文本数据可视化分析方法、装置、设备及存储介质
CN110363206B (zh) 数据对象的聚类、数据处理及数据识别方法
CN113221918A (zh) 目标检测方法、目标检测模型的训练方法及装置
CN107133644B (zh) 数字化图书馆内容分析系统及方法
CN115062186A (zh) 一种视频内容检索方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant