CN112818677A - 一种基于互联网的信息评估方法及系统 - Google Patents

一种基于互联网的信息评估方法及系统 Download PDF

Info

Publication number
CN112818677A
CN112818677A CN202110197481.XA CN202110197481A CN112818677A CN 112818677 A CN112818677 A CN 112818677A CN 202110197481 A CN202110197481 A CN 202110197481A CN 112818677 A CN112818677 A CN 112818677A
Authority
CN
China
Prior art keywords
information
module
internet
evaluation
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110197481.XA
Other languages
English (en)
Inventor
吴杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kangmei Healthcare Cloud Service Co ltd
Original Assignee
Kangmei Healthcare Cloud Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kangmei Healthcare Cloud Service Co ltd filed Critical Kangmei Healthcare Cloud Service Co ltd
Priority to CN202110197481.XA priority Critical patent/CN112818677A/zh
Publication of CN112818677A publication Critical patent/CN112818677A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于互联网的信息评估方法及系统,包括信息捕捉模块、信息提取模块、信息重组模块、分析评估模块和存储模块,信息捕捉模块用于捕捉需要评估的互联网信息;信息提取模块用于提取互联网信息中的重点字符部分;信息重组模块用于对提取的重点字符进行重组,形成新的精简信息;分析评估模块用于对重组的精简信息进行分析和评估,确定信息价值,本发明适用于互联网的信息评估,通过信息价值评分系统可以对信息捕捉模块、信息提取模块和信息重组模块捕捉、提取和重组的互联网信息进行评分,这样只需要确定需要评估的互联网信息,本发明系统即可自动对其进行处理评估,评估的准确性高,误差小。

Description

一种基于互联网的信息评估方法及系统
技术领域
本发明属于互联网技术领域,具体是一种基于互联网的信息评估方法及系统。
背景技术
互联网又称因特网,即广域网、城域网、局域网及单机按照一定的通讯协议组成的国际计算机网络,互联网是指将两台计算机或者是两台以上的计算机终端、客户端、服务端通过计算机信息技术的手段互相联系起来的结果,人们可以与远在千里之外的朋友相互发送邮件、共同完成一项工作、共同娱乐。同时,互联网还是物联网的重要组成部分,根据中国物联网校企联盟的定义,物联网是当下几乎所有技术与计算机互联网技术的结合,让信息更快更准得收集、传递、处理并执行;
而现有的互联网的信息评估基本都是人工评估的,即通过人工的方式对互联网信息进行评估,评估的准确性不高,容易产生误差,且这样的评估工作量大,评估效率低。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种基于互联网的信息评估方法及系统。
为实现上述目的,本发明采用了如下技术方案:
一种基于互联网的信息评估方法及系统,包括信息捕捉模块、信息提取模块、信息重组模块、分析评估模块和存储模块,其中:
所述信息捕捉模块用于捕捉需要评估的互联网信息;
所述信息提取模块用于提取互联网信息中的重点字符部分;
所述信息重组模块用于对提取的重点字符进行重组,形成新的精简信息;
所述分析评估模块用于对重组的精简信息进行分析和评估,确定信息价值;
所述存储模块用于储存信息价值高于设定价值的信息。
优选的,所述信息捕捉模块中包括信息标记模块,所述信息标记模块用于对捕捉的原始信息进行标记,即使每个原始信息都具有自身的编码。
优选的,所述信息提取模块的具体提取方法如下:
将互联网信息转化为文本形式,即去除信息中除文字外的其他部分;
将文本形式的信息重组,形成一段完整的文字说明;
通过标点符号对文字说明进行分割,得到单句文本数据,清洗文本中的无用数据,确定最终解析的文本内容。
优选的,所述信息提取模块的信息提取方法还包括以下步骤:
对文本内容中的单条语句进行分词,得到多个词和每个词的词性,判断每个词的词性,最终保留名词n、动词v,将其他词性剔除,得到重点字符组。
优选的,所述信息重组模块的具体信息重组方法如下:
将信息提取模块提取得到的重点字符组按照v+n的格式重新组合排序,形成新的表达语句;
再将所有语句重新组合后的语句组合到一起,形成完整的精简信息。
优选的,所述分析评估模块的具体分析评估步骤如下:
所述分析评估模块内部储存有信息价值评分系统;
所述信息价值评分系统对信息重组模块重组得到的精简信息进行逐句分析评估,得到每句信息的评分;
将所有信息的评分进行综合,得到一个总评分,所述总评分即是评估的互联网的信息评估分。
优选的,所述存储模块储存评估分高于设定评估分的互联网信息。
本发明还公开了一种基于互联网的信息评估方法,具体步骤如下:
(S1)、所述信息捕捉模块捕捉需要评估的互联网信息,并对捕捉的原始信息进行标记;
(S2)、信息提取模块将互联网信息转化为文本形式,并将文本形式的信息重组,形成一段完整的文字说明,再通过标点符号对文字说明进行分割,得到单句文本数据,清洗文本中的无用数据,确定最终解析的文本内容;
(S3)、所述信息提取模块对文本内容中的单条语句进行分词,得到多个词和每个词的词性,判断每个词的词性,最终保留名词n、动词v,将其他词性剔除,得到重点字符组;
(S4)、所述信息重组模块将信息提取模块提取得到的重点字符组按照v+n的格式重新组合排序,形成新的表达语句,再将所有语句重新组合后的语句组合到一起,形成完整的精简信息;
(S5)、所述分析评估模块对信息重组模块重组得到的精简信息进行逐句分析评估,得到每句信息的评分,再将所有信息的评分进行综合,得到一个总评分,所述总评分即是评估的互联网的信息评估分;
(S6)、所述存储模块储存评估分高于设定评估分的互联网信息。
本发明中,通过在分析评估模块内部储存有信息价值评分系统,通过信息价值评分系统可以对信息捕捉模块、信息提取模块和信息重组模块捕捉、提取和重组的互联网信息进行评分,这样只需要确定需要评估的互联网信息,本发明系统即可自动对其进行处理评估,评估的准确性高,误差小;
本发明中,通过设置信息提取模块可以将非语言格式的数据转换成可以理解的语言格式,把错综复杂、规律难寻、表达方式多样化的文本,转化成通俗易懂的文本内容,这样极大地提升了信息评估的简易性,使互联网信息评估的智能化程度更高,评估速度更快效率更高。
附图说明
图1是本发明的整体流程框图。
具体实施方式
以下结合附图1,进一步说明本发明一种基于互联网的信息评估方法及系统的具体实施方式。本发明一种基于互联网的信息评估方法及系统不限于以下实施例的描述。
实施例1:
本实施例给出一种基于互联网的信息评估系统的具体结构,如图1所示,包括信息捕捉模块、信息提取模块、信息重组模块、分析评估模块和存储模块,其中:
信息捕捉模块用于捕捉需要评估的互联网信息;
信息提取模块用于提取互联网信息中的重点字符部分;
信息重组模块用于对提取的重点字符进行重组,形成新的精简信息;
分析评估模块用于对重组的精简信息进行分析和评估,确定信息价值;
存储模块用于储存信息价值高于设定价值的信息。
信息捕捉模块中包括信息标记模块,信息标记模块用于对捕捉的原始信息进行标记,即使每个原始信息都具有自身的编码,方便后期对每个互联网信息进行储存和调取。
信息提取模块的具体提取方法如下:
将互联网信息转化为文本形式,即去除信息中除文字外的其他部分;
将文本形式的信息重组,形成一段完整的文字说明;
通过标点符号对文字说明进行分割,得到单句文本数据,清洗文本中的无用数据,确定最终解析的文本内容。
信息提取模块的信息提取方法还包括以下步骤:
对文本内容中的单条语句进行分词,得到多个词和每个词的词性,判断每个词的词性,最终保留名词n、动词v,将其他词性剔除,得到重点字符组。
信息重组模块的具体信息重组方法如下:
将信息提取模块提取得到的重点字符组按照v+n的格式重新组合排序,形成新的表达语句;
再将所有语句重新组合后的语句组合到一起,形成完整的精简信息。
分析评估模块的具体分析评估步骤如下:
分析评估模块内部储存有信息价值评分系统;
信息价值评分系统对信息重组模块重组得到的精简信息进行逐句分析评估,得到每句信息的评分;
将所有信息的评分进行综合,得到一个总评分,总评分即是评估的互联网的信息评估分。
存储模块储存评估分高于设定评估分的互联网信息。
实施例2:
本实施例给出一种基于互联网的信息评估方法,如图1所示,具体步骤如下:
(S1)、信息捕捉模块捕捉需要评估的互联网信息,并对捕捉的原始信息进行标记;
(S2)、信息提取模块将互联网信息转化为文本形式,并将文本形式的信息重组,形成一段完整的文字说明,再通过标点符号对文字说明进行分割,得到单句文本数据,清洗文本中的无用数据,确定最终解析的文本内容;
(S3)、信息提取模块对文本内容中的单条语句进行分词,得到多个词和每个词的词性,判断每个词的词性,最终保留名词n、动词v,将其他词性剔除,得到重点字符组;
(S4)、信息重组模块将信息提取模块提取得到的重点字符组按照v+n的格式重新组合排序,形成新的表达语句,再将所有语句重新组合后的语句组合到一起,形成完整的精简信息;
(S5)、分析评估模块对信息重组模块重组得到的精简信息进行逐句分析评估,得到每句信息的评分,再将所有信息的评分进行综合,得到一个总评分,总评分即是评估的互联网的信息评估分;
(S6)、存储模块储存评估分高于设定评估分的互联网信息。
结合实施例1-实施例2可以看出:本发明通过在分析评估模块内部储存有信息价值评分系统,通过信息价值评分系统可以对信息捕捉模块、信息提取模块和信息重组模块捕捉、提取和重组的互联网信息进行评分,这样只需要确定需要评估的互联网信息,本发明系统即可自动对其进行处理评估,评估的准确性高,误差小;
本发明通过设置信息提取模块可以将非语言格式的数据转换成可以理解的语言格式,把错综复杂、规律难寻、表达方式多样化的文本,转化成通俗易懂的文本内容,这样极大地提升了信息评估的简易性,使互联网信息评估的智能化程度更高,评估速度更快效率更高。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (8)

1.一种基于互联网的信息评估系统,其特征在于,包括信息捕捉模块、信息提取模块、信息重组模块、分析评估模块和存储模块,其中:
所述信息捕捉模块用于捕捉需要评估的互联网信息;
所述信息提取模块用于提取互联网信息中的重点字符部分;
所述信息重组模块用于对提取的重点字符进行重组,形成新的精简信息;
所述分析评估模块用于对重组的精简信息进行分析和评估,确定信息价值;
所述存储模块用于储存信息价值高于设定价值的信息。
2.如权利要求1所述的一种基于互联网的信息评估系统,其特征在于:所述信息捕捉模块中包括信息标记模块,所述信息标记模块用于对捕捉的原始信息进行标记,即使每个原始信息都具有自身的编码。
3.如权利要求1所述的一种基于互联网的信息评估系统,其特征在于:所述信息提取模块的具体提取方法如下:
将互联网信息转化为文本形式,即去除信息中除文字外的其他部分;
将文本形式的信息重组,形成一段完整的文字说明;
通过标点符号对文字说明进行分割,得到单句文本数据,清洗文本中的无用数据,确定最终解析的文本内容。
4.如权利要求3所述的一种基于互联网的信息评估系统,其特征在于:所述信息提取模块的信息提取方法还包括以下步骤:
对文本内容中的单条语句进行分词,得到多个词和每个词的词性,判断每个词的词性,最终保留名词n、动词v,将其他词性剔除,得到重点字符组。
5.如权利要求4所述的一种基于互联网的信息评估系统,其特征在于:所述信息重组模块的具体信息重组方法如下:
将信息提取模块提取得到的重点字符组按照v+n的格式重新组合排序,形成新的表达语句;
再将所有语句重新组合后的语句组合到一起,形成完整的精简信息。
6.如权利要求5所述的一种基于互联网的信息评估系统,其特征在于:所述分析评估模块的具体分析评估步骤如下:
所述分析评估模块内部储存有信息价值评分系统;
所述信息价值评分系统对信息重组模块重组得到的精简信息进行逐句分析评估,得到每句信息的评分;
将所有信息的评分进行综合,得到一个总评分,所述总评分即是评估的互联网的信息评估分。
7.如权利要求1所述的一种基于互联网的信息评估系统,其特征在于:所述存储模块储存评估分高于设定评估分的互联网信息。
8.如权利要求1-7任一所述的一种基于互联网的信息评估方法,其特征在于:具体步骤如下:
(S1)、所述信息捕捉模块捕捉需要评估的互联网信息,并对捕捉的原始信息进行标记;
(S2)、信息提取模块将互联网信息转化为文本形式,并将文本形式的信息重组,形成一段完整的文字说明,再通过标点符号对文字说明进行分割,得到单句文本数据,清洗文本中的无用数据,确定最终解析的文本内容;
(S3)、所述信息提取模块对文本内容中的单条语句进行分词,得到多个词和每个词的词性,判断每个词的词性,最终保留名词n、动词v,将其他词性剔除,得到重点字符组;
(S4)、所述信息重组模块将信息提取模块提取得到的重点字符组按照v+n的格式重新组合排序,形成新的表达语句,再将所有语句重新组合后的语句组合到一起,形成完整的精简信息;
(S5)、所述分析评估模块对信息重组模块重组得到的精简信息进行逐句分析评估,得到每句信息的评分,再将所有信息的评分进行综合,得到一个总评分,所述总评分即是评估的互联网的信息评估分;
(S6)、所述存储模块储存评估分高于设定评估分的互联网信息。
CN202110197481.XA 2021-02-22 2021-02-22 一种基于互联网的信息评估方法及系统 Pending CN112818677A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110197481.XA CN112818677A (zh) 2021-02-22 2021-02-22 一种基于互联网的信息评估方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110197481.XA CN112818677A (zh) 2021-02-22 2021-02-22 一种基于互联网的信息评估方法及系统

Publications (1)

Publication Number Publication Date
CN112818677A true CN112818677A (zh) 2021-05-18

Family

ID=75864658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110197481.XA Pending CN112818677A (zh) 2021-02-22 2021-02-22 一种基于互联网的信息评估方法及系统

Country Status (1)

Country Link
CN (1) CN112818677A (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096680A (zh) * 2009-12-15 2011-06-15 北京大学 信息有效性分析的方法和装置
CN105955957A (zh) * 2016-05-05 2016-09-21 北京邮电大学 一种商家总体评论中方面评分的确定方法及装置
CN106611375A (zh) * 2015-10-22 2017-05-03 北京大学 一种基于文本分析的信用风险评估方法及装置
CN108363790A (zh) * 2018-02-12 2018-08-03 百度在线网络技术(北京)有限公司 用于对评论进行评估的方法、装置、设备和存储介质
CN108363700A (zh) * 2018-03-23 2018-08-03 北京奇虎科技有限公司 新闻标题的质量评估方法及装置
CN108491377A (zh) * 2018-03-06 2018-09-04 中国计量大学 一种基于多维度信息融合的电商产品综合评分方法
CN109145260A (zh) * 2018-08-24 2019-01-04 北京科技大学 一种文本信息自动提取方法
CN109214005A (zh) * 2018-09-14 2019-01-15 南威软件股份有限公司 一种基于中文分词的线索提取方法及系统
CN109408808A (zh) * 2018-09-12 2019-03-01 中国传媒大学 一种文艺作品的评估方法及评估系统
CN110347903A (zh) * 2019-07-17 2019-10-18 江苏东网信息科技有限公司 基于统计语言模型算法的智能信息评估和营销系统
CN110457676A (zh) * 2019-06-26 2019-11-15 平安科技(深圳)有限公司 评价信息的提取方法及装置、存储介质、计算机设备
CN110489542A (zh) * 2019-08-10 2019-11-22 刘莎 一种互联网网页和文本信息的自动摘要方法
CN110866389A (zh) * 2018-08-17 2020-03-06 北大方正集团有限公司 信息价值评估方法、装置、设备及计算机可读存储介质
CN110889274A (zh) * 2018-08-17 2020-03-17 北大方正集团有限公司 信息质量评估方法、装置、设备及计算机可读存储介质
CN111126065A (zh) * 2019-12-02 2020-05-08 南京医渡云医学技术有限公司 一种自然语言文本的信息提取方法及装置

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096680A (zh) * 2009-12-15 2011-06-15 北京大学 信息有效性分析的方法和装置
CN106611375A (zh) * 2015-10-22 2017-05-03 北京大学 一种基于文本分析的信用风险评估方法及装置
US20180032870A1 (en) * 2015-10-22 2018-02-01 Tencent Technology (Shenzhen) Company Limited Evaluation method and apparatus based on text analysis, and storage medium
CN105955957A (zh) * 2016-05-05 2016-09-21 北京邮电大学 一种商家总体评论中方面评分的确定方法及装置
CN108363790A (zh) * 2018-02-12 2018-08-03 百度在线网络技术(北京)有限公司 用于对评论进行评估的方法、装置、设备和存储介质
US20190287142A1 (en) * 2018-02-12 2019-09-19 Baidu Online Network Technology (Beijing) Co., Ltd. Method, apparatus for evaluating review, device and storage medium
CN108491377A (zh) * 2018-03-06 2018-09-04 中国计量大学 一种基于多维度信息融合的电商产品综合评分方法
CN108363700A (zh) * 2018-03-23 2018-08-03 北京奇虎科技有限公司 新闻标题的质量评估方法及装置
CN110866389A (zh) * 2018-08-17 2020-03-06 北大方正集团有限公司 信息价值评估方法、装置、设备及计算机可读存储介质
CN110889274A (zh) * 2018-08-17 2020-03-17 北大方正集团有限公司 信息质量评估方法、装置、设备及计算机可读存储介质
CN109145260A (zh) * 2018-08-24 2019-01-04 北京科技大学 一种文本信息自动提取方法
CN109408808A (zh) * 2018-09-12 2019-03-01 中国传媒大学 一种文艺作品的评估方法及评估系统
CN109214005A (zh) * 2018-09-14 2019-01-15 南威软件股份有限公司 一种基于中文分词的线索提取方法及系统
CN110457676A (zh) * 2019-06-26 2019-11-15 平安科技(深圳)有限公司 评价信息的提取方法及装置、存储介质、计算机设备
CN110347903A (zh) * 2019-07-17 2019-10-18 江苏东网信息科技有限公司 基于统计语言模型算法的智能信息评估和营销系统
CN110489542A (zh) * 2019-08-10 2019-11-22 刘莎 一种互联网网页和文本信息的自动摘要方法
US20210042467A1 (en) * 2019-08-10 2021-02-11 Chongqing Sizai Information Technology Co., Ltd. Method for automatically summarizing internet web page and text information
CN111126065A (zh) * 2019-12-02 2020-05-08 南京医渡云医学技术有限公司 一种自然语言文本的信息提取方法及装置

Similar Documents

Publication Publication Date Title
CN107092596B (zh) 基于attention CNNs和CCR的文本情感分析方法
CN105468468B (zh) 面向问答系统的数据纠错方法及装置
CN111966796B (zh) 问答对提取方法、装置、设备及可读存储介质
CN112951275B (zh) 语音质检方法、装置、电子设备及介质
CN111353306B (zh) 基于实体关系和依存Tree-LSTM的联合事件抽取的方法
CN109634994A (zh) 一种简历与职位的匹配推送方法及计算机设备和存储介质
CN103729474A (zh) 用于识别论坛用户马甲账号的方法和系统
CN104346480A (zh) 信息挖掘方法和装置
CN106372053B (zh) 句法分析的方法和装置
US20110145251A1 (en) System and method for constructing named entity dictionary
CN107066541A (zh) 客服问答数据的处理方法及系统
CN111737424A (zh) 一种问题的匹配方法、装置、设备及存储介质
CN104899335A (zh) 一种对网络舆情信息进行情感分类的方法
CN112699645B (zh) 语料标注方法、装置及设备
CN102956231A (zh) 基于半自动校正的语音关键信息记录装置及方法
CN110751234B (zh) Ocr识别纠错方法、装置及设备
CN113657088A (zh) 接口文档解析方法、装置、电子设备以及存储介质
CN118171658A (zh) 智能机器人的用户意图响应方法、装置、设备及存储介质
CN1167026C (zh) 汉语个人简历信息处理系统和方法
CN116501873A (zh) 一种基于ChatGpt及其他深度模型建立文本分析框架的方法
CN114971530A (zh) 基于自然语言处理的协同运维方法及装置
CN110796565A (zh) 监理日志的分析方法及分析系统
CN114970502A (zh) 一种应用于数字政府的文本纠错方法
CN112487817A (zh) 命名实体识别模型训练方法、样本标注方法、装置及设备
CN112818677A (zh) 一种基于互联网的信息评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination