CN107248125A - 一种确定疑似孤僻性格学生的方法及装置 - Google Patents

一种确定疑似孤僻性格学生的方法及装置 Download PDF

Info

Publication number
CN107248125A
CN107248125A CN201710369019.7A CN201710369019A CN107248125A CN 107248125 A CN107248125 A CN 107248125A CN 201710369019 A CN201710369019 A CN 201710369019A CN 107248125 A CN107248125 A CN 107248125A
Authority
CN
China
Prior art keywords
student
user
analyzed
campus
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710369019.7A
Other languages
English (en)
Inventor
孙含元
李中华
陈莉莉
廖志群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Rosefinch Technology Co Ltd
Original Assignee
Wuhan Rosefinch Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Rosefinch Technology Co Ltd filed Critical Wuhan Rosefinch Technology Co Ltd
Priority to CN201710369019.7A priority Critical patent/CN107248125A/zh
Publication of CN107248125A publication Critical patent/CN107248125A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种确定疑似孤僻性格学生方法及装置,涉及数据分析技术领域,可以实现及时分析得到疑似孤僻性格的学生用户。所述方法包括:获取预定时间段内的待分析学生数据;从所述待分析学生数据中提取学生的校园活动信息;根据所述校园活动信息,对所述待分析学生数据进行分析;依据分析结果确定得到待确定孤僻性格的学生用户。本发明适用于识别疑似孤僻性格的学生。

Description

一种确定疑似孤僻性格学生的方法及装置
技术领域
本发明涉及一种数据分析技术领域,特别是涉及一种确定疑似孤僻性 格学生的方法及装置。
背景技术
随着教育改革的深入,在信息化日益深化的今天,智慧校园和平安校 园建设将高校信息化推进到新的发展阶段,各种类型的数据不断沉淀下来, 高校在面对新形势的挑战下,必须在教学管理手段和方法上不断创新。
目前孤僻与心理异常人群是学校校园中普遍存在的一类人群,这 类人群不善于沟通,孤僻性格人群由于难识别,是学校学生管理工作 的一大难点。
发明内容
有鉴于此,本发明提供了一种确定疑似孤僻性格学生的方法及装置, 主要目的在于可以实现及时分析得到疑似孤僻性格的学生用户,以便让学 工部门或辅导员尽早采取措施进行心理疏导。
依据本发明一个方面,提供了一种确定疑似孤僻性格学生的方法,该 方法包括:
获取预定时间段内的待分析学生数据;
从所述待分析学生数据中提取学生的校园活动信息;
根据所述校园活动信息,对所述待分析学生数据进行分析;
依据分析结果确定得到待确定孤僻性格的学生用户。
优选地,所述校园活动信息包括学生的消费记录信息、和/或门禁记录 信息、和/或上网活动信息,所述根据校园活动信息,对所述待分析学生数 据进行分析,具体包括:
根据所述学生的消费记录信息,检测是否存在校园消费异常的学生用 户;和/或
根据所述门禁记录信息,检测是否存在校园出入异常的学生用户;和/ 或
根据所述上网活动信息,检测是否存在上网活动异常的学生用户;
根据检测结果确定对所述待分析学生数据进行分析的分析结果。
优选地,所述根据所述学生的消费记录信息,检测是否存在校园消费 异常的学生用户,具体包括:
检测是否存在预定时间段内与其他学生用户消费记录相似度小于或等 于预设阈值的学生用户;
将预定时间段内与其他学生用户消费记录相似度小于或等于预设阈值 的学生用户,确定为存在校园消费异常的学生用户。
优选地,所述根据所述门禁记录信息,检测是否存在校园出入异常的 学生用户,具体包括:
检测是否存在预定时间段内与其他学生用户宿舍门禁记录和/或图书馆 门禁记录相似度小于或等于预设阈值的学生用户;和/或
检测是否存在预定时间段内具有深夜校园外出行为的天数大于或等于 预定天数阈值的学生用户;
将预定时间段内与其他学生用户宿舍门禁记录和/或图书馆门禁记录相 似度小于或等于预设阈值的、和/或预定时间段内具有深夜校园外出行为的 天数大于或等于预定天数阈值的学生用户,确定为存在校园出入异常的学 生用户。
优选地,所述根据所述上网活动信息,检测是否存在上网活动异常的 学生用户,具体包括:
检测是否存在预定时间段内与其他学生用户上网记录相似度小于或等 于预设阈值的学生用户;和/或
检测预定时间段内学生平均上网搜索文本内容和/或平均社交网络发帖 文本内容中是否包含预定文本内容;和/或
检测是否存在预定时间段内具有深夜上网行为的天数大于或等于预设 天数阈值的学生用户;
将预定时间段内与其他学生用户上网记录相似度小于或等于预设阈值 的、和/或预定时间段内平均上网搜索内容和/或平均社交网络发帖内容中包 含预定文本内容的、和/或预定时间段内具有深夜上网行为的天数大于或等 于预设天数阈值的学生用户,确定存在上网活动异常的学生用户。
优选地,所述检测预定时间段内学生平均上网搜索文本内容和/或平均 社交网络发帖文本内容中是否包含预定文本内容,具体包括:
采集预定时间段内学生平均上网搜索文本内容和/或平均社交网络发帖 文本内容;
通过机械压缩去词、中文分词、停用词过滤的方式,对所述平均上网 搜索文本内容和/或平均社交网络发帖文本内容进行预处理;
通过预定情感倾向分析模型、预定语义网络分析模型、预定狄利克雷 分配LDA主题分析模型,对预处理后的文本内容进行分析,得到学生平均 上网搜索文本内容和/或平均社交网络发帖文本内容中是否包含预定文本内 容的分析结果。
依据本发明另一个方面,提供了一种确定疑似孤僻性格学生的装置, 该装置包括:
获取单元,用于获取预定时间段内的待分析学生数据;
提取单元,用于从所述获取单元获取的待分析学生数据中提取学生的 校园活动信息;
分析单元,用于根据所述提取单元提取的校园活动信息,对所述待分 析学生数据进行分析;
确定单元,用于依据所述分析单元的分析结果确定得到待确定孤僻性 格的学生用户。
优选地,所述校园活动信息包括学生的消费记录信息、和/或门禁记录 信息、和/或上网活动信息,所述分析单元具体包括:
检测模块,用于根据所述学生的消费记录信息,检测是否存在校园消 费异常的学生用户;和/或
根据所述门禁记录信息,检测是否存在校园出入异常的学生用户;和/ 或
根据所述上网活动信息,检测是否存在上网活动异常的学生用户;
确定模块,用于根据所述检测模块的检测结果确定对所述待分析学生 数据进行分析的分析结果。
优选地,所述检测模块,具体用于检测是否存在预定时间段内与其他 学生用户消费记录相似度小于或等于预设阈值的学生用户;
将预定时间段内与其他学生用户消费记录相似度小于或等于预设阈值 的学生用户,确定为存在校园消费异常的学生用户。
优选地,所述检测模块,具体用于检测是否存在预定时间段内与其他 学生用户宿舍门禁记录和/或图书馆门禁记录相似度小于或等于预设阈值的 学生用户;和/或
检测是否存在预定时间段内具有深夜校园外出行为的天数大于或等于 预定天数阈值的学生用户;
将预定时间段内与其他学生用户宿舍门禁记录和/或图书馆门禁记录相 似度小于或等于预设阈值的、和/或预定时间段内具有深夜校园外出行为的 天数大于或等于预定天数阈值的学生用户,确定为存在校园出入异常的学 生用户。
优选地,所述检测模块,具体用于检测是否存在预定时间段内与其他 学生用户上网记录相似度小于或等于预设阈值的学生用户;和/或
检测预定时间段内学生平均上网搜索文本内容和/或平均社交网络发帖 文本内容中是否包含预定文本内容;和/或
检测是否存在预定时间段内具有深夜上网行为的天数大于或等于预设 天数阈值的学生用户;
将预定时间段内与其他学生用户上网记录相似度小于或等于预设阈值 的、和/或预定时间段内平均上网搜索内容和/或平均社交网络发帖内容中包 含预定文本内容的、和/或预定时间段内具有深夜上网行为的天数大于或等 于预设天数阈值的学生用户,确定存在上网活动异常的学生用户。
优选地,所述检测模块,具体还用于采集预定时间段内学生平均上网 搜索文本内容和/或平均社交网络发帖文本内容;
通过机械压缩去词、中文分词、停用词过滤的方式,对所述平均上网 搜索文本内容和/或平均社交网络发帖文本内容进行预处理;
通过预定情感倾向分析模型、预定语义网络分析模型、预定狄利克雷 分配LDA主题分析模型,对预处理后的文本内容进行分析,得到学生平均 上网搜索文本内容和/或平均社交网络发帖文本内容中是否包含预定文本内 容的分析结果。
依据本发明又一个方面,提供了一种计算机可读存储介质,其上存储 有计算机程序,该程序被处理器执行时实现以下步骤:
获取预定时间段内的待分析学生数据;
从所述待分析学生数据中提取学生的校园活动信息;
根据所述校园活动信息,对所述待分析学生数据进行分析;
依据分析结果确定得到待确定孤僻性格的学生用户。
依据本发明再一个方面,提供了一种确定疑似孤僻性格学生的实体装 置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机 程序,所述处理器执行所述程序时实现以下步骤:
获取预定时间段内的待分析学生数据;
从所述待分析学生数据中提取学生的校园活动信息;
根据所述校园活动信息,对所述待分析学生数据进行分析;
依据分析结果确定得到待确定孤僻性格的学生用户。
借由上述技术方案,本发明提供的一种确定疑似孤僻性格学生的方法 及装置,首先获取预定时间段内的待分析学生数据,然后根据从待分析学 生数据中提取的学生校园活动信息,对待分析学生数据进行分析,可以实 现分析得到疑似孤僻性格的学生用户,及时进行相应预警,便于学工部门 或辅导员对疑似孤僻性格的学生及时进行心理疏导,避免发生校园悲剧。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的 技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和 其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于 本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目 的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符 号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种确定疑似孤僻性格学生的方法流 程示意图;
图2示出了本发明实施例提供的一种确定疑似孤僻性格学生的装置的 结构示意图;
图3示出了本发明实施例提供的另一种确定疑似孤僻性格学生的装置 的结构示意图;
图4示出了本发明实施例提供的一种确定疑似孤僻性格学生的实体装 置结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显 示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开 而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更 透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术 人员。
本发明实施例提供了一种确定疑似孤僻性格学生的方法,可以实现分 析得到疑似孤僻性格的学生用户,如图1所示,该方法包括:
101、获取预定时间段内的待分析学生数据。
在本发明实施例中,可以通过高校的各种信息管理系统收集各类校园 学生数据,作为待分析学生数据,其中,学生数据可以包括在校学生的相 关信息、学生就餐情况、学生消费情况、学生在各个场所(教学楼、宿舍 楼、图书馆、游泳馆等地点)的出入情况、图书资源使用情况、网上有关 学校的评论信息等。
预定时间段可以根据实际需要预先进行相应设定,例如,如果用户需 要分析2013年第二学期的校园数据,预定时间段可以为2013年第二学期 开学时间至该学期结束时间的这段时间。
对于本发明实施例的执行主体可以为用于疑似孤僻性格学生识别的装 置,用户可以根据实际需要,输入相关的分析指令来触发该装置进行相应 工作,该指令中可以包含特定学生人群目标信息及相关的预定时间段信息, 该装置在接收到该分析指令后,执行步骤101至步骤104所述的过程,进 而分析得到存在的疑似孤僻性格学生,例如,用户可以根据实际需要,分 析A学校的B学院学生中是否存在疑似孤僻性格的学生;对于本发明实施例,用户还可以预先设置该装置自动进行数据分析的规则,即按照预定时 间间隔获取预定时间段内的待分析学生数据进行疑似孤僻性格学生的识 别,在识别出疑似孤僻性格学生后,主动推动给学工部门或辅导员。
102、从待分析学生数据中提取学生的校园活动信息。
其中,校园活动信息可以包括学生的消费记录信息、和/或门禁记录信 息、和/或上网活动信息等。
消费记录信息中可以包含学生在校内超市、食堂、教学楼等地点的消 费情况,具体可以基于校园一卡通的消费情况进行判定;门禁记录信息可 以包含学生在宿舍楼、教学楼、学校大门、图书馆、游泳馆等地的出入情 况;上网活动信息可以包含学生在校内上网的情况,包括寝室、教学楼、 图书馆、实验楼等地点的上网情况,具体可以包含学生上网搜索的内容、 浏览的网页内容、校内或校外社交网站发帖内容等。
在本发明实施例中,从待分析学生数据中提取哪些信息具体可以根据 实际情况进行设定,需要说明的是,提取的信息越全面,最后分析得到的 结果更加准确,为此还可以从待分析学生数据中提取学生成绩信息、行为 轨迹信息、考勤记录信息等,以便更加综合的分析得到确定疑似孤僻性格 的学生用户。
103、根据提取的校园活动信息,对待分析学生数据进行分析。
例如,为了识别出A学院中是否存在疑似孤僻性格的学生,参考孤僻 性格学生具备的普遍特征,可以结合A学院中每个学生的消费记录信息、 门禁记录信息、上网活动信息等多维度进行综合分析,具体可以检测最近 一年的时间内A学院的学生中是否存在与其他学生的一卡通消费记录没有 经常性(比如大于或等于3次)交集的学生,而且该学生在最近这一年的 时间内也与其他学生的宿舍门禁记录、图书馆上网记录没有经常性(比如 大于或等于3次)的交集,该学生还经常性深夜校园外出、经常性深夜上 网等,统计得到符合这些条件的学生用户,作为相应的分析结果。
104、依据分析结果确定得到待确定孤僻性格的学生用户。
在本发明实施例中,依据分析结果可以找到符合相应条件的学生用户, 将这些学生用户确定为待确定孤僻性格的学生用户,即疑似孤僻性格的学 生用户,并可以结合学生用户的姓名、性别、年龄、所在学院、所在班级、 所在宿舍、家庭联系方式等相关信息,一并展示给学工部门或辅导员。
需要说明的是,对于本发明实施例提供的确定疑似孤僻性格学生的方 法,除了可以应用在识别疑似孤僻性格学生的场景以外,还可以应用在其 他场景,例如,识别疑似孤僻性格的公司员工等场景,都可以应用本发明 实施例提供的方法,识别得到疑似孤僻性格的目标人群,以便进行相应的 管理,在此本发明实施例不做限定。
本发明实施例提供的一种确定疑似孤僻性格学生的方法,首先获取预 定时间段内的待分析学生数据,然后根据从待分析学生数据中提取的学生 校园活动信息,对待分析学生数据进行分析,可以实现分析得到疑似孤僻 性格的学生用户,及时进行相应预警,便于学工部门或辅导员对疑似孤僻 性格的学生及时进行心理疏导,避免发生校园悲剧。
进一步的,作为对上述实施例的细化和扩展,上述步骤103具体可以 包括:根据学生的消费记录信息,检测是否存在校园消费异常的学生用户; 和/或根据学生的门禁记录信息,检测是否存在校园出入异常的学生用户; 和/或根据学生的上网活动信息,检测是否存在上网活动异常的学生用户; 根据检测结果确定对待分析学生数据进行分析的分析结果。
对于本发明实施例,当结合上述消费记录信息、门禁记录信息、上网 活动信息综合进行分析时,得到的分析结果更加准确,但具体还需要依照 能够采集到的信息情况而定,在本发明实施例中,可以将存在校园消费异 常、和/或校园出入异常、和/或上网活动异常的学生用户,确定为待确定孤 僻性格的学生用户,以便让学工部门或辅导员及时识别出疑似孤僻性格的 学生,进而尽早采取措施对疑似孤僻性格的学生进行心理疏导。
其中,上述根据学生的消费记录信息,检测是否存在校园消费异常的 学生用户的过程可以根据实际需要配置相应的检测规则及设定相应的确定 消费异常的标准进行实施,在本发明的一个可选实施例中,该步骤具体可 以包括:检测是否存在预定时间段内与其他学生用户消费记录相似度小于 或等于预设阈值的学生用户;将预定时间段内与其他学生用户消费记录相 似度小于或等于预设阈值的学生用户,确定为存在校园消费异常的学生用 户。
例如,基于学生A的校园一卡通消费记录,在最近一年的时间段内, 学生A消费记录与其他学生消费记录之间的相似度小于一定阈值,即没有 其他学生与学生A的消费记录有经常性(比如大于或等于一定次数阈值) 的交集,如学生A在最近一年的时间里经常独自一人在超市内人员稀少的 时间段去购物等,说明学生A符合性格孤僻人群的一些特征,可以将学生 A确定为存在校园消费异常的学生用户。
上述根据学生的门禁记录信息,检测是否存在校园出入异常的学生用 户的过程可以根据实际需要配置相应的检测规则及设定相应的确定校园出 入异常的标准进行实施,在本发明的一个可选实施例中,该步骤具体可以 包括:检测是否存在预定时间段内与其他学生用户宿舍门禁记录和/或图书 馆门禁记录相似度小于或等于预设阈值的学生用户;和/或检测是否存在预 定时间段内具有深夜校园外出行为的天数大于或等于预定天数阈值的学生 用户;将预定时间段内与其他学生用户宿舍门禁记录和/或图书馆门禁记录相似度小于或等于预设阈值的、和/或预定时间段内具有深夜校园外出行为 的天数大于或等于预定天数阈值的学生用户,确定为存在校园出入异常的 学生用户。
预定天数阈值可以根据实际情况预先进行设定。例如,基于学生B的 宿舍门禁记录信息,在最近一年的时间段内,学生B宿舍门禁记录与其他 学生宿舍门禁记录之间的相似度小于一定阈值,即没有其他学生与学生B 的宿舍门禁记录有经常性(比如大于或等于一定次数阈值)的交集,如学 生B在最近一年的时间里经常独自一人在深夜离开宿舍外出,或经常独自 一人停留在宿舍内等,说明学生B符合性格孤僻人群的一些特征,可以将 学生B确定为存在校园出入异常的学生用户。
又例如,基于学生C的图书馆门禁记录信息,在最近一年的时间段内, 学生C图书馆门禁记录与其他学生图书馆门禁记录之间的相似度小于一定 阈值,即没有其他学生与学生C的宿舍门禁记录有经常性(比如大于或等 于一定次数阈值)的交集,如学生C在最近一年的时间里经常独自一人在 图书馆人员稀少的时间段去图书馆等,说明学生C符合性格孤僻人群的一 些特征,可以将学生C确定为存在校园消费异常的学生用户。
又例如,基于学生D的校园大门的门禁记录信息,学生D在最近半年 的时间段内,每个月具有深夜校园外出行为的天数都大于25天,说明学生 D经常性深夜校园外出,且通过对其他学生的门禁记录信息进行分析,得 到学生D经常独自一人深夜校园外出,说明学生D符合性格孤僻人群的一 些特征,可以将学生D确定为存在校园消费异常的学生用户。
上述根据学生的上网活动信息,检测是否存在上网活动异常的学生用 户的过程可以根据实际需要配置相应的检测规则及设定相应的确定上网活 动异常的标准进行实施,在本发明的一个可选实施例中,该步骤具体可以 包括:检测是否存在预定时间段内与其他学生用户上网记录相似度小于或 等于预设阈值的学生用户;和/或检测预定时间段内学生平均上网搜索文本 内容和/或平均社交网络发帖文本内容中是否包含预定文本内容;和/或检测 是否存在预定时间段内具有深夜上网行为的天数大于或等于预设天数阈值 的学生用户;将预定时间段内与其他学生用户上网记录相似度小于或等于 预设阈值的、和/或预定时间段内平均上网搜索内容和/或平均社交网络发帖 内容中包含预定文本内容的、和/或预定时间段内具有深夜上网行为的天数 大于或等于预设天数阈值的学生用户,确定存在上网活动异常的学生用户。
其中,预定文本内容可以为充满悲观、愤怒、嫉妒等负面情绪的文本 内容。例如,基于学生E的上网活动信息,在最近一年的时间段内,学生E 上网记录与其他学生上网记录之间的相似度小于一定阈值,即没有其他学 生与学生E的上网记录有经常性(比如大于或等于一定次数阈值)的交集, 如学生E在最近一年的时间里经常独自一人在图书馆人员稀少的时间段去 图书馆上网、或经常独自一人在校园计算机房人员稀少的时间段去校园计算机房上网等,说明学生E符合性格孤僻人群的一些特征,可以将学生E 确定为存在校园消费异常的学生用户。
又例如,基于学生F的上网活动信息,学生F在最近半年的时间段内, 每个月具有深夜上网行为的天数都大于25天,并且学生F在校内或校外社 交网站上多数发表一些充满悲观、愤怒、嫉妒等负面情绪的言论内容,进 而推导出学生F很可能是孤僻性格的学生,因此可以将学生F确定为存在 上网活动异常的学生用户。
为了检测学生平均上网搜索文本内容和/或平均社交网络发帖文本内容 中是否包含预定文本内容的过程更加准确,提高检测效率,以便提高识别 疑似性格孤僻学生的准确性和效率,在本发明的一个可选实施例中,该步 骤具体可以包括:采集预定时间段内学生平均上网搜索文本内容和/或平均 社交网络发帖文本内容;通过机械压缩去词、中文分词、停用词过滤的方 式,对所述平均上网搜索文本内容和/或平均社交网络发帖文本内容进行预 处理;通过预定情感倾向分析模型、预定语义网络分析模型、预定狄利克 雷分配LDA主题分析模型,对预处理后的文本内容进行分析,得到学生平 均上网搜索文本内容和/或平均社交网络发帖文本内容中是否包含预定文本 内容的分析结果。
具体地,可以基于学生用户的上网账号进行相关采集,首先采集与该 上网账号相关的上网记录、浏览网页内容、网站发帖内容等信息,再将采 集到的信息进行预处理,包括:机械压缩去词、中文分词、停用词过滤等 方式,例如,基于机械压缩去词处理过程的连续累赘重复的判断及压缩规 则,将“学校很讨厌很讨厌很讨厌很讨厌很讨厌”的文本,处理得到“学 校很讨厌”的文本;然后通过预定情感倾向分析模型、预定语义网络分析 模型、预定狄利克雷分配LDA主题分析模型对预处理后的文本内容进行分 析,进而可以更加准确的检测出学生平均上网搜索文本内容和/或平均社交 网络发帖文本内容中是否包含预定文本内容的分析结果,从而可以提高识 别疑似孤僻性格学生的准确性。
进一步地,为了提高疑似性格孤僻学生的识别准确性,增加疑似性格 孤僻学生的可信度,在本发明的一个可选实施例中,还可以结合学生的行 为轨迹信息、考勤记录信息等进行综合分析。例如,通过上述方法确定学 生G为疑似性格孤僻学生,如果学生G经常独自一人去一些较少人停留的 区域(如经常性独自一人在校园湖边散步)、以及经常出现上课缺勤的情况, 可以进一步确定学生G为疑似性格孤僻学生。
进一步地,为了使得学工部门或辅导员了解分析结果的可信度,在本 发明的一个可选实施例中,还可以参考学生的消费记录信息、门禁记录信 息、上网活动信息、行动轨迹信息、考勤记录信息等,对该学生为疑似孤 僻性格学生的概率值进行计算,例如,符合上述条件越多,其相应的概率 值就越大。然后将计算得到概率值与该学生的相关信息一同展示给学工部 门或辅导员。
进一步地,作为图1所述方法的具体实现,本发明实施例提供了一种 确定疑似孤僻性格学生的装置,如图2所示,所述装置包括:获取单元21、 提取单元22、分析单元23、确定单元24。
获取单元21,可以用于获取预定时间段内的待分析学生数据。获取单 元21为本装置中获取待分析学生数据的主要功能模块,待分析学生数据具 体可以通过高校的各种信息管理系统进行采集。
提取单元22,可以用于从所述获取单元21获取的待分析学生数据中提 取学生的校园活动信息。提取单元22为本装置中提取相关特征信息的主要 功能模块。
分析单元23,可以用于根据所述提取单元22提取的校园活动信息,对 所述待分析学生数据进行分析。分析单元23为本装置中的核心功能模块。
确定单元24,可以用于依据所述分析单元23的分析结果确定得到待确 定孤僻性格的学生用户。确定单元24为本装置中确定疑似孤僻性格学生用 户的主要功能模块。
可选地,所述校园活动信息可以包括学生的消费记录信息、和/或门禁 记录信息、和/或上网活动信息。
具体地,如图3所示,分析单元23具体可以包括:检测模块231、确 定模块232。
检测模块231,可以用于根据所述学生的消费记录信息,检测是否存在 校园消费异常的学生用户;和/或根据所述门禁记录信息,检测是否存在校 园出入异常的学生用户;和/或根据所述上网活动信息,检测是否存在上网 活动异常的学生用户。
确定模块232,可以用于根据所述检测模块231的检测结果确定对所述 待分析学生数据进行分析的分析结果。在本发明实施例中,可以将存在校 园消费异常、和/或校园出入异常、和/或上网活动异常的学生用户,确定为 待确定孤僻性格的学生用户,以便让学工部门或辅导员及时识别出疑似孤 僻性格的学生,进而尽早采取措施对疑似孤僻性格的学生进行心理疏导。
所述检测模块231,具体可以用于检测是否存在预定时间段内与其他学 生用户消费记录相似度小于或等于预设阈值的学生用户;将预定时间段内 与其他学生用户消费记录相似度小于或等于预设阈值的学生用户,确定为 存在校园消费异常的学生用户。
所述检测模块231,具体还可以用于检测是否存在预定时间段内与其他 学生用户宿舍门禁记录和/或图书馆门禁记录相似度小于或等于预设阈值的 学生用户;和/或检测是否存在预定时间段内具有深夜校园外出行为的天数 大于或等于预定天数阈值的学生用户;将预定时间段内与其他学生用户宿 舍门禁记录和/或图书馆门禁记录相似度小于或等于预设阈值的、和/或预定 时间段内具有深夜校园外出行为的天数大于或等于预定天数阈值的学生用 户,确定为存在校园出入异常的学生用户。
所述检测模块231,具体还可以用于检测是否存在预定时间段内与其他 学生用户上网记录相似度小于或等于预设阈值的学生用户;和/或检测预定 时间段内学生平均上网搜索文本内容和/或平均社交网络发帖文本内容中是 否包含预定文本内容;和/或检测是否存在预定时间段内具有深夜上网行为 的天数大于或等于预设天数阈值的学生用户;将预定时间段内与其他学生 用户上网记录相似度小于或等于预设阈值的、和/或预定时间段内平均上网 搜索内容和/或平均社交网络发帖内容中包含预定文本内容的、和/或预定时间段内具有深夜上网行为的天数大于或等于预设天数阈值的学生用户,确 定存在上网活动异常的学生用户。
为了检测学生平均上网搜索文本内容和/或平均社交网络发帖文本内容 中是否包含预定文本内容的过程更加准确,提高检测效率,以便提高识别 疑似性格孤僻学生的准确性和效率,所述检测模块231,具体还可以用于采 集预定时间段内学生平均上网搜索文本内容和/或平均社交网络发帖文本内 容;通过机械压缩去词、中文分词、停用词过滤的方式,对所述平均上网 搜索文本内容和/或平均社交网络发帖文本内容进行预处理;通过预定情感 倾向分析模型、预定语义网络分析模型、预定狄利克雷分配LDA主题分析 模型,对预处理后的文本内容进行分析,得到学生平均上网搜索文本内容 和/或平均社交网络发帖文本内容中是否包含预定文本内容的分析结果。
需要说明的是,本发明实施例提供的一种确定疑似孤僻性格学生的装 置所涉及各功能单元的其他相应描述,可以参考图1中的对应描述,在此 不再赘述。
基于上述如图1所示方法,相应的,本发明实施例还提供了一种计算 机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以 下步骤:获取预定时间段内的待分析学生数据;从所述待分析学生数据中 提取学生的校园活动信息;根据所述校园活动信息,对所述待分析学生数 据进行分析;依据分析结果确定得到待确定孤僻性格的学生用户。
基于上述如图1所示方法和如图2所示装置的实施例,本发明实施例 还提供了一种确定疑似孤僻性格学生的实体装置,如图4所示,该装置包 括:处理器31、存储器32、及存储在存储器32上并可在处理器上运行的 计算机程序,所述处理器31执行所述程序时实现以下步骤:获取预定时间 段内的待分析学生数据;从所述待分析学生数据中提取学生的校园活动信 息;根据所述校园活动信息,对所述待分析学生数据进行分析;依据分析 结果确定得到待确定孤僻性格的学生用户;该装置还包括:总线33,被配 置为耦接处理器31及存储器32。
通过应用本发明的技术方案,可以实现分析得到疑似孤僻性格的学生 用户,及时进行相应预警,便于学工部门或辅导员对疑似孤僻性格的学生 及时进行心理疏导,避免发生校园悲剧。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没 有详述的部分,可以参见其他实施例的相关描述。
可以理解的是,上述方法及装置中的相关特征可以相互参考。另外, 上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施 例的优劣。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述 描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的 对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备 固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的 描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对 任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本 发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实 施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解, 本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中, 并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一 个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征 有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将 该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个 权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要 求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方 式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行 自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。 可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及 此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或 过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明 书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开 的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本 说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提 供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括 其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征 的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下 面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合 方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处 理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员 应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现 根据本发明实施例的一种确定疑似孤僻性格学生的方法及装置中 的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行 这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机 程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读 介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特 网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限 制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出 替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成 对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步 骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明 可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实 现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通 过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示 任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种确定疑似孤僻性格学生的方法,其特征在于,包括:
获取预定时间段内的待分析学生数据;
从所述待分析学生数据中提取学生的校园活动信息;
根据所述校园活动信息,对所述待分析学生数据进行分析;
依据分析结果确定得到待确定孤僻性格的学生用户。
2.根据权利要求1所述的方法,其特征在于,所述校园活动信息包括学生的消费记录信息、和/或门禁记录信息、和/或上网活动信息,所述根据校园活动信息,对所述待分析学生数据进行分析,具体包括:
根据所述学生的消费记录信息,检测是否存在校园消费异常的学生用户;和/或
根据所述门禁记录信息,检测是否存在校园出入异常的学生用户;和/或
根据所述上网活动信息,检测是否存在上网活动异常的学生用户;
根据检测结果确定对所述待分析学生数据进行分析的分析结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述学生的消费记录信息,检测是否存在校园消费异常的学生用户,具体包括:
检测是否存在预定时间段内与其他学生用户消费记录相似度小于或等于预设阈值的学生用户;
将预定时间段内与其他学生用户消费记录相似度小于或等于预设阈值的学生用户,确定为存在校园消费异常的学生用户。
4.根据权利要求2所述的方法,其特征在于,所述根据所述门禁记录信息,检测是否存在校园出入异常的学生用户,具体包括:
检测是否存在预定时间段内与其他学生用户宿舍门禁记录和/或图书馆门禁记录相似度小于或等于预设阈值的学生用户;和/或
检测是否存在预定时间段内具有深夜校园外出行为的天数大于或等于预定天数阈值的学生用户;
将预定时间段内与其他学生用户宿舍门禁记录和/或图书馆门禁记录相似度小于或等于预设阈值的、和/或预定时间段内具有深夜校园外出行为的天数大于或等于预定天数阈值的学生用户,确定为存在校园出入异常的学生用户。
5.根据权利要求2所述的方法,其特征在于,所述根据所述上网活动信息,检测是否存在上网活动异常的学生用户,具体包括:
检测是否存在预定时间段内与其他学生用户上网记录相似度小于或等于预设阈值的学生用户;和/或
检测预定时间段内学生平均上网搜索文本内容和/或平均社交网络发帖文本内容中是否包含预定文本内容;和/或
检测是否存在预定时间段内具有深夜上网行为的天数大于或等于预设天数阈值的学生用户;
将预定时间段内与其他学生用户上网记录相似度小于或等于预设阈值的、和/或预定时间段内平均上网搜索内容和/或平均社交网络发帖内容中包含预定文本内容的、和/或预定时间段内具有深夜上网行为的天数大于或等于预设天数阈值的学生用户,确定存在上网活动异常的学生用户。
6.根据权利要求5所述的方法,其特征在于,所述检测预定时间段内学生平均上网搜索文本内容和/或平均社交网络发帖文本内容中是否包含预定文本内容,具体包括:
采集预定时间段内学生平均上网搜索文本内容和/或平均社交网络发帖文本内容;
通过机械压缩去词、中文分词、停用词过滤的方式,对所述平均上网搜索文本内容和/或平均社交网络发帖文本内容进行预处理;
通过预定情感倾向分析模型、预定语义网络分析模型、预定狄利克雷分配LDA主题分析模型,对预处理后的文本内容进行分析,得到学生平均上网搜索文本内容和/或平均社交网络发帖文本内容中是否包含预定文本内容的分析结果。
7.一种确定疑似孤僻性格学生的装置,其特征在于,包括:
获取单元,用于获取预定时间段内的待分析学生数据;
提取单元,用于从所述获取单元获取的待分析学生数据中提取学生的校园活动信息;
分析单元,用于根据所述提取单元提取的校园活动信息,对所述待分析学生数据进行分析;
确定单元,用于依据所述分析单元的分析结果确定得到待确定孤僻性格的学生用户。
8.根据权利要求7所述的装置,其特征在于,所述校园活动信息包括学生的消费记录信息、和/或门禁记录信息、和/或上网活动信息,所述分析单元具体包括:
检测模块,用于根据所述学生的消费记录信息,检测是否存在校园消费异常的学生用户;和/或
根据所述门禁记录信息,检测是否存在校园出入异常的学生用户;和/或
根据所述上网活动信息,检测是否存在上网活动异常的学生用户;
确定模块,用于根据所述检测模块的检测结果确定对所述待分析学生数据进行分析的分析结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:
获取预定时间段内的待分析学生数据;
从所述待分析学生数据中提取学生的校园活动信息;
根据所述校园活动信息,对所述待分析学生数据进行分析;
依据分析结果确定得到待确定孤僻性格的学生用户。
10.一种确定疑似孤僻性格学生的装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
获取预定时间段内的待分析学生数据;
从所述待分析学生数据中提取学生的校园活动信息;
根据所述校园活动信息,对所述待分析学生数据进行分析;
依据分析结果确定得到待确定孤僻性格的学生用户。
CN201710369019.7A 2017-05-23 2017-05-23 一种确定疑似孤僻性格学生的方法及装置 Pending CN107248125A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710369019.7A CN107248125A (zh) 2017-05-23 2017-05-23 一种确定疑似孤僻性格学生的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710369019.7A CN107248125A (zh) 2017-05-23 2017-05-23 一种确定疑似孤僻性格学生的方法及装置

Publications (1)

Publication Number Publication Date
CN107248125A true CN107248125A (zh) 2017-10-13

Family

ID=60017276

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710369019.7A Pending CN107248125A (zh) 2017-05-23 2017-05-23 一种确定疑似孤僻性格学生的方法及装置

Country Status (1)

Country Link
CN (1) CN107248125A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492694A (zh) * 2018-11-07 2019-03-19 深信服科技股份有限公司 一种用户属性分析方法、系统及相关设备
CN109785205A (zh) * 2019-01-24 2019-05-21 重庆电子工程职业学院 学情确定方法、装置及智能终端
CN111552681A (zh) * 2020-04-30 2020-08-18 山东众志电子有限公司 一种动态的基于大数据技术的场所出入次数异常计算方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050077623A (ko) * 2004-01-29 2005-08-03 (주) 스마트 이즈 Rfid를 이용한 학원 출결관리, sms 문자 및 메일전송 시스템
US20120040326A1 (en) * 2010-08-12 2012-02-16 Emily Larson-Rutter Methods and systems for optimizing individualized instruction and assessment
CN103905486A (zh) * 2012-12-26 2014-07-02 中国科学院心理研究所 一种心理健康状态评估方法
CN105138570A (zh) * 2015-07-26 2015-12-09 吉林大学 网络言论数据疑似犯罪度计算方法
CN105405082A (zh) * 2015-11-30 2016-03-16 河北工程大学 大数据学生性格分析方法
CN105893582A (zh) * 2016-04-01 2016-08-24 深圳市未来媒体技术研究院 一种社交网络用户情绪判别方法
CN106649267A (zh) * 2016-11-30 2017-05-10 北京邮电大学 一种通过文本主题挖掘推测用户大五人格的方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050077623A (ko) * 2004-01-29 2005-08-03 (주) 스마트 이즈 Rfid를 이용한 학원 출결관리, sms 문자 및 메일전송 시스템
US20120040326A1 (en) * 2010-08-12 2012-02-16 Emily Larson-Rutter Methods and systems for optimizing individualized instruction and assessment
CN103905486A (zh) * 2012-12-26 2014-07-02 中国科学院心理研究所 一种心理健康状态评估方法
CN105138570A (zh) * 2015-07-26 2015-12-09 吉林大学 网络言论数据疑似犯罪度计算方法
CN105405082A (zh) * 2015-11-30 2016-03-16 河北工程大学 大数据学生性格分析方法
CN105893582A (zh) * 2016-04-01 2016-08-24 深圳市未来媒体技术研究院 一种社交网络用户情绪判别方法
CN106649267A (zh) * 2016-11-30 2017-05-10 北京邮电大学 一种通过文本主题挖掘推测用户大五人格的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王军,周亚东: ""基于RFID技术的针对学生行为分析的研究"", 《物联网技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492694A (zh) * 2018-11-07 2019-03-19 深信服科技股份有限公司 一种用户属性分析方法、系统及相关设备
CN109785205A (zh) * 2019-01-24 2019-05-21 重庆电子工程职业学院 学情确定方法、装置及智能终端
CN111552681A (zh) * 2020-04-30 2020-08-18 山东众志电子有限公司 一种动态的基于大数据技术的场所出入次数异常计算方法

Similar Documents

Publication Publication Date Title
Jones Resilience isn't the same for all: Comparing subjective and objective approaches to resilience measurement
Hall et al. An analysis of the labor market for Uber’s driver-partners in the United States
Haselhuhn et al. The impact of personal experience on behavior: Evidence from video-rental fines
Ott et al. Estimating the prevalence of deception in online review communities
John The policy agendas project: a review
Conlon et al. Examining the everyday micro-economies of migrant detention in the United States
Bernheim et al. Behavioral public economics: welfare and policy analysis with non-standard decision makers
CN106991187A (zh) 一种校园数据的分析方法及装置
Danziger et al. Extraneous factors in judicial decisions
Joshi et al. Exploring employment preparation and postschool outcomes for students with mild intellectual disability
CN107220236A (zh) 一种确定疑似裸贷学生的方法及装置
Arceneaux et al. A cautionary note on the use of matching to estimate causal effects: An empirical example comparing matching estimates to an experimental benchmark
Warren Reverse migration to Mexico led to US undocumented population decline: 2010 to 2018
CN107194584A (zh) 一种学生数据的分析方法及装置
CN109817312A (zh) 一种就诊引导方法及计算机设备
Ross Estranged parents and a schizophrenic child: choice in economics, psychology and neuroeconomics
JP6418260B2 (ja) 要因推定装置、要因推定システム、および要因推定方法
CN107248125A (zh) 一种确定疑似孤僻性格学生的方法及装置
CN111882420A (zh) 响应率的生成方法、营销方法、模型训练方法及装置
Chen et al. A hybrid data envelopment analysis approach to analyse college graduation rate at higher education institutions
CN109214464A (zh) 一种基于大数据的疑似窃电用户识别装置及识别方法
Henley et al. A crowdsourced nickel‐and‐dime approach to analog OBM research: A behavioral economic framework for understanding workforce attrition
Langelett et al. Elasticity of demand for tuition fees at an institution of higher education
CN113343106A (zh) 学生智能推荐方法及系统
Setialana et al. Intelligent attendance system with face recognition using the deep convolutional neural network method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171013