CN110880013A - 识别文本的方法及装置 - Google Patents

识别文本的方法及装置 Download PDF

Info

Publication number
CN110880013A
CN110880013A CN201910944108.9A CN201910944108A CN110880013A CN 110880013 A CN110880013 A CN 110880013A CN 201910944108 A CN201910944108 A CN 201910944108A CN 110880013 A CN110880013 A CN 110880013A
Authority
CN
China
Prior art keywords
user
text
coefficient
importance
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910944108.9A
Other languages
English (en)
Inventor
宋增猛
龚嘉
谢月飞
王俊
汤华
马占寅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN110880013A publication Critical patent/CN110880013A/zh
Priority to EP20849148.0A priority Critical patent/EP3992818A4/en
Priority to PCT/CN2020/095510 priority patent/WO2021022900A1/zh
Priority to US17/587,498 priority patent/US20220156294A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/226Delivery according to priorities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供识别文本的方法及装置,涉及信息分类领域,可以获取文本和用户的画像信息,根据文本和用户的画像信息得到内容特征系数,并根据内容特征系数确定文本的重要性。如此,可以在大量的文本中,根据文本的内容自动筛选出与用户相关的文本,效率较高。

Description

识别文本的方法及装置
“本申请要求于2019年8月2日提交国家知识产权局、申请号为201910712935.5、发明名称为“识别用户重要短文本的方法和计算机设备”的中国专利申请的优先权,其全部内容通过引用结合在本申请中”。
技术领域
本申请涉及信息分类领域,尤其涉及识别文本的方法及装置。
背景技术
随着组织型结构领域(例如:面向企业(to business,2B)领域)中移动办公的兴起,移动办公软件在人们的工作中的作用越来越重要,人们在工作中可以通过移动办公软件及时沟通,从而提高工作效率。
目前,对于使用移动办公软件的用户而言,每天接收或发送的文本(例如:即时聊天内容、邮件、会议通知等)呈爆炸性增长。但是,用户接收或发送的的文本中,仅有部分文本是与该用户相关的,因此,该用户在接收或发送文本后,需要手动筛选与自身相关的文本。然而,在大量的文本中,手动筛选与自身相关的文本,不仅耗时长而且效率低。
发明内容
本申请实施例提供识别文本的方法及装置,可以识别用户接收或者发送的文本的重要性。
为达到上述目的,本申请实施例采用如下技术方案:
第一方面,本申请实施例提供一种识别文本的方法,该方法包括:获取文本以及用户的画像信息,其中,该文本为该用户接收或者发送的文本,该用户的画像信息用于指示与该用户相关的文本中的N个关键词,N为大于或等于1的整数;根据该文本以及该用户的画像信息得到内容特征系数,其中,该内容特征系数用于指示该文本的内容的重要性;根据该内容特征系数确定该文本的重要性。
上述第一方面提供的技术方案,可以获取文本以及用户的画像信息,根据文本以及用户的画像信息得到内容特征系数,并根据该内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该用户的画像信息包括N个标签信息,该N个标签信息对应指示该N个关键词;或者,该用户的画像信息包括该N个标签信息,以及该N个标签信息中每个标签信息的权重。基于上述技术方案,可以根据文本以及N个标签信息得到内容特征系数,并根据内容特征系数确定文本的重要性,或者,可以根据文本、N个标签信息以及N个标签信息中每个标签信息的权重得到内容特征系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该内容特征系数包括N个系数,其中,第n个系数根据该文本和该用户的画像信息中第n个标签信息得到,n为大于0且小于或等于N的正整数。基于上述技术方案,可以根据文本和用户画像信息中第n个标签信息得到内容特征系数中的第n个系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,根据该文本以及该用户的画像信息得到内容特征系数,包括:获取第一用户行为反馈数据,其中,该第一用户行为反馈数据用于指示历史上与该文本内容相似度高的文本的重要性;获取第一对应关系,其中,该第一对应关系用于指示该第一用户行为反馈数据和该第一用户行为反馈数据的影响系数之间的关联关系;根据该第一用户行为反馈数据和该第一对应关系得到该第一用户行为反馈数据的影响系数;根据该文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到该内容特征系数。基于上述技术方案,可以获取第一用户行为反馈数据,根据第一用户行为反馈数据以及第一关系得到第一用户行为反馈数据的影响系数,根据文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到内容特征系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该方法还包括:获取用户的关系信息,其中,该用户的关系信息用于指示用户与其他用户的层级关系;根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系;该确定该文本的重要性,还包括:根据该关系特征系数确定该文本的重要性。基于上述技术方案,可以获取用户的关系信息,根据文本以及用户的关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户的上下级关系信息、用户的部门关系信息、协同关系信息以及用户的沟通关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系;该用户的部门关系信息包括该用户与其他用户的最小单元组织;该协同关系信息包括指示信息,该指示信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息包括该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系、用户与其他用户的最小单元组织、指示信息以及该用户与其他用户的沟通频率得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系的权重,该用户与其他用户的上下级关系的权重用于指示该用户与其他用户之间的上下级关系;该用户的部门关系信息包括最小单元组织的权重,该最小单元组织的权重用于指示该用户与其他用户的最小单元组织;该协同关系信息包括协同关系权重,该协同关系权重用于指示该用户与其他用户的协同关系;该用户的沟通关系信息包括沟通频率的权重,该沟通频率的权重用于指示用于与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系的权重、最小单元组织的权重、协同关系权重以及该沟通频率的权重得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。基于上述技术方案,可以根据用户的上下级关系信息得到上下级关系特征系数,根据用户的部门关系信息得到部门关系特征系数,根据协同关系信息得到协同关系特征系数,根据用户的沟通关系信息得到沟通关系特征系数,并根据内容特征系数、上下级关系特征系数、部门关系特征系数、协同关系特征系数以及沟通关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该根据该文本以及该用户的关系信息得到关系特征系数,包括:获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据和该第二用户行为反馈数据的影响系数之间的关联关系;根据该第二用户行为反馈数据以及该第二对应关系,得到该第二用户行为反馈数据的影响系数;根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。基于上述技术方案,可以获取第二用户行为反馈数据,根据第二用户行为反馈数据以及第二对应关系,得到第二用户行为反馈数据的影响系数,根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该文本包括该文本的接收人的标识,该方法还包括:根据该文本的接收人的标识得到该消息影响范围特征系数,其中,该消息影响范围特征系数用于指示该文本的接收人的个数;该确定该文本的重要性,还包括:根据该消息影响范围特征系数确定该文本的重要性。基于上述技术方案,可以根据该文本得到消息影响范围特征系数,根据内容特征系数、该关系特征系数以及消息影响范围特征系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及文本的接收人的个数识别用户接收或发送的文本的重要性。
一种可能的实现方式,该方法还包括:根据该用户的关系信息得到用户与接收人/发送人的关系系数,其中,该用户与接收人/发送人的关系系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系的紧密程度;该确定该文本的重要性,还包括:根据该用户与接收人/发送人的关系系数确定该文本的重要性。基于上述技术方案,可以根据用户的关系信息得到用户与接收人/发送人的关系系数,根据内容特征系数、关系特征系数以及用户与接收人/发送人的关系系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及用户与文本的接收人和/或文本的发送人的关系的紧密程度识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:以该内容特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到内容特征系数后,可以将内容特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:以该内容特征系数和该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到内容特征系数和关系特征系数后,可以将内容特征系数和关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:以该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数和该消息影响范围特征系数后,可以将该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:以该内容特征系数、该关系特征系数、该消息影响范围特征系数以及该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到内容特征系数、关系特征系数、消息影响范围特征系数以及用户与接收人/发送人的关系系数后,可以将内容特征系数、关系特征系数、消息影响范围特征系数以及用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该方法还包括:将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的N个系数全部或部分做加法运算得到文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该方法还包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该方法还包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该方法还包括:将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数后,可以将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数和关系特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数和该消息影响范围特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性系数。基于上述技术方案,在得到该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数后,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该方法还包括:根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以根据文本的重要性系数对用户接收或发送的文本进行排序,以使得用户根据文本的重要性处理文本。
一种可能的实现方式,该方法还包括:将该文本按照该文本的重要性分类显示。基于上述技术方案,可以将文本按照文本的重要性分类显示,以使得用户对不同重要性类型的文本分别处理。
第二方面,本申请实施例提供一种识别文本的方法,该方法包括:获取文本以及用户的关系信息,其中,该文本为该用户接收或者发送的文本,该用户的关系信息用于指示该用户与其他用户的层级关系;根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系;根据该关系特征系数确定该文本的重要性。
上述第二方面提供的技术方案,可以获取文本以及用户的关系信息,根据文本以及用户的关系信息得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户的上下级关系信息、用户的部门关系信息、协同关系信息以及用户的沟通关系信息得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系;该用户的部门关系信息包括该用户与其他用户的最小单元组织;该协同关系信息包括指示信息,该指示信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息包括该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系、用户与其他用户的最小单元组织、指示信息以及该用户与其他用户的沟通频率得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系的权重,该用户与其他用户的上下级关系的权重用于指示该用户与其他用户之间的上下级关系;该用户的部门关系信息包括最小单元组织的权重,该最小单元组织的权重用于指示该用户与其他用户的最小单元组织;该协同关系信息包括协同关系权重,该协同关系权重用于指示该用户与其他用户的协同关系;该用户的沟通关系信息包括沟通频率的权重,该沟通频率的权重用于指示用于与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系的权重、最小单元组织的权重、协同关系权重以及该沟通频率的权重得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。基于上述技术方案,可以根据用户的上下级关系信息得到上下级关系特征系数,根据用户的部门关系信息得到部门关系特征系数,根据协同关系信息得到协同关系特征系数,根据用户的沟通关系信息得到沟通关系特征系数,并根据上下级关系特征系数、部门关系特征系数、协同关系特征系数以及沟通关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该根据该文本以及该用户的关系信息得到关系特征系数,包括:获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据和该第二用户行为反馈数据的影响系数之间的关联关系;根据该第二用户行为反馈数据以及该第二对应关系,得到该第二用户行为反馈数据的影响系数;根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。基于上述技术方案,可以获取第二用户行为反馈数据,根据第二用户行为反馈数据以及第二对应关系,得到第二用户行为反馈数据的影响系数,根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据该关系特征系数确定该文本的重要性,包括:以该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到关系特征系数后,可以将关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该方法还包括:将该关系特征系数中的系数做乘法运算得到该文本的重要性系数系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将关系特征系数中的系数做乘法运算得到文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,该根据该关系特征系数确定该文本的重要性,包括:将该关系特征系数中的系数做乘法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到关系特征系数后,可以将关系特征系数中的系数做乘法运算得到文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该方法还包括:根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以根据文本的重要性系数对用户接收或发送的文本进行排序,以使得用户根据文本的重要性处理文本。
一种可能的实现方式,该方法还包括:将该文本按照该文本的重要性分类显示。基于上述技术方案,可以将文本按照文本的重要性分类显示,以使得用户对不同重要性类型的文本分别处理。
第三方面,本申请实施例提供一种识别文本的方法,该方法包括:获取文本、用户的画像信息以及用户的关系信息,其中,该文本为该用户接收或者发送的文本,该用户的画像信息用于指示与该用户相关的文本中的N个关键词,N为大于或等于1的整数,该用户的关系信息用于指示该用户与其他用户的层级关系;根据该文本以及该用户的画像信息得到内容特征系数,其中,该内容特征系数用于指示文本的内容的重要性;根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系;根据该内容特征系数以及该关系特征系数确定该文本的重要性。
上述第三方面提供的技术方案,可以获取文本、用户的画像信息以及用户的关系信息,根据文本以及用户的画像信息得到内容特征系数,根据文本以及用户的关系信息得到关系特征系数,并根据内容特征系数和关系特征系数确定该文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该用户的画像信息包括N个标签信息,该N个标签信息对应指示该N个关键词;或者,该用户的画像信息包括该N个标签信息,以及该N个标签信息中每个标签信息的权重。基于上述技术方案,可以根据文本以及N个标签信息得到内容特征系数,并根据内容特征系数和关系特征系数确定文本的重要性,或者,可以根据文本、N个标签信息以及N个标签信息中每个标签信息的权重得到内容特征系数,并根据内容特征系数和关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该内容特征系数包括N个系数,其中,第n个系数根据该文本和该用户的画像信息中第n个标签信息得到,n为大于0且小于或等于N的正整数。基于上述技术方案,可以根据文本和用户画像信息中第n个标签信息得到内容特征系数中的第n个系数,并根据内容特征系数和关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,根据该文本以及该用户的画像信息得到内容特征系数,包括:获取第一用户行为反馈数据,其中,第一用户行为反馈数据用于指示历史上与该文本内容相似度高的文本的重要性;获取第一对应关系,其中,该第一对应关系用于指示该第一用户行为反馈数据和该第一用户行为反馈数据的影响系数之间的关联关系;根据该第一用户行为反馈数据和该第一对应关系得到该第一用户行为反馈数据的影响系数;根据该文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到该内容特征系数。基于上述技术方案,可以获取第一用户行为反馈数据,根据第一用户行为反馈数据以及第一关系得到第一用户行为反馈数据的影响系数,根据文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到内容特征系数,并根据内容特征系数和关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户的上下级关系信息、用户的部门关系信息、协同关系信息以及用户的沟通关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系;该用户的部门关系信息包括该用户与其他用户的最小单元组织;该协同关系信息包括指示信息,该指示信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息包括该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系、用户与其他用户的最小单元组织、指示信息以及该用户与其他用户的沟通频率得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系的权重,该用户与其他用户的上下级关系的权重用于指示该用户与其他用户之间的上下级关系;该用户的部门关系信息包括最小单元组织的权重,该最小单元组织的权重用于指示该用户与其他用户的最小单元组织;该协同关系信息包括协同关系权重,该协同关系权重用于指示该用户与其他用户的协同关系;该用户的沟通关系信息包括沟通频率的权重,该沟通频率的权重用于指示用于与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系的权重、最小单元组织的权重、协同关系权重以及该沟通频率的权重得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。基于上述技术方案,可以根据用户的上下级关系信息得到上下级关系特征系数,根据用户的部门关系信息得到部门关系特征系数,根据协同关系信息得到协同关系特征系数,根据用户的沟通关系信息得到沟通关系特征系数,并根据内容特征系数、上下级关系特征系数、部门关系特征系数、协同关系特征系数以及沟通关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该根据该文本以及该用户的关系信息得到关系特征系数,包括:获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据和该第二用户行为反馈数据的影响系数之间的关联关系;根据该第二用户行为反馈数据以及该第二对应关系,得到该第二用户行为反馈数据的影响系数;根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。基于上述技术方案,可以获取第二用户行为反馈数据,根据第二用户行为反馈数据以及第二对应关系,得到第二用户行为反馈数据的影响系数,根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该方法还包括:根据该文本得到该消息影响范围特征系数,其中,该消息影响范围特征系数用于指示该文本的接收人的个数;该确定该文本的重要性,还包括:根据该消息影响范围特征系数确定该文本的重要性。基于上述技术方案,可以根据该文本得到消息影响范围特征系数,根据内容特征系数、关系特征系数以及消息影响范围特征系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及文本的接收人的个数识别用户接收或发送的文本的重要性。
一种可能的实现方式,该方法还包括:根据该用户的关系信息得到该用户与接收人/发送人的关系系数,其中,该用户与接收人/发送人的关系系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系的紧密程度;该确定该文本的重要性,还包括:根据该用户与接收人/发送人的关系系数确定该文本的重要性。基于上述技术方案,可以根据用户的关系信息得到用户与接收人/发送人的关系系数,根据内容特征系数,关系特征系数以及用户与接收人/发送人的关系系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及用户与文本的接收人和/或文本的发送人的关系的紧密程度识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:以该内容特征系数以及该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到特征系数集合后,可以将内容特征系数以及关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:以该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到特征系数集合后,可以将内容特征系数、关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:以该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到特征系数集合后,可以将内容特征系数、关系特征系数和该消息影响范围特征系数和该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该方法还包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该方法还包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该方法还包括:将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数和关系特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数和该消息影响范围特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数后,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该方法还包括:根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以根据文本的重要性系数对用户接收或发送的文本进行排序,以使得用户根据文本的重要性处理文本。
一种可能的实现方式,该方法还包括:将该文本按照该文本的重要性分类显示。基于上述技术方案,可以将文本按照文本的重要性分类显示,以使得用户对不同重要性类型的文本分别处理。
第四方面,本申请实施例提供一种识别文本的装置,该装置包括:获取模块、处理模块以及确定模块;该获取模块,用于获取文本以及用户的画像信息,其中,该文本为该用户接收或者发送的文本,该用户的画像信息用于指示该用户相关的文本中的N个关键词,N为大于或等于1的整数;该处理模块,用于根据该文本以及该用户的画像信息得到内容特征系数,其中,该内容特征系数用于指示该文本的内容的重要性;该确定模块,用于根据内容特征系数确定该文本的重要性。
上述第四方面提供的技术方案,可以获取文本以及用户的画像信息,根据文本以及用户的画像信息得到内容特征系数,并根据该内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该用户的画像信息包括N个标签信息,该N个标签信息对应指示该N个关键词;或者,该用户的画像信息包括该N个标签信息,以及该N个标签信息中每个标签信息的权重。基于上述技术方案,可以根据文本以及N个标签信息得到内容特征系数,并根据内容特征系数确定文本的重要性,或者,可以根据文本、N个标签信息以及N个标签信息中每个标签信息的权重得到内容特征系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该内容特征系数包括N个系数,其中,第n个系数根据该文本和该用户的画像信息中第n个标签信息得到,n为大于0且小于或等于N的正整数。基于上述技术方案,可以根据文本和用户画像信息中第n个标签信息得到内容特征系数中的第n个系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该处理模块,具体用于获取第一用户行为反馈数据,其中,第一用户行为反馈数据用于指示历史上与该文本内容相似度高的文本的重要性;该处理模块,还具体用于获取第一对应关系,其中,该第一对应关系用于指示该第一用户行为反馈数据和该第一用户行为反馈数据的影响系数之间的关联关系;该处理模块,还具体用于根据该第一用户行为反馈数据和该第一对应关系得到该第一用户行为反馈数据的影响系数;该处理模块,还具体用于根据该文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到该内容特征系数。基于上述技术方案,可以获取第一用户行为反馈数据,根据第一用户行为反馈数据以及第一关系得到第一用户行为反馈数据的影响系数,根据文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到内容特征系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该获取模块,还用于获取用户的关系信息,其中,该用户的关系信息用于指示用户与其他用户的层级关系;该处理模块,还用于根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系,该确定模块,还用于根据该关系特征系数确定该文本的重要性。基于上述技术方案,可以获取用户的关系信息,根据文本以及用户的关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户的上下级关系信息、用户的部门关系信息、协同关系信息以及用户的沟通关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系;该用户的部门关系信息包括该用户与其他用户的最小单元组织;该协同关系信息包括指示信息,该指示信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息包括该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系、用户与其他用户的最小单元组织、指示信息以及该用户与其他用户的沟通频率得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系的权重,该用户与其他用户的上下级关系的权重用于指示该用户与其他用户之间的上下级关系;该用户的部门关系信息包括最小单元组织的权重,该最小单元组织的权重用于指示该用户与其他用户的最小单元组织;该协同关系信息包括协同关系权重,该协同关系权重用于指示该用户与其他用户的协同关系;该用户的沟通关系信息包括沟通频率的权重,该沟通频率的权重用于指示用于与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系的权重、最小单元组织的权重、协同关系权重以及该沟通频率的权重得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。基于上述技术方案,可以根据用户的上下级关系信息得到上下级关系特征系数,根据用户的部门关系信息得到部门关系特征系数,根据协同关系信息得到协同关系特征系数,根据用户的沟通关系信息得到沟通关系特征系数,并根据内容特征系数、上下级关系特征系数、部门关系特征系数、协同关系特征系数以及沟通关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该处理模块,具体用于用于获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;该处理模块,还具体用于根据该第二用户行为反馈数据以及第二对应关系,得到第二用户行为反馈数据的影响系数,其中,该第二对应关系用于指示该第二用户行为反馈数据和该第二用户行为反馈数据的影响系数之间的关联关系;该处理模块,还具体用于根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。基于上述技术方案,可以获取第二用户行为反馈数据,根据第二用户行为反馈数据以及第二对应关系,得到第二用户行为反馈数据的影响系数,根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该文本包括该文本的接收人的标识,该处理模块,还用于根据该文本的接收人的标识得到该消息影响范围特征系数,其中,该消息影响范围特征系数用于指示该文本的接收人的个数,该确定模块,还用于根据该消息影响范围特征系数确定该文本的重要性。基于上述技术方案,可以根据该文本得到消息影响范围特征系数,根据内容特征系数、该关系特征系数以及消息影响范围特征系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及文本的接收人的个数识别用户接收或发送的文本的重要性。
一种可能的实现方式,该处理模块,还用于根据该用户的关系信息得到用户与接收人/发送人的关系系数,其中,该用户与接收人/发送人的关系系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系的紧密程度,该确定模块,还用于根据该用户与接收人/发送人的关系系数确定该文本的重要性。基于上述技术方案,可以根据用户的关系信息得到用户与接收人/发送人的关系系数,根据内容特征系数、关系特征系数以及用户与接收人/发送人的关系系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及用户与文本的接收人和/或文本的发送人的关系的紧密程度识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于以该内容特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到该内容特征系数后,可以将该内容特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于以该内容特征系数和该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到内容特征系数和关系特征系数后,可以将内容特征系数和关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于以该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数和该消息影响范围特征系数后,可以将该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于以该内容特征系数、该关系特征系数、该消息影响范围特征系数以及该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到内容特征系数、关系特征系数、消息影响范围特征系数以及用户与接收人/发送人的关系系数后,可以将内容特征系数、关系特征系数、消息影响范围特征系数以及用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该装置还包括:排序模块;该处理模块,还用于将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数系数;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该装置还包括:排序模块;该处理模块,还用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该装置还包括:排序模块;该处理模块,还用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该装置还包括:排序模块;该处理模块,还用于将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,该确定模块,具体用于将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数;该确定模块,还具体用于根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数后,可以将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;该确定模块,还具体用于根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数和该关系特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;该确定模块,还具体用于根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数和该消息影响范围特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;该确定模块,还具体用于根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数后,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该装置还包括:排序模块;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以根据文本的重要性系数对用户接收或发送的文本进行排序,以使得用户根据文本的重要性处理文本。
一种可能的实现方式,该装置还包括:显示模块;该显示模块,用于将该文本按照该文本的重要性分类显示。基于上述技术方案,可以将文本按照文本的重要性分类显示,以使得用户对不同重要性类型的文本分别处理。
第五方面,本申请实施例提供一种识别文本的装置,该装置包括:获取模块、处理模块以及确定模块;该获取模块,用于获取文本以及用户的关系信息,其中,该文本为该用户接收或者发送的文本,该用户的关系信息用于指示该用户与其他用户的层级关系;该处理模块,用于根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系;该确定模块,用于根据该关系特征系数确定该文本的重要性。
上述第五方面提供的技术方案,可以获取文本以及用户的关系信息,根据文本以及用户的关系信息得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户的上下级关系信息、用户的部门关系信息、协同关系信息以及用户的沟通关系信息得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系;该用户的部门关系信息包括该用户与其他用户的最小单元组织;该协同关系信息包括指示信息,该指示信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息包括该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系、用户与其他用户的最小单元组织、指示信息以及该用户与其他用户的沟通频率得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系的权重,该用户与其他用户的上下级关系的权重用于指示该用户与其他用户之间的上下级关系;该用户的部门关系信息包括最小单元组织的权重,该最小单元组织的权重用于指示该用户与其他用户的最小单元组织;该协同关系信息包括协同关系权重,该协同关系权重用于指示该用户与其他用户的协同关系;该用户的沟通关系信息包括沟通频率的权重,该沟通频率的权重用于指示用于与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系的权重、最小单元组织的权重、协同关系权重以及该沟通频率的权重得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。基于上述技术方案,可以根据用户的上下级关系信息得到上下级关系特征系数,根据用户的部门关系信息得到部门关系特征系数,根据协同关系信息得到协同关系特征系数,根据用户的沟通关系信息得到沟通关系特征系数,并根据上下级关系特征系数、部门关系特征系数、协同关系特征系数以及沟通关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该处理模块,具体用于获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;该处理模块,还具体用于获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据,以及该第二用户行为反馈数据的影响系数之间的关联关系;该处理模块,还具体用于根据该第二用户行为反馈数据以及该第二对应关系,得到该第二用户行为反馈数据的影响系数;该处理模块,还具体用于根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。基于上述技术方案,可以获取第二用户行为反馈数据,根据第二用户行为反馈数据以及第二对应关系,得到第二用户行为反馈数据的影响系数,根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于以该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到关系特征系数后,可以将关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该装置还包括:排序模块;该处理模块,还用于将该关系特征系数中的系数做乘法运算得到该文本的重要性系数;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将关系特征系数中的系数做乘法运算得到文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,该确定模块,具体用于将该关系特征系数中的系数做乘法运算得到该文本的重要性系数;该确定模块,还具体用于根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到关系特征系数后,可以将关系特征系数中的系数做乘法运算得到文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该装置还包括:排序模块;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以根据文本的重要性系数对用户接收或发送的文本进行排序,以使得用户根据文本的重要性处理文本。
一种可能的实现方式,该装置还包括:显示模块;该显示模块,用于将该文本按照该文本的重要性分类显示。基于上述技术方案,可以将文本按照文本的重要性分类显示,以使得用户对不同重要性类型的文本分别处理。
第六方面,本申请实施例提供一种文本识别的装置,该装置包括:获取模块、处理模块以及确定模块;该获取模块,用于获取文本、用户的画像信息、以及用户的关系信息,其中,该文本为该用户接收或者发送的文本,该用户的画像信息用于指示该用户相关的文本中的N个关键词,N为大于或等于1的整数,该用户的关系信息用于指示该用户与其他用户的层级关系;该处理模块,用于根据该文本以及该用户的画像信息得到内容特征系数,其中,该内容特征系数用于指示文本的内容的重要性;该处理模块,还用于根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系;该确定模块,用于根据该内容特征系数以及该关系特征系数确定该文本的重要性。
上述第六方面提供的技术方案,可以获取文本、用户的画像信息以及用户的关系信息,根据文本以及用户的画像信息得到内容特征系数,根据文本以及用户的关系信息得到关系特征系数,并根据内容特征系数和关系特征系数确定该文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该用户的画像信息包括N个标签信息,该N个标签信息对应指示该N个关键词;或者,该用户的画像信息包括该N个标签信息,以及该N个标签信息中每个标签信息的权重。基于上述技术方案,可以根据文本以及N个标签信息得到内容特征系数,并根据内容特征系数和关系特征系数确定文本的重要性,或者,可以根据文本、N个标签信息以及N个标签信息中每个标签信息的权重得到内容特征系数,并根据内容特征系数和关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该内容特征系数包括N个系数,其中,第n个系数根据该文本和该用户的画像信息中第n个标签信息得到,n为大于0且小于或等于N的正整数。基于上述技术方案,可以根据文本和用户画像信息中第n个标签信息得到内容特征系数中的第n个系数,并根据内容特征系数和关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该处理模块,具体用于获取第一用户行为反馈数据,其中,第一用户行为反馈数据用于指示历史上与该文本内容相似度高的文本的重要性;该处理模块,还具体用于获取第一对应关系,其中,该第一对应关系用于指示该第一用户行为反馈数据和该第一用户行为反馈数据的影响系数之间的关联关系;该处理模块,还具体用于根据该第一用户行为反馈数据和该第一对应关系得到该第一用户行为反馈数据的影响系数;该处理模块,还具体用于根据该文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到该内容特征系数。基于上述技术方案,可以获取第一用户行为反馈数据,根据第一用户行为反馈数据以及第一关系得到第一用户行为反馈数据的影响系数,根据文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到内容特征系数,并根据内容特征系数和关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户的上下级关系信息、用户的部门关系信息、协同关系信息以及用户的沟通关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系;该用户的部门关系信息包括该用户与其他用户的最小单元组织;该协同关系信息包括指示信息,该指示信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息包括该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系、用户与其他用户的最小单元组织、指示信息以及该用户与其他用户的沟通频率得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系的权重,该用户与其他用户的上下级关系的权重用于指示该用户与其他用户之间的上下级关系;该用户的部门关系信息包括最小单元组织的权重,该最小单元组织的权重用于指示该用户与其他用户的最小单元组织;该协同关系信息包括协同关系权重,该协同关系权重用于指示该用户与其他用户的协同关系;该用户的沟通关系信息包括沟通频率的权重,该沟通频率的权重用于指示用于与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系的权重、最小单元组织的权重、协同关系权重以及该沟通频率的权重得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。基于上述技术方案,可以根据用户的上下级关系信息得到上下级关系特征系数,根据用户的部门关系信息得到部门关系特征系数,根据协同关系信息得到协同关系特征系数,根据用户的沟通关系信息得到沟通关系特征系数,并根据内容特征系数、上下级关系特征系数、部门关系特征系数、协同关系特征系数以及沟通关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该处理模块,具体用于获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;该处理模块,还具体用于获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据和该第二用户行为反馈数据的影响系数之间的关联关系;该处理模块,还具体用于根据该第二用户行为反馈数据以及该第二对应关系,该得到第二用户行为反馈数据的影响系数;该处理模块,还具体用于根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。基于上述技术方案,可以获取第二用户行为反馈数据,根据第二用户行为反馈数据以及第二对应关系,得到第二用户行为反馈数据的影响系数,根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该处理模块,还用于根据该文本得到该消息影响范围特征系数,其中,该消息影响范围特征系数用于指示该文本的接收人的个数,该确定模块,还用于根据该消息影响范围特征系数确定该文本的重要性。基于上述技术方案,可以根据该文本得到消息影响范围特征系数,根据内容特征系数、关系特征系数以及消息影响范围特征系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及文本的接收人的个数识别用户接收或发送的文本的重要性。
一种可能的实现方式,该处理模块,还用于根据该用户的关系信息得到该用户与接收人/发送人的关系系数,其中,该用户与接收人/发送人的关系系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系的紧密程度,该确定模块,还用于根据该用户与接收人/发送人的关系系数确定该文本的重要性。基于上述技术方案,可以根据用户的关系信息得到用户与接收人/发送人的关系系数,根据内容特征系数,关系特征系数以及用户与接收人/发送人的关系系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及用户与文本的接收人和/或文本的发送人的关系的紧密程度识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于以该内容特征系数以及该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到该内容特征系数以及该关系特征系数后,可以将该内容特征系数以及该关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于以该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数和该消息影响范围特征系数后,可以将该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于以该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数后,可以将该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该装置还包括:排序模块;该处理模块,还用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该装置还包括:排序模块;该处理模块,还用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该装置还包括:排序模块;该处理模块,还用于将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,该确定模块,具体用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;该确定模块,还具体用于根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数和该关系特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;该确定模块,还具体用于根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数和该消息影响范围特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该确定模块,具体用于将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;该确定模块,还具体用于根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数后,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该装置还包括:排序模块;该排序模块,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以根据文本的重要性系数对用户接收或发送的文本进行排序,以使得用户根据文本的重要性处理文本。
一种可能的实现方式,该装置还包括:显示模块;该显示模块,用于将该文本按照该文本的重要性分类显示。基于上述技术方案,可以将文本按照文本的重要性分类显示,以使得用户对不同重要性类型的文本分别处理。
第七方面,本申请提供了一种识别文本的装置,该装置可以包括:至少一个处理器、存储器,该存储器存储有软件程序,该处理器用于调用该存储器中的软件程序执行下述过程:从该存储器或服务器中获取文本以及用户的画像信息,其中,该文本为该用户接收或者发送的文本,该用户的画像信息用于指示该用户相关的文本中的N个关键词,N为大于或等于1的整数,该服务器与该识别文本的装置连接,该服务器中存储有该文本以及该用户的画像信息;根据该文本以及该用户的画像信息得到内容特征系数,其中,该内容特征系数用于指示该文本的内容的重要性;根据该内容特征系数确定该文本的重要性。
上述第七方面提供的技术方案,可以获取文本以及用户的画像信息,根据文本以及用户的画像信息得到内容特征系数,并根据该内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该用户的画像信息包括N个标签信息,该N个标签信息对应指示该N个关键词;或者,该用户的画像信息包括该N个标签信息,以及该N个标签信息中每个标签信息的权重。基于上述技术方案,可以根据文本以及N个标签信息得到内容特征系数,并根据内容特征系数确定文本的重要性,或者,可以根据文本、N个标签信息以及N个标签信息中每个标签信息的权重得到内容特征系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该内容特征系数包括N个系数,其中,第n个系数根据该文本和该用户的画像信息中第n个标签信息得到,n为大于0且小于或等于N的正整数。基于上述技术方案,可以根据文本和用户画像信息中第n个标签信息得到内容特征系数中的第n个系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该根据该文本以及该用户的画像信息得到内容特征系数,包括:从该存储器或该服务器中获取第一用户行为反馈数据,其中,第一用户行为反馈数据用于指示历史上与该文本内容相似度高的文本的重要性;从该存储器或该服务器中获取第一对应关系,其中,该第一对应关系用于指示该第一用户行为反馈数据和该第一用户行为反馈数据的影响系数之间的关联关系;根据该第一用户行为反馈数据和该第一对应关系得到该第一用户行为反馈数据的影响系数;根据该文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到该内容特征系数。基于上述技术方案,可以获取第一用户行为反馈数据,根据第一用户行为反馈数据以及第一关系得到第一用户行为反馈数据的影响系数,根据文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到内容特征系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该处理器还用于调用该存储器中的软件程序执行下述过程:从该存储器或该服务器中获取用户的关系信息,其中,该用户的关系信息用于指示用户与其他用户的层级关系;根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系;该确定该文本的重要性,还包括:根据该关系特征系数确定该文本的重要性。基于上述技术方案,可以获取用户的关系信息,根据文本以及用户的关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户的上下级关系信息、用户的部门关系信息、协同关系信息以及用户的沟通关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系;该用户的部门关系信息包括该用户与其他用户的最小单元组织;该协同关系信息包括指示信息,该指示信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息包括该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系、用户与其他用户的最小单元组织、指示信息以及该用户与其他用户的沟通频率得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系的权重,该用户与其他用户的上下级关系的权重用于指示该用户与其他用户之间的上下级关系;该用户的部门关系信息包括最小单元组织的权重,该最小单元组织的权重用于指示该用户与其他用户的最小单元组织;该协同关系信息包括协同关系权重,该协同关系权重用于指示该用户与其他用户的协同关系;该用户的沟通关系信息包括沟通频率的权重,该沟通频率的权重用于指示用于与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系的权重、最小单元组织的权重、协同关系权重以及该沟通频率的权重得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。基于上述技术方案,可以根据用户的上下级关系信息得到上下级关系特征系数,根据用户的部门关系信息得到部门关系特征系数,根据协同关系信息得到协同关系特征系数,根据用户的沟通关系信息得到沟通关系特征系数,并根据内容特征系数、上下级关系特征系数、部门关系特征系数、协同关系特征系数以及沟通关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该根据该文本以及该用户的关系信息得到关系特征系数,包括:从该存储器或该服务器中获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据,以及该第二用户行为反馈数据的影响系数之间的关联关系;根据该第二用户行为反馈数据以及该第二对应关系,得到该第二用户行为反馈数据的影响系数;根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。基于上述技术方案,可以获取第二用户行为反馈数据,根据第二用户行为反馈数据以及第二对应关系,得到第二用户行为反馈数据的影响系数,根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该文本包括该文本的接收人的标识;该处理器还用于调用该存储器中的软件程序执行下述过程:根据该文本的接收人的标识得到消息影响范围特征系数,其中,该消息影响范围特征系数用于指示该文本的接收人的个数;该确定该文本的重要性,还包括:根据该消息影响范围特征系数确定该文本的重要性。基于上述技术方案,可以根据该文本得到消息影响范围特征系数,根据内容特征系数、该关系特征系数以及消息影响范围特征系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及文本的接收人的个数识别用户接收或发送的文本的重要性。
一种可能的实现方式,该处理器还用于调用该存储器中的软件程序执行下述过程:根据该用户的关系信息得到用户与接收人/发送人的关系系数,其中,该用户与接收人/发送人的关系系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系的紧密程度;该确定该文本的重要性,还包括:根据该用户与接收人/发送人的关系系数确定该文本的重要性。基于上述技术方案,可以根据用户的关系信息得到用户与接收人/发送人的关系系数,根据内容特征系数、关系特征系数以及用户与接收人/发送人的关系系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及用户与文本的接收人和/或文本的发送人的关系的紧密程度识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据该内容特征系数确定该文本的重要性,包括:以该内容特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到该内容特征系数后,可以将该内容特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:以该内容特征系数和该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到内容特征系数和关系特征系数后,可以将内容特征系数和关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:以该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数和该消息影响范围特征系数后,可以将该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:以该内容特征系数、该关系特征系数、该消息影响范围特征系数以及该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到内容特征系数、关系特征系数、消息影响范围特征系数以及用户与接收人/发送人的关系系数后,可以将内容特征系数、关系特征系数、消息影响范围特征系数以及用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该处理器还用于调用该存储器中的软件程序执行下述过程:将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的N个系数全部或部分做加法运算得到文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该处理器还用于调用该存储器中的软件程序执行下述过程:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该处理器还用于调用该存储器中的软件程序执行下述过程:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该处理器还用于调用该存储器中的软件程序执行下述过程:将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数后,可以将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据该内容特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数和关系特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数和该消息影响范围特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数后,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该处理器还用于调用该存储器中的软件程序执行下述过程:根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以根据文本的重要性系数对用户接收或发送的文本进行排序,以使得用户根据文本的重要性处理文本。
一种可能的实现方式,该处理器还用于调用该存储器中的软件程序执行下述过程:将该文本按照该文本的重要性分类显示。基于上述技术方案,可以将文本按照文本的重要性分类显示,以使得用户对不同重要性类型的文本分别处理。
第八方面,本申请提供了一种识别文本的装置,该装置可以包括:至少一个处理器、存储器,该存储器存储有软件程序,该处理器调用该存储器中的软件程序执行下述过程:从该存储器或服务器中获取文本以及用户的关系信息,其中,该文本为该用户接收或者发送的文本,该用户的关系信息用于指示该用户与其他用户的层级关系,该服务器与该识别文本的装置连接,该服务器中存储有该文本以及该用户的关系信息;根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系;根据该关系特征系数确定该文本的重要性。
上述第八方面提供的技术方案,可以获取文本以及用户的关系信息,根据文本以及用户的关系信息得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户的上下级关系信息、用户的部门关系信息、协同关系信息以及用户的沟通关系信息得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系;该用户的部门关系信息包括该用户与其他用户的最小单元组织;该协同关系信息包括指示信息,该指示信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息包括该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系、用户与其他用户的最小单元组织、指示信息以及该用户与其他用户的沟通频率得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系的权重,该用户与其他用户的上下级关系的权重用于指示该用户与其他用户之间的上下级关系;该用户的部门关系信息包括最小单元组织的权重,该最小单元组织的权重用于指示该用户与其他用户的最小单元组织;该协同关系信息包括协同关系权重,该协同关系权重用于指示该用户与其他用户的协同关系;该用户的沟通关系信息包括沟通频率的权重,该沟通频率的权重用于指示用于与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系的权重、最小单元组织的权重、协同关系权重以及该沟通频率的权重得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。基于上述技术方案,可以根据用户的上下级关系信息得到上下级关系特征系数,根据用户的部门关系信息得到部门关系特征系数,根据协同关系信息得到协同关系特征系数,根据用户的沟通关系信息得到沟通关系特征系数,并根据上下级关系特征系数、部门关系特征系数、协同关系特征系数以及沟通关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该根据该文本以及该用户的关系信息得到关系特征系数,包括:从该存储器或该服务器中获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据和该第二用户行为反馈数据的影响系数之间的关联关系;根据该第二用户行为反馈数据以及该第二对应关系,得到该第二用户行为反馈数据的影响系数;根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。基于上述技术方案,可以获取第二用户行为反馈数据,根据第二用户行为反馈数据以及第二对应关系,得到第二用户行为反馈数据的影响系数,根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据该关系特征系数确定该文本的重要性,包括:以该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到关系特征系数后,可以将关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该处理器还用于调用该存储器中的软件程序执行下述过程:将该关系特征系数中的系数做乘法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将关系特征系数中的系数做乘法运算得到文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,该根据该关系特征系数确定该文本的重要性,包括:将该关系特征系数中的系数做乘法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到关系特征系数后,可以将关系特征系数中的系数做乘法运算得到文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该处理器还用于调用该存储器中的软件程序执行下述过程:根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以根据文本的重要性系数对用户接收或发送的文本进行排序,以使得用户根据文本的重要性处理文本。
一种可能的实现方式,该处理器还用于调用该存储器中的软件程序执行下述过程:将该文本按照该文本的重要性分类显示。基于上述技术方案,可以将文本按照文本的重要性分类显示,以使得用户对不同重要性类型的文本分别处理。
第九方面,本申请提供了一种识别文本的装置,该装置可以包括:至少一个处理器、存储器,该存储器存储有软件程序,该处理器用于调用该存储器中的软件程序执行下述过程:从该存储器或服务器中获取文本、用户的画像信息以及用户的关系信息,其中,该文本为该用户接收或者发送的文本,该用户的画像信息用于指示该用户相关的文本中的N个关键词,N为大于或等于1的整数,该用户的关系信息用于指示该用户与其他用户的层级关系,该服务器与该识别文本的装置连接,该服务器中存储有文本、用户的画像信息以及用户的关系信息;根据该文本以及该用户的画像信息得到内容特征系数,其中,该内容特征系数用于指示文本的内容的重要性;根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系;根据该内容特征系数以及该关系特征系数确定该文本的重要性。
上述第九方面提供的技术方案,可以获取文本、用户的画像信息以及用户的关系信息,根据文本以及用户的画像信息得到内容特征系数,根据文本以及用户的关系信息得到关系特征系数,并根据内容特征系数和关系特征系数确定该文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该用户的画像信息包括N个标签信息,该N个标签信息对应指示该N个关键词;或者,该用户的画像信息包括该N个标签信息,以及该N个标签信息中每个标签信息的权重。基于上述技术方案,可以根据文本以及N个标签信息得到内容特征系数,并根据内容特征系数和关系特征系数确定文本的重要性,或者,可以根据文本、N个标签信息以及N个标签信息中每个标签信息的权重得到内容特征系数,并根据内容特征系数和关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该内容特征系数包括N个系数,其中,第n个系数根据该文本和该用户的画像信息中第n个标签信息得到,n为大于0且小于或等于N的正整数。基于上述技术方案,可以根据文本和用户画像信息中第n个标签信息得到内容特征系数中的第n个系数,并根据内容特征系数和关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,根据该文本以及该用户的画像信息得到内容特征系数,包括:从该存储器或该服务器中获取第一用户行为反馈数据,其中,第一用户行为反馈数据用于指示历史上与该文本内容相似度高的文本的重要性;从该存储器或该服务器中获取第一对应关系,其中,该第一对应关系用于指示第一用户行为反馈数据和该第一用户行为反馈数据的影响系数之间的关联关系;根据该第一用户行为反馈数据和该第一对应关系得到该第一用户行为反馈数据的影响系数;根据该文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到该内容特征系数。基于上述技术方案,可以获取第一用户行为反馈数据,根据第一用户行为反馈数据以及第一关系得到第一用户行为反馈数据的影响系数,根据文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到内容特征系数,并根据内容特征系数和关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或者发送的文本的重要性。
一种可能的实现方式,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户的上下级关系信息、用户的部门关系信息、协同关系信息以及用户的沟通关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系;该用户的部门关系信息包括该用户与其他用户的最小单元组织;该协同关系信息包括指示信息,该指示信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息包括该用户与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系、用户与其他用户的最小单元组织、指示信息以及该用户与其他用户的沟通频率得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该用户的上下级关系信息包括该用户与其他用户的上下级关系的权重,该用户与其他用户的上下级关系的权重用于指示该用户与其他用户之间的上下级关系;该用户的部门关系信息包括最小单元组织的权重,该最小单元组织的权重用于指示该用户与其他用户的最小单元组织;该协同关系信息包括协同关系权重,该协同关系权重用于指示该用户与其他用户的协同关系;该用户的沟通关系信息包括沟通频率的权重,该沟通频率的权重用于指示用于与其他用户的沟通频率。基于上述技术方案,可以根据文本、用户与其他用户的上下级关系的权重、最小单元组织的权重、协同关系权重以及该沟通频率的权重得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。基于上述技术方案,可以根据用户的上下级关系信息得到上下级关系特征系数,根据用户的部门关系信息得到部门关系特征系数,根据协同关系信息得到协同关系特征系数,根据用户的沟通关系信息得到沟通关系特征系数,并根据内容特征系数、上下级关系特征系数、部门关系特征系数、协同关系特征系数以及沟通关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该根据该文本以及该用户的关系信息得到关系特征系数,包括:从该存储器或该服务器中获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;从该存储器或该服务器中获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据和该第二用户行为反馈数据的影响系数之间的关联关系;根据该第二用户行为反馈数据以及该第二对应关系,得到该第二用户行为反馈数据的影响系数;根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。基于上述技术方案,可以获取第二用户行为反馈数据,根据第二用户行为反馈数据以及第二对应关系,得到第二用户行为反馈数据的影响系数,根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容,以及用户与文本的接收人和发送人的关系识别用户接收或发送的文本的重要性。
一种可能的实现方式,该处理器还用于调用该存储器中的软件程序执行下述过程:根据该文本得到该消息影响范围特征系数,其中,该消息影响范围特征系数用于指示该文本的接收人的个数;该确定该文本的重要性,还包括:根据该消息影响范围特征系数确定该文本的重要性。基于上述技术方案,可以根据该文本得到消息影响范围特征系数,根据内容特征系数、关系特征系数以及消息影响范围特征系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及文本的接收人的个数识别用户接收或发送的文本的重要性。
一种可能的实现方式,该处理器还用于调用该存储器中的软件程序执行下述过程:根据该用户的关系信息得到该用户与接收人/发送人的关系系数,其中,该用户与接收人/发送人的关系系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系的紧密程度;该确定该文本的重要性,还包括:根据该用户与接收人/发送人的关系系数确定该文本的重要性。基于上述技术方案,可以根据用户的关系信息得到用户与接收人/发送人的关系系数,根据内容特征系数,关系特征系数以及用户与接收人/发送人的关系系数确定文本的重要性,从而可以根据文本的内容、用户与文本的接收人和发送人的关系以及用户与文本的接收人和/或文本的发送人的关系的紧密程度识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:以该内容特征系数以及该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到该内容特征系数以及该关系特征系数后,可以将该内容特征系数以及该关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:以该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到特征系数集合后,可以将内容特征系数、关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:以该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。基于上述技术方案,在得到特征系数集合后,可以将内容特征系数、关系特征系数和该消息影响范围特征系数和该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过机器学习方法确定该文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该处理器还用于调用该存储器中的软件程序执行下述过程:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该处理器还用于调用该存储器中的软件程序执行下述过程:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,当重要性相同的文本有多个时,该内容特征系数包括N个系数,该处理器还用于调用该存储器中的软件程序执行下述过程:将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数对用户接收或发送的文本进行排序,可以使用户根据文本的重要性处理文本。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数和关系特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数和该消息影响范围特征系数后,可以将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,该根据内容特征系数以及关系特征系数确定该文本的重要性,包括:将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;根据该文本的重要性系数确定该文本的重要性。基于上述技术方案,在得到该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数后,可以将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数,并根据文本的重要性系数确定文本的重要性,从而可以识别用户接收或发送的文本的重要性。
一种可能的实现方式,当重要性相同的文本有多个时,该处理器还用于调用该存储器中的软件程序执行下述过程:根据该文本的重要性系数对该用户接收或发送的文本进行排序。基于上述技术方案,在确定文本的重要性后,重要性相同的文本有多个时,可以根据文本的重要性系数对用户接收或发送的文本进行排序,以使得用户根据文本的重要性处理文本。
一种可能的实现方式,该处理器还用于调用该存储器中的软件程序执行下述过程:将该文本按照该文本的重要性分类显示。基于上述技术方案,可以将文本按照文本的重要性分类显示,以使得用户对不同重要性类型的文本分别处理。
第十方面,本申请提供了一种系统芯片,该系统芯片可以应用在识别文本的装置中,该系统芯片包括:至少一个处理器,涉及的程序指令在该至少一个处理器中执行,以实现第一方面以及第一方面的任一种可能的实现方式所述的识别文本的方法。可选的,该系统芯片还可以包括至少一个存储器,该存储器存储有涉及的程序指令。
第十一方面,本申请提供了一种系统芯片,该系统芯片可以应用在识别文本的装置中,该系统芯片包括:至少一个处理器,涉及的程序指令在该至少一个处理器中执行,以实现第一方面以及第二方面的任二种可能的实现方式所述的识别文本的方法。可选的,该系统芯片还可以包括至少一个存储器,该存储器存储有涉及的程序指令。
第十二方面,本申请提供了一种系统芯片,该系统芯片可以应用在识别文本的装置中,该系统芯片包括:至少一个处理器,涉及的程序指令在该至少一个处理器中执行,以实现第三方面以及第三方面的任一种可能的实现方式所述的识别文本的方法。可选的,该系统芯片还可以包括至少一个存储器,该存储器存储有涉及的程序指令。
第十三方面,本申请提供了一种计算机存储介质,该计算机存储介质可以应用在识别文本的装置中,该计算机可读存储介质中存储有程序指令,涉及的程序指令运行时,以实现根据第一方面以及第一方面的各种可能的实现方式所述的识别文本的方法。
第十四方面,本申请提供了一种计算机存储介质,该计算机存储介质可以应用在识别文本的装置中,该计算机可读存储介质中存储有程序指令,涉及的程序指令运行时,以实现根据第二方面以及第二方面的各种可能的实现方式所述的识别文本的方法。
第十五方面,本申请提供了一种计算机存储介质,该计算机存储介质可以应用在识别文本的装置中,该计算机可读存储介质中存储有程序指令,涉及的程序指令运行时,以实现根据第三方面以及第三方面的各种可能的实现方式所述的识别文本的方法。
第十六方面,本申请提供了一种计算机程序产品,该计算机程序产品包含程序指令,涉及的程序指令被执行时,以实现根据第一方面以及第一方面的各种可能的实现方式所述的识别文本的方法。
第十七方面,本申请提供了一种计算机程序产品,该计算机程序产品包含程序指令,涉及的程序指令被执行时,以实现根据第二方面以及第二方面的各种可能的实现方式所述的识别文本的方法。
第十八方面,本申请提供了一种计算机程序产品,该计算机程序产品包含程序指令,涉及的程序指令被执行时,以实现根据第三方面以及第三方面的各种可能的实现方式所述的识别文本的方法。
可以理解的,上述提供的任一种系统芯片、计算机存储介质或计算机程序产品等均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考对应的方法中的有益效果,此处不再赘述。
附图说明
图1为本申请实施例提供的显示界面示意图;
图2为本申请实施例提供的硬件设备的硬件结构示意图;
图3为本申请实施例提供的识别文本的方法的流程示意图一;
图4为本申请实施例提供的识别文本的方法的流程示意图二;
图5为本申请实施例提供的识别文本的方法的流程示意图三;
图6为本申请实施例提供的识别文本的方法的流程示意图四;
图7为本申请实施例提供的识别文本的方法的流程示意图五;
图8为本申请实施例提供的识别文本的装置的结构示意图一;
图9为本申请实施例提供的识别文本的装置的结构示意图二;
图10为本申请实施例提供的识别文本的装置的结构示意图三;
图11为本申请实施例提供的识别文本的装置的结构示意图四;
图12为本申请实施例提供的识别文本的装置的结构示意图五;
图13为本申请实施例提供的识别文本的装置的结构示意图六;
图14为本申请实施例提供的识别文本的装置的结构示意图七;
图15为本申请实施例提供的识别文本的装置的结构示意图八;
图16为本申请实施例提供的识别文本的装置的结构示意图九。
具体实施方式
目前,移动办公软件(例如,腾讯通、eSpace和Outlook等软件)已经是人们日常工作中不可或缺的应用。通过移动办公软件,用户每天会接收或发送大量的文本,但是,在这些大量的文本中,仅有部分文本是与用户相关的文本。因此,用户需要从大量的文本中筛选出与用户相关的文本,而如何高效地从大量的文本中筛选出与用户相关的文本是一个急需解决的问题。
为了解决如何从大量的文本中筛选出与用户相关的文本的问题,本申请实施例提供了一种识别文本的方法,该方法可以应用于安装有移动办公软件的装置中,在用户发送或者接收文本后,可以获取文本和用户的画像信息,根据文本和用户的画像信息得到内容特征系数,并根据内容特征系数确定文本的重要性。如此,可以根据文本的内容确定文本的重要性。因此,可以在大量的文本中,自动筛选与用户相关的文本,相对于现有技术中,手动筛选与用户相关的文本,效率更高。
或者,在用户发送或者接收文本后,可以获取文本的接收人的标识和/或文本的发送人的标识,以及用户的关系信息,根据文本的接收人的标识和/或文本的发送人的标识,以及用户的关系信息得到关系特征系数,并根据关系特征系数确定文本的重要性。如此,可以根据用户与文本的接收人和/或文本的发送人的关系确定文本的重要性。因此,可以在大量的文本中,自动筛选与用户相关的文本,相对于现有技术中,手动筛选与用户相关的文本,效率更高。
例如,图1为本申请实施例提供的显示界面示意图,图1中,用户接收到了文本1-文本N,共N个文本。识别文本的装置可以分别获取每个文本和用户的画像信息,根据每个文本和用户的画像信息得到每个文本的内容特征系数,并根据每个文本的内容特征系数分别确定每个文本的重要性,其中,文本2、文本6、文本7以及文本5为重要文本(图1中标记感叹号的文本),其余文本为非重要文本。
其中,上述名词:文本、用户的画像信息、内容特征系数、文本的接收人的标识(以下简写为接收人的标识)、文本的发送人的标识(以下简写为发送人的标识)、用户的关系信息以及关系特征系数的介绍如下:
文本可以是用户接收或者发送的文本,文本可以包括接收人的标识、发送人的标识以及文本的内容。例如,文本可以是用户通过腾讯通接收的即时消息,或者用户通过邮箱发送的邮件等。本申请下述实施例以文本为用户接收的文本为例进行介绍,文本为用户发送的文本的情况,可以参考本申请下述实施例中文本为用户接收的文本的介绍,不予赘述。
用户的画像信息可以用于指示与用户相关的文本中的N个关键词,N为大于或等于1的整数,例如,用户的画像信息可以用于指示历史上的与用户相关的文本中,出现频率较高的N个词。又例如,用户的画像信息可以用于指示重要项目的名称。
用户的画像信息可以包括N个标签信息,N个标签信息对应指示N个关键词。例如,{tag1,tag2,…,tagN},或者,用户的画像信息可以包括N个标签信息以及N个标签信息中每个标签信息的权重,例如,{tag1,tag2,…,tagN}和{tagVal1,tagVal2,…,tagValN},其中,tagVal1为tag1的权重,tagVal2为tag2的权重……tagValN为tagN的权重。其中,标签信息可以包括一个或多个字符。
用户的画像信息可以是用户设置的或者是根据用户历史上发送或接收的文本得到的。
例如,获取用户历史上的重要本文,从该重要文本中提取出现频率较高的词,将出现频率较高的词作为标签信息,并根据每个标签信息的出现频率设置每个标签信息的权重,标签信息的出现频率越高,该标签信息的权重越大。
内容特征系数可以用于指示文本的内容的重要性。
内容特征系数可以包括N个系数,第n个系数可以根据文本和用户的画像信息中第n个标签信息得到。n为大于0且小于等于N的整数。
接收人的标识可以是接收人的用户名,或者接收人的ID。该接收人的ID可以包括数字和字母。
发送人的标识可以是发送人的用户名,或者发送人的ID。该发送人的ID可以包括数字和字母。
用户的关系信息可以包括用户的组织关系信息以及用户的沟通关系信息。
其中,用户的组织关系信息可以用于指示用户与组织中其他用户(以下简写为用户与其他用户)的层级关系。
可选的,用户的组织关系信息包括用户的上下级关系信息、用户的部门关系信息以及协同关系信息。
下面是用户的上下级关系信息的介绍。
用户的上下级关系信息可以用于指示用户与其他用户的上下级关系。用户与其他用户之间的上下级关系可以包括用户的上级、用户的同级、用户的下级以及不存在上下级关系等等。
一种可能的实现方式,用户的上下级关系信息包括用户与其他用户的上下级关系。
例如,用户1的上下级关系信息可以包括{用户1,用户2,上级};{用户1,用户3,同级};{用户1,用户4,下级};{用户1,用户5,不存在上下级关系}等等,其中,用户2为用户1的上级用户,用户3是用户1同级用户,用户4为用户1的下级用户,用户5为与用户1不存在上下级关系的用户。
另一种可能的实现方式,用户的上下级关系信息包括用户与其他用户的上下级关系的权重。上下级关系的权重可以用于表示用户与其他用户之间的上下级关系。
需要说明的是,用户与其他用户的上下级关系的权重可以包括:用户与上级用户的上下级关系的权重、用户与同级用户的上下级关系的权重、用户与下级用户的上下级关系的权重以及用户与不存在上下级关系的用户的上下级关系的权重。其中,用户与上级用户的上下级关系的权重大于用户与同级用户的上下级关系的权重,用户与同级用户的上下级关系的权重大于用户与下级用户的上下级关系的权重,用户与下级用户的上下级关系的权重大于用户与不存在上下级关系的用户的上下级关系的权重。
示例性的,以用户与上级用户的上下级关系的权重为X,用户与同级用户的上下级关系的权重为Y,用户与下级用户的上下级关系的权重为Z,用户1的上下级关系信息包括{用户1,用户2,X};{用户1,用户3,Y};{用户1,用户4,Z};{用户1,用户5,W}等等为例,则用户2为用户1的上级,X为用户1与用户2的上下级关系的权重,用户3是与用户1同级的用户,Y为用户1与用户3的上下级关系的权重,用户4为用户1的下级,Z为用户1与用户4的上下级关系的权重,用户5为与用户1不存在上下级关系的用户,W为用户1与用户5的上下级关系的权重,其中,X>Y>Z>W。X、Y、Z以及W为正数。
需要说明的是,用户与其他用户之间的上下级关系除了包括用户的上级、用户的同级以及用户的下级之外,还可以包括其他的上下级关系,例如,用户的上级的上级以及用户的下级的下级等,本申请实施例不予限制。
需要说明的是,用户的上下级关系信息除了上述例子中的形式外,还可以是其他的形式,例如列表形式,本申请实施例不予限制。
下面是用户的部门关系信息的介绍。
用户的部门关系信息可以用于指示用户与其他用户的最小单元组织。用户与其他用户的最小单元组织可以描述为用户与其他用户所在的相同组织中,用户数量最少的组织。
最小单元组织的类型可以包括:小组织、大组织以及第一组织等等,大组织可以包括多个小组织,第一组织可以包括多个大组织。例如,若用户1的最小单元组织为小组织1(即用户1所在的组织中,用户数量最少的组织为小组织1),用户2的最小单元组织为小组织1,用户3的最小单元组织为小组织2,小组织1和小组织2是大组织1中的组,则用户1和用户2的最小单元组织为小组织1,用户1与用户3的最小单元组织为大组织1,用户2与用户3的最小单元组织也为大组织1。
一种可能的实现方式,用户的部门关系信息包括用户与其他用户的最小单元组织。
例如,用户1的部门关系信息可以包括{用户1,用户2,小组织1};{用户1,用户3,小组织1};{用户1,用户4,大组织1}等等,其中,用户1与用户2的最小单元组织为小组织1,用户1与用户3的最小单元组织也为小组织1,用户1与用户4的最小单元组织为大组织1。
另一种可能的实现方式,用户的部门关系信息包括最小单元组织的权重。其中,最小单元组织的权重可以是用户与其他用户的最小单元组织的权重。最小单元组织的权重可以用于指示用户与其他用户的最小单元组织。
需要说明的是,最小单元组织的权重可以包括:小组织的权重、大组织的权重以及第一组织的权重。其中,小组织的权重大于大组织的权重,大组织的权重大于第一组织的权重。
示例性的,以小组织的权重为A,大组织的权重为B,第一组织的权重为C,用户1的部门关系信息包括{用户1,用户2,A};{用户1,用户3,B};{用户1,用户4,C}等等为例,则用户2为用户1所在的小组织的用户,A为用户1与用户2的最小单元组织的权重,用户3不是用户1所在的小组织的用户,但是用户3为用户1所在的大组织的用户,B为用户1与用户3的最小单元组织的权重,用户4不是用户1所在的小组织和大组织的用户,但是,用户4是用户1所在的第一组织的用户,C为用户1与用户4的最小单元组织的权重,其中,A>B>C。A、B以及C为正数。
需要说明的是,用户的部门关系信息除了上述例子中的形式外,还可以是其他的形式,例如列表形式,本申请实施例不予限制。
需要说明的是,最小单元组织的类型除了小组织、大组织以及第一组织之外,还可以包括其他类型,本申请实施例不予限制。
下面是协同关系信息的介绍。
协同关系信息可以用于指示用户与其他用户是否协同工作。
一种可能的实现方式,协同关系信息包括指示信息,其中,该指示信息用于指示用户与其他用户是否协同工作。
可选的,该指示信息可以是1比特指示信息。例如,指示信息为0时,可以指示用户与其他用户没有协同工作,指示信息为1时,可以指示用户与其他用户协同工作,反之亦然。
例如,用户1的协同关系信息可以包括{用户1,用户2,0};{用户1,用户3,1};{用户1,用户4,1}等等,其中,用户1与用户2的没有协同工作,用户1与用户3协同工作,用户1与用户4协同工作。
另一种可能的实现方式,协同关系信息包括协同关系权重,该协同关系权重可以是用户与其他用户的协同关系权重。用户与其他用户的协同关系权重可以用户指示用户与其他用户的协同关系。
其中一种情况,协同关系权重可以包括:用户与其他用户有协同关系时的协同关系权重,以及用户与其他用户没有协同关系时的协同关系权重。其中,用户与其他用户有协同关系时的协同关系权重,大于用户与其他用户没有协同关系时的协同关系权重。
示例性的,以用户与其他用户有协同关系时的协同关系权重为P,用户与其他用户没有协同关系时的协同关系权重为M为例,用户1的协同关系信息可以包括{用户1,用户2,P};{用户1,用户3,M};{用户1,用户4,M}等等,其中,用户1与用户2协同工作,用户1与用户3没有协同工作,用户1与用户4没有协同工作。P>M。P和M为正数。
其中另一种情况,协同关系权重可以包括:用户与其他用户没有协同关系时的协同关系权重、用户与其他用户在重要项目上有协同关系时的协同关系权重、以及用户与其他用户在非重要项目上有协同关系时的协同关系权重。其中,用户与其他用户在重要项目上有协同关系时的协同关系权重,大于用户与其他用户在非重要项目上有协同关系时的协同关系权重,用户与其他用户在非重要项目上有协同关系时的协同关系权重,大于用户与其他用户没有协同关系时的协同关系权重。
示例性的,以用户与其他用户没有协同关系时的协同关系权重为H,用户与其他用户在重要项目上有协同关系时的协同关系权重为I,用户与其他用户在非重要项目上有协同关系时的协同关系权重为J为例,用户1的协同关系信息可以包括{用户1,用户2,H};{用户1,用户3,I};{用户1,用户4,J}等等,其中,用户1与用户2没有协同工作,用户1与用户3在重要项目上协同工作,用户1与用户4在非重要项目上协同工作。I>J>H。I、J以及H为正数。
用户的沟通关系信息可以用于指示用户与其他用户的沟通频率。
一种可能的实现方式,用户的沟通关系信息包括沟通频率,其中,该沟通频率为用户与其他用户的沟通频率。例如,该用户1与用户2一天内发送或接收了20条信息,则用户1的沟通关系信息为20。
另一种可能的实现方,用户的沟通关系信息包括沟通频率的权重。其中,沟通频率的权重为用户与其他用户的沟通频率的权重。用户与其他用户的沟通频率的权重用于指示用户与其他用户的沟通频率。
可选的,沟通频率的权重和用户与其他用户的沟通频率成正相关,即用户与其他用户的沟通频率越高,沟通频率的权重越大,用户与其他用户的沟通频率越低,沟通频率的权重越小。
如表1所示,若用户与其他用户的沟通频率大于等于0次/天,并且小于等于10次/天,沟通频率的权重为R,若用户与其他用户的沟通频率大于等于11次/天,并且小于等于30次/天,沟通频率的权重为S,若用户与其他用户的沟通频率大于等于31次/天,沟通频率的权重为T,其中,T>S>R,T、S以及R为正数。
表1
Figure BDA0002223705860000371
Figure BDA0002223705860000381
关系特征系数可以用于指示用户与接收人和/或发送人的关系。
关系特征系数可以包括组织关系特征系数以及沟通关系特征系数。组织关系特征系数可以包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数。
若用户为发送人,该上下级关系特征系数可以包括用户与每个接收人的上下级关系特征系数,用户与每个接收人的上下级关系特征系数可以用于指示用户与每个接收人之间的上下级关系。该部门关系特征系数可以包括用户与每个接收人的部门关系特征系数,用户与每个接收人的部门关系特征系数可以用于指示用户与每个接收人的最小单元组织。协同关系特征系数可以包括用户与每个接收人的协同关系特征系数,用户与每个接收人的协同关系特征系数可以用于指示用户与每个接收人是否协同工作。沟通关系特征系数可以包括用户与每个接收人的沟通关系特征系数,用户与每个接收人的沟通关系特征系数可以用于指示用户与每个接收人的沟通频率。
若用户为唯一的接收人,该上下级关系特征系数可以包括用户与发送人的上下级关系特征系数,用户与发送人的上下级关系特征系数可以用于指示用户与发送人之间的上下级关系。该部门关系特征系数可以包括用户与发送人的部门关系特征系数,用户与发送人的部门关系特征系数可以用于指示用户与发送人的最小单元组织。协同关系特征系数可以包括用户与发送人的协同关系特征系数,用户与发送人的协同关系特征系数可以用于指示用户与发送人是否协同工作。沟通关系特征系数可以包括用户与发送人的沟通关系特征系数,用户与发送人的沟通关系特征系数可以用于指示用户与发送人的沟通频率。
若用户为多个接收人中的一个,该上下级关系特征系数可以包括用户与发送人的上下级关系特征系数,以及用户与除用户之外的接收人的上下级关系特征系数,用户与除用户之外的接收人的上下级关系特征系数可以用于指示用户与除用户之外的接收人之间的上下级关系。该部门关系特征系数可以包括用户与发送人的部门关系特征系数,以及用户与除用户之外的接收人的部门关系特征系数,用户与除用户之外的接收人的部门关系特征系数可以用于指示用户与除用户之外的接收人的最小单元组织。协同关系特征系数可以包括用户与发送人的协同关系特征系数,以及用户与除用户之外的接收人的协同关系特征系数,用户与除用户之外的接收人的协同关系特征系数可以用于指示用户与除用户之外的接收人是否协同工作。沟通关系特征系数可以包括用户与发送人的沟通关系特征系数,以及用户与除用户之外的接收人的沟通关系特征系数,用户与除用户之外的接收人的沟通关系特征系数可以用于指示用户与除用户之外的接收人的沟通频率。
本申请实施例提供的识别文本的装置,可以是一个设备内的一个功能模块。可以理解的是,上述功能既可以是硬件设备中的元件,例如手机中的芯片,也可以是在专用硬件上运行的软件功能,或者是平台(例如,云平台)上实例化的虚拟化功能。
例如,识别文本的装置可以通过图2中的硬件设备200来实现。图2所示为可适用于本申请实施例的硬件设备的硬件结构示意图。该硬件设备200包括至少一个处理器201,通信线路202,存储器203以及至少一个通信接口204。
处理器201可以是一个通用中央处理器(central processing unit,CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
通信线路202可包括一通路,在上述组件之间传送信息,例如总线。
通信接口204,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网接口,无线接入网接口(radio access network,RAN),无线局域网接口(wirelesslocal area networks,WLAN)等。
存储器203可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路202与处理器相连接。存储器也可以和处理器集成在一起。本申请实施例提供的存储器通常可以具有非易失性。其中,存储器203用于存储执行本申请方案所涉及的计算机执行指令,并由处理器201来控制执行。处理器201用于执行存储器203中存储的计算机执行指令,从而实现本申请实施例提供的方法。
可选的,本申请实施例中的计算机执行指令也可以称之为应用程序代码,本申请实施例对此不做具体限定。
在具体实现中,作为一种实施例,处理器201可以包括一个或多个CPU,例如图2中的CPU0和CPU1。
在具体实现中,作为一种实施例,硬件设备200可以包括多个处理器,例如图2中的处理器201和处理器207。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
在具体实现中,作为一种实施例,硬件设备200还可以包括输出设备205和输入设备206。输出设备205和处理器201通信,可以以多种方式来显示信息。例如,输出设备205可以是液晶显示器(liquid crystal display,LCD),发光二级管(light emitting diode,LED)显示设备,阴极射线管(cathode ray tube,CRT)显示设备,或投影仪(projector)等。输入设备206和处理器201通信,可以以多种方式接收用户的输入。例如,输入设备206可以是鼠标、键盘、触摸屏设备或传感设备等。
上述的硬件设备200可以是一个通用设备或者是一个专用设备。在具体实现中,硬件设备200可以是台式机、便携式电脑、掌上电脑(personal digital assistant,PDA)、移动手机、平板电脑、无线终端设备、嵌入式设备或有图2中类似结构的设备。本申请实施例不限定硬件设备200的类型。
下面以文本为用户接收的文本为例,对本申请实施例提供的识别文本的方法进行具体阐述。
需要说明的是,本申请下述实施例中的信息的名字或参数的名字等只是一个示例,具体实现中也可以是其他的名字,本申请实施例对此不做具体限定。
可以理解的,本申请实施例中,识别文本的装置可以执行本申请实施例中的部分或全部步骤,这些步骤仅是示例,本申请实施例还可以执行其它步骤或者各种步骤的变形。此外,各个步骤可以按照本申请实施例呈现的不同的顺序来执行,并且有可能并非要执行本申请实施例中的全部步骤。
实施例1:
用户接收文本后,识别文本的装置可以获取文本和用户的画像信息,根据文本和用户的画像信息得到内容特征系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容确定文本的重要性。如图3所示,该识别文本的方法可以包括步骤301-步骤303。
步骤301:获取文本和用户的画像信息。
其中,文本以及用户的画像信息的描述可以参考上述名词介绍,此处不予赘述。
可选的,获取文本和用户的画像信息,包括:从远端(例如,服务器)和/或本地获取文本和用户的画像信息。
该服务器可以与识别文本的装置连接,该服务器中存储有文本和/或用户的画像信息。
下面结合图2介绍获取文本和用户的画像信息的具体过程。
例如,若文本与用户的画像信息存储于存储器203中,处理器201调用接口从存储器203中获取文本和用户的画像信息。
又例如,若文本存储于存储器203中,用户的画像信息存储于服务器中,处理器201调用接口从存储器203中获取文本,处理器201通过通信接口204向服务发送请求,该请求包括用户的标识,服务器接收到该请求后,发送用户的画像信息,处理器201通过通信接口204接收该用户的画像信息。
需要说明的是,步骤301中可以用文本的内容替换文本。后续,可以根据文本的内容和用户的画像信息,得到内容特征系数。
步骤302:根据文本和用户的画像信息,得到内容特征系数。
其中,内容特征系数的描述可以参考上述名词解释,此处不予赘述。
可选的,内容特征系数与文本的重要性成正相关,即在其他特征系数不变的情况下,内容特征系数越大,文本的重要性越高。
步骤302的具体过程可以参考以下示例:
示例1:若用户的画像信息包括N个标签信息,可以根据用户的画像信息中标签信息在文本中出现的次数,确定内容特征系数。
例如,若用户的画像信息中第n个标签信息在文本中出现,则第n个标签信息对应的系数可以为1;若用户的画像信息中第n个标签信息未在文本中出现,则第n个标签信息对应的系数可以为0。
又例如,可以根据表2所示的对应关系确定内容特征系数。表2中,若用户的画像信息中第n个标签信息在文本中未出现,则第n个标签信息对应的系数可以为0;若用户的画像信息中第n个标签信息在文本中出现的次数大于等于1次且小于等于8次,则第n个标签信息对应的系数可以为1;若用户的画像信息中第n个标签信息在文本中出现的次数大于等于9次,则第n个标签信息对应的系数可以为2。
表2
标签信息在文本中出现的次数 该标签信息对应的系数
0次 0
1-8次 1
9次及以上 2
示例2:若用户的画像信息包括N个标签信息以及N个标签信息中每个标签信息的权重,可以根据用户的画像信息中标签信息在文本中出现的次数以及该标签信息的权重,确定内容特征系数。例如,可以根据用户的画像信息中第n个标签信息在文本中出现的次数,得到第n个标签信息的第一参数,将第n个标签信息的第一参数以及权重的乘积作为第n个标签信息对应的系数。
示例性的,以用户的画像信息包括{tag1,tag2,tag3}和{tagVal1,tagVal2,tagVal3},tag1和tag2未在文本中出现,tag3在文本中出现,若标签信息在文本中出现,则该标签信息的第一参数为1,若标签信息未在文本中出现,则该标签信息的第一参数为0为例,tag1和tag2的第一参数为0,tag3的第一参数为1,tag1和tag2对应的系数为0,tag3对应的系数为tagVal3,因此,内容特征系数为{0,0,tagVal3}。
示例3:若用户的画像信息包括N个标签信息,可以从文本中提取文本的关键词,获取文本的关键词与每个标签信息的相似度,将该相似度作为内容特征系数。
可选的,文本的关键词可以包括从文本中提取的单词和/或词组。例如,使用分词软件(例如,jieba软件、ansj软件或者HanLP软件等)从文本中提取的单词和/或词组。文本的关键词可以包括一个或多个单词和/或词组。
进一步可选的,文本的关键词包括标签信息或者标签信息的同义词(或近义词)。
文本的关键词与标签信息的相似度可以用于指示文本的关键词与标签信息的相似程度。文本的关键词与标签信息的相似度可以包括相同、不相同两种,也可以包括相同、不相同、相近三种。
示例性的,可以比较文本的关键词与标签信息,若二者包括的字符完全相同,则确定文本的关键词与标签信息相同;若二者包括的字符中不相同的字符的个数大于或等于第一预设阈值,则确定文本的关键词与标签信息不相同;若二者包括的字符中存在不同的字符,且不相同的字符的个数小于或等于第二预设阈值,则确定文本的关键词与标签信息相近。
示例性的,本申请实施例中,可以用0、1、2来表示文本的关键词与标签信息的相似度。例如,若文本的关键词与标签信息相同,则文本的关键词与该标签信息的相似度为1,该标签信息对应的系数为1;若文本的关键词与标签信息不相同,则文本的关键词与该标签信息的相似度为0,该标签信息对应的系数为0。本领域技术人员应该理解,文本的关键词与标签信息的相似度还可以通过其他方式或者字符来表示,不予限制。
示例4:若用户的画像信息包括N个标签信息以及N个标签信息中每个标签信息的权重,可以从文本中提取文本的关键词,获取文本的关键词与每个标签信息的相似度,将第n个相似度与该相似度对应的标签信息的权重做乘法运算,得到第n个第二参数,将第n个第二参数作为内容特征系数中第n个系数。
示例性的,以用户的画像信息包括{tag1,tag2,…,tagN}和{tagVal1,tagVal2,…,tagValN},文本的关键词与用户的画像信息中每个标签信息的相似度为{similarCoff1,similarCoff2,…,similarCoffN}(similarCoff1为文本的关键词与tag1的相似度,similarCoff2为文本的关键词与tag2的相似度,以此类推)为例,内容特征系数可以为{contentCoff1,contentCoff2,…,contentCoffN},其中,contentCoffn=similarCoffn*tagValn
进一步可选的,将第n个第二参数作为第一函数的参数,该第一函数的值作为内容特征系数中第n个系数,其中,该函数的导数大于且等于0。
示例性的,以用户的画像信息包括{tag1,tag2,…,tagN}和{tagVal1,tagVal2,…,tagValN},文本的关键词与用户的画像信息中每个标签信息的相似度为{similarCoff1,similarCoff2,…,similarCoffN}(similarCoff1为文本的关键词与tag1的相似度,similarCoff2为文本的关键词与tag2的相似度,以此类推)为例,内容特征系数可以为{contentCoff1,contentCoff2,…,contentCoffN},其中,contentCoffn=Function(x),Function(x)为x的函数,Function′(x)≥0,x=similarCoffn*tagValn
可选的,内容特征系数除了根据文本以及用户的画像信息得到,还可以根据文本、用户的画像信息以及第一用户行为反馈数据得到。
其中,第一用户行为反馈数据可以用于指示历史上与该文本内容相似度高的文本的重要性。第一用户行为反馈数据可以在步骤301中获取,也可以在步骤302之前获取。后续,可以根据第一用户行为反馈数据得到第一用户行为反馈数据的影响系数,在根据上述示例1-示例4所述的方法得到内容特征系数后,可以通过第一用户行为反馈数据的影响系数对内容特征系数进行修正,使得修正后的内容特征系数更准确。具体的,可以参考下述示例5中的描述。
示例5:可以根据第一用户行为反馈数据得到第一用户行为反馈数据的影响系数,将上述示例1-示例4所述的方法得到内容特征系数与第一用户行为反馈数据的影响系数做加减运算,得到更准确的内容特征系数。
其中,第一用户行为反馈数据的影响系数可以用于指示历史上与该文本内容相似度高的文本的重要性。
可选的,第一用户行为反馈数据的影响系数与文本的重要性成正相关,即在其他特征系数不变的情况下,第一用户行为反馈数据的影响系数越大,文本的重要性越高。
可选的,根据第一用户行为反馈数据得到第一用户行为反馈数据的影响系数,包括:获取第一对应关系,其中,该第一对应关系用于指示第一用户行为反馈数据的影响系数与第一用户行为反馈数据之间的关联关系;根据第一用户行为反馈数据,以及第一对应关系,确定第一用户行为反馈数据的影响系数。
其中,第一对应关系可以是预设置的,并存储在图2中的存储器203或服务器中。
可选的,获取第一对应关系,包括从图2中的存储器203或服务器中获取第一对应关系。
如表3所示,为第一用户行为反馈数据的影响系数与第一用户行为反馈数据的对应关系。表3中,若第一用户行为反馈数据指示历史上与该文本内容相似度高的文本为重要文本,则第一用户行为反馈数据的影响系数为a,若第一用户行为反馈数据指示历史上与该文本内容相似度高的文本为非重要文本,则第一用户行为反馈数据的影响系数为-a。
表3
Figure BDA0002223705860000421
示例性的,以通过上述示例1-示例4所述的方法得到内容特征系数为{contentCoff1,contentCoff2,…,contentCoffN},第一用户行为反馈数据的影响系数与第一用户行为反馈数据的对应关系如表3所示为例,若第一用户行为反馈数据指示历史上与该文本内容相似度高的文本为重要文本,则第一用户行为反馈数据的影响系数为a,考虑了第一用户行为反馈数据的影响系数后的新的内容特征系数为{contentCoff1+a,contentCoff2+a,…,contentCoffN+a}。
步骤303:根据内容特征系数确定文本的重要性。
一种可能的实现方式,根据内容特征系数确定文本的重要性,包括:以内容特征系数作为机器学习方法的输入数据,通过机器学习方法确定文本的重要性。
其中,文本的重要性可以有多种形式,例如,重要文本和非重要文本。又例如,一级重要文本、二级重要文本、三级重要文本以及非重要文本,其中,一级重要文本的重要性大于二级重要文本的重要性,二级重要文本的重要性大于三级重要文本的重要性,三级重要文本的重要性大于非重要文本的重要性。
其中,机器学习方法可以包括传统的机器学习方法以及深度学习方法。
传统的机器学习方法可以包括:线性判别分析(linear discriminant analysis,LDA)、支持向量机(support vector machine,SVM)以及增强学习方法(adboost)等等。
深度学习方法可以包括:深度神经网络(deep neural networks,DNN)、卷积神经网络(convolutional neural networks,CNN)以及循环神经网络(recurrent neuralnetworks,RNN)等等。
可选的,当重要性相同的文本有多个时(例如,一级重要文本有多个时),根据内容特征系数确定文本的重要性之后还包括:将内容特征系数中的N个系数全部或部分做加法运算得到文本的重要性系数;根据文本的重要性系数对用户接收或发送的文本进行排序。
可选的,将内容特征系数中的N个系数全部或部分做加法运算得到文本的重要性系数,包括:根据公式textImportantCoff=contentCoff1+contentCoff2+…+contentCoffN计算文本的重要性系数。其中,textImportantCoff为文本的重要性系数,contentCoff1、contentCoff2、…、contentCoffN为内容特征系数。
另一种可能的实现方式,根据内容特征系数确定文本的重要性,包括:将内容特征系数中的N个系数全部或部分做加法运算得到文本的重要性系数;根据文本的重要性系数确定文本的重要性。
将内容特征系数中的N个系数全部或部分做加法运算得到文本的重要性系数可以包括:根据公式textImportantCoff=contentCoff1+contentCoff2+…+contentCoffN计算文本的重要性系数。
可选的,根据文本的重要性系数确定文本的重要性,包括:若文本的重要性系数大于或等于第一阈值,则确定该文本为重要文本;或者,根据文本的重要性系数与文本的重要性的对应关系,确定文本的重要性。
如表4所示,为文本的重要性系数与文本的重要性的对应关系。表4中,若文本的重要性系数大于或等于9,则文本的重要性为一级重要文本,若文本的重要性系数为6-8,则文本的重要性为二级重要文本,若文本的重要性系数为2-5,则文本的重要性为三级重要文本,若文本的重要性系数维0-1,则文本的重要性为非重要文本。
表4
文本的重要性系数 文本的重要性
大于或等于9 一级重要文本
6-8 二级重要文本
2-5 三级重要文本
0-1 非重要文本
需要说明的是,表4仅是文本的重要性系数与文本的重要性的对应关系的示例,在实际应用中,文本的重要性系数与文本的重要性的对应关系还可以是其他形式,而且文本的重要性系数与文本的重要性的对应关系可以为上述表1中的某一行、某些行、表1中的全部、或者比表1示出的更多的对应关系,本申请不进行具体限制。
进一步可选的,当重要性相同的文本有多个时,根据内容特征系数确定文本的重要性之后还包括:根据文本的重要性系数对用户接收或发送的文本进行排序。
可选的,在根据内容特征系数确定文本的重要性之后,将文本按照文本的重要性分类显示。例如,图2中的处理器201可以通过调用接口将文本按照文本的重要性分类显示在输出设备205中(例如,将重要文本显示在非重要文本的前面)。
可选的,若用户更换设备,可以通过以下两种方法将旧设备中的文本的重要性传输到新设备中:
方法1:通过显示指令,从旧设备的数据存储区中提取文本的标识、文本的重要性和/或文本的重要性系数,进行加密,将加密后的文本的标识、文本的重要性和/或文本的重要性系数通过网络安全传输方式传输到服务器,新设备可以通过显示指令从服务器上下载加密后的文本的标识、文本的重要性和/或文本的重要性系数。
方式2:通过直接拷贝的方式将旧设备中的文本的标识、文本的重要性和/或文本的重要性系数拷贝到新设备中。
基于图3所示的方法,可以获取文本和用户的画像信息,根据文本和用户的画像信息得到内容特征系数,并根据内容特征系数确定文本的重要性,从而可以根据文本的内容确定文本的重要性。
实施例2:
用户接收文本后,可以获取接收人的标识和/或发送人的标识,以及用户的关系信息,根据接收人的标识和/或发送人的标识,以及用户的关系信息得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与接收人和/或发送人的关系确定文本的重要性。如图4所示,该识别文本的方法可以包括步骤401-步骤403。
步骤401:获取接收人的标识和/或发送人的标识,以及用户的关系信息。
其中,接收人的标识和/或发送人的标识,以及用户的关系信息的描述可以参考上述名词介绍,此处不予赘述。
可选的,获取接收人的标识和/或发送人的标识,以及用户的关系信息,包括:从远端(例如:服务器)和/或从本地获取接收人的标识和/或发送人的标识,以及用户的关系信息。
该服务器可以与该识别文本的装置连接,该服务器中存储有接收人的标识和/或发送人的标识,和/或用户的关系信息。
下面结合图2介绍获取接收人的标识和/或发送人的标识,以及用户的关系信息。
例如,若文本与用户的关系信息存储于存储器203中,处理器201调用接口从存储器203中获取接收人的标识和/或发送人的标识,以及用户的关系信息。
又例如,若文本存储于存储器203中,用户的关系信息存储于服务器中,处理器201调用接口从存储器203中获取接收人的标识和/或发送人的标识,处理器201通过通信接口204向服务发送请求,该请求包括用户的标识,服务器接收到该请求后,发送用户的关系信息,处理器201通过通信接口204接收该用户的关系信息。
可选的,若用户为发送人,获取接收人的标识以及用户的关系信息;若用户为文本的唯一接收人,获取发送人的标识以及用户的关系信息;若用户为多个接收人中的一个,获取接收人的标识、发送人的标识,以及用户的关系信息。
需要说明的是,未有人员变动的时候,用户的关系信息一般是固定不变的,因此,可以在第一次发送或接收文本时,获取该用户的关系信息,后续,在接收或发送新文本时,不需要再次获取用户的关系信息,仅获取接收人的标识和/或发送人的标识。后续,当有人员变动的时候(例如,有人升职或离职等等),管理员将该变动更新到本地或服务器后,可以向识别文本的装置发送通知消息,该识别文本的装置接收到该通知消息后再次获取用户的关系信息。
步骤402:根据接收人的标识和/或发送人的标识,以及用户的关系信息,得到关系特征系数。
可选的,关系特征系数与文本的重要性成正相关,即在其他特征系数不变的情况下,关系特征系数越大,文本的重要性越高。
用户的关系信息可以包括用户的组织关系信息以及用户的沟通关系信息。其中,用户的组织关系信息包括用户的上下级关系信息、用户的部门关系信息以及协同关系信息。用户的上下级关系信息、用户的部门关系信息、协同关系信息用户的沟通关系信息的描述可以参考上述名词介绍,不予赘述。
关系特征系数包括:组织关系特征系数以及沟通关系特征系数。其中,组织关系特征系数可以包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数。上下级关系特征系数、部门关系特征系数、协同关系特征系数以及沟通关系特征系数的描述可以参考上述名词介绍,不予赘述。
其中,组织关系特征系数可以根据用户的组织关系信息得到。沟通关系特征系数可以根据用户的沟通关系信息得到。
可选的,组织关系特征系数可以根据用户的组织关系信息得到,包括:根据用户的上下级关系信息得到上下级关系特征系数,根据用户的部门关系信息得到部门关系特征系数,根据协同关系信息得到协同关系特征系数。
根据用户的上下级关系信息得到上下级关系特征系数可以有以下4种情况:
情况1:用户为唯一的接收人,用户的上下级关系信息包括用户与其他用户的上下级关系。
若用户为唯一的接收人,上下级关系特征系数可以包括用户与发送人的上下级关系特征系数。根据用户的上下级关系信息得到上下级关系特征系数,包括:从用户与其他用户的上下级关系中获取用户与发送人的上下级关系,根据用户与发送人的上下级关系,得到用户与发送人的上下级关系特征系数。
一种可能的实现方式,根据用户与发送人的上下级关系,得到用户与发送人的上下级关系特征系数,包括:根据用户与发送人的上下级关系,按照上下级关系特征系数的设置规则确定用户与发送人的上下级关系特征系数。
其中,上下级关系特征系数的设置规则可以如下所示:用户与上级用户的上下级关系特征系数大于用户与同级用户的上下级关系特征系数,用户与同级用户的上下级关系特征系数大于用户与下级用户的上下级关系特征系数,用户与下级用户的上下级关系特征系数大于用户与不存在上下级关系的用户的上下级关系特征系数。
示例性的,以用户1的上下级关系信息包括{用户1,用户2,上级};{用户1,用户3,同级};{用户1,用户4,下级};{用户1,用户5,不存在上下级关系},用户与用户的上级用户的上下级关系特征系数为6,用户与用户的同级用户的上下级关系特征系数为4,用户与用户的下级用户的上下级关系特征系数为2,用户不存在上下级关系的用户与用户的上下级关系特征系数为0.01为例,若发送人的标识为用户2,则用户与发送人的上下级关系特征系数可以是6;若发送人的标识为用户3,则用户与发送人的上下级关系特征系数可以是4;若发送人的标识为用户4,则用户与发送人的上下级关系特征系数可以是2;若发送人的标识为用户5,则用户与发送人的上下级关系特征系数可以是0.01。
情况2:用户为唯一的接收人,用户的上下级关系信息可以包括用户与其他用户的上下级关系的权重。
若用户为唯一的接收人,上下级关系特征系数可以包括用户与发送人的上下级关系特征系数。根据用户的上下级关系信息得到上下级关系特征系数,包括:从用户与其他用户的上下级关系的权重中获取用户与发送人的上下级关系的权重,根据用户与发送人的上下级关系的权重,得到用户与发送人的上下级关系特征系数。
一种可能的实现方式,根据用户与发送人的上下级关系的权重,得到用户与发送人的上下级关系特征系数,包括:将用户与发送人的上下级关系的权重作为用户与发送人的上下级关系特征系数。
示例性的,以用户1的上下级关系信息包括{用户1,用户2,X};{用户1,用户3,Y};{用户1,用户4,Z};{用户1,用户5,W},其中,X为用户1与用户2的上下级关系的权重,Y为用户1与用户3的上下级关系的权重,Z为用户1与用户4的上下级关系的权重,W为用户1与用户5的上下级关系的权重为例,若发送人的标识为用户2,则用户与发送人的上下级关系特征系数可以是X;若发送人的标识为用户3,则用户与发送人的上下级关系特征系数可以是Y;若发送人的标识为用户4,则用户与发送人的上下级关系特征系数可以是Z;若发送人的标识为用户5,则用户与发送人的上下级关系特征系数可以是W。
需要说明的是,除了将用户与发送人的上下级关系的权重作为用户与发送人的上下级关系特征系数之外,还可以将用户与发送人的上下级关系的权重进行处理(例如,加一个数或者减一个数等),并将处理后的数据作为用户与发送人的上下级关系特征系数。其中,处理后的数据应满足上述上下级关系特征系数的设置规则。
情况3:用户为多个接收人中的一个,用户的上下级关系信息可以包括用户与其他用户的上下级关系。
若用户为多个接收人中的一个,上下级关系特征系数包括用户与发送人的上下级关系特征系数,以及用户与除用户之外的接收人的上下级关系特征系数。根据用户的上下级关系信息得到上下级关系特征系数,包括:从用户与其他用户的上下级关系中获取用户与发送人的上下级关系,以及用户与除用户之外的接收人的上下级关系,根据用户与发送人的上下级关系,得到用户与发送人的上下级关系特征系数,根据用户与除用户之外的接收人的上下级关系,得到用户与除用户之外的接收人的上下级关系特征系数。
其中,根据用户与发送人的上下级关系,得到用户与发送人的上下级关系特征系数的具体描述可以参考上述情况1中的介绍,不予赘述。
其中,根据用户与除用户之外的接收人的上下级关系,得到用户与除用户之外的接收人的上下级关系特征系数的具体描述可以参考上述情况1中,对根据用户与发送人的上下级关系,得到用户与发送人的上下级关系特征系数的介绍,不予赘述。
情况4:用户为多个接收人中的一个,用户的上下级关系信息可以包括用户与其他用户的上下级关系的权重。
若用户为多个接收人中的一个,上下级关系特征系数包括用户与发送人的上下级关系特征系数,以及用户与除用户之外的接收人的上下级关系特征系数。根据用户的上下级关系信息得到上下级关系特征系数,包括:从用户与其他用户的上下级关系的权重中获取用户与发送人的上下级关系的权重,以及用户与除用户之外的接收人的上下级关系的权重,根据用户与发送人的上下级关系的权重,得到用户与发送人的上下级关系特征系数,根据用户与除用户之外的接收人的上下级关系的权重,得到用户与除用户之外的接收人的上下级关系特征系数。
其中,根据用户与发送人的上下级关系的权重,得到用户与发送人的上下级关系特征系数的具体描述可以参考上述情况2中的介绍,不予赘述。
其中,根据用户与除用户之外的接收人的上下级关系的权重,得到用户与除用户之外的接收人的上下级关系特征系数的具体描述可以参考上述情况2中,对根据用户与发送人的上下级关系的权重,得到用户与发送人的上下级关系特征系数的介绍,不予赘述。
根据用户的部门关系信息得到部门关系特征系数可以有以下4种情况:
情况5:用户为唯一的接收人,用户的部门关系信息包括用户与其他用户的最小单元组织。
若用户为唯一的接收人,部门关系特征系数包括用户与发送人的部门关系特征系数。根据用户的部门关系信息得到部门关系特征系数,包括:从用户与其他用户的最小单元组织中获取用户与发送人的最小单元组织,根据用户与发送人的最小单元组织,得到用户与发送人的部门关系特征系数。
一种可能的实现方式,根据用户与发送人的最小单元组织,得到用户与发送人的部门关系特征系数,包括:根据用户与发送人的最小单元组织,按照部门关系特征系数的设置规则确定用户与发送人的部门关系特征系数。
其中,部门关系特征系数的设置规则可以如下所示:小组织中的用户的部门关系特征系数大于大组织中的用户的部门关系特征系数,大组织中的用户的部门关系特征系数大于第一组织中的用户的部门关系特征系数。
示例性的,以用户1的部门关系信息包括{用户1,用户2,小组织1};{用户1,用户3,小组织1};{用户1,用户4,大组织1},小组织中的用户的部门关系特征系数为5,大组织中的用户的部门关系特征系数为2,第一组织中的用户的部门关系特征系数为0.01为例,若发送人的标识为用户2,则用户与发送人的部门关系特征系数可以是5;若发送人的标识为用户3,则用户与发送人的部门关系特征系数可以是2;若发送人的标识为用户4,则用户与发送人的部门关系特征系数可以是0.01。
情况6:用户为唯一的接收人,用户的部门关系信息包括用户与其他用户的最小单元组织的权重。
若用户为唯一的接收人,部门关系特征系数包括用户与发送人的部门关系特征系数。根据用户的部门关系信息得到部门关系特征系数,包括:从用户与其他用户的最小单元组织的权重中获取用户与发送人的最小单元组织的权重,根据用户与发送人的最小单元组织的权重,得到用户与发送人的部门关系特征系数。
一种可能的实现方式,根据用户与发送人的最小单元组织的权重,得到用户与发送人的部门关系特征系数,包括:将用户与发送人的最小单元组织的权重作为用户与发送人的部门关系特征系数。
示例性的,以用户1的部门关系信息包括{用户1,用户2,A};{用户1,用户3,B};{用户1,用户4,C},其中,A为用户1与用户2的最小单元组织的权重,B为用户1与用户3的最小单元组织的权重,C为用户1与用户4的最小单元组织的权重为例,若发送人的标识为用户2,则用户与发送人的部门关系特征系数可以是A;若发送人的标识为用户3,则用户与发送人的部门关系特征系数可以是B;若发送人的标识为用户4,则用户与发送人的部门关系特征系数可以是C。
需要说明的是,除了将用户与发送人的最小单元组织的权重作为用户与发送人的部门关系特征系数之外,还可以将用户与发送人的最小单元组织的权重进行处理(例如,加一个数或者减一个数等),并将处理后的数据作为用户与发送人的部门关系特征系数。其中,处理后的数据应满足上述部门关系特征系数的设置规则。
情况7:用户为多个接收人中的一个,用户的部门关系信息包括用户与其他用户的最小单元组织。
若用户为多个接收人中的一个,部门关系特征系数包括用户与发送人的部门关系特征系数,以及用户与除用户之外的接收人的部门关系特征系数。根据用户的部门关系信息得到部门关系特征系数,包括:从用户与其他用户的最小单元组织中获取用户与发送人的最小单元组织,以及用户与除用户之外的接收人的最小单元组织,根据用户与发送人的最小单元组织,得到用户与发送人的部门关系特征系数,根据用户与除用户之外的接收人的最小单元组织,得到用户与除用户之外的接收人的部门关系特征系数。
其中,根据用户与发送人的最小单元组织,得到用户与发送人的部门关系特征系数的具体描述可以参考上述情况5中的介绍,不予赘述。
其中,根据用户与除用户之外的接收人的最小单元组织,得到用户与除用户之外的接收人的部门关系特征系数的具体描述可以参考上述情况5中,对根据用户与发送人的最小单元组织,得到用户与发送人的部门关系特征系数的介绍,不予赘述。
情况8:用户为多个接收人中的一个,用户的部门关系信息包括用户与其他用户的最小单元组织的权重。
若用户为多个接收人中的一个,部门关系特征系数包括用户与发送人的部门关系特征系数,以及用户与除用户之外的接收人的部门关系特征系数。根据用户的部门关系信息得到部门关系特征系数,包括:从用户与其他用户的最小单元组织的权重中获取用户与发送人的最小单元组织的权重,以及用户与除用户之外的接收人的最小单元组织的权重,根据用户与发送人的最小单元组织的权重,得到用户与发送人的部门关系特征系数,根据用户与除用户之外的接收人的最小单元组织的权重,得到用户与除用户之外的接收人的部门关系特征系数。
其中,根据用户与发送人的最小单元组织的权重,得到用户与发送人的部门关系特征系数的具体描述可以参考上述情况6中的介绍,不予赘述。
其中,根据用户与除用户之外的接收人的最小单元组织的权重,得到用户与除用户之外的接收人的部门关系特征系数的具体描述可以参考上述情况6中,对根据用户与发送人的最小单元组织的权重,得到用户与发送人的部门关系特征系数的介绍,不予赘述。
根据协同关系信息得到协同关系特征系数可以有以下4种情况:
情况9:用户为唯一的接收人,协同关系信息包括指示用户与其他用户是否有协同工作的指示信息。
若用户为唯一的接收人,协同关系特征系数包括用户与发送人的协同关系特征系数。根据协同关系信息得到协同关系特征系数,包括:从指示用户与其他用户是否有协同工作的指示信息中获取指示用户与发送人是否有协同工作的指示信息,根据指示用户与发送人是否有协同工作的指示信息,得到用户与发送人的协同关系特征系数。
一种可能的实现方式,根据指示用户与发送人是否有协同工作的指示信息,得到用户与发送人的协同关系特征系数,包括:根据指示用户与发送人是否有协同工作的指示信息,按照协同关系特征系数的设置规则确定用户与发送人的协同关系特征系数。
其中,若协同关系特征系数包括:用户与其他用户有协同关系时的协同关系特征系数,以及用户与其他用户没有协同关系时的协同关系特征系数,协同关系特征系数的设置规则可以如下所示:用户与其他用户有协同关系时的协同关系特征系数,大于用户与其他用户没有协同关系时的协同关系特征系数。若协同关系特征系数包括:用户与其他用户没有协同关系时的协同关系特征系数、用户与其他用户在重要项目上有协同关系时的协同关系特征系数、以及用户与其他用户在非重要项目上有协同关系时的协同关系特征系数,协同关系特征系数的设置规则可以如下所示:用户与其他用户在重要项目上有协同关系时的协同关系特征系数,大于用户与其他用户在非重要项目上有协同关系时的协同关系特征系数,用户与其他用户在非重要项目上有协同关系时的协同关系特征系数,大于用户与其他用户没有协同关系时的协同关系特征系数。
示例性的,以用户1的协同关系信息包括{用户1,用户2,0};{用户1,用户3,1};{用户1,用户4,1},0指示用户与其他用户没有协同工作,1指示用户与其他用户协同工作,用户与其他用户有协同关系时的协同关系特征系数为4,用户与其他用户没有协同关系时的协同关系特征系数为0.01为例,若发送人的标识为用户2,则用户与发送人的协同关系特征系数可以是0.01;若发送人的标识为用户3,则用户与发送人的协同关系特征系数可以是4;若发送人的标识为用户4,则用户与发送人的协同关系特征系数可以是4。
情况10:用户为唯一的接收人,协同关系信息包括用户与其他用户的协同关系权重。
若用户为唯一的接收人,协同关系特征系数包括用户与发送人的协同关系特征系数。根据协同关系信息得到协同关系特征系数,包括:从用户与其他用户的协同关系权重中获取指示用户与发送人的协同关系权重,根据用户与发送人的协同关系权重,得到用户与发送人的协同关系特征系数。
一种可能的实现方式,根据用户与发送人的协同关系权重,得到用户与发送人的协同关系特征系数,包括:将用户与发送人的协同关系权重作为用户与发送人的协同关系特征系数。
示例性的,用户1的协同关系信息可以包括{用户1,用户2,P};{用户1,用户3,M},其中,P为用户1与用户2的协同关系权重,M为用户1与用户3的协同关系权重为例,若发送人的标识为用户2,则用户与发送人的协同关系特征系数可以是P;若发送人的标识为用户3,则用户与发送人的协同关系特征系数可以是M。
需要说明的是,除了将用户与发送人的协同关系权重作为用户与发送人的协同关系特征系数之外,还可以将用户与发送人协同关系权重进行处理(例如,加一个数或者减一个数等),并将处理后的数据作为用户与发送人的协同关系特征系数。其中,处理后的数据应满足上述协同关系特征系数的设置规则。
情况11:用户为多个接收人中的一个,协同关系信息包括指示用户与其他用户是否有协同工作的指示信息。
若用户为多个接收人中的一个,协同关系特征系数包括用户与发送人的协同关系特征系数,以及用户与除用户之外的接收人的协同关系特征系数。根据用户的协同关系信息得到协同关系特征系数,包括:从指示用户与其他用户是否有协同工作的指示信息中获取指示用户与发送人是否有协同工作的指示信息,以及指示用户与除用户之外的接收人是否有协同工作的指示信息,根据指示用户与发送人是否有协同工作的指示信息,得到用户与发送人的协同关系特征系数,根据指示用户与除用户之外的接收人是否有协同工作的指示信息,得到用户与除用户之外的接收人的协同关系特征系数。
其中,根据指示用户与发送人是否有协同工作的指示信息,得到用户与发送人的协同关系特征系数的具体描述可以参考上述情况9中的介绍,不予赘述。
其中,根据指示用户与除用户之外的接收人是否有协同工作的指示信息,得到用户与除用户之外的接收人的协同关系特征系数的具体描述可以参考上述情况9中,对根据指示用户与发送人是否有协同工作的指示信息,得到用户与发送人的协同关系特征系数的介绍,不予赘述。
情况12:用户为多个接收人中的一个,协同关系信息包括用户与其他用户的协同关系权重。
若用户为多个接收人中的一个,协同关系特征系数包括用户与发送人的协同关系特征系数,以及用户与除用户之外的接收人的协同关系特征系数。根据用户的协同关系信息得到协同关系特征系数,包括:从用户与其他用户的协同关系权重中获取用户与发送人的协同关系权重,以及用户与除用户之外的接收人的协同关系权重,根据用户与发送人的协同关系权重,得到用户与发送人的协同关系特征系数,根据用户与除用户之外的接收人的协同关系权重,得到用户与除用户之外的接收人的协同关系特征系数。
其中,根据用户与发送人的协同关系权重,得到用户与发送人的协同关系特征系数的具体描述可以参考上述情况10中的介绍,不予赘述。
其中,根据用户与除用户之外的接收人的协同关系权重,得到用户与除用户之外的接收人的协同关系特征系数的具体描述可以参考上述情况10中,对根据用户与发送人的协同关系权重,得到用户与发送人的协同关系特征系数的介绍,不予赘述。
沟通关系特征系数是根据用户的沟通关系信息得到的可以有以下4种情况:
情况13:用户为唯一的接收人,用户的沟通关系信息用于指示用户与其他用户的沟通频率。
若用户为唯一的接收人,沟通关系特征系数包括用户与发送人的沟通关系特征系数。沟通关系特征系数是根据用户的沟通关系信息得到,包括:从用户的沟通关系信息中获取用户与发送人的沟通频率,根据用户与发送人的沟通频率,得到用户与发送人的沟通关系特征系数。
一种可能的实现方式,根据用户与发送人的沟通频率,得到用户与发送人的沟通关系特征系数,包括:根据用户与发送人的沟通频率,按照沟通关系特征系数的设置规则确定用户与发送人的沟通关系特征系数。
其中,沟通关系特征系数的设置规则可以是:沟通关系特征系数和用户与发送人的沟通频率成正相关,即用户与发送人的沟通频率越大,则沟通关系特征系数越大。
示例性的,可以将用户与发送人的沟通频率作为沟通关系特征系数。以用户1的用户的沟通关系信息包括{用户1,用户2,50};{用户1,用户3,30};{用户1,用户4,10},50表示用户1与用户2的沟通频率为一天50次,30表示用户1与用户3的沟通频率为一天30次,10表示用户1与用户4的沟通频率为一天10次为例,若发送人的标识为用户2,则用户与发送人的沟通关系特征系数可以是50;若发送人的标识为用户3,则用户与发送人的沟通关系特征系数可以是30;若发送人的标识为用户4,则用户与发送人的沟通关系特征系数可以是10。
示例性的,用户与发送人的沟通频率与沟通关系特征系数存在对应关系,可以根据该对应关系确定沟通关系特征系数。例如,用户与发送人的沟通频率与沟通关系特征系数的对应关系如表5所示。表5中,用户与发送人的沟通频率为一天0-10次,则沟通关系特征系数为1,用户与发送人的沟通频率为一天11-30次,则沟通关系特征系数为2,用户与发送人的沟通频率为一天31-50次,则沟通关系特征系数为3,用户与发送人的沟通频率为一天50次以上,则沟通关系特征系数为4。以用户1的用户的沟通关系信息包括{用户1,用户2,50};{用户1,用户3,30};{用户1,用户4,10},50表示用户1与用户2的沟通频率为一天50次,30表示用户1与用户3的沟通频率为一天30次,10表示用户1与用户4的沟通频率为一天10次为例,若发送人的标识为用户2,则用户与发送人的沟通关系特征系数可以是3;若发送人的标识为用户3,则用户与发送人的沟通关系特征系数可以是30;若发送人的标识为用户2,则用户与发送人的沟通关系特征系数可以是1。
表5
用户与发送人的沟通频率(次/天) 沟通关系特征系数
0-10 1
11-30 2
31-50 3
51以上 4
需要说明的是,表5仅是用户与发送人的沟通频率与沟通关系特征系数的对应关系的示例,在实际应用中,用户与发送人的沟通频率与沟通关系特征系数的对应关系还可以是其他形式,而且用户与发送人的沟通频率与沟通关系特征系数的对应关系可以是表5中的某一行、某些行、表5中的全部、或者比表5示出的更多的对应关系,本申请不进行具体限定。
需要说明的是,除了上述确定用户与发送人的沟通关系特征系数的方法之外,还可以将用户与发送人的沟通频率进行处理(例如,加一个数或者减一个数等),并将处理后的数据作为用户与发送人的沟通关系特征系数。其中,处理后的数据应满足上述沟通关系特征系数的设置规则。
情况14:用户为唯一的接收人,用户的沟通关系信息包括沟通频率的权重。
若用户为唯一的接收人,沟通关系特征系数包括用户与发送人的沟通关系特征系数。沟通关系特征系数是根据用户的沟通关系信息得到,包括:从用户的沟通关系信息中获取用户与发送人的沟通频率的权重,根据用户与发送人的沟通频率的权重,得到用户与发送人的沟通关系特征系数。
一种可能的实现方式,根据用户与发送人的沟通频率的权重,得到用户与发送人的沟通关系特征系数,包括:将用户与发送人的沟通关系权重作为用户与发送人的沟通关系特征系数。
示例性的,用户1的沟通关系信息可以包括{用户1,用户2,R};{用户1,用户3,S},其中,R为用户1与用户2的沟通关系权重,S为用户1与用户3的沟通关系权重为例,若发送人的标识为用户2,则用户与发送人的沟通关系特征系数可以是R;若发送人的标识为用户3,则用户与发送人的沟通关系特征系数可以是S。
需要说明的是,除了将用户与发送人的沟通关系权重作为用户与发送人的沟通关系特征系数之外,还可以将用户与发送人沟通关系权重进行处理(例如,加一个数或者减一个数等),并将处理后的数据作为用户与发送人的沟通关系特征系数。其中,处理后的数据应满足上述沟通关系特征系数的设置规则。
情况15:用户为多个接收人中的一个,用户的沟通关系信息用于指示用户与其他用户的沟通频率。
若用户为多个接收人中的一个,沟通关系特征系数包括用户与发送人的沟通关系特征系数,以及用户与除用户之外的接收人的沟通关系特征系数。沟通关系特征系数是根据用户的沟通关系信息得到,包括:从用户的沟通关系信息中获取用户与发送人的沟通频率,以及用户与除用户之外的接收人的沟通频率,根据用户与发送人的沟通频率,得到用户与发送人的沟通关系特征系数,根据用户与除用户之外的接收人的沟通频率,得到用户与除用户之外的接收人的沟通关系特征系数。
其中,根据用户与发送人的沟通频率,得到用户与发送人的沟通关系特征系数的具体描述可以参考上述情况13中的介绍,不予赘述。
其中,根据用户与除用户之外的接收人的沟通频率,得到用户与除用户之外的接收人的沟通关系特征系数的具体描述可以参考上述情况13中,对根据用户与发送人的沟通频率,得到用户与发送人的沟通关系特征系数的介绍,不予赘述。
情况16:用户为多个接收人中的一个,用户的沟通关系信息包括沟通频率的权重。
若用户为多个接收人中的一个,沟通关系特征系数包括用户与发送人的沟通关系特征系数,以及用户与除用户之外的接收人的沟通关系特征系数。沟通关系特征系数是根据用户的沟通关系信息得到,包括:从用户的沟通关系信息中获取用户与发送人的沟通频率的权重,以及用户与除用户之外的接收人的沟通频率的权重,根据用户与发送人的沟通频率的权重,得到用户与发送人的沟通关系特征系数,根据用户与除用户之外的接收人的沟通频率的权重,得到用户与除用户之外的接收人的沟通关系特征系数。
其中,根据用户与发送人的沟通频率的权重,得到用户与发送人的沟通关系特征系数的具体描述可以参考上述情况14中的介绍,不予赘述。
其中,根据用户与除用户之外的接收人的沟通频率的权重,得到用户与除用户之外的接收人的沟通关系特征系数的具体描述可以参考上述情况14中,对根据用户与发送人的沟通频率的权重,得到用户与发送人的沟通关系特征系数的介绍,不予赘述。
关系特征系数除了根据接收人的标识和/或发送人的标识,以及用户的关系信息得到,还可以根据接收人的标识和/或发送人的标识、用户的关系信息以及第二用户行为反馈数据得到。
其中,第二用户行为反馈数据可以用于指示历史上与该文本的发送人相同的文本的重要性,和/或,历史上与该文本的接收人相同的文本的重要性。后续,可以根据第二用户行为反馈数据得到第二用户行为反馈数据的影响系数,在根据上述情况1-情况16所述的方法得到关系特征系数后,可以通过第二用户行为反馈数据的影响系数对关系特征系数中的一个或多个系数进行修正,使得修正后的关系特征系数更准确。
可选的,根据第二用户行为反馈数据得到第二用户行为反馈数据的影响系数,将上述情况1-情况16所述的方法得到关系特征系数中的一个或多个系数与第二用户行为反馈数据的影响系数做加减运算,得到更准确的关系特征系数。
其中,第二用户行为反馈数据的影响系数可以用于指示历史上与该文本的发送人相同的文本的重要性,和/或,历史上与该文本的接收人相同的文本的重要性。
可选的,第二用户行为反馈数据的影响系数与文本的重要性成正相关,即在其他特征系数不变的情况下,第二用户行为反馈数据的影响系数越大,文本的重要性越高。
可选的,根据第二用户行为反馈数据得到第二用户行为反馈数据的影响系数,包括:获取第二对应关系,第二对应关系为第二用户行为反馈数据的影响系数与第二用户行为反馈数据之间的关联关系,根据第二用户行为反馈数据以及第二对应关系,确定第二用户行为反馈数据的影响系数。
其中,第二对应关系可以预设置,并存储在图2中的存储器203或服务器中。
可选的,获取第二对应关系,包括:从图2中的存储器203或服务器中获取该第二对应关系。
如表6所示,为第二用户行为反馈数据的影响系数与第二用户行为反馈数据的对应关系。表6中,若第二用户行为反馈数据指示历史上与该文本的发送人相同的文本为重要文本,则第二用户行为反馈数据的影响系数为b,若第二用户行为反馈数据指示历史上与该文本的发送人相同的文本为非重要文本,则第二用户行为反馈数据的影响系数为-b,若第二用户行为反馈数据指示历史上与该文本的接收人相同的文本为重要文本,则第二用户行为反馈数据的影响系数为c,若第二用户行为反馈数据指示历史上与该文本的接收人相同的文本为非重要文本,则第二用户行为反馈数据的影响系数为-c。
表6
Figure BDA0002223705860000531
示例性的,以第二用户行为反馈数据的影响系数与第二用户行为反馈数据的对应关系如表6所示,关系特征系数中的上下级关系特征系数与第二用户行为反馈数据的影响系数做加减运算为例,若第二用户行为反馈数据指示历史上与该文本的发送人相同的文本为重要文本,则第二用户行为反馈数据的影响系数为b,考虑了第二用户行为反馈数据的影响系数后,新的用户与发送人的上下级关系特征系数可以为用户与发送人的上下级关系特征系数+b;若第二用户行为反馈数据指示历史上与该文本的接收人相同的文本为非重要文本,则第二用户行为反馈数据的影响系数为-c,考虑了第二用户行为反馈数据的影响系数后,新的用户与接收人的上下级关系特征系数可以为用户与接收人的上下级关系特征系数-c。
步骤403:根据关系特征系数确定文本的重要性。
一种可能的实现方式,根据关系特征系数确定文本的重要性,包括:以关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定文本的重要性。具体的,可以参考上述步骤303中,以内容特征系数作为机器学习方法的输入数据,通过机器学习方法确定文本的重要性的的描述,此处不再赘述。
可选的,当重要性相同的文本有多个时(例如,一级重要文本有多个时),根据关系特征系数确定文本的重要性之后还包括:将关系特征系数中的系数做乘法运算得到文本的重要性系数;根据文本的重要性系数对用户接收或发送的文本进行排序。
可选的,将关系特征系数中的系数做乘法运算得到文本的重要性系数,包括:根据公式textImportantCoff=upDownOranCoff*horizontalCoff*joinCoff*communicateCoff计算文本的重要性系数。其中,textImportantCoff为文本的重要性系数,upDownOranCoff为上下级关系特征系数,horizontalCoff为部门关系特征系数,joinCoff为协同关系特征系数,communicateCoff为沟通关系特征系数。
示例性的,以用户为多个接收人中的一个,用户与发送人的上下级关系特征系数为upDownOranCoff1,用户与接收人的上下级关系特征系数为upDownOranCoff2,用户与发送人的部门关系特征系数为horizontalCoff1,用户与接收人的部门关系特征系数为horizontalCoff2,用户与发送人的协同关系特征系数为joinCoff1,用户与接收人的协同关系特征系数为joinCoff2,用户与发送人的沟通关系特征系数为communicateCoff1,用户与接收人的沟通关系特征系数为communicateCoff2为例,则文本的重要性系数textImportantCoff=upDownOranCoff1*horizontalCoff1*joinCoff1*communicateCoff1*upDownOranCoff2*horizontalCoff2*joinCoff2*communicateCoff2
另一种可能的实现方式,根据关系特征系数确定文本的重要性,包括:将关系特征系数中的系数做乘法运算得到文本的重要性系数;根据文本的重要性系数确定文本的重要性。
将关系特征系数中的系数做乘法运算得到文本的重要性系数可以包括:根据公式textImportantCoff=upDownOranCoff*horizontalCoff*joinCoff*communicateCoff计算文本的重要性系数。
可选的,根据文本的重要性系数确定文本的重要性,包括:若文本的重要性系数大于或等于第二阈值,则确定该文本为重要文本;或者,根据文本的重要性系数与文本的重要性的对应关系,确定文本的重要性。具体的,可以参考上述步骤303中根据文本的重要性系数确定文本的重要性的描述,此处不再赘述。
其中,第二阈值与第一阈值可以相同也可以不同。
进一步可选的,当重要性相同的文本有多个时,根据特征系数集合确定文本的重要性之后还包括:根据文本的重要性系数对用户接收或发送的文本进行排序。
可选的,在根据特征系数集合确定文本的重要性之后,将文本按照文本的重要性分类显示。
当用户更换设备时,将旧设备中的文本的重要性传输到新设备中的方法可以参考步骤303中对应的描述,此处不再赘述。
基于图4所示的方法,可以获取接收人的标识和/或发送人的标识,以及用户的关系信息,根据接收人的标识和/或发送人的标识,以及用户的关系信息得到关系特征系数,并根据关系特征系数确定文本的重要性,从而可以根据用户与接收人和/或发送人的关系确定文本的重要性。
实施例3:
用户接收文本后,识别文本的装置可以获取文本、用户的画像信息以及用户的关系信息,根据文本和用户的画像信息得到内容特征系数,根据接收人的标识和/或发送人的标识,以及用户的关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容以及用户与接收人和/或发送人的关系确定文本的重要性。如图5所示,该识别文本的方法可以包括步骤501-步骤504。
步骤501:获取文本、用户的画像信息、以及用户的关系信息。
其中,文本可以包括文本的内容,接收人的标识以及发送人的标识。
步骤501的具体介绍可以参考上述步骤301和步骤401中对应的描述,此处不予赘述。
步骤502:根据文本和用户的画像信息得到内容特征系数。
步骤502的具体介绍可以参考上述步骤302中对应的描述,此处不予赘述。
步骤503:根据接收人的标识和/或发送人的标识,以及用户的关系信息得到关系特征系数。
步骤503的具体介绍可以参考上述步骤402中对应的描述,此处不予赘述。
需要说明的是,本申请实施例不限定步骤502以及步骤503的执行顺序,例如,可以先执行步骤502再执行步骤503,也可以先执行步骤503再执行步骤502。
步骤504:根据内容特征系数以及关系特征系数确定文本的重要性。
一种可能的实现方式,根据内容特征系数以及关系特征系数确定文本的重要性,包括:以内容特征系数以及关系特征系数作为机器学习方法的输入数据,通过机器学习方法确定文本的重要性。具体的,可以参考上述步骤303中,以内容特征系数作为机器学习方法的输入数据,通过机器学习方法确定文本的重要性的的描述,此处不再赘述。
可选的,当重要性相同的文本有多个时(例如,一级重要文本有多个时),根据内容特征系数以及关系特征系数确定文本的重要性之后还包括:将内容特征系数中的N个系数全部或部分做加法运算,再与关系特征系数中的系数做乘法运算得到文本的重要性系数;根据文本的重要性系数对用户接收或发送的文本进行排序。
可选的,将内容特征系数中的N个系数全部或部分做加法运算,再与关系特征系数中的系数做乘法运算得到文本的重要性系数,包括:根据公式textImportantCoff=(contentCoff1+contentCoff2+…+contentCoffN)*upDownOranCoff*horizontalCoff*joinCoff*communicateCoff计算文本的重要性系数。
另一种可能的实现方式,根据内容特征系数以及关系特征系数确定文本的重要性,包括:将内容特征系数中的N个系数全部或部分做加法运算,与关系特征系数中的系数做乘法运算得到文本的重要性系数;根据文本的重要性系数确定文本的重要性。
将内容特征系数中的N个系数全部或部分做加法运算,与关系特征系数中的系数做乘法运算得到文本的重要性系数,可以包括:根据公式textImportantCoff=(contentCoff1+contentCoff2+…+contentCoffN)*upDownOranCoff*horizontalCoff*joinCoff*communicateCoff计算文本的重要性系数。
可选的,根据文本的重要性系数确定文本的重要性,包括:若文本的重要性系数大于或等于第三阈值,则确定该文本为重要文本;或者,根据文本的重要性系数与文本的重要性的对应关系,确定文本的重要性。具体的,可以参考上述步骤303中根据文本的重要性系数确定文本的重要性的描述,此处不再赘述。
其中,第三阈值与第一阈值以及第二阈值可以相同也可以不同。
进一步可选的,当重要性相同的文本有多个时,根据特征系数集合确定文本的重要性之后还包括:根据文本的重要性系数对用户接收或发送的文本进行排序。
可选的,在根据特征系数集合确定文本的重要性之后,将文本按照文本的重要性分类显示。
当用户更换设备时,将旧设备中的文本的重要性传输到新设备中的方法可以参考步骤303中对应的描述,此处不再赘述。
基于图5所示的方法,可以获取文本、用户的画像信息、接收人的标识和/或发送人的标识,以及用户的关系信息,根据文本和用户的画像信息得到内容特征系数,根据接收人的标识和/或发送人的标识,以及用户的关系信息得到关系特征系数,并根据内容特征系数以及关系特征系数确定文本的重要性,从而可以根据文本的内容以及用户与接收人和/或发送人的关系确定文本的重要性。
上述实施例1-实施例3中介绍了根据内容特征系数和/或关系特征系数确定文本的重要性的方法,除了上述方法,还可以根据消息影响范围特征系数,和/或,用户与接收人/发送人的关系系数确定文本的重要性。其中,消息影响范围特征系数可以用于指示接收人的个数,用户与接收人/发送人的关系系数可以用于指示用户与接收人和/或发送人的关系的紧密程度。
下面以根据内容特征系数、关系特征系数、消息影响范围特征系数,以及用户与接收人/发送人的关系系数确定文本的重要性为例进行介绍。
实施例4:
用户接收文本后,识别文本的装置可以获取文本、用户的画像信息以及用户的关系信息,根据文本和用户的画像信息得到内容特征系数,根据接收人的标识和/或发送人的标识,以及用户的关系信息得到关系特征系数,根据接收人的标识得到消息影响范围特征系数,根据用户的关系信息得到用户与接收人/发送人的关系系数,并根据内容特征系数、关系特征系数、消息影响范围特征系数,以及用户与接收人/发送人的关系系数确定文本的重要性。如图6所示,该识别文本的方法可以包括步骤601-步骤606。
步骤601:获取文本、用户的画像信息、以及用户的关系信息。
其中,文本可以包括文本的内容、接收人的标识以及发送人的标识。
步骤601的具体介绍可以参考上述步骤301和步骤401中对应的描述,此处不予赘述。
步骤602:根据文本和用户的画像信息得到内容特征系数。
步骤602的具体介绍可以参考上述步骤302中对应的描述,此处不予赘述。
步骤603:根据接收人的标识和/或发送人的标识,以及用户的关系信息得到关系特征系数。
步骤603的具体介绍可以参考上述步骤402中对应的描述,此处不予赘述。
步骤604:根据接收人的标识得到消息影响范围特征系数。
可选的,根据接收人的标识得到消息影响范围特征系数,包括:根据接收人的标识确定接收人的个数,根据接收人的个数得到消息影响范围特征系数。例如,若接收人的个数为2,则消息影响范围特征系数为2,又例如,若接收人的个数少于10,则消息影响范围特征系数为0.3,若接收人的个数大于等于10且少于30,则消息影响范围特征系数为0.8,若接收人的个数大于等于30,则消息影响范围特征系数为1。
可选的,消息影响范围特征系数与文本的重要性成非正相关,即在其他特征系数不变的情况下,消息影响范围特征系数越大,文本的重要性越低。
步骤605:根据用户的关系信息得到用户与接收人/发送人的关系系数。
若用户为发送人,用户与接收人/发送人的关系系数可以为:与用户有组织关系和/或沟通关系的接收人的关系特征系数之和,与所有接收人的关系特征系数之和的比值;或者,用户与接收人/发送人的关系系数可以为:与用户有组织关系和/或沟通关系的接收人与用户的关系权重之和,与所有接收人与用户的关系权重之和的比值。其中,关系权重可以包括上下级关系的权重、最小单元组织的权重、协同关系权重以及沟通频率的权重。
示例性的,以用户1向用户2、用户3以及用户4发送文本,用户2和用户3与用户1有组织关系以及沟通关系,用户2的关系特征系数为20,用户3的关系特征系数为33,用户4与用户1没有组织关系以及沟通关系,用户4的关系特征系数为2为例,则用户1与接收人/发送人的关系系数可以为(20+33)/(20+33+2)=0.96。
示例性的,以用户1向用户2、用户3以及用户4发送文本,用户2和用户3与用户1有组织关系,用户2的关系权重为25,用户3的关系权重为22,用户4与用户1没有组织关系,用户4的关系权重为1为例,则用户1与接收人/发送人的关系系数可以为(25+22)/(25+22+1)=0.98。
若用户为多个接收人中的一个,用户与接收人/发送人的关系系数可以为:与用户有组织关系和/或沟通关系的接收人以及发送人的关系特征系数之和,与所有接收人以及发送人的关系特征系数之和的比值;或者,用户与接收人/发送人的关系系数可以为:与用户有组织关系和/或沟通关系的接收人以及发送人与用户的关系权重之和,与所有接收人以及发送人与用户的关系权重之和的比值。
示例性的,以用户2向用户1、用户3以及用户4发送文本,用户2和用户3与用户1有沟通关系,用户2的关系特征系数为15,用户3的关系特征系数为26,用户4与用户1没有沟通关系,用户4的关系特征系数为2为例,则用户1与接收人/发送人的关系系数可以为(15+26)/(15+26+2)=0.95。
示例性的,以用户2向用户1、用户3以及用户4发送文本,用户2与用户1有组织关系,用户2的关系权重为27,用户3和用户4与用户1没有组织关系,用户3的关系权重为1,用户4的关系权重为1为例,则用户1与接收人/发送人的关系系数可以为27/(27+1+1)=0.93。
可选的,用户与接收人/发送人的关系系数与文本的重要性成正相关,即在其他特征系数不变的情况下,用户与接收人/发送人的关系系数越大,文本的重要性越高。
需要说明的是,本申请实施例不限定步骤602-步骤605的执行顺序,例如,可以先执行步骤605,接着执行步骤604,再执行步骤603,最后执行步骤602,也可以先执行步骤604,接着执行步骤602,再执行步骤605,最后执行步骤603,还可以先执行步骤603,接着执行步骤605,再执行步骤602,最后执行步骤604。
步骤606:根据内容特征系数、关系特征系数、消息影响范围特征系数,以及用户与接收人/发送人的关系系数确定文本的重要性。
一种可能的实现方式,根据内容特征系数、关系特征系数、消息影响范围特征系数,以及用户与接收人/发送人的关系系数确定文本的重要性,包括:以内容特征系数、关系特征系数、消息影响范围特征系数,以及用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过机器学习方法确定文本的重要性。具体的,可以参考上述步骤303中,以内容特征系数作为机器学习方法的输入数据,通过机器学习方法确定文本的重要性的的描述,此处不再赘述。
可选的,当重要性相同的文本有多个时(例如,一级重要文本有多个时),根据内容特征系数、关系特征系数、消息影响范围特征系数,以及用户与接收人/发送人的关系系数确定文本的重要性之后还包括:将内容特征系数中的N个系数全部或部分做加法运算,与关系特征系数中的系数、用户与接收人/发送人的关系系数做乘法运算,与消息影响范围特征系数做除法运算得到文本的重要性系数;根据文本的重要性系数对用户接收或发送的文本进行排序。
可选的,将内容特征系数中的N个系数全部或部分做加法运算,与关系特征系数中的系数、用户与接收人/发送人的关系系数做乘法运算,与消息影响范围特征系数做除法运算得到文本的重要性系数,包括:根据公式textImportantCoff=(contentCoff1+contentCoff2+…+contentCoffN)*upDownOranCoff*horizontalCoff*joinCoff*communicateCoff*receiveandsendCoff/textAffectRange计算文本的重要性系数。其中,receiveandsendCoff用户与接收人/发送人的关系系数,textAffectRange为消息影响范围特征系数。
另一种可能的实现方式,根据内容特征系数、关系特征系数、消息影响范围特征系数,以及用户与接收人/发送人的关系系数确定文本的重要性,包括:将内容特征系数中的N个系数全部或部分做加法运算,与关系特征系数中的系数、用户与接收人/发送人的关系系数做乘法运算,与消息影响范围特征系数做除法运算得到文本的重要性系数;根据文本的重要性系数确定文本的重要性。
将内容特征系数中的N个系数全部或部分做加法运算,与关系特征系数中的系数、用户与接收人/发送人的关系系数做乘法运算,与消息影响范围特征系数做除法运算得到文本的重要性系数,可以包括:根据公式textImportantCoff=(contentCoff1+contentCoff2+…+contentCoffN)*upDownOranCoff*horizontalCoff*joinCoff*communicateCoff*receiveandsendCoff/textAffectRange计算文本的重要性系数。
可选的,根据文本的重要性系数确定文本的重要性,包括:若文本的重要性系数大于或等于第四阈值,则确定该文本为重要文本;或者,根据文本的重要性系数与文本的重要性的对应关系,确定文本的重要性。具体的,可以参考上述步骤303中根据文本的重要性系数确定文本的重要性的描述,此处不再赘述。
其中,第四阈值与第一阈值、第二阈值以及第三阈值可以相同也可以不同。
进一步可选的,当重要性相同的文本有多个时,根据特征系数集合确定文本的重要性之后还包括:根据文本的重要性系数对用户接收或发送的文本进行排序。
可选的,在根据特征系数集合确定文本的重要性之后,将文本按照文本的重要性分类显示。
当用户更换设备时,将旧设备中的文本的重要性传输到新设备中的方法可以参考步骤303中对应的描述,此处不再赘述。
基于图6所示的方法,可以获取文本、用户的画像信息、接收人的标识和/或发送人的标识,以及用户的关系信息,根据文本和用户的画像信息得到内容特征系数,根据接收人的标识和/或发送人的标识,以及用户的关系信息得到关系特征系数,根据接收人的标识得到消息影响范围特征系数,根据用户的关系信息得到用户与接收人/发送人的关系系数,并根据内容特征系数、关系特征系数、消息影响范围特征系数,以及用户与接收人/发送人的关系系数确定文本的重要性。
下面以用户1向用户2以及用户3发送文本,识别文本的装置获取文本、用户2的关系信息以及用户2的画像信息,并根据文本、用户2的关系信息以及用户2的画像信息得到内容特征系数、关系特征系数以及消息影响范围特征系数为例,介绍识别文本的方法。
实施例5:
如图7所示,该识别文本的方法包括步骤701-步骤705。
步骤701:获取文本、用户2的关系信息以及用户2的画像信息。
其中,文本可以包括文本的内容、接收人的标识以及发送人的标识。
用户2的关系信息包括{用户1,用户2,上级,小组织1,0,30}以及{用户3,用户2,同级,小组织1,1,50}。其中,{用户1,用户2,上级,小组织1,0,30}中,上级表示用户1是用户2的上级用户,小组织1表示用户1与用户2的最小单元组织为小组织1,0表示用户1与用户2没有协同工作关系,30表示用户1与用户2一个月的沟通频率为30。{用户3,用户2,同级,小组织1,1,50}中,同级表示用户3是用户2的同级用户,小组织1表示用户3与用户2的最小单元组织为小组织1,1表示用户3与用户2有协同工作关系,50表示用户3与用户2一个月的沟通频率为50。
用户2的画像信息包括{tag1,tag2,…,tag10}和{tagVal1,tagVal2,…,tagVal10}。
步骤701的描述可以参考上述步骤301和步骤401中的介绍,此处不再赘述。
步骤702:根据文本和用户的画像信息,得到内容特征系数。
根据步骤302中示例4中介绍的方法,从文本中提取文本的关键词,并获取文本的关键词与{tag1,tag2,…,tag10}的相似度{similarCoff1,similarCoff2,…,similarCoff10}。将相似度与相似度对应的标签信息的权重相乘,并根据公式contentCoffi=Function(x)计算内容特征系数{contentCoff1,contentCoff2,…,contentCoff10}。其中,Function(x)=exp(x),x=tagVali*similarCoffi,i为大于或等于1并且小于或等于10的正整数。
步骤703:根据接收人的标识、发送人的标识以及用户的关系信息,得到关系特征系数。
根据上述步骤402中介绍的方法,可以得到用户1与用户2的关系特征系数为{6,5,0.01,30},其中,6为用户1与用户2的上下级关系特征系数,5为用户1与用户2的部门关系特征系数,0.01为用户1与用户2的协同关系特征系数,30为用户1与用户2的沟通关系特征系数。
根据上述步骤402中介绍的方法,可以得到用户3与用户2的关系特征系数为{4,5,4,50},其中,4为用户3与用户2的上下级关系特征系数,5为用户3与用户2的部门关系特征系数,4为用户3与用户2的协同关系特征系数,50为用户3与用户2的沟通关系特征系数。
步骤704:根据根据接收人的标识得到消息影响范围特征系数。
接收人的标识有两个,从而确定接收人的个数为2,因此,消息影响范围特征系数为2。
步骤704后,可以将上述内容特征系数、关系特征系数以及消息影响范围特征系数组合成向量[contentCoff1,contentCoff2,…,contentCoff10,6,5,0.01,30,4,5,4,50,2],共19维。
需要说明的是,本申请实施例不限制步骤702-步骤704的执行顺序,例如,可以先执行步骤703,再执行步骤702,最后执行步骤704,也可以先执行步骤704,再执行步骤702,最后执行步骤703,还可以先执行步骤702,再执行步骤704,最后执行步骤703,本申请实施例不进行具体限定。
步骤705:以内容特征系数、关系特征系数以及消息影响范围特征系数作为机器学习方法的输入数据,通过机器学习方法确定文本的重要性。
在执行步骤705前,还要训练机器学习方法的模型。该具体过程如下:
步骤1:获取历史上用户2接收到的大量文本。例如,获取历史上用户2接收到的不同文本100000条。
步骤2:将该大量文本按照文本的重要性分类标注。例如,重要文本标注为1,非重要文本标注为0。
步骤3:根据上述步骤701-步骤704,得到该大量文本(100000条文本)中,每个文本的内容特征系数、关系特征系数以及消息影响范围特征系数组合成的向量(19维),并将100000条文本的向量按列合并,得到19*100000的矩阵。
步骤4:使用深度学习的方法训练模型。训练模型中有输入层、隐含层以及输出层。其中,可以设置4层隐含层,第一层隐含层的参数为:W1=[12,19],b1=[12,1],第二层隐含层的参数为:W2=[8,12],b2=[8,1],第三层隐含层的参数为:W3=[4,8],b3=[4,1],第四层隐含层的参数为:W4=[2,4],b4=[2,1],5层隐含层的激活函数设为relu,使用归一化指数函数(softmax)的方法得到最后分类概率,即前向传播计算公式为predict=softmax(W4*relu(W3*relu(W2*relu(W1*inputX+b1)+b2)+b3)+b4)。接着使用交叉熵作为损失函数,学习率设为1e-5,最后使用Adam梯度下降优化器进行参数更新,训练次数设为20000次。经训练后,可以得到预测文本重要度类别的计算公式为Y=Index(max(predict)),其中,Y是predict数组最大元素对应的下标,当Y为0时,表示该文本为重要文本,当Y为1时,表示文本为非重要文本。
得到训练模型后,可以将步骤704后得到的用户2的内容特征系数、关系特征系数以及消息影响范围特征系数组合成的向量[contentCoff1,contentCoff2,…,contentCoff10,6,5,0.01,30,4,5,4,50,2]输入训练模型,得到用户2接收到的文本的重要性。
基于图7所示的方法,可以获取文本、用户的关系信息以及用户的画像信息,根据文本以及用户的画像信息,得到内容特征系数,根据接收人的标识、发送人的标识以及用户的关系信息,得到关系特征系数,根据接收人的标识得到消息影响范围特征系数,并根据内容特征系数、关系特征系数以及消息影响范围特征系数确定文本的重要性,从而可以高效地识别文本的重要性。
上述识别文本的装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法操作,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对识别文本的装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
比如,以采用集成的方式划分各个功能模块的情况下,图8示出了一种识别文本的装置80的结构示意图。该识别文本的装置80包括:获取模块801、处理模块802以及确定模块803。
获取模块801,用于获取文本以及用户的画像信息,其中,该文本为该用户接收或者发送的文本,该用户的画像信息用于指示该用户相关的文本中的N个关键词,N为大于或等于1的整数。
处理模块802,用于根据该文本以及该用户的画像信息得到内容特征系数,其中,该内容特征系数用于指示该文本的内容的重要性。
确定模块803,用于根据该内容特征系数确定该文本的重要性。
可选的,该用户的画像信息包括N个标签信息,该N个标签信息对应指示该N个关键词;或者,该用户的画像信息包括该N个标签信息,以及该N个标签信息中每个标签信息的权重。
可选的,处理模块802,具体用于获取第一用户行为反馈数据,其中,第一用户行为反馈数据用于指示历史上与该文本内容相似度高的文本的重要性;处理模块802,还具体用于获取第一对应关系,其中,该第一对应关系用于指示该第一用户行为反馈数据和该第一用户行为反馈数据的影响系数之间的关联关系;处理模块802,还具体用于根据该第一用户行为反馈数据和该第一对应关系得到该第一用户行为反馈数据的影响系数;处理模块802,还具体用于根据该文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到该内容特征系数。
可选的,获取模块801,还用于获取用户的关系信息,其中,该用户的关系信息用于指示用户与组织中其他用户的层级关系;处理模块802,还用于根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系;确定模块803,还用于根据该关系特征系数确定该文本的重要性。
可选的,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。
可选的,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。
可选的,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;处理模块802,具体用于用于获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;处理模块802,还具体用于获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据和该第二用户行为反馈数据的影响系数之间的关联关系;处理模块802,还具体用于根据该第二用户行为反馈数据以及该第二对应关系,得到该第二用户行为反馈数据的影响系数;处理模块802,还具体用于根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。
可选的,该文本包括该文本的接收人的标识,处理模块802,还用于根据该文本的接收人的标识得到该消息影响范围特征系数,其中,该消息影响范围特征系数用于指示该文本的接收人的个数;确定模块803,还用于根据该消息影响范围特征系数确定该文本的重要性。
可选的,处理模块802,还用于根据该用户的关系信息得到用户与接收人/发送人的关系系数,其中,该用户与接收人/发送人的关系系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系的紧密程度;确定模块803,还用于根据该用户与接收人/发送人的关系系数确定该文本的重要性。
可选的,确定模块803,具体用于以该内容特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。
可选的,确定模块803,具体用于以该内容特征系数和该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。
可选的,确定模块803,具体用于以该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。
可选的,确定模块803,具体用于以该内容特征系数、该关系特征系数、该消息影响范围特征系数以及该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。
可选的,当重要性相同的文本有多个时,该内容特征系数包括N个系数,如图9所示,识别文本的装置80还包括:排序模块804;处理模块802,还用于将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数;排序模块804,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,当重要性相同的文本有多个时,该内容特征系数包括N个系数,如图9所示,识别文本的装置80还包括:排序模块804;处理模块802,还用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;排序模块804,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,当重要性相同的文本有多个时,该内容特征系数包括N个系数,如图9所示,识别文本的装置80还包括:排序模块804;处理模块802,还用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;排序模块804,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,当重要性相同的文本有多个时,该内容特征系数包括N个系数,如图9所示,识别文本的装置80还包括:排序模块804;处理模块802,还用于将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;排序模块804,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,确定模块803,具体用于将该内容特征系数中的N个系数全部或部分做加法运算得到该文本的重要性系数系数;确定模块803,还具体用于根据该文本的重要性系数确定该文本的重要性。
可选的,确定模块803,具体用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;确定模块803,还具体用于根据该文本的重要性系数确定该文本的重要性。
可选的,确定模块803,具体用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;确定模块803,还具体用于根据该文本的重要性系数确定该文本的重要性。
可选的,确定模块803,具体用于将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;确定模块803,还具体用于根据该文本的重要性系数确定该文本的重要性。
可选的,当重要性相同的文本有多个时,排序模块804,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,如图10所示,文本识别的装置80还包括:显示模块805;显示模块805,用于将该文本按照该文本的重要性分类显示。
其中,上述方法实施例涉及的各操作的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
在本实施例中,该识别文本的装置80以采用集成的方式划分各个功能模块的形式来呈现。这里的“模块”可以指特定ASIC,电路,执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。在一个简单的实施例中,本领域的技术人员可以想到该识别文本的装置80可以采用图2所示的形式。
比如,图2中的存储器203中存储的计算机执行指令,处理器201可以通过调用存储器203中存储的计算机执行指令,执行下述过程:从存储器203或服务器获取文本以及用户的画像信息,其中,该文本为该用户接收或者发送的文本,该用户的画像信息用于指示与该文本的重要性相关的信息;根据该文本以及该用户的画像信息得到内容特征系数,其中,该内容特征系数用于指示文本的内容的重要性;根据内容特征系数确定该文本的重要性。
示例性的,图10中的获取模块801、处理模块802、确定模块803、排序模块804和显示模块804的功能/实现过程可以通过图2中的处理器201调用存储器203中存储的计算机执行指令来实现。或者,图10中的获取模块801、处理模块802、确定模块803和排序模块804的功能/实现过程可以通过图2中的处理器201调用存储器203中存储的计算机执行指令来实现,图10中的显示模块805的功能/实现过程可以通过图2中的输出设备205来实现。
由于本实施例提供的识别文本的装置80可执行上述的识别文本的方法,因此其所能获得的技术效果可参考上述方法实施例,在此不再赘述。
比如,以采用集成的方式划分各个功能模块的情况下,图11示出了一种识别文本的装置110的结构示意图。该识别文本的装置110包括:获取模块1101、处理模块1102以及确定模块1103。
获取模块1101,用于获取文本以及用户的关系信息,其中,该文本为该用户接收或者发送的文本,该用户的关系信息用于指示该用户与组织中其他用户的层级关系。
处理模块1102,用于根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系。
确定模块1103,用于根据该关系特征系数确定该文本的重要性。
可选的,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。
可选的,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。
可选的,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;处理模块1102,具体用于获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;处理模块1102,还具体用于获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据和该第二用户行为反馈数据的影响系数之间的关联关系;处理模块1102,还具体用于根据该第二用户行为反馈数据以及该第二对应关系,得到该第二用户行为反馈数据的影响系数;处理模块1102,还具体用于根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。
可选的,确定模块1103,具体用于以该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。
可选的,当重要性相同的文本有多个时,如图12所示,识别文本的装置110还包括:排序模块1104;处理模块1102,还用于将该关系特征系数中的系数做乘法运算得到该文本的重要性系数;排序模块1104,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,确定模块1103,具体用于将该关系特征系数中的系数做乘法运算得到该文本的重要性系数;确定模块1103,还具体用于根据该文本的重要性系数确定该文本的重要性。
可选的,当重要性相同的文本有多个时,排序模块1104,还用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,如图13所示,该识别文本的装置110还包括:显示模块1105;显示模块1105,用于将该文本按照该文本的重要性分类显示。
其中,上述方法实施例涉及的各操作的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
在本实施例中,该识别文本的装置110以采用集成的方式划分各个功能模块的形式来呈现。这里的“模块”可以指特定ASIC,电路,执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。在一个简单的实施例中,本领域的技术人员可以想到该识别文本的装置110可以采用图2所示的形式。
比如,图2中的存储器203中存储的计算机执行指令,处理器201可以通过调用存储器203中存储的计算机执行指令,执行下述过程:从存储器203或服务器获取文本以及用户的关系信息,其中,该文本为该用户接收或者发送的文本,该用户的关系信息用于指示用户与组织中其他用户的层级关系;根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系;根据该关系特征系数确定该文本的重要性。
示例性的,图13中的获取模块1101、处理模块1102、确定模块1103、排序模块1104和显示模块1104的功能/实现过程可以通过图2中的处理器201调用存储器203中存储的计算机执行指令来实现。或者,图13中的获取模块1101、处理模块1102、确定模块1103和排序模块1104的功能/实现过程可以通过图2中的处理器201调用存储器203中存储的计算机执行指令来实现,图13中的显示模块1105的功能/实现过程可以通过图2中的输出设备205来实现。
由于本实施例提供的识别文本的装置110可执行上述的识别文本的方法,因此其所能获得的技术效果可参考上述方法实施例,在此不再赘述。
比如,以采用集成的方式划分各个功能模块的情况下,图14示出了一种识别文本的装置140的结构示意图。该识别文本的装置140包括:获取模块1401、处理模块1402以及确定模块1403。
获取模块1401,用于获取文本、用户的画像信息、以及用户的关系信息,其中,该文本为该用户接收或者发送的文本,该用户的画像信息用于指示该用户相关的文本中的N个关键词,N为大于或等于1的整数,该用户的关系信息用于指示该用户与组织中其他用户的层级关系。
处理模块1402,用于根据该文本以及该用户的画像信息得到内容特征系数,其中,该内容特征系数用于指示文本的内容的重要性。
处理模块1402,还用于根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系。
确定模块1403,用于根据该内容特征系数以及该关系特征系数确定该文本的重要性。
可选的,该用户的画像信息包括N个标签信息,该N个标签信息对应指示该N个关键词;或者,该用户的画像信息包括该N个标签信息,以及该N个标签信息中每个标签信息的权重。
可选的,处理模块1402,具体用于获取第一用户行为反馈数据,其中,第一用户行为反馈数据用于指示历史上与该文本内容相似度高的文本的重要性;处理模块1402,还具体用于获取第一对应关系,其中,该第一对应关系用于指示该第一用户行为反馈数据和该第一用户行为反馈数据的影响系数之间的关联关系;处理模块1402,还具体用于根据该第一用户行为反馈数据、以及该第一对应关系得到该第一用户行为反馈数据的影响系数;处理模块1402,还具体用于根据该文本、该用户的画像信息以及该第一用户行为反馈数据的影响系数得到该内容特征系数。
可选的,该用户的关系信息包括该用户的组织关系信息以及该用户的沟通关系信息,该用户的组织关系信息包括该用户的上下级关系信息、该用户的部门关系信息以及协同关系信息;该用户的上下级关系信息用于指示该用户与其他用户的上下级关系;该用户的部门关系信息用于指示该用户与其他用户的最小单元组织,该最小单元组织为该用户与其他用户所在的相同组织中,用户数量最少的组织;该协同关系信息用于指示该用户与其他用户是否协同工作;该用户的沟通关系信息用于指示该用户与其他用户的沟通频率。
可选的,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;该上下级关系特征系数是根据该用户的上下级关系信息得到的;该部门关系特征系数是根据该用户的部门关系信息得到的;该协同关系特征系数是根据该协同关系信息得到的;该沟通关系特征系数是根据该用户的沟通关系信息得到的。
可选的,该关系特征系数包括组织关系特征系数以及沟通关系特征系数,该组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数;处理模块1402,具体用于获取第二用户行为反馈数据,其中,第二用户行为反馈数据用于指示历史上与该文本的发送人相同的文本的重要性;处理模块1402,还具体用于获取第二对应关系,其中,该第二对应关系用于指示该第二用户行为反馈数据,以及该第二用户行为反馈数据的影响系数之间的关联关系;处理模块1402,还具体用于根据该第二用户行为反馈数据以及该第二对应关系,得到该第二用户行为反馈数据的影响系数;处理模块1402,还具体用于根据该文本、该用户的关系信息以及该第二用户行为反馈数据的影响系数得到该关系特征系数。
可选的,处理模块1402,还用于根据该文本得到该消息影响范围特征系数,其中,该消息影响范围特征系数用于指示该文本的接收人的个数;确定模块1403,还用于根据该消息影响范围特征系数确定该文本的重要性。
可选的,处理模块1402,还用于根据该用户的关系信息得到该用户与接收人/发送人的关系系数,其中,该用户与接收人/发送人的关系系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系的紧密程度;确定模块1403,还用于根据该用户与接收人/发送人的关系系数确定该文本的重要性。
可选的,确定模块1403,具体用于以该内容特征系数以及该关系特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。
可选的,确定模块1403,具体用于以该内容特征系数、该关系特征系数和该消息影响范围特征系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。
可选的,确定模块1403,具体用于以该内容特征系数、该关系特征系数、该消息影响范围特征系数和该用户与接收人/发送人的关系系数作为机器学习方法的输入数据,通过该机器学习方法确定该文本的重要性。
可选的,当重要性相同的文本有多个时,该内容特征系数包括N个系数,如图15所示,该识别文本的装置140还包括:排序模块1404;处理模块1402,还用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;排序模块1404,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,当重要性相同的文本有多个时,该内容特征系数包括N个系数,如图15所示,该识别文本的装置140还包括:排序模块1404;处理模块1402,还用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;排序模块1404,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,当重要性相同的文本有多个时,该内容特征系数包括N个系数,如图15所示,该识别文本的装置140还包括:排序模块1404;处理模块1402,还用于将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;排序模块1404,用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,确定模块1403,具体用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算得到该文本的重要性系数;确定模块1403,还具体用于根据该文本的重要性系数确定该文本的重要性。
可选的,确定模块1403,具体用于将该内容特征系数中的系数之和与该关系特征系数中的系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;确定模块1403,还具体用于根据该文本的重要性系数确定该文本的重要性。
可选的,确定模块1403,具体用于将该内容特征系数中的系数之和,与该关系特征系数中的系数以及该用户与接收人/发送人的关系系数做乘法运算,与该消息影响范围特征系数做除法运算得到该文本的重要性系数;确定模块1403,还具体用于根据该文本的重要性系数确定该文本的重要性。
可选的,当重要性相同的文本有多个时,排序模块1404,还用于根据该文本的重要性系数对该用户接收或发送的文本进行排序。
可选的,如图16所示,该识别文本的装置140还包括:显示模块1405;该显示模块1405,用于将该文本按照该文本的重要性分类显示。
其中,上述方法实施例涉及的各操作的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
在本实施例中,该识别文本的装置140以采用集成的方式划分各个功能模块的形式来呈现。这里的“模块”可以指特定ASIC,电路,执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。在一个简单的实施例中,本领域的技术人员可以想到该识别文本的装置140可以采用图2所示的形式。
比如,图2中的存储器203中存储的计算机执行指令,处理器201可以通过调用存储器203中存储的计算机执行指令,执行下述过程:从存储器203或服务器获取文本、用户的画像信息、以及用户的关系信息,其中,该文本为该用户接收或者发送的文本,该用户的画像信息用于指示与该文本的重要性相关的信息,该用户的关系信息用于指示用户与组织中其他用户的层级关系;根据该文本以及该用户的画像信息得到内容特征系数,其中,该内容特征系数用于指示文本的内容的重要性;根据该文本以及该用户的关系信息得到关系特征系数,其中,该关系特征系数用于指示该用户与该文本的接收人和/或该文本的发送人的关系。根据特征系数集合确定该文本的重要性,其中,该特征系数集合包括该内容特征系数以及该关系特征系数。
示例性的,图16中的获取模块1401、处理模块1402、确定模块1403、排序模块1404和显示模块1405的功能/实现过程可以通过图2中的处理器201调用存储器203中存储的计算机执行指令来实现。或者,图16中的获取模块1401、处理模块1402、确定模块1403和排序模块1404的功能/实现过程可以通过图2中的处理器201调用存储器203中存储的计算机执行指令来实现,图16中的显示模块1405的功能/实现过程可以通过图2中的输出设备205来实现。
由于本实施例提供的识别文本的装置140可执行上述的识别文本的方法,因此其所能获得的技术效果可参考上述方法实施例,在此不再赘述。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (24)

1.一种识别文本的装置,其特征在于,所述装置包括:处理器和存储器,所述存储器存储有软件程序,所述处理器用于调用所述存储器中的软件程序执行下述过程:
从所述存储器或服务器中获取文本以及用户的画像信息,其中,所述文本为所述用户接收或者发送的文本,所述用户的画像信息用于指示与所述用户相关的文本中的N个关键词,N为大于或等于1的整数,所述服务器与所述识别文本的装置连接,所述服务器中存储有所述文本以及所述用户的画像信息;
根据所述文本以及所述用户的画像信息得到内容特征系数,其中,所述内容特征系数用于指示所述文本的内容的重要性;
根据所述内容特征系数,确定所述文本的重要性。
2.根据权利要求1所述的装置,其特征在于,
所述用户的画像信息包括N个标签信息,所述N个标签信息对应指示所述N个关键词;或者,
所述用户的画像信息包括所述N个标签信息,以及所述N个标签信息中每个标签信息的权重。
3.根据权利要求1或2所述的装置,其特征在于,
所述根据所述文本以及所述用户的画像信息得到内容特征系数,包括:
从所述存储器或所述服务器中获取第一用户行为反馈数据,其中,所述第一用户行为反馈数据用于指示历史上与所述文本内容相似度高的文本的重要性;
从所述存储器或所述服务器中获取第一对应关系,其中,所述第一对应关系用于指示所述第一用户行为反馈数据与所述第一用户行为反馈数据的影响系数之间的关联关系;
根据所述第一用户行为反馈数据和所述第一对应关系得到所述第一用户行为反馈数据的影响系数;
根据所述文本、所述用户的画像信息以及所述第一用户行为反馈数据的影响系数得到所述内容特征系数。
4.根据权利要求1-3任一项所述的装置,其特征在于,所述处理器还用于调用所述存储器中的软件程序执行下述过程:
从所述存储器或所述服务器中获取用户的关系信息,其中,所述用户的关系信息用于指示所述用户与其他用户的层级关系;
根据所述文本以及所述用户的关系信息得到关系特征系数,其中,所述关系特征系数用于指示所述用户与所述文本的接收人和/或所述文本的发送人的关系;
所述确定所述文本的重要性,还包括:
根据所述关系特征系数确定所述文本的重要性。
5.根据权利要求4所述的装置,其特征在于,所述关系特征系数包括组织关系特征系数以及沟通关系特征系数,所述组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数。
6.根据权利要求1-5任一项所述的装置,其特征在于,
所述根据所述内容特征系数确定所述文本的重要性,包括:
以所述内容特征系数作为机器学习方法的输入数据,通过所述机器学习方法确定所述文本的重要性。
7.根据权利要求6所述的装置,其特征在于,所述内容特征系数包括N个系数,当重要性相同的文本有多个时,所述处理器还用于调用所述存储器中的软件程序执行下述过程:
将所述内容特征系数中的N个系数全部或部分做加法运算得到所述文本的重要性系数;
根据所述文本的重要性系数对所述用户接收或发送的文本进行排序。
8.一种识别文本的装置,其特征在于,所述装置包括:处理器和存储器,所述存储器存储有软件程序,所述处理器用于调用所述存储器中的软件程序执行下述过程:
从所述存储器或服务器中获取文本以及用户的关系信息,其中,所述文本为所述用户接收或者发送的文本,所述用户的关系信息用于指示所述用户与其他用户的层级关系,所述服务器与所述识别文本的装置连接,所述服务器中存储有所述文本以及所述用户的关系信息;
根据所述文本以及所述用户的关系信息得到关系特征系数,其中,所述关系特征系数用于指示所述用户与所述文本的接收人和/或所述文本的发送人的关系;
根据所述关系特征系数确定所述文本的重要性。
9.根据权利要求8所述的装置,其特征在于,所述关系特征系数包括组织关系特征系数以及沟通关系特征系数,所述组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数。
10.根据权利要求9所述的装置,其特征在于,所述根据所述关系特征系数确定所述文本的重要性,包括:
以所述关系特征系数作为机器学习方法的输入数据,通过所述机器学习方法确定所述文本的重要性。
11.根据权利要求10所述的装置,其特征在于,当重要性相同的文本有多个时,所述处理器还用于调用所述存储器中的软件程序执行下述过程:
将所述关系特征系数中的系数做乘法运算得到所述文本的重要性系数;
根据所述文本的重要性系数对所述用户接收或发送的文本进行排序。
12.一种识别文本的方法,其特征在于,所述方法包括:
获取文本以及用户的画像信息,其中,所述文本为所述用户接收或者发送的文本,所述用户的画像信息用于指示与所述用户相关的文本中的N个关键词,N为大于或等于1的整数;
根据所述文本以及所述用户的画像信息得到内容特征系数,其中,所述内容特征系数用于指示所述文本的内容的重要性;
根据所述内容特征系数,确定所述文本的重要性。
13.根据权利要求12所述的方法,其特征在于,
所述用户的画像信息包括N个标签信息,所述N个标签信息对应指示所述N个关键词;或者,
所述用户的画像信息包括所述N个标签信息,以及所述N个标签信息中每个标签信息的权重。
14.根据权利要求12或13所述的方法,其特征在于,所述根据所述文本以及所述用户的画像信息得到内容特征系数,包括:
获取第一用户行为反馈数据,其中,所述第一用户行为反馈数据用于指示历史上与所述文本内容相似度高的文本的重要性;
获取第一对应关系,其中,所述第一对应关系用于指示所述第一用户行为反馈数据与所述第一用户行为反馈数据的影响系数之间的关联关系;
根据所述第一用户行为反馈数据和所述第一对应关系得到所述第一用户行为反馈数据的影响系数;
根据所述文本、所述用户的画像信息以及所述第一用户行为反馈数据的影响系数得到所述内容特征系数。
15.根据权利要求12-14任一项所述的方法,其特征在于,所述方法还包括:
获取用户的关系信息,其中,所述用户的关系信息用于指示用户与其他用户的层级关系;
根据所述文本以及所述用户的关系信息得到关系特征系数,其中,所述关系特征系数用于指示所述用户与所述文本的接收人和/或所述文本的发送人的关系;
所述确定所述文本的重要性,还包括:
根据所述关系特征系数确定所述文本的重要性。
16.根据权利要求15所述的方法,其特征在于,所述关系特征系数包括组织关系特征系数以及沟通关系特征系数,所述组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数。
17.根据权利要求12-16任一项所述的方法,其特征在于,所述根据所述内容特征系数确定所述文本的重要性,包括:
以所述内容特征系数作为机器学习方法的输入数据,通过所述机器学习方法确定所述文本的重要性。
18.根据权利要求17所述的方法,其特征在于,所述内容特征系数包括N个系数,当重要性相同的文本有多个时,所述方法还包括:
将所述所述内容特征系数中的N个系数全部或部分做加法运算得到所述文本的重要性系数;
根据所述文本的重要性系数对所述用户接收或发送的文本进行排序。
19.一种识别文本的方法,其特征在于,所述方法包括:
获取文本以及用户的关系信息,其中,所述文本为所述用户接收或者发送的文本,所述用户的关系信息用于指示所述用户与其他用户的层级关系;
根据所述文本以及所述用户的关系信息得到关系特征系数,其中,所述关系特征系数用于指示所述用户与所述文本的接收人和/或所述文本的发送人的关系;
根据所述关系特征系数确定所述文本的重要性。
20.根据权利要求19所述的方法,其特征在于,所述关系特征系数包括组织关系特征系数以及沟通关系特征系数,所述组织关系特征系数包括上下级关系特征系数、部门关系特征系数以及协同关系特征系数。
21.根据权利要求20所述的方法,其特征在于,所述根据所述关系特征系数确定所述文本的重要性,包括:
以所述关系特征系数作为机器学习方法的输入数据,通过所述机器学习方法确定所述文本的重要性。
22.根据权利要求21所述的方法,其特征在于,当重要性相同的文本有多个时,所述方法还包括:
将所述关系特征系数中的系数做乘法运算得到所述文本的重要性系数;
根据所述文本的重要性系数对所述用户接收或发送的文本进行排序。
23.一种计算机存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,以执行权利要求12-18所述的识别文本的方法。
24.一种计算机存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,以执行权利要求19-22所述的识别文本的方法。
CN201910944108.9A 2019-08-02 2019-09-30 识别文本的方法及装置 Pending CN110880013A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP20849148.0A EP3992818A4 (en) 2019-08-02 2020-06-11 METHOD AND DEVICE FOR TEXT RECOGNITION
PCT/CN2020/095510 WO2021022900A1 (zh) 2019-08-02 2020-06-11 识别文本的方法及装置
US17/587,498 US20220156294A1 (en) 2019-08-02 2022-01-28 Text Recognition Method and Apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019107129355 2019-08-02
CN201910712935 2019-08-02

Publications (1)

Publication Number Publication Date
CN110880013A true CN110880013A (zh) 2020-03-13

Family

ID=69727740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910944108.9A Pending CN110880013A (zh) 2019-08-02 2019-09-30 识别文本的方法及装置

Country Status (4)

Country Link
US (1) US20220156294A1 (zh)
EP (1) EP3992818A4 (zh)
CN (1) CN110880013A (zh)
WO (1) WO2021022900A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021022900A1 (zh) * 2019-08-02 2021-02-11 华为技术有限公司 识别文本的方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001069432A2 (en) * 2000-03-16 2001-09-20 Microsoft Corporation Priorities generation and management
CN1434406A (zh) * 2001-12-12 2003-08-06 微软公司 用于自适应通信优先级化和路由的系统与方法
CN105653562A (zh) * 2014-12-02 2016-06-08 阿里巴巴集团控股有限公司 一种文本内容与查询请求之间相关性的计算方法及装置
CN106201465A (zh) * 2016-06-23 2016-12-07 扬州大学 面向开源社区的软件项目个性化推荐方法
CN107104887A (zh) * 2017-06-01 2017-08-29 珠海格力电器股份有限公司 一种即时消息提醒方法、装置及其用户终端

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050204009A1 (en) * 2004-03-09 2005-09-15 Devapratim Hazarika System, method and computer program product for prioritizing messages
PL1733532T3 (pl) * 2004-03-30 2008-12-31 Maestro Shipping Sa Filtr i sposób filtrowania wiadomości elektronicznych
JP4464975B2 (ja) * 2007-01-22 2010-05-19 インターナショナル・ビジネス・マシーンズ・コーポレーション コンピュータネットワーク上の電子文書の重要度を、当該電子文書に関係付けられた他の電子文書の当該電子文書に対する批評に基づいて、計算するためのコンピュータ装置、コンピュータプログラム及び方法
US8516058B2 (en) * 2007-11-02 2013-08-20 International Business Machines Corporation System and method for dynamic tagging in email
US20090125602A1 (en) * 2007-11-14 2009-05-14 International Business Machines Corporation Automatic priority adjustment for incoming emails
US20120245925A1 (en) * 2011-03-25 2012-09-27 Aloke Guha Methods and devices for analyzing text
CN103678320B (zh) * 2012-09-03 2017-10-27 腾讯科技(深圳)有限公司 网络信息的挖掘方法和装置
TWI501097B (zh) * 2012-12-22 2015-09-21 Ind Tech Res Inst 文字串流訊息分析系統和方法
US9654437B2 (en) * 2014-03-25 2017-05-16 Palo Alto Research Center Incorporated System and method for prioritizing messages based on senders and content for drivers
CN104615608B (zh) * 2014-04-28 2018-05-15 腾讯科技(深圳)有限公司 一种数据挖掘处理系统及方法
US10505885B2 (en) * 2015-02-27 2019-12-10 Microsoft Technology Licensing, Llc Intelligent messaging
US10333881B2 (en) * 2015-11-06 2019-06-25 Facebook, Inc. Adaptive ranking of emails in news feeds
CN107492000A (zh) * 2016-06-13 2017-12-19 阿里巴巴集团控股有限公司 一种数据处理的方法及系统
CN107423362B (zh) * 2017-06-20 2021-06-08 创新先进技术有限公司 行业确定方法、对象获取方法和装置、客户端、服务器
CN109325179B (zh) * 2018-09-17 2020-12-04 青岛海信网络科技股份有限公司 一种内容推广的方法及装置
CN110880013A (zh) * 2019-08-02 2020-03-13 华为技术有限公司 识别文本的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001069432A2 (en) * 2000-03-16 2001-09-20 Microsoft Corporation Priorities generation and management
CN1434406A (zh) * 2001-12-12 2003-08-06 微软公司 用于自适应通信优先级化和路由的系统与方法
CN105653562A (zh) * 2014-12-02 2016-06-08 阿里巴巴集团控股有限公司 一种文本内容与查询请求之间相关性的计算方法及装置
CN106201465A (zh) * 2016-06-23 2016-12-07 扬州大学 面向开源社区的软件项目个性化推荐方法
CN107104887A (zh) * 2017-06-01 2017-08-29 珠海格力电器股份有限公司 一种即时消息提醒方法、装置及其用户终端

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021022900A1 (zh) * 2019-08-02 2021-02-11 华为技术有限公司 识别文本的方法及装置

Also Published As

Publication number Publication date
EP3992818A1 (en) 2022-05-04
US20220156294A1 (en) 2022-05-19
EP3992818A4 (en) 2022-09-14
WO2021022900A1 (zh) 2021-02-11

Similar Documents

Publication Publication Date Title
US11704583B2 (en) Machine learning and validation of account names, addresses, and/or identifiers
US9946783B1 (en) Methods and systems for classifying data using a hierarchical taxonomy
US20190138653A1 (en) Calculating relationship strength using an activity-based distributed graph
US7698335B1 (en) Cluster organization of electronically-stored items
CN107430625B (zh) 通过集群对文档进行分类
US10949418B2 (en) Method and system for retrieval of data
CN111552870A (zh) 对象推荐方法、电子装置及存储介质
JP2012118977A (ja) 文書類似性計算の機械学習に基づく最適化およびカスタマイズのための方法およびシステム
US20140279803A1 (en) Disambiguating data using contextual and historical information
Altintas et al. Machine learning based ticket classification in issue tracking systems
CN108475274B (zh) 生成和应用传出通信模板
CN112966081B (zh) 处理问答信息的方法、装置、设备和存储介质
US11775894B2 (en) Intelligent routing framework
CN107291774B (zh) 错误样本识别方法和装置
Jlailaty et al. Business process instances discovery from email logs
CN112818230A (zh) 内容推荐方法、装置、电子设备和存储介质
US10216393B2 (en) Efficiently sharing user selected information with a set of determined recipients
CN107533574A (zh) 基于随机索引模式匹配的电子邮件关系查找器系统
US20220156294A1 (en) Text Recognition Method and Apparatus
CN112069230A (zh) 数据分析方法、装置、设备及存储介质
Pereira et al. Machine learning for classification of it support tickets
US9158820B2 (en) Method for managing email
EP3318987B1 (en) Method and system for retrieval of data
CN116151392B (zh) 训练样本生成方法、训练方法、推荐方法以及装置
CN112632990B (zh) 一种标签的获取方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination