CN108780660B - 相对于以健康护理为中心的证据对微博中的认知偏差进行分类的设备、系统和方法 - Google Patents
相对于以健康护理为中心的证据对微博中的认知偏差进行分类的设备、系统和方法 Download PDFInfo
- Publication number
- CN108780660B CN108780660B CN201780014043.7A CN201780014043A CN108780660B CN 108780660 B CN108780660 B CN 108780660B CN 201780014043 A CN201780014043 A CN 201780014043A CN 108780660 B CN108780660 B CN 108780660B
- Authority
- CN
- China
- Prior art keywords
- microblog
- health
- clinician
- related topic
- planned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/60—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
- G16H40/67—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Pathology (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
设备、系统和方法相对于以健康护理为中心的证据对微博中的认知偏差进行分类。在微博服务器处执行的方法包括接收来自临床医生的选择,所述选择指示健康相关主题。所述方法包括确定来自经验证的信息源的所述健康相关主题的证据数据。所述方法包括接收微博,所述微博与所述健康相关主题相关联。所述方法包括基于所述证据数据来确定所述微博的认知偏差。
Description
背景技术
临床医生可以亲自或通过诸如在线通信的通信向患者提供健康护理或健康相关信息。即使知道临床医生熟悉所关注的医学领域,临床医生仍然会参考外部资源来帮助确定要提供给患者的适当的健康护理或健康相关信息。尽管临床医生可以获得医学信息,但是患者仍然可能以不同程度的认知水平同意/不同意这些医学信息或者认为与医学信息一致/矛盾。因此,需要临床医生基于这种认知来调整为该患者提供的健康护理。
由于社交网络内的微博和消息传递的增加,存在关于由用户生成的且可由用户获得的显着影响主题的连续且大量的信息流。这些信息有很多方面,从个人意见到组织新闻,从主观命题到相对客观的命题,从事实的陈述到虚构的陈述,以及从幽默的评论到激进的评论。鉴于可用的信息的量,除了基于现有事实和证据来验证真实性以外,手动审查和理解隐藏在大量微博文本中的情绪和认知偏差是一项几乎不可能完成的任务。自动发现微博帖子/消息的作者的认知偏差变得越来越困难,因为这种特征通常是隐含的。此外,基于从用户的兴趣简况中选择的可用的元数据或背景信息来理解微博中的想法和意见的基础的能力可能对少数用户有帮助,但是由于无法通过审查关于人口统计信息、职业或工作之余的活动的条目而恰当地捕捉的人类认知和判断的多方面过程,这在很大程度上是不够的。
微博和其他社交媒体无处不在地用于以健康护理为中心的话语和辩论也带来了以下挑战:即,定制解释和干预以匹配这种消息的作者的认知偏差,从而确保临床医生了解情况,做出正确的临床决策,并且更好地从事健康护理。例如,在关于社交媒体讨论的消息中存在相对大量的不同长度的噪声。基于认知偏差对该数据进行分类和过滤对于除了在医院和/或诊所环境中的典型患者交互以外需要可操作信息的临床医生而言可能是非常有用的。这种能力可以使得临床医生能够迅速有效地解决围绕具有关键的个人和公共健康意义的健康护理问题和/或服务的关心和偏执。这种能力还可以进一步实现对引起对关于健康护理突破或采用健康信息技术的支持、关心或偏执的潜在因素的调查。然而,常规的方法仅关注情绪分析(例如,基于各种语言特征来识别微博消息的情绪、极性和意见)。此外,常规的方法既不考虑消息相对于现有证据的真实性,也不考虑常规的方法确定作者的认知(与情感的)偏差。
发明内容
示例性实施例涉及一种方法,包括:在微博服务器处:接收来自临床医生的选择,所述选择指示健康相关主题;确定来自经验证的信息源的所述健康相关主题的证据数据;接收微博,所述微博与所述健康相关主题相关联;并且基于所述证据数据来确定所述微博的认知偏差。
示例性实施例涉及一种微博服务器,包括:收发器,其经由通信网络进行通信,所述收发器被配置为接收来自临床医生的选择,所述选择指示健康相关主题,所述收发器被配置为接收微博,所述微博与所述健康相关主题相关联;存储器,其存储可执行程序;处理器,其运行所述可执行程序,所述可执行程序使得所述处理器执行操作,所述操作包括:确定来自经验证的信息源的所述健康相关主题的证据数据,并且基于所述证据数据来确定所述微博的认知偏差。
示例性实施例涉及一种方法,包括:在微博服务器处:接收来自临床医生的选择,所述选择指示健康相关主题;确定来自经验证的信息源的所述健康相关主题的证据数据;接收多个微博,所述微博中的每个微博与所述健康相关主题相关联;基于所述证据数据来确定针对所述微博中的每个微博的相应的认知偏差;并且确定针对与所述微博相关联的受众的总体认知偏差。
附图说明
图1示出了根据示例性实施例的系统。
图2示出了根据示例性实施例的图1的微博服务器。
图3示出了根据示例性实施例的生成加权策划图的过程流程。
图4示出了根据示例性实施例的用于确定微博的分类输出的方法。
具体实施方式
参考以下描述和相关附图可以进一步理解示例性实施例,其中,相同的元件被提供有相同的附图标记。示例性实施例涉及用于相对于以健康护理为中心的证据对微博的作者的认知偏差进行分类的设备、系统和方法。具体而言,认知偏差可以是作者对健康相关主题的特定立场。示例性实施例被配置为自动评估微博帖子中临床医生感兴趣的特定健康相关主题的认知偏差,使得临床医生可以定制倡导和干预以匹配目标人群或患者的独特认知特征。以这种方式,临床医生可以为患者提供更高效的护理方式。
如下面将详细描述的,示例性实施例使临床医生能够相对于关于特定的以健康为中心的主题的公认的和经验证的知识源中的事实和证据来综合处理微博帖子中的认知偏差。示例性实施例可以将实时微博帖子的认知偏差分类成四个分类输出,其反映针对微博作者的特定健康相关问题的基准认知。示例性实施例还允许发现主观观点,其可以是在其他方面隐含的,但是可以用于临床医生进行的个性化健康教育、干预和服务递送。
应当注意,关于临床医生以及临床医生如何利用认知偏差(特别是关于针对患者的健康护理)来描述示例性实施例。然而,临床医生的观点仅是示例性的。可以修改示例性实施例以供可以出于各种不同的原因(例如,轮询目的)利用认知偏差的任何健康护理利益相关者(例如,不一定是医学专业人员)使用。
还应当注意,关于健康相关主题和微博描述了示例性实施例。然而,使用健康相关主题仅是示例性的。本领域技术人员将理解,可以相应地修改示例性实施例以用于利用证据来识别认知偏差程度的任何主题。因此,健康相关主题可以表示可以利用主题中的证据的任何主题。此外,微博的使用仅是示例性的。本领域技术人员将理解,无论是否为微型的帖子,都可以相应地修改示例性实施例以与作者的任何在线或离线帖子一起使用。因此,微博可以表示可以进行陈述的任何方式。
图1示出了根据示例性实施例的系统100。系统100涉及基于针对特定健康相关主题的可用证据来确定微博的认知偏差所涉及的各种部件之间的通信。具体而言,系统100可以包括多个信息源105、110,通信网络115,临床医生设备120,简况储存库125以及微博服务器130。如下面将进一步详细描述的,系统100被配置为利用信息源105、110,其可以是微博的来源以及与微博的主题相关联的健康相关证据。
信息源105、110可以表示从其接收信息的任何源。该信息可以是医学信息/健康相关证据、在线或数字信息、微博等。例如,信息源105可以包括用于电子病历(EMR)中的临床报告的储存库。在另一范例中,信息源105可以包括来自医学期刊、医院、医学图书馆等的其他医学相关数据。在另外的范例中,信息源110可以包括在线流,例如,社交媒体流、健康博客、在线新闻等。出于示例性目的,信息源105、110可以提供可以用作针对健康相关主题的证据的任何信息。信息源105、110还可以包括作者发布微博的微博站点。
应当注意,图示两个信息源105、110的系统100仅是示例性的。信息源105、110可以表示被配置为向系统100的其他部件提供信息的一个或多个信息源。实际上,信息源105、110可以表示可以从存储库或源中获得的每个独立的项目、存储库或源本身、存储库的集合等。
通信网络115可以被配置为以通信方式连接系统100的各个部件以交换数据。通信网络115可以表示由系统100的部件用于彼此通信的任何单个网络或多个网络。例如,如果在管理站点处使用微博服务器130,则通信网络115可以包括微博服务器130可以最初连接的专用网络(例如,医院网络)。专用网络可以连接到互联网服务提供商的网络以连接到互联网。随后,通过互联网,可以建立与其他电子设备的连接。应当注意,通信网络115和可以被包括在其中的所有网络可以是任何类型的网络。例如,通信网络110可以是局域网(LAN)、广域网(WAN)、虚拟LAN(VLAN)、WiFi网络、热点、蜂窝网络(例如,3G、4G、长期演进(LTE)等)、云网络、这些网络的有线形式、这些网络的无线形式、这些网络的组合的有线/无线形式等。
临床医生设备120可以表示被配置为执行与临床医生相关联的功能的任何电子设备。例如,临床医生设备120可以是诸如平板电脑、膝上型电脑等的便携式设备或诸如台式终端的固定设备。临床医生设备120可以包括必要的硬件、软件和/或固件,以执行与医学处置相关联的各种操作。临床医生设备120还可以包括所需的连接硬件、软件和固件(例如,收发器),以建立与通信网络115的连接,从而进一步建立与系统100的其他部件的连接。例如,临床医生设备120可以使用日历应用来安排针对患者的预约,可以跟踪对患者的处置或流程等。在另一范例中,临床医生设备120可以用于发布诸如微博的在线内容。在另一范例中并且如下面将进一步详细描述的,临床医生设备120可以从微博服务器130接收关于与临床医生相关联的健康相关主题的微博分析的结果的通知。
简况储存库125可以是存储用户简况的部件。具体而言,简况储存库125可以存储临床医生的用户简况。如下面将进一步详细描述的,微博服务器130可以生成可以被存储在简况储存库125中的用户简况。如果简况储存库125已经具有针对特定临床医生的用户简况,则相关性服务器130可以查询该简况储存库125以检索对应的用户简况。
微博服务器130可以是系统100的部件,其执行与示例性实施例的特征相关联的功能,其中,基于健康相关证据来确定针对微博的作者的认知偏差。图2示出了根据示例性实施例的图1的微博服务器130。微博服务器130可以在确定认知偏差和向临床医生通知认知偏差方面提供各种功能。虽然微博服务器130被描述为网络部件(具体为服务器),但是微博服务器130可以以各种方式得以实施,例如,便携式设备(例如,平板电脑、智能电话、膝上型电脑等),并入临床医生设备120,并入网站服务中的客户端固定设备(例如,台式终端)等。微博服务器130可以包括处理器205、存储器布置210、显示设备215、输入和输出(I/O)设备220、收发器225以及其他部件230(例如,成像器、音频I/O设备、电池、数据采集设备、用于将报告服务器130电连接到其他电子设备的端口等)。
处理器205可以被配置为运行相关性服务器125的多个应用。如下面将进一步详细描述的,处理器205可以使用多个引擎,包括简况引擎235,策划监控引擎240、图形引擎245、博客引擎250、偏差引擎255以及通知引擎260。简况引擎235可以通过各种查询来确定临床医生的兴趣简况。策划引擎240可以基于临床医生的兴趣简况来识别相关的知识和元数据。图形引擎245可以对可用证据进行标准化和排序,并且识别微博与证据的语义匹配以生成三维节点图。博客引擎250可以分析、清理和标准化微博或微博相关数据。偏差引擎255可以基于来自其他引擎的其他可用信息来识别微博的认知偏差。通知引擎260可以为临床医生生成确定的认知偏差的通知。
应当注意,上述应用和引擎(每个均是由处理器205运行的应用(例如,程序))仅是示例性的。与应用相关联的功能还可以被表示为一个或多个多功能程序的部件,微博服务器130的单独结合部件,或者可以是被耦合到微博服务器130的模块化部件,例如,具有或不具有固件的集成电路。
存储器210可以是被配置为存储与微博服务器130执行的操作有关的数据的硬件部件。具体而言,存储器210可以存储与各种引擎235-260有关的数据,例如,临床医生的用户简况和来自信息源105、110的数据。显示设备215可以是被配置为向用户显示数据的硬件部件,而I/O设备220可以是使得用户能够键入输入的硬件部件。例如,微博服务器130的管理员可以通过在I/O设备220键入输入,通过显示设备215上显示的用户接口来维护和更新微博服务器130的功能。应当注意,显示设备215和I/O设备220可以是单独的部件或被集成在一起,例如,触摸屏。收发器225可以是被配置为经由通信网络110发送和/或接收数据的硬件部件。
根据示例性实施例,微博服务器125可以执行各种不同的操作以确定微博的认知偏差。最初,如上所述,简况引擎235可以通过各种查询来确定临床医生的兴趣简况。当临床医生选择利用微博服务器130的服务时(例如,在由微博服务器130托管的网站上或运行连接到微博服务器130的应用时),可以向临床医生提供表格或者请求临床医生键入信息。具体而言,临床医生可以(例如从预先生成的健康相关主题的列表中)选择感兴趣的健康相关主题并在简明的用户兴趣简况中提供对应的细节。感兴趣的健康相关主题可以包括一般主题(例如,心脏病、癌症、神经病症等)或者可以更为具体(例如,冠状动脉疾病、肺癌、孤独症等)。临床医生可以在与微博服务器130的查询接口中键入细节作为非结构化文本。
应当注意,每当临床医生选择先前未选择的与独特的感兴趣的健康相关主题时,可以使用简况引擎235。例如,当临床医生选择了感兴趣的健康相关主题并且已经键入了对应的细节时,简况引擎235可以生成针对与所选择的健康相关主题有关的临床医生的兴趣简况(例如,可以被存储在简况储存库125中)。每当临床医生选择新的、独特的健康相关主题时,可以用对应于所选择的健康相关主题的兴趣简况来更新临床医生的用户简况。
还应当注意,基于手动提供的输入生成用户简况和/或兴趣简况的简况引擎235仅是示例性的。根据另一示例性实施例,简况引擎235可以被配置为自动识别临床医生感兴趣的主题,并且使用搜集临床医生的信息并分析该信息的各种操作来确定所识别的感兴趣的主题的兴趣简况。例如,简况引擎235可以利用监视器或接收来自信息源105、110的临床医生的信息,该信息提供关于感兴趣的主题和兴趣简况的见解。
如上所述,策划引擎240可以基于临床医生的兴趣简况来识别相关的知识和元数据。策划引擎240可以解析所选择的健康相关主题的用户简况和/或兴趣简况,以通过从经验证的证据源吸收关于所选择的健康相关主题的现有知识来建立策划知识数据库。例如,信息源105、110可以包括经验证的在线资源、库、已发布的生物医学文献等。因此,所选择的健康相关主题可以具有与之相关联的所有相关的和经验证的证据。
如上所述,图形引擎245可以对可用证据进行标准化和排序,并且识别微博与证据的语义匹配以生成三维节点图。最初,应当注意,图形引擎245和图形的使用仅是示例性的。示例性实施例可以利用任何如下机制:其中,来自策划引擎240的信息将被组织以与示例性实施例的后续方面一起使用。此外,应当注意,三维节点图的使用仅是示例性的,并且同样可以使用任何图形或表示。
图形引擎245可以基于各种关系将来自策划引擎240的信息转换成诸如三维节点图的知识图状结构。具体而言,关系可以是代理-动作-患者(AAP)关系,其反映由语义角色标记操作识别的语义角色。在说明性范例中,句子“用户在窗口处投掷球”的AAP关系可能需要“用户”为代理,“投掷”为动作,“球”为患者,以及“窗口”为捐助者(受行动间接影响的实体)。可以通过用于转换成三维节点图的语义角色到图形操作来摄取根据策划引擎240的信息确定的AAP关系。如本文将使用的,根据策划信息所得到的三维节点图将被称为“策划图”。
应当注意,利用AAP关系的三维节点图仅是示例性的。根据另一示例性实施例,图形引擎245可以使用其他类型的关系,例如,短语-词-短语(PWP)关系。本领域技术人员将理解,PWP关系可以用于其他目的,例如表示复杂关系。
图形引擎245可以进一步使得基于由策划引擎240搜集的证据中存在的排序关键词来加权语义关系。例如,图形引擎245可以利用耙功能,其中,利用现有的关键词提取库来识别排序的关键词。因此,由图形引擎245生成的三维节点图可以是表示由策划引擎240在策划信息中识别的因果关系的加权图。因此,可以生成加权策划图。
图3示出了根据示例性实施例的生成加权策划图345的过程流程300。过程流程300图示了可以生成加权策划图345的一种特定方式。具体而言,过程流程300可以涉及由策划引擎240和图形引擎245执行的操作。应当注意,过程流程300仅是示例性的,并且示例性实施例可以利用其他机制或修改的过程流程来生成加权策划图345。如上所述,示例性实施例可以利用其中生成策划图的第一部分和其中确定加权的第二部分,第一部分和第二部分被组合以生成加权策划图。如下面将进一步详细描述的,第一部分可以包括多个过程305-325,而第二部分可以包括多个过程305、330、335。第一部分和第二部分可以组合以用于过程340来生成加权策划图345。
过程流程300可以包括过程305,在过程305中,接收与证据相关联的文本。具体而言,可以使用语义角色标记(SRL)操作来策划可以由用户识别的证据文本和/或在线源,如过程320所示。在过程320中的SRL操作之前,过程流程300可以包括其中执行文本清理操作的过程310和其中执行句子分割操作的过程315。因此,来自过程305的文本可以针对过程320进行标准化。SRL操作的输出可以是关于在文本的短语中标识的动词的一组语义关系。例如,该关系可以包括上述AAP关系。因此,在过程325中,语义关系可以被转换为标识代理、患者、捐助者、位置、时间等的资源描述格式(RDF)三元组。代理可以对应于执行动作的主体,而患者可以是指该动作的接受者。动词可以识别此关系中的动作。以这种方式,可以针对来自过程305的文本建立多个关系。
在第二部分中,可以通过具有诸如来自上述关键词提取操作的术语频率/逆文档频率的度量来对三元组或关系进行加权。例如,在过程330中,可以相对于用户的域和兴趣来微调所提供的权重。权重可以指示词相对于策划文本的相对重要性。在过程335中,关键词权重可以被编码到语义三元组中,并且每个RDF三元组可以具有累积且独立的权重分数。如图所示,配对可以是词(k)到词(v)的权重。
通过上述部分的组合,过程340可能需要将关系保存到加权策划图345(例如,三维节点图)中。具体而言,三元组可以利用与累积重量(W)相关联的代理(A)、患者(P)、位置(L)、时间(T)以及关系(R)。给定新的微博文本,可以从文本中提取语义角色,以基于语义相似性操作、基于深度学习的模型、其他机器学习模型等来识别加权策划图中的相似节点,使得对应于策划知识对文本进行排序。
如上所述,博客引擎250可以分析、清理和标准化微博或微博相关数据。最初,博客引擎250可以从信息源105、110接收一个或多个微博。微博可以涉及各种主题中的任何一个,特别是健康相关主题。然而,在进行进一步分析之前,微博可能不知道微博的主题。因此,博客引擎250可以确定新微博何时可用并执行本文的操作。
博客引擎250可以将来自各种源的微博标准化。例如,微博可以是作者在在线站点上发布的独立消息。在另一范例中,可以从社交媒体对话中提取微博。当微博变得可用时,博客引擎250还可以实时地执行该操作。根据微博中使用的语言,博客引擎250可以利用自然语言处理(NLP)功能来分析语法并从微博中提取语义元素和关键词。具体而言,NLP功能可以利用各种不同的操作。在第一范例中,基于规则的通用操作可以用于句子边界检测,例如,句点、问号、感叹号等。在第二范例中,语言模型操作可以用于词性标记。在第三范例中,在综合英语语料库上训练的机器学习分类器操作可以用于短语组块(例如,将语法语句分解成表示名词短语、形容词短语、动词短语等的组块)。在第四范例中,可以使用词典驱动的操作来将组块和首字母缩略词映射到识别出的英语关键词。在第五范例中,消除歧义操作可以用于使用文本中的上下文元素来消除提取的词的意义的歧义(例如,以确定叙述中的“银行”(强调“经济”)是指金融机构而不是指“河流或湖泊的边界”)。
应当注意,可以针对其他方面分析微博。例如,博客引擎250可以包括另外的功能或子引擎,使得可以分析微博的情绪和/或意见。具体而言,可以针对情绪来分析标准化微博,例如,正面情绪、负面情绪或中性情绪。还可以针对主观性来分析标准化微博,以确定意见是主观的还是客观的。可以使用上述AAP关系来进一步分析标准化微博。可以利用各种用于情绪分析和意见挖掘的工具来分别提取微博的极性和主观性。本领域技术人员将理解,度量主观性可以帮助识别微博武断的程度。
来自博客引擎250的信息还可以被提供给图形引擎245,使得还可以生成针对微博的三维节点图。如上所述,还可以用AAP关系来分析微博。因此,利用上述针对来自策划引擎240的策划信息的基本类似的操作,标准化微博及其信息可以用于生成三维节点图。由于三维节点图仅涉及微博,因此三维节点图远不及来自临床医生的所选择的健康相关主题的三维节点图复杂的可能性更高。然而,应当注意,图形引擎245可以通过使用识别语义上相似的词的基于深度学习的神经词/短语嵌入操作而利用进一步的操作来扩展微博中的关系的词汇。如文本将使用的,根据微博所得到的三维节点图将被称为“微博图”。
如上所述,偏差引擎255可以基于来自其他引擎的其他可用信息来识别微博的认知偏差。具体而言,偏差引擎255可以使用来自简况引擎235和策划引擎240的信息来接收针对来自临床医生的所选择的健康相关主题的加权策划图,并且可以使用来自博客引擎250的信息来接收针对微博的微博图。偏差引擎255可以利用加权策划图和微博图来执行“模糊图步行”操作,其中,加权策划图用微博图进行参考。例如,模糊图步行可以最初用于确定微博是否与临床医生的所选择的健康相关主题具有任何相关性。基于微博图的神经嵌入的扩展词汇可以增加与图步行期间加权策划图中的证据匹配的回忆。
基于上述操作,偏差引擎255可以基于证据来源中的加权证据的部分匹配,微博中表达的情绪以及加权策划图中对该情绪的支持,为微博生成“模糊匹配”分数。具体而言,微博可以被分类成四类认知偏差中的一种:(1)冷漠的,(2)支持的,(3)关心的,以及(4)偏执的。可以基于模糊匹配分数、情绪和意见分数来识别这些类别。可以利用模糊匹配分数、情绪和意见分数来生成认知值。这些类别中的每个类别均可以具有认知范围,使得认知值可以指示确定哪个认知偏差。例如,“冷漠的”可以是从零到第一阈值的范围;“支持的”可以是从第一阈值到第二阈值的范围;“关心的”可以是从第二阈值到第三阈值的范围;并且“偏执的”可以是高于第三阈值的范围。
通知引擎260可以基于偏差引擎255生成的结果为临床医生生成通知。例如,可以实时地向临床医生报告微博的认知偏差,以促进与作者的即时和有针对性的通信/干预。具体而言,通信可以是教育或护理服务(例如,咨询)方面,以确保微博的作者更好地了解以做出正确的健康相关决策,并且被激励以采取引起期望的健康结果的积极步骤。
应当注意,示例性实施例可以用于各种不同的实施方式中,并且提供用于各种不同原因的结果。在第一范例中,临床医生可以在有针对性的患者方法中利用示例性实施例的特征。具体而言,所分析的微博可以由临床医生的患者创作。因此,有针对性的患者方法可以涉及何时识别患者的微博并且可以向临床医生提供所识别的认知偏差。以这种方式,可以向临床医生提供针对特定患者的通知,并且因此临床医生可以根据该知识更适当地满足针对患者的健康护理。例如,如果微博指示无意识的认知偏差,则临床医生可以理解患者已经提到针对所选择的健康相关主题的特定陈述,但是对于该健康相关主题中的已知验证证据而言,并未强烈暗示特定方向。在另一范例中,如果微博指示偏执的认知偏差,则临床医生可以确定与所选择的健康相关主题有关的进一步的健康护理可以保证提供健康护理以适应患者的认知偏差的特定方式。
在第二范例中,临床医生可以在有针对性的偏差方法中利用示例性实施例的特征。具体而言,临床医生可以接收具有至少为预定认知偏差的认知偏差的微博作者的通知。例如,使用上述四种类型的偏差,临床医生可以接收至少具有关心或偏执的认知偏差的微博的通知。临床医生可以向这些作者提供信息,以减轻作者可能具有的任何恐惧。
在第三范例中,临床医生可以在一般受众方法中利用示例性实施例的特征。具体而言,临床医生可以接收通知,该通知提供对所选择的健康相关主题的认知偏差的概述。例如,使用上述四种认知偏差,所选择的健康相关主题可以基于被识别为与所选择的健康相关主题有关的微博来指示每种认知偏差的百分比。以这种方式,临床医生可以了解到一般受众对所选择的健康相关主题所具有的一般认知偏差。
在第四范例中,实体可以在轮询方法中利用示例性实施例的特征。具体而言,轮询方法可以提供认知偏差,或者可以针对受众的各种不同参数执行认知对偏差的概述(例如,如针对一般受众方法所执行的认知偏差的概述)。例如,可以基于受众的地理位置来测量针对所选择的健康相关主题的认知偏差。在另一范例中,可以基于受众的年龄组来测量针对所选择的健康相关主题的认知偏差。其他范例可以包括国籍、历史条件等。以这种方式,可以针对各种参数的各种主题提供对认知偏差的一般知识。
图4示出了根据示例性实施例的用于确定微博的分类输出的方法400。具体而言,方法400可以涉及示例性实施例的机制,其中,分类输出是基于微博的健康相关主题中的经验证的证据与微博相关联的认知偏差。因此,将从微博服务器130的角度描述方法400。还将关于图1的系统100和图2的微博服务器130的多个引擎235-260来描述方法400。
在步骤405中,微博服务器130经由简况引擎235接收来自临床医生的查询。如上所述,临床医生可以选择健康相关主题并提供与健康相关主题相关联的细节。临床医生可以使用各种不同的方式(例如,非结构化文本)来键入信息。在步骤410中,微博服务器130经由简况引擎235基于主题和细节来生成临床医生的兴趣简况。例如,微博服务器130可以解析文本并利用NPL操作。兴趣简况可以特定于所选择的健康相关主题并且与临床医生的用户简况相关联。应当注意,如果兴趣简况和/或用户简况已经存在并且被存储在简况储存库125中,则微博服务器130可以检索简况。
在步骤415中,微博服务器130经由策划引擎240可以接收外部数据。具体而言,外部数据可以是来自与所选择的健康相关主题有关的经验证的各种来源(例如,信息源105、110)的证据。在步骤420中,微博服务器130可以经由策划引擎240基于与所选择的健康相关主题有关的临床医生的兴趣简况来策划外部数据。在步骤425中,微博服务器130可以经由图形引擎245生成策划图。如上所述,策划图可以是三维节点图,其中,针对策划信息确定AAP关系。还可以基于外部数据中的排序关键词对策划图进行加权,以生成加权策划图。
在步骤430中,微博服务器130经由博客引擎250可以接收微博。例如,经由信息源105、110,微博服务器130可以确定新微博何时可用。当识别出新微博时,在步骤435中,微博服务器130经由博客引擎250可以对语言进行标准化。如上所述,微博可以利用非常规的语法、结构和符号。因此,微博服务器130可以利用各种不同的操作对微博的语言进行标准化。在步骤440中,微博服务器130经由图形引擎245可以以与加权策划图基本类似的方式生成微博图。
在步骤445中,微博服务器130经由偏差引擎255可以基于加权策划图和微博图来确定针对微博的分类输出。例如,可以利用模糊图形步行操作,其中,加权策划图和微博图彼此参考。随后,微博服务器130可以确定微博的认知偏差。例如,认知偏差可以是冷漠的、支持的、关心的或偏执的。因此,在步骤450中,微博服务器130经由通知引擎260可以生成与所确定的认知偏差相对应的通知。
示例性实施例提供了基于来自微博的健康相关主题的经验证的来源的证据来确定微博的认知偏差的设备、系统和方法。根据示例性实施例的机制可以接收来自临床医生的信息以确定其中来自经验证的来源的证据被策划的所选择的健康相关主题。微博可以与所选择的健康相关主题相关联,使得微博和证据被用于确定微博的认知偏差。
本领域技术人员将理解,上述示例性实施例可以以任何合适的软件或硬件配置或其组合来实施。用于实施示例性实施例的示例性硬件平台可以包括例如具有兼容操作系统的Intel x86平台、Windows平台、Mac平台和MAC OS、具有诸如iOS、Android等操作系统的移动设备。在另外的范例中,上述方法的示例性实施例可以被实施为包含被存储在计算机可读存储介质上的代码行的计算机程序产品,该代码行可以在处理器或微处理器上运行。存储介质可以例如是兼容或格式化的本地或远程数据储存库,以便使用任何存储操作与上述操作系统一起使用。
对于本领域技术人员显而易见的是,在不脱离本公开内容的精神或范围的情况下,可以在本公开内容中进行各种修改。因此,本公开内容旨在覆盖本公开内容的修改和变化,只要它们落入权利要求及其等价方案的范围内。
Claims (7)
1.一种方法,包括:
在微博服务器处:
接收来自临床医生的选择,所述选择指示健康相关主题并且包括所述健康相关主题的详细信息;
基于所述健康相关主题和所述详细信息来生成针对所述临床医生的兴趣简况;
基于所述临床医生的与选定的健康相关主题相关的所述兴趣简况确定来自经验证的信息源的所述健康相关主题的证据数据;
使用语义角色标记操作来策划所述证据数据以识别语义关系,由此生成策划3D节点图;
基于关键词提取数据库从所述证据数据来识别排序的关键词;
基于所述排序的关键词利用指示所述排序的关键词关于策划的证据数据的相对重要性的权重来对所述策划3D节点图中的所述语义关系进行加权,由此生成加权策划3D节点图;
接收微博,所述微博与所述健康相关主题相关联;
基于所述微博生成微博图,所述微博图指示所述微博的微博语义关系;并且
基于所述加权策划3D节点图和所述微博图来确定所述微博的认知偏差。
2.根据权利要求1所述的方法,其中,所述策划3D节点图指示所述证据数据的策划的语义关系,并且所述语义关系为代理、动作和患者之间的语义关系。
3.根据权利要求1所述的方法,其中,所述微博语义关系利用根据基于深度学习的神经词和短语嵌入操作而扩展的词汇表术语来识别语义上相似的词。
4.根据权利要求1所述的方法,还包括:
确定所述微博的情绪和意见中的至少一个,以分别识别与所述微博相关联的极性和主观性。
5.根据权利要求1所述的方法,其中,所述认知偏差是冷漠的、支持的、关心的和偏执的中的一种。
6.一种微博服务器,包括:
收发器,其经由通信网络进行通信,所述收发器被配置为接收来自临床医生的选择,所述选择指示健康相关主题并且包括所述健康相关主题的详细信息,所述收发器被配置为接收微博,所述微博与所述健康相关主题相关联;
存储器,其存储可执行程序;以及
处理器,其运行所述可执行程序,所述可执行程序使得所述处理器执行操作,所述操作包括:
基于所述健康相关主题和所述详细信息来生成针对所述临床医生的兴趣简况;
基于所述临床医生的与选定的健康相关主题相关的所述兴趣简况确定来自经验证的信息源的所述健康相关主题的证据数据,
使用语义角色标记操作来策划所述证据数据以识别语义关系,由此生成策划3D节点图;
基于关键词提取数据库从所述证据数据来识别排序的关键词;
基于所述排序的关键词利用指示所述排序的关键词关于策划的证据数据的相对重要性的权重来对所述策划3D节点图中的所述语义关系进行加权,由此生成加权策划3D节点图,
基于所述微博生成微博图,所述微博图指示所述微博的微博语义关系,并且
基于所述加权策划3D节点图和所述微博图来确定所述微博的认知偏差。
7.一种方法,包括:
在微博服务器处:
接收来自临床医生的选择,所述选择指示健康相关主题并且包括所述健康相关主题的详细信息;
基于所述健康相关主题和所述详细信息生成针对所述临床医生的兴趣简况;
基于所述临床医生的与选定的健康相关主题相关的所述兴趣简况确定来自经验证的信息源的所述健康相关主题的证据数据;
使用语义角色标记操作来策划所述证据数据以识别语义关系,由此生成策划3D节点图;
基于关键词提取数据库从所述证据数据来识别排序的关键词;
基于所述排序的关键词利用指示所述排序的关键词关于策划的证据数据的相对重要性的权重来对所述策划3D节点图中的所述语义关系进行加权,由此生成加权策划3D节点图;
接收多个微博,所述微博中的每个微博与所述健康相关主题相关联;
基于所述多个微博中的每个微博生成微博图,所述微博图指示相应微博的微博语义关系;
基于所述加权策划3D节点图和针对相应微博的所述微博图来确定针对所述微博中的每个微博的相应的认知偏差;并且
确定针对与所述微博相关联的受众的总体认知偏差。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662301250P | 2016-02-29 | 2016-02-29 | |
US62/301,250 | 2016-02-29 | ||
US201662415541P | 2016-11-01 | 2016-11-01 | |
US62/415,541 | 2016-11-01 | ||
PCT/IB2017/051154 WO2017149443A1 (en) | 2016-02-29 | 2017-02-28 | Device, system, and method for classification of cognitive bias in microblogs relative to healthcare-centric evidence |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108780660A CN108780660A (zh) | 2018-11-09 |
CN108780660B true CN108780660B (zh) | 2023-10-20 |
Family
ID=58358765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780014043.7A Active CN108780660B (zh) | 2016-02-29 | 2017-02-28 | 相对于以健康护理为中心的证据对微博中的认知偏差进行分类的设备、系统和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200168343A1 (zh) |
EP (1) | EP3423971A1 (zh) |
CN (1) | CN108780660B (zh) |
WO (1) | WO2017149443A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11934969B2 (en) | 2019-10-01 | 2024-03-19 | International Business Machines Corporation | Bias identification in cognitive computing systems |
US11475331B2 (en) | 2020-06-25 | 2022-10-18 | International Business Machines Corporation | Bias source identification and de-biasing of a dataset |
CN113609851A (zh) * | 2021-07-09 | 2021-11-05 | 浙江连信科技有限公司 | 心理学上想法认知偏差的识别方法、装置及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1325513A (zh) * | 1998-09-09 | 2001-12-05 | 发明机器公司 | 具有知识生成能力的文档语义分析/选择 |
CN103493080A (zh) * | 2011-04-28 | 2014-01-01 | 脸谱公司 | 社交网络系统中的认知相关性定位 |
CN103544242A (zh) * | 2013-09-29 | 2014-01-29 | 广东工业大学 | 面向微博的情感实体搜索系统 |
CN103559233A (zh) * | 2012-10-29 | 2014-02-05 | 中国人民解放军国防科学技术大学 | 微博中网络新词抽取方法和微博情感分析方法及系统 |
CN103927297A (zh) * | 2014-04-13 | 2014-07-16 | 北京工业大学 | 基于证据理论的中文微博可信度评估方法 |
CN104254857A (zh) * | 2012-06-08 | 2014-12-31 | 惠普发展公司,有限责任合伙企业 | 患者信息接口 |
US9009024B2 (en) * | 2011-10-24 | 2015-04-14 | Hewlett-Packard Development Company, L.P. | Performing sentiment analysis |
WO2015053607A1 (en) * | 2013-10-10 | 2015-04-16 | Mimos Berhad | System and method for semantic-level sentiment analysis of text |
CN104794208A (zh) * | 2015-04-24 | 2015-07-22 | 清华大学 | 基于微博文本上下文信息的情绪分类方法及系统 |
CN105308601A (zh) * | 2013-06-04 | 2016-02-03 | 皇家飞利浦有限公司 | 健康护理支持系统和方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6654735B1 (en) * | 1999-01-08 | 2003-11-25 | International Business Machines Corporation | Outbound information analysis for generating user interest profiles and improving user productivity |
US7089504B1 (en) * | 2000-05-02 | 2006-08-08 | Walt Froloff | System and method for embedment of emotive content in modern text processing, publishing and communication |
US8209321B2 (en) * | 2007-08-31 | 2012-06-26 | Microsoft Corporation | Emphasizing search results according to conceptual meaning |
US20110251848A1 (en) * | 2010-04-08 | 2011-10-13 | Health Invest International Limited | Global health care community and medical record access website |
US8898798B2 (en) * | 2010-09-01 | 2014-11-25 | Apixio, Inc. | Systems and methods for medical information analysis with deidentification and reidentification |
US9087048B2 (en) * | 2011-06-10 | 2015-07-21 | Linkedin Corporation | Method of and system for validating a fact checking system |
US20140272842A1 (en) * | 2013-03-15 | 2014-09-18 | Predinex UG (haftungsbeschränkt) | Assessing cognitive ability |
US20150324527A1 (en) * | 2013-03-15 | 2015-11-12 | Northrop Grumman Systems Corporation | Learning health systems and methods |
US9466024B2 (en) * | 2013-03-15 | 2016-10-11 | Northrop Grumman Systems Corporation | Learning health systems and methods |
US20140337328A1 (en) * | 2013-05-09 | 2014-11-13 | Veooz Labs Private Limited | System and method for retrieving and presenting concept centric information in social media networks |
US9984067B2 (en) * | 2014-04-18 | 2018-05-29 | Thomas A. Visel | Automated comprehension of natural language via constraint-based processing |
US10417568B2 (en) * | 2014-05-22 | 2019-09-17 | International Business Machines Corporation | Discovering cognition bias toward data presentation styles through file system analysis |
US10262261B2 (en) * | 2014-06-09 | 2019-04-16 | Cognitive Scale, Inc. | Method for cognitive information processing |
US10325205B2 (en) * | 2014-06-09 | 2019-06-18 | Cognitive Scale, Inc. | Cognitive information processing system environment |
-
2017
- 2017-02-28 WO PCT/IB2017/051154 patent/WO2017149443A1/en active Application Filing
- 2017-02-28 US US16/080,041 patent/US20200168343A1/en not_active Abandoned
- 2017-02-28 CN CN201780014043.7A patent/CN108780660B/zh active Active
- 2017-02-28 EP EP17711762.9A patent/EP3423971A1/en not_active Withdrawn
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1325513A (zh) * | 1998-09-09 | 2001-12-05 | 发明机器公司 | 具有知识生成能力的文档语义分析/选择 |
CN103493080A (zh) * | 2011-04-28 | 2014-01-01 | 脸谱公司 | 社交网络系统中的认知相关性定位 |
US9009024B2 (en) * | 2011-10-24 | 2015-04-14 | Hewlett-Packard Development Company, L.P. | Performing sentiment analysis |
CN104254857A (zh) * | 2012-06-08 | 2014-12-31 | 惠普发展公司,有限责任合伙企业 | 患者信息接口 |
CN103559233A (zh) * | 2012-10-29 | 2014-02-05 | 中国人民解放军国防科学技术大学 | 微博中网络新词抽取方法和微博情感分析方法及系统 |
CN105308601A (zh) * | 2013-06-04 | 2016-02-03 | 皇家飞利浦有限公司 | 健康护理支持系统和方法 |
CN103544242A (zh) * | 2013-09-29 | 2014-01-29 | 广东工业大学 | 面向微博的情感实体搜索系统 |
WO2015053607A1 (en) * | 2013-10-10 | 2015-04-16 | Mimos Berhad | System and method for semantic-level sentiment analysis of text |
CN103927297A (zh) * | 2014-04-13 | 2014-07-16 | 北京工业大学 | 基于证据理论的中文微博可信度评估方法 |
CN104794208A (zh) * | 2015-04-24 | 2015-07-22 | 清华大学 | 基于微博文本上下文信息的情绪分类方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2017149443A1 (en) | 2017-09-08 |
CN108780660A (zh) | 2018-11-09 |
EP3423971A1 (en) | 2019-01-09 |
US20200168343A1 (en) | 2020-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11810671B2 (en) | System and method for providing health information | |
US10236082B1 (en) | Personal assistant computing system monitoring | |
US11031103B2 (en) | Personalized questionnaire for health risk assessment | |
US10366107B2 (en) | Categorizing questions in a question answering system | |
US9785749B2 (en) | Machine training and search engine for providing specialized cognitive healthcare apparatus | |
Omoregbe et al. | Text messaging-based medical diagnosis using natural language processing and fuzzy logic | |
US20230245651A1 (en) | Enabling user-centered and contextually relevant interaction | |
US10812424B1 (en) | System and method for quantifying mental health within a group chat application | |
US10585901B2 (en) | Tailoring question answer results to personality traits | |
US9996604B2 (en) | Generating usage report in a question answering system based on question categorization | |
US9508360B2 (en) | Semantic-free text analysis for identifying traits | |
US11158427B2 (en) | Machine learning for medical screening recommendations based on patient activity information in social media | |
US11495332B2 (en) | Automated prediction and answering of medical professional questions directed to patient based on EMR | |
US11288296B2 (en) | Device, system, and method for determining information relevant to a clinician | |
Chang et al. | Accelerating mixed methods research with natural language processing of big text data | |
CN108780660B (zh) | 相对于以健康护理为中心的证据对微博中的认知偏差进行分类的设备、系统和方法 | |
Yang et al. | Deep learning-based natural language processing in ophthalmology: applications, challenges and future directions | |
Ghamdi et al. | An ontology-based system to predict hospital readmission within 30 days | |
Imuede et al. | Sentiment analysis as an indicator to evaluate gender disparity on sexual violence tweets in South Africa | |
Desmet | Finding the online cry for help: automatic text classification for suicide prevention | |
GB2616369A (en) | Sentiment detection using medical clues | |
Saxena | Examining Reactions about COVID-19 Vaccines: A Systematic Review of Studies Utilizing Deep Learning for Sentiment Analysis | |
Vasiliou | Implementation of intelligent system to support remote telemedicine services using chatbots technology | |
Shivarkar | Improving sentiment analysis of disaster related social media content | |
Yadav et al. | Chatbot-Based Medical Diagnosis Using Natural Language Processing and Classifier |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |