CN111274365A - 基于语义理解的智能问诊方法、装置、存储介质及服务器 - Google Patents

基于语义理解的智能问诊方法、装置、存储介质及服务器 Download PDF

Info

Publication number
CN111274365A
CN111274365A CN202010117542.2A CN202010117542A CN111274365A CN 111274365 A CN111274365 A CN 111274365A CN 202010117542 A CN202010117542 A CN 202010117542A CN 111274365 A CN111274365 A CN 111274365A
Authority
CN
China
Prior art keywords
inquiry
text information
session
information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010117542.2A
Other languages
English (en)
Other versions
CN111274365B (zh
Inventor
石万美
罗国基
林瞰
徐莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Qilekang Digital Health Medical Technology Co ltd
Original Assignee
Guangzhou 7lk Pharmaceutical Chain Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou 7lk Pharmaceutical Chain Co ltd filed Critical Guangzhou 7lk Pharmaceutical Chain Co ltd
Priority to CN202010117542.2A priority Critical patent/CN111274365B/zh
Publication of CN111274365A publication Critical patent/CN111274365A/zh
Application granted granted Critical
Publication of CN111274365B publication Critical patent/CN111274365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Human Computer Interaction (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于语义理解的智能问诊方法、装置、存储介质及服务器;其中,所述方法包括:基于用户终端获得用户输入所形成的文本信息,并根据文本信息构建对应的会话流程;在会话流程内对文本信息进行实体信息抽取处理,获得文本信息对应的实体信息;在会话流程内针对文本信息对应的实体信息构建对应的问诊会话,并获取问诊会话中的用户回答文本信息;基于用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字;基于问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例;基于相互匹配病例获得用户的问诊结果。在本发明实施例中,实现用户线上快速智能问诊,并且保证问诊结果的准确性及用户的体验性。

Description

基于语义理解的智能问诊方法、装置、存储介质及服务器
技术领域
本发明涉及医疗大数据技术领域,尤其涉及一种基于语义理解的智能问诊方法、装置、存储介质及服务器。
背景技术
今年来,随着人民的生活水平的不断提高,人们对身体健康的重视程度越来越高,但伴随国内的人口老龄化成为趋势,患有各种慢病,如,高血压,糖尿病,高血压等,或者一般的普通病,如,感冒,发烧等;现在随着互联网的发展,在一般情况下均可以线上智能问诊,但现在的线上问诊一般都是线上医生回答的,大部分无法实时回答,使得用户的体验非常不好。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种基于语义理解的智能问诊方法、装置、存储介质及服务器,实现用户线上快速智能问诊,并且保证问诊结果的准确性及用户的体验性。
为了解决上述技术问题,本发明实施例提供了一种基于语义理解的智能问诊方法,所述方法包括:
基于用户终端获得用户输入所形成的文本信息,并根据所述文本信息构建对应的会话流程;
在所述会话流程内对所述文本信息进行实体信息抽取处理,获得所述文本信息对应的实体信息,所述文本信息对应的实体信息包括不限于所述文本信息中所包含的性别、年龄、基本症状特征;
在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话,并获取所述问诊会话中的用户回答文本信息;
基于所述用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字;
基于所述问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例;
基于所述相互匹配病例获得所述用户的问诊结果。
可选的,所述基于用户终端获得用户输入所形成的文本信息,包括:
基于用户在所述用户终端所提供的操作界面上输入的文字信息获得所述文本信息;或,
基于用户通过所述用户终端的音频采集设备输入的语音信息进行文本信息转换处理,获得所述文本信息。
可选的,所述根据所述文本信息构建对应的会话流程,包括:
根据所述文本信息构建文字特征向量列表;
将构建文字特征向量列表输入NLP模型中,在所述NLP模型中利用N-Gram统计语言算法对所述文字特征向量列表中的每一个文字特征向量进行权值预设;
将预设好权值的文字特征向量经过所述NLP模型进行分析处理,输出分析标签;
基于所述分析标签进行对应的会话流程构建处理。
可选的,所述在所述会话流程内对所述文本信息进行实体信息抽取处理,获得所述文本信息对应的实体信息,包括:
基于长短期记忆网络和条件随机场在所述会话流程内对所述文本信息进行文字实体抽取处理,获得抽取实体信息;
对所述抽取实体信息进行实体融合归一化处理,获得所述文本信息对应的实体信息。
可选的,所述在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话,并获取所述问诊会话中的用户回答文本信息,包括:
在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话的会话问题,获得所述会话问题的回答文本信息;
对所述回答文本信息进行症状实体信息提取处理,获得症状实体信息;
根据所述症状实体信息构建对应的问诊会话的会话问题,直至完成所有的问诊流程会话;
将所有的回答文本信息按照问诊会话的会话问题顺序进行文本整理处理,获得所述问诊会话中的用户回答文本信息。
可选的,所述基于所述用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字,包括:
基于TF-IDF算法对所述用户回答文本信息进行文字会话的初始关键字提取处理,获取初始关键字;
基于所述文本信息对应的实体信息、症状实体信息对所述初始关键字进行筛选处理,获得问诊会话对应的关键字。
可选的,所述基于所述问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例,包括:
利用所述问诊会话对应的关键字为中心与所述病例数据库中索引关键字进行聚类,获取聚类结果;
选取所述聚类结果中聚类密度大于预设值的索引关键字作为最终索引关键字;
基于所述最终索引关键字在所述病例数据库进行匹配索引检索,获得相互匹配病例。
另外,本发明实施例还提供了一种基于语义理解的智能问诊装置,,所述装置包括:
会话流程构建模块:用于基于用户终端获得用户输入所形成的文本信息,并根据所述文本信息构建对应的会话流程;
实体抽取模块:用于在所述会话流程内对所述文本信息进行实体信息抽取处理,获得所述文本信息对应的实体信息,所述文本信息对应的实体信息包括不限于所述文本信息中所包含的性别、年龄、基本症状特征;
问诊会话构建模块:用于在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话,并获取所述问诊会话中的用户回答文本信息;
关键字提取模块:用于基于所述用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字;
检索匹配模块:用于基于所述问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例;
相互匹配模块:用于基于所述相互匹配病例获得所述用户的问诊结果。
另外,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述中任意一项所述的智能问诊方法。
另外,本发明实施例还提供了一种服务器,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于:执行根据上述中任意一项所述的智能问诊方法。
在本发明实施例中,通过根据用户输入的文本信息构建对应的会话流程,在该会话流程内进行实体抽取,并根据抽取的实体信息构建问诊会话,从而获得用户问诊回答文本信息,在进行关键字提取及检索匹配,向用户返回问诊结果,整一个流程无线在线医生参与,即可实现用户在线智能问诊,并且保证问诊结果的准确性及用户的体验性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明具体实施例中的基于语义理解的智能问诊方法的流程示意图;
图2是本发明具体实施例中的基于语义理解的智能问诊装置的结构组成示意图;
图3是本发明具体实施例中的服务器的结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例
请参阅图1,图1是本发明具体实施例中的基于语义理解的智能问诊方法的流程示意图。
如图1所示,一种基于语义理解的智能问诊方法,所述方法包括:
S11:基于用户终端获得用户输入所形成的文本信息,并根据所述文本信息构建对应的会话流程;
在本发明具体实施过程中,所述基于用户终端获得用户输入所形成的文本信息,包括:基于用户在所述用户终端所提供的操作界面上输入的文字信息获得所述文本信息;或,基于用户通过所述用户终端的音频采集设备输入的语音信息进行文本信息转换处理,获得所述文本信息。
进一步的,所述根据所述文本信息构建对应的会话流程,包括:根据所述文本信息构建文字特征向量列表;将构建文字特征向量列表输入NLP模型中,在所述NLP模型中利用N-Gram统计语言算法对所述文字特征向量列表中的每一个文字特征向量进行权值预设;将预设好权值的文字特征向量经过所述NLP模型进行分析处理,输出分析标签;基于所述分析标签进行对应的会话流程构建处理。
具体的,首先可以根据用户在对应的用户终端(一般为智能手机、平板或者PC端等设备)上安装可以连接对应的服务器的应用软件或者APP,在该用户终端上打开该应用软件或者APP进入对应的操作界面,用户通过该操作界面输入对应的文字信息;或者,在该用户终端上打开该应用软件或者APP进入对应的操作界面,点击相关的语音输入按钮,调用该用户终端内置的或者外置的麦克风设备,采集用户输入的语音信息,对采集到的语音信息通过自动语音识别算法(ASR)等对该语音进行识别,从而识别到相应的文字信息;对于上述的两种获得的文字信息,需要进行垃圾字符去除处理,形成对应的文本信息;具体的去除垃圾字符的规则为按照中文语法规则进行。
用于对应的文本信息来构建位置特征向量列表,是通过自然语言处理领域的词袋模型(BOF)与N-Gram特征相结合,既能准确分词又能调整分词后的顺序。词袋模型(BOF)由特征提取、特征聚类、特征编码、特征汇聚和分类器分类4部分组成的标准目标分类框架。N-Gram特征是基于统计语言模型的算法,又被称为一阶马尔科夫链,是将文本里面的内容按照字节进行大小为N的滑动窗口操作,形成了长度是N的字节片段序列。每一个字节片段称为gram,对所有的gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤,形成关键gram列表,也就是这个文本的向量特征空间;列表中的每一种gram就是一个特征向量维度;具体是,首先对输入的罪名字段信息进行语段序列粗分处理;然后在进行Bi-gram切割处理;最后进行过滤处理,获取特征向量列表。
该NLP分析模型架构采用输入、映射(隐藏)、输出的架构,其中X(1)到X(n)表示文本中每个词的特征向量,段落则可以用所有词的嵌入累加后的均值表示,最后从隐层再经过一次的非线性变换得到输出层的标签;模型输入一个词的序列(一段文本或者一句话),输出这个词序列属于不同类别的概率;隐层是由输入层求和并平均,乘以权重矩阵A得到的;输出层是由隐层乘以权重矩阵B得到的;为了改善运算时间,为了改善运行时间,该模型使用了层次Softmax技巧,建立在哈弗曼编码的基础上,对标签进行编码,能够极大地缩小模型预测目标的数量。
具体的,输出层是由隐层乘以权重矩阵B的公式如下:
Figure BDA0002391955890000061
其中,yn表示true label(真标签),xn表示特征向量列表(文档n归一化后的N-Gram特征),A和B分别表示权重矩阵;N=1,2,3,…,N为正整数。
在获得该分析标签之后,通过该分析标签确定用户需要问诊的病是属于慢病或者普通的病(感冒、发烧、腹泻等),然后构建对应的会话流程;通过上述方式构建会话流程,可以实现对用户所需要问诊进行一个大致的分类,方便后续在大致分类的基础上进行精确的针对性会话分类。
S12:在所述会话流程内对所述文本信息进行实体信息抽取处理,获得所述文本信息对应的实体信息,所述文本信息对应的实体信息包括不限于所述文本信息中所包含的性别、年龄、基本症状特征;
在本发明具体实施过程中,所述在所述会话流程内对所述文本信息进行实体信息抽取处理,获得所述文本信息对应的实体信息,包括:基于长短期记忆网络和条件随机场在所述会话流程内对所述文本信息进行文字实体抽取处理,获得抽取实体信息;对所述抽取实体信息进行实体融合归一化处理,获得所述文本信息对应的实体信息;所述文本信息对应的实体信息包括不限于所述文本信息中所包含的性别、年龄、基本症状特征。
具体的,在对应的会话流程内对该文本信息进行实体抽取处理,可以通过长短期记忆网络和条件随机场的方式在该会话流程内对该文本信息进行文字实体出去处理,从而获得抽取实体信息,采用长短期记忆网络和条件随机场的方式相结合进行实体抽取,可以更快、更准确的抽取实体信息;在抽取实体信息之后,需要进行融合归一化处理,即对抽取实体信息进行实体融合归一化处理,获得文本信息中的实体信息;通过实体融合归一化处理,可以对同一个实体信息,在不同称呼上实现融合,去除相应的冗余信息,提高后续的处理速度,并且使后续的理解根据到位,更有利于后续的交流回复;文本信息对应的实体信息包括不限于所述文本信息中所包含的性别、年龄、基本症状特征。
S13:在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话,并获取所述问诊会话中的用户回答文本信息;
在本发明具体实施过程中,所述在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话,并获取所述问诊会话中的用户回答文本信息,包括:在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话的会话问题,获得所述会话问题的回答文本信息;对所述回答文本信息进行症状实体信息提取处理,获得症状实体信息;根据所述症状实体信息构建对应的问诊会话的会话问题,直至完成所有的问诊流程会话;将所有的回答文本信息按照问诊会话的会话问题顺序进行文本整理处理,获得所述问诊会话中的用户回答文本信息。
具体的,首先是在该会话流程内针对文本信息对应的实体信息来构建问诊会话中的会话问题,即根据用户的性别、年龄和基本症状特征来构建对应的文字会话中的会话问题,并接收用户根据该会话问题的回答文本信息;然后再对该回答文本信息进行症状实体信息提取处理,具体的提取方式还是根据长短期记忆网络和条件随机场的方式进行提取,然后进行实体融合归一化处理,获得症状实体信息;然后再根据提取的症状实体信息构建对应的问诊会话的会话问题,并接收用户根据会话问题的回答文本信息,进行症状实体信息提取,并根据该症状实体信息构建相关的问诊会话的会话问题,直至完成所有的问诊流程会话;在问诊流程会话结束之后,将所有的用户回答文本信息按照问诊会话的会话问题顺序进行文本整理处理,从而获得该问诊会话中的用户回答文本信息;并且需要首先按照会话问题顺序进行冗余处理,去除用户回答文本信息中的冗余信息,之后再按照先后顺序进行文本整理处理,最终会的该问诊会话中的用户回答文本信息。
S14:基于所述用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字;
在本发明具体实施过程中,所述基于所述用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字,包括:基于TF-IDF算法对所述用户回答文本信息进行文字会话的初始关键字提取处理,获取初始关键字;基于所述文本信息对应的实体信息、症状实体信息对所述初始关键字进行筛选处理,获得问诊会话对应的关键字。
具体的,TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术;TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency);TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度;字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降;TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级;除了TF-IDF以外,因特网上的搜索引擎还会使用基于链接分析的评级方法,以确定文件在搜寻结果中出现的顺序;通过TF-IDF算法对来对用户回答文本信息进行文字会话的初始关键字提取处理,从而获取初始关键字;然后在结合文本信息对应的实体信息、症状实体信息对初始关键字进行筛选处理,获得问诊会话对应的关键字。
S15:基于所述问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例;
在本发明具体实施过程中,所述基于所述问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例,包括:利用所述问诊会话对应的关键字为中心与所述病例数据库中索引关键字进行聚类,获取聚类结果;选取所述聚类结果中聚类密度大于预设值的索引关键字作为最终索引关键字;基于所述最终索引关键字在所述病例数据库进行匹配索引检索,获得相互匹配病例。
具体的,在该病例数据库中对应所有的存储病例具有对应的索引关键字;然后利用上述步骤中获得的问诊会话对应的关键字为中心与上述的病例数据库中对应所有的存储病例具有对应的索引关键字进行k-means聚类,从而获得与问诊会话对应的关键字为中心的聚类结果;然后选择该最终索引关键字在该病例数据库中进行匹配索引检索从而获得索引结果,因为聚类结果中聚类的关键字太多,然后选择聚类结果中聚类密度大于预设值的索引关键字作为最终索引关键字;利用最终索引关键字在病例数据库进行匹配索引检索,获得相互匹配病例。
S16:基于所述相互匹配病例获得所述用户的问诊结果。
在本发明具体实施过程中,首先将相互匹配病例按照与问诊会话对应的关键字的相关度按照高低进行排序,选取最高前五位作为用户的问诊结果并且将其推送至用户终端的界面。
在本发明实施例中,通过根据用户输入的文本信息构建对应的会话流程,在该会话流程内进行实体抽取,并根据抽取的实体信息构建问诊会话,从而获得用户问诊回答文本信息,在进行关键字提取及检索匹配,向用户返回问诊结果,整一个流程无线在线医生参与,即可实现用户在线智能问诊,并且保证问诊结果的准确性及用户的体验性。
实施例
请参阅图2,图2是本发明具体实施例中的基于语义理解的智能问诊装置的结构组成示意图。
如图2所示,一种基于语义理解的智能问诊装置,,所述装置包括:
会话流程构建模块21:用于基于用户终端获得用户输入所形成的文本信息,并根据所述文本信息构建对应的会话流程;
在本发明具体实施过程中,所述基于用户终端获得用户输入所形成的文本信息,包括:基于用户在所述用户终端所提供的操作界面上输入的文字信息获得所述文本信息;或,基于用户通过所述用户终端的音频采集设备输入的语音信息进行文本信息转换处理,获得所述文本信息。
进一步的,所述根据所述文本信息构建对应的会话流程,包括:根据所述文本信息构建文字特征向量列表;将构建文字特征向量列表输入NLP模型中,在所述NLP模型中利用N-Gram统计语言算法对所述文字特征向量列表中的每一个文字特征向量进行权值预设;将预设好权值的文字特征向量经过所述NLP模型进行分析处理,输出分析标签;基于所述分析标签进行对应的会话流程构建处理。
具体的,首先可以根据用户在对应的用户终端(一般为智能手机、平板或者PC端等设备)上安装可以连接对应的服务器的应用软件或者APP,在该用户终端上打开该应用软件或者APP进入对应的操作界面,用户通过该操作界面输入对应的文字信息;或者,在该用户终端上打开该应用软件或者APP进入对应的操作界面,点击相关的语音输入按钮,调用该用户终端内置的或者外置的麦克风设备,采集用户输入的语音信息,对采集到的语音信息通过自动语音识别算法(ASR)等对该语音进行识别,从而识别到相应的文字信息;对于上述的两种获得的文字信息,需要进行垃圾字符去除处理,形成对应的文本信息;具体的去除垃圾字符的规则为按照中文语法规则进行。
用于对应的文本信息来构建位置特征向量列表,是通过自然语言处理领域的词袋模型(BOF)与N-Gram特征相结合,既能准确分词又能调整分词后的顺序。词袋模型(BOF)由特征提取、特征聚类、特征编码、特征汇聚和分类器分类4部分组成的标准目标分类框架。N-Gram特征是基于统计语言模型的算法,又被称为一阶马尔科夫链,是将文本里面的内容按照字节进行大小为N的滑动窗口操作,形成了长度是N的字节片段序列。每一个字节片段称为gram,对所有的gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤,形成关键gram列表,也就是这个文本的向量特征空间;列表中的每一种gram就是一个特征向量维度;具体是,首先对输入的罪名字段信息进行语段序列粗分处理;然后在进行Bi-gram切割处理;最后进行过滤处理,获取特征向量列表。
该NLP分析模型架构采用输入、映射(隐藏)、输出的架构,其中X(1)到X(n)表示文本中每个词的特征向量,段落则可以用所有词的嵌入累加后的均值表示,最后从隐层再经过一次的非线性变换得到输出层的标签;模型输入一个词的序列(一段文本或者一句话),输出这个词序列属于不同类别的概率;隐层是由输入层求和并平均,乘以权重矩阵A得到的;输出层是由隐层乘以权重矩阵B得到的;为了改善运算时间,为了改善运行时间,该模型使用了层次Softmax技巧,建立在哈弗曼编码的基础上,对标签进行编码,能够极大地缩小模型预测目标的数量。
具体的,输出层是由隐层乘以权重矩阵B的公式如下:
Figure BDA0002391955890000111
其中,yn表示true label(真标签),xn表示特征向量列表(文档n归一化后的N-Gram特征),A和B分别表示权重矩阵;N=1,2,3,…,N为正整数。
在获得该分析标签之后,通过该分析标签确定用户需要问诊的病是属于慢病或者普通的病(感冒、发烧、腹泻等),然后构建对应的会话流程;通过上述方式构建会话流程,可以实现对用户所需要问诊进行一个大致的分类,方便后续在大致分类的基础上进行精确的针对性会话分类。
实体抽取模块22:用于在所述会话流程内对所述文本信息进行实体信息抽取处理,获得所述文本信息对应的实体信息,所述文本信息对应的实体信息包括不限于所述文本信息中所包含的性别、年龄、基本症状特征;
在本发明具体实施过程中,所述在所述会话流程内对所述文本信息进行实体信息抽取处理,获得所述文本信息对应的实体信息,包括:基于长短期记忆网络和条件随机场在所述会话流程内对所述文本信息进行文字实体抽取处理,获得抽取实体信息;对所述抽取实体信息进行实体融合归一化处理,获得所述文本信息对应的实体信息;所述文本信息对应的实体信息包括不限于所述文本信息中所包含的性别、年龄、基本症状特征。
具体的,在对应的会话流程内对该文本信息进行实体抽取处理,可以通过长短期记忆网络和条件随机场的方式在该会话流程内对该文本信息进行文字实体出去处理,从而获得抽取实体信息,采用长短期记忆网络和条件随机场的方式相结合进行实体抽取,可以更快、更准确的抽取实体信息;在抽取实体信息之后,需要进行融合归一化处理,即对抽取实体信息进行实体融合归一化处理,获得文本信息中的实体信息;通过实体融合归一化处理,可以对同一个实体信息,在不同称呼上实现融合,去除相应的冗余信息,提高后续的处理速度,并且使后续的理解根据到位,更有利于后续的交流回复;文本信息对应的实体信息包括不限于所述文本信息中所包含的性别、年龄、基本症状特征。
问诊会话构建模块23:用于在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话,并获取所述问诊会话中的用户回答文本信息;
在本发明具体实施过程中,所述在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话,并获取所述问诊会话中的用户回答文本信息,包括:在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话的会话问题,获得所述会话问题的回答文本信息;对所述回答文本信息进行症状实体信息提取处理,获得症状实体信息;根据所述症状实体信息构建对应的问诊会话的会话问题,直至完成所有的问诊流程会话;将所有的回答文本信息按照问诊会话的会话问题顺序进行文本整理处理,获得所述问诊会话中的用户回答文本信息。
具体的,首先是在该会话流程内针对文本信息对应的实体信息来构建问诊会话中的会话问题,即根据用户的性别、年龄和基本症状特征来构建对应的文字会话中的会话问题,并接收用户根据该会话问题的回答文本信息;然后再对该回答文本信息进行症状实体信息提取处理,具体的提取方式还是根据长短期记忆网络和条件随机场的方式进行提取,然后进行实体融合归一化处理,获得症状实体信息;然后再根据提取的症状实体信息构建对应的问诊会话的会话问题,并接收用户根据会话问题的回答文本信息,进行症状实体信息提取,并根据该症状实体信息构建相关的问诊会话的会话问题,直至完成所有的问诊流程会话;在问诊流程会话结束之后,将所有的用户回答文本信息按照问诊会话的会话问题顺序进行文本整理处理,从而获得该问诊会话中的用户回答文本信息;并且需要首先按照会话问题顺序进行冗余处理,去除用户回答文本信息中的冗余信息,之后再按照先后顺序进行文本整理处理,最终会的该问诊会话中的用户回答文本信息。
关键字提取模块24:用于基于所述用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字;
在本发明具体实施过程中,所述基于所述用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字,包括:基于TF-IDF算法对所述用户回答文本信息进行文字会话的初始关键字提取处理,获取初始关键字;基于所述文本信息对应的实体信息、症状实体信息对所述初始关键字进行筛选处理,获得问诊会话对应的关键字。
具体的,TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术;TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency);TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度;字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降;TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级;除了TF-IDF以外,因特网上的搜索引擎还会使用基于链接分析的评级方法,以确定文件在搜寻结果中出现的顺序;通过TF-IDF算法对来对用户回答文本信息进行文字会话的初始关键字提取处理,从而获取初始关键字;然后在结合文本信息对应的实体信息、症状实体信息对初始关键字进行筛选处理,获得问诊会话对应的关键字。
检索匹配模块25:用于基于所述问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例;
在本发明具体实施过程中,所述基于所述问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例,包括:利用所述问诊会话对应的关键字为中心与所述病例数据库中索引关键字进行聚类,获取聚类结果;选取所述聚类结果中聚类密度大于预设值的索引关键字作为最终索引关键字;基于所述最终索引关键字在所述病例数据库进行匹配索引检索,获得相互匹配病例。
具体的,在该病例数据库中对应所有的存储病例具有对应的索引关键字;然后利用上述步骤中获得的问诊会话对应的关键字为中心与上述的病例数据库中对应所有的存储病例具有对应的索引关键字进行k-means聚类,从而获得与问诊会话对应的关键字为中心的聚类结果;然后选择该最终索引关键字在该病例数据库中进行匹配索引检索从而获得索引结果,因为聚类结果中聚类的关键字太多,然后选择聚类结果中聚类密度大于预设值的索引关键字作为最终索引关键字;利用最终索引关键字在病例数据库进行匹配索引检索,获得相互匹配病例。
相互匹配模块26:用于基于所述相互匹配病例获得所述用户的问诊结果。
在本发明具体实施过程中,首先将相互匹配病例按照与问诊会话对应的关键字的相关度按照高低进行排序,选取最高前五位作为用户的问诊结果并且将其推送至用户终端的界面。
在本发明实施例中,通过根据用户输入的文本信息构建对应的会话流程,在该会话流程内进行实体抽取,并根据抽取的实体信息构建问诊会话,从而获得用户问诊回答文本信息,在进行关键字提取及检索匹配,向用户返回问诊结果,整一个流程无线在线医生参与,即可实现用户在线智能问诊,并且保证问诊结果的准确性及用户的体验性。
实施例
本发明实施例提供的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现任一项技术方案所述的智能问诊方法。其中,所述计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSable ProgrammableRead-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储设备包括由设备(例如,计算机、手机)以能够读的形式存储或传输消息的任何介质,可以是只读存储器,磁盘或光盘等。
请参阅图3,图3是本发明实施例中的服务器组成结构示意图。
如图3所示,一种服务器,处理器302、存储器303、输入单元304以及显示单元305等器件。图3所示的结构器件并不构成对所有服务器的限定,可以比图3更多或更少部件,或组合某些部件。
存储器303可用于存储应用程序301以及各功能模块,处理器302运行存储在存储器303的应用程序301,从而执行设备的各种功能应用以及数据处理。存储器可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本发明所公开的存储器包括但不限于这些类型的存储器。本发明所公开的存储器只作为例子而非作为限定。
输入单元304用于接收信号的输入,以及接收用户输入的关键字。输入单元304可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元305可用于显示用户输入的信息或提供给用户的信息以及终端设备的各种菜单。显示单元305可采用液晶显示器、有机发光二极管等形式。处理器302是终端设备的控制中心,利用各种接口和线路连接整个设备的各个部分,通过运行或执行存储在存储器302内的软件程序和/或模块,以及调用存储在存储器内的数据,执行各种功能和处理数据。
作为一个实施例,所述服务器包括:一个或多个处理器302,存储器303,一个或多个应用程序301,其中所述一个或多个应用程序301被存储在存储器303中并被配置为由所述一个或多个处理器302执行,所述一个或多个程序301配置用于执行上述实施例中的智能问诊方法。
本发明实施例提供的服务器可实现上述提供的智能问诊方法的实施例,具体功能实现请参详方法实施例中的说明,在此不再赘述。
在本发明实施例中,通过根据用户输入的文本信息构建对应的会话流程,在该会话流程内进行实体抽取,并根据抽取的实体信息构建问诊会话,从而获得用户问诊回答文本信息,在进行关键字提取及检索匹配,向用户返回问诊结果,整一个流程无线在线医生参与,即可实现用户在线智能问诊,并且保证问诊结果的准确性及用户的体验性。
另外,以上对本发明实施例所提供的基于语义理解的智能问诊方法、装置、存储介质及服务器进行了详细介绍,本文中应采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于语义理解的智能问诊方法,其特征在于,所述方法包括:
基于用户终端获得用户输入所形成的文本信息,并根据所述文本信息构建对应的会话流程;
在所述会话流程内对所述文本信息进行实体信息抽取处理,获得所述文本信息对应的实体信息,所述文本信息对应的实体信息包括不限于所述文本信息中所包含的性别、年龄、基本症状特征;
在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话,并获取所述问诊会话中的用户回答文本信息;
基于所述用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字;
基于所述问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例;
基于所述相互匹配病例获得所述用户的问诊结果。
2.根据权利要求1所述的智能问诊方法,其特征在于,所述基于用户终端获得用户输入所形成的文本信息,包括:
基于用户在所述用户终端所提供的操作界面上输入的文字信息获得所述文本信息;或,
基于用户通过所述用户终端的音频采集设备输入的语音信息进行文本信息转换处理,获得所述文本信息。
3.根据权利要求1所述的智能问诊方法,其特征在于,所述根据所述文本信息构建对应的会话流程,包括:
根据所述文本信息构建文字特征向量列表;
将构建文字特征向量列表输入NLP模型中,在所述NLP模型中利用N-Gram统计语言算法对所述文字特征向量列表中的每一个文字特征向量进行权值预设;
将预设好权值的文字特征向量经过所述NLP模型进行分析处理,输出分析标签;
基于所述分析标签进行对应的会话流程构建处理。
4.根据权利要求1所述的智能问诊方法,其特征在于,所述在所述会话流程内对所述文本信息进行实体信息抽取处理,获得所述文本信息对应的实体信息,包括:
基于长短期记忆网络和条件随机场在所述会话流程内对所述文本信息进行文字实体抽取处理,获得抽取实体信息;
对所述抽取实体信息进行实体融合归一化处理,获得所述文本信息对应的实体信息。
5.根据权利要求1所述的智能问诊方法,其特征在于,所述在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话,并获取所述问诊会话中的用户回答文本信息,包括:
在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话的会话问题,获得所述会话问题的回答文本信息;
对所述回答文本信息进行症状实体信息提取处理,获得症状实体信息;
根据所述症状实体信息构建对应的问诊会话的会话问题,直至完成所有的问诊流程会话;
将所有的回答文本信息按照问诊会话的会话问题顺序进行文本整理处理,获得所述问诊会话中的用户回答文本信息。
6.根据权利要求1所述的智能问诊方法,其特征在于,所述基于所述用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字,包括:
基于TF-IDF算法对所述用户回答文本信息进行文字会话的初始关键字提取处理,获取初始关键字;
基于所述文本信息对应的实体信息、症状实体信息对所述初始关键字进行筛选处理,获得问诊会话对应的关键字。
7.根据权利要求1所述的智能问诊方法,其特征在于,所述基于所述问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例,包括:
利用所述问诊会话对应的关键字为中心与所述病例数据库中索引关键字进行聚类,获取聚类结果;
选取所述聚类结果中聚类密度大于预设值的索引关键字作为最终索引关键字;
基于所述最终索引关键字在所述病例数据库进行匹配索引检索,获得相互匹配病例。
8.一种基于语义理解的智能问诊装置,其特征在于,所述装置包括:
会话流程构建模块:用于基于用户终端获得用户输入所形成的文本信息,并根据所述文本信息构建对应的会话流程;
实体抽取模块:用于在所述会话流程内对所述文本信息进行实体信息抽取处理,获得所述文本信息对应的实体信息,所述文本信息对应的实体信息包括不限于所述文本信息中所包含的性别、年龄、基本症状特征;
问诊会话构建模块:用于在所述会话流程内针对所述文本信息对应的实体信息构建对应的问诊会话,并获取所述问诊会话中的用户回答文本信息;
关键字提取模块:用于基于所述用户回答文本信息进行问诊会话关键字提取处理,获得问诊会话对应的关键字;
检索匹配模块:用于基于所述问诊会话对应的关键字在病例数据库中进行检索匹配处理,获得相互匹配病例;
相互匹配模块:用于基于所述相互匹配病例获得所述用户的问诊结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7中任意一项所述的智能问诊方法。
10.一种服务器,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于:执行根据权利要求1至7中任意一项所述的智能问诊方法。
CN202010117542.2A 2020-02-25 2020-02-25 基于语义理解的智能问诊方法、装置、存储介质及服务器 Active CN111274365B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010117542.2A CN111274365B (zh) 2020-02-25 2020-02-25 基于语义理解的智能问诊方法、装置、存储介质及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010117542.2A CN111274365B (zh) 2020-02-25 2020-02-25 基于语义理解的智能问诊方法、装置、存储介质及服务器

Publications (2)

Publication Number Publication Date
CN111274365A true CN111274365A (zh) 2020-06-12
CN111274365B CN111274365B (zh) 2023-09-19

Family

ID=71002334

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010117542.2A Active CN111274365B (zh) 2020-02-25 2020-02-25 基于语义理解的智能问诊方法、装置、存储介质及服务器

Country Status (1)

Country Link
CN (1) CN111274365B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112002413A (zh) * 2020-08-23 2020-11-27 吾征智能技术(北京)有限公司 一种心血管系统感染智能认知系统、设备及存储介质
CN112035361A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 医疗诊断模型的测试方法、装置、计算机设备和存储介质
CN112133310A (zh) * 2020-11-24 2020-12-25 深圳市维度数据科技股份有限公司 基于语音识别的问卷调查方法、装置、存储介质及设备
CN112233806A (zh) * 2020-10-23 2021-01-15 深圳市乐行医疗科技有限公司 一种全信息辅助诊疗方法及系统
CN112256854A (zh) * 2020-11-05 2021-01-22 云南电网有限责任公司 一种基于ai自然语言理解的智能ai会话方法及装置
CN112395883A (zh) * 2021-01-19 2021-02-23 阿里健康科技(杭州)有限公司 一种问诊处理方法、问诊数据处理方法和装置
CN112712906A (zh) * 2020-12-29 2021-04-27 安徽科大讯飞医疗信息技术有限公司 视频图像处理方法、装置、电子设备及存储介质
CN112768091A (zh) * 2021-01-26 2021-05-07 北京搜狗科技发展有限公司 一种问诊信息处理方法、装置和介质
CN113220824A (zh) * 2020-11-25 2021-08-06 科大讯飞股份有限公司 数据检索方法、装置、设备及存储介质
CN113536798A (zh) * 2021-07-16 2021-10-22 北京易道博识科技有限公司 一种多实例文档关键信息抽取方法和系统
CN113724882A (zh) * 2021-08-30 2021-11-30 康键信息技术(深圳)有限公司 基于问诊会话构建用户画像的方法、装置、设备和介质
CN113779215A (zh) * 2021-08-25 2021-12-10 海南硬壳科技有限公司 数据处理平台
CN113921149A (zh) * 2021-10-26 2022-01-11 杭州祺鲸科技有限公司 一种基于多轮问诊的标准症状抽取方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19533541C1 (de) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN109192300A (zh) * 2018-08-17 2019-01-11 百度在线网络技术(北京)有限公司 智能问诊方法、系统、计算机设备和存储介质
JP2020013492A (ja) * 2018-07-20 2020-01-23 株式会社リコー 情報処理装置、システム、方法およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19533541C1 (de) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
US20160247068A1 (en) * 2013-11-01 2016-08-25 Tencent Technology (Shenzhen) Company Limited System and method for automatic question answering
JP2020013492A (ja) * 2018-07-20 2020-01-23 株式会社リコー 情報処理装置、システム、方法およびプログラム
CN109192300A (zh) * 2018-08-17 2019-01-11 百度在线网络技术(北京)有限公司 智能问诊方法、系统、计算机设备和存储介质

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112002413A (zh) * 2020-08-23 2020-11-27 吾征智能技术(北京)有限公司 一种心血管系统感染智能认知系统、设备及存储介质
CN112002413B (zh) * 2020-08-23 2023-09-29 吾征智能技术(北京)有限公司 一种心血管系统感染智能认知系统、设备及存储介质
CN112035361A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 医疗诊断模型的测试方法、装置、计算机设备和存储介质
CN112035361B (zh) * 2020-08-31 2024-05-14 康键信息技术(深圳)有限公司 医疗诊断模型的测试方法、装置、计算机设备和存储介质
CN112233806A (zh) * 2020-10-23 2021-01-15 深圳市乐行医疗科技有限公司 一种全信息辅助诊疗方法及系统
CN112256854A (zh) * 2020-11-05 2021-01-22 云南电网有限责任公司 一种基于ai自然语言理解的智能ai会话方法及装置
CN112133310A (zh) * 2020-11-24 2020-12-25 深圳市维度数据科技股份有限公司 基于语音识别的问卷调查方法、装置、存储介质及设备
CN113220824A (zh) * 2020-11-25 2021-08-06 科大讯飞股份有限公司 数据检索方法、装置、设备及存储介质
CN113220824B (zh) * 2020-11-25 2023-01-17 科大讯飞股份有限公司 数据检索方法、装置、设备及存储介质
CN112712906A (zh) * 2020-12-29 2021-04-27 安徽科大讯飞医疗信息技术有限公司 视频图像处理方法、装置、电子设备及存储介质
CN112395883A (zh) * 2021-01-19 2021-02-23 阿里健康科技(杭州)有限公司 一种问诊处理方法、问诊数据处理方法和装置
CN112768091A (zh) * 2021-01-26 2021-05-07 北京搜狗科技发展有限公司 一种问诊信息处理方法、装置和介质
CN113536798A (zh) * 2021-07-16 2021-10-22 北京易道博识科技有限公司 一种多实例文档关键信息抽取方法和系统
CN113536798B (zh) * 2021-07-16 2024-05-31 北京易道博识科技有限公司 一种多实例文档关键信息抽取方法和系统
CN113779215A (zh) * 2021-08-25 2021-12-10 海南硬壳科技有限公司 数据处理平台
CN113724882A (zh) * 2021-08-30 2021-11-30 康键信息技术(深圳)有限公司 基于问诊会话构建用户画像的方法、装置、设备和介质
CN113921149A (zh) * 2021-10-26 2022-01-11 杭州祺鲸科技有限公司 一种基于多轮问诊的标准症状抽取方法

Also Published As

Publication number Publication date
CN111274365B (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
CN111274365B (zh) 基于语义理解的智能问诊方法、装置、存储介质及服务器
US11334635B2 (en) Domain specific natural language understanding of customer intent in self-help
CN108829822B (zh) 媒体内容的推荐方法和装置、存储介质、电子装置
CN110222045B (zh) 一种数据报表获取方法、装置及计算机设备、存储介质
CN111241237B (zh) 一种基于运维业务的智能问答数据处理方法及装置
EP3819785A1 (en) Feature word determining method, apparatus, and server
CN108885623A (zh) 基于知识图谱的语意分析系统及方法
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN112559684A (zh) 一种关键词提取及信息检索方法
US10915756B2 (en) Method and apparatus for determining (raw) video materials for news
CN113707299A (zh) 基于问诊会话的辅助诊断方法、装置及计算机设备
CN112559747A (zh) 事件分类处理方法、装置、电子设备和存储介质
CN114116997A (zh) 知识问答方法、装置、电子设备及存储介质
CN112579750A (zh) 相似病案的检索方法、装置、设备及存储介质
CN111126067A (zh) 实体关系抽取方法及装置
CN117520503A (zh) 基于llm模型的金融客服对话生成方法、装置、设备及介质
CN115862840A (zh) 关节疼痛疾病的智能辅助诊断方法和装置
CN110019763B (zh) 文本过滤方法、系统、设备及计算机可读存储介质
CN113392205A (zh) 用户画像构建方法、装置、设备及存储介质
CN117828042A (zh) 用于金融服务的问答处理方法、装置、设备及介质
Wang et al. Automatic dialogue system of marriage law based on the parallel C4. 5 decision tree
CN116680422A (zh) 一种多模态题库资源查重方法、系统、装置及存储介质
CN116680401A (zh) 文档处理方法、文档处理装置、设备及存储介质
CN112052402B (zh) 信息推荐方法、装置、电子设备及存储介质
CN114218364A (zh) 问答知识库扩充方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 109, 1st floor, Building 2, No. 23 Hejing Road, Liwan District, Guangzhou City, Guangdong Province, 510000 (for office only)

Patentee after: Guangzhou qilekang Digital Health Medical Technology Co.,Ltd.

Address before: Room 701-707, No. 2, Luju Road, Liwan District, Guangzhou, Guangdong 510000

Patentee before: GUANGZHOU 7LK PHARMACEUTICAL CHAIN CO.,LTD.

CP03 Change of name, title or address