CN117059092B - 基于区块链的智慧医疗交互式智能分诊方法及系统 - Google Patents

基于区块链的智慧医疗交互式智能分诊方法及系统 Download PDF

Info

Publication number
CN117059092B
CN117059092B CN202311307846.5A CN202311307846A CN117059092B CN 117059092 B CN117059092 B CN 117059092B CN 202311307846 A CN202311307846 A CN 202311307846A CN 117059092 B CN117059092 B CN 117059092B
Authority
CN
China
Prior art keywords
voice
voice signal
patient
sound source
triage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311307846.5A
Other languages
English (en)
Other versions
CN117059092A (zh
Inventor
于水娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Puyi Tongchuang Technology Co ltd
Original Assignee
Shenzhen Puyi Tongchuang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Puyi Tongchuang Technology Co ltd filed Critical Shenzhen Puyi Tongchuang Technology Co ltd
Priority to CN202311307846.5A priority Critical patent/CN117059092B/zh
Publication of CN117059092A publication Critical patent/CN117059092A/zh
Application granted granted Critical
Publication of CN117059092B publication Critical patent/CN117059092B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S1/00Beacons or beacon systems transmitting signals having a characteristic or characteristics capable of being detected by non-directional receivers and defining directions, positions, or position lines fixed relatively to the beacon transmitters; Receivers co-operating therewith
    • G01S1/72Beacons or beacon systems transmitting signals having a characteristic or characteristics capable of being detected by non-directional receivers and defining directions, positions, or position lines fixed relatively to the beacon transmitters; Receivers co-operating therewith using ultrasonic, sonic or infrasonic waves
    • G01S1/76Systems for determining direction or position line
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/062Securing storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Biomedical Technology (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明公开了一种基于区块链的智慧医疗交互式智能分诊方法及系统,涉及音视频数据分析技术领域。该方法包括:对预检测语音信号进行声源定位;若为近距离声源位置,则采集该患者的人脸图像,根据预检测语音信号和患者的人脸图像对患者的身份进行识别,以得到患者身份信息;获取该患者的病情描述语音信号,利用基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别,以得到病情描述语音信号识别结果;根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器,进行智能分诊提示;将核心数据上传至区块链。本发明结合多种智能模型,实现高效精准的医疗分诊;并将核心信息上链存储。

Description

基于区块链的智慧医疗交互式智能分诊方法及系统
技术领域
本发明涉及音视频数据分析技术领域,具体而言,涉及一种基于区块链的智慧医疗交互式智能分诊方法及系统。
背景技术
分诊工作能够为患者创造舒适、安静的候诊环境,消除患者就诊时的混乱、拥挤现象,提升患者的就诊效率,从而有效地增加患者就诊的满意度。然而,传统的分诊过程往往需要消耗巨大的人力资源。尽管部分分诊系统已经应用了信息技术,但仍然在精准度、便捷度、交互性等方面存在一定的局限性。
随着信息技术的不断更新换代,能够为交互式智能分诊提供直接的支持;同时,区块链技术作为近年来的新兴技术,能够有效提升分诊过程的安全性。因此,提出一种基于区块链的智慧医疗交互式智能分诊方法及系统有非常重要的价值和意义。
发明内容
为了解决现有技术中无法实现精准、便捷的医疗分诊的问题,本发明提供一种基于区块链的智慧医疗交互式智能分诊方法及系统,结合基于语音分段语谱图比对分析的多重校验式声源定位模型、基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型、基于语音分段自适应去噪的多范围语义校验式语音识别模型,对声源、人员身份、语音进行精准分析,实现高效精准的医疗分诊;并利用区块链技术将核心信息上链存储,提高数据安全性。
为解决上述技术问题,本发明采用的技术方案为:
第一方面,本发明提供一种基于区块链的智慧医疗交互式智能分诊方法,包括以下步骤:
获取并将患者的初始语音信号作为预检测语音信号,利用基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位,生成声源定位结果;
若声源定位结果为声源位置近,则采集该患者的人脸图像,利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,根据预检测语音信号和患者的人脸图像对患者的身份进行识别,以得到患者身份信息;
获取该患者的病情描述语音信号,利用基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别,以得到病情描述语音信号识别结果;
根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器,进行智能分诊提示;记录分诊结果和分诊时间;
分诊完成后,将分诊结果、分诊时间、患者身份信息及病情描述语音信号识别结果上传至区块链。
首先,本发明提出了基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位;该模型通过语音分段语谱图比对分析的方式,保留代表性较强的等分语音信号,并对它们分别进行声源定位,当每段等分语音信号的声源定位结果都是声源位置较近时才认定预检测语音信号声源位置较近,确保了声源定位的精准度。其次,本发明提出了基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,对患者的身份进行识别;该模型先对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别,初步识别出患者的身份信息,在此基础上利用多样性语音编码后验匹配的方式对身份识别结果进行验证,确保了患者身份识别的精准度。再次,本发明提出了基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别;该模型对峰值信噪比不同的等分语音信号使用更加匹配的语音去噪方式,在保证语音去噪效果的基础上充分降低了计算资源消耗;同时,该模型利用多范围语义校验的方式,对每个识别词汇的语义合理性进行充分校验,有效保证了语音识别的精准度。最后,本发明利用了区块链技术,将患者身份信息、病情描述语音信号识别结果、分诊结果、分诊时间等进行上链存储,提升了系统的安全性。
基于第一方面,进一步地,上述利用基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位的方法包括以下步骤:
将预检测语音信号进行多等分处理,以得到多段等分语音信号;
获取并将各段等分语音信号的语谱图两两进行比对,生成对应的多个相似度结果;
若任意两段等分语音信号的相似度结果大于预置的相似度阈值,则保留其中一段等分语音信号;
利用预置的声源定位模型对保留的每段等分语音信号进行声源定位,以得到并根据对应的定位结果确定最终的声源定位结果。
基于第一方面,进一步地,上述利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,根据预检测语音信号和患者的人脸图像对患者的身份进行识别的方法包括以下步骤:
对患者的人脸图像进行图像超分辨率重建,并利用预置的人脸识别模型对重建后的人脸图像进行识别,以得到患者的初步身份信息;
根据初步身份信息在预置的基准语音库中提取对应的基准语音信号;
分别利用多种编码方式对预检测语音信号和基准语音信号进行编码,并计算对应编码方式下预检测语音信号和基准语音信号之间的相似度,以得到多个语音相似度结果;
若多个语音相似度结果均大于预置的相似度阈值,则认定患者的初步身份信息准确,将初步身份信息作为最终的患者身份信息。
基于第一方面,进一步地,上述利用基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别的方法包括以下步骤:
将病情描述语音信号进行多等分处理,以得到多段等分病情描述语音信号;
对每段等分病情描述语音信号进行峰值信噪比检测,以得到并根据对应的峰值信噪比利用不同的语音去噪模型对对应的等分病情描述语音信号进行去噪处理;
利用预置的语音识别模型对去噪处理后的等分病情描述语音信号进行识别,以得到初始病情描述语音识别结果;
对初始病情描述语音识别结果中的每个词汇进行语义合理性校验,生成并根据对应的校验结果确定最终的病情描述语音信号识别结果。
基于第一方面,进一步地,上述根据对应的峰值信噪比利用不同的语音去噪模型对对应的等分病情描述语音信号进行去噪处理的方法包括以下步骤:
若峰值信噪比大于预置的信噪比阈值,则利用预置的简易语音去噪模型对对应的等分病情描述语音信号进行去噪处理;
若峰值信噪比小于预置的信噪比阈值,则利用预置的复杂语音去噪模型对对应的等分病情描述语音信号进行去噪处理。
基于第一方面,进一步地,上述对初始病情描述语音识别结果中的每个词汇进行语义合理性校验的方法包括以下步骤:
从短句、整句及段落多个方面对初始病情描述语音识别结果中的每个词汇进行语义合理性校验,以得到对应词汇的多个语义合理性校验结果;
若每个词汇的多个语义合理性校验结果均为语义合理,则认定初始病情描述语音识别结果为最终的病情描述语音信号识别结果。
第二方面,本发明提供一种基于区块链的智慧医疗交互式智能分诊系统,包括声源定位模块、身份识别模块、病情描述识别模块、分诊模块以及数据上链模块,其中:
声源定位模块,用于获取并将患者的初始语音信号作为预检测语音信号,利用基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位,生成声源定位结果;
身份识别模块,用于若声源定位结果为声源位置近,则采集该患者的人脸图像,利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,根据预检测语音信号和患者的人脸图像对患者的身份进行识别,以得到患者身份信息;
病情描述识别模块,用于获取该患者的病情描述语音信号,利用基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别,以得到病情描述语音信号识别结果;
分诊模块,用于根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器,进行智能分诊提示;记录分诊结果和分诊时间;
数据上链模块,用于分诊完成后,将分诊结果、分诊时间、患者身份信息及病情描述语音信号识别结果上传至区块链。
本系统通过声源定位模块、身份识别模块、病情描述识别模块、分诊模块以及数据上链模块等多个模块的配合,结合基于语音分段语谱图比对分析的多重校验式声源定位模型、基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型、基于语音分段自适应去噪的多范围语义校验式语音识别模型,对声源、人员身份、语音进行精准分析,实现高效精准的医疗分诊;并利用区块链技术将核心信息上链存储,提高数据安全性。首先,本发明提出了基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位;该模型通过语音分段语谱图比对分析的方式,保留代表性较强的等分语音信号,并对它们分别进行声源定位,当每段等分语音信号的声源定位结果都是声源位置较近时才认定预检测语音信号声源位置较近,确保了声源定位的精准度。其次,本发明提出了基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,对患者的身份进行识别;该模型先对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别,初步识别出患者的身份信息,在此基础上利用多样性语音编码后验匹配的方式对身份识别结果进行验证,确保了患者身份识别的精准度。再次,本发明提出了基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别;该模型对峰值信噪比不同的等分语音信号使用更加匹配的语音去噪方式,在保证语音去噪效果的基础上充分降低了计算资源消耗;同时,该模型利用多范围语义校验的方式,对每个识别词汇的语义合理性进行充分校验,有效保证了语音识别的精准度。最后,本发明利用了区块链技术,将患者身份信息、病情描述语音信号识别结果、分诊结果、分诊时间等进行上链存储,提升了系统的安全性。
第三方面,本申请提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器;当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明至少具有如下优点或有益效果:
1、本发明提出了基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位;该模型通过语音分段语谱图比对分析的方式,保留代表性较强的等分语音信号,并对它们分别进行声源定位,当每段等分语音信号的声源定位结果都是声源位置较近时才认定预检测语音信号声源位置较近, 确保了声源定位的精准度。
2、本发明提出了基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,对患者的身份进行识别;该模型先对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别,初步识别出患者的身份信息, 在此基础上利用多样性语音编码后验匹配的方式对身份识别结果进行验证, 确保了患者身份识别的精准度。
3、本发明提出了基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别;该模型对峰值信噪比不同的等分语音信号使用更加匹配的语音去噪方式,在保证语音去噪效果的基础上充分降低了计算资源消耗;同时,该模型利用多范围语义校验的方式,对每个识别词汇的语义合理性进行充分校验,有效保证了语音识别的精准度。
4、本发明利用了区块链技术,将患者身份信息、病情描述语音信号识别结果、分诊结果、分诊时间等进行上链存储,提升了系统的安全性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种基于区块链的智慧医疗交互式智能分诊方法的流程图;
图2为本发明实施例一种基于区块链的智慧医疗交互式智能分诊系统的原理框图;
图3为本发明实施例提供的一种电子设备的结构框图。
附图标记说明:100、声源定位模块;200、身份识别模块;300、病情描述识别模块;400、分诊模块;500、数据上链模块;101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例的描述中,“多个”代表至少2个。
实施例
如图1所示,第一方面,本发明实施例提供一种基于区块链的智慧医疗交互式智能分诊方法,包括以下步骤:
S1、获取并将患者的初始语音信号作为预检测语音信号,利用基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位,生成声源定位结果;
进一步地,包括:将预检测语音信号进行多等分处理,以得到多段等分语音信号;获取并将各段等分语音信号的语谱图两两进行比对,生成对应的多个相似度结果;若任意两段等分语音信号的相似度结果大于预置的相似度阈值,则保留其中一段等分语音信号;利用预置的声源定位模型对保留的每段等分语音信号进行声源定位,以得到并根据对应的定位结果确定最终的声源定位结果。
在本发明的一些实施例中,某位患者在分诊机器前,按照系统提示说出一段话(系统提示‘请您说出一段话,时间不低于3秒钟’),分诊机器的音视频设备自动提取该语音信号作为预检测语音信号。利用基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位。如果判定预检测语音信号声源的位置较近,则继续进行下一步。
基于语音分段语谱图比对分析的多重校验式声源定位模型具体包括:
把预检测语音信号等分为10段,将每段等分语音信号的语谱图两两进行比对。若任意两段等分语音信号的语谱图的相似度较高,则仅保留其中一段等分语音信号即可。对于保留的每段等分语音信号,分别利用声源定位模型进行声源定位,若每段等分语音信号的声源定位结果都是声源位置较近,则认定预检测语音信号声源位置较近。
S2、若声源定位结果为声源位置近,则采集该患者的人脸图像,利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,根据预检测语音信号和患者的人脸图像对患者的身份进行识别,以得到患者身份信息;
进一步地,包括:对患者的人脸图像进行图像超分辨率重建,并利用预置的人脸识别模型对重建后的人脸图像进行识别,以得到患者的初步身份信息;根据初步身份信息在预置的基准语音库中提取对应的基准语音信号;分别利用多种编码方式对预检测语音信号和基准语音信号进行编码,并计算对应编码方式下预检测语音信号和基准语音信号之间的相似度,以得到多个语音相似度结果;若多个语音相似度结果均大于预置的相似度阈值,则认定患者的初步身份信息准确,将初步身份信息作为最终的患者身份信息。
在本发明的一些实施例中,分诊机器的音视频设备自动提取一张患者的人脸图像,利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,对患者的身份进行识别。
基于多样性语音编码匹配后验的多维度鲁棒性身份识模型具体包括:
对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别,初步得到该患者的身份信息。根据初步得到的患者身份信息,在系统(预先构建的基准语音库)中找到对应的基准语音信号(例如,人脸识别过程中已经初步识别出患者的身份是‘张三’,系统自动提取张三前期录入在系统的语音信号作为基准语音信号)。将预检测语音信号和基准语音信号分别利用编码方式A进行编码,计算二者的相似度,得到相似度A;将预检测语音信号和基准语音信号分别利用编码方式B进行编码,计算二者的相似度,得到相似度B;将预检测语音信号和基准语音信号分别利用编码方式C进行编码,计算二者的相似度,得到相似度C。其中,编码方式A,B,C分别为不同的语音编码方式。如果所有的相似度结果(相似度A,B,C)均为较高,则最终认定前面得到的患者身份信息是准确的。
S3、获取该患者的病情描述语音信号,利用基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别,以得到病情描述语音信号识别结果;
进一步地,包括:将病情描述语音信号进行多等分处理,以得到多段等分病情描述语音信号;对每段等分病情描述语音信号进行峰值信噪比检测,以得到并根据对应的峰值信噪比利用不同的语音去噪模型对对应的等分病情描述语音信号进行去噪处理;利用预置的语音识别模型对去噪处理后的等分病情描述语音信号进行识别,以得到初始病情描述语音识别结果;对初始病情描述语音识别结果中的每个词汇进行语义合理性校验,生成并根据对应的校验结果确定最终的病情描述语音信号识别结果。
进一步地,包括:若峰值信噪比大于预置的信噪比阈值,则利用预置的简易语音去噪模型对对应的等分病情描述语音信号进行去噪处理;若峰值信噪比小于预置的信噪比阈值,则利用预置的复杂语音去噪模型对对应的等分病情描述语音信号进行去噪处理。
进一步地,包括:从短句、整句及段落多个方面对初始病情描述语音识别结果中的每个词汇进行语义合理性校验,以得到对应词汇的多个语义合理性校验结果;若每个词汇的多个语义合理性校验结果均为语义合理,则认定初始病情描述语音识别结果为最终的病情描述语音信号识别结果。
在本发明的一些实施例中,患者对自己的病情进行简单口述,分诊机器的音视频设备自动提取该语音信号作为病情描述语音信号。利用基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别,得到病情描述语音信号识别结果。
基于语音分段自适应去噪的多范围语义校验式语音识别模型具体包括:
把病情描述语音信号进行10等分,对每段等分语音信号进行峰值信噪比检测。对于峰值信噪比较高的等分语音信号,均利用简易的语音去噪模型进行语音去噪处理;对于峰值信噪比较低的等分语音信号,均利用复杂的语音去噪模型进行语音去噪处理。完成语音去噪处理之后,利用语音识别模型对病情描述语音信号进行语音识别,初步得到病情描述语音识别结果。对于识别结果的每个词汇,从整个短语、整个句子、整个段落等多个范围对词汇的语义合理性进行校验,若每个词汇均顺利通过多范围语义校验,则最终认定前面得到的病情描述语音信号识别结果是准确的。
S4、根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器,进行智能分诊提示;记录分诊结果和分诊时间;根据病情描述语音信号识别结果生成对应的分诊信息,对患者进行分诊(例如,分诊到神经内科、呼吸内科等),并通知患者(屏幕显示、语音播放等方式)。
S5、分诊完成后,将分诊结果、分诊时间、患者身份信息及病情描述语音信号识别结果上传至区块链。
首先,本发明提出了基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位;该模型通过语音分段语谱图比对分析的方式,保留代表性较强的等分语音信号,并对它们分别进行声源定位,当每段等分语音信号的声源定位结果都是声源位置较近时才认定预检测语音信号声源位置较近,确保了声源定位的精准度。其次,本发明提出了基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,对患者的身份进行识别;该模型先对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别,初步识别出患者的身份信息,在此基础上利用多样性语音编码后验匹配的方式对身份识别结果进行验证,确保了患者身份识别的精准度。再次,本发明提出了基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别;该模型对峰值信噪比不同的等分语音信号使用更加匹配的语音去噪方式,在保证语音去噪效果的基础上充分降低了计算资源消耗;同时,该模型利用多范围语义校验的方式,对每个识别词汇的语义合理性进行充分校验,有效保证了语音识别的精准度。最后,本发明利用了区块链技术,将患者身份信息、病情描述语音信号识别结果、分诊结果、分诊时间等进行上链存储,提升了系统的安全性。
如图2所示,第二方面,本发明实施例提供一种基于区块链的智慧医疗交互式智能分诊系统,包括声源定位模块100、身份识别模块200、病情描述识别模块300、分诊模块400以及数据上链模块500,其中:
声源定位模块100,用于获取并将患者的初始语音信号作为预检测语音信号,利用基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位,生成声源定位结果;
身份识别模块200,用于若声源定位结果为声源位置近,则采集该患者的人脸图像,利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,根据预检测语音信号和患者的人脸图像对患者的身份进行识别,以得到患者身份信息;
病情描述识别模块300,用于获取该患者的病情描述语音信号,利用基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别,以得到病情描述语音信号识别结果;
分诊模块400,用于根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器,进行智能分诊提示;记录分诊结果和分诊时间;
数据上链模块500,用于分诊完成后,将分诊结果、分诊时间、患者身份信息及病情描述语音信号识别结果上传至区块链。
本系统通过声源定位模块100、身份识别模块200、病情描述识别模块300、分诊模块400以及数据上链模块500等多个模块的配合,结合基于语音分段语谱图比对分析的多重校验式声源定位模型、基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型、基于语音分段自适应去噪的多范围语义校验式语音识别模型,对声源、人员身份、语音进行精准分析,实现高效精准的医疗分诊;并利用区块链技术将核心信息上链存储,提高数据安全性。首先,本发明提出了基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位;该模型通过语音分段语谱图比对分析的方式,保留代表性较强的等分语音信号,并对它们分别进行声源定位,当每段等分语音信号的声源定位结果都是声源位置较近时才认定预检测语音信号声源位置较近,确保了声源定位的精准度。其次,本发明提出了基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,对患者的身份进行识别;该模型先对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别,初步识别出患者的身份信息,在此基础上利用多样性语音编码后验匹配的方式对身份识别结果进行验证,确保了患者身份识别的精准度。再次,本发明提出了基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别;该模型对峰值信噪比不同的等分语音信号使用更加匹配的语音去噪方式,在保证语音去噪效果的基础上充分降低了计算资源消耗;同时,该模型利用多范围语义校验的方式,对每个识别词汇的语义合理性进行充分校验,有效保证了语音识别的精准度。最后,本发明利用了区块链技术,将患者身份信息、病情描述语音信号识别结果、分诊结果、分诊时间等进行上链存储,提升了系统的安全性。
如图3所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及系统,也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (8)

1.一种基于区块链的智慧医疗交互式智能分诊方法,其特征在于,包括以下步骤:
获取并将患者的初始语音信号作为预检测语音信号,利用基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位,生成声源定位结果;
若声源定位结果为声源位置近,则采集该患者的人脸图像,利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,根据预检测语音信号和患者的人脸图像对患者的身份进行识别,以得到患者身份信息;包括:对患者的人脸图像进行图像超分辨率重建,并利用预置的人脸识别模型对重建后的人脸图像进行识别,以得到患者的初步身份信息;根据初步身份信息在预置的基准语音库中提取对应的基准语音信号;分别利用多种编码方式对预检测语音信号和基准语音信号进行编码,并计算对应编码方式下预检测语音信号和基准语音信号之间的相似度,以得到多个语音相似度结果;若多个语音相似度结果均大于预置的相似度阈值,则认定患者的初步身份信息准确,将初步身份信息作为最终的患者身份信息;
获取该患者的病情描述语音信号,利用基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别,以得到病情描述语音信号识别结果;
根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器,进行智能分诊提示;记录分诊结果和分诊时间;
分诊完成后,将分诊结果、分诊时间、患者身份信息及病情描述语音信号识别结果上传至区块链。
2.根据权利要求1所述的一种基于区块链的智慧医疗交互式智能分诊方法,其特征在于,所述利用基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位的方法包括以下步骤:
将预检测语音信号进行多等分处理,以得到多段等分语音信号;
获取并将各段等分语音信号的语谱图两两进行比对,生成对应的多个相似度结果;
若任意两段等分语音信号的相似度结果大于预置的相似度阈值,则保留其中一段等分语音信号;
利用预置的声源定位模型对保留的每段等分语音信号进行声源定位,以得到并根据对应的定位结果确定最终的声源定位结果。
3.根据权利要求1所述的一种基于区块链的智慧医疗交互式智能分诊方法,其特征在于,所述利用基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别的方法包括以下步骤:
将病情描述语音信号进行多等分处理,以得到多段等分病情描述语音信号;
对每段等分病情描述语音信号进行峰值信噪比检测,以得到并根据对应的峰值信噪比利用不同的语音去噪模型对对应的等分病情描述语音信号进行去噪处理;
利用预置的语音识别模型对去噪处理后的等分病情描述语音信号进行识别,以得到初始病情描述语音识别结果;
对初始病情描述语音识别结果中的每个词汇进行语义合理性校验,生成并根据对应的校验结果确定最终的病情描述语音信号识别结果。
4.根据权利要求3所述的一种基于区块链的智慧医疗交互式智能分诊方法,其特征在于,所述根据对应的峰值信噪比利用不同的语音去噪模型对对应的等分病情描述语音信号进行去噪处理的方法包括以下步骤:
若峰值信噪比大于预置的信噪比阈值,则利用预置的简易语音去噪模型对对应的等分病情描述语音信号进行去噪处理;
若峰值信噪比小于预置的信噪比阈值,则利用预置的复杂语音去噪模型对对应的等分病情描述语音信号进行去噪处理。
5.根据权利要求3所述的一种基于区块链的智慧医疗交互式智能分诊方法,其特征在于,所述对初始病情描述语音识别结果中的每个词汇进行语义合理性校验的方法包括以下步骤:
从短句、整句及段落多个方面对初始病情描述语音识别结果中的每个词汇进行语义合理性校验,以得到对应词汇的多个语义合理性校验结果;
若每个词汇的多个语义合理性校验结果均为语义合理,则认定初始病情描述语音识别结果为最终的病情描述语音信号识别结果。
6.一种基于区块链的智慧医疗交互式智能分诊系统,其特征在于,包括声源定位模块、身份识别模块、病情描述识别模块、分诊模块以及数据上链模块,其中:
声源定位模块,用于获取并将患者的初始语音信号作为预检测语音信号,利用基于语音分段语谱图比对分析的多重校验式声源定位模型,对预检测语音信号进行声源定位,生成声源定位结果;
身份识别模块,用于若声源定位结果为声源位置近,则采集该患者的人脸图像,利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型,根据预检测语音信号和患者的人脸图像对患者的身份进行识别,以得到患者身份信息;包括:对患者的人脸图像进行图像超分辨率重建,并利用预置的人脸识别模型对重建后的人脸图像进行识别,以得到患者的初步身份信息;根据初步身份信息在预置的基准语音库中提取对应的基准语音信号;分别利用多种编码方式对预检测语音信号和基准语音信号进行编码,并计算对应编码方式下预检测语音信号和基准语音信号之间的相似度,以得到多个语音相似度结果;若多个语音相似度结果均大于预置的相似度阈值,则认定患者的初步身份信息准确,将初步身份信息作为最终的患者身份信息;
病情描述识别模块,用于获取该患者的病情描述语音信号,利用基于语音分段自适应去噪的多范围语义校验式语音识别模型,对病情描述语音信号进行识别,以得到病情描述语音信号识别结果;
分诊模块,用于根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器,进行智能分诊提示;记录分诊结果和分诊时间;
数据上链模块,用于分诊完成后,将分诊结果、分诊时间、患者身份信息及病情描述语音信号识别结果上传至区块链。
7.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-5中任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。
CN202311307846.5A 2023-10-11 2023-10-11 基于区块链的智慧医疗交互式智能分诊方法及系统 Active CN117059092B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311307846.5A CN117059092B (zh) 2023-10-11 2023-10-11 基于区块链的智慧医疗交互式智能分诊方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311307846.5A CN117059092B (zh) 2023-10-11 2023-10-11 基于区块链的智慧医疗交互式智能分诊方法及系统

Publications (2)

Publication Number Publication Date
CN117059092A CN117059092A (zh) 2023-11-14
CN117059092B true CN117059092B (zh) 2024-06-04

Family

ID=88664780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311307846.5A Active CN117059092B (zh) 2023-10-11 2023-10-11 基于区块链的智慧医疗交互式智能分诊方法及系统

Country Status (1)

Country Link
CN (1) CN117059092B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104574246A (zh) * 2014-12-22 2015-04-29 百度在线网络技术(北京)有限公司 医疗智能分诊方法、装置及设备
CN105575391A (zh) * 2014-10-10 2016-05-11 阿里巴巴集团控股有限公司 声纹信息管理方法、装置以及身份认证方法、系统
CN205969126U (zh) * 2016-08-26 2017-02-22 厦门快商通科技股份有限公司 语音控制式医疗导诊服务机器人
CN107910073A (zh) * 2017-12-21 2018-04-13 苏州麦迪斯顿医疗科技股份有限公司 一种急诊预检分诊方法及装置
WO2022062471A1 (zh) * 2020-09-25 2022-03-31 华为技术有限公司 一种音频数据的处理方法、设备和系统
CN115762732A (zh) * 2022-11-18 2023-03-07 上海长征医院 一种基于区块链的接诊分诊系统
CN115798020A (zh) * 2023-01-29 2023-03-14 北京林业大学 一种基于人工智能的中小学生学习投入度检测方法与系统
CN115860882A (zh) * 2023-03-03 2023-03-28 北京吉道尔科技有限公司 基于区块链的智慧城市商品大数据智能选购方法及系统
CN116130072A (zh) * 2023-02-14 2023-05-16 平安科技(深圳)有限公司 科室推荐方法、装置、设备及存储介质
CN116417132A (zh) * 2021-12-29 2023-07-11 中移(成都)信息通信科技有限公司 基于区块链网络的急救方法、装置及存储介质
CN116739704A (zh) * 2023-06-07 2023-09-12 北京海上升科技有限公司 基于人工智能的电商平台兴趣分析式商品推荐方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10925551B2 (en) * 2017-08-04 2021-02-23 Cerner Innovation, Inc. Medical voice command integration

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105575391A (zh) * 2014-10-10 2016-05-11 阿里巴巴集团控股有限公司 声纹信息管理方法、装置以及身份认证方法、系统
CN104574246A (zh) * 2014-12-22 2015-04-29 百度在线网络技术(北京)有限公司 医疗智能分诊方法、装置及设备
CN205969126U (zh) * 2016-08-26 2017-02-22 厦门快商通科技股份有限公司 语音控制式医疗导诊服务机器人
CN107910073A (zh) * 2017-12-21 2018-04-13 苏州麦迪斯顿医疗科技股份有限公司 一种急诊预检分诊方法及装置
WO2022062471A1 (zh) * 2020-09-25 2022-03-31 华为技术有限公司 一种音频数据的处理方法、设备和系统
CN116417132A (zh) * 2021-12-29 2023-07-11 中移(成都)信息通信科技有限公司 基于区块链网络的急救方法、装置及存储介质
CN115762732A (zh) * 2022-11-18 2023-03-07 上海长征医院 一种基于区块链的接诊分诊系统
CN115798020A (zh) * 2023-01-29 2023-03-14 北京林业大学 一种基于人工智能的中小学生学习投入度检测方法与系统
CN116130072A (zh) * 2023-02-14 2023-05-16 平安科技(深圳)有限公司 科室推荐方法、装置、设备及存储介质
CN115860882A (zh) * 2023-03-03 2023-03-28 北京吉道尔科技有限公司 基于区块链的智慧城市商品大数据智能选购方法及系统
CN116739704A (zh) * 2023-06-07 2023-09-12 北京海上升科技有限公司 基于人工智能的电商平台兴趣分析式商品推荐方法及系统

Also Published As

Publication number Publication date
CN117059092A (zh) 2023-11-14

Similar Documents

Publication Publication Date Title
CN106683680B (zh) 说话人识别方法及装置、计算机设备及计算机可读介质
JP7242912B2 (ja) オリジナル音声の声紋を認識する方法、装置、設備および記憶媒体
CN111477250B (zh) 音频场景识别方法、音频场景识别模型的训练方法和装置
CN110909613A (zh) 视频人物识别方法、装置、存储介质与电子设备
CN110197658B (zh) 语音处理方法、装置以及电子设备
CN109559735B (zh) 一种基于神经网络的语音识别方法、终端设备及介质
CN108492830B (zh) 声纹识别方法、装置、计算机设备和存储介质
CN111081279A (zh) 语音情绪波动分析方法及装置
CN109658921B (zh) 一种语音信号处理方法、设备及计算机可读存储介质
CN111785275A (zh) 语音识别方法及装置
WO2020056995A1 (zh) 语音流利度识别方法、装置、计算机设备及可读存储介质
CN112364664B (zh) 意图识别模型的训练及意图识别方法、装置、存储介质
US11238289B1 (en) Automatic lie detection method and apparatus for interactive scenarios, device and medium
US11133022B2 (en) Method and device for audio recognition using sample audio and a voting matrix
CN112507311A (zh) 一种基于多模态特征融合的高安全性身份验证方法
CN110136726A (zh) 一种语音性别的估计方法、装置、系统及存储介质
CN113886792A (zh) 一种声纹识别和人脸识别相结合的印控仪应用方法和系统
CN107680584B (zh) 用于切分音频的方法和装置
CN115862638A (zh) 基于区块链的金融交易操作及大数据安全存储方法和系统
CN112232276A (zh) 一种基于语音识别和图像识别的情绪检测方法和装置
CN112992155B (zh) 一种基于残差神经网络的远场语音说话人识别方法及装置
CN113345466A (zh) 基于多麦克风场景的主说话人语音检测方法、装置及设备
CN117059092B (zh) 基于区块链的智慧医疗交互式智能分诊方法及系统
CN116884428A (zh) 基于区块链的线上诊疗及音视频数据智能优化方法和系统
CN116884648A (zh) 基于中医问诊的语音交互优化方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240506

Address after: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant after: Shenzhen Puyi Tongchuang Technology Co.,Ltd.

Country or region after: China

Address before: Room 222, 3-16, floors 2-3, No. 3, Maizidian West Road, Chaoyang District, Beijing 100020

Applicant before: Beijing jidaoer Technology Co.,Ltd.

Country or region before: China

GR01 Patent grant
GR01 Patent grant