CN117591660B - 基于数字人的材料生成方法、设备及介质 - Google Patents

基于数字人的材料生成方法、设备及介质 Download PDF

Info

Publication number
CN117591660B
CN117591660B CN202410071132.7A CN202410071132A CN117591660B CN 117591660 B CN117591660 B CN 117591660B CN 202410071132 A CN202410071132 A CN 202410071132A CN 117591660 B CN117591660 B CN 117591660B
Authority
CN
China
Prior art keywords
digital person
person
user
digital
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410071132.7A
Other languages
English (en)
Other versions
CN117591660A (zh
Inventor
邓永春
蒋志平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Weican Technology Co ltd
Original Assignee
Hangzhou Weican Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Weican Technology Co ltd filed Critical Hangzhou Weican Technology Co ltd
Priority to CN202410071132.7A priority Critical patent/CN117591660B/zh
Publication of CN117591660A publication Critical patent/CN117591660A/zh
Application granted granted Critical
Publication of CN117591660B publication Critical patent/CN117591660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及人工智能技术领域,提供一种基于数字人的材料生成方法、设备及介质,能够基于数字人进行落座行为检测,以避免发生事件误办理问题;基于数字人对用户进行身份信息确认,以确保用户身份准确;控制数字人基于目标问答模版与用户进行对话,以基于不同的模版与用户进行针对性对话;控制数字人对对话内容的可信度进行检测,以实现对对话内容自动快速的审核,无需人工干预;利用数字人对对话内容进行转换得到材料,以基于数字人实现对材料的自动生成,无需人为操作,不仅能够避免引入人为错误,且提高了材料的生成效率。

Description

基于数字人的材料生成方法、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于数字人的材料生成方法、设备及介质。
背景技术
目前,在进行事件办理时,需要办案人员到现场控制及拍照,并亲自与相关人员进行沟通取证,事件办理耗时长,且人力成本较高。
因此,为了加快事件办理,建设新的、高效的办案体系,同时本着“能移动不桌面、能线上不线下、能共享不重复”的建设理念,并结合“拍一拍、讲一讲、看一看、想一想”的设计思路,亟需一种新的事件办理方案,能够将办案人员从原来繁重的体力劳动、重复劳动中解放出来,并在轻松办案中实现办案的规范化。
发明内容
鉴于以上内容,有必要提供一种基于数字人的材料生成方法、设备及介质,旨在解决事件办理耗时长且人力成本高,导致无法高效、准确的生成材料的问题。
一种基于数字人的材料生成方法,所述基于数字人的材料生成方法包括:
响应于数字人唤醒指令,启动预先模拟的数字人,并利用所述数字人进行落座行为检测;
当检测到有用户通过所述落座行为检测时,基于所述数字人对所述用户进行身份信息确认;
当身份信息确认成功时,控制所述数字人向所述用户语音播报告知信息;
当所述告知信息播报结束时,获取所述用户对应的案由,并调取与所述案由对应的目标问答模版,控制所述数字人基于所述目标问答模版与所述用户进行对话,并记录对话内容;
控制所述数字人对所述对话内容的可信度进行检测;
当所述对话内容的可信度通过检测时,利用所述数字人对所述对话内容进行转换,得到材料。
根据本发明优选实施例,所述启动预先模拟的数字人前,所述方法还包括:
调用3D引擎基于线稿构建几何形状,及基于轮廓渲染细节,得到初始人物模型;
获取基准人物形象,并基于所述基准人物形象的穿着特征对所述初始人物模型进行布料模拟,以及基于所述基准人物形象的发型特征对所述初始人物模型进行毛发渲染,得到中间人物模型;
获取所述基准人物形象的运动特征,并基于所述运动特征对所述中间人物模型进行运动匹配,得到所述数字人;
其中,所述数字人的工作模式包括指令播报模式、情景对话模式;
其中,所述数字人包括语音驱动组件,所述语音驱动组件用于控制与所述数字人关联的录音设备进行录音,并根据录音得到的音频文件对所述数字人进行驱动;
其中,所述数字人还包括唇形驱动组件,所述唇形驱动组件用于基于唇形算法生成人物说话时的口形数据,并基于所述口形数据对所述数字人说话时的口型进行校准;
其中,所述数字人还包括知识图谱组件,所述知识图谱组件用于通过知识图谱方式连接事件的实体要素关系。
根据本发明优选实施例,所述利用所述数字人进行落座行为检测包括:
利用所述数字人内部署的传感器设备检测所述数字人的座位上是否有人落座;
当检测到有人落座时,对检测到的人进行光栅检测,得到所述检测到的人相对于所述座位的偏移量;
当所述偏移量小于或者等于预设阈值时,确定所述检测到的人通过所述落座行为检测;或者
当所述偏移量大于或者等于所述预设阈值时,确定所述检测到的人未通过所述落座行为检测,并基于所述偏移量发出位置调整提示。
根据本发明优选实施例,所述基于所述数字人对所述用户进行身份信息确认包括:
调用所述数字人的人脸识别引擎对所述用户进行人脸识别,得到人脸识别结果;
根据所述人脸识别结果从配置数据库中调取所述用户的身份信息;
在所述数字人的显示器上显示所述身份信息,并向所述用户发出对所述身份信息的确认提示;
当接收到所述用户反馈的所述身份信息确认无误的响应时,控制所述数字人继续执行下一任务;或者
当接收到所述用户反馈的所述身份信息有误的响应时,获取错误信息,并基于所述错误信息向指定终端设备发送通知。
根据本发明优选实施例,所述控制所述数字人对所述对话内容的可信度进行检测包括:
控制所述数字人对所述对话内容进行要素提取,得到对话要点;
获取所述用户的每个同案人员,及获取每个同案人员提供的事件要点;
计算所述对话要点与每个同案人员提供的事件要点的关联度,得到每个第一关联度;
获取所述第一关联度中大于或者等于第一配置关联度的关联度的数量,并作为第一数量;
当所述第一数量大于或者等于第一数值时,获取当前取证;
计算所述对话要点与所述当前取证的关联度作为第二关联度,及计算每个同案人员提供的事件要点与所述当前取证的关联度得到每个第三关联度;
获取所述第二关联度与所述第三关联度中大于或者等于第二配置关联度的关联度的数量,并作为第二数量;
当所述第二数量大于或者等于第二数值时,确定所述对话内容的可信度通过检测;或者
当所述第一数量小于所述第一数值,或者所述第二数量小于所述第二数值时,确定所述对话内容的可信度未通过检测,并生成检测记录。
根据本发明优选实施例,所述控制所述数字人对所述对话内容的可信度进行检测后,所述方法还包括:
当所述对话内容的可信度通过检测时,记录所述对话内容与所述当前取证的关联,以生成指正摘要;
记录所述对话内容与每个同案人员提供的事件要点的关联,得到印证摘要;
根据所述对话内容、所述当前取证及每个同案人员提供的事件要点对所述用户进行身份预测,得到所述用户在当前事件中的身份。
根据本发明优选实施例,所述方法还包括:
当所述数字人接收到所述用户触发的远程介入指令,或者当确定所述对话内容的可信度未通过检测时,与指定用户建立远程连接,并向所述指定用户发送事件办理提示。
根据本发明优选实施例,所述利用所述数字人对所述对话内容进行转换,得到材料包括:
获取当前事件类型;
当所述当前事件类型为快速办理类型时,将所述对话内容转换为自书材料,并提示所述用户对所述自书材料进行确认;当检测到所述用户对所述自书材料完成确认时,将确认后的自书材料确定为所述材料;或者
当所述当前事件类型为非快速办理类型,或者待添加额外笔录的类型时,调用笔录生成引擎基于所述对话内容生成行政笔录材料;或者
当所述当前事件类型为刑事事件类型时,调用所述笔录生成引擎基于所述对话内容生成刑事讯问笔录材料。
一种基于数字人的材料生成装置,所述基于数字人的材料生成装置包括:
检测单元,用于响应于数字人唤醒指令,启动预先模拟的数字人,并利用所述数字人进行落座行为检测;
确认单元,用于当检测到有用户通过所述落座行为检测时,基于所述数字人对所述用户进行身份信息确认;
播报单元,用于当身份信息确认成功时,控制所述数字人向所述用户语音播报告知信息;
对话单元,用于当所述告知信息播报结束时,获取所述用户对应的案由,并调取与所述案由对应的目标问答模版,控制所述数字人基于所述目标问答模版与所述用户进行对话,并记录对话内容;
所述检测单元,还用于控制所述数字人对所述对话内容的可信度进行检测;
转换单元,用于当所述对话内容的可信度通过检测时,利用所述数字人对所述对话内容进行转换,得到材料。
一种计算机设备,所述计算机设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现所述基于数字人的材料生成方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被计算机设备中的处理器执行以实现所述基于数字人的材料生成方法。
由以上技术方案可以看出,本发明能够基于数字人进行落座行为检测,以避免发生事件误办理问题;基于数字人对用户进行身份信息确认,以确保用户身份准确;控制数字人基于目标问答模版与用户进行对话,以基于不同的模版与用户进行针对性对话;控制数字人对对话内容的可信度进行检测,以实现对对话内容自动快速的审核,无需人工干预;利用数字人对对话内容进行转换得到材料,以基于数字人实现对材料的自动生成,无需人为操作,不仅能够避免引入人为错误,且提高了材料的生成效率。
附图说明
图1是本发明基于数字人的材料生成方法的较佳实施例的流程图。
图2是本发明基于数字人的材料生成装置的较佳实施例的功能模块图。
图3是本发明实现基于数字人的材料生成方法的较佳实施例的计算机设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明基于数字人的材料生成方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述基于数字人的材料生成方法应用于一个或者多个计算机设备中,所述计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
所述计算机设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量主机或网络服务器构成的云。
所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,响应于数字人唤醒指令,启动预先模拟的数字人,并利用所述数字人进行落座行为检测。
在本实施例中,所述数字人唤醒指令可以通过预设的唤醒语音(如“启动数字人”等)触发,也可以通过指定按键触发,本实施例对所述数字人唤醒指令的触发方式不做限制。
在本实施例中,所述启动预先模拟的数字人前,所述方法还包括:
调用3D(3 Dimensions,三维)引擎基于线稿构建几何形状,及基于轮廓渲染细节,得到初始人物模型;
获取基准人物形象,并基于所述基准人物形象的穿着特征对所述初始人物模型进行布料模拟,以及基于所述基准人物形象的发型特征对所述初始人物模型进行毛发渲染,得到中间人物模型;
获取所述基准人物形象的运动特征,并基于所述运动特征对所述中间人物模型进行运动匹配,得到所述数字人;
其中,所述数字人的工作模式包括指令播报模式、情景对话模式;
其中,所述数字人包括语音驱动组件,所述语音驱动组件用于控制与所述数字人关联的录音设备进行录音,并根据录音得到的音频文件对所述数字人进行驱动;如通过语音唤醒所述数字人、向所述数字人发送指令、与所述数字人对话等;
其中,所述数字人还包括唇形驱动组件,所述唇形驱动组件用于基于唇形算法生成人物说话时的口形数据,并基于所述口形数据对所述数字人说话时的口型进行校准,以使所述数字人逼近真人说话的效果;
其中,所述数字人还包括知识图谱组件,所述知识图谱组件用于通过知识图谱方式连接事件的实体要素关系。具体地,结合语音识别、语音合成、自然语言理解共同组建“数字人大脑”,驱动数字人执法教育内容转化。所述知识图谱组件提供识别和提取事件或警情文本实体要素的能力,把人、物、事件要素等不同种类的信息连接在一起而得到一个关系网络,实现人物关系、事件关系、事件要素关系、证据关系的查询。例如:将分类案由的图谱模型与对应事件的证据材料进行结合,并形成该案清晰的逻辑线条,及可以适应审判证据规则的证据图谱,并发现事件主体、客体、主观方面、客观方面的证据现状及存在的问题。
例如:所述基准人物形象是指办案人员的普遍形象。如藏蓝色大檐帽、深色领带、蓝色衬衣的着装。
例如:所述指令播报模式为对系统给定文本结构化数据进行识读、发声;所述情景对话模式为在特定的场景下,基于取证信息、自然语言分析模型还原事件经过、事实真相。
在上述实施例中,通过主流人物形象建模方式进行建模,以刻画出现实中办案人员的体貌特征,精确地创造所述数字人的面部特征、衣着、神态等来呈现所述数字人的情感,真实展现出生动、流畅和自然的动作,以增强所述数字人的逼真度、表现力、交互和共情能力。
本实施例将所述数字人模拟为普遍认知中的形象,能够使用户的感知更加真实,同时提高了数字人的辨识度及专业度。
在本实施例中,所述数字人还可以包括语音合成引擎,所述语音合成引擎可以基于大文本训练深度学习技术、语音合成技术提供将文本信息转化为自然语言的能力,使得所述数字人可以通过语音进行交互和对话;对输入的文本进行分词、语音标注和音素转换等处理,以及基于构建的声音库控制音素、单词、短语等生成语音输出,并基于声学模块捕捉语音音高、共振峰、持续时间等声学特性以控制生成的语音的音色、音调和韵律,同时提供语速、音量、音调和发音等参数的调整功能,以满足特定的需求和偏好,使语音输出更加自然易懂,并支持将标准普通话等多语种文本实时、准确地转换为自然、刘畅的语音。
在本实施例中,所述数字人还可以包括语音识别引擎,用于提供输入设备获取语音信号的能力以实现人机交互。采用神经网络对标点符、数字转换等可读性模块的预测,以及多种机器学习算法的融合技术,识别用户语音,并将语音转换为文字。同时,使用声学模型分析和表示语音信号的特征,并基于大型文本语料库预测给定音频信号下可能的词或短语序列,将声学特征与语言模型进行匹配,使语音中的词汇内容转换为计算机可读的输入,最终让所述数字人具有“听”的能力。
在本实施例中,所述数字人还可以包括自然语言理解分析引擎,所述自然语言理解分析引擎用于使用统计、规则或人工智能的学习方法,对大量的文本数据进行建模,并对输入的单词、短语和句子的语义关系进行分析,以识别上下文中的实体、动作、属性和关系,从而识别用户对象的需求、意愿或命令,并将其转化为计算机可以理解的形式,帮助判断不同句子或片段的可能含义,以便进行后续的处理,融合相关领域的知识问答库,构建所述数字人的智能问答和对话能力。
在本实施例中,所述利用所述数字人进行落座行为检测包括:
利用所述数字人内部署的传感器设备检测所述数字人的座位上是否有人落座;
当检测到有人落座时,对检测到的人进行光栅检测,得到所述检测到的人相对于所述座位的偏移量;
当所述偏移量小于或者等于预设阈值时,确定所述检测到的人通过所述落座行为检测;或者
当所述偏移量大于或者等于所述预设阈值时,确定所述检测到的人未通过所述落座行为检测,并基于所述偏移量发出位置调整提示。
例如:所述传感器设备可以为所述座位上的压力传感器,也可以为红外传感器等。
其中,所述预设阈值可以根据实际的需求进行配置。
通过上述实施例,能够自动检测出是否有人正确落座,避免出现对事件的误办理问题,并辅助相关人员正确落座。
S11,当检测到有用户通过所述落座行为检测时,基于所述数字人对所述用户进行身份信息确认。
在本实施例中,所述基于所述数字人对所述用户进行身份信息确认包括:
调用所述数字人的人脸识别引擎对所述用户进行人脸识别,得到人脸识别结果;
根据所述人脸识别结果从配置数据库中调取所述用户的身份信息;
在所述数字人的显示器上显示所述身份信息,并向所述用户发出对所述身份信息的确认提示;
当接收到所述用户反馈的所述身份信息确认无误的响应时,控制所述数字人继续执行下一任务;或者
当接收到所述用户反馈的所述身份信息有误的响应时,获取错误信息,并基于所述错误信息向指定终端设备发送通知。
其中,所述配置数据库可以为能够准确提供用户身份的安全数据库。
其中,所述指定终端设备可以为事件办理人员的手机等智能终端。
通过上述实施例,能够自动引导用户进行身份确认。
S12,当身份信息确认成功时,控制所述数字人向所述用户语音播报告知信息。
其中,所述告知信息可以为若事件确认为所述用户导致时,所述用户需要负的责任等,以及让所述用户保证提供真实信息的提示。
在播报所述告知信息时,还可以根据所述用户的反馈对相关告知内容进行重复播报。
S13,当所述告知信息播报结束时,获取所述用户对应的案由,并调取与所述案由对应的目标问答模版,控制所述数字人基于所述目标问答模版与所述用户进行对话,并记录对话内容。
在本实施例中,不同的案由各自对应于不同的问答模版,以便根据不同的案由与用户进行针对性对话,提高了对话的效率,同时保证了对话内容的可用性。
S14,控制所述数字人对所述对话内容的可信度进行检测。
在本实施例中,所述控制所述数字人对所述对话内容的可信度进行检测包括:
控制所述数字人对所述对话内容进行要素提取,得到对话要点;
获取所述用户的每个同案人员,及获取每个同案人员提供的事件要点;
计算所述对话要点与每个同案人员提供的事件要点的关联度,得到每个第一关联度;
获取所述第一关联度中大于或者等于第一配置关联度的关联度的数量,并作为第一数量;
当所述第一数量大于或者等于第一数值时,获取当前取证;
计算所述对话要点与所述当前取证的关联度作为第二关联度,及计算每个同案人员提供的事件要点与所述当前取证的关联度得到每个第三关联度;
获取所述第二关联度与所述第三关联度中大于或者等于第二配置关联度的关联度的数量,并作为第二数量;
当所述第二数量大于或者等于第二数值时,确定所述对话内容的可信度通过检测;或者
当所述第一数量小于所述第一数值,或者所述第二数量小于所述第二数值时,确定所述对话内容的可信度未通过检测,并生成检测记录。
其中,所述对话要点可以包括,但不限于以下一种或者多种信息的组合:
时间、地点、任务、事件过程等。
其中,所述第一配置关联度及所述第二配置关联度,所述第一数值及所述第二数值可以根据实际的办案场景进行配置。
通过上述实施例,能够自动对相关人员陈述内容的一致性进行检测,无需人为参与,提高了检测效率。
在本实施例中,所述控制所述数字人对所述对话内容的可信度进行检测后,所述方法还包括:
当所述对话内容的可信度通过检测时,记录所述对话内容与所述当前取证的关联,以生成指正摘要;
记录所述对话内容与每个同案人员提供的事件要点的关联,得到印证摘要;
根据所述对话内容、所述当前取证及每个同案人员提供的事件要点对所述用户进行身份预测,得到所述用户在当前事件中的身份。
通过上述实施例,能够同时提供当前事件的指正摘要、印证摘要及用户在当前事件中的身份,以供后续使用。
在本实施例中,所述方法还包括:
当所述数字人接收到所述用户触发的远程介入指令,或者当确定所述对话内容的可信度未通过检测时,与指定用户建立远程连接,并向所述指定用户发送事件办理提示。
例如:当所述用户拒绝采用数字办案方式,或者当前对话的可信度太低,需要人为介入时,则可以与相关办案人员建立远程连接,并向相关办案人员发送事件办理提示,以提示相关办案人员及时进行远程介入,避免耽误事件办理进度,同时提高了事件办理结果的准确性。
S15,当所述对话内容的可信度通过检测时,利用所述数字人对所述对话内容进行转换,得到材料。
在本实施例中,所述利用所述数字人对所述对话内容进行转换,得到材料包括:
获取当前事件类型;
当所述当前事件类型为快速办理类型时,将所述对话内容转换为自书材料,并提示所述用户对所述自书材料进行确认;当检测到所述用户对所述自书材料完成确认时,将确认后的自书材料确定为所述材料;或者
当所述当前事件类型为非快速办理类型,或者待添加额外笔录的类型时,调用笔录生成引擎基于所述对话内容生成行政笔录材料;或者
当所述当前事件类型为刑事事件类型时,调用所述笔录生成引擎基于所述对话内容生成刑事讯问笔录材料。
通过上述实施例,能够根据不同的事件类型生成不同类型的材料。
由以上技术方案可以看出,本发明能够基于数字人进行落座行为检测,以避免发生事件误办理问题;基于数字人对用户进行身份信息确认,以确保用户身份准确;控制数字人基于目标问答模版与用户进行对话,以基于不同的模版与用户进行针对性对话;控制数字人对对话内容的可信度进行检测,以实现对对话内容自动快速的审核,无需人工干预;利用数字人对对话内容进行转换得到材料,以基于数字人实现对材料的自动生成,无需人为操作,不仅能够避免引入人为错误,且提高了材料的生成效率。
如图2所示,是本发明基于数字人的材料生成装置的较佳实施例的功能模块图。所述基于数字人的材料生成装置11包括检测单元110、确认单元111、播报单元112、对话单元113、转换单元114。本发明所称的模块/单元是指一种能够被处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
其中,所述检测单元110,用于响应于数字人唤醒指令,启动预先模拟的数字人,并利用所述数字人进行落座行为检测;
所述确认单元111,用于当检测到有用户通过所述落座行为检测时,基于所述数字人对所述用户进行身份信息确认;
所述播报单元112,用于当身份信息确认成功时,控制所述数字人向所述用户语音播报告知信息;
所述对话单元113,用于当所述告知信息播报结束时,获取所述用户对应的案由,并调取与所述案由对应的目标问答模版,控制所述数字人基于所述目标问答模版与所述用户进行对话,并记录对话内容;
所述检测单元110,还用于控制所述数字人对所述对话内容的可信度进行检测;
所述转换单元114,用于当所述对话内容的可信度通过检测时,利用所述数字人对所述对话内容进行转换,得到材料。
由以上技术方案可以看出,本发明能够基于数字人进行落座行为检测,以避免发生事件误办理问题;基于数字人对用户进行身份信息确认,以确保用户身份准确;控制数字人基于目标问答模版与用户进行对话,以基于不同的模版与用户进行针对性对话;控制数字人对对话内容的可信度进行检测,以实现对对话内容自动快速的审核,无需人工干预;利用数字人对对话内容进行转换得到材料,以基于数字人实现对材料的自动生成,无需人为操作,不仅能够避免引入人为错误,且提高了材料的生成效率。
如图3所示,是本发明实现基于数字人的材料生成方法的较佳实施例的计算机设备的结构示意图。
所述计算机设备1可以包括存储器12、处理器13和总线,还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如基于数字人的材料生成程序。
本领域技术人员可以理解,所述示意图仅仅是计算机设备1的示例,并不构成对计算机设备1的限定,所述计算机设备1既可以是总线型结构,也可以是星形结构,所述计算机设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如所述计算机设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,所述计算机设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是计算机设备1的内部存储单元,例如该计算机设备1的移动硬盘。存储器12在另一些实施例中也可以是计算机设备1的外部存储设备,例如计算机设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器12还可以既包括计算机设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于计算机设备1的应用软件及各类数据,例如基于数字人的材料生成程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述计算机设备1的控制核心(Control Unit),利用各种接口和线路连接整个计算机设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行基于数字人的材料生成程序等),以及调用存储在所述存储器12内的数据,以执行计算机设备1的各种功能和处理数据。
所述处理器13执行所述计算机设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于数字人的材料生成方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机程序在所述计算机设备1中的执行过程。例如,所述计算机程序可以被分割成检测单元110、确认单元111、播报单元112、对话单元113、转换单元114。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述基于数字人的材料生成方法的部分。
所述计算机设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器等。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图3中仅用一根直线表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
尽管未示出,所述计算机设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器13逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述计算机设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该计算机设备1与其他计算机设备之间建立通信连接。
可选地,该计算机设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在计算机设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
图3仅示出了具有组件12-13的计算机设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对所述计算机设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
结合图1,所述计算机设备1中的所述存储器12存储多个指令以实现一种基于数字人的材料生成方法,所述处理器13可执行所述多个指令从而实现:
响应于数字人唤醒指令,启动预先模拟的数字人,并利用所述数字人进行落座行为检测;
当检测到有用户通过所述落座行为检测时,基于所述数字人对所述用户进行身份信息确认;
当身份信息确认成功时,控制所述数字人向所述用户语音播报告知信息;
当所述告知信息播报结束时,获取所述用户对应的案由,并调取与所述案由对应的目标问答模版,控制所述数字人基于所述目标问答模版与所述用户进行对话,并记录对话内容;
控制所述数字人对所述对话内容的可信度进行检测;
当所述对话内容的可信度通过检测时,利用所述数字人对所述对话内容进行转换,得到材料。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
需要说明的是,本案中所涉及到的数据均为合法取得。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
本发明可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。本发明中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (9)

1.一种基于数字人的材料生成方法,其特征在于,所述基于数字人的材料生成方法包括:
响应于数字人唤醒指令,启动预先模拟的数字人,并利用所述数字人进行落座行为检测;
当检测到有用户通过所述落座行为检测时,基于所述数字人对所述用户进行身份信息确认;
当身份信息确认成功时,控制所述数字人向所述用户语音播报告知信息;其中,根据所述用户的反馈对所述告知信息中的相关告知内容进行重复播报;
当所述告知信息播报结束时,获取所述用户对应的案由,并调取与所述案由对应的目标问答模版,控制所述数字人基于所述目标问答模版与所述用户进行对话,并记录对话内容;
控制所述数字人对所述对话内容的可信度进行检测,包括:控制所述数字人对所述对话内容进行要素提取,得到对话要点;获取所述用户的每个同案人员,及获取每个同案人员提供的事件要点;计算所述对话要点与每个同案人员提供的事件要点的关联度,得到每个第一关联度;获取所述第一关联度中大于或者等于第一配置关联度的关联度的数量,并作为第一数量;当所述第一数量大于或者等于第一数值时,获取当前取证;计算所述对话要点与所述当前取证的关联度作为第二关联度,及计算每个同案人员提供的事件要点与所述当前取证的关联度得到每个第三关联度;获取所述第二关联度与所述第三关联度中大于或者等于第二配置关联度的关联度的数量,并作为第二数量;当所述第二数量大于或者等于第二数值时,确定所述对话内容的可信度通过检测;或者当所述第一数量小于所述第一数值,或者所述第二数量小于所述第二数值时,确定所述对话内容的可信度未通过检测,并生成检测记录;
当所述对话内容的可信度通过检测时,利用所述数字人对所述对话内容进行转换,得到材料。
2.如权利要求1所述的基于数字人的材料生成方法,其特征在于,所述启动预先模拟的数字人前,所述方法还包括:
调用3D引擎基于线稿构建几何形状,及基于轮廓渲染细节,得到初始人物模型;
获取基准人物形象,并基于所述基准人物形象的穿着特征对所述初始人物模型进行布料模拟,以及基于所述基准人物形象的发型特征对所述初始人物模型进行毛发渲染,得到中间人物模型;
获取所述基准人物形象的运动特征,并基于所述运动特征对所述中间人物模型进行运动匹配,得到所述数字人;
其中,所述数字人的工作模式包括指令播报模式、情景对话模式;
其中,所述数字人包括语音驱动组件,所述语音驱动组件用于控制与所述数字人关联的录音设备进行录音,并根据录音得到的音频文件对所述数字人进行驱动;
其中,所述数字人还包括唇形驱动组件,所述唇形驱动组件用于基于唇形算法生成人物说话时的口形数据,并基于所述口形数据对所述数字人说话时的口型进行校准;
其中,所述数字人还包括知识图谱组件,所述知识图谱组件用于通过知识图谱方式连接事件的实体要素关系。
3.如权利要求1所述的基于数字人的材料生成方法,其特征在于,所述利用所述数字人进行落座行为检测包括:
利用所述数字人内部署的传感器设备检测所述数字人的座位上是否有人落座;
当检测到有人落座时,对检测到的人进行光栅检测,得到所述检测到的人相对于所述座位的偏移量;
当所述偏移量小于或者等于预设阈值时,确定所述检测到的人通过所述落座行为检测;或者
当所述偏移量大于或者等于所述预设阈值时,确定所述检测到的人未通过所述落座行为检测,并基于所述偏移量发出位置调整提示。
4.如权利要求1所述的基于数字人的材料生成方法,其特征在于,所述基于所述数字人对所述用户进行身份信息确认包括:
调用所述数字人的人脸识别引擎对所述用户进行人脸识别,得到人脸识别结果;
根据所述人脸识别结果从配置数据库中调取所述用户的身份信息;
在所述数字人的显示器上显示所述身份信息,并向所述用户发出对所述身份信息的确认提示;
当接收到所述用户反馈的所述身份信息确认无误的响应时,控制所述数字人继续执行下一任务;或者
当接收到所述用户反馈的所述身份信息有误的响应时,获取错误信息,并基于所述错误信息向指定终端设备发送通知。
5.如权利要求1所述的基于数字人的材料生成方法,其特征在于,所述控制所述数字人对所述对话内容的可信度进行检测后,所述方法还包括:
当所述对话内容的可信度通过检测时,记录所述对话内容与所述当前取证的关联,以生成指正摘要;
记录所述对话内容与每个同案人员提供的事件要点的关联,得到印证摘要;
根据所述对话内容、所述当前取证及每个同案人员提供的事件要点对所述用户进行身份预测,得到所述用户在当前事件中的身份。
6.如权利要求1所述的基于数字人的材料生成方法,其特征在于,所述方法还包括:
当所述数字人接收到所述用户触发的远程介入指令,或者当确定所述对话内容的可信度未通过检测时,与指定用户建立远程连接,并向所述指定用户发送事件办理提示。
7.如权利要求1所述的基于数字人的材料生成方法,其特征在于,所述利用所述数字人对所述对话内容进行转换,得到材料包括:
获取当前事件类型;
当所述当前事件类型为快速办理类型时,将所述对话内容转换为自书材料,并提示所述用户对所述自书材料进行确认;当检测到所述用户对所述自书材料完成确认时,将确认后的自书材料确定为所述材料;或者
当所述当前事件类型为非快速办理类型,或者待添加额外笔录的类型时,调用笔录生成引擎基于所述对话内容生成行政笔录材料;或者
当所述当前事件类型为刑事事件类型时,调用所述笔录生成引擎基于所述对话内容生成刑事讯问笔录材料。
8. 一种计算机设备,其特征在于,所述计算机设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的基于数字人的材料生成方法。
9.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被计算机设备中的处理器执行以实现如权利要求1至7中任意一项所述的基于数字人的材料生成方法。
CN202410071132.7A 2024-01-18 2024-01-18 基于数字人的材料生成方法、设备及介质 Active CN117591660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410071132.7A CN117591660B (zh) 2024-01-18 2024-01-18 基于数字人的材料生成方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410071132.7A CN117591660B (zh) 2024-01-18 2024-01-18 基于数字人的材料生成方法、设备及介质

Publications (2)

Publication Number Publication Date
CN117591660A CN117591660A (zh) 2024-02-23
CN117591660B true CN117591660B (zh) 2024-04-16

Family

ID=89911834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410071132.7A Active CN117591660B (zh) 2024-01-18 2024-01-18 基于数字人的材料生成方法、设备及介质

Country Status (1)

Country Link
CN (1) CN117591660B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6420514B1 (ja) * 2018-04-04 2018-11-07 一般社団法人It&診断支援センター・北九州 会話ロボット
CN109345191A (zh) * 2018-08-30 2019-02-15 浙江亨百信息技术有限公司 一种基于人工智能的办案控制系统及其方法
CN208739293U (zh) * 2018-08-29 2019-04-12 杭州亨百信息科技有限公司 一种智能审讯控制系统及控制台
CN110303513A (zh) * 2019-03-27 2019-10-08 陈志君 自助接报案笔录机器人及其系统
CN110522462A (zh) * 2019-08-26 2019-12-03 南京睿数网络科技有限公司 一种多模态智能审讯系统和方法
CN111627448A (zh) * 2020-05-15 2020-09-04 公安部第三研究所 实现基于语音大数据的审讯与谈话控制系统及其方法
CN111881288A (zh) * 2020-05-19 2020-11-03 杭州中奥科技有限公司 笔录信息真假的判断方法、装置、存储介质及电子设备
CN112162628A (zh) * 2020-09-01 2021-01-01 魔珐(上海)信息科技有限公司 基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端
CN112734604A (zh) * 2020-12-25 2021-04-30 科讯嘉联信息技术有限公司 一种提供多模态智能报案的装置及其笔录生成方法
CN114462376A (zh) * 2022-02-16 2022-05-10 来也科技(北京)有限公司 基于rpa和ai的庭审笔录生成方法、装置、设备及介质
CN114495927A (zh) * 2021-12-31 2022-05-13 魔珐(上海)信息科技有限公司 多模态交互的虚拟数字人的生成方法及装置、存储介质、终端
CN115423667A (zh) * 2022-08-30 2022-12-02 和旭科技南京有限公司 基于物联网、人工智能和大数据分析的智慧审讯系统
CN115550711A (zh) * 2022-09-23 2022-12-30 阿里巴巴(中国)有限公司 虚拟数字人渲染方法、渲染引擎及系统
CN115618873A (zh) * 2021-07-13 2023-01-17 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机设备及存储介质
CN116229977A (zh) * 2022-12-21 2023-06-06 国泰君安证券股份有限公司 基于虚拟数字人实现智能化实时交互问答的系统及其处理方法
CN116798427A (zh) * 2023-06-21 2023-09-22 支付宝(杭州)信息技术有限公司 基于多模态的人机交互方法及数字人系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10670706B2 (en) * 2015-06-15 2020-06-02 Sony Corporation Detection device, system and method for detecting the presence of a living being

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6420514B1 (ja) * 2018-04-04 2018-11-07 一般社団法人It&診断支援センター・北九州 会話ロボット
CN208739293U (zh) * 2018-08-29 2019-04-12 杭州亨百信息科技有限公司 一种智能审讯控制系统及控制台
CN109345191A (zh) * 2018-08-30 2019-02-15 浙江亨百信息技术有限公司 一种基于人工智能的办案控制系统及其方法
CN110303513A (zh) * 2019-03-27 2019-10-08 陈志君 自助接报案笔录机器人及其系统
CN110522462A (zh) * 2019-08-26 2019-12-03 南京睿数网络科技有限公司 一种多模态智能审讯系统和方法
CN111627448A (zh) * 2020-05-15 2020-09-04 公安部第三研究所 实现基于语音大数据的审讯与谈话控制系统及其方法
CN111881288A (zh) * 2020-05-19 2020-11-03 杭州中奥科技有限公司 笔录信息真假的判断方法、装置、存储介质及电子设备
CN112162628A (zh) * 2020-09-01 2021-01-01 魔珐(上海)信息科技有限公司 基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端
CN112734604A (zh) * 2020-12-25 2021-04-30 科讯嘉联信息技术有限公司 一种提供多模态智能报案的装置及其笔录生成方法
CN115618873A (zh) * 2021-07-13 2023-01-17 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机设备及存储介质
CN114495927A (zh) * 2021-12-31 2022-05-13 魔珐(上海)信息科技有限公司 多模态交互的虚拟数字人的生成方法及装置、存储介质、终端
CN114462376A (zh) * 2022-02-16 2022-05-10 来也科技(北京)有限公司 基于rpa和ai的庭审笔录生成方法、装置、设备及介质
CN115423667A (zh) * 2022-08-30 2022-12-02 和旭科技南京有限公司 基于物联网、人工智能和大数据分析的智慧审讯系统
CN115550711A (zh) * 2022-09-23 2022-12-30 阿里巴巴(中国)有限公司 虚拟数字人渲染方法、渲染引擎及系统
CN116229977A (zh) * 2022-12-21 2023-06-06 国泰君安证券股份有限公司 基于虚拟数字人实现智能化实时交互问答的系统及其处理方法
CN116798427A (zh) * 2023-06-21 2023-09-22 支付宝(杭州)信息技术有限公司 基于多模态的人机交互方法及数字人系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
审讯中人工智能的应用与思考;毕惜茜;;中国人民公安大学学报(社会科学版);20200615(第03期);全文 *

Also Published As

Publication number Publication date
CN117591660A (zh) 2024-02-23

Similar Documents

Publication Publication Date Title
CN112086086B (zh) 语音合成方法、装置、设备及计算机可读存储介质
CN113420807A (zh) 基于多任务学习与注意力机制的多模态融合情感识别系统、方法及实验评价方法
CN112001175B (zh) 流程自动化方法、装置、电子设备及存储介质
US20240070397A1 (en) Human-computer interaction method, apparatus and system, electronic device and computer medium
Sayers et al. The Dawn of the Human-Machine Era: A forecast of new and emerging language technologies.
JP2017016566A (ja) 情報処理装置、情報処理方法及びプログラム
CN113870395A (zh) 动画视频生成方法、装置、设备及存储介质
CN113345431B (zh) 跨语言语音转换方法、装置、设备及介质
Mower et al. Human perception of audio-visual synthetic character emotion expression in the presence of ambiguous and conflicting information
KR20190109651A (ko) 인공지능 기반의 음성 모방 대화 서비스 제공 방법 및 시스템
Antunes et al. A framework to support development of sign language human-computer interaction: Building tools for effective information access and inclusion of the deaf
CN110767005A (zh) 基于儿童专用智能设备的数据处理方法及系统
CN113435180B (zh) 文本纠错方法、装置、电子设备及存储介质
CN113707124A (zh) 话术语音的联动播报方法、装置、电子设备及存储介质
CN117591660B (zh) 基于数字人的材料生成方法、设备及介质
CN116450797A (zh) 基于多模态对话的情感分类方法、装置、设备及介质
CN116523734A (zh) 基于人工智能的视频生成方法、装置、电子设备及介质
Yip Cross-situational word learning of Cantonese Chinese
CN114519999A (zh) 基于双模态模型的语音识别方法、装置、设备及存储介质
CN114401346A (zh) 基于人工智能的应答方法、装置、设备及介质
Bhutada et al. Facial Emotion Recognition Using Chatbot and Raspberry Pi
CN113268953A (zh) 文本重点词抽取方法、装置、计算机设备及存储介质
CN112331209A (zh) 一种语音转文本的方法、装置、电子设备及可读存储介质
WO2024037196A1 (zh) 一种通信方法以及装置
CN114565814B (zh) 一种特征检测方法、装置及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant