CN116189682A - 文本信息显示方法、装置、电子设备及存储介质 - Google Patents

文本信息显示方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116189682A
CN116189682A CN202211602551.6A CN202211602551A CN116189682A CN 116189682 A CN116189682 A CN 116189682A CN 202211602551 A CN202211602551 A CN 202211602551A CN 116189682 A CN116189682 A CN 116189682A
Authority
CN
China
Prior art keywords
information
text
voice
user
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211602551.6A
Other languages
English (en)
Inventor
谢基有
李亚桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Digital Miracle Technology Co ltd
Voiceai Technologies Co ltd
Original Assignee
Shanghai Shengyang Yunhan Information Technology Co ltd
Voiceai Technologies Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Shengyang Yunhan Information Technology Co ltd, Voiceai Technologies Co ltd filed Critical Shanghai Shengyang Yunhan Information Technology Co ltd
Priority to CN202211602551.6A priority Critical patent/CN116189682A/zh
Publication of CN116189682A publication Critical patent/CN116189682A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/065Combinations of audio and video presentations, e.g. videotapes, videodiscs, television systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Hardware Design (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本申请提供文本信息显示方法、装置、电子设备及存储介质,该方法包括:显示对话信息;若接收到用户根据对话信息输入的语音数据,则显示与语音数据对应的语音控件;根据语音控件的位置信息确定文本显示位置;将语音数据转化为文本信息,并在文本显示位置显示文本信息。通过自动将语音数据转化为文本信息,并在文本显示位置显示文本信息,可以模拟真实的沟通情景,提高情景练习的真实性,以提高培训效果。

Description

文本信息显示方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机技术领域,更具体地,涉及文本信息显示方法、装置、电子设备及存储介质。
背景技术
随着技术发展,人们越来越多的在网上进行学习,例如,企业可以通过网络对员工进行培训,但是目前通过网络进行培训的方式过于简单,无法模拟真实的沟通情景,导致培训效果不佳。
发明内容
鉴于上述问题,本申请提出了一种文本信息显示方法、装置、电子设备及存储介质,以改善上述问题。
第一方面,本申请实施例提供了一种文本信息显示方法,方法包括:显示对话信息;若接收到用户根据对话信息输入的语音数据,则显示与语音数据对应的语音控件;根据语音控件的位置信息确定文本显示位置;将语音数据转化为文本信息,并在文本显示位置显示文本信息。
第二方面,本申请实施例还提供了一种文本信息显示装置,装置包括:第一显示模块,用于显示对话信息;第二显示模块,用于若接收到用户根据对话信息输入的语音数据,则显示与语音数据对应的语音控件;确定模块,用于根据语音控件的位置信息确定文本显示位置;转化模块,用于将语音数据转化为文本信息,并在文本显示位置显示文本信息。
第三方面,本申请实施例还提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面的文本信息显示方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使电子设备能够执行如第一方面的文本信息显示方法。
本申请提供一种文本信息显示方法、装置、电子设备及存储介质,该方法包括:显示对话信息;若接收到用户根据对话信息输入的语音数据,则显示与语音数据对应的语音控件;根据语音控件的位置信息确定文本显示位置;将语音数据转化为文本信息,并在文本显示位置显示文本信息。通过自动将语音数据转化为文本信息,并在文本显示位置显示文本信息,可以模拟真实的沟通情景,提高情景练习的真实性,以提高培训效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例及附图,都属于本发明保护的范围。
图1是本申请实施例提供的一种文本信息显示方法的流程示意图。
图2是图1中的步骤110的细化流程示意图。
图3是本申请实施例提供的语音控件与输入控件的示意图。
图4是本申请实施例提供的显示焦点的示意图。
图5是本申请实施例提供的一种文本信息显示方法的另一流程示意图。
图6是本申请实施例提供的辅助控件的示意图。
图7是本申请实施例提供的一种文本信息显示装置的结构示意图。
图8是本申请实施例提供的一种电子设备的结构示意图。
图9是本申请实施例提供的一种计算机可读存储介质的结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着技术发展,人们越来越多的在网上进行学习,例如企业可以通过网络对员工进行培训,但是目前通过网络进行培训的方式过于简单,例如很多网上培训都只是跟答题一样出题目让用户输入答案,无法模拟真实的沟通情景,用户完成培训后独自面对客户时仍然经常遭到投诉,沟通不顺利,培训效果不佳。
为了改善上述问题,发明人提出了文本信息显示方法、装置、电子设备及存储介质,该方法包括:显示对话信息;若接收到用户根据对话信息输入的语音数据,则显示与语音数据对应的语音控件;根据语音控件的位置信息确定文本显示位置;将语音数据转化为文本信息,并在文本显示位置显示文本信息。通过自动将语音数据转化为文本信息,并在文本显示位置显示文本信息,可以模拟真实的沟通情景,提高情景练习的真实性,以提高培训效果。
下面将结合附图具体描述本申请的各实施例。
请参阅图1,图1是本申请实施例提供的一种文本信息显示方法的流程示意图。如图1所示,该方法包括:步骤110至步骤140。
步骤110:显示对话信息。
在一些实施方式中,对话信息由客户发送,并于用户的电子设备中进行显示。
在一些实施方式中,对话信息可以预先设置好,通过显示该对话信息以使用户对该对话信息进行回复。
在一些实施方式中,对话信息可以为文本信息、音频信息以及视频信息等,本申请对对话信息的类型不作限制。
请再参阅图2,图2是图1中的步骤110的细化流程示意图。如图2所示,步骤110包括:步骤111至步骤113。
步骤111:获取情景信息和客户类别信息。
在一些实施方式中,为了对用户进行培训,可以获取情景信息和客户类别信息以确定用于培训的情景以及在该情景下的目标客户。
在一些实施方式中,情景信息包括情景名称、情景属性等。可选地,情景属性包括催款通知、客服、回访、产品信息更新通知等。
进一步地,情景信息还可以包括客户属性。示例性地,客户属性包括是否欠费、是否逾期、是否已购买、沟通难度等。
在一些实施方式中,客户类别信息用于反映客户类别,进一步地,一个客户对应的客户类别可以有多种,因此客户类别信息可以包括多种客户类别。可选地,客户类别包括男性、女性、信用良好、信用较差、国内客户、国外客户等。
在一些实施方式中,还可以获取用户的历史情景对练信息,根据历史情景对练信息确定用户最不擅长应对的客户类别、客户属性、情景属性中的一种或多种,以获取根据用户最不擅长应对的客户类别、客户属性、情景属性中的一种或多种,以对用户进行针对性的训练。
步骤112:根据情景信息和客户类别信息确定目标客户。
在一些实施方式中,步骤112包括:
(1)根据情景信息确定客户属性。
(2)根据客户类别信息确定客户类别。
(3)根据客户属性和客户类别确定目标客户。
在一些实施方式中,若根据客户属性和客户类别可以确定多个符合要求的客户,则可以在多个符合要求的客户中随机抽取一个作为目标客户。进一步地,每个目标客户对应的对话信息都不相同。
在一些实施方式中,管理员可以在后台设置情景信息,以设置情景信息包含的客户属性。
在一些实施方式中,目标客户的信息可以预先创建并存储好,例如可以预先创建并存储于服务器、数据库或用户的电子设备等中,根据客户属性以及客户类别可以在服务器、数据库或用户的电子设备中寻找符合要求的目标客户。
在一些实施方式中,为了更准确的定位目标客户,还可以根据情景属性确定目标客户,此时步骤112包括:
(1)根据情景信息确定情景属性和客户属性。
(2)根据客户类别信息确定客户类别。
(3)根据情景属性、客户属性以及客户类别确定目标客户。
示例性地,若情景属性为催款通知,客户属性为“是否逾期:是”,客户类别为男性、信用良好,则目标客户则为信用良好的需要催款通知的已经逾期的男性客户;若情景属性为催款通知,客户属性为“是否逾期:否”,客户类别为女性、国外客户,则目标客户为需要催款通知的尚未逾期的国外的女性客户。
根据情景属性、客户属性以及客户类别可以设置多个不同的目标客户,使得用户训练时每一次碰到的目标客户均不相同,提高用户的应变能力。
步骤113:根据目标客户确定对话信息。
在一些实施方式中,每一目标客户都具有对应的对话信息,该对话信息可以预先设置好。
在一些实施方式中,根据目标客户对应的客户属性、客户类别以及情景属性定制对话信息,以增强情景对练的真实性。
示例性地,客户属性为“是否逾期:是”的目标客户的对话信息可以为阐述逾期理由,客户属性为“是否逾期:否”的目标客户的对话信息则为对用户的催还信息感到不耐烦。
示例性地,客户类别为“国内用户”的目标客户的对话信息为全中文,客户类别为“国外用户”的目标客户的对话信息为与国外用户国籍对应的外文或不太通顺的中文,以训练用户对不同客户的沟通能力。
示例性地,情景属性为催款通知、客服、回访、产品信息更新通知时,对话信息也各不相同,以对真实的对话情景进行模拟。
在一些实施方式中,用户通过输入语音数据对显示的对话信息进行作答,此时显示的对话信息还与用户上一次输入的语音数据有关。
具体地,可以对用户上一次输入的语音数据进行关键词检测,或对用户上一次输入的语音数据进行语音识别得到的文本信息进行关键词检测,根据检测得到的关键词和目标客户确定要显示的对话信息。
具体地,对话信息并不是一成不变的,为了提高情景对练的真实性,检测到不同的关键词时,对话信息也会不同,以模拟真实的对话场景。例如在催款通知情景中,检测到的关键词为“逾期”和“还款时间”时,下一次显示的对话信息不同,示例性地,检测到关键词为“逾期”时,对话信息可以为阐述逾期原因,检测到关键词为“还款时间”时,对话信息为阐述是否能在还款时间前进行还款,以避免出现显示的对话信息和用户上一次输入的语音数据无关的现象。
进一步地,还可以对用户上一次输入的语音数据进行情绪检测,和/或超时检测,根据检测得到的关键词、情绪、是否超时回复和目标客户确定要显示的对话信息。示例性地,当目标客户和关键词均相同时,当用户超时回复或语气不好(例如检测到情绪为愤怒或阴阳怪气等)时,显示的对话信息与用户及时回复或语气好(例如检测到情绪为温柔或态度良好)时不同。
示例性地,用户超时回复或语气不好时显示的对话信息难以回复,例如在“催款通知”情景中,显示的对话信息为“你态度太差了,我很忙,没时间跟你继续沟通!”,而在用户及时回复或语气好时显示的对话信息的回复难度低,例如在“催款通知”情景中,显示的对话信息为“好的,我一定会在规定时间还款的”。
在一些实施方式中,可以通过情绪识别模型对用户上一次输入的语音数据进行情绪检测。
在一些实施方式中,可以设置一个预设时间阈值,当显示对话信息后,若用户没有在预设时间阈值内进行回复,例如没有在预设时间阈值内完成语音数据的输入或触发输入控件,则确定用户回复超时,输入控件例如为图3中的输入控件230,具体将在说明书下述部分介绍,在此不再赘述。进一步地,还可以根据用户超时的程度调整显示的对话信息,例如超时的时间越长,客户的态度越恶劣。
步骤120:若接收到用户根据对话信息输入的语音数据,则显示与语音数据对应的语音控件。
在一些实施方式中,用户可以通过麦克风等设备输入语音数据。
在一些实施方式中,因为用户可能会输入多个语音数据,为了提高语音数据的识别准确度,不对语音数据误识别,在用户的电子设备界面中具有一个或多个输入控件,当用户触发该输入控件时,代表用户正在根据对话信息输入语音数据。
请再参阅图3,图3是本申请实施例提供的语音控件与输入控件的示意图。如图3所示,对话界面200中包括对话信息210、语音控件220以及输入控件230。
可以理解的是,图3中输入控件230的位置只是示例性地,本申请对输入控件230的位置不作限制。
在一些实施方式中,语音控件220的位置位于对话信息210的下方。本申请对语音控件220与对话信息210的位置关系不作限制。
在一些实施方式中,用户触发语音控件220可以播放其输入的语音数据。
在一些实施方式中,语音控件220的样式提前预设好,显示语音控件220时用于反映用户正在输入语音数据。
在一些实施方式中,用户触发输入控件230后,代表用户正在根据对话信息210输入语音数据,此时显示语音控件220。
步骤130:根据语音控件的位置信息确定文本显示位置。
在一些实施方式中,可以根据语音控件的位置信息确定显示焦点的位置信息,根据显示焦点的位置信息确定文本显示位置。可选地,显示焦点的位置与语音控件的位置具有第一对应关系,在确定语音控件的位置信息,可以根据第一对应关系确定显示焦点的位置信息。
在一些实施方式中,在确定显示焦点的位置信息后,可以直接将显示焦点的位置作为文本显示位置。
在一些实施方式中,请再参阅图4,图4是本申请实施例提供的显示焦点的示意图。如图4所示,图4包括对话信息210、语音控件220、输入控件230以及显示焦点240,其中对话信息210、语音控件220、输入控件230已在说明书其余部分进行介绍,在此不再赘述。
在一些实施方式中,显示焦点240具有预设的样式,例如图4中的样式,以向用户提示语音数据转化为文本信息后会显示于何处。
步骤140:将语音数据转化为文本信息,并在文本显示位置显示文本信息。
在一些实施方式中,文本显示位置的最终显示效果会根据文本信息的信息量而变化,例如文本包含的字数较多时,文本显示位置的面积较大;文本包含的字数较少时,文本显示位置的面积较小。
在一些实施方式中,可以根据预设的训练好的语音识别模型对语音数据进行识别,以得到文本信息。
在一些实施方式中,在步骤140之后,本申请实施例提供的文本信息显示方法还包括:
(1)对语音数据进行分析,得到语音分析结果。
(2)根据语音分析结果确定用户的作答评分;其中,作答评分用于反映用户的作答是否符合要求。
在一些实施方式中,可以根据训练好的语音分析模型对语音数据进行分析,得到语音分析结果。
在一些实施方式,语音分析包括语速检测、音量检测、情绪识别、是否超时回复中的一种或多种。
示例性地,语速检测对应的语音分析结果可以为语速过低、语速正常、语速过高;或为语速的具体值,单位可以为字/分钟。
进一步地,可以为用户预设一个基准分,在语速过低或语速过高时在基准分的基础上进行扣分,以得到用户的作答评分;也可以在用户的具体语速处于预设语速范围外时,在基准分的基础上根据用户的具体语速进行扣分,例如用户的具体语速与预设语速范围相差越远扣分越多。
示例性地,音量检测对应的语音分析结果可以为音量过低、音量正常、音量过高;或为音量的具体值,单位可以为分贝。
进一步地,可以为用户预设一个基准分,在音量过低或音量过高时在基准分的基础上进行扣分,以得到用户的作答评分;也可以在用户的具体音量处于预设音量范围外时,在基准分的基础上根据用户的具体音量进行扣分,例如用户的具体音量与预设音量范围相差越远扣分越多。
示例性地,情绪识别对应的语音分析结果可以为情绪异常、情绪正常;或为具体的情绪,例如识别情绪具体为愤怒、温柔、不耐烦等。
进一步地,可以为用户预设一个基准分,在用户情绪异常时在基准分的基础上进行扣分,以得到用户的作答评分;也可以根据每个具体的情绪进行扣分,例如温柔时不扣分,愤怒和不耐烦时根据不同的负面情绪进行不同程度的扣分,即正面情绪不扣分,不同的负面情绪进行不同程度的扣分。
示例性地,是否超时回复对应的语音分析结果可以为已超时回复、未超时回复;或为具体的超时时间,单位可以为秒。
进一步地,可以为用户预设一个基准分,在用户超时回复时在基准分的基础上进行扣分,未超时回复不进行扣分,以得到用户的作答评分;也可以根据用户具体的超时回复的时间进行扣分,超时回复的时间越久,扣分越多。
在一些实施方式中,本申请实施例提供的文本信息显示方法还包括:
(1)对文本信息进行分析,得到文本分析结果。
(2)根据语音分析结果和文本分析结果确定用户的作答评分。
在一些实施方式中,可以根据训练好的文本信息分析模型对文本信息进行分析,得到文本分析结果。
在一些实施方式,文本信息分析包括关键词检测、敏感词检测、话术准确度中的一种或多种。
示例性地,关键词检测对应的文本分析结果可以为包含关键词或不包含关键词。
进一步地,可以为用户预设一个基准分,在文本信息不包含关键词时在基准分的基础上进行扣分,并叠加语音分析结果的扣分,以得到用户的作答评分。
示例性地,敏感词检测对应的文本分析结果可以为包含敏感词或不包含敏感词;或可以为具体的敏感词。
进一步地,可以为用户预设一个基准分,在文本信息包含敏感词时在基准分的基础上进行扣分,并叠加语音分析结果的扣分,以得到用户的作答评分;或根据每一个敏感词对应的扣分值在基准分的基础上进行扣分,并叠加语音分析结果的扣分,以得到用户的作答评分,其中,每个敏感词对应的扣分值可以不同。
在一些实施方式中,在敏感词检测后,可以在文本信息处高亮标记敏感词,以告知用户是因为什么敏感词而扣分。进一步地,还可以根据不同敏感词的扣分值,为不同扣分值的敏感词以不同的方式高亮标记,例如扣分值最高的以红色高亮标记,扣分值次高的以黄色高亮标记,可以理解的是,还可以以加粗或倾斜等方式高亮标记敏感词,本申请对高亮标记敏感词的具体方式不作限制。
示例性地,话术准确度对应的文本分析结果可以为文本信息与参考文本的相似度,例如可以为文本信息与参考文本的相似百分比,比如文本信息与参考文本的相似度为80%,参考文本将在说明书下述部分进行介绍。
进一步地,可以为用户预设一个基准分,在文本信息与参考文本的相似百分比到达预设百分比时不进行扣分,在文本信息与参考文本的相似百分比未到达预设百分比时进行扣分,并且相似百分比与预设百分比的差值越大,扣分越多,并叠加语音分析结果的扣分,以得到用户的作答评分。
通过上述方式,可以得到用户的作答评分,以使用户的培训效果可视化,并根据具体的语音分析和文本分析结果得到作答评分,可以使用户再次进行情景训练时针对性的对扣分项目进行优化,提高情景训练的训练效果。
在一些实施方式中,请再参阅图5,图5是本申请实施例提供的一种文本信息显示方法的另一流程示意图。如图5所示,该文本信息显示方法100包括:步骤110至步骤180。
步骤110:显示对话信息。
具体地,步骤110已在说明书其余部分进行介绍,在此不再赘述。
步骤120:若接收到用户根据对话信息输入的语音数据,则显示与语音数据对应的语音控件。
具体地,步骤120已在说明书其余部分进行介绍,在此不再赘述。
步骤130:根据语音控件的位置信息确定文本显示位置。
具体地,步骤130已在说明书其余部分进行介绍,在此不再赘述。
步骤140:将语音数据转化为文本信息,并在文本显示位置显示文本信息。
具体地,步骤140已在说明书其余部分进行介绍,在此不再赘述。
步骤150:在接收到用户根据对话信息输入的语音数据时,显示辅助控件。
在一些实施方式中,请再参阅图6,图6是本申请实施例提供的辅助控件的示意图。如图6所示,图6包括对话信息210、语音控件220、输入控件230、显示焦点240以及辅助控件250,其中对话信息210、语音控件220、输入控件230、显示焦点240已在说明书其余部分进行介绍,在此不再赘述。
在一些实施方式中,辅助控件的样式可以根据需要自行设置。
在一些实施方式中,辅助控件的位置根据显示焦点240和对话信息210决定,例如辅助控件的位置位于显示焦点240和对话信息210之间,且辅助控件不与显示焦点240和对话信息210发生重叠等。
步骤160:根据辅助控件的位置信息确定参考文本显示位置。
在一些实施方式中,在确定辅助控件的位置信息后,可以直接将辅助控件的位置作为参考文本显示位置。
步骤170:根据对话信息确定参考文本。
在一些实施方式中,不同的对话信息对应不同的参考文本。
在一些实施方式中,可以预先设置好对话信息与参考文本的第二对应关系,在显示对话信息后,根据第二对应关系确定对话信息对应的参考文本。
进一步地,参考文本中还可以包含关键词,当用户输入的语音数据或根据语音数据得到的文本信息中包含参考文本中的关键词时,用户输入语音数据后才会显示下一次的对话信息,以此防止用户乱答题或无效答题。
在一些实施方式中,还可以为不同的关键词设置不同的等级,并以不同的样式显示不同等级的关键词,例如以不同的颜色,不同的字体、或以加粗、倾斜等方式区别不同等级的关键词。
在一些实施方式中,可以将与业务有关的关键词设置为最高等级,将与礼貌有关的关键词设置为次高等级。
步骤180:在参考文本显示位置显示参考文本。
在一些实施方式中,参考文本显示位置的最终显示效果会根据参考文本信息的信息量而变化,例如参考文本包含的字数较多时,参考文本显示位置的面积较大;参考文本包含的字数较少时,参考文本显示位置的面积较小。
通过上述方式,可以在参考文本显示位置显示参考文本,以在用户进行培训时,提供可视化的参考文本,帮助用户快速掌握标准对话话术,提高情景对练的训练效果。
在一些实施方式中,本申请实施例提供的文本信息显示方法还包括:
(1)在接收到用户根据对话信息输入的语音数据时,对语音数据进行声纹识别,以获取语音数据对应的第一声纹特征。
(2)获取用户对应的第二声纹特征。
(3)根据第一声纹特征与第二声纹特征对用户进行身份验证,并保存身份验证结果。
在一些实施方式中,根据训练好的声纹识别模型对语音数据进行声纹识别,以得到语音数据对应的第一声纹特征。
在一些实施方式中,用户在注册账号时也需要进行语音输入,根据用户注册时输入的语音进行声纹识别,可以得到第二声纹特征;其中,第二声纹特征可以保存于服务器或数据库中,以在用户输入语音数据后于服务器或数据库中获取第二声纹特征。
在一些实施方式中,若第一声纹特征与第二声纹特征匹配,例如第一声纹特征与第二声纹特征的相似度大于预设相似度,比如第一声纹特征与第二声纹特征的相似度大于80%,则代表用户是本人在进行作答,身份验证成功;若第一声纹特征与第二声纹特征不匹配,则代表有人在顶替用户进行作答,即用户非本人在进行作答,身份验证失败。
在一些实施方式中,在保存身份验证结果后,管理员可以在后台查看身份验证结果,以对身份验证失败的用户进行询问或处罚。
通过以上方式,可以防止其余人顶替用户进行情景练习,提高作弊难度。
本申请提供一种文本信息显示方法,该方法包括:显示对话信息;若接收到用户根据对话信息输入的语音数据,则显示与语音数据对应的语音控件;根据语音控件的位置信息确定文本显示位置;将语音数据转化为文本信息,并在文本显示位置显示文本信息。通过自动将语音数据转化为文本信息,并在文本显示位置显示文本信息,可以模拟真实的沟通情景,提高情景练习的真实性,以提高培训效果。
请再参阅图7,图7是本申请实施例提供的一种文本信息显示装置的结构示意图。如图7所示,该文本信息显示装置300包括:第一显示模块310、第二显示模块320、确定模块330、转化模块340。
第一显示模块310,用于显示对话信息;
第二显示模块320,用于若接收到用户根据对话信息输入的语音数据,则显示与语音数据对应的语音控件;
确定模块330,用于根据语音控件的位置信息确定文本显示位置;
转化模块340,用于将语音数据转化为文本信息,并在文本显示位置显示文本信息。
需要说明的是,对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。对于方法实施例中的所描述的任意的处理方式,在装置实施例中均可以通过相应的处理模块实现,装置实施例中不再一一赘述。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
请在参阅图8,图8是本申请实施例提供的一种电子设备的结构示意图。如图8所示,该电子设备400包括:一个或多个处理器410以及存储器420,图8中以一个处理器410为例。
处理器410和存储器420可以通过总线或者其他方式连接,图8中以通过总线连接为例。
处理器410,用于显示对话信息;若接收到用户根据对话信息输入的语音数据,则显示与语音数据对应的语音控件;根据语音控件的位置信息确定文本显示位置;将语音数据转化为文本信息,并在文本显示位置显示文本信息。
存储器420作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的文本信息显示方法的程序指令/模块。处理器410通过运行存储在存储器420中的非易失性软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例的文本信息显示方法。
存储器420可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器420可选包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至控制器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器420中,当被一个或者多个处理器410执行时,执行上述任意方法实施例中的文本信息显示方法,例如,执行以上描述的图1中的方法步骤110至步骤140。
请参考图9,图9是本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读存储介质500中存储有程序代码510,程序代码510可被处理器调用执行上述方法实施例中所描述的文本信息显示方法。
计算机可读存储介质500可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质500具有执行上述文本信息显示方法中的任何方法步骤的程序代码的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码可以例如以适当形式进行压缩。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上的本发明的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。通过以上的实施例的描述,本领域普通技术人员可以清楚地了解到各实施例可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

Claims (10)

1.一种文本信息显示方法,其特征在于,所述方法包括:
显示对话信息;
若接收到用户根据所述对话信息输入的语音数据,则显示与所述语音数据对应的语音控件;
根据所述语音控件的位置信息确定文本显示位置;
将所述语音数据转化为文本信息,并在所述文本显示位置显示所述文本信息。
2.根据权利要求1所述的方法,其特征在于,在所述显示对话信息之前,所述方法还包括:
获取情景信息和客户类别信息;
根据所述情景信息和所述客户类别信息确定目标客户;
根据所述目标客户确定对话信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述情景信息和所述客户类别信息确定目标客户,包括:
根据所述情景信息确定客户属性;
根据所述客户类别信息确定客户类别;
根据所述客户属性和所述客户类别确定所述目标客户。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到所述用户根据所述对话信息输入的语音数据时,显示辅助控件;
根据所述辅助控件的位置信息确定参考文本显示位置;
根据所述对话信息确定参考文本;
在所述参考文本显示位置显示所述参考文本。
5.根据权利要求1所述的方法,其特征在于,在所述文本显示位置显示所述文本信息之后,所述方法还包括:
对所述语音数据进行分析,得到语音分析结果;
根据所述语音分析结果确定所述用户的作答评分;其中,所述作答评分用于反映所述用户的作答是否符合要求。
6.根据权利要求5所述的方法,其特征在于,所述根据所述语音分析结果确定所述用户的作答评分,包括:
对所述文本信息进行分析,得到文本分析结果;
根据所述语音分析结果和所述文本分析结果确定所述用户的作答评分。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到用户根据所述对话信息输入的语音数据时,对所述语音数据进行声纹识别,以获取所述语音数据对应的第一声纹特征;
获取所述用户对应的第二声纹特征;
根据所述第一声纹特征与所述第二声纹特征对所述用户进行身份验证,并保存身份验证结果。
8.一种文本信息显示装置,其特征在于,所述装置包括:
第一显示模块,用于显示对话信息;
第二显示模块,用于若接收到用户根据所述对话信息输入的语音数据,则显示与所述语音数据对应的语音控件;
确定模块,用于根据所述语音控件的位置信息确定文本显示位置;
转化模块,用于将所述语音数据转化为文本信息,并在所述文本显示位置显示所述文本信息。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7任一项所述的文本信息显示方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使电子设备能够执行权利要求1-7任一项所述的文本信息显示方法。
CN202211602551.6A 2022-12-09 2022-12-09 文本信息显示方法、装置、电子设备及存储介质 Pending CN116189682A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211602551.6A CN116189682A (zh) 2022-12-09 2022-12-09 文本信息显示方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211602551.6A CN116189682A (zh) 2022-12-09 2022-12-09 文本信息显示方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116189682A true CN116189682A (zh) 2023-05-30

Family

ID=86445148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211602551.6A Pending CN116189682A (zh) 2022-12-09 2022-12-09 文本信息显示方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116189682A (zh)

Similar Documents

Publication Publication Date Title
US11706165B2 (en) Personalized chatbots for inmates
CN107818798B (zh) 客服服务质量评价方法、装置、设备及存储介质
US10438586B2 (en) Voice dialog device and voice dialog method
CN109960723B (zh) 一种用于心理机器人的交互系统及方法
CN109462603A (zh) 基于盲检测的声纹认证方法、设备、存储介质及装置
CN109448737B (zh) 虚拟形象的创建方法、装置、电子设备与存储介质
CN109410675B (zh) 一种基于学生画像的练习题推荐方法及家教设备
CN110610705A (zh) 一种基于人工智能的语音交互提示器
CN111276148A (zh) 基于卷积神经网络的回访方法、系统及存储介质
CN109739354A (zh) 一种基于声音的多媒体交互方法及装置
CN109582780B (zh) 一种基于用户情绪的智能问答方法及装置
CN112287091A (zh) 智能问答方法及相关产品
CN114971658B (zh) 一种反诈宣传方法、系统、电子设备以及存储介质
CN110516426A (zh) 身份认证方法、认证终端、装置及可读存储介质
CN116189682A (zh) 文本信息显示方法、装置、电子设备及存储介质
CN112185187A (zh) 一种社交语言的学习方法及智能装置
CN115602160A (zh) 基于语音识别的业务办理方法、装置及电子设备
CN114157763A (zh) 交互过程中的信息处理方法、装置、终端及存储介质
CN110765242A (zh) 一种客服信息的提供方法,装置及系统
CN112367494A (zh) 基于ai的在线会议通讯方法、装置及计算机设备
CN112905748A (zh) 一种演讲效果评估系统
CN116092481A (zh) 基于语音数据的评分方法、装置、电子设备及存储介质
KR101817342B1 (ko) 사진 이모티콘 생성 및 판매 방법
KR20210117827A (ko) 인공지능을 활용한 음성 서비스 제공 시스템 및 제공 방법
US20230208966A1 (en) Determination method, information processing apparatus, and computer-readable recording medium storing determination program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230710

Address after: 518000 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong

Applicant after: VOICEAI TECHNOLOGIES Co.,Ltd.

Applicant after: Shenzhen Digital Miracle Technology Co.,Ltd.

Address before: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant before: VOICEAI TECHNOLOGIES Co.,Ltd.

Applicant before: Shanghai Shengyang Yunhan Information Technology Co.,Ltd.