CN111061845A - 管理聊天室的聊天主题的方法、设备和计算机存储介质 - Google Patents
管理聊天室的聊天主题的方法、设备和计算机存储介质 Download PDFInfo
- Publication number
- CN111061845A CN111061845A CN201811204452.6A CN201811204452A CN111061845A CN 111061845 A CN111061845 A CN 111061845A CN 201811204452 A CN201811204452 A CN 201811204452A CN 111061845 A CN111061845 A CN 111061845A
- Authority
- CN
- China
- Prior art keywords
- chat
- keyword
- library
- topic
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本公开的实施例涉及用于管理聊天室的聊天主题的方法、设备和计算机存储介质。在一个实施例中,提供了一种用于管理聊天室的聊天主题的方法。该方法包括:获取聊天主题的特征库,特征库包括与聊天主题相关联的至少一个特征;在聊天室的运行过程中,获取来自聊天室的至少一个用户的聊天记录;根据与特征库相关联的生成规则,基于聊天记录生成特征集合;以及基于特征集合与特征库的比较,确定聊天记录与聊天主题的匹配程度。在其他实施例中,提供了用于管理聊天室的聊天主题的设备和计算机存储介质。
Description
技术领域
本公开的实施例涉及互联网数据处理的领域,并且更具体地,涉及用于管理网络聊天室的聊天主题的方法、设备和计算机存储介质。
背景技术
随着即时网络通信技术和智能移动设备的持续迅猛发展,出现了拥有网络直播功能的众多PC(个人计算机)端和移动设备端的应用。由于网络直播和在线聊天等能够极大地促进用户之间的沟通和互动,因此已经在娱乐休闲、远程教学、商务推广等方面得到了广泛使用。为了方便系统管理员对各个直播主题聊天室的聊天内容进行管理,需要对聊天内容与聊天主题的相关性进行分析与评价。然而,通常需要大量的后台管理员或审核员对直播数据进行人工监测,以便确定聊天内容是否符合主题并进行后续处理流程。这导致直播中的监测在拥有众多直播数据的应用平台上难以高效地进行。
发明内容
本公开的实施例提供一种用于自动且准确地管理聊天室的聊天主题的方案。
根据本公开的第一方面,提供了一种用于管理聊天室的聊天主题的方法。该方法包括:获取该聊天主题的特征库,该特征库包括与该聊天主题相关联的至少一个特征;在该聊天室的运行过程中,获取来自该聊天室的至少一个用户的聊天记录;根据与该特征库相关联的生成规则,基于该聊天记录生成特征集合;以及基于该特征集合与该特征库的比较,确定该聊天记录与该聊天主题的匹配程度。
根据本公开的第二方面,提出了一种用于管理聊天室的聊天主题的设备。该设备包括:至少一个处理单元;至少一个存储器,该至少一个存储器被耦合到该至少一个处理单元并且存储用于由该至少一个处理单元执行的指令,该指令当由该至少一个处理单元执行时,使得该设备执行动作。该动作包括:获取该聊天主题的特征库,该特征库包括与该聊天主题相关联的至少一个特征;在该聊天室的运行过程中,获取来自该聊天室的至少一个用户的聊天记录;根据与该特征库相关联的生成规则,基于该聊天记录生成特征集合;基于该特征集合与该特征库的比较,确定该聊天记录与该聊天主题的匹配程度。
根据本公开的第三方面,提供了一种计算机存储介质。该计算机存储介质具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行根据第一方面的方法。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1图示了能够在其中实施本公开的多个实现的计算环境的框图;
图2图示了根据本公开实施例的用于管理聊天室的聊天主题的方法的流程图;
图3图示了根据本公开的实施例的基于聊天主题生成关键词文本库的方法的流程图;
图4图示了根据本公开的实施例的基于关键词文本库获取聊天主题的语音波形库的方法的流程图;以及
图5图示了可以用来实施本公开内容的实施例的示例设备的示意性框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
如以上讨论的,在常规技术中往往需要大量的后台管理员对诸如聊天室等网络直播平台的网络应用中生成的聊天数据进行人工审核,这经常是低效的,并且可能由于错误的人工判断结果而导致较差的直播体验。随着机器学习、模式学习等人工智能相关技术和云计算相关技术的不断进步,期望以自动的方式识别直播聊天数据与所设定聊天主题的匹配程度。
根据本公开的实施例,提供了一种管理聊天室的聊天主题的方案。在该方案中,首先,获取聊天主题的特征库,特征库包括与聊天主题相关联的至少一个特征。随后,在聊天室的运行过程中,获取来自聊天室的至少一个用户的聊天记录。然后,根据与特征库相关联的生成规则,基于聊天记录生成特征集合。最后,基于特征集合与特征库的比较,确定聊天记录与聊天主题的匹配程度。采用本公开的方案,能够监控网络语音聊天室中的用户聊天记录与该语音聊天室中被预先确定的聊天主题的符合程度,从而确保在该语音聊天室中用户讨论相同的话题而不会跑题。
以下参考附图来说明本公开的基本原理和若干示例实现。
图1示出了能够在其中实施本公开的多个实现的计算环境100的框图。应当理解,图1所示出的计算环境100仅仅是示例性的,而不应当构成对本公开所描述的实现的功能和范围的任何限制。如图1所示,计算环境100包括计算设备130以及服务器140。在一些实施例中,计算设备130与服务器140之间可以经由网络互相通信。
在一些实施例中,计算设备130诸如是任何类型的移动终端、固定终端或便携式终端,包括移动手机、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信系统(PCS)设备、个人导航设备、个人数字助理(PDA)、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合,包括这些设备的配件和外设或者其任意组合。还可预见到的是,计算设备130能够支持任何类型的针对用户的接口(诸如“可佩戴”电路等)。
在一些实施例中,用户120可以对计算设备130进行操作,而用户120的语音数据将经由网络被存储在服务器140上。
计算设备130可以用于显示聊天室的环境。为了显示具有特定聊天室主题的聊天室,计算设备130可以根据用户所选择的聊天室而从服务器140获取聊天室的具体环境与相关设定。
用户可以根据所进入的聊天室中的主题而与其他用户进行交流,该交流是通过语音、视频或文字的方式进行的。每个聊天室可以具有匹配程度,该匹配程度表示聊天室的用户的沟通与该聊天室的主题之间的匹配程度。
在一些实施例中,该匹配程度可以采用总分M(例如以整数、实数等)方式表示。将用户的语音、视频、文字等形式的聊天记录与服务器140中所存储的与主题相关的语音波形、文本拼音等进行比较110。如图1所示,在语音波形的情况下,假设聊天主题112为曲线形式,则此时当聊天记录同样呈现为曲线形式时,则确定聊天记录匹配于聊天主题(如图1中的对号所示)时,增加总分M;当聊天记录呈现为折线形式时,则确定聊天记录不匹配于聊天主题(如图1中的错误符号所示)时,减小总分M。
在一些实施例中,总分M具有上限A,当达到该上限A时,总分M不会因为比较110的结果的匹配而进一步增加。这样可以避免短时间的关键词命中较多,造成后期即使直播长时间不符合主题,M也不能降低至表示聊天记录与聊天主题不匹配的范围。
在一些实施例中,总分M随直播时间T进行非线性扣减。具体而言,总分M随着直播时间T以高次曲线(例如二次曲线、三次曲线或更高次曲线)、指数曲线的方式进行扣减。在一些实施例中,当总分M每次达到上限A时,将直播时间T清零,并且重新开始计数,这样可以尽快发现M显示不符合主题的情况,并且保证在M符合主题时聊天过程不被错误干扰。当符合主题的总分M被扣减到设定的下限时,认定此时的聊天内容疑似不符合主题,并进行后续处理流程。例如,可以提醒聊天室的管理员进行人工干预等。
在一些实施例中,例如可以以整数来表示总分M。在初始时可以将总分M设置为例如80,随着聊天过程的进行,可以周期性地比较在预定时间间隔内的聊天记录与聊天主题的匹配程度。例如,可以以20秒或者其他时间间隔为单位来进行比较。当确定一个时间间隔内的聊天记录匹配于聊天主题,则可以将总分M增加预定步长,例如1或其他数值。当确定一个时间间隔内的聊天记录不匹配于聊天主题,则可以将总分M减小预定步长,例如1或其他数值。在一些实施例中,可以将总分的上限A设置为100,当总分M被增加至100时则不再增加。当总分M被减小至下限(例如50)时,则可以提示聊天记录不匹配于聊天主题。
图2图示了根据本公开实施例的本公开实施例的用于管理聊天室的聊天主题的方法200的流程图。方法200可以由图1中的服务器140来实施,以下将结合图1所示的计算环境100并且以“流行音乐”的主题为例,来描述方法200所涉及的动作。本领域技术人员应该理解,本申请不限于流行音乐的主题,而是也可以使用其他的主题,例如在线教育、科学、舞蹈、游戏、户外、美食、文学、文玩鉴赏等。
在框202,获取聊天主题的特征库,特征库包括与聊天主题相关联的至少一个特征。在不同的实施例中,特征可以涉及不同的内容。例如,特征可以涉及聊天主题的文本方面和/或语音方面。在下文中,将首先介绍有关文本的更多细节。在一些实施例中,获取聊天主题的特征库包括:基于聊天主题生成关键词文本库;以及基于关键词文本库获取聊天主题的特征库。在下文中,将分别参见图3和图4进行描述。
下面结合图3来详细说明如何基于聊天主题生成关键词文本库。
图3图示了根据本公开的实施例的基于聊天主题生成关键词文本库的方法300的流程图。通过图3中的以下步骤可以获得尽可能完整的关键词文本库。
在框302,确定与聊天主题相关联的至少一个基础关键词。在一些实施例中,至少一个基础关键词包括平台关键词和用户关键词中的至少任一项,其中平台关键词是由平台运营人员、客服人员关于聊天主题来确定的,以及用户关键词是基于至少一个用户的输入来确定的。通过平台以及用户所确定或输入的关键词来确定基础关键词可以为后续检索和扩展奠定坚实的关键词基础。例如在主题为“流行音乐”的聊天室中,平台关键词为“流行音乐”,而用户所输入的用户关键词可以是最近流行排行榜中歌曲的名称,因此基础关键词为“流行音乐”和多个歌曲名称。
在框304,扩展至少一个基础关键词中的基础关键词,以获得至少一个扩展关键词。在一些实施例中,针对至少一个基础关键词中的给定基础关键词,根据给定基础关键词的别称、简称、俗语、别字、缩写、功能、属性来获得扩展关键词。根据语言学相关特征来对基础关键词进行扩展,以此方式可以极大地丰富关键词,进而避免因为语言习惯、地域等差异而造成在确定匹配程度时产生的潜在错误。例如在主题为“流行音乐”的聊天室中,平台关键词流行音乐可以被扩展为流行歌曲、热门单曲等。
在框306,检索与主题有关的至少一个附加基础关键词。在一些实施例中,检索与主题有关的至少一个附加基础关键词包括在以下中的至少任一项来进行检索:互联网、预定义词库以及知识图谱,从而能够除了通过平台和用户所给定的以及扩展的关键词而进一步获得其他相关的关键词。例如在主题为“流行音乐”的聊天室中,根据检索基础关键词而获得的附加基础关键词可以包括华语流行音乐、欧美流行音乐等。
在框308,扩展附加基础关键词,以获得附加扩展关键词。例如在主题为“流行音乐”的聊天室中,附加基础关键词中的华语流行音乐可以被扩展为包括C-pop、民歌,而欧美流行音乐可以被扩展为包括R&B、HOUSE、Britpop、Trip-Hop、Gangsta、Rap、Synth Pop、ORCHESTRA、CHAMBER POP、BOSSA NOVA、CLASSICAL等
在框310,根据扩展关键词和附加扩展关键词形成关键词文本库。例如在主题为“流行音乐”的聊天室中,将流行音乐、流行歌曲、热门单曲、华语流行音乐、欧美流行音乐、C-pop、民歌、R&B、HOUSE、Britpop、Trip-Hop、Gangsta、Rap、Synth Pop、ORCHESTRA、CHAMBERPOP、BOSSA NOVA、CLASSICAL等这些关键词形成关键词文本库。
在一些实施例中,在关键词文本库中的关键词根据与主题的关联度可以具有不同的权重。例如在主题为“流行音乐”的聊天室中,将流行音乐的权重设置为1,而例如将BOSSANOVA的权重设置为0.3。
下面结合图4来详细说明如何基于关键词文本库获取聊天主题的特征库。图4图示了根据本公开的实施例的基于关键词文本库获取聊天主题的语音波形库的方法400的流程图。基于方法400,可以通过尽可能完整的关键词文本库获得尽可能完整的特征库。
在框402,将关键词文本库中的关键词转换为基本语音波形。例如在主题为“流行音乐”的聊天室中,使用语音合成技术将“热门单曲”转换成声音波形并且以MP3或者其他格式存储。
在框404,扩展基本语音波形,以获得语音波形。在一些实施例中,扩展语音波形以获得语音波形库包括:通过大数据灌入及人工智能(AI)机器人训练,根据以下中的至少任一项来获得语音波形库:口音、语音语调、性别、以及方言,从而可以通过地域和人群的语言特征而获得更加丰富的语音波形。例如在主题为“流行音乐”的聊天室中,将热门单曲根据排列组合A*B*C进行扩展,其中A代表方言A1普通话、A1广东话、A3潮汕话等,B代表语音语调例如B1兴奋、B2失落、B4疑问、B4笃定等,C代表性别例如C1男性、C2女性。在一种排列组合例如A1*B2*C1中,热门单曲被扩展为一个失落的男性使用普通话所讲出的热门单曲的语音波形。
在该实施例中,A具有三种类型,B具有四种类型,C具有两种类型,因此可以扩展3*4*2=24种语音波形。在一些实施例中,还可以考虑年龄的因素,例如儿童、青年、中年、老年。在一些实施例中,还可以考虑健康状况,例如健康、病态。
在框406,基于语音波形获取语音波形库。例如在主题为“流行音乐”的聊天室中,将根据排列组合A*B*C所扩展的所有MP3语音波形形成MP3语音波形库,并且存储在数据库中。
上述方法300与400中的步骤可以重复进行,以便形成不断扩充的关键词语音波形库和关键词文本库。例如在主题为“流行音乐”的聊天室中,由于流行音乐在日常生活中每时每刻都在产生新的词汇、新的曲目和元素,因此重复检索、扩展和更新关键词和语音波形可以尽可能准确地将与当前最流行的音乐、歌曲相关的关键词和语音波形进行存储,以备后续进行比较和匹配程度判断。
通过将关键词文本库转换为特征库,可以获得聊天主题的特征库,以便方便与实际用户的语音波形的比较。将会理解,在本公开的上下文中,聊天室可以支持语音聊天和文字聊天中的任一项。对于文本形式的聊天记录,可以直接将基于聊天记录生成的特征集合与特征库进行比较。对于语音形式的聊天记录,则可以基于语音识别技术来获得聊天记录的文本相关的特征,继而进行比较。
返回图2,在框204,在聊天室的运行过程中,获取来自聊天室的至少一个用户的聊天记录。聊天记录可以是用户的聊天语音、聊天视频或聊天文本等。例如在主题为“流行音乐”的聊天室中,获取客户端用户的语音聊天记录、文字聊天记录以及在打开视频的情况下也获取聊天视频。
在框206,根据与特征库相关联的生成规则,基于聊天记录生成特征集合。例如在主题为“流行音乐”的聊天室中,通过客户端用户的语音聊天记录、文字聊天记录以及聊天视频记录可以生成特征集合。
在框208,基于特征集合与特征库的比较,确定聊天记录与聊天主题的匹配程度。在一些实施例中,确定聊天记录与聊天主题的匹配程度包括:响应于特征集合匹配于特征库,提高匹配程度;以及响应于特征集合不匹配于特征库,降低匹配程度,从而可以根据特征集合与特征库的是否匹配来相应对匹配程度进行调整,从而可以实时地准确确定当前的匹配程度。例如在主题为“流行音乐”的聊天室中,当聊天记录与所存储的主题特征库中的存储特征匹配时,提高对匹配程度的评价,而当聊天记录与所存储的主题特征库中的存储特征不匹配时,降低对匹配程度的评价。
在一些实施例中,至少一个特征包括与聊天主题相关联的语音波形,聊天记录是来自至少一个用户的语音;以及基于聊天记录生成特征集合包括:提取语音波形;以及基于语音波形生成特征集合,从而可以通过用户的语音波形与数据库中存储的相关语音波形的比较来确定它们的匹配程度。
在一些实施例中,语音的比较可以通过基于采样数据的比较、基于音频内容的比较或半监督的反馈技术来进行。基于采样数据的音频比较技术通常通过直接在比较两段音频的每个采样点来实现。基于音频内容的音频比较技术主要是对音频本身的各种特征进行分析和比较的技术。半监督的反馈技术通过与平台管理人员的交互来改善比较的结果,直到平台管理人员满意。
在下文中,将仅以基于采样数据的比较为示例进行描述。例如在基于采样数据的比较中,匹配程度可以通过采样数据的标准差的形式呈现。例如,在音频数据的n个采样点a1,a2,…,an处分别具有n个幅值A1,A2,…,An,与n个采样点对应的所存储的语音波形包含n个对应点b1,b2,…,bn,分别具有n个幅值B1,B2,…,Bn,因此匹配程度M可以根据采样点与对应点的幅值的标准差来计算:
其中,标准差越大,M越小,表示越不符合主题。在一些实施例中,可以将M进行标准化处理得到M标准,其中M标准的数值范围为-10到10,这样根据M+M标准便可以计算出当前的匹配程度分数。
在一些实施例中,除了使用语音波形之外,还可以通过语音数据的其他特征值与所存储的语音数据的对应特征值的比较来呈现匹配程度。语音数据的其他特征值可以包括在语音识别领域中常用的特征的值,诸如响度、基音周期、基音频率、信噪比、短时能量、短时平均幅度、短时平均过零率、共振峰等。
在一些实施例中,可以采用诸如短时能量分析、短时平均振幅分析、短时过零分析、倒谱分析、短时傅里叶变换等语音特征提取技术来提取语音数据的特征值。在一些实施例中,在提取语音数据的特征值时可以对语音数据进行预处理,诸如采样、量化、分帧、加窗、端点检测等,以例如去除语音数据中存在的固有环境特征的影响。
在一些实施例中,至少一个特征包括与聊天主题相关联的文本的拼音,在此聊天记录是来自至少一个用户的语音。进一步,可以基于语音识别技术提取与语音相关联的文本。基于文本的拼音来生成特征集合,从而可以通过由用户的语音波形所转换成的文本与数据库中存储的相关文本拼音的比较来确定它们的匹配程度。在此实施例中,可以基于带声调的拼音和/或不带声调的拼音来生成特征集合。利用上述示例性实现,可以忽略用户由于口音或者发音不清楚而造成的错误匹配的情况。
在一些实施例中,数据库中存储的文本拼音是以拼音单元为形式的。例如关键词“流行歌曲”的拼音“liu xing ge qu”为一个拼音单元并且包含4个拼音,并且关键词“热曲”的拼音“re qu”为另一个拼音单元并且包含2个拼音,并且数据库中的拼音单元以其中所包含的拼音数量进行分组。
由于从用户语音转换为的拼音包含大量的内容,因此快速从用户语音中提取匹配的拼音非常重要。在一些实施例中,将用户语音进行断句,例如根据一段语音中的停顿的时长进行断句。在一个用户的语音句段中,首先计算拼音的数量,例如“我喜欢的华语流行歌曲有很多”,该句段中的拼音数量为13,从这13个拼音中根据每2个、每3个、…、每13个提取语音片段,分别提取了12个、11个、…、1个不同的片段。将这些片段分别与数据库中具有对应数目拼音的拼音单元进行对比。当匹配时停止比较,将所匹配的拼音单元中的拼音数量除以该句段中的总拼音数量而得到匹配程度M。在该示例中,匹配程度M等于“华语流行歌曲”的拼音数量除以该句段的总数量,即6/13。
在一些实施例中,首先比较包含拼音数量多的片段与对应的包含相同拼音数量的拼音单元,这样可以避免因为匹配到拼音数量少的片段而使得匹配程度M太小。即在该示例中,如果先比较4个拼音的拼音单元,则由于“流行歌曲”而得到的匹配程度M为4/13,比实际的匹配程度M=6/13小,不符合实际情况。在一些实施例中,可以将M进行标准化处理得到M标准,其中M标准的数值范围为-10到10,这样根据M+M标准便可以计算出当前的匹配程度分数。
在一些实施例中,至少一个特征包括与聊天主题相关联的视频波形以及其他特征,从而通过获取聊天视频等方式来对符合主题的程度进行管理。将会理解,尽管在上文中描述了如何处理音频方式的聊天记录的具体实现,还可以采用类似的方式来对聊天视频中的语音部分进行处理。
图5图示了可以用来实施本公开内容的实施例的示例设备500的示意性框图。例如,如图1所示的示例环境100中的计算设备130可以由设备500来实施。如图所示,设备500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的计算机程序指令或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序指令,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法200、方法300和/或方法400,可由处理单元501执行。例如,在一些实施例中,方法300和/或方法400可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序被加载到RAM 503并由CPU 501执行时,可以执行上文描述的方法200、方法400和/或方法500的一个或多个动作。
在一些实施例中,提供了一种用于管理聊天室的聊天主题的设备,包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令当由至少一个处理单元执行时,使得设备执行动作。动作包括:获取聊天主题的特征库,特征库包括与聊天主题相关联的至少一个特征;在聊天室的运行过程中,获取来自聊天室的至少一个用户的聊天记录;根据与特征库相关联的生成规则,基于聊天记录生成特征集合;基于特征集合与特征库的比较,确定聊天记录与聊天主题的匹配程度。
在一些实施例中,确定聊天记录与聊天主题的匹配程度包括:响应于特征集合匹配于特征库,提高匹配程度;以及响应于特征集合不匹配于特征库,降低匹配程度。
在一些实施例中,聊天主题的特征库包括关键词文本库与语音波形库,并且获取聊天主题的特征库包括:基于聊天主题生成关键词文本库;以及基于关键词文本库获取聊天主题的语音波形库。
在一些实施例中,基于聊天主题生成关键词文本库包括:确定与聊天主题相关联的至少一个基础关键词;扩展至少一个基础关键词中的基础关键词,以获得至少一个扩展关键词;检索与主题有关的至少一个附加基础关键词;扩展附加基础关键词,以获得附加扩展关键词;根据至少一个扩展关键词和附加扩展关键词形成关键词文本库。
在一些实施例中,基于关键词文本库获取聊天主题的语音波形库包括:将关键词文本库中的关键词转换为基本语音波形;扩展基本语音波形,以获得语音波形;以及基于语音波形获取语音波形库。
在一些实施例中,至少一个基础关键词包括平台关键词和用户关键词中的至少任一项,其中平台关键词是由平台运营人员、客服人员关于聊天主题来确定的,以及用户关键词是基于至少一个用户的输入来确定的。
在一些实施例中,扩展至少一个基础关键词中的基础关键词,以获得至少一个扩展关键词包括:针对至少一个基础关键词中的给定基础关键词,根据给定基础关键词的别称、简称、俗语、别字、缩写、功能、属性来获得至少一个扩展关键词。
在一些实施例中,检索与主题有关的至少一个附加基础关键词包括在以下中的至少任一项来进行检索:互联网、预定义词库以及知识图谱。
在一些实施例中,扩展语音波形,以获得语音波形库包括:根据以下中的至少任一项来获得语音波形库:口音、语音语调、性别、以及方言。
在一些实施例中,至少一个特征包括与聊天主题相关联的语音波形,聊天记录是来自至少一个用户的语音;以及基于聊天记录生成特征集合包括:提取语音波形;以及
基于语音波形生成特征集合。
在一些实施例中,至少一个特征包括与聊天主题相关联的文本的拼音,聊天记录是来自至少一个用户的语音;以及基于聊天记录生成特征集合包括:基于语音识别技术提取与语音相关联的文本;以及基于文本的拼音来生成特征集合。
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。
Claims (23)
1.一种用于管理聊天室的聊天主题的方法,包括:
获取所述聊天主题的特征库,所述特征库包括与所述聊天主题相关联的至少一个特征;
在所述聊天室的运行过程中,获取来自所述聊天室的至少一个用户的聊天记录;
根据与所述特征库相关联的生成规则,基于所述聊天记录生成特征集合;
基于所述特征集合与所述特征库的比较,确定所述聊天记录与所述聊天主题的匹配程度。
2.根据权利要求1所述的方法,其中确定所述聊天记录与所述聊天主题的匹配程度包括:
响应于所述特征集合匹配于所述特征库,提高所述匹配程度;以及
响应于所述特征集合不匹配于所述特征库,降低所述匹配程度。
3.根据权利要求1所述的方法,其中所述聊天主题的特征库包括关键词文本库与语音波形库,并且获取所述聊天主题的特征库包括:
基于所述聊天主题生成关键词文本库;以及
基于所述关键词文本库获取所述聊天主题的语音波形库。
4.根据权利要求3所述的方法,其中基于所述聊天主题生成关键词文本库包括:
确定与所述聊天主题相关联的至少一个基础关键词;
扩展所述至少一个基础关键词中的基础关键词,以获得至少一个扩展关键词;
检索与所述主题有关的至少一个附加基础关键词;
扩展所述附加基础关键词,以获得附加扩展关键词;
根据所述至少一个扩展关键词和所述附加扩展关键词形成所述关键词文本库。
5.根据权利要求3所述的方法,其中基于所述关键词文本库获取所述聊天主题的语音波形库包括:
将所述关键词文本库中的关键词转换为基本语音波形;
扩展所述基本语音波形,以获得语音波形;以及
基于所述语音波形获取所述语音波形库。
6.根据权利要求4所述的方法,其中:
所述至少一个基础关键词包括平台关键词和用户关键词中的至少任一项,其中所述平台关键词是由平台运营人员、客服人员关于所述聊天主题来确定的,以及所述用户关键词是基于所述至少一个用户的输入来确定的。
7.根据权利要求4所述的方法,其中扩展所述至少一个基础关键词中的基础关键词,以获得所述至少一个扩展关键词包括:针对所述至少一个基础关键词中的给定基础关键词,
根据所述给定基础关键词的别称、简称、俗语、别字、缩写、功能、属性来获得所述至少一个扩展关键词。
8.根据权利要求4所述的方法,其中检索与所述主题有关的至少一个附加基础关键词包括在以下中的至少任一项来进行检索:
互联网、预定义词库以及知识图谱。
9.根据权利要求5所述的方法,其中扩展所述语音波形,以获得所述语音波形库包括:
根据以下中的至少任一项来获得所述语音波形库:口音、语音语调、性别、以及方言。
10.根据权利要求1所述的方法,其中所述至少一个特征包括与所述聊天主题相关联的语音波形,所述聊天记录是来自所述至少一个用户的语音;以及
基于所述聊天记录生成特征集合包括:
提取所述语音波形;以及
基于所述语音波形生成所述特征集合。
11.根据权利要求1所述的方法,其中所述至少一个特征包括与所述聊天主题相关联的文本的拼音,所述聊天记录是来自所述至少一个用户的语音;以及
基于所述聊天记录生成特征集合包括:
基于语音识别技术提取与所述语音相关联的文本;以及
基于所述文本的拼音来生成所述特征集合。
12.一种用于管理聊天室的聊天主题的设备,包括:
至少一个处理单元;
至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令当由所述至少一个处理单元执行时,使得所述设备执行动作,所述动作包括:
获取所述聊天主题的特征库,所述特征库包括与所述聊天主题相关联的至少一个特征;
在所述聊天室的运行过程中,获取来自所述聊天室的至少一个用户的聊天记录;
根据与所述特征库相关联的生成规则,基于所述聊天记录生成特征集合;
基于所述特征集合与所述特征库的比较,确定所述聊天记录与所述聊天主题的匹配程度。
13.根据权利要求12所述的设备,其中确定所述聊天记录与所述聊天主题的匹配程度包括:
响应于所述特征集合匹配于所述特征库,提高所述匹配程度;以及
响应于所述特征集合不匹配于所述特征库,降低所述匹配程度。
14.根据权利要求12所述的设备,其中所述聊天主题的特征库包括关键词文本库与语音波形库,并且获取所述聊天主题的特征库包括:
基于所述聊天主题生成关键词文本库;以及
基于所述关键词文本库获取所述聊天主题的语音波形库。
15.根据权利要求14所述的设备,其中基于所述聊天主题生成关键词文本库包括:
确定与所述聊天主题相关联的至少一个基础关键词;
扩展所述至少一个基础关键词中的基础关键词,以获得至少一个扩展关键词;
检索与所述主题有关的至少一个附加基础关键词;
扩展所述附加基础关键词,以获得附加扩展关键词;
根据所述至少一个扩展关键词和所述附加扩展关键词形成所述关键词文本库。
16.根据权利要求14所述的设备,其中基于所述关键词文本库获取所述聊天主题的语音波形库包括:
将所述关键词文本库中的关键词转换为基本语音波形;
扩展所述基本语音波形,以获得语音波形;以及
基于所述语音波形获取所述语音波形库。
17.根据权利要求15所述的设备,其中:
所述至少一个基础关键词包括平台关键词和用户关键词中的至少任一项,其中所述平台关键词是由平台运营人员、客服人员关于所述聊天主题来确定的,以及所述用户关键词是基于所述至少一个用户的输入来确定的。
18.根据权利要求15所述的设备,其中:
扩展所述至少一个基础关键词中的基础关键词,以获得所述至少一个扩展关键词包括:针对所述至少一个基础关键词中的给定基础关键词,
根据所述给定基础关键词的别称、简称、俗语、别字、缩写、功能、属性来获得所述至少一个扩展关键词。
19.根据权利要求15所述的设备,其中:
检索与所述主题有关的至少一个附加基础关键词包括在以下中的至少任一项来进行检索:
互联网、预定义词库以及知识图谱。
20.根据权利要求16所述的设备,其中扩展所述语音波形,以获得所述语音波形库包括:
根据以下中的至少任一项来获得所述语音波形库:口音、语音语调、性别、以及方言。
21.根据权利要求12所述的设备,其中所述至少一个特征包括与所述聊天主题相关联的语音波形,所述聊天记录是来自所述至少一个用户的语音;以及
基于所述聊天记录生成特征集合包括:
提取所述语音波形;以及
基于所述语音波形生成所述特征集合。
22.根据权利要求12所述的设备,其中所述至少一个特征包括与所述聊天主题相关联的文本的拼音,所述聊天记录是来自所述至少一个用户的语音;以及
基于所述聊天记录生成特征集合包括:
基于语音识别技术提取与所述语音相关联的文本;以及
基于所述文本的拼音来生成所述特征集合。
23.一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,所述计算机可读程序指令用于执行根据权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811204452.6A CN111061845A (zh) | 2018-10-16 | 2018-10-16 | 管理聊天室的聊天主题的方法、设备和计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811204452.6A CN111061845A (zh) | 2018-10-16 | 2018-10-16 | 管理聊天室的聊天主题的方法、设备和计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111061845A true CN111061845A (zh) | 2020-04-24 |
Family
ID=70296716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811204452.6A Pending CN111061845A (zh) | 2018-10-16 | 2018-10-16 | 管理聊天室的聊天主题的方法、设备和计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111061845A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220103680A1 (en) * | 2020-09-29 | 2022-03-31 | Sandvine Corporation | System and method for classifying and handling voice over ip traffic |
CN116418777A (zh) * | 2023-04-10 | 2023-07-11 | 深圳市逗娱科技有限公司 | 基于数据分析的在线聊天房间智能推送系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002101483A2 (en) * | 2001-06-12 | 2002-12-19 | Kent Ridge Digital Labs | Network communication system |
CN103226580A (zh) * | 2013-04-02 | 2013-07-31 | 西安交通大学 | 一种面向交互文本的话题识别方法 |
CN103870491A (zh) * | 2012-12-13 | 2014-06-18 | 联想(北京)有限公司 | 一种信息匹配方法及电子设备 |
CN105488026A (zh) * | 2015-11-25 | 2016-04-13 | 小米科技有限责任公司 | 关注话题的提醒方法及装置 |
CN105723450A (zh) * | 2013-11-13 | 2016-06-29 | 谷歌公司 | 用于话语检测的包络比较 |
CN108257594A (zh) * | 2016-12-28 | 2018-07-06 | 中国移动通信有限公司研究院 | 一种会议系统及其信息处理方法 |
-
2018
- 2018-10-16 CN CN201811204452.6A patent/CN111061845A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002101483A2 (en) * | 2001-06-12 | 2002-12-19 | Kent Ridge Digital Labs | Network communication system |
CN103870491A (zh) * | 2012-12-13 | 2014-06-18 | 联想(北京)有限公司 | 一种信息匹配方法及电子设备 |
CN103226580A (zh) * | 2013-04-02 | 2013-07-31 | 西安交通大学 | 一种面向交互文本的话题识别方法 |
CN105723450A (zh) * | 2013-11-13 | 2016-06-29 | 谷歌公司 | 用于话语检测的包络比较 |
CN105488026A (zh) * | 2015-11-25 | 2016-04-13 | 小米科技有限责任公司 | 关注话题的提醒方法及装置 |
CN108257594A (zh) * | 2016-12-28 | 2018-07-06 | 中国移动通信有限公司研究院 | 一种会议系统及其信息处理方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220103680A1 (en) * | 2020-09-29 | 2022-03-31 | Sandvine Corporation | System and method for classifying and handling voice over ip traffic |
CN116418777A (zh) * | 2023-04-10 | 2023-07-11 | 深圳市逗娱科技有限公司 | 基于数据分析的在线聊天房间智能推送系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10210861B1 (en) | Conversational agent pipeline trained on synthetic data | |
US10559299B1 (en) | Reconciliation between simulator and speech recognition output using sequence-to-sequence mapping | |
US10410627B2 (en) | Automatic language model update | |
US10176804B2 (en) | Analyzing textual data | |
US11494434B2 (en) | Systems and methods for managing voice queries using pronunciation information | |
US11056104B2 (en) | Closed captioning through language detection | |
US20200075024A1 (en) | Response method and apparatus thereof | |
JP2019061662A (ja) | 情報を抽出する方法及び装置 | |
CN111107380B (zh) | 一种用于管理音频数据的方法、设备和计算机存储介质 | |
US11842721B2 (en) | Systems and methods for generating synthesized speech responses to voice inputs by training a neural network model based on the voice input prosodic metrics and training voice inputs | |
WO2020052069A1 (zh) | 用于分词的方法和装置 | |
US20210034662A1 (en) | Systems and methods for managing voice queries using pronunciation information | |
CN111832308A (zh) | 语音识别文本连贯性处理方法和装置 | |
CN111061845A (zh) | 管理聊天室的聊天主题的方法、设备和计算机存储介质 | |
CN113111658B (zh) | 校验信息的方法、装置、设备和存储介质 | |
Dumitrescu et al. | Crowd-sourced, automatic speech-corpora collection–Building the Romanian Anonymous Speech Corpus | |
JP2018084627A (ja) | 言語モデル学習装置およびそのプログラム | |
US11410656B2 (en) | Systems and methods for managing voice queries using pronunciation information | |
CN113241061B (zh) | 语音识别结果的处理方法、装置、电子设备和存储介质 | |
CN114822492B (zh) | 语音合成方法及装置、电子设备、计算机可读存储介质 | |
RU2744063C1 (ru) | Способ и система определения говорящего пользователя управляемого голосом устройства | |
CA3143967A1 (en) | Systems and methods for managing voice queries using pronunciation information | |
Vignesh et al. | Tamil speech recognizer using hidden markov model for question answering system of railways | |
CN117651192A (zh) | 视频播放方法及装置 | |
CN114822456A (zh) | 基于乐谱的乐谱音频检测方法、装置、设备和计算机介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |