CN108540373A - 即时聊天中语音数据的摘要生成方法、服务器及系统 - Google Patents

即时聊天中语音数据的摘要生成方法、服务器及系统 Download PDF

Info

Publication number
CN108540373A
CN108540373A CN201810240649.9A CN201810240649A CN108540373A CN 108540373 A CN108540373 A CN 108540373A CN 201810240649 A CN201810240649 A CN 201810240649A CN 108540373 A CN108540373 A CN 108540373A
Authority
CN
China
Prior art keywords
text message
voice data
terminal
message
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810240649.9A
Other languages
English (en)
Other versions
CN108540373B (zh
Inventor
范大宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yunzhisheng Information Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201810240649.9A priority Critical patent/CN108540373B/zh
Publication of CN108540373A publication Critical patent/CN108540373A/zh
Application granted granted Critical
Publication of CN108540373B publication Critical patent/CN108540373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种即时聊天中语音数据的摘要生成方法,包括:获取即时聊天时终端发送的语音消息,语音消息包括语音数据和语音数据在终端的存储路径;对语音数据进行语音识别,确定语音数据对应的文本信息,并根据文本信息提取语音数据的摘要信息;根据语音识别结果生成语音消息的摘要数据列表,摘要数据列表包括语音数据的摘要信息、语音数据的生成时间、语音数据的终端存储路径和语音数据的时间偏移量;将语音消息的摘要数据列表下发至终端,指示终端根据摘要数据列表检索所需的语音消息。本即时聊天中语音数据的摘要生成方法,生成即时聊天软件中语音消息的摘要信息,根据摘要信息来搜索需要搜索的历史语音消息,提高了搜索的效率,节约了时间。

Description

即时聊天中语音数据的摘要生成方法、服务器及系统
技术领域
本发明涉及语音识别技术领域,特别涉及一种即时聊天中语音数据的摘要生成方法、服务器及系统。
背景技术
目前,即时聊天软件中需要搜索历史消息,但其中语音消息无提示信息,无摘要信息,所以若需要搜索的信息在语音消息中就会很麻烦,浪费了大量的时间。
发明内容
本发明提供一种即时聊天中语音数据的摘要生成方法,生成即时聊天软件中语音消息的摘要信息,根据摘要信息来搜索需要搜索的历史语音消息,提高了搜索的效率,节约了时间。
本发明实施例提供的一种即时聊天中语音数据的摘要生成方法,包括:
获取即时聊天时终端发送的语音消息,所述语音消息包括语音数据和所述语音数据在终端的存储路径;
对所述语音数据进行语音识别,确定所述语音数据对应的文本信息,并根据所述文本信息提取所述语音数据的摘要信息;
根据语音识别结果生成所述语音消息的摘要数据列表,所述摘要数据列表包括所述语音数据的摘要信息、所述语音数据的生成时间、所述语音数据的终端存储路径和所述语音数据的时间偏移量;
将所述语音消息的摘要数据列表下发至所述终端,指示所述终端根据所述摘要数据列表检索所需的语音消息。
其中,将所述语音消息的摘要数据列表下发至所述终端包括:
周期性将生成的所述语音消息的摘要数据列表推送至所述终端;或
接收终端发送的用于获取摘要数据列表的获取请求,将在所述终端上一次发送获取请求与本次发送获取请求之间的时间段内生成的语音消息的摘要数据列表推送至所述终端。
在一个实施例中,即时聊天中语音数据的摘要生成方法还包括:
存储所述语音消息和所述语音消息的摘要数据列表;
接收所述终端发送的语音消息获取请求,将与所述语音消息获取请求相对应的语音消息和语音消息的摘要数据列表下发至所述终端。
在一个实施例中,根据所述文本信息提取所述语音数据的摘要信息包括:
判断所述文本信息包含的字符数是否大于预设阈值;
当所述文本信息包含的字符数不大于预设阈值时,将所述文本信息作为所述语音数据的摘要信息;
当所述文本信息包含的字符数大于预设阈值时,对所述文本信息进行分词处理,并去除所述文本信息中的停用词生成第一文本信息;
判断所述第一文本信息包含的字符数是否大于预设阈值;
当所述第一文本信息包含的字符数不大于预设阈值时,将所述第一文本信息作为所述语音数据的摘要信息;
当所述第一文本信息包含的字符数大于预设阈值时,去除所述第一文本信息中的虚词,并生成第二文本信息,所述虚词包括数量词、介词、连词、助词、感叹词和象声词;
判断所述第二文本信息包含的字符数是否大于预设阈值;
当所述第二文本信息包含的字符数不大于预设阈值时,将所述第二文本信息作为所述语音数据的摘要信息;
当所述第二文本信息包含的字符数大于预设阈值时,选取所述第二文本信息中字符数小于所述预设阈值的信息,将选取出的信息作为第三文本信息,并为所述第三文本信息添加隐藏标记,并将所述第三文本信息作为所述语音数据的摘要信息;所述隐藏标记用于表示所述第三文本信息包含所述语音数据中的部分信息。
本发明还提供一种即时聊天中语音数据的摘要生成服务器,包括:
获取模块,用于获取即时聊天时终端发送的语音消息,所述语音消息包括语音数据和所述语音数据在终端的存储路径;
处理模块,用于对所述语音数据进行语音识别,确定所述语音数据对应的文本信息,并根据所述文本信息提取所述语音数据的摘要信息;
列表生成模块,用于根据语音识别结果生成所述语音消息的摘要数据列表,所述摘要数据列表包括所述语音数据的摘要信息、所述语音数据的生成时间、所述语音数据的终端存储路径和所述语音数据的时间偏移量;
下发模块,用于将所述语音消息的摘要数据列表下发至所述终端,指示所述终端根据所述摘要数据列表检索所需的语音消息。
其中,下发模块用于:
周期性将生成的所述语音消息的摘要数据列表推送至所述终端;或
接收终端发送的用于获取摘要数据列表的获取请求,将在所述终端上一次发送获取请求与本次发送获取请求之间的时间段内生成的语音消息的摘要数据列表推送至所述终端。
在一个实施例中,服务器还包括:
存储模块,用于存储所述语音消息和所述语音消息的摘要数据列表;
接收模块,用于接收所述终端发送的语音消息获取请求,将与所述语音消息获取请求相对应的语音消息和语音消息的摘要数据列表下发至所述终端。
在一个实施例中,处理模块包括:
第一判断单元,用于判断所述文本信息包含的字符数是否大于预设阈值;
第一处理单元,用于当所述文本信息包含的字符数不大于预设阈值时,将所述文本信息作为所述语音数据的摘要信息;
分词单元,用于当所述文本信息包含的字符数大于预设阈值时,对所述文本信息进行分词处理,并去除所述文本信息中的停用词生成第一文本信息;
第二判断单元,用于判断所述第一文本信息包含的字符数是否大于预设阈值;
第二处理单元,用于当所述第一文本信息包含的字符数不大于预设阈值时,将所述第一文本信息作为所述语音数据的摘要信息;
虚词去除单元,用于当所述第一文本信息包含的字符数大于预设阈值时,去除所述第一文本信息中的虚词,并生成第二文本信息,所述虚词包括数量词、介词、连词、助词、感叹词和象声词;
第三判断单元,用于判断所述第二文本信息包含的字符数是否大于预设阈值;
第三处理单元,用于当所述第二文本信息包含的字符数不大于预设阈值时,将所述第二文本信息作为所述语音数据的摘要信息;
第四处理单元,用于当所述第二文本信息包含的字符数大于预设阈值时,选取所述第二文本信息中字符数小于所述预设阈值的信息,将选取出的信息作为第三文本信息,并为所述第三文本信息添加隐藏标记,并将所述第三文本信息作为所述语音数据的摘要信息;所述隐藏标记用于表示所述第三文本信息包含所述语音数据中的部分信息。
本发明还提供一种即时聊天中语音数据的摘要生成系统,包括:终端和上述任一服务器。
本即时聊天中语音数据的摘要生成方法、服务器及系统,生成即时聊天软件中语音消息的摘要信息,根据摘要信息来搜索需要搜索的历史语音消息,提高了搜索的效率,节约了时间。另外还可运用生成的摘要信息恢复想要恢复的语音消息。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种即时聊天中语音数据的摘要生成方法的示意图;
图2为本发明实施例中一种即时聊天中语音数据的摘要生成服务器的示意图;
图3为本发明实施例处理模块的示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供了一种即时聊天中语音数据的摘要生成方法,如图1所示,包括:
S1:获取即时聊天时终端发送的语音消息,语音消息包括语音数据和语音数据在终端的存储路径;语音数据即语音聊天时的录入的声音。
S2:对语音数据进行语音识别,确定语音数据对应的文本信息,并根据文本信息提取语音数据的摘要信息;
S3:根据语音识别结果生成语音消息的摘要数据列表,摘要数据列表包括语音数据的摘要信息、语音数据的生成时间、语音数据的终端存储路径和语音数据的时间偏移量;语音数据的生成时间是语音聊天时开始录入声音的时间;语音数据的时间偏移量是从开始录入声音到声音录入结束的总时间。
S4:将语音消息的摘要数据列表下发至终端,指示终端根据摘要数据列表检索所需的语音消息。
本发明实施例中,可以根据摘要数据列表搜索用户需要的历史语音消息;具体的,根据文本格式的语音数据的摘要信息来搜索需要搜索的历史语音消息;或者通过语音数据的生成时间来搜索,例如,记得想要搜索的语音数据在前天9点左右;可以指定前天8点半和9点半这个时间段进行搜索,将所有发生在这个时间内的语音消息搜索出来。这样就缩小了搜索的语音数据的寻找范围节约了时间。或者,通过语音数据的时间偏移量,例如,记得想要搜索的语音数据是50秒,可以将所有50秒的语音消息搜索出来。这样就缩小了搜索的语音数据的寻找范围节约了时间。
通过上述即时聊天中语音数据的摘要生成方法生成即时聊天软件中语音数据的摘要数据列表,既可以根据摘要数据列表中的语音数据的摘要信息来搜索需要搜索的历史语音消息,也可以通过语音数据的生成时间或语音数据的时间偏移量来搜索需要搜索的历史语音消息,提高了搜索的效率,节约了时间。
其中,将语音消息的摘要数据列表下发至终端包括:
周期性将生成的语音消息的摘要数据列表推送至终端;例如:每隔一分钟将生成的语音消息的摘要数据列表推送至终端;
接收终端发送的用于获取摘要数据列表的获取请求,将在终端上一次发送获取请求与本次发送获取请求之间的时间段内生成的语音消息的摘要数据列表推送至终端。将语音消息的摘要数据列表下发至终端,保证在用户运用终端进行搜索历史语音消息时,终端中存有完整的历史语音消息的摘要数据列表,保证搜索的准确与完整。
为了实现恢复终端的历史语音消息的目的,在一个实施例中,即时聊天中语音数据的摘要生成方法还包括:
存储语音消息和语音消息的摘要数据列表;
接收终端发送的语音消息获取请求,将与语音消息获取请求相对应的语音消息和语音消息的摘要数据列表下发至终端。例如,当终端本地存储的语音消息遗失或被删除后,当用户需要最近一个月的聊天记录时,终端可以向服务器发送用于获取一个月内的语音消息的获取请求,进而服务器可以就将一个月内的语音消息和语音消息的摘要数据列表发送给终端。
为实现根据文本信息提取语音数据的摘要信息,在一个实施例中,根据文本信息提取语音数据的摘要信息包括:
判断文本信息包含的字符数是否大于预设阈值;
当文本信息包含的字符数不大于预设阈值时,将文本信息作为语音数据的摘要信息;
当文本信息包含的字符数大于预设阈值时,对文本信息进行分词处理,并去除文本信息中的停用词生成第一文本信息;
判断第一文本信息包含的字符数是否大于预设阈值;
当第一文本信息包含的字符数不大于预设阈值时,将第一文本信息作为语音数据的摘要信息;
当第一文本信息包含的字符数大于预设阈值时,去除第一文本信息中的虚词,并生成第二文本信息,虚词包括数量词、介词、连词、助词、感叹词和象声词;
判断第二文本信息包含的字符数是否大于预设阈值;
当第二文本信息包含的字符数不大于预设阈值时,将第二文本信息作为语音数据的摘要信息;
当第二文本信息包含的字符数大于预设阈值时,选取第二文本信息中字符数小于预设阈值的信息,将选取出的信息作为第三文本信息,并为第三文本信息添加隐藏标记,并将第三文本信息作为语音数据的摘要信息;隐藏标记用于表示第三文本信息包含语音数据中的部分信息。
例如,预设阈值为10,首先判断文本信息包含的字符数是否大于10,当不大于10,直接将文本信息作为语音数据的摘要信息;当文本信息包含的字符数大于10,对文本信息进行分词处理,并去除文本信息中的停用词生成第一文本信息。然后判断第一文本信息包含的字符数是否大于10,当不大于10,将第一文本信息作为语音数据的摘要信息;当第一文本信息包含的字符数大于10,去除第一文本信息中的虚词,并生成第二文本信息;虚词包括介词、连词、助词、语气词。然后判断第二文本信息包含的字符数是否大于10;当第二文本信息包含的字符数不大于10,将第二文本信息作为语音数据的摘要信息;当第二文本信息包含的字符数大于10,选取第二文本信息中字符数小于预设阈值的信息,将选取出的信息作为第三文本信息,并为第三文本信息添加隐藏标记,并将第三文本信息作为语音数据的摘要信息;隐藏标记用于表示第三文本信息包含语音数据中的部分信息。隐藏标记可以用“……”表示。
上述根据文本信息提取语音数据的摘要信息,保证摘要信息包含的字符数在一定范围内,方便搜索。
本发明还提供一种即时聊天中语音数据的摘要生成服务器,如图2所示,包括:
获取模块21,用于获取即时聊天时终端发送的语音消息,语音消息包括语音数据和语音数据在终端的存储路径;
处理模块22,用于对语音数据进行语音识别,确定语音数据对应的文本信息,并根据文本信息提取语音数据的摘要信息;
列表生成模块23,用于根据语音识别结果生成语音消息的摘要数据列表,摘要数据列表包括语音数据的摘要信息、语音数据的生成时间、语音数据的终端存储路径和语音数据的时间偏移量;
下发模块24,用于将语音消息的摘要数据列表下发至终端,指示终端根据摘要数据列表检索所需的语音消息。
通过上述即时聊天中语音数据的摘要生成服务器生成即时聊天软件中语音数据的摘要数据列表,下发至终端。用户在终端处既可以根据摘要数据列表中的语音数据的摘要信息来搜索需要搜索的历史语音消息,也可以通过语音数据的生成时间或语音数据的时间偏移量来搜索需要搜索的历史语音消息,提高了搜索的效率,节约了时间。
其中,下发模块用于:
周期性将生成的语音消息的摘要数据列表推送至终端;或
接收终端发送的用于获取摘要数据列表的获取请求,将在终端上一次发送获取请求与本次发送获取请求之间的时间段内生成的语音消息的摘要数据列表推送至终端。
服务器将语音消息的摘要数据列表下发至终端,保证在用户运用终端进行搜索历史语音消息时,终端中存有完整的历史语音消息的摘要数据列表,保证搜索的准确与完整。
为了实现恢复终端的历史语音消息,在一个实施例中,服务器还包括:
存储模块,用于存储语音消息和语音消息的摘要数据列表;
接收模块,用于接收终端发送的语音消息获取请求,将与语音消息获取请求相对应的语音消息和语音消息的摘要数据列表下发至终端。
当终端处的历史语音信息删除时,通过服务器可以恢复在终端的历史语音信息。
为实现根据文本信息提取语音数据的摘要信息,在一个实施例中,处理模块,如图3所示,包括:
第一判断单元31,用于判断文本信息包含的字符数是否大于预设阈值;
第一处理单元32,用于当文本信息包含的字符数不大于预设阈值时,将文本信息作为语音数据的摘要信息;
分词单元33,用于当文本信息包含的字符数大于预设阈值时,对文本信息进行分词处理,并去除文本信息中的停用词生成第一文本信息;
第二判断单元34,用于判断第一文本信息包含的字符数是否大于预设阈值;
第二处理单元35,用于当第一文本信息包含的字符数不大于预设阈值时,将第一文本信息作为语音数据的摘要信息;
虚词去除单元36,用于当第一文本信息包含的字符数大于预设阈值时,去除第一文本信息中的虚词,并生成第二文本信息,虚词包括数量词、介词、连词、助词、感叹词和象声词;
第三判断单元37,用于判断第二文本信息包含的字符数是否大于预设阈值;
第三处理单元38,用于当第二文本信息包含的字符数不大于预设阈值时,将第二文本信息作为语音数据的摘要信息;
第四处理单元39,用于当第二文本信息包含的字符数大于预设阈值时,选取第二文本信息中字符数小于预设阈值的信息,将选取出的信息作为第三文本信息,并为第三文本信息添加隐藏标记,并将第三文本信息作为语音数据的摘要信息;隐藏标记用于表示第三文本信息包含语音数据中的部分信息。
例如,预设阈值为10,首先第一判断单元判断文本信息包含的字符数是否大于10,当不大于10,第一处理单元直接将文本信息作为语音数据的摘要信息;当文本信息包含的字符数大于10,分词单元对文本信息进行分词处理,并去除文本信息中的停用词生成第一文本信息。然后第二判断单元判断第一文本信息包含的字符数是否大于10,当不大于10,第二处理单元将第一文本信息作为语音数据的摘要信息;当第一文本信息包含的字符数大于10,虚词去除单元去除第一文本信息中的虚词,并生成第二文本信息。然后第三判断单元判断第二文本信息包含的字符数是否大于10;当第二文本信息包含的字符数不大于10,第三处理单元将第二文本信息作为语音数据的摘要信息;当第二文本信息包含的字符数大于10,第四处理单元选取第二文本信息中字符数小于预设阈值的信息,将选取出的信息作为第三文本信息,并为第三文本信息添加隐藏标记,并将第三文本信息作为语音数据的摘要信息;隐藏标记用于表示第三文本信息包含语音数据中的部分信息。隐藏标记可以用“……”表示。
上述处理单元根据文本信息提取语音数据的摘要信息,保证摘要信息包含的字符数在一定范围内,方便搜索。
本发明还提供一种即时聊天中语音数据的摘要生成系统,包括:终端和上述任一上述的服务器。该系统可以生成即时聊天软件中语音消息的摘要信息,根据摘要信息来搜索需要搜索的历史语音消息,提高了搜索的效率,节约了时间。另外还可运用生成的摘要信息恢复想要恢复的语音消息。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种即时聊天中语音数据的摘要生成方法,其特征在于,包括:
获取即时聊天时终端发送的语音消息,所述语音消息包括语音数据和所述语音数据在终端的存储路径;
对所述语音数据进行语音识别,确定所述语音数据对应的文本信息,并根据所述文本信息提取所述语音数据的摘要信息;
根据语音识别结果生成所述语音消息的摘要数据列表,所述摘要数据列表包括所述语音数据的摘要信息、所述语音数据的生成时间、所述语音数据的终端存储路径和所述语音数据的时间偏移量;
将所述语音消息的摘要数据列表下发至所述终端,指示所述终端根据所述摘要数据列表检索所需的语音消息。
2.如权利要求1所述的方法,其特征在于,所述将所述语音消息的摘要数据列表下发至所述终端包括:
周期性将生成的所述语音消息的摘要数据列表推送至所述终端;或
接收终端发送的用于获取摘要数据列表的获取请求,将在所述终端上一次发送获取请求与本次发送获取请求之间的时间段内生成的语音消息的摘要数据列表推送至所述终端。
3.如权利要求1所述的方法,其特征在于,还包括:
存储所述语音消息和所述语音消息的摘要数据列表;
接收所述终端发送的语音消息获取请求,将与所述语音消息获取请求相对应的语音消息和语音消息的摘要数据列表下发至所述终端。
4.如权利要求1所述的方法,其特征在于,所述根据所述文本信息提取所述语音数据的摘要信息包括:
判断所述文本信息包含的字符数是否大于预设阈值;
当所述文本信息包含的字符数不大于预设阈值时,将所述文本信息作为所述语音数据的摘要信息;
当所述文本信息包含的字符数大于预设阈值时,对所述文本信息进行分词处理,并去除所述文本信息中的停用词生成第一文本信息;
判断所述第一文本信息包含的字符数是否大于预设阈值;
当所述第一文本信息包含的字符数不大于预设阈值时,将所述第一文本信息作为所述语音数据的摘要信息;
当所述第一文本信息包含的字符数大于预设阈值时,去除所述第一文本信息中的虚词,并生成第二文本信息,所述虚词包括数量词、介词、连词、助词、感叹词和象声词;
判断所述第二文本信息包含的字符数是否大于预设阈值;
当所述第二文本信息包含的字符数不大于预设阈值时,将所述第二文本信息作为所述语音数据的摘要信息;
当所述第二文本信息包含的字符数大于预设阈值时,选取所述第二文本信息中字符数小于所述预设阈值的信息,将选取出的信息作为第三文本信息,并为所述第三文本信息添加隐藏标记,并将所述第三文本信息作为所述语音数据的摘要信息;所述隐藏标记用于表示所述第三文本信息包含所述语音数据中的部分信息。
5.一种即时聊天中语音数据的摘要生成服务器,其特征在于,包括:
获取模块,用于获取即时聊天时终端发送的语音消息,所述语音消息包括语音数据和所述语音数据在终端的存储路径;
处理模块,用于对所述语音数据进行语音识别,确定所述语音数据对应的文本信息,并根据所述文本信息提取所述语音数据的摘要信息;
列表生成模块,用于根据语音识别结果生成所述语音消息的摘要数据列表,所述摘要数据列表包括所述语音数据的摘要信息、所述语音数据的生成时间、所述语音数据的终端存储路径和所述语音数据的时间偏移量;
下发模块,用于将所述语音消息的摘要数据列表下发至所述终端,指示所述终端根据所述摘要数据列表检索所需的语音消息。
6.如权利要求5所述的服务器,其特征在于,所述下发模块用于:
周期性将生成的所述语音消息的摘要数据列表推送至所述终端;或
接收终端发送的用于获取摘要数据列表的获取请求,将在所述终端上一次发送获取请求与本次发送获取请求之间的时间段内生成的语音消息的摘要数据列表推送至所述终端。
7.如权利要求5所述的服务器,其特征在于,还包括:
存储模块,用于存储所述语音消息和所述语音消息的摘要数据列表;
接收模块,用于接收所述终端发送的语音消息获取请求,将与所述语音消息获取请求相对应的语音消息和语音消息的摘要数据列表下发至所述终端。
8.如权利要求5所述的服务器,其特征在于,所述处理模块包括:
第一判断单元,用于判断所述文本信息包含的字符数是否大于预设阈值;
第一处理单元,用于当所述文本信息包含的字符数不大于预设阈值时,将所述文本信息作为所述语音数据的摘要信息;
分词单元,用于当所述文本信息包含的字符数大于预设阈值时,对所述文本信息进行分词处理,并去除所述文本信息中的停用词生成第一文本信息;
第二判断单元,用于判断所述第一文本信息包含的字符数是否大于预设阈值;
第二处理单元,用于当所述第一文本信息包含的字符数不大于预设阈值时,将所述第一文本信息作为所述语音数据的摘要信息;
虚词去除单元,用于当所述第一文本信息包含的字符数大于预设阈值时,去除所述第一文本信息中的虚词,并生成第二文本信息,所述虚词包括数量词、介词、连词、助词、感叹词和象声词;
第三判断单元,用于判断所述第二文本信息包含的字符数是否大于预设阈值;
第三处理单元,用于当所述第二文本信息包含的字符数不大于预设阈值时,将所述第二文本信息作为所述语音数据的摘要信息;
第四处理单元,用于当所述第二文本信息包含的字符数大于预设阈值时,选取所述第二文本信息中字符数小于所述预设阈值的信息,将选取出的信息作为第三文本信息,并为所述第三文本信息添加隐藏标记,并将所述第三文本信息作为所述语音数据的摘要信息;所述隐藏标记用于表示所述第三文本信息包含所述语音数据中的部分信息。
9.一种即时聊天中语音数据的摘要生成系统,其特征在于,包括:终端和如权利要求5-8任一所述的服务器。
CN201810240649.9A 2018-03-22 2018-03-22 即时聊天中语音数据的摘要生成方法、服务器及系统 Active CN108540373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810240649.9A CN108540373B (zh) 2018-03-22 2018-03-22 即时聊天中语音数据的摘要生成方法、服务器及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810240649.9A CN108540373B (zh) 2018-03-22 2018-03-22 即时聊天中语音数据的摘要生成方法、服务器及系统

Publications (2)

Publication Number Publication Date
CN108540373A true CN108540373A (zh) 2018-09-14
CN108540373B CN108540373B (zh) 2020-12-29

Family

ID=63484155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810240649.9A Active CN108540373B (zh) 2018-03-22 2018-03-22 即时聊天中语音数据的摘要生成方法、服务器及系统

Country Status (1)

Country Link
CN (1) CN108540373B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274586A (zh) * 2018-11-14 2019-01-25 深圳市云歌人工智能技术有限公司 聊天信息的存储方法、装置及存储介质
CN110287364A (zh) * 2019-06-28 2019-09-27 合肥讯飞读写科技有限公司 语音搜索方法、系统、设备及计算机可读存储介质
CN110312040A (zh) * 2019-07-02 2019-10-08 网易(杭州)网络有限公司 信息处理的方法、装置和系统
CN113987264A (zh) * 2021-10-28 2022-01-28 北京中科闻歌科技股份有限公司 视频摘要生成方法、装置、设备、系统及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101147370A (zh) * 2005-03-24 2008-03-19 艾利森电话股份有限公司 通信系统中用于将消息送交到接收方的方法和布置
CN103425668A (zh) * 2012-05-16 2013-12-04 联想(北京)有限公司 信息检索方法及电子设备
US20140188475A1 (en) * 2012-12-29 2014-07-03 Genesys Telecommunications Laboratories, Inc. Fast out-of-vocabulary search in automatic speech recognition systems
CN105005555A (zh) * 2015-07-28 2015-10-28 陈包容 基于聊天时间的关键词提取方法及装置
CN105302925A (zh) * 2015-12-10 2016-02-03 百度在线网络技术(北京)有限公司 推送语音搜索数据的方法和装置
CN106254617A (zh) * 2016-09-29 2016-12-21 努比亚技术有限公司 一种移动终端及控制方法
CN106407178A (zh) * 2016-08-25 2017-02-15 中国科学院计算技术研究所 一种会话摘要生成方法及装置
CN106446109A (zh) * 2016-09-14 2017-02-22 科大讯飞股份有限公司 语音文件摘要的获取方法和装置
CN106791052A (zh) * 2016-12-07 2017-05-31 惠州Tcl移动通信有限公司 一种移动终端筛选即时通信应用中聊天记录的方法及系统
CN107146618A (zh) * 2017-06-16 2017-09-08 北京云知声信息技术有限公司 语音处理方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101147370A (zh) * 2005-03-24 2008-03-19 艾利森电话股份有限公司 通信系统中用于将消息送交到接收方的方法和布置
CN103425668A (zh) * 2012-05-16 2013-12-04 联想(北京)有限公司 信息检索方法及电子设备
US20140188475A1 (en) * 2012-12-29 2014-07-03 Genesys Telecommunications Laboratories, Inc. Fast out-of-vocabulary search in automatic speech recognition systems
CN105005555A (zh) * 2015-07-28 2015-10-28 陈包容 基于聊天时间的关键词提取方法及装置
CN105302925A (zh) * 2015-12-10 2016-02-03 百度在线网络技术(北京)有限公司 推送语音搜索数据的方法和装置
CN106407178A (zh) * 2016-08-25 2017-02-15 中国科学院计算技术研究所 一种会话摘要生成方法及装置
CN106446109A (zh) * 2016-09-14 2017-02-22 科大讯飞股份有限公司 语音文件摘要的获取方法和装置
CN106254617A (zh) * 2016-09-29 2016-12-21 努比亚技术有限公司 一种移动终端及控制方法
CN106791052A (zh) * 2016-12-07 2017-05-31 惠州Tcl移动通信有限公司 一种移动终端筛选即时通信应用中聊天记录的方法及系统
CN107146618A (zh) * 2017-06-16 2017-09-08 北京云知声信息技术有限公司 语音处理方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274586A (zh) * 2018-11-14 2019-01-25 深圳市云歌人工智能技术有限公司 聊天信息的存储方法、装置及存储介质
CN110287364A (zh) * 2019-06-28 2019-09-27 合肥讯飞读写科技有限公司 语音搜索方法、系统、设备及计算机可读存储介质
CN110312040A (zh) * 2019-07-02 2019-10-08 网易(杭州)网络有限公司 信息处理的方法、装置和系统
CN113987264A (zh) * 2021-10-28 2022-01-28 北京中科闻歌科技股份有限公司 视频摘要生成方法、装置、设备、系统及介质

Also Published As

Publication number Publication date
CN108540373B (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
CN108540373A (zh) 即时聊天中语音数据的摘要生成方法、服务器及系统
JP4580885B2 (ja) シーン情報抽出方法、シーン抽出方法および抽出装置
CN101256557B (zh) 自定义词管理装置、方法
KR100890691B1 (ko) 언어학적으로 지능적인 텍스트 압축방법 및 그 처리장치
CN103971684B (zh) 一种添加标点的方法、系统及其语言模型建立方法、装置
EP1014277A1 (en) Communication system and method employing automatic language identification
CN111506712B (zh) 对话系统、对话方法、程序以及存储介质
US9280536B2 (en) Synonym determination among n-grams
EP2880513A1 (en) Generating string predictions using contexts
CN112700769A (zh) 一种语义理解方法、装置、设备以及计算机可读存储介质
US20190303384A1 (en) Method and system for consolidating data retrieved from different sources
CN112541095B (zh) 视频标题生成方法、装置、电子设备及存储介质
CN111243570A (zh) 一种语音获取方法、装置以及计算机可读存储介质
CN111539206A (zh) 一种确定敏感信息的方法、装置、设备及存储介质
CN102486787A (zh) 用于提取文档结构的方法和装置
US20210319481A1 (en) System and method for summerization of customer interaction
CN106558311A (zh) 语音内容提示方法和装置
CN112562659A (zh) 语音识别方法、装置、电子设备和存储介质
CN113128205B (zh) 一种剧本信息处理方法、装置、电子设备及存储介质
CN103559242A (zh) 语音输入信息的方法及终端设备
CN101887416B (zh) 一种将文字转化为图形的方法
CN101227579A (zh) 呈现辅助节目数据的系统及方法
CN116055825A (zh) 一种生成视频标题的方法及装置
KR20130115155A (ko) 클린메시지 서버 및 클린메시지 서비스 방법
EP3055859B1 (en) Identifying a contact

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 101, 1st floor, building 1, Xisanqi building materials City, Haidian District, Beijing 100096

Applicant after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: 12 / F, Guanjie building, building 1, No. 16, Taiyanggong Middle Road, Chaoyang District, Beijing

Applicant before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant