CN105049637A - 一种控制即时通讯的装置和方法 - Google Patents

一种控制即时通讯的装置和方法 Download PDF

Info

Publication number
CN105049637A
CN105049637A CN201510526737.1A CN201510526737A CN105049637A CN 105049637 A CN105049637 A CN 105049637A CN 201510526737 A CN201510526737 A CN 201510526737A CN 105049637 A CN105049637 A CN 105049637A
Authority
CN
China
Prior art keywords
progress bar
voice signal
keyword
module
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510526737.1A
Other languages
English (en)
Inventor
李成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nubia Technology Co Ltd
Original Assignee
Nubia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nubia Technology Co Ltd filed Critical Nubia Technology Co Ltd
Priority to CN201510526737.1A priority Critical patent/CN105049637A/zh
Publication of CN105049637A publication Critical patent/CN105049637A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)

Abstract

本发明公开了一种控制即时通讯的装置和方法,包括:处理模块、提取模块、标记模块和显示模块;其中,处理模块,用于计算语音信号的时长,并根据计算出的时长生成与语音信号对应的进度条;提取模块,用于提取语音信号中的关键词;标记模块,用于确定提取的关键词在进度条中的位置,并在确定出的位置处标记提取的关键词;显示模块,用于显示标记有关键词的进度条。本发明技术方案实现了更加快速、直观地显示语音通话的核心内容,增强了用户体验。

Description

一种控制即时通讯的装置和方法
技术领域
本发明涉及智能终端技术,尤指一种控制即时通讯的装置和方法。
背景技术
即时通讯满足了人们社交的需求,能够维护朋友、亲人和家庭之间的联系以及分享等便捷途径。即时通讯的形式丰富多样,人们在即时通讯中能够通过文字、图片、视频和语音等不同方式进行便捷地交流。
相比于文字和图片,语音聊天更加符合人们的日常聊天方式;同时,相比视频、文字和图片等方式,语音聊天的操作方式更具有便捷性。因此,语音聊天方式的即时通讯越来越受到人们的欢迎和青睐。
语音聊天是即时通讯中最为常见的一种通讯方式,语音聊天的具体实现方式包括:首先,用户发起通过语音方式的即时通讯呼叫时,向即时服务器系统传送包括发起人和对话接受者在内的即时通讯用户的呼叫列表;其次,发送呼叫列表的即时通讯用户与其它即时通讯用户通过即时通讯服务器系统形成通讯组,即时通讯服务器系统响应该通讯组中语音呼叫请求,并接收和传输该即时通讯组内用户所发出的语音数据包(也可以称之为语音信号);最后,将语音数据包发送至该通讯组中的指定通讯用户。
上述语音聊天实现过程中存在以下问题:1)语音聊天过程中,没有进行关键节点的标记:例如关键词或关键语句标记;2)没有提供关键信息预览操作,用户不知道提前该对话的核心内容;3)没有提供语音播放进度的指示,用户不知道当前语音播放状态;4)没有提供进度调节操作,用户无法自由调整语音播放进度。
发明内容
为了解决上述技术问题,本发明提供了一种控制即时通讯的装置和方法,能够更加快速、直观地显示语音通话的核心内容,增强用户体验。
为了达到本发明目的,本发明提供了一种控制即时通讯的装置,当有语音信号时,包括:处理模块、提取模块、标记模块和显示模块;其中,
处理模块,用于计算语音信号的时长,并根据计算出的时长生成与语音信号对应的进度条;
提取模块,用于提取语音信号中的关键词;
标记模块,用于确定提取的关键词在进度条中的位置,并在确定出的位置处标记提取的关键词;
显示模块,用于显示标记有关键词的进度条。
进一步地,所述提取模块具体用于:
通过数位信号转换器将语音信号转换为数位语音信号;
采用隐式马尔科夫模型语音辨识模块对转换后的数位语音信号的内容进行辨识并提取关键词。
进一步地,所述处理模块,还用于当用户读取标记有关键词的进度条时,获取用户已读取的标记有关键词的进度条的第一长度;根据所述生成的进度条的长度和获得的第一长度计算用户未读取的标记有关键词的进度条的第二长度;向所述显示模块发送显示第一长度和所述第二长度的通知;
所述显示模块,还用于接收到显示第一长度和所述第二长度的通知,以不同的方式显示所述第一长度和所述第二长度。
进一步地,所述处理模块,还用于在生成与语音信号对应的进度条时,生成控制进度条前进或后退的进度调节控件;其中,进度调节控件的初始位置为进度条的开始位置。
进一步地,所述处理模块,还用于监测用户是否拖动进度条;当监测到用户拖动进度条时,获取用户拖动进度条的方向和距离;
该装置还包括播放模块,用于播放与获得的用户拖动进度条的方向和距离对应的语音信号。
本发明还提供了一种控制即时通讯的方法,当有语音信号时,包括:
计算语音信号的时长,并根据计算出的时长生成与语音信号对应的进度条;
提取语音信号中的关键词以及确定提取的关键词在进度条中的位置,并在与进度条对应的位置标记关键词;
显示标记有关键词的进度条。
进一步地,所述提取语音信号中的关键词,包括:
通过数位信号转换器将语音信号转换为数位语音信号;
采用隐式马尔科夫模型语音辨识模块对转换后的数位语音信号的内容进行辨识并提取关键词。
进一步地,所述语音信号的时长与生成的进度条的长度成正比。
进一步地,当用户读取标记有关键词的进度条时,该方法还包括:
获取用户已读取的标记有关键词的进度条的第一长度;
根据所述生成的进度条的长度和获得的第一长度计算用户未读取的标记有关键词的进度条的第二长度;
以不同的方式显示所述第一长度和所述第二长度。
进一步地,在生成与语音信号对应的进度条时,该方法还包括:生成控制进度条前进或后退的进度调节控件;其中,进度调节控件的初始位置为进度条的开始位置。
进一步地,该方法之后还包括:
监测用户是否拖动进度条;
当监测到用户拖动进度条时,获取用户拖动进度条的方向和距离;
播放与获得的用户拖动进度条的方向和距离对应的语音信号。
本发明技术方案包括:处理模块、提取模块、标记模块和显示模块;其中,处理模块,用于计算语音信号的时长,并根据计算出的时长生成与语音信号对应的进度条;提取模块,用于提取语音信号中的关键词;标记模块,用于在与进度条对应的位置标记关键词;显示模块,用于显示标记有关键词的进度条。本发明技术方案实现了更加快速、直观地显示语音通话的核心内容,增强了用户体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为现有技术中显示语音通话的示意图;
图2为实现本发明各个实施例的移动终端的硬件结构示意;
图3为支持本发明移动终端之间进行通信的通信系统的示意图;
图4为本发明控制即时通讯的装置的结构示意图;
图5为本发明控制即时通讯的方法的流程图;
图6为本发明标记有关键词的语音信号的示例图;
图7为本发明进度条播放显示的示例图。
具体实施方式
下面将结合附图及实施例对本发明的技术方案进行更详细的说明。
现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。
移动终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
图2为实现本发明各个实施例的移动终端的硬件结构示意图。
移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、感测单元140、输出单元150、存储器160、接口单元170、控制器180和电源单元190等等。图2示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。
无线通信单元110通常包括一个或多个组件,其允许移动终端100与无线通信系统或网络之间的无线电通信。例如,无线通信单元可以包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114和位置信息模块115中的至少一个。
广播接收模块111经由广播信道从外部广播管理服务器接收广播信号和/或广播相关信息。广播信道可以包括卫星信道和/或地面信道。广播管理服务器可以是生成并发送广播信号和/或广播相关信息的服务器或者接收之前生成的广播信号和/或广播相关信息并且将其发送给终端的服务器。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等等。而且,广播信号可以进一步包括与TV或无线电广播信号组合的广播信号。广播相关信息也可以经由移动通信网络提供,并且在该情况下,广播相关信息可以由移动通信模块112来接收。广播信号可以以各种形式存在,例如,其可以以数字多媒体广播(DMB)的电子节目指南(EPG)、数字视频广播手持(DVB-H)的电子服务指南(ESG)等等的形式而存在。广播接收模块111可以通过使用各种类型的广播系统接收信号广播。特别地,广播接收模块111可以通过使用诸如多媒体广播-地面(DMB-T)、数字多媒体广播-卫星(DMB-S)、数字视频广播-手持(DVB-H),前向链路媒体(MediaFLO)的数据广播系统、地面数字广播综合服务(ISDB-T)等等的数字广播系统接收数字广播。广播接收模块111可以被构造为适合提供广播信号的各种广播系统以及上述数字广播系统。经由广播接收模块111接收的广播信号和/或广播相关信息可以存储在存储器160(或者其它类型的存储介质)中。
移动通信模块112将无线电信号发送到基站(例如,接入点、节点B等等)、外部终端以及服务器中的至少一个和/或从其接收无线电信号。这样的无线电信号可以包括语音通话信号、视频通话信号、或者根据文本和/或多媒体消息发送和/或接收的各种类型的数据。
无线互联网模块113支持移动终端的无线互联网接入。该模块可以内部或外部地耦接到终端。该模块所涉及的无线互联网接入技术可以包括WLAN(无线LAN)(Wi-Fi)、Wibro(无线宽带)、Wimax(全球微波互联接入)、HSDPA(高速下行链路分组接入)等等。
短程通信模块114是用于支持短程通信的模块。短程通信技术的一些示例包括蓝牙TM、射频识别(RFID)、红外数据协会(IrDA)、超宽带(UWB)、紫蜂TM等等。
位置信息模块115是用于检查或获取移动终端的位置信息的模块。位置信息模块的典型示例是GPS(全球定位系统)。根据当前的技术,GPS模块115计算来自三个或更多卫星的距离信息和准确的时间信息并且对于计算的信息应用三角测量法,从而根据经度、纬度和高度准确地计算三维当前位置信息。当前,用于计算位置和时间信息的方法使用三颗卫星并且通过使用另外的一颗卫星校正计算出的位置和时间信息的误差。此外,GPS模块115能够通过实时地连续计算当前位置信息来计算速度信息。
A/V输入单元120用于接收音频或视频信号。A/V输入单元120可以包括相机121和麦克风1220,相机121对在视频捕获模式或图像捕获模式中由图像捕获装置获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元151上。经相机121处理后的图像帧可以存储在存储器160(或其它存储介质)中或者经由无线通信单元110进行发送,可以根据移动终端的构造提供两个或更多相机1210。麦克风122可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由移动通信模块112发送到移动通信基站的格式输出。麦克风122可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
用户输入单元130可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。用户输入单元130允许用户输入各种类型的信息,并且可以包括键盘、锅仔片、触摸板(例如,检测由于被接触而导致的电阻、压力、电容等等的变化的触敏组件)、滚轮、摇杆等等。特别地,当触摸板以层的形式叠加在显示单元151上时,可以形成触摸屏。
感测单元140检测移动终端100的当前状态,(例如,移动终端100的打开或关闭状态)、移动终端100的位置、用户对于移动终端100的接触(即,触摸输入)的有无、移动终端100的取向、移动终端100的加速或减速移动和方向等等,并且生成用于控制移动终端100的操作的命令或信号。例如,当移动终端100实施为滑动型移动电话时,感测单元140可以感测该滑动型电话是打开还是关闭。另外,感测单元140能够检测电源单元190是否提供电力或者接口单元170是否与外部装置耦接。感测单元140可以包括接近传感器1410将在下面结合触摸屏来对此进行描述。
接口单元170用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。识别模块可以是存储用于验证用户使用移动终端100的各种信息并且可以包括用户识别模块(UIM)、客户识别模块(SIM)、通用客户识别模块(USIM)等等。另外,具有识别模块的装置(下面称为"识别装置")可以采取智能卡的形式,因此,识别装置可以经由端口或其它连接装置与移动终端100连接。接口单元170可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端和外部装置之间传输数据。
另外,当移动终端100与外部底座连接时,接口单元170可以用作允许通过其将电力从底座提供到移动终端100的路径或者可以用作允许从底座输入的各种命令信号通过其传输到移动终端的路径。从底座输入的各种命令信号或电力可以用作用于识别移动终端是否准确地安装在底座上的信号。输出单元150被构造为以视觉、音频和/或触觉方式提供输出信号(例如,音频信号、视频信号、警报信号、振动信号等等)。输出单元150可以包括显示单元151、音频输出模块152、警报单元153等等。
显示单元151可以显示在移动终端100中处理的信息。例如,当移动终端100处于电话通话模式时,显示单元151可以显示与通话或其它通信(例如,文本消息收发、多媒体文件下载等等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频通话模式或者图像捕获模式时,显示单元151可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的UI或GUI等等。
同时,当显示单元151和触摸板以层的形式彼此叠加以形成触摸屏时,显示单元151可以用作输入装置和输出装置。显示单元151可以包括液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、有机发光二极管(OLED)显示器、柔性显示器、三维(3D)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,典型的透明显示器可以例如为TOLED(透明有机发光二极管)显示器等等。根据特定想要的实施方式,移动终端100可以包括两个或更多显示单元(或其它显示装置),例如,移动终端可以包括外部显示单元(未示出)和内部显示单元(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。
音频输出模块152可以在移动终端处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将无线通信单元110接收的或者在存储器160中存储的音频数据转换音频信号并且输出为声音。而且,音频输出模块152可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出模块152可以包括扬声器、蜂鸣器等等。
警报单元153可以提供输出以将事件的发生通知给移动终端100。典型的事件可以包括呼叫接收、消息接收、键信号输入、触摸输入等等。除了音频或视频输出之外,警报单元153可以以不同的方式提供输出以通知事件的发生。例如,警报单元153可以以振动的形式提供输出,当接收到呼叫、消息或一些其它进入通信(incomingcommunication)时,警报单元153可以提供触觉输出(即,振动)以将其通知给用户。通过提供这样的触觉输出,即使在用户的移动电话处于用户的口袋中时,用户也能够识别出各种事件的发生。警报单元153也可以经由显示单元151或音频输出模块152提供通知事件的发生的输出。
存储器160可以存储由控制器180执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据(例如,电话簿、消息、静态图像、视频等等)。而且,存储器160可以存储关于当触摸施加到触摸屏时输出的各种方式的振动和音频信号的数据。
存储器160可以包括至少一种类型的存储介质,所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且,移动终端100可以与通过网络连接执行存储器160的存储功能的网络存储装置协作。
控制器180通常控制移动终端的总体操作。例如,控制器180执行与语音通话、数据通信、视频通话等等相关的控制和处理。另外,控制器180可以包括用于再现(或回放)多媒体数据的多媒体模块1810,多媒体模块1810可以构造在控制器180内,或者可以构造为与控制器180分离。控制器180可以执行模式识别处理,以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。
电源单元190在控制器180的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。
这里描述的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,这样的实施方式可以在控制器180中实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器160中并且由控制器180执行。
至此,己经按照其功能描述了移动终端。下面,为了简要起见,将描述诸如折叠型、直板型、摆动型、滑动型移动终端等等的各种类型的移动终端中的滑动型移动终端作为示例。因此,本发明能够应用于任何类型的移动终端,并且不限于滑动型移动终端。
如图2中所示的移动终端100可以被构造为利用经由帧或分组发送数据的诸如有线和无线通信系统以及基于卫星的通信系统来操作。
现在将参考图3描述其中根据本发明的移动终端能够操作的通信系统。
这样的通信系统可以使用不同的空中接口和/或物理层。例如,由通信系统使用的空中接口包括例如频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)和通用移动通信系统(UMTS)(特别地,长期演进(LTE))、全球移动通信系统(GSM)等等。作为非限制性示例,下面的描述涉及CDMA通信系统,但是这样的教导同样适用于其它类型的系统。
参考图3,CDMA无线通信系统可以包括多个移动终端100、多个基站(BS)270、基站控制器(BSC)275和移动交换中心(MSC)280。MSC280被构造为与公共电话交换网络(PSTN)290形成接口。MSC280还被构造为与可以经由回程线路耦接到基站270的BSC275形成接口。回程线路可以根据若干己知的接口中的任一种来构造,所述接口包括例如E1/T1、ATM,IP、PPP、帧中继、HDSL、ADSL或xDSL。将理解的是,如图3中所示的系统可以包括多个BSC2750。
每个BS270可以服务一个或多个分区(或区域),由多向天线或指向特定方向的天线覆盖的每个分区放射状地远离BS270。或者,每个分区可以由用于分集接收的两个或更多天线覆盖。每个BS270可以被构造为支持多个频率分配,并且每个频率分配具有特定频谱(例如,1.25MHz,5MHz等等)。
分区与频率分配的交叉可以被称为CDMA信道。BS270也可以被称为基站收发器子系统(BTS)或者其它等效术语。在这样的情况下,术语"基站"可以用于笼统地表示单个BSC275和至少一个BS270。基站也可以被称为"蜂窝站"。或者,特定BS270的各分区可以被称为多个蜂窝站。
如图3中所示,广播发射器(BT)295将广播信号发送给在系统内操作的移动终端100。如图2中所示的广播接收模块111被设置在移动终端100处以接收由BT295发送的广播信号。在图3中,示出了几个全球定位系统(GPS)卫星300。卫星300帮助定位多个移动终端100中的至少一个。
在图3中,描绘了多个卫星300,但是理解的是,可以利用任何数目的卫星获得有用的定位信息。如图2中所示的GPS模块115通常被构造为与卫星300配合以获得想要的定位信息。替代GPS跟踪技术或者在GPS跟踪技术之外,可以使用可以跟踪移动终端的位置的其它技术。另外,至少一个GPS卫星300可以选择性地或者额外地处理卫星DMB传输。
作为无线通信系统的一个典型操作,BS270接收来自各种移动终端100的反向链路信号。移动终端100通常参与通话、消息收发和其它类型的通信。特定基站270接收的每个反向链路信号被在特定BS270内进行处理。获得的数据被转发给相关的BSC275。BSC提供通话资源分配和包括BS270之间的软切换过程的协调的移动管理功能。BSC275还将接收到的数据路由到MSC280,其提供用于与PSTN290形成接口的额外的路由服务。类似地,PSTN290与MSC280形成接口,MSC与BSC275形成接口,并且BSC275相应地控制BS270以将正向链路信号发送到移动终端100。
基于上述移动终端硬件结构以及通信系统,提出本发明方法各个实施例。
图4为本发明控制即时通讯的装置的结构示意图,当有语音信号时,如图4所示,包括:处理模块40、提取模块41、标记模块42和显示模块43。其中,
处理模块40,用于计算语音信号的时长,并根据计算出的时长生成与语音信号对应的进度条。
其中,语音信号的时长与生成的进度条的长度成正比。
进一步地,处理模块40,还用于当用户读取标记有关键词的进度条时,获取用户已读取的标记有关键词的进度条的第一长度;根据生成的进度条的长度和获得的第一长度计算用户未读取的标记有关键词的进度条的第二长度;向显示模块43发送显示第一长度和第二长度的通知。
进一步地,处理模块40,还用于在生成与语音信号对应的进度条时,生成控制进度条前进或后退的进度调节控件;其中,进度调节控件的初始位置为进度条的开始位置。
进一步地,处理模块40,还用于监测用户是否拖动进度条;当监测到用户拖动进度条时,获取用户拖动进度条的方向和距离;将获得的用户拖动进度条的方向和距离发送给播放模块。
提取模块41,用于提取语音信号中的关键词。
其中,提取模块41,具体用于:
通过数位信号转换器将语音信号转换为数位语音信号;
采用隐式马尔科夫模型语音辨识模块对转换后的数位语音信号的内容进行辨识并提取关键词。
其中,关键词包括但不限于:人物、时间、事件、地点和时间。
标记模块42,用于在与进度条对应的位置标记关键词。
显示模块43,用于显示标记有关键词的进度条。
进一步地,显示模块43,还用于接收到显示第一长度和第二长度的通知,以不同的方式显示第一长度和第二长度。
进一步地,该装置还包括播放模块,用于播放与获得的用户拖动进度条的方向和距离对应的语音信号。
进一步地,该装置可以设置在移动终端中。
需要说明的是,该装置中的处理模块40可以设置在图2中的感测单元140中,也可以设置在图2中的控制器180中;提取模块41和标记模块42均可以设置在图2中的控制器180中;显示模块43和播放模块44均可以设置在图2中的输出单元150中。
图5为本发明控制即时通讯的方法的流程图,当有语音信号时,如图5所示,包括:
步骤501:计算语音信号的时长,并根据计算出的时长生成与语音信号对应的进度条。
其中,语音信号的时长与生成的进度条的长度成正比。
需要说明的是,关于如何生成进度条属于本领域技术人员所熟知的惯用技术手段,在此不再赘述,并不用来限制本发明。
步骤502:提取语音信号中的关键词以及确定提取的关键词在进度条中的位置,并在确定出的位置处标记提取的关键词。
其中,提取语音信号中的关键词,包括:
通过数位信号转换器将语音信号转换为数位语音信号;
采用隐式马尔科夫模型语音辨识模块对转换后的数位语音信号的内容进行辨识并提取关键词。
其中,关键词包括但不限于:人物、时间、事件、地点和时间。
需要说明的是,关于如何采用隐式马尔科夫模型语音辨识模块提取关键词是本领域技术人员所熟知的惯用技术手段,在此不再赘述,并不用来限制本发明。另外除了上述提取关键词的手段外,还可以人为(如用户自己)的添加关键词。例如,当用户听到对方说下午4点有会议时,可以在该位置对时间和事件进行手动标记。
步骤503:显示标记有关键词的进度条。
需要说明的是,通过显示标记有关键词的进度条,可以更加快速的显示语音通话的核心内容,从而使用户更加快速地获知语音通话的核心内容。
如图6所示,显示的标记有关键词的进度条。
进一步地,当用户读取标记有关键词的进度条时,该方法还包括:
获取用户已读取的标记有关键词的进度条的第一长度;
根据生成的进度条的长度和获得的第一长度计算用户未读取的标记有关键词的进度条的第二长度;
以不同的方式显示第一长度和第二长度。
其中,可以采用不同颜色或不同亮度的方式显示第一长度和第二长度,如图7所示的示例图。
进一步地,在生成与语音信号对应的进度条时,该方法还包括:生成控制进度条前进或后退的进度调节控件;其中,进度调节控件的初始位置为进度条的开始位置。进一步地,该方法之后还包括:
监测用户是否拖动进度条;
当监测到用户拖动进度条时,获取用户拖动进度条的方向和距离;
播放与获得的用户拖动进度条的方向和距离对应的语音信号。进一步地,当检测到用户进入已播放的语音信号时,该方法还包括:获取上次该语音信号已播放的进度条的位置;并显示获得的上次该语音信号已播放的进度条的位置。
需要说明的是,关于如何生成控制进度条前进或后退的进度调节控件属于本领域技术人员所熟知的惯用技术手段,在此不再赘述,并不用来限制本发明。
本发明方法中,通过标记语音信号中的关键词并且显示标记有关键词的进度条,实现了更加快速、直观地显示语音通话的核心内容,增强了用户体验;通过不同方式显示第一长度和所述第二长度,直观的展示了当前语音信号播放进度;通过监测用户拖动进度条的方向和距离,并播放与获得的用户拖动进度条的方向和距离对应的语音信号,从而实现了用户可以选择任意位置播放语音信号的方式。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (11)

1.一种控制即时通讯的装置,其特征在于,包括:处理模块、提取模块、标记模块和显示模块;其中,
处理模块,用于计算语音信号的时长,并根据计算出的时长生成与语音信号对应的进度条;
提取模块,用于提取语音信号中的关键词;
标记模块,用于确定提取的关键词在进度条中的位置,并在确定出的位置处标记提取的关键词;
显示模块,用于显示标记有关键词的进度条。
2.根据权利要求1所述的装置,其特征在于,所述提取模块具体用于:
通过数位信号转换器将语音信号转换为数位语音信号;
采用隐式马尔科夫模型语音辨识模块对转换后的数位语音信号的内容进行辨识并提取关键词。
3.根据权利要求1所述的装置,其特征在于,所述处理模块,还用于当用户读取标记有关键词的进度条时,获取用户已读取的标记有关键词的进度条的第一长度;根据所述生成的进度条的长度和获得的第一长度计算用户未读取的标记有关键词的进度条的第二长度;向所述显示模块发送显示第一长度和所述第二长度的通知;
所述显示模块,还用于接收到显示第一长度和所述第二长度的通知,以不同的方式显示所述第一长度和所述第二长度。
4.根据权利要求1或3所述的装置,其特征在于,所述处理模块,还用于在生成与语音信号对应的进度条时,生成控制进度条前进或后退的进度调节控件;其中,进度调节控件的初始位置为进度条的开始位置。
5.根据权利要求4所述的装置,其特征在于,所述处理模块,还用于监测用户是否拖动进度条;当监测到用户拖动进度条时,获取用户拖动进度条的方向和距离;
该装置还包括播放模块,用于播放与获得的用户拖动进度条的方向和距离对应的语音信号。
6.一种控制即时通讯的方法,其特征在于,包括:
计算语音信号的时长,并根据计算出的时长生成与语音信号对应的进度条;
提取语音信号中的关键词以及确定提取的关键词在进度条中的位置,并在确定出的位置处标记提取的关键词;
显示标记有关键词的进度条。
7.根据权利要求6所述的方法,其特征在于,所述提取语音信号中的关键词,包括:
通过数位信号转换器将语音信号转换为数位语音信号;
采用隐式马尔科夫模型语音辨识模块对转换后的数位语音信号的内容进行辨识并提取关键词。
8.根据权利要求6所述的方法,其特征在于,所述语音信号的时长与生成的进度条的长度成正比。
9.根据权利要求8所述的方法,其特征在于,当用户读取标记有关键词的进度条时,该方法还包括:
获取用户已读取的标记有关键词的进度条的第一长度;
根据所述生成的进度条的长度和获得的第一长度计算用户未读取的标记有关键词的进度条的第二长度;
以不同的方式显示所述第一长度和所述第二长度。
10.根据权利要求6所述的方法,其特征在于,在生成与语音信号对应的进度条时,该方法还包括:生成控制进度条前进或后退的进度调节控件;其中,进度调节控件的初始位置为进度条的开始位置。
11.根据权利要求10所述的方法,其特征在于,该方法之后还包括:
监测用户是否拖动进度条;
当监测到用户拖动进度条时,获取用户拖动进度条的方向和距离;
播放与获得的用户拖动进度条的方向和距离对应的语音信号。
CN201510526737.1A 2015-08-25 2015-08-25 一种控制即时通讯的装置和方法 Pending CN105049637A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510526737.1A CN105049637A (zh) 2015-08-25 2015-08-25 一种控制即时通讯的装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510526737.1A CN105049637A (zh) 2015-08-25 2015-08-25 一种控制即时通讯的装置和方法

Publications (1)

Publication Number Publication Date
CN105049637A true CN105049637A (zh) 2015-11-11

Family

ID=54455827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510526737.1A Pending CN105049637A (zh) 2015-08-25 2015-08-25 一种控制即时通讯的装置和方法

Country Status (1)

Country Link
CN (1) CN105049637A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106940618A (zh) * 2017-03-31 2017-07-11 珠海市魅族科技有限公司 一种语音信息的播放方法以及装置
CN107516533A (zh) * 2017-07-10 2017-12-26 阿里巴巴集团控股有限公司 一种会话信息处理方法、装置、电子设备
CN107622137A (zh) * 2017-10-23 2018-01-23 腾讯音乐娱乐科技(深圳)有限公司 查找语音消息的方法和装置
CN107743089A (zh) * 2017-10-25 2018-02-27 上海织语网络科技有限公司 一种语音即时通讯方法及系统
CN107888757A (zh) * 2017-09-25 2018-04-06 努比亚技术有限公司 一种语音消息处理方法、终端和计算机可读存储介质
CN108133719A (zh) * 2017-12-13 2018-06-08 北京小米移动软件有限公司 语音播放方法、装置、电子设备及存储介质
CN108446389A (zh) * 2018-03-22 2018-08-24 平安科技(深圳)有限公司 语音消息搜索显示方法、装置、计算机设备及存储介质
CN110719518A (zh) * 2018-07-12 2020-01-21 阿里巴巴集团控股有限公司 多媒体数据处理方法、装置和设备
CN113132927A (zh) * 2019-12-27 2021-07-16 阿里巴巴集团控股有限公司 一种来电处理方法、装置、设备和机器可读介质
WO2021142999A1 (zh) * 2020-01-17 2021-07-22 青岛海信传媒网络技术有限公司 基于内容的语音播报方法及显示设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100125791A1 (en) * 2008-11-14 2010-05-20 Rebelvox, Llc User interface for a telecommunication and multimedia management system and method
CN103970477A (zh) * 2014-04-30 2014-08-06 华为技术有限公司 控制语音消息的方法和设备
CN104049885A (zh) * 2013-03-15 2014-09-17 Lg电子株式会社 移动终端和控制移动终端的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100125791A1 (en) * 2008-11-14 2010-05-20 Rebelvox, Llc User interface for a telecommunication and multimedia management system and method
CN104049885A (zh) * 2013-03-15 2014-09-17 Lg电子株式会社 移动终端和控制移动终端的方法
CN103970477A (zh) * 2014-04-30 2014-08-06 华为技术有限公司 控制语音消息的方法和设备

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106940618A (zh) * 2017-03-31 2017-07-11 珠海市魅族科技有限公司 一种语音信息的播放方法以及装置
CN107516533A (zh) * 2017-07-10 2017-12-26 阿里巴巴集团控股有限公司 一种会话信息处理方法、装置、电子设备
CN107888757A (zh) * 2017-09-25 2018-04-06 努比亚技术有限公司 一种语音消息处理方法、终端和计算机可读存储介质
CN107622137A (zh) * 2017-10-23 2018-01-23 腾讯音乐娱乐科技(深圳)有限公司 查找语音消息的方法和装置
CN107743089A (zh) * 2017-10-25 2018-02-27 上海织语网络科技有限公司 一种语音即时通讯方法及系统
CN108133719B (zh) * 2017-12-13 2020-11-27 北京小米移动软件有限公司 语音播放方法、装置、电子设备及存储介质
CN108133719A (zh) * 2017-12-13 2018-06-08 北京小米移动软件有限公司 语音播放方法、装置、电子设备及存储介质
CN108446389A (zh) * 2018-03-22 2018-08-24 平安科技(深圳)有限公司 语音消息搜索显示方法、装置、计算机设备及存储介质
CN108446389B (zh) * 2018-03-22 2021-12-24 平安科技(深圳)有限公司 语音消息搜索显示方法、装置、计算机设备及存储介质
CN110719518A (zh) * 2018-07-12 2020-01-21 阿里巴巴集团控股有限公司 多媒体数据处理方法、装置和设备
CN113132927A (zh) * 2019-12-27 2021-07-16 阿里巴巴集团控股有限公司 一种来电处理方法、装置、设备和机器可读介质
CN113132927B (zh) * 2019-12-27 2023-03-24 阿里巴巴集团控股有限公司 一种来电处理方法、装置、设备和机器可读介质
WO2021142999A1 (zh) * 2020-01-17 2021-07-22 青岛海信传媒网络技术有限公司 基于内容的语音播报方法及显示设备

Similar Documents

Publication Publication Date Title
CN105049637A (zh) 一种控制即时通讯的装置和方法
CN105100892A (zh) 视频播放装置及方法
CN105206260A (zh) 一种终端语音播报方法、装置及终端语音操作方法
CN104917896A (zh) 一种推送数据的方法和终端设备
CN105100482A (zh) 一种实现手语识别的移动终端、系统及其通话实现方法
CN105260083A (zh) 一种移动终端及其实现分屏的方法
CN105407037A (zh) 一种群聊装置及方法
CN104883430A (zh) 一种移动终端及其未读角标的处理方法和装置
CN104735255A (zh) 分屏显示方法和系统
CN105306815A (zh) 一种拍摄模式切换装置、方法及移动终端
CN104735257A (zh) 信息快捷回复方法和系统
CN104954867A (zh) 媒体播放方法及装置
CN105391562A (zh) 一种群聊装置、方法及移动终端
CN104766604A (zh) 语音数据的标记方法及装置
CN104809221A (zh) 音乐信息的推荐方法及装置
CN104850799A (zh) 一种隐藏移动终端中的数据的方法及移动终端
CN104850325A (zh) 移动终端应用处理方法及装置
CN104968033A (zh) 终端网络处理方法及装置
CN104811865A (zh) 音频输出方法、装置和系统
CN105353947A (zh) 一种移动终端及控制应用显示内容的方法
CN105245725A (zh) 一种场景闹钟的实现装置、方法及移动终端
CN105049612A (zh) 一种实现录音的方法和装置
CN105261054A (zh) 一种合成有声gif图片的装置和方法
CN104980576A (zh) 移动终端自动提取号码的方法及装置
CN104780278A (zh) 基于通信数据的路线生成方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination