CN107729315A - 音频文件的显示方法、终端和计算机存储介质 - Google Patents
音频文件的显示方法、终端和计算机存储介质 Download PDFInfo
- Publication number
- CN107729315A CN107729315A CN201710915976.5A CN201710915976A CN107729315A CN 107729315 A CN107729315 A CN 107729315A CN 201710915976 A CN201710915976 A CN 201710915976A CN 107729315 A CN107729315 A CN 107729315A
- Authority
- CN
- China
- Prior art keywords
- audio file
- audio
- display
- character string
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 12
- 230000007613 environmental effect Effects 0.000 claims description 11
- 230000036651 mood Effects 0.000 claims description 9
- 230000001960 triggered effect Effects 0.000 claims description 6
- 239000000725 suspension Substances 0.000 claims description 3
- 230000006870 function Effects 0.000 description 14
- 230000006854 communication Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000007667 floating Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 206010001488 Aggression Diseases 0.000 description 1
- 206010016275 Fear Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Psychiatry (AREA)
- Hospice & Palliative Care (AREA)
- Child & Adolescent Psychology (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了一种音频文件的显示方法,包括以下步骤:当终端接收到音频文件时,判断是否已开启音频预览模式;若已开启音频预览模式,则将所述音频文件转化为对应字符序列;将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览。本发明还公开了一种终端和计算机可读存储介质。本发明旨在通过将音频文件自动地转化为字符序列并显示以供用户的预览,实现了用户音频文件的预览的便捷性。
Description
技术领域
本发明涉及通信技术领域,尤其涉及音频文件的显示方法、终端和计算机存储介质。
背景技术
现在的终端大多支持音频文件的保存发送,即时通信应用都支持音频信息的发送。
音频文件输入便捷输入的同时还会给读取带来不便,比如,音频文件(如录音,音频信息)的查看费时,传播信息效率不高,有时候音频存在一些时间没有记录到有用的信息。在微信的聊天时,有时候群聊时音频很多,不想一条一条打开查看,但又害怕错失重要内容,如何才能平衡音频文件输入便捷与读取不便的矛盾是目前亟待解决的技术问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种音频文件的显示方法、终端和计算机存储介质,旨在通过将音频文件自动地转化为字符序列并显示以供用户的预览,实现了用户音频文件的预览的便捷性。
为实现上述目的,本发明提供一种音频文件的显示方法,所述音频文件的显示方法包括以下步骤:
当终端接收到音频文件时,判断是否已开启音频预览模式;
若已开启音频预览模式,则将所述音频文件转化为对应字符序列;
将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览。
可选地,所述若已开启音频预览模式,则将所述音频文件转化为对应字符序列的步骤包括:
若已开启音频预览模式,则识别所述音频文件的类型,以判断所述音频文件类型是否为音乐类型;
若所述音频文件类型是音乐类型,则识别所述音频文件得到对应的音乐信息;
若所述音频文件类型不是音乐类型,则将所述音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列。
可选地,所述若所述音频文件类型不是音乐类型,则将所述音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列的步骤之后,包括:
将音频文件进行音频分析,并基于音频分析的结果划分音频文件级别;
所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤包括:
根据音频文件等级获取预置显示标识,将所述显示标识赋予音频文件对应的字符序列,以在字符序列显示时根据显示标识确定音频文件录制者对应的情绪。
可选地,所述若已开启音频预览模式,则将所述音频文件转化为对应字符序列的步骤还包括:
若已开启音频预览模式,则识别所述音频文件,以判断所述音频文件是否包含预设敏感字;
若所述音频文件包含预设敏感字,则将所述音频文件按预设转化方式进行部分转化得到对应的字符序列。
可选地,所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤包括:
若所述音频文件来源于即时通讯应用,则在所述即时通讯应用聊天界面上生成悬浮的单行文本框;
判断字符序列的数量是否超过阈值,其中,所述阈值为单行文本框中的最大的字符显示数量;
若字符序列的数量超过阈值,则将字符序列在单行文本框中滑动显示,以供用户进行音频预览。
可选地,所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤之后,包括:
基于用户对所述音频文件的播放操作触发环境噪音的检测指令,检测并确定环境噪音的音频大小;
根据所述音频大小调整所述音频文件的播放音量,以使音频文件的播放符合用户需求。
可选地,所述当终端接收到音频文件时,判断是否已开启音频预览模式的步骤之后,包括:
若没有开启音频预览模式,则获取终端当前铃声的设置状态,以根据终端当前铃声的设置状态,判断是否自动开启音频预览模式。
可选地,所述若已开启音频预览模式,则将所述音频文件转化为对应字符序列的步骤包括:
若已开启音频预览模式,则获取终端的界面语言,并判断所述界面语言与所述音频文件的音频语言是否相同;
若所述界面语言与所述音频文件的音频语言不同,则将所述音频文件转化为界面语言对应的字符序列。
为实现上述目的,本发明还提供一种终端,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音频文件的显示程序,其中:
所述音频文件的显示程序被所述处理器执行时实现如上述的音频文件的显示方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机存储介质,所述计算机存储介质上存储有音频文件的显示程序,所述音频文件的显示程序被处理器执行时实现如上述的音频文件的显示方法的步骤。
本发明实施例提出的一种音频文件的显示方法,在终端接收到音频文件时,终端确实是否已开启音频预览模式;若已开启音频预览模式,则将所述音频文件转化为对应字符序列;将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览。通过在终端上设置音频预览模式,将终端接收到的音频文件进行分析,音频文件分析的维度包括:音频文件类型分析(是否为音乐类型,若是音乐类型则识别音频信息得到音乐的演唱者,歌曲名称等)、音频文件中包含的敏感词汇分析(是否包含不文明的话语/关键词,预览时进行屏蔽或者突出显示)、音频文件的语言分析(如,是否为中文译汉字,或者为英文译汉字)、音频文件的来源分析(根据音频文件来源,设置不同的显示方式)等,本发明中从各个角度实现音频文件的分析,无需用户进行多余的设置,就可以实现音频文件的显示预览,使用户的音频文件预览更加便捷,提高了用户的体验。
附图说明
图1为实现本发明各个实施例一种终端的硬件结构示意图;
图2为本发明实施例提供的一种通信网络系统架构图;
图3为本发明音频文件的显示方法第一实施例的流程示意图;
图4为图2中音频文件的显示方法的步骤S20的第一细化流程示意图;
图5为图2中音频文件的显示方法的步骤S20的第二细化流程示意图;
图6为图2中音频文件的显示方法的步骤S20的第三细化流程示意图;
图7为图2中音频文件的显示方法的步骤S20的第四细化流程示意图;
图8为本发明音频文件的显示方法第二实施例的流程示意图;
图9为本发明音频文件的显示方法第三实施例的流程示意图;
图10为本发明音频文件的显示方法第一实施例的具体场景示意图;
图11为本发明音频文件的显示方法第二实施例的具体场景示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
请参阅图1,其为实现本发明各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(Radio Frequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对移动终端的各个部件进行具体的介绍:
射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将基站的下行信息接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(CodeDivision Multiple Access 2000,码分多址2000)、WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)、TD-SCDMA(Time Division-Synchronous CodeDivision Multiple Access,时分同步码分多址)、FDD-LTE(Frequency DivisionDuplexing-Long Term Evolution,频分双工长期演进)和TDD-LTE(Time DivisionDuplexing-Long Term Evolution,分时双工长期演进)等。
WiFi属于短距离无线传输技术,移动终端通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块102,但是可以理解的是,其并不属于移动终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、记录模式、音频识别模式、广播接收模式等等模式下时,将射频单元101或WiFi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。
A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、音频识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(音频)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。
用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。
进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部装置之间传输数据。
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
此外,在图1所示的终端中,所述存储器109上存储有在所述处理器110上运行的音频文件的显示程序,所述终端通过处理器110调用存储器109中存储的音频文件的显示程序,并执行以下操作:
当终端接收到音频文件时,判断是否已开启音频预览模式;
若已开启音频预览模式,则将所述音频文件转化为对应字符序列;
将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览。
进一步地,所述终端通过处理器110调用存储器109中存储的音频文件的显示程序,以进行音频文件是否为音乐类型识别的步骤:
若已开启音频预览模式,则识别所述音频文件的类型,以判断所述音频文件类型是否为音乐类型;
若所述音频文件类型是音乐类型,则识别所述音频文件得到对应的音乐信息;
若所述音频文件类型不是音乐类型,则将所述音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列。
进一步地,所述若所述音频文件类型不是音乐类型,则将所述音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列的步骤之后,所述终端通过处理器110调用存储器109中存储的音频文件的显示程序,将音频文件进行音频分析,并基于音频分析的结果划分音频文件级别,以实现根据音频文件级别,将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤:
根据音频文件等级获取预置显示标识,将所述显示标识赋予音频文件对应的字符序列,以在字符序列显示时根据显示标识确定音频文件录制者对应的情绪。
进一步地,所述终端通过处理器110调用存储器109中存储的音频文件的显示程序,所述若已开启音频预览模式,则将所述音频文件转化为对应字符序列以实现以下步骤:
若已开启音频预览模式,则识别所述音频文件,以判断所述音频文件是否包含预设敏感字;
若所述音频文件包含预设敏感字,则将所述音频文件按预设转化方式进行部分转化得到对应的字符序列。
进一步地,所述终端通过处理器110调用存储器109中存储的音频文件的显示程序,所述若已开启音频预览模式,则将所述音频文件转化为对应字符序列以实现以下步骤:
若已开启音频预览模式,则获取终端的界面语言,并判断所述界面语言与所述音频文件的音频语言是否相同;
若所述界面语言与所述音频文件的音频语言不同,则将所述音频文件转化为界面语言对应的字符序列。
进一步地,所述终端通过处理器110调用存储器109中存储的音频文件的显示程序,所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览以实现以下步骤:
若所述音频文件来源于即时通讯应用,则在所述即时通讯应用聊天界面上生成悬浮的单行文本框;
判断字符序列的数量是否超过阈值,其中,所述阈值为单行文本框中的最大的字符显示数量;
若字符序列的数量超过阈值,则将字符序列在单行文本框中滑动显示,以供用户进行音频预览。
进一步地,所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤之后,所述终端通过处理器110调用存储器109中存储的音频文件的显示程序,以实现以下步骤:
基于用户对所述音频文件的播放操作触发环境噪音的检测指令,检测并确定环境噪音的音频大小;
根据所述音频大小调整所述音频文件的播放音量,以使音频文件的播放符合用户需求。
进一步地,所述当终端接收到音频文件时,判断是否已开启音频预览模式的步骤之后,所述终端通过处理器110调用存储器109中存储的音频文件的显示程序,以实现以下步骤:
若没有开启音频预览模式,则获取终端当前铃声的设置状态,以根据终端当前铃声的设置状态,判断是否自动开启音频预览模式。
移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。
为了便于理解本发明实施例,下面对本发明的移动终端所基于的通信网络系统进行描述。
请参阅图2,图2为本发明实施例提供的一种通信网络系统架构图,该通信网络系统为通用移动通信技术的LTE系统,该LTE系统包括依次通讯连接的UE(User Equipment,用户设备)201,E-UTRAN(Evolved UMTS Terrestrial Radio Access Network,演进式UMTS陆地无线接入网)202,EPC(Evolved Packet Core,演进式分组核心网)203和运营商的IP业务204。
具体地,UE201可以是上述终端100,此处不再赘述。
E-UTRAN202包括eNodeB2021和其它eNodeB2022等。其中,eNodeB2021可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接,eNodeB2021连接到EPC203,eNodeB2021可以提供UE201到EPC203的接入。
EPC203可以包括MME(Mobility Management Entity,移动性管理实体)2031,HSS(Home Subscriber Server,归属用户服务器)2032,其它MME2033,SGW(Serving Gate Way,服务网关)2034,PGW(PDN Gate Way,分组数据网络网关)2035和PCRF(Policy andCharging Rules Function,政策和资费功能实体)2036等。其中,MME2031是处理UE201和EPC203之间信令的控制节点,提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸如归属位置寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过SGW2034进行发送,PGW2035可以提供UE 201的IP地址分配以及其它功能,PCRF2036是业务数据流和IP承载资源的策略与计费控制策略决策点,它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。
IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem,IP多媒体子系统)或其它IP业务等。
虽然上述以LTE系统为例进行了介绍,但本领域技术人员应当知晓,本发明不仅仅适用于LTE系统,也可以适用于其他无线通信系统,例如GSM、CDMA2000、WCDMA、TD-SCDMA以及未来新的网络系统等,此处不做限定。
基于上述移动终端硬件结构以及通信网络系统,提出本发明方法各个实施例。
基于上述终端硬件结构以及通信网络系统,提出本发明音频文件的显示方法的各个实施例。
本发明提供一种音频文件的显示方法。
在本实施例中,所述音频文件的显示方法可选应用于终端中,所述终端可选为图1中所述的移动终端,所述音频文件的显示方法包括:
当终端接收到音频文件时,判断是否已开启音频预览模式;
若已开启音频预览模式,则将所述音频文件转化为对应字符序列;
将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览。
在本实施例中,终端开启音频预览模式,终端将接收到的音频文件转换为对应的字符序列,并按照不同的显示方式进行显示输出,具体地,终端将别人发送的语音或用户自己的录音自动音频信息转化文字,并按照设定的显示方式进行显示,例如,微信的聊天界面接收到音频文件,终端将音频文件转换的汉子并在文本框中单行显示,当用户打开该聊天界面,文字开始从右到左滑动,这样的方式可以减少语音无用录音时间的信息传播浪费的时间,同时也让用户大致了解语音信息的内容,方便用户判断是否要打开该条语音。以此同时,用户可以通过左右滑动语音气泡或录音列表调节预览进度,如果语音或录音内容是一首歌或音乐将会预览到歌曲的名称,演唱者等信息,如果是一段脏话则可以对脏话词语进行xxxx的部分屏蔽;如果终端对音频文件分析,终端对关键的联系信息可以对关键字进行突出显示,这样的音频预览方式不仅可以提高音频信息的查看效率,还平衡音频文件输入便捷与读取不便的矛盾。
参照图3,图3为本发明音频文件的显示方法第一实施例的流程示意图。
本发明一种音频文件的显示方法的第一实施例中,所述音频文件的显示方法具体包括:
步骤S10,当终端接收到音频文件时,判断是否已开启音频预览模式。
在终端接收到音频文件时,终端确定音频文件的来源,即,终端接收到音频文件可能来源于:用户的录音、即时通讯应用上联系人发送的信息,如,腾讯QQ、微信上接收的语音信息、语音邮件、语音彩信等;终端根据音频信息的来源确定预览文件的显示方式。
终端判断是否开启音频预览模式,若没有开启音频预览模式,则确定用户是否授予终端音频预览模式自动开启的权限,在用户授予终端音频预览模式自动开启的权限,终端获取当前铃声的设置状态,并根据当前铃声的设置状态,判断是否自动开启音频预览模式,即,终端当前铃声的设置状态为震动、会议或者静音模式时,终端自动开启音频预览模式,若终端已开启音频预览模式,则执行以下步骤。
步骤S20,若已开启音频预览模式,则将所述音频文件转化为对应字符序列。
若终端已开启音频预览模式,则将所述音频文件转化为对应字符序列,具体地,终端将音频文件转化为对应字符序列的步骤中包含不同的实现方式,不同的实现方式可进行结合或者单独执行,以下为不同将音频文件转换为字符序列实现方式的举例说明:
方式一、终端判断音频文件的种类,即,终端接收到音频文件是否仅为语音,或者有其他的声音信息,根据终端接收音频文件中音频的具体情况,将音频文件划分为音乐类型或者非音乐类型,例如,终端判断所述音频文件类型是否为音乐类型,若所述音频文件类型是音乐类型,则识别所述音频文件得到对应的音乐信息,其中,音乐信息包含音乐名称、演唱者等信息;若所述音频文件类型不是音乐类型,则将所述音频文件进行识别得到对应的字符序列。
方式二、终端识别所述音频文件,判断所述音频文件是否包含预设敏感字(预设敏感字,根据具体的使用情况进行设置,可以包含金钱相关的字词或者其他重要信息,还可以包含粗话等);若所述音频文件包含预设敏感字,则将所述音频文件按预设转化方式进行部分转化得到对应的字符序列,预设的转换方式可以是部分的转换或者屏蔽的方式,根据敏感字的类型设置,若敏感字涉及都暴力,黄色,则将对应的音频文件中的信息进行屏蔽。
方式三、终端根据语言种类进行确定对应的转化方式,终端获取界面语言,并判断所述界面语言与所述音频文件的音频语言是否相同;若所述界面语言与所述音频文件的音频语言不同,则将所述音频文件转化为界面语言对应的字符序列。
步骤S30,将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览。
终端将字符序列按照预设的显示方式(预设显示方式:包括突出显示、或者按照特定的显示方式在指定的显示位置显示,或者在显示的字符序列中增加其他标识信息,参考图10,图10所示为音频文件转为文字序列的一种显示方式)进行显示,方便供用户进行音频预览。
预设的显示方式根据音频文件的来源设置,例如,终端根据音频文件的来源确定显示方式,若所述音频文件来源于即时通讯应用,则在所述即时通讯应用聊天界面上生成悬浮的单行文本框;判断字符序列的数量是否超过阈值,其中,所述阈值为单行文本框中的最大的字符显示数量;若字符序列的数量超过阈值,则将字符序列在单行文本框中滑动显示,以供用户进行音频预览,若所述音频文件来源于系统应用,或者短信邮件,则可以将字符序列进行全部的显示,或者按照音频信息的内容设置突出显示规则。
预设的显示方式根据音频文件的内容显示,音频文件中包含关键信息,可以将关键信息进行突出显示,如,您的135xxxx1598的电话话费余额不足,为了避免不必要的麻烦,请您及时进行缴费,为了防止用户错失信息,可以将“话费余额不足”,“请您及时进行缴费”进行突出显示。
在本实施例中本发明实施例提出的一种音频文件的显示方法,在终端接收到音频文件时,终端确实是否已开启音频预览模式;若已开启音频预览模式,则将所述音频文件转化为对应字符序列;将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览。通过在终端上设置音频预览模式,将终端接收到的音频文件进行分析,音频文件分析的维度包括:音频文件类型分析、音频文件中包含的敏感词汇分析、音频文件的语言分析、音频文件的来源分析等,本发明中从各个角度实现音频文件的分析,无需用户进行多余的设置,就可以实现音频文件的显示预览,使用户的音频文件预览更加便捷,提高了用户的体验。
进一步的,参照图4,本发明音频文件的显示方法的第二实施例是在第一实施例的基础上提出的,本实施例是步骤S20的细化,在确定终端开启音频预览模式后,对音频文件进行分析,并转化为对应字符序列。
具体地,在本发明音频文件的显示方法中,将音频文件转换为对应字符序列包括以下方式:
参照图4,方式一:终端将音频文件是否为音乐类型,音乐类型其他的音频类型的区别在于音色、声调、声纹等的音频信息不同,即,音乐类型中包含乐器,节奏等;终端确定音频文件的类型是否为音乐类型,并进行对应的显示。具体地,
步骤S21,若已开启音频预览模式,则识别所述音频文件的类型,以判断所述音频文件类型是否为音乐类型;
步骤S22,若所述音频文件类型是音乐类型,则识别所述音频文件得到对应的音乐信息;
步骤S23,若所述音频文件类型不是音乐类型,则将所述音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列。
终端已开启音频预览模式,则识别所述音频文件的类型(终端识别音频文件的方式多种多样,即,终端将音频信息转换为字符序列,并查询预置字符数据库进行识别,或者终端进入预置音频数据库直接进行音频的匹配),以判断所述音频文件类型是否为音乐类型,音乐类型可以是歌曲、伴奏、交响乐等;若所述音频文件类型是音乐类型,则识别所述音频文件得到对应的音乐信息,具体地,音乐信息包括:歌词、曲谱,词曲的名称,演唱或者伴奏者姓名、歌曲的演出时间等信息。
若所述音频文件类型不是音乐类型,则将所述音频文件利用语音识别技术(语音识别技术是通过识别和理解过程把语音信号转变为相应的文本或命令的技术),例如,终端对音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列,即,字符序列可以是汉字、拼音、英文、符号、公式等。
在本实施例中终端根据音频文件中声音种类,将音频文件划分为音乐类型或者非音乐类型,若音频文件是音频类型,则识别出对应的音乐信息,用户可以在预览时获取音频文件的音乐信息,提高用户的预览效率。
参照图5,所述若所述音频文件类型不是音乐类型,则将所述音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列的步骤之后,包括:
步骤S24,将音频文件进行音频分析,并基于音频分析的结果划分音频文件级别;
步骤S25,根据音频文件等级获取预置显示标识,将所述显示标识赋予音频文件对应的字符序列,以在字符序列显示时根据显示标识确定音频文件录制者对应的情绪。
将音频文件进行音频分析,其中音频分析包括且不仅限于:音色、声调、频率响度、振幅,并基于音频分析的结果划分音频文件级别,即,根据音频文件的音频分析将音频文件划分等级;并根据音频文件等级获取预置显示标识,将所述显示标识赋予音频文件对应的字符序列,以在字符序列显示时根据显示标识确定音频文件录制者对应的情绪。即,音频文件的分析结果将音频划分为第一等级、第二等级和第三等级,其中,第一等级、第二等级和第三等级分别代表平和、焦急、愤怒,并根据音频等级赋予不同的标识,以使用户通过标识识别音频信息录制者的情绪,例如,终端接收到微信的联系人发送的音频文件,在音频分析后音频文件符合第三等级,则将转换的字符序列用红色显示,用户在预览时根据显示标识判断录制者的情绪,以进行相关的处理。
在本实施例中终端将音频文件进行音频分析,并将音频文件转换成的字符序列赋予对应的显示标识,用户可以直观地确定录制者的情绪,这样的终端字符序列的显示方式更加智能。
参照图6,方式二,终端对音频文件的内容进行分析,并根据音频的内容进行音频文件的转换或者显示,具体地;
步骤S26,若已开启音频预览模式,则识别所述音频文件,以判断所述音频文件是否包含预设敏感字;
步骤S27,若所述音频文件包含预设敏感字,则将所述音频文件按预设转化方式进行部分转化得到对应的字符序列。
若终端已开启音频预览模式,则识别所述音频文件,以判断所述音频文件是否包含预设敏感字,其中,预置敏感字可以根据具体情况设置,包括但不仅限于:粗话、脏话、或者金钱相关的字;若所述音频文件包含预设敏感字,则将所述音频文件按预设转化方式(预设转化方式:可以是音频文件的部分转换、或者是用特定的字符序列代替预设敏感字等的方式)进行部分转化得到对应的字符序列,具体地,音频文件中包含粗话时,可以将音频文件按预设转化方式进行部分转化得到对应的字符序列,例如,音频文件中包含脏话,可以将脏话部分屏蔽。
在本实施例中通过对音频文件的内容分析设置对应的转换方式,在提高用户语音预览效率的同时,保障用户不会接收到骚扰信息,不会遗漏关键信息,使得用户的体验更高。
参照图7,方式三,终端基于音频文件的语种和界面信息的显示语种进行比较,确定对应的音频文件转换种类,具体地,
步骤S28,若已开启音频预览模式,则获取终端的界面语言,并判断所述界面语言与所述音频文件的音频语言是否相同;
步骤S29,若所述界面语言与所述音频文件的音频语言不同,则将所述音频文件转化为界面语言对应的字符序列。
若终端已开启音频预览模式,则获取终端的界面语言,并判断所述界面语言与所述音频文件的音频语言是否相同;例如,终端界面显示中文汉字,音频文件中为英文,则所述界面语言与所述音频文件的音频语言不同,需要确定将音频文件转换为界面语言对应的文字种类,若所述界面语言与所述音频文件的音频语言相同,则将所述音频文件转化为对应字符序列;若所述界面语言与所述音频文件的音频语言不同,则将所述音频文件转化为界面语言对应的字符序列,即,终端可以将英文音频,转换为中文汉字。
在本实施例中通过将音频文件中的音频语言与对终端显示界面语言进行比对,将音频文件翻译为对应的字符序列,更加方便用户的预览;需要补充说明的是本实施例中的实现方式可以进行结合或者选择,本发明音频文件的显示方法中,将音频文件转换为对应字符序列的方式包括但不仅限于以上三种显示方式。
进一步的,参照图8,本发明音频文件的显示方法的第三实施例中,本实施例是在所述音频文件的显示方法包括:
步骤S31,若所述音频文件来源于即时通讯应用,则在所述即时通讯应用聊天界面上生成悬浮的单行文本框。
步骤S32,判断字符序列的数量是否超过阈值,其中,所述阈值为单行文本框中的最大的字符显示数量。
步骤S33,若字符序列的数量超过阈值,则将字符序列在单行文本框中滑动显示,以供用户进行音频预览。
若所述音频文件来源于即时通讯应用,音频文件的来源分为录音文件、语音邮件,语音信息、即时通讯应用等,基于即时通讯应用的聊天界面中可能包含多个联系人发送的多条音频文件,则在所述即时通讯应用聊天界面上生成悬浮的单行文本框,并判断字符序列的数量是否超过阈值,其中,所述阈值为单行文本框中的最大的字符显示数量,若字符序列的数量超过阈值,则将字符序列在单行文本框中滑动显示,结合图11,在图11中微信聊天界面中音频文件转换为字符序列的一种显示方式,以供用户进行音频预览。
例如,微信群聊中,不同的群成员在界面上发送语音,若语音进行转换全部显示,当语音较长时,聊天界面上的显示信息条数较少,并不能提高用户语音预览的效率,以此将当用户打开该聊天界面,文字开始从右到左滑动,这样的方式可以减少语音无用录音时间的信息传播浪费的时间,同时也让用户大致了解语音信息的内容,方便他们判断是否要打开该条语音,依次同时,用户可以调整显示的位置。
在本实施例中针对即时通信应用中接收到的音频文件,显示方式进行了说明,通过单行文本框滑动显示的方式,可以加快用户的语音预览效率。
进一步的,参照图9,本发明一种音频文件的显示方法的第四实施例中,所述音频文件的显示方法包括:
步骤S40,基于用户对所述音频文件的播放操作触发环境噪音的检测指令,检测并确定环境噪音的音频大小。
步骤S50,根据所述音频大小调整所述音频文件的播放音量,以使音频文件的播放符合用户需求。
基于用户对所述音频文件的播放操作触发环境噪音的检测指令,即,用户播放音频文件时,触发终端检测环境噪音的检测指令,终端检测并确定环境噪音的音频大小,根据所述音频大小调整所述音频文件的播放音量,以使音频文件的播放符合用户需求。例如,用户点击播放语音,终端检测环境噪声,使播放的音频文件跟环境适应,用户在会议状态,环境噪声较低,用户播放时,终端将以较低的音量进行播放。
在本实施例中在音频文件的播放中根据环境音量智能地调整终端播放音量的大小,使终端的音频播放更加智能,在公共场合不会出现用户播放音频文件,声音过大影响其他人,或者声音较小,用户听不清楚的情况。
此外,本发明实施例还提出一种计算机存储介质。
所述计算机存储介质上存储有音频文件的显示程序,所述音频文件的显示程序被处理器执行时实现音频文件的显示如下操作:
当终端接收到音频文件时,判断是否已开启音频预览模式;
若已开启音频预览模式,则将所述音频文件转化为对应字符序列;
将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览。
进一步地,所述音频文件的显示程序被处理器执行时还实现如下操作:
若已开启音频预览模式,则识别所述音频文件的类型,以判断所述音频文件类型是否为音乐类型;
若所述音频文件类型是音乐类型,则识别所述音频文件得到对应的音乐信息;
若所述音频文件类型不是音乐类型,则将所述音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列。
进一步地,所述音频文件的显示程序被处理器执行时还实现如下操作:
所述若所述音频文件类型不是音乐类型,则将所述音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列的步骤之后,包括:
将音频文件进行音频分析,并基于音频分析的结果划分音频文件级别;
所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤包括:
根据音频文件等级获取预置显示标识,将所述显示标识赋予音频文件对应的字符序列,以在字符序列显示时根据显示标识确定音频文件录制者对应的情绪。
进一步地,所述音频文件的显示程序被处理器执行时还实现如下操作:
所述若已开启音频预览模式,则将所述音频文件转化为对应字符序列的步骤还包括:
若已开启音频预览模式,则识别所述音频文件,以判断所述音频文件是否包含预设敏感字;
若所述音频文件包含预设敏感字,则将所述音频文件按预设转化方式进行部分转化得到对应的字符序列。
进一步地,所述音频文件的显示程序被处理器执行时还实现如下操作:
所述若已开启音频预览模式,则将所述音频文件转化为对应字符序列的步骤包括:
若已开启音频预览模式,则获取终端的界面语言,并判断所述界面语言与所述音频文件的音频语言是否相同;
若所述界面语言与所述音频文件的音频语言不同,则将所述音频文件转化为界面语言对应的字符序列。
进一步地,所述音频文件的显示程序被处理器执行时还实现如下操作:
所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤包括:
若所述音频文件来源于即时通讯应用,则在所述即时通讯应用聊天界面上生成悬浮的单行文本框;
判断字符序列的数量是否超过阈值,其中,所述阈值为单行文本框中的最大的字符显示数量;
若字符序列的数量超过阈值,则将字符序列在单行文本框中滑动显示,以供用户进行音频预览。
进一步地,所述音频文件的显示程序被处理器执行时还实现如下操作:
所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤之后,包括:
基于用户对所述音频文件的播放操作触发环境噪音的检测指令,检测并确定环境噪音的音频大小;
根据所述音频大小调整所述音频文件的播放音量,以使音频文件的播放符合用户需求。
进一步地,所述音频文件的显示程序被处理器执行时还实现如下操作:
所述当终端接收到音频文件时,判断是否已开启音频预览模式的步骤之后,包括:
若没有开启音频预览模式,则获取终端当前铃声的设置状态,以根据终端当前铃声的设置状态,判断是否自动开启音频预览模式。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种音频文件的显示方法,其特征在于,所述音频文件的显示方法包括以下步骤:
当终端接收到音频文件时,判断是否已开启音频预览模式;
若已开启音频预览模式,则将所述音频文件转化为对应字符序列;
将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览。
2.如权利要求1所述的音频文件的显示方法,其特征在于,所述若已开启音频预览模式,则将所述音频文件转化为对应字符序列的步骤包括:
若已开启音频预览模式,则识别所述音频文件的类型,以判断所述音频文件类型是否为音乐类型;
若所述音频文件类型是音乐类型,则识别所述音频文件得到对应的音乐信息;
若所述音频文件类型不是音乐类型,则将所述音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列。
3.如权利要求2所述的音频文件的显示方法,其特征在于,所述若所述音频文件类型不是音乐类型,则将所述音频文件进行语音识别和语义识别,将所述音频文件转化为对应的字符序列的步骤之后,包括:
将音频文件进行音频分析,并基于音频分析的结果划分音频文件级别;
所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤包括:
根据音频文件等级获取预置显示标识,将所述显示标识赋予音频文件对应的字符序列,以在字符序列显示时根据显示标识确定音频文件录制者对应的情绪。
4.如权利要求1所述的音频文件的显示方法,其特征在于,所述若已开启音频预览模式,则将所述音频文件转化为对应字符序列的步骤还包括:
若已开启音频预览模式,则识别所述音频文件,以判断所述音频文件是否包含预设敏感字;
若所述音频文件包含预设敏感字,则将所述音频文件按预设转化方式进行部分转化得到对应的字符序列。
5.根据权利要求1所述的音频文件的显示方法,其特征在于,所述若已开启音频预览模式,则将所述音频文件转化为对应字符序列的步骤包括:
若已开启音频预览模式,则获取终端的界面语言,并判断所述界面语言与所述音频文件的音频语言是否相同;
若所述界面语言与所述音频文件的音频语言不同,则将所述音频文件转化为界面语言对应的字符序列。
6.如权利要求1至5任意一项所述的音频文件的显示方法,其特征在于,所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤包括:
若所述音频文件来源于即时通讯应用,则在所述即时通讯应用聊天界面上生成悬浮的单行文本框;
判断字符序列的数量是否超过阈值,其中,所述阈值为单行文本框中的最大的字符显示数量;
若字符序列的数量超过阈值,则将字符序列在单行文本框中滑动显示,以供用户进行音频预览。
7.如权利要求1所述的音频文件的显示方法,其特征在于,所述将所述字符序列按预设显示方式在终端显示界面进行显示,以供用户进行音频预览的步骤之后,包括:
基于用户对所述音频文件的播放操作触发环境噪音的检测指令,检测并确定环境噪音的音频大小;
根据所述音频大小调整所述音频文件的播放音量,以使音频文件的播放符合用户需求。
8.根据权利要求1所述的音频文件的显示方法,其特征在于,所述当终端接收到音频文件时,判断是否已开启音频预览模式的步骤之后,包括:
若没有开启音频预览模式,则获取终端当前铃声的设置状态,以根据终端当前铃声的设置状态,判断是否自动开启音频预览模式。
9.一种终端,其特征在于,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音频文件的显示程序,其中:
所述音频文件的显示程序被所述处理器执行时实现如权利要求1至8中任一项所述的音频文件的显示方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有音频文件的显示程序,所述音频文件的显示程序被处理器执行时实现如权利要求1至8中任一项所述的音频文件的显示方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710915976.5A CN107729315A (zh) | 2017-09-28 | 2017-09-28 | 音频文件的显示方法、终端和计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710915976.5A CN107729315A (zh) | 2017-09-28 | 2017-09-28 | 音频文件的显示方法、终端和计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107729315A true CN107729315A (zh) | 2018-02-23 |
Family
ID=61209529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710915976.5A Pending CN107729315A (zh) | 2017-09-28 | 2017-09-28 | 音频文件的显示方法、终端和计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107729315A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108595422A (zh) * | 2018-04-13 | 2018-09-28 | 卓望信息技术(北京)有限公司 | 一种过滤不良彩信的方法 |
CN110636175A (zh) * | 2019-10-18 | 2019-12-31 | 深圳传音控股股份有限公司 | 通讯录制方法、终端设备及计算机可读存储介质 |
CN111768805A (zh) * | 2020-06-30 | 2020-10-13 | 深圳传音控股股份有限公司 | 录音文件的管理方法、终端设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010016815A1 (en) * | 1997-06-06 | 2001-08-23 | Hidetaka Takahashi | Voice recognition apparatus and recording medium having voice recognition program recorded therein |
CN104317787A (zh) * | 2014-10-23 | 2015-01-28 | 迎新科技有限公司 | 即时通讯终端及其信息翻译方法和装置 |
CN104679729A (zh) * | 2015-02-13 | 2015-06-03 | 广州市讯飞樽鸿信息技术有限公司 | 录音留言有效性处理方法及系统 |
CN105528438A (zh) * | 2015-12-18 | 2016-04-27 | 大陆汽车投资(上海)有限公司 | 将电台广播中的音频内容可视化的方法 |
CN105609106A (zh) * | 2015-12-16 | 2016-05-25 | 魅族科技(中国)有限公司 | 记事文档生成方法和装置 |
CN106024014A (zh) * | 2016-05-24 | 2016-10-12 | 努比亚技术有限公司 | 一种语音转换方法、装置及移动终端 |
CN106375548A (zh) * | 2016-08-19 | 2017-02-01 | 深圳市金立通信设备有限公司 | 一种对语音信息处理的方法和终端 |
CN106462573A (zh) * | 2014-05-27 | 2017-02-22 | 微软技术许可有限责任公司 | 通话中翻译 |
CN107124352A (zh) * | 2017-05-26 | 2017-09-01 | 维沃移动通信有限公司 | 一种语音信息的处理方法及移动终端 |
-
2017
- 2017-09-28 CN CN201710915976.5A patent/CN107729315A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010016815A1 (en) * | 1997-06-06 | 2001-08-23 | Hidetaka Takahashi | Voice recognition apparatus and recording medium having voice recognition program recorded therein |
CN106462573A (zh) * | 2014-05-27 | 2017-02-22 | 微软技术许可有限责任公司 | 通话中翻译 |
CN104317787A (zh) * | 2014-10-23 | 2015-01-28 | 迎新科技有限公司 | 即时通讯终端及其信息翻译方法和装置 |
CN104679729A (zh) * | 2015-02-13 | 2015-06-03 | 广州市讯飞樽鸿信息技术有限公司 | 录音留言有效性处理方法及系统 |
CN105609106A (zh) * | 2015-12-16 | 2016-05-25 | 魅族科技(中国)有限公司 | 记事文档生成方法和装置 |
CN105528438A (zh) * | 2015-12-18 | 2016-04-27 | 大陆汽车投资(上海)有限公司 | 将电台广播中的音频内容可视化的方法 |
CN106024014A (zh) * | 2016-05-24 | 2016-10-12 | 努比亚技术有限公司 | 一种语音转换方法、装置及移动终端 |
CN106375548A (zh) * | 2016-08-19 | 2017-02-01 | 深圳市金立通信设备有限公司 | 一种对语音信息处理的方法和终端 |
CN107124352A (zh) * | 2017-05-26 | 2017-09-01 | 维沃移动通信有限公司 | 一种语音信息的处理方法及移动终端 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108595422A (zh) * | 2018-04-13 | 2018-09-28 | 卓望信息技术(北京)有限公司 | 一种过滤不良彩信的方法 |
CN110636175A (zh) * | 2019-10-18 | 2019-12-31 | 深圳传音控股股份有限公司 | 通讯录制方法、终端设备及计算机可读存储介质 |
CN111768805A (zh) * | 2020-06-30 | 2020-10-13 | 深圳传音控股股份有限公司 | 录音文件的管理方法、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108093123A (zh) | 一种消息通知处理方法、终端及计算机可读存储介质 | |
CN109462692A (zh) | 分屏显示操作方法、移动终端及计算机可读存储介质 | |
CN108536481A (zh) | 一种应用程序启动方法、移动终端及计算机存储介质 | |
CN108289244A (zh) | 视频字幕处理方法、移动终端及计算机可读存储介质 | |
CN108572764A (zh) | 一种文字输入控制方法、设备及计算机可读存储介质 | |
CN107517405A (zh) | 一种视频处理的方法、装置及计算机可读存储介质 | |
CN108492836A (zh) | 一种基于语音的搜索方法、移动终端及存储介质 | |
CN107659729A (zh) | 一种文件预览方法、装置及计算机可读存储介质 | |
CN107729115A (zh) | 一种显示方法、设备及计算机存储介质 | |
CN108418948A (zh) | 一种提醒方法、移动终端以及计算机存储介质 | |
CN108174236A (zh) | 一种媒体文件处理方法、服务器及移动终端 | |
CN108551520A (zh) | 一种语音搜索响应方法、设备及计算机可读存储介质 | |
CN107592415A (zh) | 语音发送方法、终端和计算机可读存储介质 | |
CN108307043A (zh) | 语音消息转换方法、移动终端及计算机可读存储介质 | |
CN107704828A (zh) | 阅读信息的展示方法、移动终端及计算机可读存储介质 | |
CN109840119A (zh) | 一种终端应用启动方法、终端及计算机可读存储介质 | |
CN108521500A (zh) | 一种语音场景控制方法、设备及计算机可读存储介质 | |
CN107403623A (zh) | 录音内容的保存方法、终端、云服务器及可读存储介质 | |
CN107688429A (zh) | 应用控件的管理方法、移动终端和计算机可读存储介质 | |
CN109584897A (zh) | 视频降噪方法、移动终端及计算机可读存储介质 | |
CN107729315A (zh) | 音频文件的显示方法、终端和计算机存储介质 | |
CN109117105A (zh) | 一种协同桌面交互调控方法、设备及计算机可读存储介质 | |
CN108762631A (zh) | 一种移动终端控制方法、移动终端及计算机可读存储介质 | |
CN108012029A (zh) | 一种信息处理方法、设备及计算机可读存储介质 | |
CN108572777A (zh) | 一种终端对象整理方法、终端及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180223 |
|
RJ01 | Rejection of invention patent application after publication |