CN111445929A - 一种语音信息处理方法及电子设备 - Google Patents

一种语音信息处理方法及电子设备 Download PDF

Info

Publication number
CN111445929A
CN111445929A CN202010172657.1A CN202010172657A CN111445929A CN 111445929 A CN111445929 A CN 111445929A CN 202010172657 A CN202010172657 A CN 202010172657A CN 111445929 A CN111445929 A CN 111445929A
Authority
CN
China
Prior art keywords
icon
voice
segment
voice information
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010172657.1A
Other languages
English (en)
Inventor
王春野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202010172657.1A priority Critical patent/CN111445929A/zh
Publication of CN111445929A publication Critical patent/CN111445929A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Child & Adolescent Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Abstract

本发明实施例提供了一种语音信息处理方法及电子设备,所述方法包括:依据预设分段参数将语音信息划分成多个语音分段;生成分段图标;在接收到对所述语音信息的编辑指令的情况下,显示排序后的各所述分段图标;接收用户对所述各分段图标中的目标分段图标的第一输入;响应于第一输入,以目标分段图标对应的语音分段为基准,对所述语音信息进行处理。本发明实施例提供的语音信息处理方法,用户可灵活地触发电子设备向语音信息中插入新增语音内容、删除语音信息中的语音分段或者对语音信息进行续播,操作便捷能够提升用户的使用体验。

Description

一种语音信息处理方法及电子设备
技术领域
本发明涉及通信技术领域,尤其涉及一种语音信息处理方法及电子设备。
背景技术
电子设备中安装的各种社交类应用程序为人与人之间的沟通提供各种便捷。目前,用户通过该社交类应用程序与对端用户进行语音信息交互过程中,在接听对端用户发送的语音信息时,若语音信息听到一半退出,欲收听剩余的语音内容时,需要从该语音信息的起始部分重新收听,耗时长且用户需重复收听部分语音内容,用户体验差。在输入向对端用户发送的语音信息时,若输入过程中漏掉了某些内容,需将当前所录制的语音信息删除,重新输入语音信息,操作繁琐。
可见,现有的语音信息处理方式无法便捷、灵活地对语音信息进行处理。
发明内容
本发明实施例提供一种语音信息处理方法及电子设备,以解决现有技术中存在的无法灵活、便捷地对语音信息进行处理的问题。
为了解决上述技术问题,本发明实施例是这样实现的:
第一方面,本发明实施例提供了一种语音信息处理方法,应用于电子设备,所述方法包括:依据预设分段参数将语音信息划分成多个语音分段;生成分段图标,所述分段图标用于指示所述语音分段;在接收到对所述语音信息的编辑指令的情况下,显示排序后的各所述分段图标;其中,各所述分段图标按照所对应的各语音分段在所述语音信息中的位置进行排序;接收用户对所述各分段图标中的目标分段图标的第一输入;响应于所述第一输入,以所述目标分段图标对应的语音分段为基准,对所述语音信息进行处理。
第二方面,本发明实施例提供了一种电子设备,其中,所述电子设备包括:划分模块,用于依据预设分段参数将语音信息划分成多个语音分段;生成模块,用于生成分段图标,所述分段图标用于指示所述语音分段;显示模块,用于在接收到对所述语音信息的编辑指令的情况下,显示排序后的各所述分段图标;其中,各所述分段图标按照所对应的各语音分段在所述语音信息中的位置进行排序;接收模块,用于接收用户对所述各分段图标中的目标分段图标的第一输入;处理模块,用于响应于所述第一输入,以所述目标分段图标对应的语音分段为基准,对所述语音信息进行处理。
第三方面,本发明实施例提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述语音信息处理方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述语音信息处理方法的步骤。
在本发明实施例中,通过依据预设分段参数将语音信息划分成多个语音分段;生成分段图标;在接收到对语音信息的编辑指令的情况下,显示排序后的各分段图标;接收用户对各分段图标中的目标分段图标的第一输入;响应于第一输入,以目标分段图标对应的语音分段为基准,对语音信息进行处理,用户可灵活地触发电子设备向语音信息中插入新增语音内容、删除语音信息中的语音分段或者对语音信息进行续播等,操作便捷能够提升用户的使用体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种语音信息处理方法的步骤流程图;
图2是分段图标显示示意图;
图3是本发明实施例提供的又一种语音信息处理方法的步骤流程图;
图4是本发明实施例提供的另一种语音信息处理方法的步骤流程图;
图5是本发明实施例提供的一种电子设备的结构框图;
图6是本发明实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
在本发明的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
参照图1,示出了本发明实施例的一种语音信息处理方法的步骤流程图。
本发明实施例的语音信息处理方法包括以下步骤:
步骤101:依据预设分段参数将语音信息划分成多个语音分段。
语音信息可以为待发送的语音信息,也可以接收到的未播放完成的语音信息。语音信息的类型不同则其对应的预设分段参数不同。
当语音信息为待发送的语音信息时,预设分段参数可以为语音信息输入过程中用户的语气、语调等参数,当语音信息为未播放完成的语音信息时,预设分段参数可以为结束播放时所对应的播放时长、结束句柄等参数。
步骤102:生成分段图标。
通过预设分段参数可将语音信息划分成多个语音分段,每个语音分段对应一个分段图标。
各分段图标可通过不同形状、不同颜色或者不同标号进行区分。
步骤103:在接收到对语音信息的编辑指令时,显示排序后的各分段图标。
其中,各分段图标按照所对应的各语音分段在语音信息中的位置进行排序。
每个分段图标对应一个语音分段,按照时间先后顺序对语音分段进行排序时,每个语音分段在排序中的位置不同,基于各语音分段在排序中的位置,可将各语音分段对应的分段图标按照时间先后进行排序。
语音信息停止录制或者播放后,电子设备在界面中显示语音信息处理选项,其中,语音信息处理选项中可以包括但不限于:编辑、取消或者转文字等处理项。当接收到用户对语音信息的编辑指令时,电子设备将各分段图标进行排序后显示。
将各分段图标按照时间先后排序后显示,便于用户依据分段图标在排序中的位置粗略定位目标语音分段在语音信息中的位置。
假设:语音信息被划分为A、B以及C三个语音分段,电子设备分别为三个语音分段生成的分段图标为第一矩形、第二矩形以及第三矩形,三个语音分段的先后排序为A、B以及C,则在电子设备界面中显示依次排列的第一矩形、第二矩形以及第三矩形。第一矩形、第二矩形以及第三矩形可以为不同颜色长度相同的三个矩形,也可以为相同颜色长度不同的三个矩形,还可以为长度颜色均相同但标号不同的三个矩形。
一种示例性地分段图标显示方法如附图2所示,附图2中通过长度相同不同填充的N个矩形表示N个分段图标,且每个分段图标具有唯一标号。
步骤104:接收用户对各分段图标中的目标分段图标的第一输入。
第一输入可以为对目标分段图标的单击操作、双击操作或者长按操作等,本发明实施例中对第一输入所对应的具体操作不做具体限制。
语音信息类型不同,则第一输入触发电子设备执行的具体操作不同。
步骤105:响应于第一输入,以目标分段图标对应的语音分段为基准,对语音信息进行处理。
第一输入可以为触发电子设备续播语音信息的输入指令,也可以为触发电子设备在已录制但未发送的语音信息中插入或者删除语音分段的输入指令等。
第一输入所对应的具体指令不同,电子设备依据第一输入对语音信息的处理不同,但均以目标分段图标对应的语音分段为基准对语音信息进行处理,无需从语音信息的开头进行处理或者重新录制语音信息,便于用户对语音信息进行灵活处理。
本发明实施例提供的语音信息处理方法,通过依据预设分段参数将语音信息划分成多个语音分段;生成分段图标;在接收到对语音信息的编辑指令的情况下,显示排序后的各分段图标;接收用户对各分段图标中目标分段图标的第一输入;响应于第一输入,以目标分段图标对应的语音分段为基准,对语音信息进行处理,用户可灵活地触发电子设备向语音信息中插入新增语音内容、删除语音信息中的语音分段或者对语音信息进行续播,操作便捷能够提升用户的使用体验。
参照图3,示出了本发明实施例的一种语音信息处理方法的步骤流程图。
本发明实施例的语音信息处理方法应用于电子设备,包括以下步骤:
步骤301:在语音信息为未播放完成的语音信息的情况下,在结束播放语音信息后记录已播放时长以及结束句柄。
电子设备对语音信息进行播放过程中接收到停止播放指令时,停止播放本条语音信息,在该种情况下,若用户预继续收听本条语音信息中未播放完成的部分,可通过本发明实施例中所示的语音信息处理方法进行语音消息续听。
步骤302:依据已播放时长以及结束句柄,确定语音信息中的已播放语音分段和未播放语音分段。
在具体实现过程中,可仅通过已播放时长对语音分段进行划分,该种可选的通过已播放时长和结束句柄,可精确地定位为语音信息结束播放的位置,从而准确地将语音信息中已播放语音分段和未播放语音分段进行划分。
例如:一条语音信息时长为30s,用户首次收听15s后退出,电子设备将该条语音信息划分为前15s的语音分段和后15s的语音分段。
步骤303:生成分段图标。
每个语音分段对应的分段图标不同。
步骤304:在接收到对语音信息的编辑指令的情况下,显示排序后的各分段图标。
其中,各分段图标按照所对应的各语音分段在所述语音信息中的位置进行排序。
本发明实施例中所示的语音信息处理方法,可对语音信息进行至少一次续播,还可依据用户操作对语音信息中的语音分段针对性的进行播放。
例如:用户对语音信息进行两次续播后语音信息仍未播放完成,接收到语音播放停止指令后,语音信息可被划分为四个语音分段,分别为首次播放的语音分段N1,第一次续播的语音分段N2,第二次续播的语音分段N3以及未播放的语音分段N4。该条语音信息所对应的分段图标排序为依次排列的N1、N2、N3以及N4四个语音分段对应的四个分段图标。
步骤305:接收用户对各分段图标中的目标分段图标的第一输入。
第一输入可以为对目标分段图标的按压操作或点击操作等。
步骤306:响应于第一输入,以目标分段图标对应的语音分段为基准,对语音信息进行处理。
通过第一输入可触发电子设备对语音信息中的某一语音分段进行播放,或者从被选定的语音分段为起点开始播放该条语音信息。继续延用步骤304中的举例,用户可选择语音分段N4续听语音分段,也可以选择已播放完成的任意语音分段重新接听该语音分段及后续语音分段。
在具体实现过程中,可以将每次续播所播放的语音分段整合成一个语音分段,整条语音信息将被划分为两段语音分段,分别为一段已播放语音分段和一段未播放语音分段,为已播放语音分段生成第一分段图标,未播放语音分段生成第二分段图标。
一种可选的,响应于第一输入,以目标分段图标对应的语音分段为基准,对语音信息进行处理的方式为:从目标分段图标对应的语音分段的起点开始,续播语音信息;在接收到结束播放指令的情况下,确定本次续播已播放的第一语音分段和未播放的第二语音分段;生成第一分段图标和第二分段图标,第一分段图标用于指示第一语音分段,第二分段图标用于指示第二语音分段;在各分段图标排序中,将目标分段图标替换为第一分段图标和第二分段图标。该种可选的方式,将每次续播所播放的语音分段整合成一个语音分段,便于用户对已播放语音分段和未播放语音分段进行区分。
本发明实施例提供的语音信息处理方法,通过依据预设分段参数将语音信息划分成多个语音分段;生成分段图标;在接收到对语音信息的编辑指令的情况下,显示按照时间先后排序后的各分段图标;接收用户对各分段图标中目标分段图标的第一输入;响应于第一输入,从目标分段图标对应的语音分段的起点开始续播该条语音信息,无需从语音信息起始部分重新播放该条语音信息,可节省播放所耗时长、避免用户重复收已收听语音分段,操作便捷且能够提升用户的使用体验。
参照图4,示出了本发明实施例的一种语音信息处理方法的步骤流程图。
本发明实施例的语音信息处理方法包括以下步骤:
步骤401:在语音信息为待发送语音信息时,在录制语音信息的过程中依据用户语调变化、换气时机,将语音信息划分成多个语音分段。
用户按下语音信息录入按钮进行语音输入,电子设备对用户输入的语音信息进行录入,在语音信息录入过程中检测到用户语调发生变化时,记录语调变化的时间点,检测到用户换气时记录换气的时间点,基于所记录的时间点对录入的语音信息进行划分。
在对录制的语音信息进行语音分段划分时,还可以结合语音信息过程中用户语气发送变化的时间点。
步骤402:生成分段图标。
每个语音分段对应一个分段图标。
在具体实现过程中,可为相同语气的语音分段设置相似分段图标,例如:语音信息共被分为三个语音分段,其中第一和第三个语音分段对应平和的语气,第二个语音分段对应激动的语气,则第一和第三个语音分段对应的分段图标可设置为填充色相同形状相同但标号不同的分段图标。
步骤403:在接收到对语音信息的编辑指令的情况下,显示排序后的各分段图标。
其中,各分段图标按照所对应的各语音分段在语音信息中的位置进行排序。
一种示例性地分段图标设置方式如附图2中所示。用户当前录制的语音信息被划分为4个语音分段,用户在退出语音信息输入后电子设备在界面中显示语音信息处理选项,其中,语音信息处理选项中可以包括但不限于:编辑、取消或者转文字等处理项。当接收到用户对语音信息的编辑指令时,电子设备将各分段图标进行排序后显示。
步骤404:接收用户对各分段图标中的目标分段图标的第一输入。
用户对目标分段图标执行点击或者按压操作后,可触发电子设备弹出编辑项选择界面,编辑项选择界面中可以包括但不限于:语音插入、语音删除或者语音覆盖等编辑项,用户可根据需求选择任意编辑项,从而触发电子设备对语音信息进行进一步编辑处理。用户欲向已录入的语音信息中插入语音内容时,可选择语音添加编辑项;用户欲将已录入的语音信息中的部分语音内容删除时,可选择语音删除编辑项;用户欲将已录入的语音信息中的部分语音内容进行替换时,可选择语音覆盖编辑项。
第一输入可以为对目标分段图标的选中操作以及对编辑项的选中操作集合。
步骤405:响应于第一输入,以目标分段图标对应的语音分段为基准,对语音信息进行处理。
在第一输入为插入语音分段的指令输入时,响应于第一输入,录制用户输入的第一语音信息;在目标分段图标对应的第三语音分段的末位处插入第一语音信息;在各分段图标排序中,确定目标分段图标和位于目标分段图标之后且紧邻目标分段图标的第三分段图标;将第一语音信息对应的第四分段图标添加至目标分段图标与第三分段图标之间。
在第一输入为删除语音分段的指令输入时,响应于第一输入,确定目标分段图标对应的第四语音分段;在语音信息中将第四语音分段删除;在各分段图标排序中,将目标分段图标删除。
在具体实现过程中,不仅可将目标分段图标对应的语音分段删除,还可以触发电子设备将与目标分段图标颜色相同形状相同但标号不同的各分段图标对应的语音分段均删除。
本发明实施例提供的语音信息处理方法,通过依据预设分段参数将语音信息划分成多个语音分段;生成分段图标;按照各语音分段在语音信息中的位置对各分段图标进行排序后显示;接收用户对目标分段图标的第一输入;响应于第一输入,以目标分段图标对应的语音分段为基准向语音信息中插入新增的语音内容或者删除语音信息中的部分语音分段,便于用户灵活地对已录制的语音信息进行灵活调整,操作便捷。
参照图5,示出了本发明实施例三的一种电子设备的结构框图。
本发明实施例的电子设备500作为第一电子设备,其中,电子设备500包括:
划分模块501,用于依据预设分段参数将语音信息划分成多个语音分段;
生成模块502,用于生成分段图标;
显示模块503,用于在接收到对语音信息的编辑指令的情况下,显示排序后的各所述分段图标;其中,各所述分段图标按照所对应的各语音分段在所述语音信息中的位置进行排序;
接收模块504,用于接收用户对所述各分段图标中的目标分段图标的第一输入;
处理模块505,用于响应于所述第一输入,以所述目标分段图标对应的语音分段为基准,对所述语音信息进行处理。
可选地,所述划分模块包括:
记录子模块,用于在所述语音信息为未播放完成的语音信息的情况下,在结束播放所述语音信息后记录已播放时长以及结束句柄;
分段确定子模块,用于依据所述已播放时长以及结束句柄,确定所述语音信息中的已播放语音分段和未播放语音分段。
可选地,所述处理模块包括:
续播子模块,用于在所述第一输入为续播所述语音信息的指令输入时,从所述目标分段图标对应的语音分段的起点开始,续播所述语音信息;
第一分段确定子模块,用于在接收到结束播放指令的情况下,确定本次续播已播放的第一语音分段和未播放的第二语音分段;
图标生成子模块,用于生成第一分段图标和第二分段图标,所述第一分段图标用于指示所述第一语音分段,所述第二分段图标用于指示所述第二语音分段;
替换子模块,用于在各所述分段图标排序中,将所述目标分段图标替换为所述第一分段图标和所述第二分段图标。
可选地,所述划分模块具体用于:
在所述语音信息为待发送语音信息的情况下,在录制所述语音信息的过程中依据用户语调变化、换气时机,将所述语音信息划分成多个语音分段。
可选地,所述处理模块包括:
录制子模块,用于在所述第一输入为插入语音分段的指令输入时,录制用户输入的第一语音信息;
插入子模块,用于在所述目标分段图标对应的第三语音分段的末位处插入所述第一语音信息;
图标确定子模块,用于在各所述分段图标排序中,确定所述目标分段图标和位于所述目标分段图标之后且紧邻所述目标分段图标的第三分段图标;
添加子模块,用于将所述第一语音信息对应的第四分段图标添加至所述目标分段图标与所述第三分段图标之间。
可选地,所述处理模块包括:
第二分段确定子模块,用于在所述第一输入为删除语音分段的指令输入时,确定所述目标分段图标对应的第四语音分段;
第一删除子模块,用于在所述语音信息中将所述第四语音分段删除;
第二删除子模块,用于在各所述分段图标排序中,将所述目标分段图标删除。
本发明实施例提供的电子设备能够实现上述各方法实施例中语音信息处理方法的各个过程,为避免重复,这里不再赘述。
本发明实施例提供的电子设备,通过依据预设分段参数将语音信息划分成多个语音分段;生成分段图标;在接收到对语音信息的编辑指令的情况下,显示排序后的各分段图标;接收用户对各分段图标中的目标分段图标的第一输入;响应于第一输入,以目标分段图标对应的语音分段为基准,对语音信息进行处理,用户可灵活地触发电子设备向语音信息中插入新增语音内容、删除语音信息中的语音分段或者对语音信息进行续播,操作便捷能够提升用户的使用体验。
参照图6,示出了本发明实施例的一种电子设备的结构框图。
图6为实现本发明各个实施例的一种电子设备的硬件结构示意图,该电子设备600包括但不限于:射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、处理器610、以及电源611等部件。本领域技术人员可以理解,图6中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。本发明实施例提供的电子设备作为第一电子设备与各第二电子设备之间进行交互,对图像进行处理。
其中,处理器610,可用于依据预设分段参数将语音信息划分成多个语音分段;生成分段图标;在接收到对语音信息的编辑指令的情况下,显示排序后的各所述分段图标;其中,各所述分段图标按照所对应的各语音分段在所述语音信息中的位置进行排序;接收用户对所述各分段图标中的目标分段图标的第一输入;响应于所述第一输入,以所述目标分段图标对应的语音分段为基准,对所述语音信息进行处理。
本发明实施例提供的电子设备,通过依据预设分段参数将语音信息划分成多个语音分段;生成分段图标;在接收到对语音信息的编辑指令的情况下,显示排序后的各分段图标;接收用户对各分段图标中的目标分段图标的第一输入;响应于第一输入,以目标分段图标对应的语音分段为基准,对语音信息进行处理,用户可灵活地触发电子设备向语音信息中插入新增语音内容、删除语音信息中的语音分段或者对语音信息进行续播等,操作便捷能够提升用户的使用体验。
应理解的是,本发明实施例中,射频单元601可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器610处理;另外,将上行的数据发送给基站。通常,射频单元601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元601还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块602为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元603可以将射频单元601或网络模块602接收的或者在存储器609中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元603还可以提供与电子设备600执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元603包括扬声器、蜂鸣器以及受话器等。
输入单元604用于接收音频或视频信号。输入单元604可以包括图形处理器(Graphics Processing Unit,GPU)6041和麦克风6042,图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元606上。经图形处理器6041处理后的图像帧可以存储在存储器609(或其它存储介质)中或者经由射频单元601或网络模块602进行发送。麦克风6042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元601发送到移动通信基站的格式输出。
电子设备600还包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板6061的亮度,接近传感器可在电子设备600移动到耳边时,关闭显示面板6061和/或背光。显示面板601为柔性显示屏,柔性显示屏包括依次叠加设置的屏幕底座、可升降模块阵列以及柔性屏幕。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器605还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元606用于显示由用户输入的信息或提供给用户的信息。显示单元606可包括显示面板6061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板6061。
用户输入单元607可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元607包括触控面板6071以及其他输入设备6072。触控面板6071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板6071上或在触控面板6071附近的操作)。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器610,接收处理器610发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板6071。除了触控面板6071,用户输入单元607还可以包括其他输入设备6072。具体地,其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板6071可覆盖在显示面板6061上,当触控面板6071检测到在其上或附近的触摸操作后,传送给处理器610以确定触摸事件的类型,随后处理器610根据触摸事件的类型在显示面板6061上提供相应的视觉输出。虽然在图6中,触控面板6071与显示面板6061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板6071与显示面板6061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元608为外部装置与电子设备600连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元608可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备600内的一个或多个元件或者可以用于在电子设备600和外部装置之间传输数据。
存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器609可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器610是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器609内的软件程序和/或模块,以及调用存储在存储器609内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器610可包括一个或多个处理单元;优选的,处理器610可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器610中。
电子设备600还可以包括给各个部件供电的电源611(比如电池),优选的,电源611可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备600包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器610,存储器609,存储在存储器609上并可在所述处理器610上运行的计算机程序,该计算机程序被处理器610执行时实现上述语音信息处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述语音信息处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (10)

1.一种语音信息处理方法,应用于电子设备,其特征在于,所述方法包括:
依据预设分段参数将语音信息划分成多个语音分段;
生成分段图标,所述分段图标用于指示所述语音分段;
在接收到对所述语音信息的编辑指令的情况下,显示排序后的各所述分段图标;其中,各所述分段图标按照所对应的各语音分段在所述语音信息中的位置进行排序;
接收用户对所述各分段图标中的目标分段图标的第一输入;
响应于所述第一输入,以所述目标分段图标对应的语音分段为基准,对所述语音信息进行处理。
2.根据权利要求1所述的方法,其特征在于,所述依据预设分段参数将待处理的语音信息划分成多个语音分段的步骤,包括:
在所述语音信息为未播放完成的语音信息的情况下,在结束播放所述语音信息后记录已播放时长以及结束句柄;
依据所述已播放时长以及结束句柄,确定所述语音信息中的已播放语音分段和未播放语音分段。
3.根据权利要求2所述的方法,其特征在于,在所述第一输入为续播所述语音信息的指令输入时,响应于所述第一输入,以所述目标分段图标对应的语音分段为基准,对所述语音信息进行处理的步骤,包括:
从所述目标分段图标对应的语音分段的起点开始,续播所述语音信息;
在接收到结束播放指令的情况下,确定本次续播已播放的第一语音分段和未播放的第二语音分段;
生成第一分段图标和第二分段图标,所述第一分段图标用于指示所述第一语音分段,所述第二分段图标用于指示所述第二语音分段;
在各所述分段图标排序中,将所述目标分段图标替换为所述第一分段图标和所述第二分段图标。
4.根据权利要求1所述的方法,其特征在于,在所述第一输入为插入语音分段的指令输入时,响应于所述第一输入,以所述目标分段图标对应的语音分段为基准,对所述语音信息进行处理的步骤,包括:
录制用户输入的第一语音信息;
在所述目标分段图标对应的第三语音分段的末位处插入所述第一语音信息;
在各所述分段图标排序中,确定所述目标分段图标和位于所述目标分段图标之后且紧邻所述目标分段图标的第三分段图标;
将所述第一语音信息对应的第四分段图标添加至所述目标分段图标与所述第三分段图标之间。
5.根据权利要求1所述的方法,其特征在于,在所述第一输入为删除语音分段的指令输入时,响应于所述第一输入,以所述目标分段图标对应的语音分段为基准,对所述语音信息进行处理的步骤,包括:
确定所述目标分段图标对应的第四语音分段;
在所述语音信息中将所述第四语音分段删除;
在各所述分段图标排序中,将所述目标分段图标删除。
6.一种电子设备,其特征在于,所述电子设备包括:
划分模块,用于依据预设分段参数将语音信息划分成多个语音分段;
生成模块,用于生成分段图标,所述分段图标用于指示所述语音分段;
显示模块,用于在接收到对所述语音信息的编辑指令的情况下,显示排序后的各所述分段图标;其中,各所述分段图标按照所对应的各语音分段在所述语音信息中的位置进行排序;
接收模块,用于接收用户对所述各分段图标中的目标分段图标的第一输入;
处理模块,用于响应于所述第一输入,以所述目标分段图标对应的语音分段为基准,对所述语音信息进行处理。
7.根据权利要求6所述的电子设备,其特征在于,所述划分模块包括:
记录子模块,用于在所述语音信息为未播放完成的语音信息的情况下,在结束播放所述语音信息后记录已播放时长以及结束句柄;
分段确定子模块,用于依据所述已播放时长以及结束句柄,确定所述语音信息中的已播放语音分段和未播放语音分段。
8.根据权利要求7所述的电子设备,其特征在于,所述处理模块包括:
续播子模块,用于在所述第一输入为续播所述语音信息的指令输入时,从所述目标分段图标对应的语音分段的起点开始,续播所述语音信息;
第一分段确定子模块,用于在接收到结束播放指令的情况下,确定本次续播已播放的第一语音分段和未播放的第二语音分段;
图标生成子模块,用于生成第一分段图标和第二分段图标,所述第一分段图标用于指示所述第一语音分段,所述第二分段图标用于指示所述第二语音分段;
替换子模块,用于在各所述分段图标排序中,将所述目标分段图标替换为所述第一分段图标和所述第二分段图标。
9.根据权利要求6所述的电子设备,其特征在于,所述处理模块包括:
录制子模块,用于在所述第一输入为插入语音分段的指令输入时,录制用户输入的第一语音信息;
插入子模块,用于在所述目标分段图标对应的第三语音分段的末位处插入所述第一语音信息;
图标确定子模块,用于在各所述分段图标排序中,确定所述目标分段图标和位于所述目标分段图标之后且紧邻所述目标分段图标的第三分段图标;
添加子模块,用于将所述第一语音信息对应的第四分段图标添加至所述目标分段图标与所述第三分段图标之间。
10.根据权利要求6所述的电子设备,其特征在于,所述处理模块包括:
第二分段确定子模块,用于在所述第一输入为删除语音分段的指令输入时,确定所述目标分段图标对应的第四语音分段;
第一删除子模块,用于在所述语音信息中将所述第四语音分段删除;
第二删除子模块,用于在各所述分段图标排序中,将所述目标分段图标删除。
CN202010172657.1A 2020-03-12 2020-03-12 一种语音信息处理方法及电子设备 Pending CN111445929A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010172657.1A CN111445929A (zh) 2020-03-12 2020-03-12 一种语音信息处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010172657.1A CN111445929A (zh) 2020-03-12 2020-03-12 一种语音信息处理方法及电子设备

Publications (1)

Publication Number Publication Date
CN111445929A true CN111445929A (zh) 2020-07-24

Family

ID=71654020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010172657.1A Pending CN111445929A (zh) 2020-03-12 2020-03-12 一种语音信息处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN111445929A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112887480A (zh) * 2021-01-22 2021-06-01 维沃移动通信有限公司 音频信号处理方法、装置、电子设备和可读存储介质
CN112885369A (zh) * 2021-01-26 2021-06-01 维沃移动通信有限公司 音频处理方法、音频处理装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020010575A1 (en) * 2000-04-08 2002-01-24 International Business Machines Corporation Method and system for the automatic segmentation of an audio stream into semantic or syntactic units
CN103544950A (zh) * 2012-07-12 2014-01-29 索尼公司 信息处理设备,信息处理方法,显示控制设备和显示控制方法
CN104850335A (zh) * 2015-05-28 2015-08-19 瞬联软件科技(北京)有限公司 基于语音输入的表情曲线生成方法
CN105868307A (zh) * 2016-03-26 2016-08-17 深圳市金立通信设备有限公司 一种音频信息的显示方法及终端
CN107369442A (zh) * 2017-06-22 2017-11-21 北京奇艺世纪科技有限公司 一种语音消息展示方法、装置及电子设备
CN107481743A (zh) * 2017-08-07 2017-12-15 捷开通讯(深圳)有限公司 移动终端、存储器及录音文件的编辑方法
CN107888757A (zh) * 2017-09-25 2018-04-06 努比亚技术有限公司 一种语音消息处理方法、终端和计算机可读存储介质
CN109841216A (zh) * 2018-12-26 2019-06-04 珠海格力电器股份有限公司 语音数据的处理方法、装置和智能终端
CN110619897A (zh) * 2019-08-02 2019-12-27 精电有限公司 一种会议纪要生成的方法及车载录音系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020010575A1 (en) * 2000-04-08 2002-01-24 International Business Machines Corporation Method and system for the automatic segmentation of an audio stream into semantic or syntactic units
CN103544950A (zh) * 2012-07-12 2014-01-29 索尼公司 信息处理设备,信息处理方法,显示控制设备和显示控制方法
CN104850335A (zh) * 2015-05-28 2015-08-19 瞬联软件科技(北京)有限公司 基于语音输入的表情曲线生成方法
CN105868307A (zh) * 2016-03-26 2016-08-17 深圳市金立通信设备有限公司 一种音频信息的显示方法及终端
CN107369442A (zh) * 2017-06-22 2017-11-21 北京奇艺世纪科技有限公司 一种语音消息展示方法、装置及电子设备
CN107481743A (zh) * 2017-08-07 2017-12-15 捷开通讯(深圳)有限公司 移动终端、存储器及录音文件的编辑方法
CN107888757A (zh) * 2017-09-25 2018-04-06 努比亚技术有限公司 一种语音消息处理方法、终端和计算机可读存储介质
CN109841216A (zh) * 2018-12-26 2019-06-04 珠海格力电器股份有限公司 语音数据的处理方法、装置和智能终端
CN110619897A (zh) * 2019-08-02 2019-12-27 精电有限公司 一种会议纪要生成的方法及车载录音系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112887480A (zh) * 2021-01-22 2021-06-01 维沃移动通信有限公司 音频信号处理方法、装置、电子设备和可读存储介质
CN112887480B (zh) * 2021-01-22 2022-07-29 维沃移动通信有限公司 音频信号处理方法、装置、电子设备和可读存储介质
CN112885369A (zh) * 2021-01-26 2021-06-01 维沃移动通信有限公司 音频处理方法、音频处理装置
CN112885369B (zh) * 2021-01-26 2024-05-24 维沃移动通信有限公司 音频处理方法、音频处理装置

Similar Documents

Publication Publication Date Title
CN108763316B (zh) 一种音频列表管理方法及移动终端
CN108279948B (zh) 一种应用程序启动方法及移动终端
CN108334272B (zh) 一种控制方法及移动终端
EP3731077A1 (en) Method for editing text, and mobile device
CN111010608B (zh) 视频播放的方法及电子设备
CN110673770B (zh) 消息展示方法及终端设备
CN109830248B (zh) 一种音频录制方法及终端设备
CN110855921B (zh) 一种视频录制控制方法及电子设备
CN110096203B (zh) 一种截图方法及移动终端
CN110221795B (zh) 一种屏幕录制方法及终端
CN110868633A (zh) 一种视频处理方法及电子设备
CN111124345A (zh) 一种音频源处理的方法及移动终端
CN111026305A (zh) 音频处理方法及电子设备
CN109324999B (zh) 一种基于下载指令执行操作的方法和电子设备
CN109246474B (zh) 一种视频文件编辑方法及移动终端
CN110909524A (zh) 一种编辑方法及电子设备
CN111212316B (zh) 视频生成方法及电子设备
CN110022445B (zh) 一种内容输出方法及终端设备
CN109672845B (zh) 一种视频通话的方法、装置以及移动终端
CN111445929A (zh) 一种语音信息处理方法及电子设备
CN109147746B (zh) 一种k歌方法及终端
CN110780751A (zh) 一种信息处理方法及电子设备
CN108270928B (zh) 一种语音识别的方法及移动终端
CN111049977B (zh) 一种闹钟提醒方法及电子设备
CN110213437B (zh) 一种编辑方法及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200724

RJ01 Rejection of invention patent application after publication