CN107705790B - 一种信息处理方法和电子设备 - Google Patents

一种信息处理方法和电子设备 Download PDF

Info

Publication number
CN107705790B
CN107705790B CN201710866956.3A CN201710866956A CN107705790B CN 107705790 B CN107705790 B CN 107705790B CN 201710866956 A CN201710866956 A CN 201710866956A CN 107705790 B CN107705790 B CN 107705790B
Authority
CN
China
Prior art keywords
information
voice
voice information
target
piece
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710866956.3A
Other languages
English (en)
Other versions
CN107705790A (zh
Inventor
夏伟成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201710866956.3A priority Critical patent/CN107705790B/zh
Publication of CN107705790A publication Critical patent/CN107705790A/zh
Application granted granted Critical
Publication of CN107705790B publication Critical patent/CN107705790B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种信息处理方法和电子设备,其中方法包括:若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息进行转换,获得对应每条语音信息的目标文字信息;显示所述至少两条语音信息的每条语音信息和对应的目标文字信息,其中,每条语音信息的显示框与该语音信息进行转换后的目标文字信息对应显示。检测到语音转换指示,即可将至少两条语音信息均转换成文字信息并对应显示,简化了电子设备的信息处理操作,达到了优化电子设备的信息处理操作流程的技术效果。

Description

一种信息处理方法和电子设备
技术领域
本发明涉及通信技术领域,特别涉及一种信息处理方法和电子设备。
背景技术
随着通信技术的发展,电子设备的功能也越来越强大,电子设备的语音转换成文字的功能为用户日常生活带来便利。现有通信技术中,电子设备的语音转换成文字的功能中,用户分段录制多个语音信息,需要针对每一条语音单独执行语音转换成文字的指示操作,操作较为复杂。可见,现有的电子设备存在语音转换成文字的操作较为复杂的技术问题。
发明内容
本发明实施例的目的在于提供一种信息处理方法和电子设备,以解决现有的电子设备存在信息处理操作较为复杂的技术问题。
为了达到上述目的,本发明实施例提供的具体方案如下:
第一方面,本发明实施例提供了一种信息处理方法,所述信息处理方法包括:
若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息进行转换,获得对应每条语音信息的目标文字信息;
显示所述至少两条语音信息的每条语音信息和对应的目标文字信息,其中,每条语音信息的显示框与该语音信息转换后的目标文字信息对应显示。
第二方面,本发明实施例提供了一种电子设备,所述电子设备包括:
文字转换模块,用于若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息进行转换,获得对应每条语音信息的目标文字信息;
显示模块,用于显示所述至少两条语音信息的每条语音信息和对应的目标文字信息,其中,每条语音信息的显示框与该语音信息转换后的目标文字信息对应显示。
第三方面,本发明实施例提供了一种电子设备,所述电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述处理器执行所述计算机程序时实现如第一方面所述的信息处理方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机序被处理器执行时实现如第一方面所述的信息处理方法的步骤。
本发明实施例中,电子设备检测到语音转换指示后,将电子设备接收到的至少两条语音信息进行转换,获得对应成每条语音信息的目标文字信息,并将每条语音信息的显示框与该语音信息转换后的目标文字信息对应显示。检测到语音转换指示,即可将至少两条语音信息均转换成文字信息并对应显示,简化了电子设备的语音转换成文字的操作,达到了优化电子设备的信息处理操作流程的技术效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种信息处理方法的流程示意图;
图2为本发明实施例提供的信息处理方法所涉及的信息显示的结构示意图;
图3为本发明实施例提供的另一种信息处理方法的流程示意图;
图4为本发明实施例提供的另一种信息处理方法所涉及的信息显示的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图;
图6为本发明实施例提供的电子设备的结构示意图之一;
图7为本发明实施例提供的电子设备的结构示意图之二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,图1为本发明实施例提供的信息处理方法的流程示意图。如图1所示,一种信息处理方法,应用于电子设备,包括以下步骤:
步骤101、若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息进行转换,获得对应每条语音信息的目标文字信息。
电子设备接收至少两条语音信息,将该至少两条语音信息转换成文字信息方便用户查看。电子设备接收到的语音信息,可以为其他电子设备通过无线网络等方式传输来的语音信息,或者是所述电子设备直接录制的语音信息。在一种实施方式中,所述电子设备接收的语音信息,可以为电子设备的语音便签直接录制的语音信息,本实施例提供的信息处理方法,可以直接将语音便签中录制的多条语音信息同时转换成对应的文字信息,方便用户查看。
若电子设备接收到语音转换指示,执行将电子设备接收到的至少两条语音信息进行转换,以获得对应每条语音信息的目标文字信息的操作。用于指示语音转换成文字操作的语音转换指示,可以为电子设备预设的检测数据,也可以为用户触发的转换操作。在一种实施方式中,电子设备预设的检测数据可以为电子设备当前的网络状态,将网络连接状态正常或者网络连接状态良好作为语音转换指示。若检测到当前的网络连接状态正常或者良好,则可以执行信息处理操作,可以不再需要用户触发其他转换指示。在其他实施方式中,还可以将用户触控所述电子设备上设置的语音转换按钮等操作作为语音转换指示,在此不做限定。
在检测到语音转换指示后,将至少两条语音信息的每条语音信息均进行转换,以获得对应每条语音信息的目标文字信息。在一种实施方式中,可以直接用常用的语音转换成文字的技术将所接收到的至少两条语音信息均转换成对应的文字信息,作为所述目标文字信息。在其他实施方式中,也可以先将通过语音转换文字技术转换出的文字信息作为初始文字信息,根据预设的优化处理程序对初始文字信息进行优化处理,以获得对应每条语音信息的目标文字信息。
步骤102、显示所述至少两条语音信息的每条语音信息和对应的目标文字信息。
依据上述步骤将所述电子设备接收到的至少两条语音信息转换成目标文字信息后,将所述至少两条语音信息的每条语音信息和对应的目标文字信息进行对应显示,以使用户查看每条语音信息对应的文字内容。如图2所示,所述电子设备显示转换后的目标文字信息时,可以控制每条语音信息的显示框与该语音信息转换后的目标文字信息对应显示,例如将每条语音信息对应的目标文字信息显示在该语音信息的显示框的下方或者侧边,以便用户清晰查看每条语音信息对应的文字内容。也可以仅将每条语音信息的标识信息与该语音信息转换后的目标文字信息对应显示,例如将语音信息的标号与该语音信息转换的目标文字信息对应显示,语音信息的显示框可以隐藏或者不显示。控制至少两条语音信息的每条语音信息和对应的目标文字信息对应显示的方式可以有多种,在此不做限定。
上述本发明实施例提供的信息处理方法,在检测到语音转换指示后,将电子设备接收的至少两条语音信息进行转换,以通过一个语音转换成文字指示即可获得对应至少两条语音信息中的每条语音信息的目标文字信息,并显示所述至少两条语音信息的每条语音信息和对应的目标文字信息。简化了多个语音信息转换成文字信息的操作,降低了信息处理操作复杂度,方便了用户使用。
请参见图3,为本发明实施例提供的另一种信息处理方法的流程示意图。本发明实施例提供的信息处理方法,相对于上述实施例的区别在于,增设了对转换文字进行优化处理的操作,以提高文字转换的准确度。如图3所示,一种信息处理方法,应用于电子设备,包括以下步骤:
步骤301、若检测到语音转换指示,将所述至少两条语音信息中的每条语音信息均转换为初始文字信息。
电子设备内预设有语音转换成文字的程序,可以将接收到的语音信息转换成文字信息。电子设备检测到语音转换指示后,将所述至少两条语音信息中的每条语音信息均转换为初始文字信息。语音信息转换成文字信息的过程可以包括:静音切除、声音分帧、声学特征提取、帧识别成状态、状态组合成因素、因素组合成词汇等过程,其他本领域常用的语音转换成初始文字信息的方式均可适用于本实施例,在此不做限定。
步骤302、对所述初始文字信息进行优化处理,获得所述目标文字信息。
依据上述步骤完成所述电子设备接收的至少两条语音信息转换成初始文字信息后,依据电子设备内预设的优化处理程序,对所述初始文字信息进行优化处理,获得对应每条语音信息的目标文字信息。所述优化处理操作可以有多种,包括但不限于:易混淆发音的文字纠错、自动去重、时间地点等关键字段突出显示等。
在一种实施方式中,所述电子设备内可以存储有对应多个位置区域的纠正集合,所述纠正集合可以包括与位置区域匹配的对应至少两个纠正字段组合,每个纠正字段组合包括对应同一相近发音的易错字段和纠正字段,可以为对应容易发音错误或者不同习惯读音的典型词汇的易错字段和纠正字段。例如,在一些地区,容易将“f”和“h”混淆,例如将福建的发音“fujian”错发成“hujian”,如果直接语音转换成文字,会根据录音中的“hujian”转换成“胡建”,而我们日常的发音习惯中,可以推测用户想要表达的是“福建”,发音为“fujian”,则对应该位置区域的纠正集合包括对应典型词汇“福建”的易错字段“胡建”和纠正字段“福建”。再例如,部分位置区域将括号的发音“括号”习惯性发音为“kuohu”,如果直接语音转换文字,为“括弧”。因此,可以将该位置区域的纠正集合内存储易错字段“括弧”以及对应的纠正字段“括号”。因此,对所述初始文字信息进行优化处理,获得目标文字信息的步骤可以包括:
查找与录制所述语音信息的位置区域匹配的目标纠正集合,将所述初始文字信息包含的所述易错字段替换为对应的所述纠正字段,获得所述目标文字信息。查找录制所述语音信息的位置区域,获取录制所述语音信息的位置区域可以通过利用GPS定位仪定位获取所述电子设备录制所述语音信息的位置区域,也可以为发送该语音信息的其他电子设备录制该语音信息的位置区域。在其他实施方式中,也可以由用户手动为所述语音信息匹配对应的位置区域进行优化处理,在此不做限定。
如图4所示,在上述实施例中,查找到与语音信息匹配的位置区域的纠正集合包含“胡建和福建”,以及“括弧和括号”等典型词汇的易错字段和纠正字段,则对所述语音信息转换的初始文字信息进行易错字段替换,将初始文字信息中所包含的“胡建”替换为“福建”,将初始文字信息中包含的“括弧”替换为“括号”,以便提高语音转换成为文字的准确率。
在其他实施方式中,为了进一步提高信息处理准确率,还可以保留替换痕迹,以便用户知悉此处的替换操作。考虑到特殊情况下用户真实表达的词汇核能确实为所述易错字段表述的词汇,还可以设置用户确认是否替换的触发按钮,由用户再次确认是否将所查找到的易错字段替换为纠正字段,进一步提高用户体验。在其他实施方式中,还可以为用户设置专用的纠正集合,该纠正集合内可以包含该用户常用的错误发音词汇对应的易错字段和纠正字段,以便后期信息处理过程中,根据该专用的纠错集合,针对录制的该用户的语音信息进行文字信息的转换操作,进一步提高信息处理准确率和适用性。
在上述实施例的基础上,考虑到每条语音信息所包含的内容较多时,用户可能无法快速获取关键信息,还可以设置关键字段突出显示的技术方案。对所述初始文字信息进行优化处理,获得所述目标文字信息的步骤还可以包括:
筛选出所述初始文字信息中的关键字段,对所述初始文字信息中的所述关键字段进行标记,以获得所述目标文字信息。在后续的目标文字信息的显示操作中,控制所述目标文字信息中被标记的关键字段突出显示,以便用户快速获取目标文字信息中的关键字段。所述关键字段可以为时间、地点、用户名称等常用关键信息,也可以为用户自定义的关键字段,在此不做限定。控制关键字段突出显示的方式也可以有多种,例如,控制关键字段相对于目标文字信息中的其他字段放大显示、加粗显示、下划线显示、变色显示等,其他能控制目标文字信息中的关键字段突出显示的方式均可适用于本实施例,在此不做限定。
在上述实施例的基础上,考虑到语音信息在录制过程中,用户可能会因为咳嗽、喝水等突发情况暂停说话,在突发情况结束后重复暂停说话前的语句,以便能继续后续的讲述,这就会造成语句重复。语音信息转换成文字信息后,重复讲述的语音信息也会被转换成邻接的重复字段。因此对所述初始文字信息进行优化处理,获得目标文字信息的步骤还可以包括:对所述初始信息中的邻接重复字段作去重处理,获得所述目标文字信息。可以检测在同一语句中的邻接重复字段,或者是邻接语句中的前后重复字段,或者是中间间隔部分预期词的邻接重复字段,将邻接重复字段进行合并,以使得转换后的目标文字信息更准确和流程,方便用户查看。如图4所示,初始文字信息的部分片段为“打扫,咳咳咳,打扫办公室卫生”,则可以针对“打扫,咳咳咳,打扫办公室卫生”字段进行优化处理,合并为“打扫办公室卫生”,优化处理后的目标文字信息为“下班记得关电脑打扫办公室卫生”,使得转换后的语句表达更精准更流畅,提高用户体验。
步骤303、显示所述至少两条语音信息的每条语音信息和对应的目标文字信息。
依据上述步骤对电子设备接收的多个语音信息转换成初始文字信息,并优化处理为目标文字信息后,将所述至少两条语音信息中的每条语音信息和转换后的目标文字信息显示。以使用户查看每条语音信息对应的文字内容。所述电子设备显示转换后的目标文字信息时,可以控制每条语音信息的显示框与该语音信息转换后的目标文字信息对应显示,例如将每条语音信息对应的目标文字信息显示在该语音信息的下方或者侧边,以便用户清晰查看每条语音信息对应的文字内容。控制语音信息和目标文字信息对应显示的具体实施过程可参见上述实施例,不再赘述。
在上述实施例的基础上,考虑到用户对转换后的目标文字信息的保存需求,还可以增设“过滤语音”功能,仅保留转换后的目标文字信息。例如,将至少两条语音信息隐藏,仅将至少两条语音信息转换后的目标文字信息进行整理,按语音的录制先后顺序,将转换后的多个目标文字信息按顺序进行排列显示,或者是整理合并显示,方便用户查看或保存。
在上述实施例的基础上,考虑到部分语音信息转换成目标文字信息后,用户可能需要针对至少两条语音信息中的一条或者某几条语音信息再次校准,因此还可以增设语音回放端口。用户可以通过转换后的目标文字信息直接获知每条语音信息的主要内容,不需要再次通过语音回放识别。还可以针对转换后的目标文字信息,查找到重要内容对应的语音信息,通过设置的语音回放进行语音回放,或者针对转换后的目标文字信息进行手动修改,进一步方便用户使用,提高转换文字的准确率。
上述本发明实施例提供的信息处理方法,根据语音转换指示,将至少两条语音信息转换成初始文字信息,根据预设的优化处理方案,对初始文字信息进行优化处理,获得目标文字信息。简化了电子设备的信息处理操作,提高了信息处理准确率。本发明实施例提供的信息处理具体实施过程可参见上述实施例,在此不再一一赘述。
请参见图5,为本发明实施例提供的电子设备的结构示意图。如图5所示,所述电子设备500包括:
文字转换模块501,用于若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息进行转换,获得对应每条语音信息的目标文字信息;
显示模块502,用于显示所述至少两条语音信息的每条语音信息和对应的目标文字信息,其中,每条语音信息的显示框与该语音信息转换后的目标文字信息对应显示。
在上述实施例的基础上,如图6所示,所述文字转换模块501可以包括:
初始转换子模块5011,用于将所述至少两条语音信息中的每条语音信息均转换为初始文字信息;
优化处理子模块5012,用于对所述初始文字信息进行优化处理,获得所述目标文字信息。
在上述实施例的基础上,所述优化处理子模块5012用于:
查找与录制所述语音信息的位置区域匹配的目标纠正集合,其中,所述目标纠正集合包括与所述位置区域对应的易错字段和纠正字段;
将所述初始文字信息包含的所述易错字段替换为所述纠正字段,获得所述目标文字信息。
在上述实施例的基础上,所述优化处理子模块5012可以用于:
筛选出所述初始文字信息中的关键字段;
对所述初始文字信息中的所述关键字段进行标记,以获得所述目标文字信息;
所述显示模块502用于:
控制每条语音信息对应的目标文字信息中的关键字段突出显示。
在上述实施例的基础上,所述优化处理子模块5012可以用于:
对所述初始文字信息中的邻接重复字段作去重处理,获得所述目标文字信息。
在上述实施例的基础上,所述文字转换模块501还可以用于:
判断当前的网络状态是否连接正常;
若当前的网络状态连接正常,将所述电子设备接收到的至少两条语音信息进行转换。
上述本发明实施例提供的电子设备,根据语音转换指示,将至少两条语音信息转换成初始文字信息,根据预设的优化处理方案,对初始文字信息进行优化处理,获得目标文字信息。简化了电子设备的信息处理操作,提高了信息处理准确率。本发明实施例提供的电子设备的具体实施过程可以参见上述实施例提供的信息处理方法的具体实施过程,在此不再一一赘述。
请参见图7,图7为本发明实施例提供的另一种电子设备700的结构示意图。如图7所示,所述电子设备700包括至少一个处理器701、存储器702、至少一个网络接口704和用户接口703。电子设备700中的各个组件通过总线系统705耦合在一起。可理解,总线系统705用于实现这些组件之间的连接通信。总线系统705除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图7中将各种总线都标为总线系统705。
其中,用户接口703可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
可以理解,本发明实施例中的存储器702可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random AccessMemory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的系统和方法的存储器702旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器702存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统7021和应用程序7022。
其中,操作系统7021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序7022,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明前述实施例的信息处理方法的程序可以包含在应用程序7022中。
在本发明实施例中,通过调用存储器702存储的程序或指令,具体的,可以是应用程序7022中存储的程序或指令,处理器701执行计算机程序时用于实现以下步骤:
若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息进行转换,获得对应每条语音信息的目标文字信息;
显示所述至少两条语音信息的每条语音信息和对应的目标文字信息,其中,每条语音信息的显示框与该语音信息转换后的目标文字信息对应显示。
前述本发明实施例揭示的方法可以应用于处理器1001中,或者由处理器1001实现。处理器1001可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1001中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1001可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(FieldProgrammable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器702,处理器701读取存储器702中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable GateArray,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
可选的,处理器701执行计算机程序时还用于实现以下步骤:
将所述至少两条语音信息中的每条语音信息均转换为初始文字信息;
对所述初始文字信息进行优化处理,获得所述目标文字信息。
可选的,处理器701执行计算机程序时还用于实现以下步骤:
查找与录制所述语音信息的位置区域匹配的目标纠正集合,其中,所述目标纠正集合包括与所述位置区域对应的易错字段和纠正字段;
将所述初始文字信息包含的所述易错字段替换为所述纠正字段,获得所述目标文字信息。
可选的,处理器701执行计算机程序时还用于实现以下步骤:
筛选出所述初始文字信息中的关键字段;
对所述初始文字信息中的所述关键字段进行标记,以获得所述目标文字信息;
控制每条语音信息对应的目标文字信息中的关键字段突出显示。
可选的,处理器701执行计算机程序时还用于实现以下步骤:
对所述初始文字信息中的邻接重复字段作去重处理,获得所述目标文字信息。
可选的,处理器701执行计算机程序时还用于实现以下步骤:
判断当前的网络状态是否连接正常;
若当前的网络状态连接正常,将所述电子设备接收到的至少两条语音信息进行转换。
所述电子设备700能实现前述实施例中电子设备实现的各个过程,在此不再一一赘述。
本发明实施例提供的电子设备,根据语音转换指示,将至少两条语音信息转换成初始文字信息,根据预设的优化处理方案,对初始文字信息进行优化处理,获得目标文字信息。简化了电子设备的信息处理操作,提高了信息处理准确率。
本发明实施例还提供了一种计算机可读存储介质。所述计算机可读处处介质上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息进行转换,获得对应每条语音信息的目标文字信息;
显示所述至少两条语音信息的每条语音信息和对应的目标文字信息,其中,每条语音信息的显示框与该语音信息转换后的目标文字信息对应显示。
可选的,所述计算机程序被处理器执行时实现以下步骤:
将所述至少两条语音信息中的每条语音信息均转换为初始文字信息;
对所述初始文字信息进行优化处理,获得所述目标文字信息。
可选的,所述计算机程序被处理器执行时实现以下步骤:
查找与录制所述语音信息的位置区域匹配的目标纠正集合,其中,所述目标纠正集合包括与所述位置区域对应的易错字段和纠正字段;
将所述初始文字信息包含的所述易错字段替换为所述纠正字段,获得所述目标文字信息。
可选的,所述计算机程序被处理器执行时实现以下步骤:
筛选出所述初始文字信息中的关键字段;
对所述初始文字信息中的所述关键字段进行标记,以获得所述目标文字信息;
控制每条语音信息对应的目标文字信息中的关键字段突出显示。
可选的,所述计算机程序被处理器执行时实现以下步骤:
对所述初始文字信息中的邻接重复字段作去重处理,获得所述目标文字信息。
可选的,所述计算机程序被处理器执行时实现以下步骤:
判断当前的网络状态是否连接正常;
若当前的网络状态连接正常,将所述电子设备接收到的至少两条语音信息进行转换。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每条特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、电子设备和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的电子设备和方法,可以通过其它的方式实现。例如,以上所描述的电子设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或可以是通过一些接口,电子设备或单元的间接耦合,或可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种信息处理方法,应用于电子设备,其特征在于,所述方法包括:
若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息同时进行转换,获得对应每条语音信息的目标文字信息;
显示所述至少两条语音信息中每条语音信息和对应的目标文字信息,其中,每条语音信息的显示框与该语音信息进行转换后的目标文字信息对应显示;
所述将所述电子设备接收到的至少两条语音信息进行转换,获得对应每条语音信息的目标文字信息的步骤包括:
将所述至少两条语音信息中的每条语音信息均转换为初始文字信息;
对所述初始文字信息进行优化处理,获得所述目标文字信息;
所述对所述初始文字信息进行优化处理,获得所述目标文字信息的步骤包括:
查找与录制所述语音信息的位置区域匹配的目标纠正集合,其中,所述目标纠正集合包括与所述位置区域对应的易错字段和纠正字段;
将所述初始文字信息包含的所述易错字段替换为所述纠正字段,获得所述目标文字信息。
2.根据权利要求1所述的信息处理方法,其特征在于,所述对所述初始文字信息进行优化处理,获得所述目标文字信息的步骤还包括:
筛选出所述初始文字信息中的关键字段;
对所述初始文字信息中的所述关键字段进行标记,以获得所述目标文字信息;
所述显示所述至少两条语音信息的每条语音信息和对应的目标文字信息的步骤包括:
控制每条语音信息对应的目标文字信息中的关键字段突出显示。
3.根据权利要求1所述的信息处理方法,其特征在于,所述对所述初始文字信息进行优化处理,获得所述目标文字信息的步骤包括:
对所述初始文字信息中的邻接重复字段作去重处理,获得所述目标文字信息。
4.根据权利要求1所述的信息处理方法,其特征在于,所述若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息进行转换的步骤包括:
判断当前的网络状态是否连接正常;
若当前的网络状态连接正常,将所述电子设备接收到的至少两条语音信息进行转换。
5.一种电子设备,其特征在于,所述电子设备包括:
文字转换模块,用于若检测到语音转换指示,将所述电子设备接收到的至少两条语音信息同时进行转换,获得对应每条语音信息的目标文字信息;
显示模块,用于显示所述至少两条语音信息的每条语音信息和对应的目标文字信息,其中,每条语音信息的显示框与该语音信息转换后的目标文字信息对应显示;
所述文字转换模块包括:
初始转换子模块,用于将所述至少两条语音信息中的每条语音信息均转换为初始文字信息;
优化处理子模块,用于对所述初始文字信息进行优化处理,获得所述目标文字信息;
所述优化处理子模块用于:
查找与录制所述语音信息的位置区域匹配的目标纠正集合,其中,所述目标纠正集合包括与所述位置区域对应的易错字段和纠正字段;
将所述初始文字信息包含的所述易错字段替换为所述纠正字段,获得所述目标文字信息。
6.根据权利要求5所述的电子设备,其特征在于,所述优化处理子模块还用于:
筛选出所述初始文字信息中的关键字段;
对所述初始文字信息中的所述关键字段进行标记,以获得所述目标文字信息;
所述显示模块用于:
控制每条语音信息对应的目标文字信息中的关键字段突出显示。
7.根据权利要求5所述的电子设备,其特征在于,所述优化处理子模块用于:
对所述初始文字信息中的邻接重复字段作去重处理,获得所述目标文字信息。
8.根据权利要求5所述的电子设备,其特征在于,所述文字转换模块用于:
判断当前的网络状态是否连接正常;
若当前的网络状态连接正常,将所述电子设备接收到的至少两条语音信息进行转换。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的信息处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的信息处理方法的步骤。
CN201710866956.3A 2017-09-22 2017-09-22 一种信息处理方法和电子设备 Active CN107705790B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710866956.3A CN107705790B (zh) 2017-09-22 2017-09-22 一种信息处理方法和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710866956.3A CN107705790B (zh) 2017-09-22 2017-09-22 一种信息处理方法和电子设备

Publications (2)

Publication Number Publication Date
CN107705790A CN107705790A (zh) 2018-02-16
CN107705790B true CN107705790B (zh) 2020-01-21

Family

ID=61174280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710866956.3A Active CN107705790B (zh) 2017-09-22 2017-09-22 一种信息处理方法和电子设备

Country Status (1)

Country Link
CN (1) CN107705790B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7159756B2 (ja) * 2018-09-27 2022-10-25 富士通株式会社 音声再生区間の制御方法、音声再生区間の制御プログラムおよび情報処理装置
CN113381922B (zh) * 2020-03-09 2024-02-27 阿尔派株式会社 电子装置以及信息的再生控制方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543078B (zh) * 2010-12-09 2016-08-03 上海果壳电子有限公司 电子名片系统及电子名片的语音录入方法、语音检索方法
JP5772219B2 (ja) * 2011-05-26 2015-09-02 富士通株式会社 音響モデル生成装置、音響モデル生成方法及び音響モデル生成用コンピュータプログラム
US9117450B2 (en) * 2012-12-12 2015-08-25 Nuance Communications, Inc. Combining re-speaking, partial agent transcription and ASR for improved accuracy / human guided ASR
CN106448675B (zh) * 2016-10-21 2020-05-01 科大讯飞股份有限公司 识别文本修正方法及系统

Also Published As

Publication number Publication date
CN107705790A (zh) 2018-02-16

Similar Documents

Publication Publication Date Title
US10614803B2 (en) Wake-on-voice method, terminal and storage medium
CN106997764B (zh) 一种基于语音识别的即时通信方法和即时通信系统
KR102128561B1 (ko) 음성 입력의 워드-레벨 수정
KR100996212B1 (ko) 음성인식을 위한 방법, 시스템 및 프로그램
CN107622054B (zh) 文本数据的纠错方法及装置
KR101255402B1 (ko) 대안들의 목록을 사용하는 오인된 단어들의 다시 받아쓰기
US8954329B2 (en) Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information
US10586528B2 (en) Domain-specific speech recognizers in a digital medium environment
KR20140047633A (ko) 컨텍스트 정보를 이용한 음성 인식 복구
US20190267007A1 (en) Text correction apparatus and text correction method
US10269353B2 (en) System and method for transcription of spoken words using multilingual mismatched crowd unfamiliar with a spoken language
US20200143799A1 (en) Methods and apparatus for speech recognition using a garbage model
CN109448460A (zh) 一种背诵检测方法及用户设备
CN107705790B (zh) 一种信息处理方法和电子设备
JP2017058507A (ja) 音声認識装置、音声認識方法、プログラム
CN113327597B (zh) 语音识别方法、介质、装置和计算设备
US20070088549A1 (en) Natural input of arbitrary text
CN109213970B (zh) 笔录生成方法及装置
AU2021313166A1 (en) Systems and methods for scripted audio production
WO2023226726A1 (zh) 语音数据处理方法及装置
US20140156256A1 (en) Interface device for processing voice of user and method thereof
CN111862958A (zh) 发音插入错误检测方法、装置、电子设备及存储介质
JP2012063526A (ja) 端末装置、音声認識方法および音声認識プログラム
RU2682005C1 (ru) Идентификация контактов с использованием распознавания речи
CN113053415B (zh) 一种连读的检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant