CN111768788A - 用于转换信息的方法、装置、电子设备和计算机可读介质 - Google Patents

用于转换信息的方法、装置、电子设备和计算机可读介质 Download PDF

Info

Publication number
CN111768788A
CN111768788A CN202010598765.5A CN202010598765A CN111768788A CN 111768788 A CN111768788 A CN 111768788A CN 202010598765 A CN202010598765 A CN 202010598765A CN 111768788 A CN111768788 A CN 111768788A
Authority
CN
China
Prior art keywords
format
target
entry
matching
target entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010598765.5A
Other languages
English (en)
Other versions
CN111768788B (zh
Inventor
姚佳立
蔡猛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010598765.5A priority Critical patent/CN111768788B/zh
Publication of CN111768788A publication Critical patent/CN111768788A/zh
Application granted granted Critical
Publication of CN111768788B publication Critical patent/CN111768788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开的实施例公开了用于转换信息的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:将接收到的语音信号转换为待处理文字信息;从上述待处理文字信息中筛选设定词性的目标词条;响应于上述目标词条存在至少两种显示格式,确定上述目标词条在上述待处理文字信息中的目标显示格式;按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息。该实施方式提高了语音转换的准确性和有效性。

Description

用于转换信息的方法、装置、电子设备和计算机可读介质
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于转换信息的方法、装置、电子设备和计算机可读介质。
背景技术
随着语音识别技术的发展,越来越多具备语音识别功能的电子设备应在在人们的工作和生活中,为人们的工作和生活带来便利。
通常,设备获取采集到语音信号后,可以通过语音识别技术将语音信号转换为文字信息。实际中,语音信号中可以包含对数字等信息的描述,这些信息在实际中需要用对应的阿拉伯数字、符号等来表示。直接通过语音识别技术得到的文字信息与语音信号对应的实际信息存在歧义,导致语音识别的结果不够准确有效。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了用于转换信息的方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题。
第一方面,本公开的一些实施例提供了一种用于转换信息的方法,该方法包括:将接收到的语音信号转换为待处理文字信息;从上述待处理文字信息中筛选设定词性的目标词条;响应于上述目标词条存在至少两种显示格式,确定上述目标词条在上述待处理文字信息中的目标显示格式;按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息。
第二方面,本公开的一些实施例提供了一种用于转换信息的装置,该装置包括:语音转换单元,被配置成将接收到的语音信号转换为待处理文字信息;目标词条筛选单元,被配置成从上述待处理文字信息中筛选设定词性的目标词条;目标显示格式确定单元,响应于上述目标词条存在至少两种显示格式,被配置成确定上述目标词条在上述待处理文字信息中的目标显示格式;信息转换单元,被配置成按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息。
第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器执行上述第一方面的用于转换信息的方法。
第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面的用于转换信息的方法。
本公开的上述各个实施例中的一个实施例具有如下有益效果:首先将接收到的语音信号转换为待处理文字信息;然后从待处理文字信息中筛选设定词性的目标词条,确定了需要进行信息转换的词条;之后再上述目标词条存在至少两种显示格式时,确定上述目标词条在上述待处理文字信息中的目标显示格式,消除了目标词条可能存在的歧义,使得信息转换后的目标词条符合日常表达;最后按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息,提高了语音转换的准确性和有效性。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是本公开的一些实施例的用于转换信息的方法的应用场景的示意图;
图2是根据本公开的用于转换信息的方法的一些实施例的流程图;
图3是根据本公开的用于转换信息的方法的另一些实施例的流程图;
图4是根据本公开的用于转换信息的方法的又一些实施例的流程图;
图5是根据本公开的用于转换信息的方法的一些实施例的结构示意图;
图6是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本公开。
图1是根据本公开一些实施例的用于转换信息的方法的一个应用场景的示意图。
用户向终端设备101(例如可以是手机、笔记本电脑、台式机电脑、服务器等)发出语音信号。终端设备101接收到语音信号后,将语音信号转换为待处理文字信息:“我十一点十一过来”。为了提高对语音信号识别的准确性,终端设备101可以从待处理文字信息中筛选容易出现转换错误的设定词性的目标词条[十一点十一]。设定词性例如可以是数词、量词等。当待处理文字信息存在设定词性的目标词条时,终端设备101可以进一步查询目标词条的多个显示格式。多个显示格式可以为:数字百分比格式、数字时间格式、分数格式。通常,只有存在多种显示格式的信息才有可能出现信息显示格式问题。由于目标词条[十一点十一]中没有关于数字百分比格式的信息,且目标词条[十一点十一]符合数字时间格式。因此,终端设备101可以确认[十一点十一]在“我十一点十一过来”中的目标显示格式为数字时间格式。最后,终端设备101按照数字时间格式对[十一点十一]进行信息转换,得到的目标文字信息为:“我11点11过来”。如此,消除了信息转换过程中可能出现的歧义,使得经语音转换后的目标文字信息更加符合日常表达,提高了语音转换的准确性和有效性。
应该理解,图1中的终端设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的计算设备。
继续参考图2,示出了根据本公开的用于转换信息的方法的一些实施例的流程200。该用于转换信息的方法,包括以下步骤:
步骤201,将接收到的语音信号转换为待处理文字信息。
在一些实施例中,用于转换信息的方法的执行主体(例如图1所示的终端设备101)可以通过有线连接方式或者无线连接方式接收语音信号。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultrawideband)连接、以及其他现在已知或将来开发的无线连接方式。
用户可以根据执行主体的提示,向执行主体发出语音信号。执行主体接收到语音信号后,可以将语音信号转换为待处理文字信息。需要说明的是,此时的待处理文字信息通常只包含由汉字组成的文字。
步骤202,从上述待处理文字信息中筛选设定词性的目标词条。
执行主体可以对待处理文字信息包含的每个词条的词性进行识别,并筛选出设定词性的目标词条。其中,设定词性即为上述容易出现转换错误的词性。例如数词、量词等。
步骤203,响应于上述目标词条存在至少两种显示格式,确定上述目标词条在上述待处理文字信息中的目标显示格式。
由上述描述可知,目标词条可能存在多种显示格式。执行主体可以查询目标词条的至少两种显示格式,通过对显示格式的分析,确定目标词条在上述待处理文字信息中的目标显示格式。
步骤204,按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息。
确定了目标显示格式后,执行主体可以上述目标显示格式对上述目标词条进行信息转换。之后,将信息转换后的目标词条替换掉待处理文字信息原有的目标词条,得到目标文字信息。如此,消除了信息转换过程中可能出现的歧义,使得经语音转换后的目标文字信息更加符合日常表达,提高了语音转换的准确性和有效性。
本公开的一些实施例公开的用于转换信息的方法,首先将接收到的语音信号转换为待处理文字信息;然后从待处理文字信息中筛选设定词性的目标词条,确定了需要进行信息转换的词条;之后再上述目标词条存在至少两种显示格式时,确定上述目标词条在上述待处理文字信息中的目标显示格式,消除了目标词条可能存在的歧义,使得信息转换后的目标词条符合日常表达;最后按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息,提高了语音转换的准确性和有效性。
继续参考图3,示出了根据本公开的用于转换信息的方法的一些实施例的流程300。该用于转换信息的方法,包括以下步骤:
步骤301,将接收到的语音信号转换为待处理文字信息。
步骤301的内容与步骤201的内容相同,此处不再一一赘述。
步骤302,从上述待处理文字信息中筛选设定词性的目标词条。
步骤302的内容与步骤202的内容相同,此处不再一一赘述。
步骤303,查询上述至少两种显示格式对应的至少两个格式匹配模块。
为了确定目标词条应该以哪种格式进行显示,执行主体可以查询上述至少两种显示格式对应的至少两个格式匹配模块。其中,格式匹配模块为预先建立的。格式匹配模块可以为用于检测对应显示格式的程序、表格等。
步骤304,通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配,确定上述目标词条在上述待处理文字信息中的目标显示格式。
执行主体可以通过格式匹配模块对目标词条中是否包含对应显示格式的信息进行检测,以确定目标词条是否通过对应的显示格式进行显示。当目标词条包含对应显示格式的信息时,格式匹配模块与目标词条匹配成功。执行主体可以将该格式匹配模块对应的显示格式设置为目标显示格式。
在一些实施例的一些可选的实现方式中,上述通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配,可以包括:基于上述匹配优先级信息,通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配。
为了准确对目标词条进行显示,执行主体可以按照一定的顺序将发生歧义最小的显示格式对应的格式匹配模块优先于目标词条进行匹配。即,上述至少两个格式匹配模块之间存在匹配优先级信息,上述匹配优先级信息可以用于表征上述目标词条与至少两个格式匹配模块的匹配顺序。当发生歧义最小的显示格式对应的格式匹配模块与目标词条匹配不成功时,再通过其他显示格式对应的格式匹配模块与目标词条匹配。如此,可以尽量避免目标词条的显示出现歧义,有利于提高信息转换的准确性的有效性。
在一些实施例的一些可选的实现方式中,上述通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配,可以包括以下步骤:
第一步,将上述格式匹配模块的格式关键词转换为格式特征文字。
格式匹配模块还可以包括格式关键词。其中,上述格式关键词用于表征信息显示格式的显示特征。例如,格式匹配模块用于检测数字百分比格式时,格式关键词可以为“百分之”。格式关键词“百分之”对应的数字百分比格式实际为“%”。即格式关键词“百分之”为数字百分比格式中“%”的文字表达方式。由于本公开将语音信号转换的待处理文字信息是通过文字来显示的,因此,通过格式关键词可以查询到各种显示格式的文字表达。如此,有利于提高对待处理文字信息的识别准确性和转换准确性。
第二步,响应于上述目标词条中存在上述格式特征文字,标识上述格式匹配模块与上述目标词条匹配成功。
当目标词条中存在上述格式特征文字时,说明格式匹配模块与上述目标词条匹配成功。
在一些实施例的一些可选的实现方式中,上述响应于上述目标词条中存在上述格式特征文字,标识上述格式匹配模块与上述目标词条匹配成功,可以包括:响应于上述格式关键词为多个,根据匹配成功的格式特征文字对应的格式关键词的数量为上述格式匹配模块设置权重值。
格式匹配模块可以存在多个格式关键词。由于用户的说话习惯等原因,可能不会把某个格式匹配模块中的全部格式关键词都说出来。此时,执行主体可以根据匹配成功的格式特征文字对应的格式关键词的数量为上述格式匹配模块设置权重值。上述权重值可以用于表征上述格式匹配模块与上述目标词条的匹配程度。例如,格式匹配模块包含了3个格式关键词,用户说出了其中的2个,则可以为格式匹配模块设置权重值为0.66。
在一些实施例的一些可选的实现方式中,上述确定上述目标词条在上述待处理文字信息中的目标显示格式,可以包括:响应于当前格式匹配模块的权重值大于设定权重阈值,将当前格式匹配模块对应的显示格式设置为目标显示格式,否则,根据上述匹配优先级信息选择下一个格式匹配模块对上述目标词条进行匹配,确定上述目标词条的目标显示格式。
由上述描述可知,执行主体是按照优先级顺序对目标词条进行匹配(即歧义小的显示格式先匹配)的。如果当前格式匹配模块的权重值大于设定权重阈值,说明目标词条满足当前格式匹配模块,且目标词条在格式匹配模块对应的显示格式下歧义最小。此时,执行主体可以将当前格式匹配模块对应的显示格式设置为目标显示格式。
如果当前格式匹配模块的权重值小于等于设定权重阈值时,说明当前目标词条与格式匹配模块的匹配度低。此时,执行主体可以根据匹配优先级信息选择下一个格式匹配模块对上述目标词条进行匹配,确定上述目标词条的目标显示格式。
匹配优先级信息是先通过歧义小的格式匹配模块匹配目标词条,然后再通过歧义答的格式匹配模块匹配目标词条。如此,有利于提高信息转换的准确性和有效性。
在一些实施例的一些可选的实现方式中,上述确定上述目标词条在上述待处理文字信息中的目标显示格式,可以包括:响应于上述至少两个格式匹配模块中每个格式匹配模块的权重值都不大于上述设定权重阈值,将上述至少两个格式匹配模块中的、最大权重值对应的格式匹配模块对应的显示格式设置为目标显示格式。
实际中,还可能出现每个格式匹配模块的权重值都不大于上述设定权重阈值的情况。此时,执行主体可以将上述至少两个格式匹配模块中的、最大权重值对应的格式匹配模块对应的显示格式设置为目标显示格式。如此,有利于提高信息转换的准确性和有效性。
步骤305,按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息。
步骤305的内容与步骤204的内容相同,此处不再一一赘述。
继续参考图4,示出了根据本公开的用于转换信息的方法的一些实施例的流程400。该用于转换信息的方法,包括以下步骤:
步骤401,将接收到的语音信号转换为待处理文字信息。
步骤401的内容与步骤201的内容相同,此处不再一一赘述。
步骤402,从上述待处理文字信息中筛选设定词性的目标词条。
步骤402的内容与步骤202的内容相同,此处不再一一赘述。
步骤403,将上述目标词条设定范围内的词条设置为邻居词条。
实际中,除了目标词条外,其他词条也有助于对目标词条显示格式的判断。执行主体可以将上述目标词条设定范围内的词条设置为邻居词条。
步骤404,响应于上述邻居词条中存在格式指示词条,根据上述格式指示词条确定目标显示格式。
有些邻居词条明显带有对目标词条显示格式的指示性。例如,待处理文字信息为:“我上午十一点十一过来”,对应的目标词条为[十一点十一]。其中,邻居词条可以为“上午”和“过来”。其中,“上午”对[十一点十一]具有明确的格式指示。即,“上午”表示的是时间段,“上午”后面紧跟的[十一点十一]显现可以用时间显示格式来表示。即,上述格式指示词条可以用于指示上述目标词条的显示格式。如此,提高了信息转换的有效性和准确性。
步骤405,按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息。
步骤405的内容与步骤204的内容相同,此处不再一一赘述。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了一种用于转换信息的装置的一些实施例,这些装置实施例与图2所示的那些方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,一些实施例的用于转换信息的装置500包括:语音转换单元501、目标词条筛选单元502、目标显示格式确定单元503和信息转换单元504。其中,语音转换单元501,被配置成将接收到的语音信号转换为待处理文字信息;目标词条筛选单元502,被配置成从上述待处理文字信息中筛选设定词性的目标词条;目标显示格式确定单元503,响应于上述目标词条存在至少两种显示格式,被配置成确定上述目标词条在上述待处理文字信息中的目标显示格式;信息转换单元504,被配置成按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息。
在一些实施例的可选实现方式中,上述目标显示格式确定单元503可以包括:格式匹配模块查询子单元(图中未示出)和第一目标显示格式确定子单元(图中未示出)。其中,格式匹配模块查询子单元,被配置成查询上述至少两种显示格式对应的至少两个格式匹配模块;第一目标显示格式确定子单元,被配置成通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配,确定上述目标词条在上述待处理文字信息中的目标显示格式。
在一些实施例的可选实现方式中,上述至少两个格式匹配模块之间存在匹配优先级信息,上述匹配优先级信息用于表征上述目标词条与至少两个格式匹配模块的匹配顺序,以及,上述第一目标显示格式确定子单元包括:优先级匹配模块(图中未示出),被配置成基于上述匹配优先级信息,通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配。
在一些实施例的可选实现方式中,上述格式匹配模块包括格式关键词,上述格式关键词用于表征信息显示格式的显示特征,以及上述第一目标显示格式确定子单元可以包括:格式特征文字转换模块(图中未示出)和匹配标识模块(图中未示出)。其中,格式特征文字转换模块,被配置成将上述格式匹配模块的格式关键词转换为格式特征文字;匹配标识模块,响应于上述目标词条中存在上述格式特征文字,被配置成标识上述格式匹配模块与上述目标词条匹配成功。
在一些实施例的可选实现方式中,上述匹配标识模块可以包括:权重值设置子模块(图中未示出),响应于上述格式关键词为多个,被配置成根据匹配成功的格式特征文字对应的格式关键词的数量为上述格式匹配模块设置权重值,上述权重值用于表征上述格式匹配模块与上述目标词条的匹配程度。
在一些实施例的可选实现方式中,上述第一目标显示格式确定子单元包括:第一目标显示格式确定模块(图中未示出),响应于当前格式匹配模块的权重值大于设定权重阈值,被配置成将当前格式匹配模块对应的显示格式设置为目标显示格式,否则,根据上述匹配优先级信息选择下一个格式匹配模块对上述目标词条进行匹配,确定上述目标词条的目标显示格式。
在一些实施例的可选实现方式中,上述第一目标显示格式确定子单元包括:第二目标显示格式确定模块(图中未示出),响应于上述至少两个格式匹配模块中每个格式匹配模块的权重值都不大于上述设定权重阈值,被配置成将上述至少两个格式匹配模块中的、最大权重值对应的格式匹配模块对应的显示格式设置为目标显示格式。
在一些实施例的可选实现方式中,上述目标显示格式确定单元503可以包括:邻居词条设置子单元(图中未示出)和第二目标显示格式确定子单元(图中未示出)。其中,邻居词条设置子单元,被配置成将上述目标词条设定范围内的词条设置为邻居词条;第二目标显示格式确定子单元,响应于上述邻居词条中存在格式指示词条,被配置成根据上述格式指示词条确定目标显示格式,其中,上述格式指示词条用于指示上述目标词条的显示格式。
可以理解的是,该装置500中记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置500及其中包含的单元,在此不再赘述。
如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开的一些实施例的方法中限定的上述功能。
需要说明的是,本公开的一些实施例上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:将接收到的语音信号转换为待处理文字信息;从上述待处理文字信息中筛选设定词性的目标词条;响应于上述目标词条存在至少两种显示格式,确定上述目标词条在上述待处理文字信息中的目标显示格式;按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括语音转换单元、目标词条筛选单元、目标显示格式确定单元和信息转换单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,信息转换单元还可以被描述为“用于转换信息的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
根据本公开的一个或多个实施例,提供了一种用于转换信息的方法,包括:将接收到的语音信号转换为待处理文字信息;从上述待处理文字信息中筛选设定词性的目标词条;响应于上述目标词条存在至少两种显示格式,确定上述目标词条在上述待处理文字信息中的目标显示格式;按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息。
根据本公开的一个或多个实施例,上述响应于上述目标词条存在至少两种显示格式,确定上述目标词条在上述待处理文字信息中的目标显示格式,包括:查询上述至少两种显示格式对应的至少两个格式匹配模块;通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配,确定上述目标词条在上述待处理文字信息中的目标显示格式。
根据本公开的一个或多个实施例,上述至少两个格式匹配模块之间存在匹配优先级信息,上述匹配优先级信息用于表征上述目标词条与至少两个格式匹配模块的匹配顺序,以及,上述通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配,包括:基于上述匹配优先级信息,通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配。
根据本公开的一个或多个实施例,上述格式匹配模块包括格式关键词,上述格式关键词用于表征信息显示格式的显示特征,以及,上述通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配,包括:将上述格式匹配模块的格式关键词转换为格式特征文字;响应于上述目标词条中存在上述格式特征文字,标识上述格式匹配模块与上述目标词条匹配成功。
根据本公开的一个或多个实施例,上述响应于上述目标词条中存在上述格式特征文字,标识上述格式匹配模块与上述目标词条匹配成功,包括:响应于上述格式关键词为多个,根据匹配成功的格式特征文字对应的格式关键词的数量为上述格式匹配模块设置权重值,上述权重值用于表征上述格式匹配模块与上述目标词条的匹配程度。
根据本公开的一个或多个实施例,上述确定上述目标词条在上述待处理文字信息中的目标显示格式,包括:响应于当前格式匹配模块的权重值大于设定权重阈值,将当前格式匹配模块对应的显示格式设置为目标显示格式,否则,根据上述匹配优先级信息选择下一个格式匹配模块对上述目标词条进行匹配,确定上述目标词条的目标显示格式。
根据本公开的一个或多个实施例,上述确定上述目标词条在上述待处理文字信息中的目标显示格式,包括:响应于上述至少两个格式匹配模块中每个格式匹配模块的权重值都不大于上述设定权重阈值,将上述至少两个格式匹配模块中的、最大权重值对应的格式匹配模块对应的显示格式设置为目标显示格式。
根据本公开的一个或多个实施例,上述响应于上述目标词条存在至少两种显示格式,确定上述目标词条在上述待处理文字信息中的目标显示格式,包括:将上述目标词条设定范围内的词条设置为邻居词条;响应于上述邻居词条中存在格式指示词条,根据上述格式指示词条确定目标显示格式,其中,上述格式指示词条用于指示上述目标词条的显示格式。
根据本公开的一个或多个实施例,提供了一种用于转换信息的装置,包括:语音转换单元,被配置成将接收到的语音信号转换为待处理文字信息;目标词条筛选单元,被配置成从上述待处理文字信息中筛选设定词性的目标词条;目标显示格式确定单元,响应于上述目标词条存在至少两种显示格式,被配置成确定上述目标词条在上述待处理文字信息中的目标显示格式;信息转换单元,被配置成按照上述目标显示格式对上述目标词条进行信息转换,得到对应上述待处理文字信息的目标文字信息。
根据本公开的一个或多个实施例,上述目标显示格式确定单元包括:格式匹配模块查询子单元,被配置成查询上述至少两种显示格式对应的至少两个格式匹配模块;第一目标显示格式确定子单元,被配置成通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配,确定上述目标词条在上述待处理文字信息中的目标显示格式。
根据本公开的一个或多个实施例,上述至少两个格式匹配模块之间存在匹配优先级信息,上述匹配优先级信息用于表征上述目标词条与至少两个格式匹配模块的匹配顺序,以及,上述第一目标显示格式确定子单元包括:优先级匹配模块,被配置成基于上述匹配优先级信息,通过上述至少两个格式匹配模块中的每个格式匹配模块对上述目标词条进行匹配。
根据本公开的一个或多个实施例,上述格式匹配模块包括格式关键词,上述格式关键词用于表征信息显示格式的显示特征,以及,上述第一目标显示格式确定子单元包括:格式特征文字转换模块,被配置成将上述格式匹配模块的格式关键词转换为格式特征文字;匹配标识模块,响应于上述目标词条中存在上述格式特征文字,被配置成标识上述格式匹配模块与上述目标词条匹配成功。
根据本公开的一个或多个实施例,上述匹配标识模块包括:权重值设置子模块,响应于上述格式关键词为多个,被配置成根据匹配成功的格式特征文字对应的格式关键词的数量为上述格式匹配模块设置权重值,上述权重值用于表征上述格式匹配模块与上述目标词条的匹配程度。
根据本公开的一个或多个实施例,上述第一目标显示格式确定子单元包括:第一目标显示格式确定模块,响应于当前格式匹配模块的权重值大于设定权重阈值,被配置成将当前格式匹配模块对应的显示格式设置为目标显示格式,否则,根据上述匹配优先级信息选择下一个格式匹配模块对上述目标词条进行匹配,确定上述目标词条的目标显示格式。
根据本公开的一个或多个实施例,上述第一目标显示格式确定子单元包括:第二目标显示格式确定模块,响应于上述至少两个格式匹配模块中每个格式匹配模块的权重值都不大于上述设定权重阈值,被配置成将上述至少两个格式匹配模块中的、最大权重值对应的格式匹配模块对应的显示格式设置为目标显示格式。
根据本公开的一个或多个实施例,上述目标显示格式确定单元包括:邻居词条设置子单元,被配置成将上述目标词条设定范围内的词条设置为邻居词条;第二目标显示格式确定子单元,响应于上述邻居词条中存在格式指示词条,被配置成根据上述格式指示词条确定目标显示格式,其中,上述格式指示词条用于指示上述目标词条的显示格式。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (11)

1.一种用于转换信息的方法,包括:
将接收到的语音信号转换为待处理文字信息;
从所述待处理文字信息中筛选设定词性的目标词条;
响应于所述目标词条存在至少两种显示格式,确定所述目标词条在所述待处理文字信息中的目标显示格式;
按照所述目标显示格式对所述目标词条进行信息转换,得到对应所述待处理文字信息的目标文字信息。
2.根据权利要求1所述的方法,其中,所述响应于所述目标词条存在至少两种显示格式,确定所述目标词条在所述待处理文字信息中的目标显示格式,包括:
查询所述至少两种显示格式对应的至少两个格式匹配模块;
通过所述至少两个格式匹配模块中的每个格式匹配模块对所述目标词条进行匹配,确定所述目标词条在所述待处理文字信息中的目标显示格式。
3.根据权利要求2所述的方法,其中,所述至少两个格式匹配模块之间存在匹配优先级信息,所述匹配优先级信息用于表征所述目标词条与至少两个格式匹配模块的匹配顺序,以及
所述通过所述至少两个格式匹配模块中的每个格式匹配模块对所述目标词条进行匹配,包括:
基于所述匹配优先级信息,通过所述至少两个格式匹配模块中的每个格式匹配模块对所述目标词条进行匹配。
4.根据权利要求2所述的方法,其中,所述格式匹配模块包括格式关键词,所述格式关键词用于表征信息显示格式的显示特征,以及
所述通过所述至少两个格式匹配模块中的每个格式匹配模块对所述目标词条进行匹配,包括:
将所述格式匹配模块的格式关键词转换为格式特征文字;
响应于所述目标词条中存在所述格式特征文字,标识所述格式匹配模块与所述目标词条匹配成功。
5.根据权利要求4所述的方法,其中,所述响应于所述目标词条中存在所述格式特征文字,标识所述格式匹配模块与所述目标词条匹配成功,包括:
响应于所述格式关键词为多个,根据匹配成功的格式特征文字对应的格式关键词的数量为所述格式匹配模块设置权重值,所述权重值用于表征所述格式匹配模块与所述目标词条的匹配程度。
6.根据权利要求5所述的方法,其中,所述确定所述目标词条在所述待处理文字信息中的目标显示格式,包括:
响应于当前格式匹配模块的权重值大于设定权重阈值,将当前格式匹配模块对应的显示格式设置为目标显示格式,否则,根据所述匹配优先级信息选择下一个格式匹配模块对所述目标词条进行匹配,确定所述目标词条的目标显示格式。
7.根据权利要求6所述的方法,其中,所述确定所述目标词条在所述待处理文字信息中的目标显示格式,包括:
响应于所述至少两个格式匹配模块中每个格式匹配模块的权重值都不大于所述设定权重阈值,将所述至少两个格式匹配模块中的、最大权重值对应的格式匹配模块对应的显示格式设置为目标显示格式。
8.根据权利要求1至7任意一项所述的方法,其中,所述响应于所述目标词条存在至少两种显示格式,确定所述目标词条在所述待处理文字信息中的目标显示格式,包括:
将所述目标词条设定范围内的词条设置为邻居词条;
响应于所述邻居词条中存在格式指示词条,根据所述格式指示词条确定目标显示格式,其中,所述格式指示词条用于指示所述目标词条的显示格式。
9.一种用于转换信息的装置,包括:
语音转换单元,被配置成将接收到的语音信号转换为待处理文字信息;
目标词条筛选单元,被配置成从所述待处理文字信息中筛选设定词性的目标词条;
目标显示格式确定单元,响应于所述目标词条存在至少两种显示格式,被配置成确定所述目标词条在所述待处理文字信息中的目标显示格式;
信息转换单元,被配置成按照所述目标显示格式对所述目标词条进行信息转换,得到对应所述待处理文字信息的目标文字信息。
10.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至8中任一所述的方法。
11.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1至8中任一所述的方法。
CN202010598765.5A 2020-06-28 2020-06-28 用于转换信息的方法、装置、电子设备和计算机可读介质 Active CN111768788B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010598765.5A CN111768788B (zh) 2020-06-28 2020-06-28 用于转换信息的方法、装置、电子设备和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010598765.5A CN111768788B (zh) 2020-06-28 2020-06-28 用于转换信息的方法、装置、电子设备和计算机可读介质

Publications (2)

Publication Number Publication Date
CN111768788A true CN111768788A (zh) 2020-10-13
CN111768788B CN111768788B (zh) 2023-08-22

Family

ID=72722237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010598765.5A Active CN111768788B (zh) 2020-06-28 2020-06-28 用于转换信息的方法、装置、电子设备和计算机可读介质

Country Status (1)

Country Link
CN (1) CN111768788B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556973B1 (en) * 2000-04-19 2003-04-29 Voxi Ab Conversion between data representation formats
JP2010044666A (ja) * 2008-08-15 2010-02-25 Kazuo Imamura 音声情報管理システム、文字情報表示プログラム及び記憶媒体
CN104050157A (zh) * 2014-06-16 2014-09-17 海信集团有限公司 歧义消解的方法和系统
CN105916127A (zh) * 2016-06-27 2016-08-31 北京奇虎科技有限公司 用于获取用户流量信息的方法、装置及服务器
CN107331396A (zh) * 2017-07-05 2017-11-07 北京云知声信息技术有限公司 输出数字的方法及装置
CN109801630A (zh) * 2018-12-12 2019-05-24 平安科技(深圳)有限公司 语音识别的数字转换方法、装置、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556973B1 (en) * 2000-04-19 2003-04-29 Voxi Ab Conversion between data representation formats
JP2010044666A (ja) * 2008-08-15 2010-02-25 Kazuo Imamura 音声情報管理システム、文字情報表示プログラム及び記憶媒体
CN104050157A (zh) * 2014-06-16 2014-09-17 海信集团有限公司 歧义消解的方法和系统
CN105916127A (zh) * 2016-06-27 2016-08-31 北京奇虎科技有限公司 用于获取用户流量信息的方法、装置及服务器
CN107331396A (zh) * 2017-07-05 2017-11-07 北京云知声信息技术有限公司 输出数字的方法及装置
CN109801630A (zh) * 2018-12-12 2019-05-24 平安科技(深圳)有限公司 语音识别的数字转换方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111768788B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
US8682640B2 (en) Self-configuring language translation device
US20190081914A1 (en) Method and apparatus for generating candidate reply message
CN108229704B (zh) 用于推送信息的方法和装置
CN110096655B (zh) 搜索结果的排序方法、装置、设备及存储介质
CN110956955B (zh) 一种语音交互的方法和装置
CN111462728A (zh) 用于生成语音的方法、装置、电子设备和计算机可读介质
CN111462727A (zh) 用于生成语音的方法、装置、电子设备和计算机可读介质
CN111368560A (zh) 文本翻译方法、装置、电子设备及存储介质
CN112309384B (zh) 一种语音识别方法、装置、电子设备及介质
CN110223694B (zh) 语音处理方法、系统和装置
CN111931494B (zh) 用于生成预测信息的方法、装置、电子设备和介质
CN112242143B (zh) 一种语音交互方法、装置、终端设备及存储介质
CN112382266A (zh) 一种语音合成方法、装置、电子设备及存储介质
CN111768788B (zh) 用于转换信息的方法、装置、电子设备和计算机可读介质
US10803861B2 (en) Method and apparatus for identifying information
CN111221424B (zh) 用于生成信息的方法、装置、电子设备和计算机可读介质
CN114707951A (zh) 警情大数据管理方法、装置、设备和存储介质
CN112148847B (zh) 一种语音信息的处理方法及装置
CN111339790B (zh) 文本翻译方法、装置、设备及计算机可读存储介质
CN110929209B (zh) 用于发送信息的方法及装置
CN113488050A (zh) 语音唤醒方法、装置、存储介质及电子设备
CN113807056A (zh) 一种文档名称序号纠错方法、装置和设备
CN113393288A (zh) 订单处理信息生成方法、装置、设备和计算机可读介质
CN111599354A (zh) 用于转换信息的方法、装置、电子设备和计算机可读介质
CN111582708A (zh) 医疗信息的检测方法、系统、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: Tiktok vision (Beijing) Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant