CN107967104A - 对信息实体进行语音评论的方法和电子设备 - Google Patents
对信息实体进行语音评论的方法和电子设备 Download PDFInfo
- Publication number
- CN107967104A CN107967104A CN201711388103.XA CN201711388103A CN107967104A CN 107967104 A CN107967104 A CN 107967104A CN 201711388103 A CN201711388103 A CN 201711388103A CN 107967104 A CN107967104 A CN 107967104A
- Authority
- CN
- China
- Prior art keywords
- comment
- information
- speech recognition
- voice
- voice messaging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000006243 chemical reaction Methods 0.000 claims abstract description 48
- 238000004590 computer program Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 3
- 238000003860 storage Methods 0.000 abstract description 13
- 230000003993 interaction Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 208000001491 myopia Diseases 0.000 description 1
- 210000003733 optic disk Anatomy 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开了一种对信息实体进行语音评论的方法、电子设备和可读存储介质。本申请通过对用户输入的语音信息进行识别,获取通过语音识别转换过来的文本信息,根据包括所述语音信息和通过语音识别转换过来的文本信息一同展现的评论信息更新并显示评论列表。在所述评论列表中,包括新上传的文本信息和对应的播放控件,所述播放控件用于播放所述的语音信息。由此,可以直接使用语音通过“一键”操作完成评论输入;同时展示播放语音的播放控件和通过语音识别获得的文本信息,使得可以对于以语音形式输入的评论内容进行文本检索。本申请公开的评论方法,可以替代常规的输入法发布评论或交互内容,直接通过语音来输入文字和语音,提高了信息输入效率。
Description
技术领域
本申请涉及互联网技术领域,具体涉及一种对信息实体进行语音评论的方法、电子设备和可读存储介质。
背景技术
随着移动互联网的快速发展,通过网络应用浏览图文信息、视频或音频等各类信息实体并对其进行评论交流已经成为人们社交生活中的一部分。现有的基于互联网的应用程序,例如,微博、新闻类应用、电子商务类应用、视频类应用、外卖类应用等都具备评论功能,用户可以将自己的评论发布到对应的信息实体下,与其它用户进行交流和分享。然而,在现有技术中,评论通常都是纯文字形式或图文形式,输入文本评论操作繁琐,特别对于移动终端用户来说输入效率较低。因此,现有的评论方式用户体验较差。
发明内容
有鉴于此,本申请提供一种对信息实体进行语音评论的方法、电子设备和可读存储介质,以方便用户的输入评论的操作,并提升用户浏览评论的使用体验。
根据本申请的第一方面,提供一种对信息实体进行语音评论的方法,包括:
获取用户输入的语音信息和当前展示的信息实体的唯一标识;
识别所述语音信息获取通过语音识别转换过来的文本信息;
向内容服务器发送评论信息,所述评论信息包括所述语音信息、通过语音识别转换过来的文本信息以及所述唯一标识;
显示当前展示的信息实体的评论列表,所述评论列表包括新上传的通过语音识别转换过来的文本信息和对应的播放控件,所述播放控件被链接到所述通过语音识别转换过来的文本信息对应的语音信息。
优选地,在检测到对第一控件的操作时,开始获取所述语音信息,在检测到对位于相同位置的第二控件的操作时,结束获取语音信息以实现一键操作完成语音录制和发布包括通过语音识别转换过来的文本信息和对应的播放控件的内容。
优选地,在检测到对第一控件的操作时,开始获取所述语音信息,在检测到录制时间达到预定时限时,结束获取语音信息以实现一键操作完成语音录制和发布包括通过语音识别转换过来的文本信息和对应的播放控件的内容。
优选地,所述识别所述语音信息获取通过语音识别转换过来的文本信息包括:
向在线的语音识别服务器发送所述语音信息并接收通过语音识别转换过来的文本信息;或者
调用离线语音识别应用程序接口对所述语音信息进行识别。
优选地,所述显示当前展示的信息实体的评论列表包括:
以信息流方式显示具有相同唯一标识的评论信息对应的多个通过语音识别转换过来的文本信息和播放控件,所述播放控件链接到所述通过语音识别转换过来的文本信息对应的语音信息。
优选地,所述多个通过语音识别转换过来的文本信息按照预定顺序排列。
优选地,所述方法还包括:
响应于对信息流的播放请求,按预定顺序播放评论列表中多个评论信息对应的语音信息。
优选地,所述信息实体包括视频信息、图片信息、音频信息、文本信息以及评论信息。
第二方面,提供一种对信息实体进行语音评论的方法,包括:
获取评论信息,所述评论信息包括语音信息、通过语音识别转换过来的文本信息以及信息实体的唯一标识;
根据所述语音信息生成播放控件,并将所述播放控件和通过语音识别转换过来的文本信息添加到所述信息实体的评论列表中,所述播放控件用于播放所述语音信息;
发送所述信息实体的评论列表以供用户查看。
第三方面,提供一种计算机可读存储介质,其上存储计算机程序指令,其中,所述计算机程序指令在被处理器执行时实现如上所述的方法。
第四方面,提供一种电子设备,包括存储器和处理器,其中,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如上所述的方法。
本申请通过对用户输入的语音信息进行识别,获取通过语音识别转换过来的文本信息,将包括所述语音信息和通过语音识别转换过来的文本信息的评论信息发送给内容服务器,更新并显示评论列表。在所述评论列表中包括新上传的通过语音识别转换过来的文本信息和对应的播放控件,所述播放控件用于播放所述的语音信息。由此,一方面可通过“一键”操作实现直接使用语音输入评论,方便用户使用;另一方面,同时展示语音播放语音的播放控件和通过语音识别获得的文本信息,使得可以对于以语音形式输入的评论内容进行文本检索,并使得其它用户通过不同的方式获取评论包含的信息,提升了用户体验。本申请公开的评论方法,可以替代常规的输入法发布评论或交互内容,直接通过语音来输入文字和语音,提高了信息输入效率。
附图说明
通过以下参照附图对本申请实施例的描述,本申请的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1是本申请实施例的评论系统的框图;
图2是本申请实施例的对信息实体进行语音评论的方法的流程图;
图3是本申请实施例的方法在用户终端一侧的流程图;
图4是本申请实施例的方法在服务器一侧的流程图;
图5是本申请实施例在语音评论前的图形用户界面的示意图;
图6是本申请实施例在语音评论中的图形用户界面的示意图;
图7是本申请实施例在语音评论后的图形用户界面的示意图;
图8是本申请实施例的用户终端在听取语音评论的图形用户界面的示意图;
图9是本申请实施例点击文本评论后的图形用户界面的示意图;
图10是本申请实施例提交文本评论后的图形用户界面的示意图
图11是本申请实施例的电子设备的示意图。
具体实施方式
以下基于实施例对本申请进行描述,但是本申请并不仅仅限于这些实施例。在下文对本申请的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本申请。为了避免混淆本申请的实质内容,公知的方法、过程、流程、元件和电路并没有详细叙述。
此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
下面结合附图对本申请进行详细说明。
图1是本申请实施例的评论系统的框图。如图1所示,本实施例的系统100可以包括多个用户终端101,网络102以及内容服务器103。用户终端101和内容服务器103通过网络102连接。网络102用于为用户终端101与内容服务器103之间提供通信。网络102可以为局域网(LAN)或广域网(WAN),可以为基于有线连接接入的网络或无线连接接入的网络。优选地,网络102采用基于无线连接接入的互联网。
用户终端101用于获取用户对某一指定的信息实体进行评论时输入的语音信息,获取与所述语音信息对应的文本信息,然后将语音信息、通过语音识别转换过来的文本信息以及指定的信息实体的唯一标识转换为评论信息发送给内容服务器103。内容服务器103用于存储所有的评论信息。评论信息可以存储在内容服务器103的数据库中。内容服务器103还用于生成评论列表,用户终端101访问评论列表以“浏览”评论信息。在评论列表中除了文字信息外,还包括将连接到语音信息的播放控件,用户可以阅读通过语音识别转换过来的文本信息或点击播放控件播放语音信息,以不同的方式来获取评论所传达的信息。
在本实施例中,用户终端101可以为载入预定应用程序的通用数据处理设备,例如,智能移动终端、智能电视、或通用计算机等。用户终端101可以在应用程序(例如,社交类应用程序、视频类应用程序、电子商务类应用程序以及线上至线下服务类应用程序)的控制下访问内容服务器103浏览不同类别的信息实体。具体地,信息实体包括视频、音频、图片、文字或其任意的组合。通过应用程序,用户终端101可以与内容服务器103交互,上传评论信息。在本实施例中,以语音方式输入的评论信息可以最终以播放控件和通过语音识别转换过来的文本信息的形式发布,供其它用户进行查看和评论。应理解,内容服务器103也可仅用于存储和处理评论信息,而需要展示的信息实体由其他的服务器来进行存储和处理。
内容服务器103可以是通用数据处理设备。由于内容服务器103在接收到由用户终端101发送的语音信息和通过语音识别转换过来的文本信息后需要对信息进行解析、存储,并生成播放控件,因此一般来说内容服务器103应具备较大的存储能力和较好的数据处理能力。应理解,内容服务器103可以是集中连接的一个或多个服务器,也可以是以分布式方式相互通信连接的多个服务器集群。
图2是本申请实施例的对信息实体进行语音评论的方法的流程图。如图2所示,本实施例的方法包括以下步骤:
步骤S210、在用户输入进行评论的指令后,用户终端101获取用户输入的语音信息和当前展示的信息实体的唯一标识。
步骤S220、识别所述语音信息获取通过语音识别转换过来的文本信息。
步骤S230、用户终端101向内容服务器103发送评论信息。
步骤S240、内容服务器103根据评论信息中唯一标识将链接到所述语音信息的播放控件和通过语音识别转换过来的文本信息添加到对应的信息实体的评论列表中,所述播放控件用于播放所述语音信息。
步骤S250、内容服务器103向用户终端101发送所述信息实体的评论列表以供用户查看。
步骤S260、用户终端101显示当前展示的信息实体的评论列表。
具体地,在步骤S210中,用户在用户终端101当前展示的信息实体页面点击语音评论控件启动输入语音信息,点击语音评论结束控件结束语音信息的输入。由此,用户只需要在触控输入装置的相同位置点击两次,就可以完成评论的输入,而无需使用虚拟或实体键盘,极大地简化了评论的操作,实现了“一键”操作。
同时,本实施例的评论方式可以替代输入法来发布评论,用最简洁的操作来实现文字和语音的输入,完全不用使用软键盘或实体键盘,提高了操作效率。
同时,本实施例对于语音识别的触发还可以通过自动跳转在实现,在检测到对第一控件的操作时,开始获取语音信息,在检测到录制时间达到预定时限时,自动跳转启动进行识别以实现一键操作。
由此,在开始录制后,如果时间较长(例如达到60秒)则自动跳转生成待发布的视频数据,进一步简化操作。
用户终端101在获取语音信息的同时,还要获取当前展示的信息实体的唯一标识,以实现信息实体与语音信息的绑定。唯一标识使得后续可以标记评论信息是针对的哪一个信息实体作出的。
对于步骤S220,在本实施例中可以采用不同的方式来对语音信息进行识别。用户终端101可以调用语音识别应用程序接口(API)来获取通过语音识别转换过来的文本信息。语音识别应用程序接口可以是安装在用户终端101上的离线语音识别应用程序接口,也可以是在线语音识别应用程序接口。在图2中,通过在线语音识别应用程序接口访问一个语音识别服务器来进行语音识别。
具体地,在步骤S221,用户终端101向在线的语音服务器发送语音信息。
在步骤S222,在线的语音服务器向用户终端101返回语音识别获得的文本信息。
通过在线方式进行语音识别可以获得较高的识别精确度。在需要节省网络流量或网络环境不好时,也可以采用离线方式来进行识别。例如,离线方式可以在没有网络连接或连接语音识别服务器失败时采用。可以保证在不同的情况下用户输入均可以被识别。
在步骤S230中,在语音识别操作完成后,用户终端101将语音信息、语音识别获得的文本信息以及信息实体的唯一标识作为评论信息发送给内容服务器103,以便于服务器端对上述信息进行后续的处理。对应地,内容服务器103接收所述评论信息,将所述评论信息存储在数据库中。
在步骤S240中,内容服务器103根据接收的语音信息生成对应的播放控件。所述播放控件链接到所述语音信息,并用于播放所述语音信息。然后,内容服务器103将该播放控件和通过语音识别转换过来的文本信息按照预定顺序排列在唯一标识对应的信息实体的评论列表中形成新的评论列表。
在步骤S260中,所显示的评论列表包括文字信息以及链接到对应的语音信息的播放控件。用户对于播放控件的点击可以出发其播放所链接的语音信息。
由此,一方面可以直接使用语音输入评论,使得评论更加方便,另一方面,同时展示播放语音的播放控件和通过语音识别获得的文本信息,使得可以对于以语音形式输入的评论内容进行文本检索,并使得其它用户通过不同的方式获取评论包含的信息,提升了用户体验。同时,本申请公开的评论方法,可以替代常规的输入法发布评论,直接通过语音来输入文字和语音,有效地提高了信息输入效率。
图3示出了本申请实施例的方法在用户终端侧的流程。在用户终端侧,所述方法包括以下步骤:
步骤S310、获取用户输入的语音信息和当前展示的信息实体的唯一标识。
步骤S320、识别所述语音信息获取通过语音识别转换过来的文本信息。
步骤S330、向内容服务器发送评论信息。
步骤S340、显示当前展示的信息实体的评论列表。
在步骤S310中,当用户对于观看的信息实体需要发布自己的观点和评论时,用户可以输入语音评论指令。接收到该指令后,用户终端101进入语音录入状态。此时,用户可以对着用户终端101的话筒进行语音输入,并在语音输入完成时输入语音评论结束指令,形成一条语音信息。语音评论指令和语音评论结束指令可以通过不同的方式来输入。在一个可选实现方式中,可以通过点击语音评论控件来启动语音输入,通过点击位于相同位置的语音评论结束控件来结束语音输入。在另一个可选实现方式中,可以通过按压语音评论按钮后进行语音输入,在语音输入完成后松开语音评论按钮形成一条语音信息。在进行语音输入的同时或语音输入结束后,用户终端101还会获取当前展示的信息实体的唯一标识,即语音信息相对应的信息实体的唯一标识,将唯一标识与所述语音信息进行绑定。这使得后续可以将评论信息准确地展示于相对应的信息实体的评论列表中。
在步骤S320中,用户终端101在获取语音信息后,需要对所述语音信息进行识别以获取通过语音识别转换过来的文本信息。语音识别可以通过调用离线语音识别应用程序接口对所述语音信息进行识别。具体来说,用户终端101将获取的语音信息转换成MP3、AAC、WAV等格式的语音信息文件。通过调用离线语音识别应用程序接口获得通过语音识别转换过来的文本信息。可选地,本实施例选用的语音识别技术可以通过搜狗、科大讯飞、百度等第三方提供的离线语音识别引擎实现。用户终端101还可以将获取的语音信息转换成MP3、AAC、WAV等格式的语音信息文件。通过调用在线语音识别应用程序接口可以对语音信息文件进行识别,获得通过语音识别转换过来的文本信息。本实施例选用的语音识别技术可以通过搜狗、科大讯飞、百度等第三方提供的在线语音识别引擎实现。
在本实施例中,用户终端101除了可以通过输入语音信息获得评论信息外,也可以通过输入文本信息获得评论信息。用户可以根据使用环境以及需求选择进行评论的方式。同时,语音评论的方式也满足了老年人和残疾人的使用需求。用户可以摆脱输入法显示,可以通过简单的点击语音评论按钮以较高的效率进行语音评论,同时输入语音和文字,也可以通过播放语音信息而获取他人的评论信息,提高了应用的使用便捷性和操作效率。
在步骤S330中,在获取到通过语音识别转换过来的文本信息后,用户终端101将包括所述语音信息、语音识别获得的文本信息以及所述信息实体的唯一标识的评论信息发送给内容服务器103。
在服务器一侧,内容服务器103根据所述语音信息生成对应的播放控件。进而,将播放控件和通过语音识别转换过来的文本信息按照预定顺序排列到对应的信息实体的评论列表中。其中,所述预定顺序可以根据评论信息的发布时间、评论内容的时长、评论账号的活跃度等。播放控件用于播放所对应的语音信息,播放控件上可以显示对应的语音信息的时长。用户可以根据需求选择阅读通过语音识别转换过来的文本信息还是播放语音信息以获取评论内容。
内容服务器103将信息实体的评论列表返回给用户终端101后,在步骤S340中,用户终端101显示评论列表。其中,评论列表包括新上传的通过语音识别转换过来的文本信息和链接到对应的语音信息的播放控件。所述播放控件用于播放所述文本信息对应的语音信息。可选地,所述评论列表以信息流方式显示具有相同唯一标识的评论信息。不同评论信息的通过语音识别转换过来的文本信息和播放控件按照预定顺序排列。其中预定顺序可以根据评论信息的发布时间、评论内容的时长、评论账号的活跃度等确定。用户可以根据自己的需求选择不同的评论排序方式。当用户点击某一个评论信息的播放控件时,该播放控件对应的语音信息就会进行播放。
在本实施例中,用户也可以对评论的信息流进行播放。响应于用户对信息流的播放请求,用户终端101就会按照用户所选择的预定顺序播放评论列表中的多个评论信息对应的语音信息。按照预定顺序播放可以是连续播放同一用户的评论,也可以播放所有的热门回帖,或者播放所有回复,还可以是播放其它的评论。这样,用户根据自己的喜好一键操作获取所关心的评论的信息,提高了操作效率。
图4示出了本申请实施例的方法在内容服务器一侧的流程。所述方法具体地包括以下步骤:
步骤S410、获取评论信息,所述评论信息包括语音信息、语音识别获得的文本信息以及信息实体的唯一标识。
步骤S420、根据所述唯一标识将链接到所述语音信息的播放控件和语音识别获得的文本信息添加到所述信息实体的评论列表中,所述播放控件用于播放所述文本信息对应的语音信息。
步骤S430、发送所述信息实体的评论列表以供用户查看。
在步骤S410中,用户终端101将该语音信息和通过语音识别转换过来的文本信息以及信息实体的唯一标识发送给内容服务器103。内容服务器103接收上述信息,形成评论信息。
在步骤S420中,内容服务器103根据所述语音信息生成播放控件,并根据唯一标识将播放控件和通过语音识别转换过来的文本信息按照预定顺序排列在所述信息实体的评论列表中。
本实施例的对信息实体进行语音评论的方法可以通过如图5-图8所示的例子进一步详细解释。图5-图8示出了对于用户终端中某一应用程序中的图片进行评论的详细过程。其中,该图形用户界面包括信息实体展示单元510和评论列表单元520。在信息实体展示单元510中,展示如视频、图片、音频或文字等信息实体,每一个所展示的信息实体都具有唯一标识。评论列表单元520中则展示关于该信息实体的评论信息。评论信息包括通过语音识别转换过来的文本信息和对应的播放控件。播放控件与对应的网络地址连接,链接到所对应的语音信息。点击播放控件时就可以播放对应的语音信息。评论列表单元520还设置有语音评论控件521和文本评论控件522。语音评论控件521设置于图像用户界面底部的中间位置,文本评论控件522设置于语音评论控件521的一侧,如图5所示。
当用户终端检测到用户点击语音评论控件521时,切换到可录入语音状态,并显示语音评论结束控件523。此时,用户可以通过话筒进行语音评论,如图6所示。用户终端检测到用户点击可语音评论结束控件523,结束录入,并开始进行语音识别,获取通过语音识别转换过来的文本信息,然后发送给内容服务器103。内容服务器103向用户终端101返回评论列表。用户终端101以信息流的方式显示更新后的评论列表,如图7所示。在用户终端侧,在检测到用户点击播放控件时,播放对应的语音信息,如图8所示。同时,也可以点击相应的控件链接到对应的评论界面对该评论信息进行再次评论。
当用户终端正在展示信息实体(例如短视频)时,用户还可以通过点击文本评论控件522后跳转到对应的文本录入状态,通过软键盘进行文本信息录入,录入完成后经过内容服务器103排列在该图片的评论列表内,如图9-图10所示。
本申请通过获取用户输入的语音信息和当前展示的信息实体的唯一标识,并对所述语音信息进行识别获取通过语音识别转换过来的文本信息,将包括所述语音信息、通过语音识别转换过来的文本信息以及所述唯一标识的评论信息发送给内容服务器后,显示当前展示的信息实体的评论列表,所述评论列表包括新上传的通过语音识别转换过来的文本信息和对应的播放控件,所述播放控件用于播放所述文本信息对应的语音信息。本申请通过输入语音并输出语音和对应文本的方式,使得评论更加方便,提高了用户的使用体验。
图11是本申请实施例的电子设备的示意图。图11所示的电子设备为通用数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器91和存储器92。处理器91和存储器92通过总线93连接。存储器92适于存储处理器91可执行的指令或程序。处理器91可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器91通过执行存储器92所存储的指令,从而执行如上所述的本申请实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线93将上述多个组件连接在一起,同时将上述组件连接到显示控制器94和显示装置以及输入/输出(I/O)装置95。输入/输出(I/O)装置95可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出装置95通过输入/输出(I/O)控制器96与系统相连。优选地,本实施例的电子设备为服务器。
同时,如本领域技术人员将意识到的,本申请实施例的各个方面可以被实现为系统、方法或计算机程序产品。因此,本申请实施例的各个方面可以采取如下形式:完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微代码等)或者在本文中通常可以都称为“电路”、“模块”或“系统”的将软件方面与硬件方面相结合的实施方式。此外,本申请的方面可以采取如下形式:在一个或多个计算机可读介质中实现的计算机程序产品,计算机可读介质具有在其上实现的计算机可读程序代码。
可以利用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是如(但不限于)电子的、磁的、光学的、电磁的、红外的或半导体系统、设备或装置,或者前述的任意适当的组合。计算机可读存储介质的更具体的示例(非穷尽列举)将包括以下各项:具有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储装置、磁存储装置或前述的任意适当的组合。在本发申请实施例的上下文中,计算机可读存储介质可以为能够包含或存储由指令执行系统、设备或装置使用的程序或结合指令执行系统、设备或装置使用的程序的任意有形介质。
计算机可读信号介质可以包括传播的数据信号,所述传播的数据信号具有在其中如在基带中或作为载波的一部分实现的计算机可读程序代码。这样的传播的信号可以采用多种形式中的任何形式,包括但不限于:电磁的、光学的或其任何适当的组合。计算机可读信号介质可以是以下任意计算机可读介质:不是计算机可读存储介质,并且可以对由指令执行系统、设备或装置使用的或结合指令执行系统、设备或装置使用的程序进行通信、传播或传输。
可以使用包括但不限于无线、有线、光纤电缆、RF等或前述的任意适当组合的任意合适的介质来传送实现在计算机可读介质上的程序代码。
用于执行针对本申请各方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合来编写,所述编程语言包括:面向对象的编程语言如Java、Smalltalk、C++等;以及常规过程编程语言如“C”编程语言或类似的编程语言。程序代码可以作为独立软件包完全地在用户计算机上、部分地在用户计算机上执行;部分地在用户计算机上且部分地在远程计算机上执行;或者完全地在远程计算机或服务器上执行。在后一种情况下,可以将远程计算机通过包括局域网(LAN)或广域网(WAN)的任意类型的网络连接至用户计算机,或者可以与外部计算机进行连接(例如通过使用因特网服务供应商的因特网)。
上述根据本申请实施例的方法、设备(系统)和计算机程序产品的流程图图例和/或框图描述了本申请的各个方面。将要理解的是,流程图图例和/或框图的每个块以及流程图图例和/或框图中的块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供至通用计算机、专用计算机或其它可编程数据处理设备的处理器,以产生机器,使得(经由计算机或其它可编程数据处理设备的处理器执行的)指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。
还可以将这些计算机程序指令存储在可以指导计算机、其它可编程数据处理设备或其它装置以特定方式运行的计算机可读介质中,使得在计算机可读介质中存储的指令产生包括实现在流程图和/或框图块或块中指定的功能/动作的指令的制品。
计算机程序指令还可以被加载至计算机、其它可编程数据处理设备或其它装置上,以使在计算机、其它可编程设备或其它装置上执行一系列可操作步骤来产生计算机实现的过程,使得在计算机或其它可编程设备上执行的指令提供用于实现在流程图和/或框图块或块中指定的功能/动作的过程。
以上所述仅为本申请的优选实施例,并不用于限制本申请,对于本领域技术人员而言,本申请可以有各种改动和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (11)
1.一种对信息实体进行语音评论的方法,包括:
获取用户输入的语音信息和当前展示的信息实体的唯一标识;
识别所述语音信息获取通过语音识别转换过来的文本信息;
向内容服务器发送评论信息,所述评论信息包括所述语音信息、通过语音识别转换过来的文本信息以及所述唯一标识;
显示当前展示的信息实体的评论列表,所述评论列表包括新上传的通过语音识别转换过来的文本信息和对应的播放控件,所述播放控件用于播放所述通过语音识别转换过来的文本信息对应的语音信息。
2.根据权利要求1所述的方法,其特征在于,在检测到对第一控件的操作时,开始获取所述语音信息,在检测到对位于相同位置的第二控件的操作时,结束获取语音信息以实现一键操作完成语音录制和发布包括通过语音识别转换过来的文本信息和对应的播放控件的内容。
3.根据权利要求1所述的方法,其特征在于,在检测到对第一控件的操作时,开始获取所述语音信息,在检测到录制时间达到预定时限时,结束获取语音信息以实现一键操作完成语音录制和发布包括通过语音识别转换过来的文本信息和对应的播放控件的内容。
4.根据权利要求1所述的方法,其特征在于,所述识别所述语音信息获取通过语音识别转换过来的文本信息包括:
向在线的语音识别服务器发送所述语音信息并接收通过语音识别转换过来的文本信息;或者
调用离线语音识别应用程序接口对所述语音信息进行识别。
5.根据权利要求1所述的方法,其特征在于,所述显示当前展示的信息实体的评论列表包括:
以信息流方式显示具有相同唯一标识的多个评论信息中通过语音识别转换过来的文本信息和播放控件,所述播放控件用于播放所述通过语音识别转换过来的文本信息对应的语音信息。
6.根据权利要求5所述的方法,其特征在于,所述多个评论信息按照预定顺序排列。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
响应于对信息流的播放请求,按预定顺序播放评论列表中多个评论信息对应的语音信息。
8.根据权利要求1所述的方法,其特征在于,所述信息实体包括视频信息、图片信息、音频信息、文本信息以及评论信息。
9.一种对信息实体进行语音评论的方法,包括:
获取评论信息,所述评论信息包括语音信息、通过语音识别转换过来的文本信息以及信息实体的唯一标识;
根据所述语音信息生成播放控件,并将所述播放控件和通过语音识别转换过来的文本信息添加到所述信息实体的评论列表中,所述播放控件用于播放所述语音信息;
发送所述信息实体的评论列表以供用户查看。
10.一种计算机可读存储介质,其上存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如权利要求1-9任一项所述的方法。
11.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711388103.XA CN107967104A (zh) | 2017-12-20 | 2017-12-20 | 对信息实体进行语音评论的方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711388103.XA CN107967104A (zh) | 2017-12-20 | 2017-12-20 | 对信息实体进行语音评论的方法和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107967104A true CN107967104A (zh) | 2018-04-27 |
Family
ID=61995649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711388103.XA Pending CN107967104A (zh) | 2017-12-20 | 2017-12-20 | 对信息实体进行语音评论的方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107967104A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108597522A (zh) * | 2018-05-10 | 2018-09-28 | 北京奇艺世纪科技有限公司 | 一种语音处理方法及装置 |
CN109343696A (zh) * | 2018-08-21 | 2019-02-15 | 咪咕数字传媒有限公司 | 一种电子书的评论方法、装置及计算机可读存储介质 |
CN110221760A (zh) * | 2019-06-24 | 2019-09-10 | 梁舒云 | 一种生成拖拽式图片语音标签的方法 |
CN110379406A (zh) * | 2019-06-14 | 2019-10-25 | 北京字节跳动网络技术有限公司 | 语音评论转换方法、系统、介质和电子设备 |
CN110377191A (zh) * | 2019-06-14 | 2019-10-25 | 北京字节跳动网络技术有限公司 | 语音评论交互方法、系统、介质和电子设备 |
CN110413834A (zh) * | 2019-06-14 | 2019-11-05 | 北京字节跳动网络技术有限公司 | 语音评论修饰方法、系统、介质和电子设备 |
CN110620718A (zh) * | 2018-06-19 | 2019-12-27 | 中移(杭州)信息技术有限公司 | 音频文件的评论方法及装置 |
CN110851650A (zh) * | 2019-11-11 | 2020-02-28 | 腾讯科技(深圳)有限公司 | 一种评论输出方法、装置、以及计算机存储介质 |
CN110968673A (zh) * | 2019-12-04 | 2020-04-07 | 北京明略软件系统有限公司 | 一种语音评论的播放方法、装置、语音设备及存储介质 |
CN111259181A (zh) * | 2018-12-03 | 2020-06-09 | 连尚(新昌)网络科技有限公司 | 用于展示信息、提供信息的方法和设备 |
CN111666280A (zh) * | 2020-04-27 | 2020-09-15 | 百度在线网络技术(北京)有限公司 | 评论的排序方法、装置、设备和计算机存储介质 |
CN113946230A (zh) * | 2021-09-01 | 2022-01-18 | 北京新氧科技有限公司 | 一种文字与语音的混合输入方法、装置、电子设备及存储介质 |
CN114762357A (zh) * | 2019-12-06 | 2022-07-15 | 索尼集团公司 | 信息处理系统、信息处理方法以及存储介质 |
CN114760257A (zh) * | 2021-01-08 | 2022-07-15 | 上海博泰悦臻网络技术服务有限公司 | 一种点评方法、电子设备及计算机可读存储介质 |
CN115134615A (zh) * | 2021-03-29 | 2022-09-30 | 北京字节跳动网络技术有限公司 | 语音评论信息处理方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104125483A (zh) * | 2014-07-07 | 2014-10-29 | 乐视网信息技术(北京)股份有限公司 | 音频评论信息生成方法和装置,音频评论播放方法和装置 |
CN104714937A (zh) * | 2015-03-30 | 2015-06-17 | 北京奇艺世纪科技有限公司 | 一种评论信息发布方法及装置 |
CN107038023A (zh) * | 2016-02-02 | 2017-08-11 | 腾讯科技(深圳)有限公司 | 互动评论的交互方法和装置 |
-
2017
- 2017-12-20 CN CN201711388103.XA patent/CN107967104A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104125483A (zh) * | 2014-07-07 | 2014-10-29 | 乐视网信息技术(北京)股份有限公司 | 音频评论信息生成方法和装置,音频评论播放方法和装置 |
CN104714937A (zh) * | 2015-03-30 | 2015-06-17 | 北京奇艺世纪科技有限公司 | 一种评论信息发布方法及装置 |
CN107038023A (zh) * | 2016-02-02 | 2017-08-11 | 腾讯科技(深圳)有限公司 | 互动评论的交互方法和装置 |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108597522A (zh) * | 2018-05-10 | 2018-09-28 | 北京奇艺世纪科技有限公司 | 一种语音处理方法及装置 |
CN110620718A (zh) * | 2018-06-19 | 2019-12-27 | 中移(杭州)信息技术有限公司 | 音频文件的评论方法及装置 |
CN109343696B (zh) * | 2018-08-21 | 2022-03-25 | 咪咕数字传媒有限公司 | 一种电子书的评论方法、装置及计算机可读存储介质 |
CN109343696A (zh) * | 2018-08-21 | 2019-02-15 | 咪咕数字传媒有限公司 | 一种电子书的评论方法、装置及计算机可读存储介质 |
CN111259181A (zh) * | 2018-12-03 | 2020-06-09 | 连尚(新昌)网络科技有限公司 | 用于展示信息、提供信息的方法和设备 |
CN111259181B (zh) * | 2018-12-03 | 2024-04-12 | 连尚(新昌)网络科技有限公司 | 用于展示信息、提供信息的方法和设备 |
CN110379406A (zh) * | 2019-06-14 | 2019-10-25 | 北京字节跳动网络技术有限公司 | 语音评论转换方法、系统、介质和电子设备 |
CN110377191A (zh) * | 2019-06-14 | 2019-10-25 | 北京字节跳动网络技术有限公司 | 语音评论交互方法、系统、介质和电子设备 |
CN110413834A (zh) * | 2019-06-14 | 2019-11-05 | 北京字节跳动网络技术有限公司 | 语音评论修饰方法、系统、介质和电子设备 |
CN110413834B (zh) * | 2019-06-14 | 2022-07-05 | 北京字节跳动网络技术有限公司 | 语音评论修饰方法、系统、介质和电子设备 |
CN110379406B (zh) * | 2019-06-14 | 2021-12-07 | 北京字节跳动网络技术有限公司 | 语音评论转换方法、系统、介质和电子设备 |
CN110221760A (zh) * | 2019-06-24 | 2019-09-10 | 梁舒云 | 一种生成拖拽式图片语音标签的方法 |
CN110851650B (zh) * | 2019-11-11 | 2023-11-28 | 腾讯科技(深圳)有限公司 | 一种评论输出方法、装置、以及计算机存储介质 |
CN110851650A (zh) * | 2019-11-11 | 2020-02-28 | 腾讯科技(深圳)有限公司 | 一种评论输出方法、装置、以及计算机存储介质 |
CN110968673B (zh) * | 2019-12-04 | 2023-05-02 | 北京明略软件系统有限公司 | 一种语音评论的播放方法、装置、语音设备及存储介质 |
CN110968673A (zh) * | 2019-12-04 | 2020-04-07 | 北京明略软件系统有限公司 | 一种语音评论的播放方法、装置、语音设备及存储介质 |
CN114762357A (zh) * | 2019-12-06 | 2022-07-15 | 索尼集团公司 | 信息处理系统、信息处理方法以及存储介质 |
US11968432B2 (en) | 2019-12-06 | 2024-04-23 | Sony Group Corporation | Information processing system, information processing method, and storage medium |
CN111666280B (zh) * | 2020-04-27 | 2023-11-21 | 百度在线网络技术(北京)有限公司 | 评论的排序方法、装置、设备和计算机存储介质 |
CN111666280A (zh) * | 2020-04-27 | 2020-09-15 | 百度在线网络技术(北京)有限公司 | 评论的排序方法、装置、设备和计算机存储介质 |
CN114760257A (zh) * | 2021-01-08 | 2022-07-15 | 上海博泰悦臻网络技术服务有限公司 | 一种点评方法、电子设备及计算机可读存储介质 |
CN115134615A (zh) * | 2021-03-29 | 2022-09-30 | 北京字节跳动网络技术有限公司 | 语音评论信息处理方法、装置、电子设备及存储介质 |
CN113946230A (zh) * | 2021-09-01 | 2022-01-18 | 北京新氧科技有限公司 | 一种文字与语音的混合输入方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107967104A (zh) | 对信息实体进行语音评论的方法和电子设备 | |
JP6505117B2 (ja) | 模写によるデジタル携帯情報端末の対話、および応答時のリッチなマルチメディア | |
CN105955703B (zh) | 依赖于状态的查询响应 | |
CN103915095B (zh) | 语音识别的方法、交互设备、服务器和系统 | |
JP6467554B2 (ja) | メッセージ送信方法、メッセージ処理方法及び端末 | |
CN107430858A (zh) | 传送标识当前说话者的元数据 | |
US20090055186A1 (en) | Method to voice id tag content to ease reading for visually impaired | |
KR101673267B1 (ko) | 미디어 배포 플랫폼으로부터의 소셜 네트워크를 통한 피드백 제공 | |
CN113766253A (zh) | 基于虚拟主播的直播方法、装置、设备及存储介质 | |
CN107112013A (zh) | 用于创建可定制对话系统引擎的平台 | |
CN106133826A (zh) | 用于语言模型自定义的灵活模式 | |
US20170249934A1 (en) | Electronic device and method for operating the same | |
TW200900966A (en) | Client input method | |
CN108063722A (zh) | 视频数据生成方法、计算机可读存储介质和电子设备 | |
CN103168298A (zh) | 基于搜索引擎推断的虚拟协助 | |
CN106534276A (zh) | 数据分享方法及装置、移动终端 | |
CN105426103A (zh) | 一种移动设备上消息编辑方法和装置 | |
CN109643540A (zh) | 用于人工智能语音演进的系统和方法 | |
US11282523B2 (en) | Voice assistant management | |
JP2014067366A (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
CN110311858A (zh) | 一种发送会话消息的方法与设备 | |
CN108139895A (zh) | 字体字型预览 | |
JP2023517124A (ja) | 歌の処理方法、歌の処理装置、電子機器、及びコンピュータプログラム | |
CN103581700B (zh) | 音视频点播方法、服务器、终端以及系统 | |
CN109428908A (zh) | 信息显示方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180427 |