CN114664306A - 一种编辑文本的方法、电子设备和系统 - Google Patents
一种编辑文本的方法、电子设备和系统 Download PDFInfo
- Publication number
- CN114664306A CN114664306A CN202011529621.0A CN202011529621A CN114664306A CN 114664306 A CN114664306 A CN 114664306A CN 202011529621 A CN202011529621 A CN 202011529621A CN 114664306 A CN114664306 A CN 114664306A
- Authority
- CN
- China
- Prior art keywords
- text content
- electronic device
- content
- text
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 98
- 230000004044 response Effects 0.000 claims description 110
- 230000006870 function Effects 0.000 claims description 54
- 230000015654 memory Effects 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 17
- 230000004048 modification Effects 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 38
- 230000006854 communication Effects 0.000 description 38
- 101100264195 Caenorhabditis elegans app-1 gene Proteins 0.000 description 34
- 239000010410 layer Substances 0.000 description 21
- 238000007726 management method Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 21
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 238000010295 mobile communication Methods 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 11
- 210000000988 bone and bone Anatomy 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 9
- 235000019633 pungent taste Nutrition 0.000 description 8
- 230000036651 mood Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 235000012149 noodles Nutrition 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000036772 blood pressure Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
本申请提供了一种编辑文本的方法、电子设备和系统,该方法包括:设备A获取音频内容;设备A向设备B发送第一信息,该第一信息为该音频内容,或者,该第一信息为该音频内容对应的第一文本内容;设备B根据该第一信息,显示该第一文本内容;设备B响应于用户对该第一文本内容的编辑操作,显示第二文本容,该第二文本内容为对该第一文本内容编辑后的文本内容。本申请实施例,有助于提升用户对文本内容的编辑效率。
Description
技术领域
本申请涉及终端领域,并且更具体地,涉及一种编辑文本的方法、电子设备和系统。
背景技术
语音识别(automatic speech recognition,ASR)技术已经被广泛使用,非常大程度提高了人们做纪要的效率,但是由于某些条件下,ASR技术无法做到100%的准确,就需要人为对ASR结果进行人工编辑后才能使用。但是一般情况下,ASR模块都存在手机这样的便捷移动设备上,它没有相对人类交互比较友好的屏幕显示和输入方式,使得ASR结果的编辑效率低下。
发明内容
本申请提供一种编辑文本的方法、电子设备和系统,有助于提升用户对文本编辑的编辑效率。
第一方面,提供了一种系统,该系统包括第一电子设备和第二电子设备,其中,该第一电子设备用于获取音频内容;该第一电子设备还用于向该第二电子设备发送第一信息,该第一信息为该音频内容,或者,该第一信息为该音频内容对应的第一文本内容;该第二电子设备用于根据该第一信息,显示该第一文本内容;该第二电子设备还用于响应于用户对该第一文本内容的编辑操作,显示第二文本容,该第二文本内容为对该第一文本内容编辑后的文本内容。
本申请实施例中,第一电子设备可以将获取的音频内容对应的文本内容发送给第二电子设备,从而使得该文本内容可以显示在第二电子设备上,从而方便用户在第二电子设备上对文本内容进行编辑,从而有助于提升用户在编辑文本内容时的效率。
在一些可能的实现方式中,第一电子设备中可以保存有一个或者多个电子设备的信息,当第一电子设备获取音频时,第一电子设备可以从该一个或者多个电子设备选择一个合适进行文本编辑的第二电子设备,从而将第一信息发送给第二电子设备。
在一些可能的实现方式中,第二电子设备响应于接收到该第一信息,可以打开第一应用程序,并在该第一应用程序中显示该第一文本内容;第二电子设备可以通过第二电子设备的输入法对该第一文本内容进行编辑。
结合第一方面,在第一方面的某些实现方式中,该第二电子设备还用于向该第一电子设备发送该第二文本内容。
在一些可能的实现方式中,该第二电子设备还用于在检测到用户的第一操作时,向该第一电子设备发送该第二文本内容。
在一些可能的实现方式中,该第一操作为用户点击保存的操作。
本申请实施例中,第二电子设备可以获取到用户编辑后的文本内容后向第一电子设备发送编辑后的文本内容,从而使得第一电子设备可以保存该编辑后的文本内容。无需用户的额外操作,就可使得第一电子设备也可以获得编辑后的文本内容
结合第一方面,在第一方面的某些实现方式中,该编辑操作包括对该第一文本内容的格式修改操作,其中,该第二电子设备,还用于向该第一电子设备发送该第二文本内容的格式信息。
本申请实施例中,当用户修改了文本内容的格式时,第二电子设备还可以向第一电子设备发送编辑后的文本内容的格式信息,从而使得第一电子设备根据该格式信息还原第二电子设备上用户编辑后的文本内容。
结合第一方面,在第一方面的某些实现方式中,该第二文本内容的格式信息包括该第二文本内容的字体颜色、字体大小、字体背景色、字体倾斜、字体下划线以及该第二文本内容中的回车操作种的一种或者多种。
结合第一方面,在第一方面的某些实现方式中,该第一电子设备,还用于:在接收该第二电子设备发送的该第二文本内容之前,根据该音频内容,显示该第一文本内容;在接收该第二电子设备发送的该第二文本内容之后,使用该第二文本内容替换该第一文本内容。
本申请实施例中,第一电子设备可以在获取该音频内容时显示对应的第一文本内容,在第一电子设备接收到第二电子设备发送的用户编辑后的第二文本内容后,第一电子设备可以使用第二文本内容替换之前的第一文本内容,从而方便用户在第一电子设备和第二电子设备上同时观看到编辑后的文本内容,有助于提高用户的体验。
结合第一方面,在第一方面的某些实现方式中,该第一电子设备还用于发送查询请求,该查询请求用于接收到该查询请求的设备确定是否具有文本编辑功能;响应于接收到该第二电子设备发送的响应,向该第二电子设备发送该第一信息,该响应用于指示该第二电子设备具备文本编辑功能。
本申请实施例中,第一电子设备可以在向第二电子设备发送第一信息之前,查询具备文本编辑功能的设备。第一电子设备在确定第二电子设备具备文本编辑功能后,可以向该第二电子设备发送该第一信息,从而方便用户在第二电子设备上对文本内容进行编辑,有助于提升用户在文本编辑时的效率。
结合第一方面,在第一方面的某些实现方式中,该第二电子设备具体用于:响应于接收到该第一信息,提示用户是否在该第二电子设备上进行文本编辑;响应于用户确定在该第二电子设备上进行文本编辑的操作,显示该第一文本内容。
本申请实施例中,第二电子设备在接收到该第一信息时,可以先提示用户是否同意在第二电子设备上进行文本编辑。若第二电子设备检测到用户同意的操作,则可以显示该文本内容,这样有助于避免对用户造成干扰,用户可以选择一个自己认为合适的设备进行文本编辑,有助于提升用户的体验。
在一些可能的实现方式中,该第一电子设备还可以向第二电子设备发送请求信息,该请求信息用于请求第二电子设备对该第一文本内容进行编辑;第二电子设备可以响应于该请求信息,提示用户是否同意在第二电子设备上对文本内容进行编辑;若第二电子设备检测到用户同意在第二电子设备上对文本内容进行编辑的操作,第二电子设备可以显示该第一文本内容。
结合第一方面,在第一方面的某些实现方式中,该第一信息为该第一文本内容,该第一电子设备具体用于:响应于获取到该音频内容,将该音频内容转化为该第一文本内容;向该第二电子设备发送该第一文本内容。
本申请实施例中,第一电子设备可以在获取音频内容后,将该音频内容转化为文本内容,从而向第二电子设备发送该文本内容,第二电子设备可以显示对应的文本内容,从而方便用户对文本内容进行编辑。
结合第一方面,在第一方面的某些实现方式中,该第一信息为该音频内容,该第二电子设备具体用于:响应于接收到该音频内容,将该音频内容转化为该第一文本内容;显示该第一文本内容。
本申请实施例中,第一电子设备可以将获取到的音频内容发送给第二电子设备,第二电子设备可以将音频内容转化为文本内容后显示该文本内容,从而方便用户对文本内容进行编辑。
结合第一方面,在第一方面的某些实现方式中,该第一电子设备的账号和该第二电子设备的账号相关联。
第二方面,提供了一种文本编辑的方法,该方法应用于第一电子设备,该方法包括:该第一电子设备获取音频内容;该第一电子设备向第二电子设备发送第一信息,该第一信息为该音频内容,或者,该第一信息为该音频内容对应的第一文本内容,以使得该第二电子设备根据该第一信息显示该第一文本内容并检测用户对该第一文本内容的编辑操作。
结合第二方面,在第二方面的某些实现方式中,该方法还包括:该第一电子设备接收该第二电子设备发送的第二文本内容,该第二文本内容为用户在该第二电子设备上对该第一文本内容进行编辑后的文本内容。
结合第二方面,在第二方面的某些实现方式中,该方法还包括:该第一电子设备接收该第二电子设备发送的该第二文本内容的格式信息。
结合第二方面,在第二方面的某些实现方式中,该第二文本内容的格式信息包括该第二文本内容的字体颜色、字体大小、字体背景色、字体倾斜、字体下划线以及该第二文本内容中的回车操作种的一种或者多种。
结合第二方面,在第二方面的某些实现方式中,该方法还包括:在接收该第二电子设备发送的该第二文本内容之前,该第一电子设备根据该音频内容,显示该第一文本内容;在接收该第二电子设备发送的该第二文本内容之后,该第一电子设备使用该第二文本内容替换该第一文本内容。
结合第二方面,在第二方面的某些实现方式中,该方法包括:在向该第二电子设备发送该第一信息之前,该第一电子设备发送查询请求,该查询请求用于接收到该查询请求的设备确定是否具有文本编辑功能;响应于接收到该第二电子设备发送的响应,该第一电子设备向该第二电子设备发送该第一信息,该响应用于指示该第二电子设备具备文本编辑功能。
结合第二方面,在第二方面的某些实现方式中,该第一信息为该第一文本内容,该方法还包括:响应于获取到该音频内容,该第一电子设备将该音频内容转化为该第一文本内容;该第一电子设备向该第二电子设备发送该第一文本内容。
结合第二方面,在第二方面的某些实现方式中,该第一电子设备的账号和该第二电子设备的账号相关联。
第三方面,提供了一种文本编辑的方法,该方法应用于第二电子设备,该方法包括:该第二电子设备接收第一电子设备发送的第一信息,该第一信息为该第一电子设备获取的音频内容,或者,该第一信息为该音频内容对应的第一文本内容;该第二电子设备根据该第一信息,显示该第一文本内容;响应于用户对该第一文本内容的编辑操作,该第二电子设备显示第二文本容,该第二文本内容为对该第一文本内容编辑后的文本内容。
结合第三方面,在第三方面的某些实现方式中,该方法还包括:该第二电子设备向该第一电子设备发送该第二文本内容。
结合第三方面,在第三方面的某些实现方式中,该编辑操作包括对该第一文本内容的格式修改操作,该方法还包括:该第二电子设备向该第一电子设备发送该第二文本内容的格式信息。
结合第三方面,在第三方面的某些实现方式中,该第二文本内容的格式信息包括该第二文本内容的字体颜色、字体大小、字体背景色、字体倾斜、字体下划线以及该第二文本内容中的回车操作种的一种或者多种。
结合第三方面,在第三方面的某些实现方式中,该方法还包括:在接收该第一电子设备发送的该第一信息之前,该第二电子设备接收该第一电子设备发送的查询请求,该查询请求该第二电子设备确定是否具有文本编辑功能;该第二电子设备向该第一电子设备发送响应,该响应用于指示该第二电子设备具备文本编辑功能。
结合第三方面,在第三方面的某些实现方式中,该第二电子设备根据该第一信息,显示该第一文本内容,包括:响应于接收到该第一信息,该第二电子设备提示用户是否在该第二电子设备上进行文本编辑;响应于用户确定在该第二电子设备上进行文本编辑的操作,该第二电子设备显示该第一文本内容。
结合第三方面,在第三方面的某些实现方式中,该第一信息为该音频内容,该第二电子设备显示该第一文本内容之前,该方法还包括:响应于接收到该音频内容,将该音频内容转化为该第一文本内容。
结合第三方面,在第三方面的某些实现方式中,该第一电子设备的账号和该第二电子设备的账号相关联。
第四方面,提供了一种装置,该装置包括:获取单元,用于获取音频内容;发送单元,用于向第二电子设备发送第一信息,该第一信息为该音频内容,或者,该第一信息为该音频内容对应的第一文本内容,以使得该第二电子设备根据该第一信息显示该第一文本内容并检测用户对该第一文本内容的编辑操作。
第五方面,提供了一种装置,该装置包括:接收单元,用于接收第一电子设备发送的第一信息,该第一信息为该第一电子设备获取的音频内容,或者,该第一信息为该音频内容对应的第一文本内容;显示单元,用于根据该第一信息,显示该第一文本内容;检测单元,用于检测用户对该第一文本内容的编辑操作;显示单元,还用于显示第二文本容,该第二文本内容为对该第一文本内容编辑后的文本内容。
第六方面,提供了一种电子设备,包括:一个或多个处理器;存储器;以及一个或多个计算机程序。其中,一个或多个计算机程序被存储在存储器中,一个或多个计算机程序包括指令。当指令被电子设备执行时,使得电子设备执行上述第二方面中任一项可能的实现中的方法。
第七方面,提供了一种电子设备,包括:一个或多个处理器;存储器;以及一个或多个计算机程序。其中,一个或多个计算机程序被存储在存储器中,一个或多个计算机程序包括指令。当指令被电子设备执行时,使得电子设备执行上述第三方面中任一项可能的实现中的方法。
第八方面,提供了一种包含指令的计算机程序产品,当所述计算机程序产品在第一电子设备上运行时,使得所述电子设备执行上述第二方面所述的方法;或者,当所述计算机程序产品在第二电子设备上运行时,使得所述电子设备执行上述第三方面所述的方法。
第九方面,提供了一种计算机可读存储介质,包括指令,当所述指令在第一电子设备上运行时,使得所述电子设备执行上述第二方面所述的方法;或者,当所述指令在第二电子设备上运行时,使得所述电子设备执行上述第三方面所述的方法。
第十方面,提供了一种芯片用于执行指令,当所述芯片运行时,所述芯片执行上述第二方面所述的方法;或者,所述芯片执行上述第三方面所述的方法。
附图说明
图1是本申请实施例提供的一种电子设备的硬件结构示意图。
图2是本申请实施例提供的软件结构框图。
图3是本申请实施例提供的一组图形用户界面。
图4是本申请实施例提供的另一组图形用户界面。
图5是本申请实施例提供的另一组图形用户界面。
图6是本申请实施例提供的另一组图形用户界面。
图7是本申请实施例提供的另一组图形用户界面。
图8是本申请实施例提供的另一组图形用户界面。
图9是本申请实施例提供的另一组图形用户界面。
图10是本申请实施例提供的另一组图形用户界面。
图11是本申请实施例提供的系统架构的示意图。
图12是本申请实施例提供的调文本编辑的方法的示意性流程图。
图13是本申请实施例提供的另一系统架构的示意图。
图14是本申请实施例提供的装置的示意性结构图。
图15是本申请实施例提供的装置的另一示意性结构图。
图16是本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“复数个”或者“多个”是指两个或多于两个。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本申请实施例提供的方法可以应用于手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等电子设备上,本申请实施例对电子设备的具体类型不作任何限制。
示例性的,图1示出了电子设备100的结构示意图。电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户身份识别(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户身份识别(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(Bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,电子设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控面板”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用嵌入式SIM(embedded-SIM,eSIM)卡,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。
应理解,本申请实施例中的电话卡包括但不限于SIM卡、eSIM卡、全球用户识别卡(universal subscriber identity module,USIM)、通用集成电话卡(universalintegrated circuit card,UICC)等等。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。
图2是本申请实施例的电子设备100的软件结构框图。分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。应用程序层可以包括一系列应用程序包。
如图2所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图2所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(media libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
应理解,本申请实施例中的技术方案可以用于Android、IOS、鸿蒙等系统中。
图3是本申请实施例提供的一组图形用户界面(graphical user interface,GUI)。
参见图3中的(a)所示的GUI,该GUI为手机的桌面。其中,手机的桌面上包括多个应用程序的图标,该多个应用程序包括时钟、日历、图库、备忘录、文件管理、电子邮件、音乐和计算器等等。当手机检测到用户点击备忘录的图标的操作时,可以显示如图3中的(b)所示的GUI。
参见图3中的(b)所示的GUI,该GUI为备忘录应用的显示界面。该显示界面上显示有一条9月1日记录的笔记,该笔记的内容为“妈妈生日(9月28日)”。该显示界面上还包括创建新的笔记的控件301。当手机检测到用户点击控件301的操作时,手机可以显示如图3中的(c)所示的GUI。
参见图3中的(c)所示的GUI,该GUI为备忘录应用的另一显示界面。用户可以在该界面上编辑笔记的标题以及正文内容。该显示界面上还包括清单、文本编辑、插入图片、录音转文字以及手写控件。
参见图3中的(d)所示,当手机检测到用户点击录音转文字控件302的操作时,手机可以向笔记本电脑发送请求信息,该请求信息用于请求笔记本电脑对手机获取的语音内容对应为文本内容进行编辑。响应于接收到该请求信息,笔记本电脑可以显示提醒框303,其中提醒框303中包括提示信息“检测到手机正在进行录音转文字,是否在笔记本电脑上进行文字编辑”。
参见图3中的(e)所示,笔记本电脑响应于用户点击控件304的操作,可以启动App1。其中App1是可以进行文本编辑的应用程序。手机响应于用户点击控件302的操作,可以对环境中的语音内容进行检测,并将检测到的语音内容转化为文本内容。在手机将语音内容转化为文本内容后,手机还可以向笔记本电脑发送转化的文本内容。从而使得手机的备忘录应用的显示界面和笔记本电脑的App1显示界面上同时显示该文本内容“热度再变…社会心态”。
一个实施例中,手机中可以包括麦克风和语音识别(automatic speechrecognition,ASR)模块,其中,麦克风用于采集环境中的语音内容,ASR模块的作用是将接收到的语音内容转化为文本内容。
一个实施例中,笔记本电脑的App1显示界面上和手机的备忘录应用显示界面上的文本内容可以是实时同步的。示例性的,手机可以按照一定的时间间隔(例如,5秒)将语音内容转化为文本内容。在0-5秒中手机将采集到的语音内容转化为文本内容“热度再变与不变中体现民生诉求”,从而手机可以在备忘录的显示界面上显示该文本内容,同时手机可以将该文本内容发送给笔记本电脑,从而笔记本电脑可以在App1的显示界面上显示该文本内容;在5-10秒中手机将采集到的语音内容转化为文本内容“光志智库我们刚刚统计得到2020年全国两会前夕”,从而手机可以在备忘录的显示界面上显示该文本内容,同时手机可以将该文本内容发送给笔记本电脑,从而笔记本电脑可以在App1的显示界面上显示该文本内容。
一个实施例中,笔记本电脑在开启App1后可以显示光标306,其中笔记本电脑在接收到手机发送的文本内容后,可以将光标306显示在文本内容的最后面。
参见图3中的(f)所示的GUI,手机可以继续检测语音内容并将该语音内容转化为文本内容。手机可以将文本内容实时同步到笔记本电脑的App1中。同时,笔记本电脑响应于用户的编辑操作,可以对App1中的文本内容进行编辑。例如,用户可以在手机发送的文本内容中增加内容(在“热度”前增加“1、”,在“光志智库”前增加“2、”)。又例如,用户可以修改文本内容不准确的内容(例如,将“名义”修改为“民意”,将“突破时”修改为“top10”)。又例如,用户还可以对文本内容的格式进行修改(例如,笔记本电脑在“名声诉求”后检测到用户回车的操作)。
如图3中的(f),响应于笔记本电脑检测到用户点击保存控件307的操作时,笔记本电脑可以将编辑后的文本内容发送给手机,从而使得手机在备忘录的显示界面上显示笔记本电脑上编辑后的文本内容。
一个实施例中,手机在检测到环境中的语音内容后将该语音内容转化为文本内容,并向笔记本电脑发送该文本内容,而手机可以不显示文本内容。当手机从笔记本电脑接收到编辑后的文本内容后,手机可以在备忘录应用的显示界面上显示该编辑后的文本内容。
一个实施例中,笔记本电脑在检测到用户将光标移动到需要进行编辑的位置后,可以对该位置附近的文本内容进行编辑。例如,当前光标306在“社会心态”后,当笔记本电脑检测到用户在“社会心态”后增加了符号“?”后,光标306可以移动至“社会心态?”后面。同时,在笔记本电脑接收到手机发送的其他文本内容后,可以继续将接收到的文本内容显示出来。
参见图3中的(g)所示,当笔记本电脑继续检测到用户对文本内容编辑操作时,可以对从手机接收到的文本内容进行编辑。示例性的,当笔记本电脑可以检测到用户将“正成功”修改为“郑成功”的操作;又例如,笔记本电脑可以检测到用户在“年度特征”后增加符号“。”的操作;又例如,笔记本电脑可以检测到用户在“医疗教育住房食品安全”中插入符号“、”的操作。又例如,笔记本电脑可以检测到用户在“社会心态?”后回车的操作。
如图3中的(g)所示,当笔记本电脑检测到用户点击保存控件307的操作时,笔记本电脑可以将编辑后的文本内容发送给手机,从而使得手机在备忘录的显示界面上显示笔记本电脑上编辑后的文本内容。
参见图3中的(h)所示的GUI,该GUI为备忘录应用的另一显示界面。当手机检测到用户点击停止录音的控件308的操作时,手机可以显示如图3中的(i)所示的GUI。
参见图3中的(i)所示的GUI,该GUI为备忘录应用的另一显示界面。用户可以继续在手机上对笔记本电脑编辑后的文本内容进行编辑(例如,用户可以在文本内容中插入图片)。当手机检测到用户点击控件309的操作时,手机可以对当前界面上显示的文本内容进行保存并显示如图3中的(j)所示的GUI。
参见图3中的(j)所示的GUI,该GUI为备忘录应用的另一显示界面。响应于检测到用户点击控件309的操作,手机可以将该笔记的标题更新为“1、热点”。当手机检测到用户点击控件310的操作时,手机可以显示如图3中的(k)所示的GUI.
参见图3中的(k)所示的GUI,该GUI为备忘录应用的另一显示界面。手机上可以显示当前备忘录应用中包括2条笔记,最新增加的笔记内容可以显示在最上方。
一个实施例中,若手机开始进行语音转文字时,笔记本电脑没有检测到用户点击控件304,那么手机可以开始进行录音转文字,而笔记本电脑可以继续显示提示框301。在手机进行录音转文字的过程中,若笔记本电脑检测到用户点击控件304的操作,那么笔记本电脑可以向手机发送响应,该响应用于指示笔记本电脑可以进行文本编辑。手机在接收到该响应后,可以将接收到该响应之前语音转文字的文本内容1都发送给笔记本电脑,笔记本电脑可以打开App1并显示文本内容1。之后如果手机继续检测到用户输入的语音内容,那么手机可以在继续向笔记本电脑发送用户输入的语音内容对应的文本内容2。笔记本电脑可以将手机发送的文本内容2追加在文本内容1后面。
本申请实施例中,手机在进行录音转文字操作时,手机可以通知笔记本电脑正在进行录音转文字功能,从而可以使得笔记本电脑提示用户是否需要在笔记本电脑上进行文本内容的编辑。当用户选择在笔记本电脑上进行编辑时,笔记本电脑可以实时显示手机发送的文本内容,从而方便用户对文本内容进行编辑,有助于提升用户的体验。
图4是本申请实施例提供的另一组GUI。
参见图4中的(a)所示,当手机检测到用户点击录音转文字控件的操作时,手机可以显示如图4中的(b)所示的界面。此时手机可以向笔记本电脑发送请求信息,该请求信息用于请求笔记本电脑对手机获取的语音内容对应的文本内容进行编辑。
参见图4中的(b)所示,响应于接收到手机发送的请求信息,笔记本电脑可以启动App1。响应于手机接收到笔记本电脑对该请求信息的响应,手机可以显示提醒框401,其中,提醒框401中包括提示信息“检测到周围有笔记本电脑,是否将文本内容发送至笔记本电脑上编辑”。当手机检测到用户点击控件402的操作时,手机开始检测环境中的语音内容。
参见图4中的(c)所示,手机在检测到环境中的语音内容后,可以开始进行录音转文字。手机可以采集语音内容并将该语音内容转化文本内容“热度再变…社会心态”,同时手机还可以向笔记本电脑发送转化的文本内容,从而使得笔记本电脑通过App1显示该文本内容。
一个实施例中,当笔记本电脑检测到用户在笔记本电脑上对该文本内容进行编辑的操作以及检测到用户点击保存的操作时,笔记本电脑可以将编辑后的文本内容发送给手机,从而使得手机在备忘录的显示界面上显示编辑后的文本内容。具体过程可以参考图3中的(f)至(g)的过程,为了简洁,在此不再赘述。
本申请实施例中,手机在进行录音转文字操作时,如果确定周围有方便用户进行文本编辑的设备(例如,笔记本电脑),那么手机可以提示用户是否在笔记本电脑上进行文本编辑。当用户选择在笔记本电脑上进行编辑时,笔记本电脑可以实时显示手机发送的文本内容,从而方便用户对文本内容进行编辑,有助于提升用户的体验。
图5是本申请实施例提供的另一组GUI。
参见图5中的(a)所示的GUI,该GUI为手机的桌面。其中,手机的桌面上包括多个应用程序的图标,该多个应用程序包括录音机应用等等。当手机检测到用户点击录音机应用的图标的操作时,可以显示如图5中的(b)所示的GUI。
参见图5中的(b)所示的GUI,该GUI为录音机应用的显示界面。该显示界面上显示有一条10月3日记录的录音文件,该录音文件的命名为“20201003_100832”。该显示界面上还包括创建新的录音文件的控件501。
参见图5中的(c)所示,当手机检测到用户点击控件501的操作时,手机可以向笔记本电脑发送指示信息,该指示信息用于指示手机正在进行录音。响应于接收到该指示信息,笔记本电脑可以显示提醒框502,其中该提醒框502包括提示信息“检测到手机正在进行录音,是否在笔记本电脑上进行录音转文字?”。
参见图5中的(d)所示,响应于笔记本电脑检测到用户点击控件503的操作,笔记本电脑可以启动App1。响应于手机检测到用户点击控件501的操作,手机可以显示录音界面,其中,该录音界面上显示当前已经录制了25秒31,且手机预计还能录制10小时以上。
手机在采集语音内容的同时还可以将该语音内容发送给笔记本电脑,笔记本电脑可以在接收到语音内容后,将该语音内容转化为文本内容“热度再变…社会心态”,从而笔记本电脑可以在App1中显示该文本内容。
一个实施例中,笔记本电脑中可以包括ASR模块,其中,ASR模块的作用是将接收到的语音内容转化为文本内容。
参见图5中的(e)所示,笔记本电脑响应于用户的编辑操作,可以对App1中的文本内容进行编辑。例如,用户可以在手机发送的文本内容中增加内容(在“热度”前增加“1、”,在“光志智库”前增加“2、”)。又例如,用户可以修改文本内容不准确的内容(例如,将“名义”修改为“民意”,将“突破时”修改为“top10”)。又例如,用户还可以对文本内容的格式进行修改(例如,笔记本电脑在“名声诉求”后检测到用户回车的操作)。
一个实施例中,笔记本电脑检测到用户点击保存控件的操作时,可以向手机发送编辑后的文本内容,从而手机可以将编辑后的文本内容保存在某个应用层序(例如,备忘录)中。
本申请实施例中,当手机检测到用户开始录音时,可以向周围的笔记本电脑发送指示信息,从而使得笔记本电脑提示用户是否需要在笔记本电脑上进行录音转文字。这样可以方便用户在笔记本电脑上对手机采集的语音内容进行转文字内容,同时利用了笔记本电脑编辑的便捷性,有助于提升用户的体验。
图6是本申请实施例提供的另一组GUI。
参见图6中的(a)所示,手机显示来电显示界面,该来电显示界面显示来自于广东深圳的手机号码“XXX-XXXXXXXX”正在进行呼叫。响应于手机接收到该来电,手机向周围的笔记本电脑发送指示信息,该指示信息用于指示手机检测到用户的来电。响应于接收到该指示信息,笔记本电脑可以显示提醒框601,其中提醒框601中包括提示信息“手机接收到来电,是否在笔记本电脑上进行通话内容转文字?”。
参见图6中的(b)所示,响应于笔记本电脑检测到用户点击控件602的操作,笔记本电脑可以开启App1并向手机发送响应,该响应用于指示笔记本电脑可以作为文本内容编辑的设备。响应于手机检测到用户接受该来电的操作,手机可以对端设备建立通话连接。手机可以接收对端设备发送的另一用户的语音内容。响应于接收到另一用户的语音内容,手机可以将该语音内容发送给笔记本电脑。
一个实施例中,手机也可以是在检测到用户接受该来电的操作时,向笔记本电脑发送指示信息,该指示信息用于指示手机正在进行通话,请求笔记本电脑对通话内容对应的文本内容进行编辑。笔记本电脑在接收到该指示信息后,可以提示用户“手机正在通话,是否在笔记本电脑上进行通话内容转文字?”。当笔记本电脑检测到用户确定使用笔记本电脑进行通话内容转文字的操作时,笔记本电脑可以开启App1,并从手机接收另一用户的语音内容。从而笔记本电脑可以将该语音内容转化为文本内容。
一个实施例中,手机在接收到该响应后,可以将获取到的另一个用户的语音内容转化为文本内容,从而手机可以向笔记本电脑发送该文本内容。
参见图6中的(c)所示,响应于从手机接收到该语音内容,笔记本电脑可以将该语音内容转化为文字内容“嗨,明天上午有个会议…请按时参加”,从而通过App1显示该文本内容。
一个实施例中,当笔记本电脑检测到用户在笔记本电脑上对该文本内容进行编辑的操作以及检测到用户点击保存的操作时,笔记本电脑可以将编辑后的文本内容发送给手机,从而使得手机在备忘录的显示界面上显示编辑后的文本内容。具体过程可以参考图3中的(f)至(g)的过程,为了简洁,在此不再赘述。
本申请实施例中,手机在检测到来电时,如果确定周围有方便用户进行文本编辑的设备(例如,笔记本电脑),那么手机可以向笔记本电脑指示手机检测到来电。当用户选择在笔记本电脑上进行编辑时,笔记本电脑可以实时将从手机获得的语音内容转化为文字内容并显示给用户,从而方便用户对文本内容进行编辑,有助于提升用户的体验。
图7是本申请实施例提供的另一组GUI。
参见图7中的(a)所示,手机显示某个社交应用的视频通话界面,该视频通话界面显示另一用户正在邀请用户进行视频通话。响应于手机接收到该视频通话,手机向周围的笔记本电脑发送指示信息,该指示信息用于指示手机检测到另一用户的视频通话请求。响应于接收到该指示信息,笔记本电脑可以显示提醒框701,其中提醒框701中包括提示信息“手机接收到视频通话请求,是否在笔记本电脑上进行通话内容转文字?”。
参见图7中的(b)所示,响应于笔记本电脑检测到用户点击控件702的操作,笔记本电脑可以开启App1并向手机发送响应,该响应用于指示笔记本电脑可以作为文本内容编辑的设备。响应于手机检测到用户接受该视频通话请求的操作,手机可以对端设备建立视频通话连接。手机可以接收对端设备发送的另一用户的语音内容。响应于接收到另一用户的语音内容,手机可以将该语音内容发送给笔记本电脑。
一个实施例中,手机在接收到该响应后,可以将获取到的另一个用户的语音内容转化为文本内容,从而手机可以向笔记本电脑发送该文本内容。
参见图7中的(c)所示,响应于从手机接收到该语音内容,笔记本电脑可以将该语音内容转化为文字内容“嗨,明天上午有个会议…请按时参加”,从而通过App1显示该文本内容。
一个实施例中,当笔记本电脑检测到用户在笔记本电脑上对该文本内容进行编辑的操作以及检测到用户点击保存的操作时,笔记本电脑可以将编辑后的文本内容发送给手机,从而使得手机在备忘录的显示界面上显示编辑后的文本内容。具体过程可以参考图3中的(f)至(g)的过程,为了简洁,在此不再赘述。
本申请实施例中,手机在检测到视频通话时,如果确定周围有方便用户进行文本编辑的设备(例如,笔记本电脑),那么手机可以向笔记本电脑指示手机检测到来单。当用户选择在笔记本电脑上进行编辑时,笔记本电脑可以实时将从手机获得的语音内容转化为文字内容并显示给用户,从而方便用户对文本内容进行编辑,有助于提升用户的体验。
应理解,以上结合图6和图7介绍了手机在接收到来电以及视频通话请求时,手机指示周围的笔记本电脑,从而使得笔记本电脑提示用户是否在笔记本电脑上进行通话内容转文字。本申请实施例中,手机也可以在接收到另一用户的语音通话请求后,指示笔记本电脑,从而使得笔记本电脑提示用户是否在笔记本电脑上进行通话内容转文字。
图8是本申请实施例提供的另一组GUI。
参见图8中的(a)所示,手机显示来电显示界面,该来电显示界面显示来自于广东深圳的手机号码“XXX-XXXXXXXX”正在进行呼叫。响应于手机接收到该来电,手机向周围的笔记本电脑发送指示信息,该指示信息用于指示手机检测到用户的来电。响应于接收到该指示信息,笔记本电脑可以显示提醒框801,其中提醒框801中包括提示信息“手机接收到来电,是否在笔记本电脑上进行通话内容转文字?”。
参见图8中的(b)所示,笔记本电脑在预设时长内检测到用户没有点击取消控件或者确定控件802的操作时,可以隐藏该提醒框801。响应于手机检测到用户接受该来电的操作,手机可以对端设备建立通话连接。
参见图8中的(c)所示,用户在是否手机进行通话的过程中,检测到用户点击录音控件803的操作,可以向笔记本电脑发送指示信息,该指示信息用于指示手机正在进行通话,请求笔记本电脑对通话内容对应的文本内容进行编辑。响应于接收到该指示信息,笔记本电脑可以再一次显示提醒框801。当笔记本电脑检测到用户点击控件802的操作时,笔记本电脑可以向手机发送响应,该响应用于指示笔记本电脑可以对通话内容对应的文本内容进行编辑。响应于接收到该响应,手机可以向笔记本电脑发送该通话内容。
参见图8中的(d)所示,响应于接收到手机发送的通话内容,笔记本电脑的ASR模块可以将该通话内容转化为文本内容“嗨,明天上午…参加”,并显示在App1中。
参见图8中的(e)所示,笔记本电脑检测到用户的编辑操作,可以对文本内容进行编辑,并在App1中显示编辑后的文本内容(“领导:嗨,明天上午…参见”)。
本申请实施例中,手机在用户接听来电的过程中检测到用户点击录音的操作时,向笔记本电脑发送指示信息,从而指示笔记本电脑对通话内容对应的文本内容进行编辑。当用户选择在笔记本电脑上进行编辑时,笔记本电脑可以实时将从手机获得的语音内容转化为文字内容并显示给用户,从而方便用户对文本内容进行编辑,有助于提升用户的体验。
下面结合图9和图10介绍笔记本电脑上另外两种显示方式。
图9是本申请实施例提供的另一组GUI。
如图9中的(a)所示,手机可以显示备忘录中的录音转文字界面,手机检测用户输入的语音内容“热度再变与不变之间中体现民生诉求”,手机可以将该语音内容转化为文本内容,从而向笔记本电脑发送该文本内容。笔记本电脑在接收到该文本内容后,可以通过字幕的方式向用户显示该文本内容。示例性的,笔记本电脑可以在字幕显示区域901中显示该文本内容“热度再变与不变之间中体现民生诉求”。
如图9中的(b)所示,当手机接着检测到用户输入的语音内容“光志智库我们刚刚统计得到”,手机可以将该语音内容转化为文本内容,从而向笔记本电脑发送该文本内容。笔记本电脑在接收到该文本内容后,可以通过字幕的方式向用户显示该文本内容。示例性的,笔记本电脑可以在字幕显示区域901中显示该文本内容“光志智库我们刚刚统计得到”。
图10是本申请实施例提供的另一组GUI。
如图10中的(a)所示,手机可以显示备忘录中的录音转文字界面,手机检测用户输入的语音内容“热度再变与不变之间中体现民生诉求”,手机可以将该语音内容转化为文本内容,从而向笔记本电脑发送该文本内容。笔记本电脑在接收到该文本内容后,可以通过字幕的方式向用户显示该文本内容,同时,笔记本电脑还可以打开App1并在App1中显示该文本内容。示例性的,笔记本电脑可以在字幕显示区域1001中显示该文本内容“热度再变与不变之间中体现民生诉求”同时在App1中显示该文本内容。用户可以在App1中对该文本内容进行编辑。
如图10中的(b)所示,当手机接着检测到用户输入的语音内容“光志智库我们刚刚统计得到”,手机可以将该语音内容转化为文本内容,从而向笔记本电脑发送该文本内容。笔记本电脑在接收到该文本内容后,可以通过字幕的方式向用户显示该文本内容,同时,笔记本电脑还可以在App1中“热度再变与不变之间中体现民生诉求”后面追加显示该文本内容。示例性的,笔记本电脑可以在字幕显示区域1001中显示该文本内容“光志智库我们刚刚统计得到”,并且在App1中显示“热度再变与不变之间中体现民生诉求,光志智库我们刚刚统计得到”。
下面集合图11介绍本申请实施例提供的系统架构。该系统架构中包括设备A和设备B,其中设备A可以是具有拾音功能的设备(例如,手机),设备B可以是具备高效编辑功能的设备(例如,笔记本电脑)。设备A包括拾音模块1110、ASR模块1120、收发控制模块1130和替换模块1140;设备B包括收发控制模块1150、显示单元1160和编辑控制模块1170。
拾音模块1110用于获取到需要处理的语音内容。本申请实施例中对设备A获取语音内容的方式并不作具体限定,获取方式可以很多样。例如,可以是从设备A周边环境录制实时语音;或者,也可以是用户在手机上播放的音视频的音频;或者,还可以是设备A通过移动网络打电话时获取的音频(包括远端和近端);还可以是手机里面的音视频文件。拾音模块负责把相关的音频转换成特定的音频格式,比如某种采样率的脉冲编码调制(pulsecode modulation,PCM)音频流,从而作为ASR模块作为输入。
ASR模块1120可以将语音内容转文本内容。通过向ASR模块1120输入特定的PCM音频流,经过训练的深度神经网络声学模型,得出概率最高的音素序列,再经过对应的语言模型,得出概率最高的文字系列,完成从语音内容到文本内容的转换。
收发控制模块1130用于设备A和其他设备进行信息同步的控制。本申请实施例中,收发控制模块1130可以负责信息的透传,收发控制模块1130不涉及传输内容的逻辑处理。信息的发送传输可以通过局域网络,比如蓝牙,Wi-Fi或者其他传输协议(例如,internet)。设备A通过网络通信协议跟其他设备(例如,设备B)建立连接网络链路,然后发起启动传输。
应理解,收发控制模块1150的功能描述可以参考上述收发控制模块1130,为了简洁,在此不再赘述。
显示单元1160用于提示用户是否在设备B上启动文本编辑。收发控制模块1150收到收发控制模块1130发送的设备A获取音频内容(例如,语音内容或者音频文件)的指示,或者,收发控制模块1150收到收发控制模块1130发送的在设备B上进行文本编辑的指示后,可以通过显示单元1160以通知形式弹出提示。如果设备B检测到用户的确定通过设备B进行文本编辑的操作,则可以通过收发控制模块1150向收发控制模块1130发送响应,该响应可以用于指示设备B可以作为文本编辑的设备。当设备A的收发控制模块1130接收到该响应后,设备A开始实时向设备B传输ASR结果的传输。
一个实施例中,当设备A检测到获取音频内容(例如,语音内容或者音频文件)后,收发控制模块1130可以发送查询请求,该查询请求用于查询周围具备文本编辑功能的设备。
示例性的,设备A和设备B是同一账号下的设备,那么设备A可以保存有设备B的设备类型、设备名称、MAC地址等信息。当设备A检测到获取语音内容时,设备A可以根据设备B的MAC地址,向设备B发送BLE数据包。该BLE数据包可以包括PDU,该查询请求可以携带在PDU中的服务数据字段中,或者,也可以携带在PDU中的厂商特定数据字段中。例如,服务数据字段的负荷中可以包括多个比特位,其中,多个比特位中包括可扩展的比特位。设备A和设备B可以约定某个可扩展的比特位的内容。当某个可扩展的比特位为1时,设备B就可以获取设备A查询设备B是否具备文本编辑功能。
例如,如图5中的(c)所示,当手机检测到用户点击控件501(控件501为开始录音的控件)的操作时,手机可以发送BLE数据包,该BLE数据包中可以携带该查询请求。
一个实施例中,当设备A检测到用户进行语音转文字的操作时,设备A可以根据设备B的MAC地址,向设备B发送BLE数据包。
例如,如图3中的(d)所示,当手机检测到用户点击控件302(控件302为手机进行语音转文字的控件)时,手机可以发送BLE数据包,该BLE数据包中可以携带该查询请求。
设备B的收发控制模块可以调用查询文本编辑功能的接口(例如,contentprovider接口)向应用层的一个或者多个应用程序发送请求,该请求用于请求应用程序判断是否具备文本编辑功能;若某个应用程序具备文本编辑功能,那么该应用程序可以向数据同步模块发送响应,该响应用于指示app2登录了账号。从而设备B可以确定设备B安装且登录了app2。
在设备B确定具备文本编辑功能后,设备B可以向设备A发送响应,该响应可以携带在BLE数据包。该BLE数据包可以包括PDU,该查询请求可以携带在PDU中的服务数据字段中,或者,也可以携带在PDU中的厂商特定数据字段中。例如,服务数据字段的负荷中可以包括多个比特位,其中,多个比特位中包括可扩展的比特位。设备A和设备B可以约定某个可扩展的比特位的内容。当某个可扩展的比特位为1时,设备A就可以获取设备B具备文本剪辑功能。
当设备A确定设备B具备文本编辑功能后,设备A就可以向设备B发送获取的音频内容对应的文本内容以及指示信息,该指示信息用于指示在设备B上对该文本内容进行编辑。
示例性的,设备A可以根据设备B的MAC地址,向设备B发送BLE数据包。该BLE数据包可以包括PDU,该文本内容和指示信息可以携带在PDU中的服务数据字段中,或者,也可以携带在PDU中的厂商特定数据字段中。例如,服务数据字段的负荷中可以包括多个比特位,其中,多个比特位中包括可扩展的比特位。设备A和设备B可以约定某个可扩展的比特位的内容。设备A可以采用GBK、ISO8859-1或者Unicode(例如,UTF-8、UTF-16)等编码方式,对设备A的ASR模块输出的文本内容进行编码,并将编码后得到的信息携带在一个或者多个可扩展比特位上。设备A还可以将某个可扩展的比特位设置为1。设备B在接收到该BLE数据包后,可以通过解码获得该文本内容和指示信息,从而设备B可以根据该指示信息显示该文本内容。
或者,当设备A确定设备B具备文本编辑功能后,设备A就可以向设备B发送获取的音频内容对应的文本内容。
示例性的,设备A可以根据设备B的MAC地址,向设备B发送BLE数据包。该BLE数据包可以包括PDU,该文本内容可以携带在PDU中的服务数据字段中,或者,也可以携带在PDU中的厂商特定数据字段中。例如,服务数据字段的负荷中可以包括多个比特位,其中,多个比特位中包括可扩展的比特位。设备A和设备B可以约定某个可扩展的比特位的内容。设备A可以采用GBK、ISO8859-1或者Unicode(例如,UTF-8、UTF-16)等编码方式,对设备A的ASR模块输出的文本内容进行编码,并将编码后得到的信息携带在一个或者多个可扩展比特位上。设备B在接收到该BLE数据包后,可以通过解码获得该文本内容,从而设备B可以显示该文本内容。
一个实施例中,设备A和设备B是同一账号下的设备,那么设备A可以保存有设备B的设备类型、设备名称、MAC地址以及是否具备文本编辑功能等信息。那么当设备A获取音频内容时,设备A可以向设备B发送该音频内容对应的文本内容和指示信息,该指示信息用于指示在设备B上对该文本内容进行编辑。设备B响应于接收到文本内容和该指示信息,可以通过显示单元1160提示用户是否在设备B上进行文本编辑。响应于检测到用户在设备B上进行文本编辑的操作,设备B可以打开某个可以用于文本编辑的应用程序,从而将从设备A获取的文本内容显示出来。
或者,设备A可以向设备B发送该音频内容对应的文本内容。设备B响应于接收到文本内容,设备B可以在设备B上对该文本内容进行编辑,从而设备B可以通过显示单元1160提示用户是否在设备B上进行文本编辑。响应于检测到用户在设备B上进行文本编辑的操作,设备B可以打开某个可以用于文本编辑的应用程序,从而将从设备A获取的文本内容显示出来。
本申请实施例中,显示单元1160也可以用于显示ASR模块输出的文本内容(包括中间结果和最终确定的结果);显示单元1160还可以用于显示用户在设备B上编辑后的文本内容。
一个实施例中,设备B的收发控制模块1150收到收发控制模块1130发送的文本内容后,可以将该文本内容追加到之前显示的文本内容的后面。示例性的,以设备B为windows系统为例,设备B的收发控制模块1150在接收到文本内容后,可以调用QT接口,执行以下步骤:(1)对App1显示的文本内容进行全选;(2)将光标移动到文末;(3)插入设备A发送的新的文本内容;(4)保存当前App1中的所有文本内容。
编辑控制模块1170用于对接收信息的保存,编辑和显示控制。
本申请实施例中,通过ASR模块1120发送给设备B的结果可以包括2种:
第一种是中间结果,比如一句话没有说完之前,ASR模块1120确定的文本内容是没有最终确定的,可以作为一个中间结果。为了体现实时性,中间结果也是要显示出来的,但并没有作为最终的结果保存。
示例性的,设备A的ASR模块检测到用户每说出一个字就向设备B发送对应的字,从而可以实现设备A和设备B上同步显示文本内容。例如,用户说“我是XX”,当设备A检测到用户说出“我”时,设备A的ASR模块在确定对应的文字“我”后就可以向设备B发送该文本内容(“我”),从而设备B可以显示该文本内容“我”。当设备A检测到用户说出“是”时,设备A的ASR模块在确定对应的文字“是”后就可以向设备B发送该文本内容(“是”),从而设备B可以在文本内容“我”后追加显示文本内容“是”,直至显示出“我是XX”。
示例性的,设备A的ASR模块检测到用户每说出一个词组就向设备B发送对应的词组,从而可以实现设备A和设备B上同步显示文本内容。例如,用户说“任何艰难困苦都不能阻挡我们前进的步伐”,当设备A检测到用户说出“任何”时,设备A的ASR模块在确定对应的文字“任何”后就可以向设备B发送该文本内容(“任何”),从而设备B可以显示该文本内容“任何”。当设备A检测到用户说出“艰难”时,设备A的ASR模块在确定对应的文字“艰难”后就可以向设备B发送该文本内容(“艰难”),从而设备B可以在文本内容“任何”后追加显示文本内容“艰难”,直至显示出“任何艰难困苦都不能阻挡我们前进的步伐”。
一个实施例中,设备A显示的内容与设备B上显示的内容可以同步,设备A在判断用户说完一句话时可能会对之前ASR模块转化的文本内容进行纠正。示例性的,用户说“今天我想吃面条”,设备A的ASR模块检测到用户每说出一个字或者一个词组时就向设备B发送对应的文本内容,当设备A检测到用户说出“想”时,有可能ASR模块确定对应的文字为“向”,那么设备A会向设备B发送对应的文本内容(“向”),设备B可以以显示该文本内容“向”。而当设备A在判断用户说完这句话后,可以确定之前转化的文本内容“今天我向吃面条”中的“向”转化存在错误,则设备A可以自动将该“向”纠正为“想”,从而更新用户说出的文本内容(从“今天我向吃面条”更新为“今天我想吃面条”)。设备A可以将更新后的文本内容发送给设备B,从而设备B也可以将之前显示的文本内容“今天我向吃面条”中的“向”更新为“想”,从而显示更新后的文本内容“今天我想吃面条”。
第二种是一句话说完后,ASR模块1120确定的这句话的识别结果以后不会再变回,这样的结果会把之前的中间结果替换显示并作为保存结果。
示例性的,设备A的ASR模块可以将用户说出的每一个字或者每一个词组转化为文本内容,但是设备A在判断用户没有说完一句话之前,可以不向设备B发送文本内容。而是,当设备A判断用户说完一句话之后并将之前转化文本内容进行纠正后,向设备B发送该句话对应的文本内容。
一个实施例中,设备A的ASR模块可以将用户说出的每一字或者每一个词组转化为文本内容后发送给设备B,设备B可以以字幕的方式显示设备A发送的文本内容,但是设备B可以不将该文本内容显示在app1中。当设备A判断用户说完一句话(并对之前转化的文本内容进行纠正)之后,设备A可以向设备B发送该句话对应的文本内容以及指示信息,该指示信息指示设备B在app1中显示该句话对应的文本内容。设备B在接收到该文本内容和指示信息后,可以在app1中显示该句话对应的文本内容。
如果设备A在实时同步ASR模块的输出结果的过程中,设备B检测到用户在设备B上对文本内容进行了编辑,编辑控制模块1170也会重新保存编辑后的结果并显示出来,后续的ASR结果会在此基础上追加。
编辑控制模块1170还用于将用户编辑后的文本内容发送给收发控制模块1150,从而收发控制模块1150将编辑后的文本内容发送给收发控制模块1130。
替换模块1140用于在接收到收发控制模块1130发送的编辑后的文本内容后,将该编辑后的文本内容替换原来显示的文本内容。
一个实施例中,当录音结束或者音频获取结束时,设备A可以向设备B指示录音结束或者音频获取结束。用户在设备B上编辑完成后,可以一次性把编辑结果同步到设备A,整个同步流程完成。
图12示出了本申请实施例的文本编辑的方法1200的示意性流程图。该方法1200可以由上述设备A和设备B实现,该方法1200包括:
S1201,设备A获取音频内容。
示例性的,如图3中的(d)所示,当手机检测到用户点击控件302的操作时,手机开始采集环境中的语音内容。
示例性的,如图5中的(c)所示,当手机检测到用户点击控件501的操作时,手机还是采集环境中的语音内容。
示例性的,如图6中的(b)所示,当手机检测到用户接受该来电的操作时,手机可以获取另一用户的语音内容。
示例性的,如图7中的(b)所示,当手机检测到用户接受该视频通话请求的操作时,手机可以获取另一用户的语音内容。
S1202,设备A根据该音频内容,向设备B发送第一信息。
一个实施例中,该第一信息为该音频内容对应的文本内容。
应理解,本申请实施例中,设备A在获取到语音内容后,可以先通过ASR模块将该语音内容转化为文本内容,从而向设备B发送该文本内容。设备A将该语音内容转化为文本内容的过程可以参考上述实施例中的描述,为了简洁,在此不再赘述。
一个实施例中,设备A在向设备B发送该语音内容之前,该方法还包括:
设备A向发送查询请求,该查询请求用于请求接收到该查询请求的设备判断是否具备文本编辑功能;
响应于接收到设备A发送的请求信息,设备B向设备A发送响应,该响应用于指示设备B具备文本编辑功能;
响应于接收到该响应,设备A向设备B发送该第一信息。
本申请实施例中,设备A向周围设备广播发送该查询请求。或者,设备A可以保存有设备B的设备信息(例如,设备A和设备B为同一账号下的设备或者,设备A和设备B为同一家庭群组中不同账号下的设备)。
应理解,设备A发送查询请求的过程可以参考上述实施例中的描述,为了简洁,在此不再赘述。
一个实施例中,设备B响应于接收到该查询请求,可以提示用户是否在设备B上进行文本编辑;响应于用户确定在设备B上进行文本编辑的操作,设备B向设备A发送该响应。
示例性的,如图3中(d)所示,当笔记本电脑检测到手机发送的查询请求后,笔记本电脑可以显示提示框303,该提示框303中包括提示信息“检测到手机正在进行录音转文字,是否在笔记本电脑上进行文本编辑”。响应于用户点击控件304的操作,笔记本电脑可以向手机发送该响应。
一个实施例中,设备A在接收到设备B发送的响应后,可以向设备A发送请求信息,该请求信息用于请求设备B对设备A输出的文本内容进行编辑;或者,该请求信息用于请求设备B对该音频内容对应的文本内容进行编辑。
示例性的,如图3中的(d)所示,当手机检测到用户点击控件302的操作时,手机可以向周围设备发送查询请求,该查询请求用于查询周围设备是否具备文本编辑功能;响应于接收到笔记本电脑发送的响应,手机可以确定笔记本电脑具备文本编辑功能。手机可以继续向笔记本电脑发送请求信息,该请求信息用于对手机输出的文本内容进行编辑。响应于从手机接收到该请求信息,笔记本电脑可以显示提示框303。响应于用户点击控件304的操作,笔记本电脑可以向手机发送响应,该响应用于指示笔记本电脑可以对文本内容进行编辑。响应于接收到该响应,手机可以向笔记本电脑发送文本内容。
示例性的,如图5中的(c)所示,手机检测到用户点击控件501的操作时,向周围设备发送查询请求;响应于接收到笔记本电脑发送的响应,手机可以确定笔记本电脑具备文本编辑功能。手机可以向笔记本电脑发送请求信息,该请求信息用于请求笔记本电脑对手机获取的音频内容对应的文本内容进行编辑。响应于接收到该请求信息,笔记本电脑可以显示提示框502,其中,提示框502中包括提示信息“检测到手机正在进行录音,是否在笔记本电脑上进行录音转文字”。响应于用户点击控件503的操作,笔记本电脑可以向手机发送响应,该响应用于指示笔记本电脑可以对录音对应的文本内容进行编辑。响应于接收到该响应,手机可以向笔记本电脑发送文本内容。
还应理解,设备B可以通过BLE数据包向设备A发送该响应信息,具体的发送过程可以参考上述设备A向设备B发送BLE数据包的过程,为了简洁,在此不再赘述。
示例性的,该请求信息可以携带在用户数据报协议(user datagram protocol,UDP)数据包中。UPD数据包中包括IP数据报的数据部分。IP数据报的数据部分可以包括可扩展的比特位。设备A和设备B可以约定某个可扩展比特位的内容。当某个可扩展的比特位为1时,设备B就可以获知设备A请求对文本内容进行编辑。
该UDP数据包还可以携带设备A的IP地址和端口号(包括源端口号和目的端口号,其中,源端口号是指设备A发送数据时使用的端口号,目的端口号是指设备A接收数据所使用的端口),设备A的IP地址和端口号可以携带在IP数据报的数据部分的UDP首部。设备B响应于接收到该UDP数据包,可以和设备A建立传输控制协议(transmission controlprotocol,TCP)连接。
应理解,当设备B和设备A建立了TCP连接后,设备B可以通过TCP连接向设备A发送该响应。
示例性的,若UDP数据包中携带设备A的IP地址以及目的端口号。设备B在可以通过IP地址以及目的端口号,和设备A建立TCP连接。此后设备A可以通过TCP连接向设备B发送设备A的ASR模块输入的文本内容。
一个实施例中,该方法1200还包括:在设备A将语音内容转化为文字内容时,设备A显示该文本内容。
示例性的,如图3中的(e)所示,手机在检测到环境中的语音内容后,可以将该语音内容转化为文本内容,从而通过备忘录应用的显示界面显示该文本内容。
S1203,设备B根据该第一信息,显示该音频内容对应的文本内容。
示例性的,如图3中的(e)所示,笔记本电脑在接收到手机发送的文本内容后,可以通过App1显示该文本内容。
S1204,检测到用户对该文本内容进行编辑的操作,设备B可以显示编辑后的文本内容。
示例性的,如图3中的(f)和(g)所示,笔记本电脑在检测到用户编辑该文本内容的操作后,笔记本电脑可以显示编辑后的文本内容。
一个实施例中,该方法1200还包括:设备B向设备A发送编辑后的文本内容。
一个实施例中,设备B检测到用户的第一操作,向设备A发送编辑后的文本内容。
示例性的,如图3中的(f)所示,当笔记本电脑检测到用户点击控件307的操作时,笔记本电脑可以向手机发送编辑后的文本内容。
示例性的,如图3中的(g)所示,当笔记本电脑检测到用户点击控件307的操作时,笔记本电脑可以向手机发送编辑后的文本内容。
一个实施例中,设备A在接收到编辑后的文本内容后,可以使用编辑后的文本内容对之前显示的文本内容进行编辑。示例性的,如图3中的(e)和(f)所示,当笔记本电脑检测到用户点击保存控件307的操作时,笔记本电脑可以向手机发送编辑后的文本内容。手机可以使用用户编辑后的文本内容替换之前显示的文本内容。
本申请实施例中,设备B在检测到用户对设备A发送的文本内容的编辑操作时,可以对该文本内容进行相应的编辑。示例性的,参见图3中的(g)所示,当笔记本电脑检测到用户对文本内容编辑操作时,可以对从手机接收到的文本内容进行编辑。示例性的,当笔记本电脑可以检测到用户将“正成功”修改为“郑成功”的操作;又例如,笔记本电脑可以检测到用户在“年度特征”后增加符号“。”的操作;又例如,笔记本电脑可以检测到用户在“医疗教育住房食品安全”中插入符号“、”的操作。又例如,笔记本电脑可以检测到用户在“社会心态?”后回车的操作。
设备B可以通过BLE数据包或者通过TCP连接向设备A发送编辑后的文本内容,该发送方式可以参考上述实施例中的描述,为了简洁,在此不再赘述。
一个实施例中,如果设备B检测到用户编辑了该文本内容的格式,那么设备B向设备A发送编辑后的文本内容时,还可以向设备A指示该文本内容的格式信息。示例性的,该文本内容的格式可以包括该文本内容中某两个字之间的换行(或者回车)操作;或者,某两个字之间存在空格。示例性的,如图3中的(g)所示,笔记本电脑在向手机发送编辑后的文本内容的同时,还可以向手机指示“求”和“2”之间存在换行,以及“?”和“3”之间存在换行。
一个实施例中,设备B在检测到用户对文本内容的格式进行修改的操作后,可以向设备A发送编辑后的文本内容以及该文本内容的格式信息。设备B向设备A发送编辑后的文本内容的实现方式可以参考上述实施例中的描述,为了简洁,在此不在赘述。下面介绍设备B向设备A发送编辑后的文本内容的格式信息的一种实现方式。示例性的,该文本内容格式包括字体大小、字体颜色、字体倾斜、字体下划线、字体的背景色、本本内容中某个文字后的回车操作。
示例性的,设备A可以通过BLE数据包向设备B发送编辑后的文本内容的格式信息。该文本内容可以携带在PDU中的服务数据字段或者厂商特定数据字段中。例如,服务数据字段的负荷中可以包括多个比特位,其中,多个比特位中包括可扩展的比特位。对于编辑后的文本内容中的某一个字符(例如,文字、字符或者符号),设备A可以和设备B约定某些可扩展的比特位的内容。示例性的,当某个可扩展的比特位为000时,设备A就可以获知该字符不倾斜、无下划线且该字符后无回车操作。示例性的,当某个可扩展的比特位为100时,设备A就可以获知该字符倾斜、无下划线且该字符后无回车操作。示例性的,当某个可扩展的比特位为010时,设备A就可以获知该字符不倾斜、有下划线且该字符后无回车操作。示例性的,当某个可扩展的比特位为001时,设备A就可以获知该字符不倾斜、无下划线且该字符后有回车操作。
对于编辑后的文本内容中的某一个字符(例如,文字、字符或者符号),设备A可以和设备B约定某些可扩展的比特位的内容。示例性的,当某个可扩展的比特位为000时,设备A就可以获知该字符的字体颜色为黑色。示例性的,当某个可扩展的比特位为001时,设备A就可以获知该字符的字体颜色为灰色。示例性的,当某个可扩展的比特位为010时,设备A就可以获知该字符的颜色为蓝色。示例性的,当某个可扩展的比特位为100时,设备A就可以获知该字符的字体颜色为蓝色。
应理解,设备B向设备A指示编辑后的文本内容中的某个字符的字体背景色的过程也可以参考上述实施例中的描述。
对于编辑后的文本内容中的某一个字符(例如,文字、字符或者符号),设备A可以和设备B约定某些可扩展的比特位的内容。示例性的,当某个可扩展的比特位为000时,设备A就可以获知该字符的字体大小为10号。示例性的,当某个可扩展的比特位为001时,设备A就可以获知该字符的字体大小为12号。示例性的,当某个可扩展的比特位为010时,设备A就可以获知该字符的字体大小为14号。示例性的,当某个可扩展的比特位为100时,设备A就可以获知该字符的字体大小为18号。
应理解,本申请实施例中对文本内容的格式并不作具体限定,设备B在接收到该编辑后的文本内容的格式信息后,可以根据编辑后的文本内容以及编辑后的文本内容的格式信息,显示编辑后的文本内容。设备B上显示的文本内容与设备A上显示的文本内容是相对应的。
一个实施例中,该方法1200还包括:设备A使用从设备B接收到的编辑后的文本内容替换原来的文本内容;响应于从设备B接收到编辑后的文本内容,设备A显示第二界面,该第二界面上包括编辑后的文本内容。
示例性的,如图3中的(f)和(g)所示,笔记本电脑响应于用户点击保存控件307的操作,向手机发送编辑后的文本内容。手机在接收到编辑后的文本内容后,可以使用编辑后的文本内容替换原来界面上显示的文本内容。
一个实施例中,设备B向设备A发送编辑后的文本内容时,还可以向设备A发送该编辑后的文本内容的标识信息。
应理解,S1204为可选地步骤,设备B也可以不向设备A发送编辑后的文本内容。而是将编辑后的文本内容保存在设备B本地。
图13示出了本申请实施例提供的另一系统架构。该系统架构中包括设备A和设备B,其中设备A可以是具有拾音功能的设备(例如,手机),设备B可以是具备高效编辑功能的设备(例如,笔记本电脑)。设备A包括拾音模块1310和收发控制模块1320;设备B包括接收收发控制模块1330、ASR模块1340、显示模块1350和编辑控制模块1360。与图11所示的系统架构不同的是,ASR模块可以包括在设备B中。设备A可以负责获取语音内容或者音频文件,设备A通过收发控制模块1320向设备B的收发控制模块1330发送获取的语音内容或者音频文件,从而由设备B的ASR模块1340将该语音内容或者音频文件转化为文本内容,从而设备B可以向用户显示转化后的文本内容。设备B还可以通过编辑控制模块1360在检测到用户对文本内容的编辑操作后,通过显示模块1340显示编辑后的文本内容。
图14示出了本申请实施例提供的装置1400的示意性框图。该装置1400可以设置于上述图12中的设备A中,该装置1400中包括:获取单元1410,用于获取音频内容;发送单元1420,用于向第二电子设备发送第一信息,该第一信息为该音频内容,或者,该第一信息为该音频内容对应的第一文本内容,以使得该第二电子设备根据该第一信息显示该第一文本内容并检测用户对该第一文本内容的编辑操作。
图15示出了本申请实施例提供的装置1200的示意性框图。该装置1500可以设置于上述图12中的设备B中,该装置1500中包括:接收单元1510,用于接收第一电子设备发送的第一信息,该第一信息为该第一电子设备获取的音频内容,或者,该第一信息为该音频内容对应的第一文本内容;显示单元1520,用于根据该第一信息,显示该第一文本内容;检测单元1530,用于检测用户对该第一文本内容的编辑操作;显示单元1520,还用于显示第二文本容,该第二文本内容为对该第一文本内容编辑后的文本内容。
图16示出了本申请实施例提供的电子设备1600的示意性结构图。如图16所示,该电子设备包括:一个或多个处理器1610,一个或多个存储器1620,该一个或多个存储器1620存储有一个或多个计算机程序,该一个或多个计算机程序包括指令。当该指令被所述一个或多个处理器1610运行时,使得第一电子设备或者第二电子设备执行上述实施例中的技术方案。
本申请实施例提供了一种系统,包括设备A和设备B,该系统用于执行上述实施例中的技术方案。其实现原理和技术效果与上述方法相关实施例类似,此处不再赘述。
本申请实施例提供一种计算机程序产品,当所述计算机程序产品在设备A(或者,上述实施例中的手机)运行时,使得设备A执行上述实施例中的技术方案。其实现原理和技术效果与上述方法相关实施例类似,此处不再赘述。
本申请实施例提供一种计算机程序产品,当所述计算机程序产品在设备B(或者,上述实施例中的笔记本电脑)运行时,使得设备B执行上述实施例中的技术方案。其实现原理和技术效果与上述方法相关实施例类似,此处不再赘述。
本申请实施例提供一种可读存储介质,所述可读存储介质包含指令,当所述指令在设备A(或者,上述实施例中的手机)运行时,使得所述设备A执行上述实施例的技术方案。其实现原理和技术效果类似,此处不再赘述。
本申请实施例提供一种可读存储介质,所述可读存储介质包含指令,当所述指令在设备B(或者,上述实施例中的笔记本电脑)运行时,使得所述设备B执行上述实施例的技术方案。其实现原理和技术效果类似,此处不再赘述。
本申请实施例提供一种芯片,所述芯片用于执行指令,当所述芯片运行时,执行上述实施例中的技术方案。其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (29)
1.一种系统,其特征在于,所述系统包括第一电子设备和第二电子设备,其中,
所述第一电子设备,用于获取音频内容;
所述第一电子设备,还用于向所述第二电子设备发送第一信息,所述第一信息为所述音频内容,或者,所述第一信息为所述音频内容对应的第一文本内容;
所述第二电子设备,用于根据所述第一信息,显示所述第一文本内容;
所述第二电子设备,还用于响应于用户对所述第一文本内容的编辑操作,显示第二文本容,所述第二文本内容为对所述第一文本内容编辑后的文本内容。
2.根据权利要求1所述的系统,其特征在于,所述第二电子设备,还用于向所述第一电子设备发送所述第二文本内容。
3.根据权利要求2所述的系统,其特征在于,所述编辑操作包括对所述第一文本内容的格式修改操作,其中,
所述第二电子设备,还用于向所述第一电子设备发送所述第二文本内容的格式信息。
4.根据权利要求3所述的系统,其特征在于,所述第二文本内容的格式信息包括所述第二文本内容的字体颜色、字体大小、字体背景色、字体倾斜、字体下划线以及所述第二文本内容中的回车操作种的一种或者多种。
5.根据权利要求2至4中任一项所述的系统,其特征在于,所述第一电子设备,还用于:
在接收所述第二电子设备发送的所述第二文本内容之前,根据所述音频内容,显示所述第一文本内容;
在接收所述第二电子设备发送的所述第二文本内容之后,使用所述第二文本内容替换所述第一文本内容。
6.根据权利要求1至5中任一项所述的系统,其特征在于,所述第一电子设备,还用于:
发送查询请求,所述查询请求用于接收到所述查询请求的设备确定是否具有文本编辑功能;
响应于接收到所述第二电子设备发送的响应,向所述第二电子设备发送所述第一信息,所述响应用于指示所述第二电子设备具备文本编辑功能。
7.根据权利要求1至6中任一项所述的系统,其特征在于,所述第二电子设备具体用于:
响应于接收到所述第一信息,提示用户是否在所述第二电子设备上进行文本编辑;
响应于用户确定在所述第二电子设备上进行文本编辑的操作,显示所述第一文本内容。
8.根据权利要求1至7中任一项所述的系统,其特征在于,所述第一信息为所述第一文本内容,所述第一电子设备具体用于:
响应于获取到所述音频内容,将所述音频内容转化为所述第一文本内容;
向所述第二电子设备发送所述第一文本内容。
9.根据权利要求1至7中任一项所述的系统,其特征在于,所述第一信息为所述音频内容,所述第二电子设备具体用于:
响应于接收到所述音频内容,将所述音频内容转化为所述第一文本内容;
显示所述第一文本内容。
10.根据权利要求1至9中任一项所述的系统,其特征在于,所述第一电子设备的账号和所述第二电子设备的账号相关联。
11.一种文本编辑的方法,其特征在于,所述方法应用于第一电子设备,所述方法包括:
所述第一电子设备获取音频内容;
所述第一电子设备向第二电子设备发送第一信息,所述第一信息为所述音频内容,或者,所述第一信息为所述音频内容对应的第一文本内容,以使得所述第二电子设备根据所述第一信息显示所述第一文本内容并检测用户对所述第一文本内容的编辑操作。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
所述第一电子设备接收所述第二电子设备发送的第二文本内容,所述第二文本内容为用户在所述第二电子设备上对所述第一文本内容进行编辑后的文本内容。
13.根据权利要求12所述的方法,其特征在于,所述方法还包括:
所述第一电子设备接收所述第二电子设备发送的所述第二文本内容的格式信息。
14.根据权利要求13所述的系统,其特征在于,所述第二文本内容的格式信息包括所述第二文本内容的字体颜色、字体大小、字体背景色、字体倾斜、字体下划线以及所述第二文本内容中的回车操作种的一种或者多种。
15.根据权利要求12至14中任一项所述的方法,其特征在于,所述方法还包括:
在接收所述第二电子设备发送的所述第二文本内容之前,所述第一电子设备根据所述音频内容,显示所述第一文本内容;
在接收所述第二电子设备发送的所述第二文本内容之后,所述第一电子设备使用所述第二文本内容替换所述第一文本内容。
16.根据权利要求11至15中任一项所述的方法,其特征在于,所述方法包括:
在向所述第二电子设备发送所述第一信息之前,所述第一电子设备发送查询请求,所述查询请求用于接收到所述查询请求的设备确定是否具有文本编辑功能;
响应于接收到所述第二电子设备发送的响应,所述第一电子设备向所述第二电子设备发送所述第一信息,所述响应用于指示所述第二电子设备具备文本编辑功能。
17.根据权利要求11至16中任一项所述的方法,其特征在于,所述第一信息为所述第一文本内容,所述方法还包括:
响应于获取到所述音频内容,所述第一电子设备将所述音频内容转化为所述第一文本内容;
所述第一电子设备向所述第二电子设备发送所述第一文本内容。
18.根据权利要求11至17中任一项所述的方法,其特征在于,所述第一电子设备的账号和所述第二电子设备的账号相关联。
19.一种文本编辑的方法,其特征在于,所述方法应用于第二电子设备,所述方法包括:
所述第二电子设备接收第一电子设备发送的第一信息,所述第一信息为所述第一电子设备获取的音频内容,或者,所述第一信息为所述音频内容对应的第一文本内容;
所述第二电子设备根据所述第一信息,显示所述第一文本内容;
响应于用户对所述第一文本内容的编辑操作,所述第二电子设备显示第二文本容,所述第二文本内容为对所述第一文本内容编辑后的文本内容。
20.根据权利要求19所述的方法,其特征在于,所述方法还包括:
所述第二电子设备向所述第一电子设备发送所述第二文本内容。
21.根据权利要求20所述的方法,其特征在于,所述编辑操作包括对所述第一文本内容的格式修改操作,所述方法还包括:
所述第二电子设备向所述第一电子设备发送所述第二文本内容的格式信息。
22.根据权利要求21所述的方法,其特征在于,所述第二文本内容的格式信息包括所述第二文本内容的字体颜色、字体大小、字体背景色、字体倾斜、字体下划线以及所述第二文本内容中的回车操作种的一种或者多种。
23.根据权利要求19至22中任一项所述的方法,其特征在于,所述方法还包括:
在接收所述第一电子设备发送的所述第一信息之前,所述第二电子设备接收所述第一电子设备发送的查询请求,所述查询请求所述第二电子设备确定是否具有文本编辑功能;
所述第二电子设备向所述第一电子设备发送响应,所述响应用于指示所述第二电子设备具备文本编辑功能。
24.根据权利要求19至23中任一项所述的方法,其特征在于,所述第二电子设备根据所述第一信息,显示所述第一文本内容,包括:
响应于接收到所述第一信息,所述第二电子设备提示用户是否在所述第二电子设备上进行文本编辑;
响应于用户确定在所述第二电子设备上进行文本编辑的操作,所述第二电子设备显示所述第一文本内容。
25.根据权利要求19至24中任一项所述的方法,其特征在于,所述第一信息为所述音频内容,所述第二电子设备显示所述第一文本内容之前,所述方法还包括:
响应于接收到所述音频内容,将所述音频内容转化为所述第一文本内容。
26.根据权利要求19至25中任一项所述的方法,其特征在于,所述第一电子设备的账号和所述第二电子设备的账号相关联。
27.一种电子设备,其特征在于,包括:
一个或多个处理器;
一个或多个存储器;
所述一个或多个存储器存储有一个或者多个计算机程序,所述一个或者多个计算机程序包括指令,当所述指令被所述一个或多个处理器执行时,使得所述电子设备执行如权利要求11至18中任一项所述的方法。
28.一种电子设备,其特征在于,包括:
一个或多个处理器;
一个或多个存储器;
所述一个或多个存储器存储有一个或者多个计算机程序,所述一个或者多个计算机程序包括指令,当所述指令被所述一个或多个处理器执行时,使得所述电子设备执行如权利要求19至26中任一项所述的方法。
29.一种计算机可读存储介质,其特征在于,包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求11至18中任一项所述的方法;或者,
当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求19至26中任一项所述的方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011529621.0A CN114664306A (zh) | 2020-12-22 | 2020-12-22 | 一种编辑文本的方法、电子设备和系统 |
CN202080104076.2A CN116171568A (zh) | 2020-08-13 | 2020-12-31 | 一种调用其他设备能力的方法、电子设备和系统 |
US18/041,196 US20230305680A1 (en) | 2020-08-13 | 2020-12-31 | Method for invoking capability of another device, electronic device, and system |
EP20949470.7A EP4187876A4 (en) | 2020-08-13 | 2020-12-31 | METHOD FOR CALLING CAPABILITIES OF OTHER DEVICES, ELECTRONIC DEVICE AND SYSTEM |
PCT/CN2020/142564 WO2022032979A1 (zh) | 2020-08-13 | 2020-12-31 | 一种调用其他设备能力的方法、电子设备和系统 |
PCT/CN2021/138655 WO2022135254A1 (zh) | 2020-12-22 | 2021-12-16 | 一种编辑文本的方法、电子设备和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011529621.0A CN114664306A (zh) | 2020-12-22 | 2020-12-22 | 一种编辑文本的方法、电子设备和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114664306A true CN114664306A (zh) | 2022-06-24 |
Family
ID=82025546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011529621.0A Pending CN114664306A (zh) | 2020-08-13 | 2020-12-22 | 一种编辑文本的方法、电子设备和系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114664306A (zh) |
WO (1) | WO2022135254A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116737049A (zh) * | 2022-11-22 | 2023-09-12 | 荣耀终端有限公司 | 音频播放方法及终端设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6904405B2 (en) * | 1999-07-17 | 2005-06-07 | Edwin A. Suominen | Message recognition using shared language model |
US8515751B2 (en) * | 2011-09-28 | 2013-08-20 | Google Inc. | Selective feedback for text recognition systems |
US10614808B2 (en) * | 2014-06-30 | 2020-04-07 | Nuance Communications, Inc. | Mobile device for speech input and text delivery |
CN105159870B (zh) * | 2015-06-26 | 2018-06-29 | 徐信 | 一种精准完成连续自然语音文本化的处理系统及方法 |
CN109599115B (zh) * | 2018-12-24 | 2022-03-22 | 思必驰科技股份有限公司 | 用于音频采集设备和用户终端的会议记录方法和装置 |
CN109782997B (zh) * | 2019-01-25 | 2021-08-24 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置及存储介质 |
-
2020
- 2020-12-22 CN CN202011529621.0A patent/CN114664306A/zh active Pending
-
2021
- 2021-12-16 WO PCT/CN2021/138655 patent/WO2022135254A1/zh active Application Filing
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116737049A (zh) * | 2022-11-22 | 2023-09-12 | 荣耀终端有限公司 | 音频播放方法及终端设备 |
CN116737049B (zh) * | 2022-11-22 | 2024-04-19 | 荣耀终端有限公司 | 音频播放方法及终端设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2022135254A1 (zh) | 2022-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020253719A1 (zh) | 一种录屏方法及电子设备 | |
CN111046680B (zh) | 一种翻译方法及电子设备 | |
CN110138959B (zh) | 显示人机交互指令的提示的方法及电子设备 | |
CN110825469A (zh) | 语音助手显示方法及装置 | |
CN114546190A (zh) | 一种应用显示方法及电子设备 | |
CN109286725B (zh) | 翻译方法及终端 | |
CN113961157B (zh) | 显示交互系统、显示方法及设备 | |
CN114390139B (zh) | 一种电子设备在来电时呈现视频的方法、电子设备和存储介质 | |
CN114173000B (zh) | 一种回复消息的方法、电子设备和系统、存储介质 | |
EP4293997A1 (en) | Display method, electronic device, and system | |
CN114115770A (zh) | 显示控制的方法及相关装置 | |
CN115705315A (zh) | 管理文件的方法、电子设备和计算机可读存储介质 | |
WO2022206763A1 (zh) | 一种显示方法、电子设备和系统 | |
CN113438366A (zh) | 信息通知的交互方法、电子设备和存储介质 | |
WO2022135254A1 (zh) | 一种编辑文本的方法、电子设备和系统 | |
CN110191223B (zh) | 一种添加邮件联系人的方法和电子设备 | |
CN114430441A (zh) | 来电提示方法、系统、电子设备及存储介质 | |
WO2023124829A1 (zh) | 语音协同输入方法、电子设备及计算机可读存储介质 | |
CN113938556B (zh) | 来电提示方法、装置和电子设备 | |
CN114115772B (zh) | 灭屏显示的方法及装置 | |
WO2024114212A1 (zh) | 跨设备切换焦点的方法、电子设备及系统 | |
CN114666441A (zh) | 一种调用其他设备能力的方法、电子设备和系统 | |
CN118555327A (zh) | 一种音频处理方法及电子设备 | |
CN115145665A (zh) | 一种显示方法、电子设备和系统 | |
CN116700556A (zh) | 卡片生成方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |