CN104869225A - 智能对话方法和使用所述方法的电子装置 - Google Patents

智能对话方法和使用所述方法的电子装置 Download PDF

Info

Publication number
CN104869225A
CN104869225A CN201510085453.3A CN201510085453A CN104869225A CN 104869225 A CN104869225 A CN 104869225A CN 201510085453 A CN201510085453 A CN 201510085453A CN 104869225 A CN104869225 A CN 104869225A
Authority
CN
China
Prior art keywords
recipient
communication type
communication
state
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510085453.3A
Other languages
English (en)
Other versions
CN104869225B (zh
Inventor
应文平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HTC Corp
Original Assignee
High Tech Computer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by High Tech Computer Corp filed Critical High Tech Computer Corp
Publication of CN104869225A publication Critical patent/CN104869225A/zh
Application granted granted Critical
Publication of CN104869225B publication Critical patent/CN104869225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/56Unified messaging, e.g. interactions between e-mail, instant messaging or converged IP messaging [CPM]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/06Message adaptation to terminal or network requirements
    • H04L51/066Format adaptation, e.g. format conversion or compression

Abstract

本公开提出智能对话方法和使用所述方法的电子装置。根据示范性实施例中的一个,电子装置可经由接收器而以第一通信类型接收第一通信且确定接收者状态。电子装置可基于接收者状态而将第二通信类型确定为最佳通信类型。电子装置可将第一通信转换为适用于第二通信类型的第二通信。电子装置可经由发射器而以第二通信类型发射第二通信。

Description

智能对话方法和使用所述方法的电子装置
技术领域
本公开涉及智能对话方法和使用所述方法的电子装置。
背景技术
例如智能电话等小型通信装置可提供过多的方式来允许智能电话的用户进行通信,范围从常规电话呼叫到较现代的方式,例如,文本消息传递、即时消息传递、进行因特网协议语音(VoIP)对话等。现代电子装置的通信可划分为以下这些类型中的至少一个:电路交换式(Circuit-Switched,CS)语音呼叫、短消息传递服务(Short Messaging Service,SMS)、即时消息传递(Instant Messaging,IM)(例如,ICQ、AOL、MSN信使、Line等)、VoIP语音呼叫(例如,使用例如Line或Skype等专有软件而进行的呼叫)和视频呼叫。
虽然例如基于SMS和IM的对话等存储转发式(store-and-forward)对话可被视为较不具侵入性,但例如CS语音呼叫、VoIP呼叫或视频呼叫等多数实时对话可被视为具侵入性。举例来说,当接收者在接收到呼叫时是需要全神贯注(例如,驾驶汽车或操作重型机械)的时候,上述实时对话可为是侵入性的。类似地,接收者可能发现自己处于不适合参与实时对话(例如,接收者正在开会、处于电影院中、看医生、约会等)的境况下。且,接收者可能处于接收者根本不能够接收通信(例如,当接收者正在睡觉、坐在牙医诊疗椅上、被麻醉等)的境况下。在这些不适宜的境况下,可由于不能够或不愿意实时地参与对话而错过或延迟重要呼叫。
此外,接收者可能偏好除对话的起始者使用的类型外的不同的(上述的)类型的对话。举例来说,当呼叫者呼叫被呼叫方时,呼叫可为通过从电话呼叫界面拨号而起始的CS语音呼叫类型的对话,且被呼叫方将需要从电话呼叫用户界面(UI)接收电话呼叫而进行CS语音呼叫服务。换句话说,被呼叫方的电子装置实际上不可以选择实时地使用服务不同类型的通信的UI或直接应答CS呼叫。按照惯例,接收者可需要首先手动地拒绝或不应答CS呼叫且通过使用例如即时消息等另一通信方式而将消息发射回发送者。另举例来说,当呼叫者将文本消息(其为SMS类型的通信)发送到被呼叫方时,被呼叫方将需要从服务SMS类型的通信的用户界面接收文本消息。换句话说,被呼叫方的电子装置不可以选择使用服务不同类型的通信的UI来参与传入的文本消息。
发明内容
因此,本公开涉及智能对话方法和使用所述方法的电子装置。
在示范性实施例中的一个中,本公开涉及一种电子装置,其至少包含(但不限于):发射器,用于发射信号;接收器,用于接收信号;以及处理器,电耦接到所述发射器和所述接收器。所述处理器经配置以至少:经由接收器而以第一通信类型接收第一通信且确定接收者状态;基于所述接收者状态而将第二通信类型确定为最佳通信类型;将所述第一通信转换为适用于所述第二通信类型的第二通信;以及经由发射器而以所述第二通信类型发射所述第二通信。
在示范性实施例中的一个中,本公开涉及一种智能对话方法,其至少包含(但不限于):经由接收器而以第一通信类型接收第一通信且确定接收者状态;基于所述接收者状态而将第二通信类型确定为最佳通信类型;将所述第一通信转换为适用于所述第二通信类型的第二通信;以及经由发射器而以所述第二通信类型发射所述第二通信。
为了使本公开的上述特征和优点可理解,下文详细描述伴随着图式的示范性实施例。应理解,以上一般描述和以下详细描述都是示范性的,且希望进一步解释如所主张的本公开。
然而,应理解,此概述可能不含有本公开的所有方面和实施例,且因此并不意味以任何方式为限制性的。而且,本公开将包含对于本领域技术人员来说明显的改进和修改。
附图说明
包含附图以便进一步理解本公开,且附图并入本说明书中并构成本说明书的一部分。所述图式说明本公开的实施例,且与描述一起用以解释本公开的原理。
图1为说明根据本公开的示范性实施例中的一个的具有智能对话能力的电子装置的功能框图。
图2为说明根据本公开的示范性实施例中的一个的智能对话方法的流程图。
图3说明根据本公开的示范性实施例中的一个的第一示范性实施例。
图4说明根据本公开的示范性实施例中的一个的第二示范性实施例。
图5说明根据本公开的示范性实施例中的一个的第三示范性实施例。
图6说明根据本公开的示范性实施例中的一个的第四示范性实施例。
图7为说明根据本公开的示范性实施例中的一个的智能对话方法的流程图。
具体实施方式
现将详细参考本公开的示范性实施例,其实例在附图中得以说明。只要有可能,相同组件符号在附图和描述中用来表示相同或相似部分。
为了解决上述问题,本公开提出一种具有智能对话能力的电子装置,其在移动电子装置的触摸屏上提供接收者状态控制式对话用户界面(UI)。
本公开描述一种通信范例,其允许接收者在所述接收从通信的发送者或起始者接收到所述通信时选择所要通信类型,且由所述接收者进行的所述选择可独立于由起始所述通信的所述发送者使用的所述通信类型。所述通信类型的所述选择可在以下意义上为手动的:所述接收者可手动地选择所述通信类型以从所述移动电子装置内的用户界面或通过在所述移动电子装置内的不同用户界面之间切换而对所述发送者进行答复。
所述通信类型的所述选择还可在以下意义上为自动的:传入的通信的接收者所使用的电子装置可根据一组参数而自动地为所述接收者选择最佳通信类型。所述一组参数可至少含有至少(但不限于):接收者的预定偏好设置、接收者的就绪度或状态设置、电子装置所检测的就绪度或状态、移动电子装置的传感器(G传感器、温度传感器、运动传感器、红外线传感器、声音传感器等)所检测的数据读数、当前时间或日期,以及发送者的信息或简档。基于一个参数或不同参数的组合,接收者的移动电子装置可为接收者自动地选择最佳通信类型。
在来自发送者的通信的传入之前以及响应于来自发送者传入的通信,自动选择都可基于上述任一组参数而由移动电子装置进行。这意味在发生通信时,通信类型可自动地切换。然而,通信类型还可基于境况的改变,而在通信之前或之后自动地改变响应于移动电子装置已确定所述一组参数中的至少一个参数已改变,且接着作为响应已确定另一最佳通信类型。
通过手动地选择通信类型,根据一个示范性实施例,移动电子装置可在通信期间自动地重新选择另一通信类型。根据另一示范性实施例,通过进行手动选择,将防止电子装置在通信之前或之后进行自动选择。类似地,如果移动电子装置经配置以自动地选择最佳通信类型,那么将不妨碍接收者进行手动选择。
通过聚集多个对话流,上述新颖范例可甚至超出一对一对话而扩展到一对多对话或多对多对话。将在下文中描述上述概念的详细实施例。
图1为根据本公开的示范性实施例中的一个的示范性电子装置的范例的功能框。示范性电子装置可为智能电话、台式PC、非移动装置或例如基站、中继站、服务器、网关和网络控制器等网络组件。示范性电子装置还可为例如智能手表等可穿戴装置。功能框中的每一个可由软件或硬件或两者的组合实施。对于本领域技术人员来说将显而易见的是,图1的各种功能框可由移动电子装置中一般所熟知的硬件组件(例如,微处理器、控制器、通信接口、收发器、传感器、显示器等)实施。
功能框含有至少(但不限于)输入/输出接口101,其可至少包含例如显示器、扬声器、麦克风等组件。功能框还将含有各种通信资源,包含视频102、语音103、SMS 104和IM 105。视频资源102的实施方案可涉及视频相机和扬声器,语音资源103可涉及麦克风和扬声器,且SMS资源104和IM资源105的实施方案可涉及实际键盘或虚拟键盘。这些通信资源可经由发射器或接收器来发射或接收。这些通信资源可存储在非易失性或易失性存储器中或直接从缓冲器接收。这些通信资源还可存储在并非通信装置本身的位置(例如,云服务器)中。
功能框还含有交互工作功能107、自动话音识别(automatic speechrecognition,ASR)引擎110、文本到话音(text to speech,TTS)引擎111、个性化话音/TTS数据库112和虚拟形象数据库113。ASR引擎110将作为输入的数字化话音转换为文本。数字化话音和经转换的文本不限于任何特定语言。TTS引擎111将接收文本作为输入,且将文本转换为合成话音而作为输出。个性化话音/TTS数据库112电耦接到TTS引擎111,且将为含有关于如何将文本转换为话音或将话音转换为文本的个人偏好的数据库。举例来说,个性化话音数据库可包含已知呼叫者的话音模型文件,其可用于改进传入的语音的识别率,而个性化TTS数据库可包含话音模型文件,其可模拟发送者的声道和话音基音/节奏或给出特定类型的语音(例如,男性语音、女性语音、高音调语音、低音调语音等)。虚拟形象数据库113将含有发送者/呼叫者的静态图像或运动图像表示的联系人的虚拟形象,其可与合成语音(TTS)对口型。交互工作功能107会将自动话音识别(ASR)引擎110、文本到话音(TTS)引擎111、个性化话音/TTS数据库112和虚拟形象数据库113与通信资源102、103、104和105电耦接。
因为一种通信类型的第一内容被转换为另一通信类型的第二内容,所以交互工作功能107将在转换过程期间充当逻辑媒介和连接媒介。交互工作功能107可由微处理器或微控制器实施。举例来说,视频资源102可为发送者本地硬盘中所存储的视频,且发送者视频可实时地接收自输入/输出接口101,且交互工作功能107将接着接收发送者视频,且将发送者视频递送到ASR引擎110。ASR引擎将从发送者视频提取话音以转换为文本。类似地,从SMS资源104和IM资源105接收的文本可经由交互工作功能107而转换为实时话音。
图1的功能框将还至少含有(但不限于)接口控制器106、通信决策数据库108和传感器中枢109。接口控制器将电耦接到输入/输出接口101、交互工作功能107、通信决策数据库和传感器中枢109。接口控制器106可拥有装置I/O能力。传感器中枢将包含一个或多于一个传感器,例如,G传感器、温度传感器、运动传感器、红外线传感器、压力传感器等。通信决策数据库108将含有用户的预定偏好设置,且预定偏好设置可与来自传感器中枢109的输出、时间信息和日历信息一起并入,以由接口控制器106用来确定最佳通信类型。当已确定最佳通信类型时,接口控制器106可接着经由交互工作功能107来协调以将输入从一种通信类型转换为另一通信类型。
本公开还提供适用于电子装置的智能对话方法。图2为说明在存在传入的社交通信请求(例如,CS语音呼叫、VoIP呼叫、视频呼叫、IM、SMS等)时的所提出的智能对话方法的流程图。图2的流程图可(例如)由至少(但不限于)图1的接口控制器106实施。
由于步骤S211到S216,智能对话方法将接收传入的社交通信请求201以由数据库和智能逻辑电路202转换为不同的通信类型的输出(未图示)在步骤S211中,接口控制器106可用于确定可实时地从输入/输出接口101接收的请求的通信类型或用于确定可为已在本地存储或在云存储装置中存储的数据的请求的通信类型。响应于步骤S211,数据库和智能逻辑202将确定接收通信请求的装置的最佳通信类型。在步骤S212中,数据库和智能逻辑202将获得参数,例如,经由传感器中枢109而获得的接收者的运动状态、社交通信请求201的起始者的对等信息、日历信息和从接口控制器106输入的信令。从接口控制器106输入信令可用于指示这整个装置上的I/O接口可用性。接口控制器106可因此在可从其它输入确定最佳对话模式之前向数据库和智能逻辑202通知装置能够将什么对话方法提供给用户。
这些参数中的多个中的一个可已存储在数据库和智能逻辑202内或必须在外部获得。举例来说,来自传感器中枢109的读数可指示接收者正经历高速运动,且因此将不处于最适用于执行文本讯息传递的境遇下。日历信息可指示接收者当前正在开会。对等信息可指示请求201的起始者并非参与实际对话的好伙伴。在步骤S213中,数据库和智能逻辑202将获得接收者的预定偏好,且预定偏好可含有一组规则,例如,应使用某些通信类型的时间或日期、将适用于某些对等体的某些通信类型等。基于因不需要以任何特定次序执行的步骤S212和S213而收集的参数,在步骤S214中,数据库和智能逻辑202将确定最佳通信类型。
在步骤S215中,接口控制器106将在必要时执行从一种通信类型到另一通信类型的后续转换。当最佳通信类型与请求201的起始者的通信类型相同时,不需要转换。且,数据库和智能逻辑202可获得从指示这整个装置上的I/O接口可用性的信令指示符接收的信息,以便确定步骤S216的接收者通信自适应流。否则,在步骤S216中,将由交互工作功能进行两种不同通信类型之间的转换以产生通信自适应流。举例来说,在步骤S126中,如果请求201呈视频呼叫的形式,那么接收者通信自适应流1、2和3可分别为CS语音呼叫/VoIP语音呼叫、文本消息或即时消息。步骤S215中接收者通信自适应流的决策可基于I/O接口可用性指示符。举例来说,如果仅CS语音呼叫/VoIP语音呼叫可用,那么将选择接收者通信自适应流1。为了更详细地阐明图1和图2,本公开提供将如下描述的将由图3到图6展示的四个示范性实施例。
图3将第一实施例说明为接收者在接收到CS语音呼叫时正在开会但决定使用SMS接口参与对话的假设情形。在步骤S31中,通过来自输入/输出接口101(例如,扬声器)的CS语音警报通知接收者传入的CS语音呼叫正来临。在步骤S32中,接收者从UI手动地选择以文本答复传入的CS语音呼叫,所述文本可例如为“你好”。应注意,接收者可选择以语音呼叫的形式或以文本消息的形式接收CS语音呼叫。举例来说,如果接收者正在开会,那么接收者可通过使用耳机而收听语音呼叫或可从显示器查看从CS语音呼叫转换的文本。但在这个实例中,接收者选择以文本形式听取CS语音呼叫。在步骤S33中,接口控制器106接收CS语音呼叫且与涉及后续通信类型转换的交互工作功能107协调。在步骤S34a中,响应于接收者通过发送文本而应答CS语音呼叫,接口控制器106将与交互工作功能107协调以从文本通信类型转换为语音通信类型。在步骤S34b中,文本将由TTS引擎111根据个性化TTS数据库112中所存储的偏好设置而转换为合成话音。在步骤S34c中,合成话音“你好”将由交互工作功能107递送到语音资源103,其可为针对语音数据而暂时分配的存储缓冲器。合成话音将最终经由无线接口(未图示)发射到CS语音呼叫的起始者(约翰)。
假设响应于从接收者接收到“你好”,约翰对接收者说出语句,且语句被数字化。在步骤S35a中,数据化语句存储在语音资源103中且被递送到交互工作功能107以进行转换。在步骤S35b中,数字化语句被递送到ASR引擎110以加以识别。ASR引擎110可为接收者的移动电子装置本身的或处于装置外部。在处于装置外部的状况下,数字化语句将经由无线接口而发射到外部装置位置。在已完成从数字化语句到文本的转换之后,在步骤S35c中,文本将被递送到SMS资源104以便由输入/输出接口101(例如,显示器)显示。在步骤S36a中,接收者键入数字化答复。在步骤S36b中,数字化答复被递送到TTS引擎111且转换为话音答复。在步骤S36c中,话音答复在接口控制器106的协调下经由交互工作功能107而递送到约翰。
根据图3的第一替代实施例,在步骤S32中,代替手动地选择SMS接口来进行答复,接口控制器106可改为自动地为接收者作出选择。选择过程可基于类似于图2的过程。举例来说,接口控制器106可实施数据库和选择逻辑202,或从接口控制器外部的数据库和选择逻辑202接收确定:接收者的最佳通信类型为文本消息类型。所述确定可基于指示此时的接收者很可能正在开会的来自日历应用的信息而作出。因此,第一替代实施例与第一替代实施例之间的差异在于最佳通信类型是自动地确定而不是手动地确定。
根据图3的第二替代实施例,不仅自动地确定最佳通信类型,而且可在对话之前、在对话期间和在对话之后动态地改变最佳通信类型。明确地说,在步骤S33a中,可拥有装置I/O能力的接口控制器可与智能逻辑和通信决策数据库交互,以确定是否动态地改变最佳通信类型。举例来说,假设在呼叫者与被呼叫方之间的语音对话的过程中,数据库和智能逻辑202可确定被呼叫方将突然不能够保持语音对话。在这种状况下,智能逻辑202将自动地使接口控制器106能够与交互工作功能107协调以实施步骤S35a、S35b、S35c、S36a、S36b和S36c。
图4将第二示范性实施例说明为接收者正在驾驶但已手动地选择以纯语音(voice-only)接口答复所有对话而不管传入的通信类型的情形。在步骤S41中,在接收者为驾驶员时,接收者已手动地预定使用语音接口以参与所有对话,这是因为,在接收者正在驾驶时,接收者将被视为不适于参与文本消息传递的良好境遇下。
假设接收者已接收到SMS消息,在步骤S42a中,接口控制器106已知晓接收者的决策,且因此在步骤S42b中与交互工作功能107协调以在SMS消息通信类型与语音通信类型之间进行转换。在步骤S43中,交互工作功能107从发送者(约翰)获得SMS文本消息。在步骤S44a中,交互工作功能将SMS文本消息递送到TTS引擎111,且TTS引擎111从来自约翰的SMS文本消息产生合成的传入的话音(TTS数据库可含有约翰的话音模型,其允许TTS引擎合成话音与约翰的语音)。在步骤S44b中,合成的传入的话音被递送到交互工作功能107。在步骤S44c中,合成的传入的话音被递送到语音资源103,其可为含有将递送到扬声器的合成话音的语音输出存储缓冲器。此外,合成语音将以前缀标记,所述前缀将以可听见的方式指示合成的传入的话音来自约翰。在接收者以合成话音的方式听取约翰的SMS消息之后,在步骤S45a中,接收者将对输入/输出接口101的麦克风口述答复,且所述答复将数字化为数字化答复。在步骤S45b中,数字化答复将处于语音资源103中以经由交互工作功能107而递送到ASR引擎110。在步骤S45c中,ASR引擎将识别数字化答复且产生将递送到约翰的对应文本消息。文本消息可为SMS消息或IM。
根据图4的第一替代实施例,类似于图3的第一替代实施例,代替在驾驶时手动地预定使用语音接口,数据库和智能逻辑202可自动地确定接收者不能够执行文本消息传递。可基于(例如)接收者的过往行为、暗示接收者需要在短时间内处于两个位置的日历信息和来自传感器中枢109的传感器读数而进行确定。当智能逻辑202已确定接收者不能够执行文本消息传递时,可接着执行步骤S42a到S45c。
根据图4的第二替代实施例,类似于图3的第一替代实施例,不仅自动地确定最佳通信类型,而且可在对话之前、在对话期间和在对话之后动态地改变最佳通信类型。明确地说,在步骤S42a2中,可拥有装置I/O能力的接口控制器可与智能逻辑和通信决策数据库交互,以确定是否动态地改变最佳通信类型。举例来说,假设在呼叫者与被呼叫方之间的语音对话的过程中,数据库和智能逻辑202可确定被呼叫方将突然不再能够参与语音对话而是可实际上改为参与文本消息对话。在这种状况下,类似于图3,智能逻辑202将自动地使接口控制器106能够与交互工作功能107协调以实施类似于先前针对图3所描述的步骤S35a、S35b、S35c、S36a、S36b和S36c的步骤。
图5将第三示范性实施例说明为在接收者正在开会且不能够应答视频呼叫而决定改为使用SMS接口来应答视频呼叫时接收到分组交换(PS)式视频呼叫时的图2的实施方案。在这种状况下,动画人物虚拟形象与个性化TTS一起将作为视频呼叫而递送到呼叫者。
在步骤S51中,接收者已从视频呼叫的起始者(约翰)接收到视频呼叫。在步骤S52中,接收者已手动地选择使用SMS接口来答复视频呼叫。在步骤S53中,使用SMS接口来答复视频呼叫的决策由接口控制器接收。在步骤S54a中,接口控制器106将经由交互工作功能107而协调从一种通信类型到另一通信类型的对话过程。在步骤S54b中,交互工作功能107可递送已由接收者键入以递送到约翰的文本消息,且TTS引擎会将文本消息转换为将递送到约翰的合成语音。合成语音将由TTS引擎递送到动画引擎。且在与动画引擎接收合成语音几乎相同的时间,虚拟形象数据库113将表示接收者的动画提供到动画引擎,且动画形象的口部将与将递送到约翰的合成语音对口型。合成语音可根据TTS数据库的接收者的偏好设置来定制。在步骤S54b结束时,动画引擎将已接收到合成语音和表示接收者的动画,且作为响应将产生对应视频以递送到视频资源。在步骤S54c中,随着动画在无线接口上递送到约翰,与TTS引擎的合成语音对口型的根据虚拟形象113的动画将由电耦接到交互工作功能107的动画引擎递送到视频资源102。在步骤S55a中,来自约翰的视频将经由交互工作功能107而递送到ASR引擎110。ASR引擎110将提取来自约翰的视频的音频部分,且将音频部分转换为文本。在步骤S55c中,文本消息将被递送到SMS资源104以在输入/输出接口101的显示器上向接收者展示。在步骤S56a中,接收者通过键入答复消息而对约翰进行答复。在步骤S56b中,文本消息将经由交互工作功能107而递送到TTS引擎111。TTS引擎111与个性化TTS数据库一起将转而产生对应于答复消息的下一合成语音。且在与对应于答复消息的合成语音已由动画引擎接收几乎相同的时间,在步骤S56b中,动画引擎将从虚拟形象数据库接收与下一合成语音对口型的下一所产生动画。在步骤S56c中,下一所产生动画将被递送到视频资源102以在无线接口上发出到约翰。
图6说明根据本公开的示范性实施例中的一个的第四示范性实施例。第四示范性实施例不仅利用第一应用来确定最佳通信类型,而且利用第二应用来作出是否应改变最佳通信类型的动态确定。第一应用(例如)可为用于确定用户的当前境况的日历应用,且第二应用可为(例如)用于根据定位单元(location and positioning unit,LPU)、或经度和纬度坐标、或地图上的地址或已接近已知参考点,来确定用户的位置是否已移动到某些对话模式偏好的位置。位置与定位单位可为(例如)GPS接收器、RF签名计算器、WiFi、传感器、基于观察到达时间差异(observed time different of arrival,OTDOA)的计算器等。
举例来说,第四示范性实施例中所述的由电子装置使用的智能对话方法可如下操作。交互工作功能607可经由另一应用来确定用户的状态。举例来说,交互工作功能607可从日历应用650预测用户的状态。举例来说,基于日历应用650的记录,交互工作功能607可确定用户当前正在开会,以使得交互工作功能607可通过使用ASR引擎110而自动地将传入的呼叫从语音转换为文本,且在交互工作功能607使用文本到话音(TTS)111将文本转换为话音之后,用户可在合成语音中进行响应。通常,基于用户的当前状态,交互工作功能607可将经由第一通信类型接收的第一通信数据转换为适用于第二通信类型的第二通信数据。交互工作功能607还可通过将适用于第二通信类型或另一通信类型的第三通信数据转换为将经由第一通信类型或另一通信类型发射的第四通信数据而进行响应。
然而,可想得到,会议可在日历应用650中所记录的结束时间之前结束,或用户可在会议仍在进行时选择离开会议。对于第四示范性实施例,交互工作功能607可周期性地更新用户的状态。举例来说,交互工作功能607可经由接口控制器606而从位置与定位单元651周期性地确定用户的位置。基于用户位置,如果交互工作功能607已确定用户很可能不在开会,那么交互工作功能可将当前通信类型切换为不同通信类型。在这种状况下,交互工作功能607可停止转换传入的语音呼叫,而是改为允许用户正常参与语音对话。
然而,假设用户已离开会议进入电影院,而在电影院将认为不适合说话。在位置与定位单元651基于电子装置中或电子装置外的云存储装置中所存储的地图而确定用户处于电影院中之后,交互工作功能107可将通信类型切换为基于文本的通信类型或文本到话音通信类型。
对于第四示范性实施例的另一实例,假设具有智能对话能力的电子装置为例如智能手表等可穿戴装置,可穿戴装置还可鉴别或预测第一用户的状态,以便确定是否将第一用户从以第一通信类型参与到与第二用户的通信切换为以第二通信类型参与通信,其中第二通信类型可不同于第二用户正用来与第一用户实时地通信的通信类型。第二用户可实际上通过使用第一通信类型或第三通信类型而与第一用户通信。举例来说,第一通信类型可为典型语音对话,且第二通信类型可为文本消息传递或即时消息传递。
如果交互工作功能607已从日历应用605或经由接口控制器606从传感器中枢609中的运动传感器或G传感器确定第一用户正在进行体育运动,那么交互工作功能607可让第一用户通过使用语音呼叫(即,经由语音资源103)而参与通信,而不管第二用户的通信类型,这是因为第一用户可不能够键入,而是可改为对可穿戴装置的扬声器101说话。然而,当交互工作功能607已从日历应用605确定用户处于间隙休息或经由接口控制器606从传感器中枢609的传感器读数确定用户正在休息时,交互工作功能607可将第一用户的通信类型切换为文本到语音对话或文本到文本对话(例如,IM、SMS)。第一用户的通信类型的设置可由第一用户手动地选择,且第一用户的当前状态也可由第一用户实时或预先手动地设置。
图7为说明根据本公开的示范性实施例中的一个的所提出的智能对话方法的流程图。在步骤S711中,电子装置可经由接收器而以第一通信类型接收第一通信且确定接收者状态。在步骤S712中,电子装置可基于接收者状态而将第二通信类型确定为最佳通信类型。在步骤S713中,电子装置可将第一通信转换为适用于第二通信类型的第二通信。在步骤S714中,电子装置可经由发射器而以第二通信类型发射第二通信。
鉴于前述描述,本发明适用于由电子装置用来允许用户通过使用最适用于用户的境遇的最佳通信类型而与另一用户通信。可手动地或自动地进行最佳通信类型的确定,且当用户的境遇改变时,最佳通信类型的调整可为动态的。
用于本申请案的所公开实施例的详细描述中的组件、动作或指令不应解释为对本公开来说为绝对关键或必要的,除非明确地如此描述。而且,如本文中所使用,用词“一”可包含一个以上项目。如果打算指仅一个项目,那么将使用术语“单一”或类似语言。此外,如本文中所使用,在多个项目和/或多个项目种类的列表之前的术语“中的任一个”希望包含所述项目和/或项目种类个别地或结合其它项目和/或其它项目种类“中的任一个”、“中的任何组合”、“中的任何多个”和/或“中的多个的任何组合”。此外,如本文中所使用,术语“集合”希望包含任何数量个项目,包含零个。此外,如本文中所使用,术语“数量”希望包含任何数量,包含零。
本领域技术人员将明白,在不脱离本公开的范围或精神的情况下,可对所公开的实施例的结构进行各种修改和变化。鉴于以上内容,希望本公开涵盖本公开的修改和变化,只要所述修改和变化落入所附权利要求书和其等效物的范围内。
此外,权利要求书不应视为限于所描述的次序或组件,除非如此陈述。
相关申请案的交叉参考
本申请案主张2014年2月21日申请的第61/942,623号美国临时申请案的优先权权益。上述专利申请案的全部内容特此以引用方式并入本文中并形成本说明书的一部分。

Claims (21)

1.一种适用于电子装置的智能对话方法,其特征在于包括:
经由接收器而以第一通信类型接收第一通信且确定接收者状态;
基于至少所述接收者状态而将不同于所述第一通信类型的第二通信类型确定为最佳通信类型;
将所述第一通信转换为适用于作为所述最佳通信类型的所述第二通信类型的第二通信;以及
经由发射器而以所述第二通信类型发射所述第二通信。
2.根据权利要求1所述的智能对话方法,其特征在于还包括:
检测接收者状态改变;以及
响应于检测到所述接收者状态改变经由所述发射器而以第三通信类型或所述第一通信类型发射第三通信。
3.根据权利要求2所述的智能对话方法,其特征在于所述接收者状态是根据至少一日程信息来确定的,或根据传感器读数或GPS读数而周期性地更新。
4.根据权利要求3所述的智能对话方法,其特征在于响应于检测到所述接收者状态改变,将所述最佳通信类型切换回所述第一通信类型。
5.根据权利要求3所述的智能对话方法,其特征在于还包括响应于由于用户运动检测到所述接收者状态改变而选择不需要键入的通信类型。
6.根据权利要求3所述的智能对话方法,其特征在于还包括响应于检测到确定不适合讲话的位置或事件的所述接收者状态改变而选择不需要讲话的通信类型。
7.根据权利要求1所述的智能对话方法,其特征在于所述接收者状态是根据运动状态、预定设置和日程信息中的至少一个或组合来确定的。
8.根据权利要求7所述的智能对话方法,其特征在于所述最佳通信是根据接收者装置I/O接口能力、接收者状态、选择规则、用户简档、对等信息、日历信息、用户列表、当日时间和来自传感器读数的动态信息中的至少一个或组合来确定的。
9.根据权利要求1所述的智能对话方法,其特征在于将所述第一通信转换为所述第二通信包括:
通过使用自动话音识别系统而将语音数据转换为文本数据;或
通过使用文本到话音合成器而从所述文本数据合成话音数据。
10.根据权利要求9所述的智能对话方法,其特征在于所述话音数据是根据个性化话音或文本到话音数据库和虚拟形象数据库来合成的。
11.一种电子装置,其特征在于包括:
发射器,用于发射数据;
接收器,用于接收数据;以及
处理器,电耦接到所述发射器和所述接收器,经配置以至少:
经由接收器而以第一通信类型接收第一通信且确定接收者状态;
基于所述接收者状态而将第二通信类型确定为最佳通信类型;
将所述第一通信转换为适用于所述第二通信类型的第二通信;以及
经由发射器而以所述第二通信类型发射所述第二通信。
12.根据权利要求11所述的电子装置,其特征在于所述处理器经进一步配置以:
检测接收者状态改变;以及
响应于检测到所述接收者状态改变经由所述发射器而以第三通信类型或所述第一通信类型发射第三通信。
13.根据权利要求12所述的电子装置,其特征在于还包括:
传感器;以及
GPS系统,其中所述处理器根据至少一日程信息来确定所述接收者状态,或根据所述传感器的传感器读数或所述GPS系统的GPS读数而周期性地进行更新。
14.根据权利要求13所述的电子装置,其特征在于所述处理器经进一步配置以响应于检测到所述接收者状态改变而将所述最佳通信类型切换回所述第一通信类型。
15.根据权利要求13所述的电子装置,其特征在于所述处理器经进一步配置以响应于由于从所述传感器读数检测的用户运动检测到所述接收者状态改变而选择不需要键入的通信类型。
16.根据权利要求13所述的电子装置,其特征在于所述处理器经进一步配置以响应于经由所述传感器或GPS系统检测到确定不适合讲话的位置或事件的所述接收者状态改变而选择不需要讲话的通信类型。
17.根据权利要求11所述的电子装置,其特征在于所述接收者状态是由所述处理器根据由所述传感器检测的运动状态、预定设置和日程信息中的至少一个或组合来确定的。
18.根据权利要求17所述的电子装置,其特征在于所述最佳通信是由所述处理器根据接收者装置I/O接口能力、接收者状态、选择规则、用户简档、对等信息、日历信息、用户列表、当日时间和来自传感器读数的动态信息中的至少一个或组合来确定的。
19.根据权利要求11所述的电子装置,其特征在于所述处理器经配置以将所述第一通信转换为所述第二通信包括:
经由自动话音识别系统而将语音数据转换为文本数据;或
经由文本到话音合成器而从所述文本数据合成话音数据。
20.根据权利要求19所述的电子装置,其特征在于所述处理器经配置以根据个性化话音或文本到话音数据库和虚拟形象数据库来合成所述话音数据。
21.根据权利要求20所述的电子装置,其特征在于所述个性化话音模型或文本到话音数据库包括呼叫者的预先建立的个性化话音模型或文本到话音数据库。
CN201510085453.3A 2014-02-21 2015-02-17 智能对话方法和使用所述方法的电子装置 Active CN104869225B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201461942623P 2014-02-21 2014-02-21
US61/942,623 2014-02-21
US14/609,441 US9641481B2 (en) 2014-02-21 2015-01-30 Smart conversation method and electronic device using the same
US14/609,441 2015-01-30

Publications (2)

Publication Number Publication Date
CN104869225A true CN104869225A (zh) 2015-08-26
CN104869225B CN104869225B (zh) 2020-02-18

Family

ID=53883372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510085453.3A Active CN104869225B (zh) 2014-02-21 2015-02-17 智能对话方法和使用所述方法的电子装置

Country Status (3)

Country Link
US (1) US9641481B2 (zh)
CN (1) CN104869225B (zh)
TW (1) TWI594611B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228779A (zh) * 2017-12-28 2018-06-29 华中师范大学 一种基于学习社区对话流的成绩预测方法
CN108520750A (zh) * 2018-03-13 2018-09-11 努比亚技术有限公司 一种语音输入控制方法、设备及计算机可读存储介质
CN112804766A (zh) * 2021-01-29 2021-05-14 展讯通信(上海)有限公司 跨业务类型的文本通信方法及装置、计算机可读存储介质
WO2021098708A1 (zh) * 2019-11-22 2021-05-27 维沃移动通信有限公司 通话方法及终端设备

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015178715A1 (en) * 2014-05-23 2015-11-26 Samsung Electronics Co., Ltd. System and method of providing voice-message call service
US10447788B2 (en) * 2015-02-10 2019-10-15 Cisco Technology, Inc. Collaboration techniques between parties using one or more communication modalities
US10262555B2 (en) 2015-10-09 2019-04-16 Microsoft Technology Licensing, Llc Facilitating awareness and conversation throughput in an augmentative and alternative communication system
US9679497B2 (en) 2015-10-09 2017-06-13 Microsoft Technology Licensing, Llc Proxies for speech generating devices
US10148808B2 (en) * 2015-10-09 2018-12-04 Microsoft Technology Licensing, Llc Directed personal communication for speech generating devices
CN107016008B (zh) * 2016-06-06 2020-06-09 阿里巴巴集团控股有限公司 信息处理方法和装置及动态信息的显示方法和装置
US10558421B2 (en) * 2017-05-22 2020-02-11 International Business Machines Corporation Context based identification of non-relevant verbal communications
US11463657B1 (en) * 2020-11-10 2022-10-04 Know Systems Corp. System and method for an interactive digitally rendered avatar of a subject person

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101378530A (zh) * 2007-08-30 2009-03-04 乐金电子(中国)研究开发中心有限公司 一种短信收发方法、系统及短信服务器
CN102821196A (zh) * 2012-07-25 2012-12-12 江西好帮手电子科技有限公司 一种移动终端文字语音对等通话方法及其移动终端
US20130304457A1 (en) * 2012-05-08 2013-11-14 Samsung Electronics Co. Ltd. Method and system for operating communication service

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3728173B2 (ja) * 2000-03-31 2005-12-21 キヤノン株式会社 音声合成方法、装置および記憶媒体
JP2002221980A (ja) * 2001-01-25 2002-08-09 Oki Electric Ind Co Ltd テキスト音声変換装置
JP4687936B2 (ja) * 2001-03-22 2011-05-25 ソニー株式会社 音声出力装置および音声出力方法、並びにプログラムおよび記録媒体
JP2004020613A (ja) * 2002-06-12 2004-01-22 Canon Inc サーバ、受信端末
US7260539B2 (en) * 2003-04-25 2007-08-21 At&T Corp. System for low-latency animation of talking heads
US8270933B2 (en) * 2005-09-26 2012-09-18 Zoomsafer, Inc. Safety features for portable electronic device
US8086457B2 (en) * 2007-05-30 2011-12-27 Cepstral, LLC System and method for client voice building

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101378530A (zh) * 2007-08-30 2009-03-04 乐金电子(中国)研究开发中心有限公司 一种短信收发方法、系统及短信服务器
US20130304457A1 (en) * 2012-05-08 2013-11-14 Samsung Electronics Co. Ltd. Method and system for operating communication service
CN102821196A (zh) * 2012-07-25 2012-12-12 江西好帮手电子科技有限公司 一种移动终端文字语音对等通话方法及其移动终端

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228779A (zh) * 2017-12-28 2018-06-29 华中师范大学 一种基于学习社区对话流的成绩预测方法
CN108520750A (zh) * 2018-03-13 2018-09-11 努比亚技术有限公司 一种语音输入控制方法、设备及计算机可读存储介质
WO2021098708A1 (zh) * 2019-11-22 2021-05-27 维沃移动通信有限公司 通话方法及终端设备
CN112804766A (zh) * 2021-01-29 2021-05-14 展讯通信(上海)有限公司 跨业务类型的文本通信方法及装置、计算机可读存储介质
CN112804766B (zh) * 2021-01-29 2022-06-10 展讯通信(上海)有限公司 跨业务类型的文本通信方法及装置、计算机可读存储介质

Also Published As

Publication number Publication date
TWI594611B (zh) 2017-08-01
TW201541930A (zh) 2015-11-01
US9641481B2 (en) 2017-05-02
US20150244669A1 (en) 2015-08-27
CN104869225B (zh) 2020-02-18

Similar Documents

Publication Publication Date Title
CN104869225A (zh) 智能对话方法和使用所述方法的电子装置
EP1869666B1 (en) Wireless communications device with voice-to-text conversion
CN100481851C (zh) 使用通信设备的化身控制
CN102972015B (zh) 电话保持机制
US8509408B2 (en) Voice and text communication system
CA2835110C (en) Cross-language communication between proximate mobile devices
US20050144247A1 (en) Method and system for voice on demand private message chat
US20070203987A1 (en) System and method for voice-enabled instant messaging
US10255266B2 (en) Relay apparatus, display apparatus, and communication system
CN110324485A (zh) 基于通信接收方偏好切换通信模式的设备、方法和系统
CA2749633A1 (en) Multi-modal messaging and callback with service authorizer and virtual customer database
KR20070051107A (ko) 지그비를 이용한 인스턴트 메시징 서비스 시스템 및 방법
KR20190056355A (ko) 무선단말
KR20040100243A (ko) 유,무선 통합 이미지 메세징 서비스.
KR20110057516A (ko) 메신저서비스 상의 프레즌스 정보 알림 시스템 및 그 방법
KR100706902B1 (ko) 립싱크 메시지 제공 시스템 및 방법
JP2007006238A (ja) 電話連絡方法、及び記録媒体
KR20020032269A (ko) 자금 이체 내역의 서비스 시스템 및 방법
KR100742211B1 (ko) 부가정보 전송기능이 구비된 모바일 단말기 및 그단말기를 이용한 부가정보 전송시스템과 그 방법
KR101740669B1 (ko) 모바일 단말기 문자메시지 표출 시스템
KR101983799B1 (ko) 무선단말 및 그 무선단말의 정보처리 방법
KR20190056354A (ko) 무선단말
KR20190056356A (ko) 무선단말의 정보처리 방법
KR20100066596A (ko) 문자 대화를 지원하는 장치 및 문자 대화 서비스 방법
KR20130066468A (ko) 무선단말 및 그 무선단말의 정보처리 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant