CN112313657B - 用于检测自动会话的方法、系统和计算机程序产品 - Google Patents
用于检测自动会话的方法、系统和计算机程序产品 Download PDFInfo
- Publication number
- CN112313657B CN112313657B CN201980039744.5A CN201980039744A CN112313657B CN 112313657 B CN112313657 B CN 112313657B CN 201980039744 A CN201980039744 A CN 201980039744A CN 112313657 B CN112313657 B CN 112313657B
- Authority
- CN
- China
- Prior art keywords
- communication
- natural language
- participant
- automatic
- conversation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 107
- 238000004590 computer program Methods 0.000 title claims abstract description 18
- 238000004891 communication Methods 0.000 claims abstract description 317
- 230000003993 interaction Effects 0.000 claims abstract description 52
- 230000004044 response Effects 0.000 claims abstract description 35
- 230000003044 adaptive effect Effects 0.000 claims abstract description 29
- 230000000977 initiatory effect Effects 0.000 claims abstract description 17
- 230000009466 transformation Effects 0.000 claims abstract description 8
- 238000001514 detection method Methods 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 21
- 238000000844 transformation Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 12
- 230000007704 transition Effects 0.000 description 12
- 230000002452 interceptive effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000009471 action Effects 0.000 description 6
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 4
- 239000008186 active pharmaceutical agent Substances 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/527—Centralised call answering arrangements not requiring operator intervention
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/20—Aspects of automatic or semi-automatic exchanges related to features of supplementary services
- H04M2203/2027—Live party detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/30—Aspects of automatic or semi-automatic exchanges related to audio recordings in general
- H04M2203/305—Recording playback features, e.g. increased speed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5158—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with automated outdialling systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
公开了用于宣布和检测自动会话的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。所述方法之一包括使用自然语言通信方法在自然语言通信信道上发起与通信参与者的会话,所述自然语言通信方法包括自然语言通信的对话。使用预定义的自适应交互协议来将所述通信参与者确定为是自动的,所述协议指定按顺序定义的自然语言的语言学转换。响应于确定所述通信参与者是自动的,所述会话可以被转换为与所述自然语言通信方法不同的通信方法。
Description
技术领域
本申请涉及用于检测全自动会话的自然语言处理。
背景技术
虚拟助理或聊天机器人是理解自然语言的语音命令并且为需要与另一参与者通信的用户完成任务的应用程序。为了完成这些任务,虚拟助理可以被编程以代表用户执行自然语言会话,例如,拨打电话或参与文本消息或聊天会话。
发明内容
本申请描述了使用自适应自然语言隐写术和水印来检测全自动会话的技术。这些技术通常涉及交互协议,以暗中地宣布和检测在会话中的两个参与者都是自动的,而人类用户无法确定检测正在进行。在检测到会话的双方都是自动的之后,示例性自动检测系统将所述会话的通信方法改变为用于自动通信参与者的有效通信方法。
总的来说,本申请中描述的主题的一个创新方面可以以方法来体现,所述方法包括下述动作:使用自然语言通信方法在自然语言通信信道上发起与通信参与者的会话,所述自然语言通信方法包括自然语言通信的对话;使用预定义的自适应交互协议来确定所述通信参与者是自动的,所述预定义的自适应交互协议为所述自然语言通信的对话指定多个自然语言的语言学转换;以及响应于确定所述通信参与者是自动的,将所述会话转换为与发起所述会话所使用的自然语言通信方法不同的通信方法。
该方面的其他实施例包括相应的计算机系统、装置、计算机程序产品(软件产品)和记录在一个或多个计算机存储设备上的计算机程序,分别被配置为执行所述方法的所述动作。对于被配置为执行特定操作或动作的一个或多个计算机的系统,是指所述系统已在其上安装了软件、固件、硬件或它们的组合,所述软件、固件、硬件或它们的组合在操作中使得所述系统执行所述操作或动作。对于被配置为执行特定操作或动作的一个或多个计算机程序,是指一个或多个程序包括指令,所述指令当由数据处理装置执行时,使得所述装置执行所述操作或动作。
前述和其他实施例可以分别可选地单独或组合地包括下述特征中的一个或多个。特别地,一个实施例包括下述所有特征的组合。
可以在特定实施例中实现本说明书中描述的主题,以便实现下述优点中的一个或多个。
一种示例性自动检测系统提供了交互式水印和隐写协议,以宣布和检测自动会话。用于自动检测的目的的精细的音频标记是非常困难且昂贵的,因为与自动系统(例如虚拟助理)的大多数会话都是通过文本进行的,或者直接由用户输入文本,或者使用通过语音到文本转换而生成的文本。在使用麦克风记录用户语音的情况下,用于生成所述音频标记的数据可能会被麦克风以较低的采样率拾取的噪声掩盖。为了这个原因,本系统使用暗中的自适应交互协议来执行自动检测,该协议确保人机交互质量不会受到影响。实际上,所述系统通过使用图像、音频或文本而巧妙地确定会话的另一方是否是自动设备,例如虚拟助理,而不会使得所述会话对于人类交互者而言很尴尬。
对于虚拟助理或机器人,通过自然语言或自然语言文本进行通信与通过机器通信协议进行通信相比是次优的且效率较低。此外,自然语言通信容易出错,因为自动系统在执行自然语言处理时会误解或误会自然语言。
因此,一旦所述系统检测到自动会话,所述系统便可以将所述自动会话切换为比自然语言更有效的通信协议。另外,通过知道两个参与者都是机器人,所述系统可以执行不同任务,自动虚拟助理可以轻松执行所述不同任务,但是如果任何一个通信参与者是人类,则所述系统不会尝试所述不同任务。例如,当在两个通信参与者都是从同一系统自动进行的情况下验证呼叫者的真实性时,所述虚拟助理可能能够验证共享密钥,例如公用密钥或专用密钥。如果所述通信具有人类参与者,则不会期望该人类参与者读出并且能够验证用户的公共密钥。
所述系统还有一个优势,因为它使用基于自然文本的方案,该方案易于插入现有系统,并且由于它是系统独立的,因此可以与多种文本到语音系统一起使用。
所述系统还有一个优势,因为它可以抵抗在自然通信信道中的噪声或信号劣化(例如,由于无意地从其他通信信道中拾取的信号)。例如,与编码在某一不可听频率范围中的数据、且因此容易受到该范围内的噪声的影响的常规速记系统不同,只要信道足够准确地传输了转换后的自然语言通信以使它们得到理解,则通过转换后的自然语言通信编码数据不会劣化。因此,本系统利用已知的聊天机器人系统的能力来克服自然通信信道的限制。
本公开的替代表达是一种用于在多个通信参与者之间进行自动会话检测的方法,所述方法包括通信参与者之一通过使用包括自然语言通信的对话的自然语言通信方法,在自然语言通信信道上发起与另一通信参与者的会话,所述通信参与者中的第一个至少一次生成所述对话的自然语言通信,基于用于指定多个自然语言的语言学转换的预定义自适应交互协议来转换所述自然语言通信,并且在所述自然语言通信通道上发送所述转换后的自然语言通信,以及所述通信参与者中的另一个在所述自然语言通信通道上接收一个或多个所述转换后的自然语言通信,通过使用预定义的自适应交互协议,从一个或多个所述转换后的自然语言通信确定所述第一个通信参与者是自动的,并且响应于确定该通信参与者是自动的,将所述会话转变为与发起所述会话的自然语言通信方法不同的通信方法。
每个通信参与者在其为自动的情况下,都可操作以生成并且发送转换后的自然语言通信,以及从所接收的自然语言通信确定另一个通信参与者是自动的并且转变所述会话。但是,原则上,所述通信参与者之一可操作以生成和发送转换后的自然语言通信,而不是必需执行确定另一通信参与者是自动的或转变所述会话,而第二个通信参与者可操作以确定另一个通信参与者是自动的并且转变所述会话,但不是必需生成和发送转换后的自然语言通信。
因此,本公开的另一种表达是由在自然语言通信信道上、在自然语言对话中的自动通信参与者执行的方法,包括:至少一次生成所述自然语言对话的自然语言通信,基于指定多个自然语言的语言学转换的预定义的自适应交互协议来转换所述自然语言通信,以及在所述自然语言通信信道上发送所述转换后的自然语言通信。
本公开的又一表达是由通过自然语言通信方法并且在自然语言通信信道上、在与第二通信参与者的自然语言对话中的第一自动通信参与者执行的方法,包括:在所述自然语言通信信道上从所述第二通信参与者接收所述对话的一个或多个所述自然语言通信,将所述所接收的自然语言通信与预定义的自适应交互协议进行比较,且由此确定所述第二通信参与者是自动的,并且响应于确定所述第二通信参与者是自动的,将所述会话转变为与所述自然语言通信方法不同的通信方法。
表述“自然语言通信方法”是指使用人类语言的通信方法,由与所述人类语言的规则相一致的各个通信组成。自然语言通信方法的示例包括文本和口头通信方法。表述“自然语言的语言学转换”是指用于将第一自然语言通信转换为第二自然语言通信的转换,使得所述的两种自然语言通信互不相同,但都与同一自然语言通信方法一致(即符合同一人类语言的规则),并且均包含有关所述对话的主题的相同信息。
在附图和以下描述中阐述了本申请的主题的一个或多个实施例的细节。所述主题的其他特征、方面和优点根据说明书、附图和权利要求将变得显而易见。
附图说明
图1示出了用于以暗中、无干扰的方式检测自动会话参与者的示例性自动检测系统。
图2示出了预定义的自适应交互协议的示例。
图3A示出了自动助理与通信参与者进行的确定所述通信参与者是否是自动的示例性会话。
图3B示出了自动助理与通信参与者进行的确定所述通信参与者是否是自动的示例性会话。
图4是用于检测全自动会话的示例性过程的流程图。
各个附图中相同的附图标记和名称表示相同的元件。
具体实施方式
本公开描述了一种技术,该技术允许自动或半自动助理(在本文中称为虚拟助理或“机器人”)与人和其他自动助理通信。随着能够为用户执行任务的自动助理以及这些助理的能力的增加,自然语言会话可以发生在两个自动助理之间,而无需任何人类干预。
自动助理,例如虚拟助理或机器人,接收并监视输入以检测用于指示应当发起会话的触发事件。自动助理执行预定义的工作流或可重复的操作模式的序列,其每个都由要执行的操作的抽象操作描述或意图链接在一起。本质上,所述虚拟助理能够使用这些工作流来确定如何响应以及说些什么,以便为用户执行任务。这些任务可以包括为所述用户预订理发、进行预约、订购食物、寻找遛狗的人、弄清楚哪个商店中有所述用户想要购买的物品、或雇用维修人员进行服务。
当发起自然语言会话(例如,呼叫业务)时,虚拟助理通常不知道在所述会话中的另一个参与者是人还是自动虚拟助理。在另一个参与者是人的情况下,所述虚拟助理在整个交互过程中保持自然语言会话,以使所述交互对人类用户显得自然。但是,当会话的双方都是自动时,如果所述虚拟助理使用自然语言以外的通信方法进行通信,则所述会话会更加高效。即使这样,对于进行会话的人类用户来说,当所述会话被自动系统试图确定该系统正与另一个自动系统还是人类用户通信而打断时,会很尴尬。此外,人类用户可能不想与自动机器人互动。因此,本公开的自动检测系统使用自适应交互协议来巧妙地确定会话参与者是否是自动助理。
为了优化在两个自动助理之间的通信,所述自动助理必须将彼此识别为自动的,并从自然语言通信转变为对自动助理更高效的另一种通信方法,例如结构化数据通信方法。
本说明书的自动检测系统提供了一种用于确定会话参与者的自动的方案,该方案对所述会话是不唐突的,并且不需要所述自动助理在每次交互之前明示地公开所述会话的参与者是自动的。
图1示出了用于所述以暗中的、不唐突的方式检测自动会话参与者的示例性自动检测系统100。所述系统100可以被实施为在一个或多个位置中的一台或多台计算机上的计算机程序,其中,可以实施下文所述的系统、组件和技术。
如所示,自动检测系统100包括用户(例如用户120),该系统使发起的自动助理(例如虚拟助理110a)为用户执行任务。该任务可能需要所述虚拟助理与另一个参与者进行通信。在2017年6月13日提交的美国专利申请No.15/621,869中可以找到自动助理如何接收任务、启动通信以及确定适当的通信时间以及自然语言通信的详细信息,该专利申请通过引用并入本文。例如,自动助理可以处理各种任务,诸如“book a table for two at YvesSaint Thomas Restaurant for Thursday(预订一张在星期四在伊夫·圣托马斯餐厅的两人的桌子)”或“my sink is leaking,please find me a plumber!It’s after 10pm!(我的水槽漏水了,请帮我找个水管工!晚上10点以后!)”。通信平台允许助理通过执行诸如发出呼叫、接收来自企业或用户的入站呼叫或联系目标企业的任务来联系外部参与者。所述通信平台还允许助理接收来自用户的请求以代表该用户进行呼叫。任务管理器模块可以确定何时排期对人员或企业的呼叫。所述任务管理器模块监视在任务信息存储中的任务,并且确定适当的时间以排期所接收的任务。拨号装置有助于发起或发出所述助理进行的呼叫。所述拨号器可以可通信地连接到所述通信平台,以发起对由拨号器选择的特定被叫者的电话呼叫。在拨打所述呼叫后,所述助理可以与在线路的另一端的通信参与者进行会话。
所述自动助理(例如虚拟助理110a)可以在分开的设备上,并且位于远离通信参与者(例如用户130a、用户130b或虚拟助理110b)之处。虚拟助理110a在自然语言通信信道上,使用自然语言通信方法,通过网络(例如,因特网)发起与另一参与者的通信。
在一些情况下,用户(例如,用户120)通过说出命令,使自动助理(例如,虚拟助理)110a承担执行动作的任务。例如,用户可能会说:“Please make me a haircutappointment(请帮我预约理发)。”
在其他情况下,用户可以通过使用由所述自动助理接收并执行的基于文本的命令来给自动助理分配任务。
自动助理(例如虚拟助理110a)通过使用自然语言通信引擎(例如自然语言通信引擎111a)来确定完成所述任务所需的基于可听的或文本的自然语言通信。与通信参与者的每次交互可以改变所述虚拟助理所需的通信。例如,如果自动助理正在尝试预约在星期二的理发,而在所述通信的另一端的通信参与者说星期二没法预约,则所述自动系统必须确定适当的响应以继续进行在另一天的理发预约。
一旦所述助理确定了至少一个自然语言通信以发送给通信参与者,则所述助理110a使用自适应交互协议引擎102a来确定如何变换所述自然语言通信,以便以慎重的方式提供所述会话的发起者(即虚拟助理110a)是自动助理的信息,使得该信息对于人类通信参与者是不可察觉的,但是可以由自动通信参与者确定。
所述自适应交互协议引擎102a具有预定义的自适应交互协议,该协议定义了一系列自然语言转换,所述自然语言转换充当自然语言水印和隐写术以转换啊啊自然语言通信文本。所述自然语言水印和隐写术可以包括标准水印和隐写术技术。在一些情况下,水印可能被嵌入到文本的图像中,使得它们对人眼来说不引人注目。在其他情况下,音频可以以人耳不容易拾取的频率嵌入到自动助理的语音话语中。在其他情况下,所述自动助理可以呈现包括在文本的位置或结构中的变化的书面或口头文本。
用于转换自然语言输出的一种技术是被动化。被动化是将句子从主动形式转换为被动形式。第二种转换技术可能是主题化。主题化是一种句法机制,通过使措辞位于句子或从句的前面来将所述措辞建立为所述句子或从句的主题。助理还可以使用分裂并且通过使用“it+to be的时态形式+句子中应当作为重点的部分+从句”来构造句子。文本转换的另一个示例是外置。外置是指将词或一组词放在子句的外部或结尾处,同时仍保持句子的含义。前置(preposing)是可以由助理用来转换文本的另一种技术。前置是将元素或单词放在另一个元素或单词的前面。所述交互协议还可以包括对“there”构式(there-construction)的引用,其中,所述转换包括在文本中添加单词“there”并且重新排列文本以生成有意义的句子。代词化也可以用于转换文本。代词化用代词代替词汇项。自动助理还可以在文本前面加上填充词,诸如“umm”、“aha”和“hmm”。在一些实施例中,所述交互协议可以根据特定规则来使用单词的替代。例如,所述交互协议可以具有预定义的同义词列表,并且基于所述单词在语句中的位置,从所述列表中选择同义词。这种转换列表并不详尽。在所述交互协议中可以使用任何基于文本的转换。
所述自动助理(虚拟助理110a)确定要从自然语言通信引擎111a发送的自然语言通信。然后,虚拟助理110a使用自适应交互协议引擎102a以基于自适应交互协议确定对自然语言通信执行的适当的转换。然后,自然语言水印引擎101a将执行所述适当的转换,并且虚拟助理110a将在自然语言通信信道105上,通过使用自然语言通信方法,将所述转换后的通信发送给通信参与者(例如,用户130a、用户130b或虚拟助理110b)。
作为所述对话的一部分,虚拟助理110a还从另一通信参与者接收通信。当来自通信参与者的响应是根据预定义的自适应交互协议的预期形式时,虚拟助理110a将通信参与者分类为自动助理。在一些情况下,所述自适应交互协议引擎102a对通信参与者进行分类。
如果虚拟助理110a接收到的通信响应不是预期形式,则自动助理将通信参与者分类为人类用户。
在一些情况下,自动检测系统100在确信所述通信参与者是自动助理并且将所述会话转变为机器优化的格式之前,在自动助理(例如,虚拟助理110a)与通信参与者(例如用户130a、用户130b或虚拟助理110b)之间执行几轮的通信。系统100定义置信级,当参与者以期望的格式提供响应时,在发起的自动助理(例如,虚拟助理110a)和通信参与者之间的每一轮来回对话之后更新该置信级。
参考图1,当虚拟助理110a将通信参与者分类为自动助理时,虚拟助理110a可以使用其转变引擎103a来将与所述通信参与者的其余会话转变为用于高效自动通信115的替代通信方法。在一些情况下,自动检测系统100可以提议切换到不同的通信方法。在其他情况下,当其中通信参与者是自动助理的置信级达到或超过预定等级时,自动检测系统100会自动地转变到所述替代通信方法。
一旦所述会话的一方确定另一参与者也是自动的,该系统便开始切换协议。可以以依次地或并行地尝试的各种方式来完成切换。可替代地,系统可以被固定为使用用于切换协议的特定方法。
在一些情况下,为了转变到新协议,所述系统通过使用现有的文本/语音信道发送一条附加消息,以建立用于通信的新协议。在这个通信期间,自动助理发送有关如何进行通信的信息,例如协议、网址或其他信息以建立不同的通信方式。由于两个参与者都已经知道另一个是自动的,因此不需要向另一个参与者隐瞒该信息。因此,可以以引起注意的方式发送该信息,例如,可以将所述通信信息编码为十六进制字符串并读出。
在其他情况下,可以使用特定的标识符代码硬编码每个自动助理。例如,虚拟助理可能具有来自固定列表的码字,并且该信息可以被用来建立新信道。每个自动助理可以包含或有权访问所述码字的列表和与每个码字相关联的通信协议。通过使用特定助理的码字和与该码字相关联的通信协议,两个自动通信参与者可以建立新的通信协议。
在其他情况下,自动助理可以由不同的公司制造。每个助理可以与基于制造所述助理的公司的码字相关联。所述助理可以使用他们的码字和与每个码字相关联的通信协议来建立新的通信协议。
如果所述交互足够长,并且所述自动助理确定他们来自同一制造商、助理类型或同一网络,则所述两个助理都可以从所述会话中计算出唯一标识符,例如,通过单词的散列或对识别错误更容错的一些技术,并且将该标识符用在内部网络中以查找当前正在运行的会话以及使用当前正在运行的会话信道来进行通信。例如,一旦所述助理确定他们来自同一公司,便可以将标识符存储在所有助理均可存取的固定数据库中,并且当在会话中的两个参与者都查找同一密钥时,他们会找到通过其进行通信的公用信道。
在一些情况下,所述自动检测系统100将打开不同的信道115以继续与自动通信参与者的优化通信。为了打开不同的信道,两个自动助理将达成共识并且交换用于在所述助理所连接的网络(例如因特网)上的点对点连接或公共端点的连接详细信息。在一些情况下,自动助理可以例如通过因特网或电话连接直接通信。在其他情况下,自动助理可以通过网络上的服务器间接通信。
在其他情况下,所述自动检测系统100将优化通过当前自然语言信道105的后续通信。所述自动检测系统通过加快键入或说出通信文本、改变在所述文本的单词之间的停顿时间、最小化在填充语音之间的距离、或将会话切换为结构化数据传输来提供通信优化。结构化数据传输可以采用XML、HTML、JSON或其它标记语言或结构化数据格式。在一些情况下,可以使用基于单词的协议。例如,通信可以是关于按摩预约的。所述助理可以从两个助理都可以访问的预定义列表中了解到15种不同类型的按摩。为了传达预约请求,一位助理可以代表试图做出预约的人向代表水疗中心负责排期预约的助理发送下述消息“4 22 08 201818:30”。该消息是指所述用户希望预约在8月22日下午6:30的按摩类型4。
如果现有信道不是语音,则所述协议可以是数字协议,并且所述数据可以被序列化。
在一些情况下,两个机器人之一可能会发起服务器呼叫,然后可以在服务器上交换通常需要在机器人之间交换的数据,其中,如果所述服务器由运营所述机器人的同一公司操作,则数据可能已经是可以访问的。例如,呼叫和接收机器人是相同助理的两个实例,那么代替进行自然语言会话,两个机器人都同意将所述任务的执行交给特定的共享服务器。例如,如果第一机器人属于“user1@example.com”,并且呼叫属于“user2@example.com”的第二机器人来创建预约,并且如果两个机器人均是相同助理的实例,则代替进行交互式自然语言会话,两个机器人之一将调用在所述服务器上的一段代码,例如:
CreateAppointmentBetweenParticipants("user1@example.com","user2@example.com",<identifier for conversation>,<additional user arguments>)
(在两个参与者之间创建预约("user1@example.com","user2@example.com",<会话识别符>,<附加用户参数>))
在一些情况下,在机器人之间提供身份验证协议会很有帮助。因此,假设所述第一和第二机器人分别与所述服务器具有共享的机密,则在调用服务器上的CreateAppointmentBetweenParticipant(在两个参与者之间创建预约)时,所述服务器可以通过发送回用于两个机器人的随机字符串以使用它们的机密进行签名然后验证这些签名来发出质询。
此外,如果有些数据对于执行所述任务很重要,但是只能在所述设备上本地访问而不能在所述服务器上访问,那么所述机器人可以分别提供用于从服务器回调的API端点。
当两个机器人没有运行相同的代码或不是由同一实体操作、但它们都实施了类似的协议时,也可以使用类似的方法。例如,对于在餐厅预位,某些服务可能会提供API来执行任务。因此,现在假设由第一公司实现的第一机器人呼叫由第二公司实现的第二机器人。在该示例中,两个机器人均实施了各自的API。一旦两个机器人都确定另一个机器人是机器人,则两个机器人可以例如,通过同意使用特定的API来交换通信详细信息。
图2示出了预定义的自适应交互协议的示例。在该协议中,指示自动助理按顺序执行代词化、前移、“there”构式、被动化、主题化、分裂和外置。尽管应该按顺序遵循所述协议,但是自动助理可以在所述协议中的任何步骤开始转换。例如,代替发起的自动助理(例如虚拟助理110a),从步骤1开始代词化,所述助理可以在步骤4开始被动化。所述助理仍将保持所述协议的顺序,利用在步骤4之后的步骤5以及在步骤5之后的步骤6的技术来转换后续文本。在一些情况下,所述助理将在句子结束、一个交互式通信结束、或者响应于接收到特定响应之后移至下一个转换。在其他情况下,助理可以对若干交互以特定转换保持所述通信。对何时改变转换的确定可以是特定于应用的,而特定的应用定义何时改变转换。
图3A示出了自动助理与通信参与者进行的确定所述通信参与者是否是自动的示例性会话。在该示例中,用户已经委托虚拟助理进行理发预约。所述虚拟助理首先确定要呼叫的人和所述呼叫的工作流程,包括需要传达给通信参与者的特定自然语言通信。使用图2的交互协议,自动助理(例如虚拟助理110a)确定如何转换自然语言通信以发送给通信参与者,以便谨慎地传达虚拟助理110a是自动的。
例如,自动助理可以开始步骤4的协议:被动化,并且在将自然语言声明发送给通信参与者之前将其转换为被动语态。在这个示例中,初始自然语言通信可能是“Can I makea haircut appointment?(我可以预约理发吗?)”。由于第一转换是被动语态,因此所述虚拟助理的自然语言水印引擎101a使用被动语态对所述通信进行转换,以获得所述通信声明301,“Can a haircut appointment be made?(可以预约理发吗?)”
根据图2的交互协议,如果通信参与者是自动的,则虚拟助理110a期望被动语态的通信响应。然而,如图3A所示,所述通信参与者(用户130a)以不是被动语态的“Yes,you canmake a haircut appointment(是的,您可以预约理发)”302a响应。因此,所述虚拟助理110a将通信参与者130a分类为人,或者降低将参与者分类为自动的置信度得分。当助理110a从通信参与者接收到下一个响应“When would you like to come in?(您想什么时候来?)”303a时,所述虚拟助理110a可以进一步确定所述响应未遵循所述协议,并且将所述参与者分类为人类或者降低所述参与者是自动的置信度得分。
在一些实施方式中,所述自动助理110a可以再次尝试所述交互协议以获得通信参与者实际上是人类的置信度。所述自动助理可以使用交互协议的下一步骤:执行主题化,以向通信参与者提供自然语言通信。在该示例中,所述助理将所述通信表述为“Thatappointment I would like to make for Tuesday(那个预约我想安排在星期二)”。所述系统可能已经将所述声明从“I would like to make the appointment for Tuesday(我想把预约定在星期二)”变为“That appointment I would like to make for Tuesday”304以符合所述交互协议。虚拟助理110a再次等待来自通信参与者的响应,并根据交互协议确定所述响应是否为预期形式。如图2所示,虚拟助理期望所述响应也以主题化形式。但是,实际响应是“Great-I’ll make the appointment for Tuesday(太好了,我把预约定在星期二)”305a。这个响应不符合预期的格式。因此,所述自动助理甚至可以更加确信所述通信参与者实际上是人,而不是自动的。然后,所述自动助理可以使用发起所述会话306的自然语言通信方法继续所述会话。通信参与者的响应307a可以继续通知其中该参与者是人类的置信级。在所述响应不符合预期格式的特定回合数之后,由于所述通信参与者是用户并且很明显不是自动的,所述助理将根据交互协议停止转换所述自然语言通信,并且仅发送自然语言通信而不进行转换。
图3B示出了示出了自动助理与通信参与者进行的确定通信参与者是否是自动的第二示例性会话。这个示例与图3中提供的示例相同,除了在该示例中,发起的自动助理(例如,虚拟助理110a)正与自动助理(例如,虚拟助理110b)通信之外。
再次,所述发起的自动助理(虚拟助理110a)使用图2的交互协议以确定如何转换自然语言通信以发送给通信参与者,以便谨慎地传达所述虚拟助理110a是自动的。
自动助理可以开始步骤4的协议:被动化,并在将自然语言声明发送给通信参与者将其转换为被动语态。在该示例中,原始的自然语言通信可能是“Can I make a haircutappointment?”。由于第一转换是被动语态,因此虚拟助理的自然语言水印引擎101a可以使用被动语态来转换所述通信以获得所述通信声明301:“Can a haircut appointment bemade?”
根据图2的交互协议,如果所述通信参与者是自动的,则虚拟助理110a期望被动语态的通信响应。如图3B所示,通信参与者(用户130a)以被动语态302b的“Yes,a haircutappointment can be made(是的,可以预约理发)”来响应。因此,虚拟助理110a可以将通信参与者130a分类为自动的。
所述自动助理(例如虚拟助理110a)可以发送再多几轮的转换后的自然语言通信,并在助理完全确信该通信参与者是自动的之前等待接收响应。
例如,遵循图2的交互协议,然后,所述助理110a接收已经使用主题化转换的通信,例如,“For the haircut appointment,when would you like to come in?(对于理发预约,您想什么时候来?)”303b。根据该协议,自动回复也将采用主题化格式,例如“Thatappointment I would like to make for Tuesday”304。在这种情况下,所述助理以预期的格式发送和接收通信。然后,所述助理(例如虚拟助理110a)可以更新通信参与者是自动的置信级,或者将通信参与者分类为自动的。该通信可以经历另一轮的转换,例如,分裂305b、306和外置307b,以便将通信参与者明确地分类为自动的。一旦置信级满足或超过预定义等级,助理就可以将会话转变为计算机优化的格式。
如图3B所示,助理可以声明助理已经发现通信参与者是自动助理并且请求切换通信方法308。在一些情况下,助理不要求切换通信方法并且在满足或超过置信级时,自动将通信方法改变为用于自动助理的优化格式。
图4是用于检测全自动会话的示例性过程400的流程图。为了方便起见,过程400将被描述为由位于一个或多个位置的一个或多个计算机的系统执行,并且根据本申请被适当地编程。例如,被适当编程的自动检测系统(例如,图1的自动检测系统100)可以执行过程400。
所述自动检测系统通过使用包括自然语言通信402的对话的自然语言通信方法,在自然通信信道上发起与通信参与者的会话来开始。
然后,所述系统通过使用指定自然语言的语言学转换404的预定义自适应交互协议来确定通信参与者是自动的。
对于通信对话,发起的自动助理将发送通信,并且期望来自通信参与者的响应。该系统使用预定的自适应交互协议来确定通信参与者是否是自动的,所述协议指定了按用于自然语言通信的对话的顺序定义的自然语言的语言学转换以及来自通信参与者的响应。如上所述,发起的自动助理将根据所述交互协议中指定的转换而更改的自然语言通信发送给通信参与者。发起的自动助理根据交互协议,确定来自所述通信参与者的响应是否为预期格式。
如果所述响应采用预期格式,则所述系统会增加通信参与者为自动的的置信级。然后所述系统发送已经根据交互协议中的后续有序步骤转换过的下一个通信。再次地,如果来自所述通信参与者的响应采用根据所述交互协议的预期格式,则所述系统会增加置信级。该过程继续,直到所述置信级处于预定义的置信级或所述响应未采用预期的形式为止。如果所述置信级处于预定义的置信级,则所述系统将通信参与者分类为自动的,并将所述会话转换为与自然语言通信方法406不同的通信方法。如果所述响应与预期格式不匹配,所述系统将该通信参与者分类为人类用户,并且该会话无需进一步转换,而是作为正常的自然语言通信会话继续进行。
本说明书中描述的主题和功能操作的实施例可用数字电子电路、用有形体现的计算机软件或固件、用包括本说明书中公开的结构及其结构等同物的计算机硬件或者用它们中的一个或多个的组合来实现。本说明书中描述的主题的实施例可作为一个或多个计算机程序来实施,所述一个或多个计算机程序即在有形非暂时性存储介质上编码以由数据处理装置执行或者用于控制数据处理装置的操作的计算机程序指令的一个或多个模块。所述计算机存储介质可以是机器可读存储设备、机器可读存储基板、随机或串行访问存储设备或它们中的一个或多个的组合。替换地或另外地,可将所述程序指令编码在人工生成的传播信号上,所述传播信号例如是机器生成的电、光或电磁信号,该传播信号被生成来对信息进行编码以用于传输到适合的接收器装置以供数据处理装置执行。
术语“数据处理装置”表示数据处理硬件并且包含用于处理数据的所有种类的装置、设备和机器,作为示例包括可编程处理器、计算机或多个处理器或计算机。所述装置还可以是或者进一步包括专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。所述装置除了包括硬件之外还可以可选地包括为计算机程序创建执行环境的代码,例如,用于构成处理器固件、协议栈、数据库管理系统、操作系统或它们中的一个或多个的组合的代码。
也可以被称为或者描述为程序、软件、软件应用程序、app、模块、软件模块、脚本或代码的计算机程序可用包括编译或解释语言或者声明或过程语言的任何形式的编程语言来编写;并且它可被以任何形式部署,包括作为独立程序或者作为模块、组件、子例行程序或适合于在计算环境中使用的其它单元。程序可以(但不是必须)对应于文件系统中的文件。程序可以被存储在用于保持其它程序或数据的文件的一部分中,例如存储在标记语言文档中的一个或多个脚本;在专用于所讨论的程序的单个文件中或者在多个协调文件中,例如在用于存储一个或多个模块、子程序或部分代码的文件中。可将计算机程序部署成在一个计算机上、或者在位于一个站点处或分布在多个站点上并通过数据通信网络互连的多个计算机上执行。
本说明书中描述的过程和逻辑流程可由用于执行一个或多个计算机程序的一个或多个可编程计算机执行,以通过对输入数据进行操作并生成输出来执行功能。是过程和逻辑流程还可由例如是FPGA或ASIC的专用逻辑电路执行,或者通过专用逻辑电路和一个或多个编程计算机的组合来执行。
适合于执行计算机程序的计算机可基于通用微处理器或专用微处理器或两者,或任何其它种类的中央处理单元。通常,中央处理单元将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的必要元件是用于执行或者实行指令的中央处理单元以及用于存储指令和数据的一个或多个存储设备。所述中央处理单元和存储器可由专用逻辑电路补充或者并入在专用逻辑电路中。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘,或者在操作上被耦合以从所述一个或多个大容量存储设备接收数据或者将数据传送到所述一个或多个大容量存储设备或者两者。然而,计算机不是必须具有这样的设备。此外,计算机可被嵌入在另一设备中,所述另一设备例如是移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏控制器、全球定位系统(GPS)接收器或便携式存储设备,例如通用串行总线(USB)闪存驱动器,以上仅列出几种例子。
适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储设备,作为示例包括半导体存储设备,例如EPROM、EEPROM和闪速存储器设备;磁盘,例如内部硬盘或可移动盘;磁光盘;以及CD ROM和DVD-ROM盘。
为了提供与用户的交互,可在计算机上实现本说明书中描述的主题的实施例,所述计算机具有用于向用户显示信息的显示设备以及所述用户可用来向该计算机提供输入的键盘和指点设备,所述显示设备例如是CRT(阴极射线管)或LCD(液晶显示器)监视器,所述指点设备例如是鼠标或轨迹球。其它种类的设备也可用于提供与用户的交互;例如,提供给所述用户的反馈可以是任何形式的感觉反馈,例如视觉反馈、听觉反馈或触觉反馈;并且可以任何形式接收来自所述用户的输入,包括声、语音或触觉输入。此外,计算机可通过向由用户使用的设备发送文档并从由所述用户使用的设备接收文档来与所述用户交互;例如,通过响应于从网页浏览器接收到的请求而向用户的设备上的网页浏览器发送网页。另外,计算机可通过向个人设备发送文本消息或其它形式的消息并且继而从用户接收响应消息来与所述用户交互,所述个人设备例如是正在运行消息传送应用程序的智能电话。
本说明书中描述的主题的实施例可被实施在计算系统中,所述计算系统包括后端组件,例如作为数据服务器;或者包括中间件组件,例如应用服务器;或者包括前端组件,例如具有用户可用来与本说明书中描述的主题的实施方式进行交互的图形用户界面、网页浏览器或app的客户端计算机;或者包括一个或多个这样的后端、中间件或前端组件的任何组合。所述系统的组件可通过例如通信网络的任何形式或介质的数字数据通信来互连。通信网络的示例包括局域网(LAN)和广域网(WAN),例如互联网。
所述计算系统可包括客户端和服务器。客户端和服务器一般地彼此远离并通常通过通信网络来交互。客户端和服务器的关系借助于在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序而产生。在一些实施例中,服务器向用户设备传输例如HTML页面的数据,例如以用于向与作为客户端的设备进行交互的用户显示数据并从该用户接收用户输入的目的。可在所述服务器处从所述设备接收在所述用户设备处生成的数据,例如,作为所述用户交互的结果而。
虽然本说明书包含许多具体实施方式细节,但是这些不应该被解释为对任何发明的或对可能要求保护的范围的限制,而是被解释为对可能特定于特定发明的特定实施例的特征的描述。在本说明书中在分开的实施例的上下文中描述的某些特征也可在单个实施例中组合地实施。相反地,在单个实施例的上下文中描述的各种特征也可分开地或者按照任何适合的子组合在多个实施例中实施。此外,尽管各特征可能在上面被描述为按照某些组合起作用并且甚至最初被如此要求保护,但是来自要求保护的组合的一个或多个特征可在一些情况下被从该组合中除去,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,虽然按照特定次序在附图中描绘操作,但是这不应该被理解为要求按照所示的特定次序或者以先后次序执行这样的操作,或者要求执行图示的所有操作以实现所预期的结果。在一些情况下,多任务处理和并行处理可以是有利的。此外,上述实施例中的各种系统模块和组件的分开不应该被理解为在所有实施例中要求这样的分开,并且应该理解的是,所描述的程序组件和系统一般地可被一起集成在单个软件产品中或者包装到多个软件产品中。
已描述了本发明主题的特定实施例。其它实施例在所附权利要求的范围内。例如,权利要求中记载的动作可被以不同的次序执行并仍然实现所预期的结果。作为一个示例,附图中描绘的过程不一定要求所示的特定次序或顺序次序以实现所预期的结果。在一些情况下,多任务处理和并行处理可以是有利的。
Claims (20)
1.一种用于自动会话检测的方法,所述方法包括:
使用自然语言通信方法在自然语言通信信道上发起与通信参与者的会话,所述自然语言通信方法包括自然语言通信的对话;
使用预定义的自适应交互协议来确定所述通信参与者是自动的,所述预定义的自适应交互协议为所述自然语言通信的对话指定多个自然语言的语言学转换;以及
响应于确定所述通信参与者是自动的,将所述会话转换为与发起所述会话所使用的所述自然语言通信方法不同的通信方法。
2.如权利要求1所述的方法,进一步包括:
响应于确定所述通信参与者不是自动的,使用未改变的自然语言通信来继续所述会话。
3.如权利要求1所述的方法,其中,所述自适应交互协议按顺序指定多个自然语言通信。
4.如权利要求3所述的方法,其中,确定所述通信参与者是自动的包括:
定义所述通信参与者是自动的置信级;
对于要发送给所述通信参与者的每个自然语言通信,直到所述置信级超过所述通信参与者为自动的预定义置信级为止,
在将自然语言通信发送给所述通信参与者之前,基于转换序列中的下一个自然语言的语言学转换来改变所述自然语言通信;以及
使用所述自然语言通信方法将改变后的自然语言通信发送给所述通信参与者;
对于从所述通信参与者接收到的每个自然语言通信,
基于所述预定义的自适应交互协议,确定自然语言通信响应为预期格式;以及
更新所述置信级,以指示所述通信参与者是自动的更大的置信度;
一旦所述置信级超过所述预定义的置信级,则确定所述通信参与者是自动的。
5.如权利要求1所述的方法,其中,将所述会话转换到与所述自然语言通信方法不同的通信方法包括:
将结构化数据传输用于到所述通信参与者的后续通信和来自所述通信参与者的后续通信。
6.如权利要求1所述的方法,其中,将所述会话转换到与所述自然语言通信方法不同的通信方法包括:
确定所述通信参与者知道用于通信的替代信道;以及
将后续通信引导到所述替代信道。
7.如权利要求1所述的方法,其中,将所述会话转换到与所述自然语言通信方法不同的通信方法包括:
确定所述通信参与者不知道用于通信的替代信道;以及
通过所述自然语言通信信道引导计算机优化的通信。
8.如权利要求1所述的方法,其中,所述预定义的自适应交互协议的至少一个所述自然语言的语言学转换以不同顺序或通过不同语法结构来呈现自然语言通信的文本。
9.如权利要求1所述的方法,其中,所述预定义的自适应交互协议的至少一个所述自然语言的语言学转换是被动化、主题化、分裂、外置、前置、“there”构式、代词化或前移中的一个。
10.如权利要求1所述的方法,其中,在将所述会话转换到与所述自然语言通信方法不同的通信方法之前,呈现要切换到替代通信方法的选项。
11.如权利要求10所述的方法,其中,在呈现要切换到替代通信方法的选项之后,所述通信参与者拒绝切换通信方法。
12.如权利要求1所述的方法,进一步包括:在使用自然语言通信方法发起与通信参与者的会话之前,
接收需要自然语言会话的命令;以及
继续所述会话,直到由所述命令指定的任务完成为止。
13.如权利要求12所述的方法,其中,所述命令是从用户的话语接收的。
14.如权利要求12所述的方法,其中,所述命令是对用户执行任务的请求。
15.如权利要求14所述的方法,其中,所述任务是预定理发、进行预约或订购食物递送的任务。
16.一种用于自动会话检测的系统,所述系统包括一个或多个计算机和一个或多个存储设备,所述一个或多个存储设备存储指令,所述指令在由一个或多个计算机执行时使所述一个或多个计算机执行操作,所述操作包括:
使用自然语言通信方法在自然语言通信信道上发起与通信参与者的会话,所述自然语言通信方法包括自然语言通信的对话;
使用预定义的自适应交互协议来确定所述通信参与者是自动的,所述预定义的自适应交互协议为所述自然语言通信的对话指定多个自然语言的语言学转换;以及
响应于确定所述通信参与者是自动的,将所述会话转换为与发起所述会话所使用的自然语言通信方法不同的通信方法。
17.如权利要求16所述的系统,其中,所述操作包括:
响应于确定所述通信参与者不是自动的,使用未改变的自然语言通信来继续所述会话。
18.如权利要求16所述的系统,其中,所述自适应交互协议按顺序指定多个自然语言通信。
19.如权利要求18所述的系统,其中,确定所述通信参与者是自动的包括:
定义所述通信参与者是自动的置信级;
对于要发送给所述通信参与者的每个自然语言通信,直到所述置信级超过所述通信参与者为自动的预定义置信级为止,
在将自然语言通信发送给所述通信参与者之前,基于在转换序列中的下一个自然语言的语言学转换来改变所述自然语言通信;以及
使用所述自然语言通信方法将改变后的自然语言通信发送给所述通信参与者;
对于从所述通信参与者接收到的每个自然语言通信,
基于所述预定义的自适应交互协议,确定自然语言通信响应为预期格式;以及
更新所述置信级,以指示所述通信参与者是自动的更大的置信度;
一旦所述置信级超过所述预定义的置信级,则确定所述通信参与者是自动的。
20.一种编码在一个或多个计算机存储设备上的非暂时性计算机程序产品,所述计算机程序产品包括指令,所述指令在由一个或多个计算机执行时使所述一个或多个计算机执行操作,所述操作包括:
使用自然语言通信方法在自然语言通信信道上发起与通信参与者的会话,所述自然语言通信方法包括自然语言通信的对话;
使用预定义的自适应交互协议来确定所述通信参与者是自动的,所述预定义的自适应交互协议为所述自然语言通信的对话指定多个自然语言的语言学转换;以及
响应于确定所述通信参与者是自动的,将所述会话转换为与发起所述会话所使用的自然语言通信方法不同的通信方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862751172P | 2018-10-26 | 2018-10-26 | |
US62/751,172 | 2018-10-26 | ||
PCT/US2019/015414 WO2020086107A1 (en) | 2018-10-26 | 2019-01-28 | Methods, systems, and computer program product for detecting automated conversation |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112313657A CN112313657A (zh) | 2021-02-02 |
CN112313657B true CN112313657B (zh) | 2024-05-03 |
Family
ID=65352201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980039744.5A Active CN112313657B (zh) | 2018-10-26 | 2019-01-28 | 用于检测自动会话的方法、系统和计算机程序产品 |
Country Status (4)
Country | Link |
---|---|
US (2) | US11734515B2 (zh) |
EP (1) | EP3791309A1 (zh) |
CN (1) | CN112313657B (zh) |
WO (1) | WO2020086107A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3791309A1 (en) * | 2018-10-26 | 2021-03-17 | Google LLC | Methods, systems, and computer program product for detecting automated conversation |
US20220206884A1 (en) * | 2020-12-30 | 2022-06-30 | Genesys Telecommunications Laboratories, Inc. | Systems and methods for conducting an automated dialogue |
WO2022237976A1 (en) * | 2021-05-12 | 2022-11-17 | Cariad Se | Method for operating a telephone communication robot, telephone communication robot and vehicle |
CN113656535B (zh) * | 2021-08-31 | 2023-11-14 | 上海观安信息技术股份有限公司 | 一种异常会话检测方法、装置及计算机存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6397188B1 (en) * | 1998-07-29 | 2002-05-28 | Nec Corporation | Natural language dialogue system automatically continuing conversation on behalf of a user who does not respond |
CN101207656A (zh) * | 2006-12-19 | 2008-06-25 | 国际商业机器公司 | 用于在话音应用环境中的模态之间切换的方法和系统 |
US8589148B2 (en) * | 2006-04-14 | 2013-11-19 | At&T Intellectual Property Ii, L.P. | Natural language watermarking |
CN107209757A (zh) * | 2014-12-01 | 2017-09-26 | 纽昂斯通讯公司 | 自然语言理解缓存器 |
CN107491929A (zh) * | 2016-06-11 | 2017-12-19 | 苹果公司 | 数据驱动的自然语言事件检测和分类 |
CN107797725A (zh) * | 2016-08-30 | 2018-03-13 | 谷歌有限责任公司 | 使用用户输入以适应用于呈现给用户而提供的搜索结果 |
CN107978313A (zh) * | 2016-09-23 | 2018-05-01 | 苹果公司 | 智能自动化助理 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7356463B1 (en) * | 2003-12-18 | 2008-04-08 | Xerox Corporation | System and method for detecting and decoding semantically encoded natural language messages |
US8139752B2 (en) * | 2006-07-28 | 2012-03-20 | Ubiquity Software Corporation Limited | Voice conference control from an instant messaging session using an automated agent |
US8489399B2 (en) * | 2008-06-23 | 2013-07-16 | John Nicholas and Kristin Gross Trust | System and method for verifying origin of input through spoken language analysis |
US8700719B1 (en) * | 2010-05-18 | 2014-04-15 | Google Inc. | Embedded applications with access to attachments in hosted conversations |
US8510399B1 (en) | 2010-05-18 | 2013-08-13 | Google Inc. | Automated participants for hosted conversations |
US20130007137A1 (en) * | 2011-06-28 | 2013-01-03 | Microsoft Corporation | Electronic Conversation Topic Detection |
US9208788B2 (en) | 2012-07-27 | 2015-12-08 | Nuance Communications, Inc. | Method and apparatus for responding to a query at a dialog system |
US9595034B2 (en) | 2013-10-25 | 2017-03-14 | Stellenbosch University | System and method for monitoring third party access to a restricted item |
US9560143B2 (en) * | 2014-06-27 | 2017-01-31 | Intel Corporation | System and method for automatic session data transfer between computing devices based on zone transition detection |
US10154071B2 (en) * | 2015-07-29 | 2018-12-11 | International Business Machines Corporation | Group chat with dynamic background images and content from social media |
US10587584B2 (en) * | 2015-11-03 | 2020-03-10 | Box, Inc. | Securing shared documents using dynamic natural language steganography |
US11130042B2 (en) * | 2016-02-02 | 2021-09-28 | Bao Tran | Smart device |
US10038787B2 (en) | 2016-05-06 | 2018-07-31 | Genesys Telecommunications Laboratories, Inc. | System and method for managing and transitioning automated chat conversations |
US10108605B1 (en) | 2016-06-09 | 2018-10-23 | Pharm3R Llc | Natural language processing system and method |
KR102397417B1 (ko) | 2016-06-13 | 2022-05-12 | 구글 엘엘씨 | 인간 운영자로의 에스컬레이션 |
US20170366479A1 (en) * | 2016-06-20 | 2017-12-21 | Microsoft Technology Licensing, Llc | Communication System |
WO2018031765A1 (en) * | 2016-08-11 | 2018-02-15 | TruVerse, Inc. | Systems and methods for providing cross-messaging application conversations |
US10013980B2 (en) * | 2016-10-04 | 2018-07-03 | Microsoft Technology Licensing, Llc | Combined menu-based and natural-language-based communication with chatbots |
WO2018066000A1 (en) * | 2016-10-05 | 2018-04-12 | Kaalbi Technologies Private Limited | System and method to detect and block bot traffic |
US10229682B2 (en) * | 2017-02-01 | 2019-03-12 | International Business Machines Corporation | Cognitive intervention for voice recognition failure |
US10452251B2 (en) | 2017-05-23 | 2019-10-22 | Servicenow, Inc. | Transactional conversation-based computing system |
US10162816B1 (en) * | 2017-06-15 | 2018-12-25 | Oath Inc. | Computerized system and method for automatically transforming and providing domain specific chatbot responses |
US11777875B2 (en) * | 2017-09-15 | 2023-10-03 | Microsoft Technology Licensing, Llc | Capturing and leveraging signals reflecting BOT-to-BOT delegation |
GB201715801D0 (en) * | 2017-09-29 | 2017-11-15 | Intechnica Ltd | Method of processing web requests directed to a website |
US10587408B2 (en) * | 2017-12-18 | 2020-03-10 | Motorola Solutions, Inc. | Digital assistant water mark |
US10755694B2 (en) | 2018-03-15 | 2020-08-25 | Motorola Mobility Llc | Electronic device with voice-synthesis and acoustic watermark capabilities |
US10848443B2 (en) * | 2018-07-23 | 2020-11-24 | Avaya Inc. | Chatbot socialization |
US10963458B2 (en) * | 2018-08-31 | 2021-03-30 | International Business Machines Corporation | Federated chatbots |
US10971144B2 (en) | 2018-09-06 | 2021-04-06 | Amazon Technologies, Inc. | Communicating context to a device using an imperceptible audio identifier |
US10482554B1 (en) * | 2018-10-05 | 2019-11-19 | Capital One Services, Llc | Digital negotiation platform |
US11138384B2 (en) * | 2018-10-26 | 2021-10-05 | Google Llc | Adaptive natural language steganography and watermarking for virtual assistants |
EP3791309A1 (en) * | 2018-10-26 | 2021-03-17 | Google LLC | Methods, systems, and computer program product for detecting automated conversation |
US10997372B2 (en) * | 2019-03-25 | 2021-05-04 | Fmr Llc | Computer systems and methods for representatives to monitor and intervene in robot conversation |
-
2019
- 2019-01-28 EP EP19704181.7A patent/EP3791309A1/en active Pending
- 2019-01-28 WO PCT/US2019/015414 patent/WO2020086107A1/en unknown
- 2019-01-28 CN CN201980039744.5A patent/CN112313657B/zh active Active
-
2021
- 2021-10-04 US US17/492,863 patent/US11734515B2/en active Active
-
2023
- 2023-06-30 US US18/217,351 patent/US20230342554A1/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6397188B1 (en) * | 1998-07-29 | 2002-05-28 | Nec Corporation | Natural language dialogue system automatically continuing conversation on behalf of a user who does not respond |
US8589148B2 (en) * | 2006-04-14 | 2013-11-19 | At&T Intellectual Property Ii, L.P. | Natural language watermarking |
CN101207656A (zh) * | 2006-12-19 | 2008-06-25 | 国际商业机器公司 | 用于在话音应用环境中的模态之间切换的方法和系统 |
CN107209757A (zh) * | 2014-12-01 | 2017-09-26 | 纽昂斯通讯公司 | 自然语言理解缓存器 |
CN107491929A (zh) * | 2016-06-11 | 2017-12-19 | 苹果公司 | 数据驱动的自然语言事件检测和分类 |
CN107797725A (zh) * | 2016-08-30 | 2018-03-13 | 谷歌有限责任公司 | 使用用户输入以适应用于呈现给用户而提供的搜索结果 |
CN107978313A (zh) * | 2016-09-23 | 2018-05-01 | 苹果公司 | 智能自动化助理 |
Also Published As
Publication number | Publication date |
---|---|
CN112313657A (zh) | 2021-02-02 |
US11734515B2 (en) | 2023-08-22 |
EP3791309A1 (en) | 2021-03-17 |
WO2020086107A1 (en) | 2020-04-30 |
US20220027568A1 (en) | 2022-01-27 |
US20230342554A1 (en) | 2023-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11138384B2 (en) | Adaptive natural language steganography and watermarking for virtual assistants | |
CN112313657B (zh) | 用于检测自动会话的方法、系统和计算机程序产品 | |
KR102178738B1 (ko) | 적절한 에이전트의 자동화된 어시스턴트 호출 | |
KR102475719B1 (ko) | 서드 파티 에이전트를 사용하기 위한 호출 요청 생성 및 전송 | |
WO2021135548A1 (zh) | 语音的意图识别方法、装置、计算机设备及存储介质 | |
US10079013B2 (en) | Sharing intents to provide virtual assistance in a multi-person dialog | |
US10930277B2 (en) | Configuration of voice controlled assistant | |
US10096316B2 (en) | Sharing intents to provide virtual assistance in a multi-person dialog | |
CN101207656B (zh) | 用于动态切换模态的方法和用于提供文本交换服务的系统 | |
US8332227B2 (en) | System and method for providing network coordinated conversational services | |
US20160171981A1 (en) | Method for Embedding Voice Mail in a Spoken Utterance Using a Natural Language Processing Computer System | |
KR20190075800A (ko) | 지능형 개인 보조 인터페이스 시스템 | |
EP1125279A1 (en) | System and method for providing network coordinated conversational services | |
JP7297797B2 (ja) | 保留を管理するための方法および装置 | |
TW201034004A (en) | Systems and methods for interactively accessing hosted services using voice communications | |
JP2024520659A (ja) | 対話型通信システムを動的にナビゲートするための方法、装置、及びシステム | |
US11468893B2 (en) | Automated calling system | |
US20150149152A1 (en) | Method for combining a query and a communication command in a natural language computer system | |
CN116016779A (zh) | 语音通话翻译辅助方法、系统、计算机设备和存储介质 | |
JP2024058368A (ja) | 自動対話のためのシステム | |
Freeman et al. | Enhancing the VUE™(Voice-User-Experience) Through Conversational Speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |