CN108475503B - 用于多语言通信排序的系统和方法 - Google Patents

用于多语言通信排序的系统和方法 Download PDF

Info

Publication number
CN108475503B
CN108475503B CN201580085355.8A CN201580085355A CN108475503B CN 108475503 B CN108475503 B CN 108475503B CN 201580085355 A CN201580085355 A CN 201580085355A CN 108475503 B CN108475503 B CN 108475503B
Authority
CN
China
Prior art keywords
sequence
language
audio
alternative
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580085355.8A
Other languages
English (en)
Other versions
CN108475503A (zh
Inventor
S·P·鲍尔
J·R·尤罗特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Interactive Intelligence Group Inc
Original Assignee
Interactive Intelligence Group Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Interactive Intelligence Group Inc filed Critical Interactive Intelligence Group Inc
Publication of CN108475503A publication Critical patent/CN108475503A/zh
Application granted granted Critical
Publication of CN108475503B publication Critical patent/CN108475503B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/35Aspects of automatic or semi-automatic exchanges related to information services provided via a voice call
    • H04M2203/355Interactive dialogue design tools, features or methods

Abstract

本发明提供了一种用于多语言通信排序的系统和方法。通信流可以支持可能需要被创建、移除或编辑的一种或多种语言。在序列编辑期间,可以添加提示、数据、表达式、暂停和文本转语音。这可以通过使用包括提示或TTS的内联选择器完成,或者通过还可以提供错误反馈的对话的使用完成。主序列能够处理被彼此独立地支持和管理的多种语言。

Description

用于多语言通信排序的系统和方法
技术领域
本发明整体涉及电信系统和方法以及商业环境。更具体地,本发明涉及在商业环境内交互中的音频回放。
发明内容
本发明提出了一种用于多语言通信排序的系统和方法。通信流可以支持可能需要被创建、移除或编辑的一种或多种语言。在序列编辑期间,可以添加提示、数据、表达式、暂停和文本转语音。这可以通过使用包括提示或TTS的内联选择器完成,或者通过还可以提供错误反馈的对话的使用完成。主序列能够处理被彼此独立地支持和管理的多种语言。
在一个实施例中,提供了一种用于在交互式语音应答系统中使用多种语言与参与者按序列通信的方法,该方法包括以下步骤:通过系统的用户创建提示,其中提示具有多个附加资源;通过交互式语音应答系统为通信启用至少一个支持的语言,其中通信为至少一个支持的语言;为编辑序列启用提示、数据、表达式、暂停和文本转语音中的一个或多个;为通信启用替代语言,其中替代语言包括替代序列。
在另一个实施例中,提供了一种在交互式语音应答系统中使用多种语言与参与者按序列通信的方法,所述方法包括以下步骤:由用户通过图形用户界面选择提示;和在运行时通过计算机处理器使用提示创建通信序列。
在另一个实施例中,提供了一种在交互式语音应答系统中使用多种语言与参与者按序列通信的方法,所述方法包括以下步骤:由用户将文本输入到图形用户界面中,其中文本通过计算机处理器被转换为文本转语音;和通过计算机处理器使用文本转语音创建通信序列。
附图说明
图1a-1d为显示内联选择器的实施例的视图;
图2a-2e为显示序列选择器的实施例的视图;
图3a-3b为显示音频序列的实施例的视图;
图4a-4e为显示多语言序列的实施例的视图;
图5a-5b为显示音频序列编辑的实施例的视图;以及
图6为显示错误的实施例的视图。
具体实施方式
为了有助于对本发明的原理的理解,现在将参考附图中示出的实施例,并将使用特定语言来说明这些实施例。然而,应当理解的是,这并不意在限制本发明的范围。本发明所属领域的技术人员通常会想到对所述的实施例的任何替换和进一步的修改以及对这里描述的发明原理的任何进一步的应用。
在商业环境中,例如联络中心或企业环境,经常使用交互式语音应答系统,特别是用于入站和出站的交互(例如,呼叫、网页交互、视频聊天,等等)。不同媒体类型的通信流可以被设计为自动应答通信、使用菜单选项呈现交互的各方并根据各方选择提供交互的路由。可以根据使用该流的产业或商业呈现选项。例如,银行可以向客户提供输入账号的选项,而另一个企业可以询问通信者的姓名。另一个公司可以只是让客户选择与选项相关的数字。可能还需要系统支持许多种语言。在一个实施例中,可以使用对于自动运行时间数据回放、语音识别以及文本转语音(TTS)统一的多语言支持。
在一个实施例中,IVR用以完成交互的呼叫流或者用于通信处理的逻辑可以包括多种不同的语言。在对这些流的管理中,主序列向流中所有支持的语言提供音频序列,并且具有以单个语言为基础向系统用户(例如,流创建者)指定替代序列的能力。主序列还可以包括一个或多个项。主序列能够处理IVR流中支持的多种语言。在触发替代序列的情况下,所述语言可以被彼此独立地进行管理。在序列编辑期间,错误反馈可以通过系统触发并被提供到用户以纠正出现的问题。
在一个实施例中,流可以包括多个序列。例如,流中的初始问候语包括序列,可以向通信者呈现菜单,可以在所述菜单处向所述通信者提供另一个序列,例如‘销售按1’、‘Jim按2’,等等。在本示例中,对选项的选择触发呈现给通信者的另一个序列。
由于商业环境并不总是一致的,因此可能需要对音频进行更改,但无需解构IVR。相关提示资源上的新提示的TTS将与创建者在流中设置的TTS集保持一致,而这可以根据需要修改。
例如,可以为问候语创建提示,例如“您好”,并存储在通过运行时间引擎访问的数据库中,所述运行时间引擎例如为类似执行IVR逻辑的Interactive Intelligence Group,Inc.’s Interaction产品的媒体服务器。提示可以附加有一个或多个资源。资源可以包括音频(例如,说出的“您好”)、TTS(例如,合成的“您好”)或语言(例如,en-US)。在一个实施例中,资源可以包括TTS和音频以及语言标签。在另一个示例中,资源可以包括TTS或音频以及语言标签。语言标签可以包括IETF语言标签(或其它用于标记语言的方法),并且可以用于识别提示中的资源。语言标签还可以提供用于音频和TTS的分组。在一个实施例中,提示可以每种语言仅具有一个提示资源。例如,两个资源不可能与德语相关联。
在一个实施例中,可以在TTS跟随提示之后编辑音频序列,反之亦然。用户可以决定指定提示或指定TTS。随着业务需求的提出,提示或TTS随后可以变成序列。例如,在流的开发期间,可以初始使用TTS,并在随后的时间转变为序列。
音频序列包括向与IVR交互的通信者回放的索引项的有序列表。所述项可以包括不是特定顺序的TTS、数据回放、提示、暂停或中止以及嵌入式音频表达式。主序列可以被指定,并且该被指定的序列应用于在流上设置的所有支持的语言。替代序列也可以存在于流中。这些替代序列能够用于特定的语言,以使交互退出主序列时,例如通过新语言的选择,用于该新语言的替代序列接管过来。替代序列可以初始从主序列复制过来并进一步由流创建者编辑。随后,除了由流创建者启用的替换序列外,主序列还可以被用于流中所有支持的语言。如果为流中每个支持的语言启用替换序列,则由于每个替代语言覆盖了主序列而将不再应用主序列。因此,提示中用语的顺序可以是语言特定的。在一个实施例中,一个提示可以足够用于所有语言,例如“感谢联系”提示。在这种提示中,每种语言都有在主序列中所使用的提示中使用的适当音频。
音频序列可以通过对话(例如,模式对话或窗口)或内联选择器来配置。在一个实施例中,内联选择器包括TTS或提示的简单配置方法。图1a-1d为显示内联选择器的实施例的视图,所述内联选择器整体用100标示。在一个实施例中,内联选择器包括单项序列,例如TTS或提示。
对于交互,创建者可以详细说明流支持的语言。在一个实施例中,初始问候语可以使用TTS或预先创建的提示生成。例如,创建者可以输入初始问候语的TTS或选择预先存在的提示,而不必打开序列编辑器进行配置。在一个实施例中,内联选择器包括将被播放为初始问候语的TTS。在另一个实施例中,内联选择器包括将被播放为初始问候语的提示选择。
图1a为使用TTS的单项序列的示例,图1b为使用提示的单项序列的示例。内联选择器(例如,图1a和图1b中)包括“音频”105。还可以包括音频表达式106。与音频表达式一起可以呈现图标107,一旦选择该图标,则打开用于编辑音频序列的窗口。还可以为该附加的提示打开窗口。这些编辑窗口将在以下的图2a-2e中更详细地说明。
在一个实施例中,可以为项目显示错误及其描述108,如图1c中所示,其中错误指示音频序列中存在问题(例如,“1个或多个音频序列有错误”)。例如,可以通过突出显示或者错误和/或错误描述的字体颜色变化来引起对错误的注意。
图1d为没有错误的音频序列的一个实施例,显示‘设置1个音频序列’109。图标,例如在图1d中列举说明的对话云110,也可以指示这个入口不是TTS或提示的内联入口。在一个实施例中,用户可以通过与选择TTS或提示相反的对话手动输入序列。
图2a-2d为整体显示序列选择器的实施例的视图。为简单起见,图2a-2d中的每一个显示支持的单种语言。这些窗口通常指示用于配置对话和音频表达式的序列编辑的示例。在图2a中,窗口显示音频表达式为TTS 201。用于可以决定添加附加的对话,例如“添加提示”、“添加数据”、“添加TTS”、“添加表达式”以及“添加空白音频”,作为非限制示例列举。这些选项可以在任务栏202中显示。在图2a中,已经选择了“添加TTS”。因此,可以创建序列中的附加项。在图2a中,这被识别为序列中的第二个并且是“文本转语音”203。因为项顺序可编辑,可以将任意数量的项添加到序列。在一个实施例中,如图2c中进一步描述的,TTS字符串可以被另外提升为添加到一个或多个语言中的提示或音频。
在图2b中,初始已经选择“添加空白音频”204。空白音频可以允许用户配置系统以在回放中延迟或暂停特定时长。在一个实施例中,这可以由下拉菜单205执行,如图2b中所示。可以呈现不同时长以供选择,例如100ms、250ms、500ms,等等。
进一步地,对于多种语言,简单的TTS可以被提升为包括音频和TTS的管理提示,例如图2c中所示。流创建者可以指定提示名称206和描述207,以便创建提示。这里,名称为“感谢联系”,描述为“在交互结束时表达感谢联系我们”。在用户界面中创建提示之后,在每个提示资源上设置TTS,其中所述提示资源通过在流208上设置的支持的语言确定。在图2c中,已经指定了英语和美国。流创建者可以指定包括作为“感谢联系我们”的音频209。在一个实施例中,例如,如果支持的语言为英语和西班牙语,则两个资源可以被呈现为提示资源。
主序列中还可以包括附加数据。在图2d中,例如,主序列中可以包括四个项。每个项可以通过从任务栏202选择对话“添加数据”创建。可以添加不同类型的数据,例如:日期和/或时间、货币、可以代表客户信息的数字,等等。根据所选择的数据类型,可以从系统获得不同的选项以供用户选择。例如,项目1中的数据,208可以包括货币。用户可以决定接受仅来自可获得选项的主要单位。对于项目2,209,已经选择小数。用户可以决定他们希望系统说出每个数字、说出整个数值,等等。
在使用性别和/或(语法)格(case)的特定语言中,选项还可以包括在阴性、阳性、中性、冠词等等之间选择210。还可以根据语言改变/重新排序/移除序列。
在使用性别的一个示例中,兽医诊所拥有具有在西班牙-美国(es-US)中运行的呼叫流的IVR。关于呼叫者文件上有什么宠物,与呼叫者的确认被自动执行。对于该特定客户,需要确认他们的文件上有一只雌性猫。以下为一个示例性序列,例如:
TTS:“Usted tiene”(你有)
数据:1,雌性
TTS:“gata”
在运行时,IVR将返回:“Usted tiene una gata”。
生成的表达式包括:添加(到音频TTS(“Usted tiene”),到音频数字(1,语言.性别.雌性),到音频TTS(“gata”))。
在一个实施例中,其中提交数字到“到音频数字”具有特定的性别表达,运行时间回放将播放正确的提示。对于上述的兽医诊所的示例,由于数字‘1’将需要与跟随的名词的性别(雌性猫)一致,因此使用“una”。
还可以为语言支持冠词。元数据可以在语言是否支持性别、有什么性别类型(例如,雄性、雌性、无性)或(语法)格上作出保留。如果这些选项中的一个由流创建者指定,并且运行时间具有为该选项设置的专用音频处理程序,该处理程序将为通信者回放。在一个实施例中,(语法)格和性别还可以在回放上组合在一起而不是彼此独立。例如,使用“到音频数字(1,语言.词性.阳性,语言.格.冠词)”,词性选项被组合在一起,随后格选项被组合在一起。在一个实施例中,在用户界面的同一个下拉菜单中可以支持格和词性。
错误还可以在序列编辑期间通过系统自动显示。在图2e中,提供了内联错误的一个示例211。内联错误可以通过诸如颜色改变、警告、突出显示、图标等方式显示。在图2e中,项输入字段被突出显示。在这个示例中,用户在序列中添加了项,但是没有在对话中指定表达式文本。系统识别到出现错误并提供指示,例如反馈,以允许用户以快速编辑形式纠正错误。在具有较长表达式的实施例中,例如,可以打开提供更多详细反馈(例如,将音频转换为数字)的编辑器。在图2e中,生成了“没有已定义的表达式”的指示212,从而允许用户快速查明错误并在本示例中定义表达式。
表达式还可以包括在序列图形用户界面中,这允许更大的灵活性,例如,‘到音频TTS(如果(小时(获得当前日期时间UTC())>=12,“下午好”,“早上好”))’。如果呼叫者在英格兰的格林威治,如果在12:00PM之前运行,则表达式显示“早上好”的TTS,否则显示“下午好”。表达式还可以允许在序列内动态回放,例如“是你的社会保险号码的最后四位数字”的TTS。表达式可以是:“到音频TTS(子串(流.客户SSN,长度(流.客户SSC)-4,4),格式.字符串.播放字符)”。本示例中的表达式被用于提取部分数据。该数据包括客户的社会保险号码,所述社会保险号码的最后四个字符被作为流在其中运行的语言中的说话整体重读给客户。表达式还可以用于执行数学计算和文本处理,例如一起添加订单或计算交货日期。
表达式还可以包括返回音频类型的语法,以提供对回放的数据类型的更多控制。在一个实施例中,这还可以应用到在通信者(例如,呼叫者)待机正在等待代理时运行的通信和/或流(例如,入栈流)。
音频序列可以被编辑。在图3a和3b中,整体提供了音频序列的示例。可以呈示音频序列,并且用户可以决定使用大的/长的表达式编辑器。在图3a中,例如,索引1,301说明了由TTS 303的项跟随的提示,例如“提示.您好”302。用户可以指示他们希望提供的时间304。可以添加另一个数据项305以提供当前时间306。在图3b中,如果可以的话,可以提供综合表达式帮助,以使用户可以获得更详细的错误反馈。音频序列编辑器的输出包括表达式。这里,系统可以向音频提示添加定制音频“时间是”,然后插入时间,如表达式“附加(到音频(提示.您好),到音频TTS(“时间是”),到音频时间(流.当前时间))”307所例示的。
在启用替代语言的实施例中,例如,除了为主序列生成的表达式之外,可以为该语言生成表达式。音频序列编辑器内的项会被单独验证正确性,以便向每个序列项显示适当的错误。在一个实施例中,如果一个或多个序列项在序列中出错,则对话附近的主序列或语言特定序列标签也将反映它是错误的。
图4a-4d为整体显示多语言序列的视图。作为一些非限制性示例,多个语言序列可以被定义为使得可以存在一个或多个主语言序列或具有替代语言序列的主语言。如果主语言序列不支持替代语言序列,则可以自动指示错误。例如,对于TTS引擎可能无法将所选择的语言的TTS读回的语言,可以为该语言选择TTS。因此可以生成合法性错误,从而反映TTS不能在这种语言中使用。在图4a中,提供了多语言序列的示例。作为少数非限制示例,可以支持的语言包括美国英语(en-US)401、加拿大法语(fr-CA)402以及美国西班牙语(es-US)403。所显示的音频序列包括提示404,例如“提示.您好”405,随后是TTS项406,例如“时间是”407。还显示第三数据项408以提供当前时间,例如“流.当前时间”409。
在图4b中,诸如es-US 403的语言可以被指定为用于主序列,并且编辑正在生成的项目。在这个示例中,TTS项406可以被编辑为“es el momento”407,并且通过TTS项重新排序的序列移动到位置3,数据项408移动到位置2。可以为主语言启用替代序列,例如fr-CA402,如图4c中所示。在一个实施例中,指示符可以向用户确认他们想启用法语(加拿大)410的替代序列。
如图4d中整体示例性所示,每种语言可以具有与其关联的不同的信息片段。例如,可以包括诸如“支持运行时间数据回放”411、“支持语音识别”412和“支持文本转语音”413的信息,以允许有关系统支持的更多的信息。在这个非限制性示例中,每个信息片段后面的“是”指示以期望的语言支持这些信息。因此,可以做出语言序列是否支持特定特征的指示。
在另一个实施例中,无论是由于错误或故意,都可以不指定主音频序列在运行时播放。在这种情况下,如图4e中整体所示,指示符414可以让用户知道这个序列将不会播放。因此,系统可以回到替代序列中的一个。
图5a-5c为可用于音频序列编辑的不同选项的整体视图。例如,在图5中例示的对话的项3,501中,可以选择回放数据。在一个实施例中,如果在项中指示(例如,“流.当前时间”)当前时间,则可以包括选项以将时间呈现为“日期”、“日期和时间”、“月”等。选项可以在下拉菜单503中呈现或者例如通过另一种方法(例如,单独窗口)呈现。
在一个实施例中,例如图5b中整体所示,如果在数据项504中指示整数(例如,“流.小数”505),可以显示506选项,所述选项使合成语音包括到“说出每个数字”、提供“完整数值”、提供“作为百分比”,等等。
在出现错误的实施例中,这些可以向用户说明,例如图6中整体呈现。在一个实施例中,索引项可以被突出显示并包括指示已经出现错误的工具提示。在这个示例中,项1,601已经被突出显示602以指示错误。在所述项中,向用户提供消息“选择提示”603。
本文说明的实施例的应用并不限于呼叫。可以应用于一般的通信,作为非限制性示例,例如用于基于文本的交互,例如网页聊天。在网页聊天的情况中,运行时间可以使用提示资源的TTS分量,以不必尝试拾取音频。这样,网页聊天上的“您好”的TTS将是文本“您好”。
尽管结合附图和前文的描述详细说明和描述了本发明,但应该认为它们是说明性的而非限制性的,应当理解的是仅显示并说明了优选的实施例,而在本文和/或通过所附权利要求中所述的本发明的精神内的所有等效形式、改变和修改都期望得到保护。
因此,本发明的适当保护范围应当仅通过所附权利要求的最宽解释来确定,以便涵盖所有修改以及与在附图中所示和在说明书中所述的内容等效的所有关系。

Claims (21)

1.一种用于在交互式语音应答系统中使用多种语言与参与者按序列通信的方法,所述方法包括以下步骤:
a.通过所述系统的用户创建提示,其中所述提示具有多个附加资源;
b.通过所述交互式语音应答系统为所述通信启用至少一个支持的语言,其中所述通信为所述至少一个支持的语言;
c.为编辑所述序列启用提示、数据、表达式、暂停和文本转语音中的一个或多个;和
d.为所述通信启用替代语言,其中所述替代语言包括替代序列,
其中,所述序列包括主序列和所述替代序列,所述替代序列能够用于特定的语言,以使交互退出主序列时,通过新语言的选择,用于该新语言的替代序列接管过来,
其中,在启用替代语言的情况下,除了为主序列生成的表达式之外,还能够为所述替代语言生成表达式,
其中,所述主序列向用于完成交互的呼叫流中所有支持的语言提供音频序列,所述音频序列能够在音频序列编辑器内被编辑,并且音频序列编辑器内的序列项能够被单独验证正确性。
2.根据权利要求1所述的方法,其中,所述多个附加资源包括语言标签,其中所述语言标签包括文本转语音。
3.根据权利要求1所述的方法,其中,所述多个附加资源包括语言标签,所述语言标签包括音频。
4.根据权利要求1所述的方法,其中,所述替代语言属于替代序列,在选择所述替代语言的情况中,所述替代序列取代所述主序列。
5.根据权利要求1所述的方法,其中,所述数据包括:数据、时间、货币、数字以及数据库查找。
6.根据权利要求1所述的方法,其中,所述暂停包括音频回放的延迟。
7.根据权利要求1所述的方法,其中,所述编辑包括添加、删除或重新安排。
8.根据权利要求7所述的方法,其中,为编辑实时提供验证。
9.根据权利要求8所述的方法,其中,所述验证包括在错误中相邻于序列步骤放置的错误。
10.根据权利要求1所述的方法,其中,用于编辑所述序列的所述启用步骤包括启用序列的原始来源以用于编辑。
11.根据权利要求1所述的方法,其中,对于支持的语言资源,所述文本转语音能够自动转换到提示。
12.根据权利要求1所述的方法,其中,所述为所述通信启用替代语言的步骤包括保存所述主序列的快照并将所述快照作为所述替代序列的起始点。
13.一种用于在交互式语音应答系统中使用多种语言与参与者按序列通信的方法,所述方法包括以下步骤:
a.由用户通过图形用户界面选择提示;和
b.在运行时通过计算机处理器使用所述提示创建通信序列,
其中,所述序列包括主序列和替代序列,所述替代序列能够用于特定的语言,以使交互退出主序列时,通过新语言的选择,用于该新语言的替代序列接管过来,
其中,在启用替代语言的情况下,除了为主序列生成的表达式之外,还能够为所述替代语言生成表达式,
其中,所述主序列向用于完成交互的呼叫流中所有支持的语言提供音频序列,所述音频序列能够在音频序列编辑器内被编辑,音频序列编辑器内的序列项能够被单独验证正确性。
14.根据权利要求13所述的方法,其中,所述提示具有多个附加资源。
15.根据权利要求13所述的方法,其中,所述通信序列包括:序列项,其中所述序列项包括所述提示。
16.根据权利要求13所述的方法,其中,所述创建步骤包括:使用创建的所述通信序列替换已存序列项。
17.一种用于在交互式语音应答系统中使用多种语言与参与者按序列通信的方法,所述方法包括以下步骤:
a.由用户将文本输入到图形用户界面中,其中所述文本通过计算机处理器被转换为文本转语音;和
b.通过所述计算机处理器使用所述文本转语音创建通信序列,
其中,所述序列包括主序列和替代序列,所述替代序列能够用于特定的语言,以使交互退出主序列时,通过新语言的选择,用于该新语言的替代序列接管过来,
其中在启用替代语言的情况下,除了为主序列生成的表达式之外,还能够为所述替代语言生成表达式,
其中,所述主序列向用于完成交互的呼叫流中所有支持的语言提供音频序列,所述音频序列能够在音频序列编辑器内被编辑,音频序列编辑器内的序列项能够被单独验证正确性。
18.根据权利要求17所述的方法,其中,所述文本转语音具有多个附加字符。
19.根据权利要求18所述的方法,其中,所述多个附加字符包括单词。
20.根据权利要求17所述的方法,其中,所述通信序列包括:序列项,其中所述序列项包括文本转语音。
21.根据权利要求17所述的方法,其中,所述创建步骤包括:使用创建的所述通信序列替换已存序列项。
CN201580085355.8A 2015-10-15 2015-10-15 用于多语言通信排序的系统和方法 Active CN108475503B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2015/055686 WO2017065770A1 (en) 2015-10-15 2015-10-15 System and method for multi-language communication sequencing

Publications (2)

Publication Number Publication Date
CN108475503A CN108475503A (zh) 2018-08-31
CN108475503B true CN108475503B (zh) 2023-09-22

Family

ID=58517748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580085355.8A Active CN108475503B (zh) 2015-10-15 2015-10-15 用于多语言通信排序的系统和方法

Country Status (6)

Country Link
EP (1) EP3363016A4 (zh)
KR (1) KR20180082455A (zh)
CN (1) CN108475503B (zh)
AU (1) AU2015411582B2 (zh)
CA (1) CA3005710C (zh)
WO (1) WO2017065770A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111078830B (zh) * 2019-07-11 2023-11-24 广东小天才科技有限公司 一种听写提示方法及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6205418B1 (en) * 1997-06-25 2001-03-20 Lucent Technologies Inc. System and method for providing multiple language capability in computer-based applications
CN1323435A (zh) * 1998-10-02 2001-11-21 国际商业机器公司 提供网络协同会话服务的系统和方法
CN1387639A (zh) * 1999-11-05 2002-12-25 微软公司 语言输入用户界面
US20030204404A1 (en) * 2002-04-25 2003-10-30 Weldon Phyllis Marie Dyer Systems, methods and computer program products for designing, deploying and managing interactive voice response (IVR) systems
EP1835488A1 (en) * 2006-03-17 2007-09-19 Svox AG Text to speech synthesis
US20090202049A1 (en) * 2008-02-08 2009-08-13 Nuance Communications, Inc. Voice User Interfaces Based on Sample Call Descriptions
CN102543069A (zh) * 2010-12-30 2012-07-04 财团法人工业技术研究院 多语言的文字转语音合成系统与方法
CN104011791A (zh) * 2011-11-21 2014-08-27 (株)未来机器人 角色的多语言语音系统及方法
CN104380284A (zh) * 2012-03-06 2015-02-25 苹果公司 针对多种语言处理内容的语音合成

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6904401B1 (en) * 2000-11-01 2005-06-07 Microsoft Corporation System and method for providing regional settings for server-based applications
US20020184002A1 (en) * 2001-05-30 2002-12-05 International Business Machines Corporation Method and apparatus for tailoring voice prompts of an interactive voice response system
US20040044517A1 (en) * 2002-08-30 2004-03-04 Robert Palmquist Translation system
US7817784B2 (en) * 2003-12-23 2010-10-19 Apptera, Inc. System for managing voice files of a voice prompt server
EP1679867A1 (en) 2005-01-06 2006-07-12 Orange SA Customisation of VoiceXML Application
US8352270B2 (en) * 2009-06-09 2013-01-08 Microsoft Corporation Interactive TTS optimization tool

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6205418B1 (en) * 1997-06-25 2001-03-20 Lucent Technologies Inc. System and method for providing multiple language capability in computer-based applications
CN1323435A (zh) * 1998-10-02 2001-11-21 国际商业机器公司 提供网络协同会话服务的系统和方法
CN1387639A (zh) * 1999-11-05 2002-12-25 微软公司 语言输入用户界面
US20030204404A1 (en) * 2002-04-25 2003-10-30 Weldon Phyllis Marie Dyer Systems, methods and computer program products for designing, deploying and managing interactive voice response (IVR) systems
EP1835488A1 (en) * 2006-03-17 2007-09-19 Svox AG Text to speech synthesis
US20090202049A1 (en) * 2008-02-08 2009-08-13 Nuance Communications, Inc. Voice User Interfaces Based on Sample Call Descriptions
CN102543069A (zh) * 2010-12-30 2012-07-04 财团法人工业技术研究院 多语言的文字转语音合成系统与方法
CN104011791A (zh) * 2011-11-21 2014-08-27 (株)未来机器人 角色的多语言语音系统及方法
CN104380284A (zh) * 2012-03-06 2015-02-25 苹果公司 针对多种语言处理内容的语音合成

Also Published As

Publication number Publication date
EP3363016A1 (en) 2018-08-22
CA3005710C (en) 2021-03-23
CN108475503A (zh) 2018-08-31
KR20180082455A (ko) 2018-07-18
AU2015411582B2 (en) 2019-11-21
WO2017065770A1 (en) 2017-04-20
AU2015411582A1 (en) 2018-06-07
EP3363016A4 (en) 2019-05-15
CA3005710A1 (en) 2017-04-20

Similar Documents

Publication Publication Date Title
KR102258121B1 (ko) 인간 운영자로의 에스컬레이션
CN103621119B (zh) 用于向计算设备的用户呈现语音消息信息的系统和方法
US9728190B2 (en) Summarization of audio data
US11544311B2 (en) Automated removal of private information
US7286985B2 (en) Method and apparatus for preprocessing text-to-speech files in a voice XML application distribution system using industry specific, social and regional expression rules
US20180067924A1 (en) Generalized phrases in automatic speech recognition systems
US6789064B2 (en) Message management system
CN100424632C (zh) 用于高级交互接口的语义对象同步理解
US7398215B2 (en) Prompt language translation for a telecommunications system
CN101138228A (zh) 个性化语音扩展标记语言应用
US11340767B2 (en) Smart email task reminders
US20180226073A1 (en) Context-based cognitive speech to text engine
US20110035220A1 (en) Automated communication integrator
US20160189713A1 (en) Apparatus and method for automatically creating and recording minutes of meeting
CN114647410A (zh) 用于使用用户界面创作平台来创作任务的方法和系统
CN102263863A (zh) 交互式语音响应设计的过程集成的树视图控制
US9886423B2 (en) Reconciliation of transcripts
US10431216B1 (en) Enhanced graphical user interface for voice communications
CN116235177A (zh) 与通过使用相关联的样本话语的已知意图从对话数据挖掘意图来进行机器人创作相关的系统和方法
US20210134296A1 (en) Project issue tracking via automated voice recognition
CN108475503B (zh) 用于多语言通信排序的系统和方法
US11054970B2 (en) System and method for multi-language communication sequencing
JP2022025665A (ja) 要約文作成装置、要約文作成方法及びプログラム
CN110740212B (zh) 基于智能语音技术的通话接听方法、装置及电子设备
US20210225377A1 (en) Method for transcribing spoken language with real-time gesture-based formatting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant