CN100502571C

CN100502571C - 通信方法及系统

Info

Publication number: CN100502571C
Application number: CNB200480035970XA
Authority: CN
Inventors: 弗朗西斯·詹姆士·斯卡西尔; 西蒙·帕特里克·亚历山大·林兰
Original assignee: British Telecommunications PLC
Current assignee: British Telecommunications PLC
Priority date: 2003-12-03
Filing date: 2004-11-25
Publication date: 2009-06-17
Anticipated expiration: 2024-11-25
Also published as: EP1695586B1; EP1695586A1; WO2005055639A1; GB0328035D0; US20070129061A1; CA2548159A1; CN1891004A; ES2298841T3; DE602004011109D1; ATE383053T1; DE602004011109T2

Abstract

用于一键通(PTT)通信系统的通信方法和系统，其中，使用语音识别器来对通过PTT通信服务进行传输的所讲的消息中的言语进行识别，并且分析所识别的言语以试图确定所述消息的期望接受者。如果可以明确地确定期望接受者，则建立PTT呼叫以将所述消息转发给所确定的接受者。如果确定出多个潜在的接受者，则向用户显示选择列表以允许用户选择期望接受者。

Description

通信方法及系统

技术领域

本发明涉及这样一种通信方法和系统，其使用语音识别技术来分析声音消息以确定其期望目的地。

背景技术

现有技术中已知基于移动分组的半双工声音消息传送系统。它们俗称为“一键通”(PTT)系统，在美国商业应用已达多年，由NextelCommunications提供且服务标记为“Direct Connect”。

这种PTT系统也已被研制为在网际协议(IP)环境中通过基于IP的语音(VoIP)系统进行操作。具体地，在现有技术中已知基于VoIP的PTT系统的通用分组无线业务(GPRS)和码分多路访问(CDMA)，例如由Motorola生产的系统(参见http://www.motorola.com/mediacenter/news/detail/0，1958，3069_2512_23，00.html)和Qualccomm生产的系统(参见http://www.qualcomm.com/press/releases/2002/020111_qchat_voip.html)。

如现有技术中所熟知的，当使用PTT系统时，用户通常使用图形界面和装置自带的用户控件从其自己的手机上保持的地址薄列表选择期望的接收者。然而，还已知的是提供语音拨号PTT服务，并且提供该功能性的示例性现有技术的装置是由CellportSystems Inc.of Boulder公司生产的用于Motorola iDEN i1000和i1000 plus移动电话的分组适配器。可以在http://www.cellport.com/adapterguides/nextel_i1000_PAG.pdf上找到用于Cellport分组适配器的用户指南。如这里所指出的，这种语音拨号包括：在用户希望发送的声音消息被说出之前，用户讲预定码字，之后是该用户希望连接的接受者的标识(例如号码，但另选地是快速拨号代码)。例如，在Cellport系统中，用户通过使用语音拨号而讲词语“Cellport，dial，pound，pound，6284”。所述适配器然后重复所识别词语“pound，pound，6284”，而后进行连接处理。用户然后可以通过以通常的方式按下PTT按钮而讲其消息。

然而，即使具有该语音拨号功能性，也仍然存在单独的“拨号阶段”，在该阶段用户或者通过使用通常的图形界面或者通过使用语音拨号界面，而必须选择期望的接受者，并且直到已完成了该拨号阶段并建立了连接，用户才可以讲其最初的消息。因此，该单独的拨号阶段引入了对用户能够讲其消息的延迟，而且还使得用户或者以浏览图形显示器的方式或者通过根据语音拨号协议进行讲话而必须与装置进行附加交互。

发明内容

本发明旨在通过从用户界面除去单独的拨号阶段而改善上述操作。更具体地，本发明利用了语音识别和相关技术来分析所说消息，以识别该消息的期望接收者，并且通过网络向期望接受者发送所述消息或者至少其变体(例如，由语音识别器获得的消息文本)。这样允许用户简单地按下其手机上的PTT按钮并立即说其消息(优选地，在其消息内包含有期望接受者的某些表示(indication)，例如姓名等)，而无需预先经历单独的拨号阶段。

鉴于上述，从第一方面，提供了一种通信方法，包括如下步骤：

当用户按下在用户装置上的按钮并开始讲话时，接收在通信网络中的包含言语的声音流；

对所接收的声音流进行缓冲；

对所接收的声音流进行语音识别处理以识别其中包含的言语；

如果可能，根据所识别的言语确定所述声音流的期望接收者；以及

如果确定了期望接收者，则使用由分组交换网络提供的半双工通信服务将所述声音流发送给确定的期望接收者。

如上所述，本发明提供的优点在于，在用户可以说出消息之前无需单独的拨号阶段。这样改善了用户的通信经历，并且使得半双工通信服务更宜人并更友好地供用户使用。

在本发明的实施例中，当所述确定步骤根据所识别的言语确定出一个或多个可能的期望接收者时，优选地所述方法还包括以下步骤：

向用户指明所述一个或多个可能的期望接收者；以及

从用户接收选择信号，该信号指明应该向其发送所述声音流的所述一个或多个确定的可能的期望接收者。

这样，在所述确定步骤已识别出一个或多个潜在的期望消息接受者的情况下，从用户可以寻求对所识别的可能期望接受者的说明。优选地，为易于进行接口，所述指明步骤还包括：生成与所述多个可能的期望接收者相对应的音频语音提示；以及将所生成的音频语音提示输出给用户。这种进一步特征允许来自用户装置的音频输出提示。

另外，在本发明的实施例中，优选地，仅对所接收的声音流的一部分进行所述语音识别处理。这种特征识别出很可能在声音流开始时指明消息的期望接受者(例如，考虑消息“您好罗杰，今晚想去酒吧吗”，在第一短语中识别出期望接受者“罗杰”)，因此可以通过仅进行必要的识别量而节约了语音识别器资源。

此外，在本发明的实施例中，还包括以下步骤：接收生成所述声音流的用户标识的表示；以及根据用户标识选择供所述语音识别处理使用的基于用户的语音语法。这样允许与语音识别处理一起使用专用于用户的语法，在所述语法中可以编码有地址薄数据等。

另外，本发明的实施例还可以包括下面步骤：从用户接收语音识别启动信号，其中根据该信号的接收而执行所述语音识别和确定步骤。该功能性允许用户明确地指明何时消息是至新接受者的消息，并因此应该执行语音识别和接受者确定步骤。这样进一步提高了语音识别器资源的使用效率，并且还改进了本发明的整体操作，因为仅对其中极有可能说某种接收者表示(例如姓名等)的消息(通常为线程中的第一消息)执行语音识别和接收者确定步骤，并因此相应地极有可能的是能够确定期望接受者。

本发明另一方面提供了一种通信系统，包括：用户装置，其被设置成当用户按下在该用户装置上的按钮并开始讲话时、可以操作来接收包含言语的声音流并将该声音流发送至通信网络；存储装置，用于对所接收的声音流进行缓冲；语音识别器，其被设置成用于对包含在所接收的声音流中的言语进行识别；接收者确定装置，其被设置成如果可能，根据所识别的言语确定所述声音流的期望接收者；以及声音流发送装置，如果确定了期望接受者，则该声音流发送装置使用由分组交换网络提供的半双工通信服务将所述声音流发送给所确定的期望接收者。

附图说明

通过下面参照附图对本发明仅以示例方式给出的实施例的描述，将明确本发明的进一步特征和优点，其中：

图1是本发明实施例的体系结构系统框图；

图2(a)是示出本发明该实施例中所涉及的方法步骤的流程图；以及

图2(b)是继续图2(a)流程图的流程图。

具体实施方式

下面将参照图1、图2(a)和图2(b)来描述本发明的实施例。

本发明的实施例提供了一种声音操纵的一键通(PTT)服务。更具体地，本发明的实施例的目的是提供一种一键通通信服务，其可以使用在现有技术中已经公知并在本说明书的介绍部分中论述的PTT通信技术中的任一种，并且其增加有这样的功能性，即，允许一键通通信指向期望的接受者或目的地而不经历任何显式拨号阶段。而且在本发明的实施例中，对所讲消息进行语音识别，并应用语音语法以确定消息的期望接受者或目的地，然后将消息转发给如此确定的期望接受者或目的地。

鉴于上述，图1示出了整个系统的体系结构框图，其示出了根据本发明实施例的主要系统组成部分。因此，参照图1，在本发明的实施例中，设置有音频路由服务器14，其用于从PTT使能手机接收由网络(未示出)上的PTT通信服务承载的流式数字音频信号，以及调用线标识符(callingline identifier(CLI))信息。音频路由服务器14配备有音频缓冲器142，该音频缓冲器是例如RAM、硬盘、光学存储介质等的数据存储介质，并用于在其中临时存储任何接收的音频消息。另外，该实施例设置有语音识别服务器18，其用于接收来自音频路由服务器处的音频缓冲器142的数字音频以及CLI信息，并且还从地址薄和语法数据库20接收在语音识别处理中使用的语音语法和词汇数据。在使用中，语音识别服务器18运行语音识别应用程序以向从音频缓冲器412接收的数字音频应用用户特定语法，从而识别其中的任何所讲言语以确定期望的接受者。应注意的是，由语音识别服务器运行的语音识别应用程序可以是现有技术中当前已知的任何语音识别应用程序，但优选的是独立于说话者的语音识别应用程序。在优先权日之前可获得的并且可以由当前实施例中的语音识别服务器18使用的合适的语音识别软件是来自1005 Hamilton Court，Menlo Park，CA 94025的Nuance Communications Inc.的Nuance 7。

语音识别服务器18还用于将识别结果传送给接受者确定服务器16，所述识别结果优选地是一组关键值对(key-value pair)，其表示在所识别语音中的特定语法时隙(slot)值以及它们相关的识别可信值。接受者确定服务器用于接收所述关键值对，并根据由识别器返回的关键值对而适当地进行动作，这将在后面描述。接受者确定服务器可以执行的一个可能动作是向音频路由服务器14传送以被拨叫号码标识符(DNI)形式的地址。另外，接受者确定服务器16还用于从用户手机接收调用线标识符(CLI)数据(稍后描述)，并且还向用户手机传送最后候选人名单信息，这也将在后面描述。

返回考虑地址薄和语法数据库20，其对于系统的各注册用户存储语音识别语法，所述语法将关于可能接受者姓名的地址薄数据及其相应的DNI进行编码。对于各注册用户存储有单独的用户专用语法。下面显示了语法的格式示例：

Names

(

[

(bob){return(＂Bob Smith +447711123456＂)}

(peter jones){return(＂Peter Jones +447722123456＂)}

(pete){return(＂Pete Brown +447733123456＂)}

]

)

Phonemes：filler

[

ph1

ph2

...

ph41

]

Fillers：filler

[

Phonemes

@-@

]

EndCall

[

end call

over and out

]

Overall

[

(？hi+Names：n？(it′sBob)＊Fillers){<action＂placecall＂>

<recipient n>}

＊Fillers

EndCall{<action＂endcall＂>}

]

拨号语法的生成可以是任何一种熟知的技术，所述技术或者使用文本(例如，获得用户电话地址薄副本)或者使用用于语音号码部分的地址薄和讲话输入的组合以限定姓名发音。

上面描述涉及的各种服务器优选地包含在提供半双工PTT通信服务的网络内或者形成其一部分。然而，为了更详细地描述该实施例的操作，还有必要描述适用于本发明的移动用户手机的具体特征。图1还示出采用移动站A 10形式的手机。还显示了移动站B 12，但是其可以是如现有技术中公知的传统的PTT使能手机。

因此参考移动站A 10，移动站A 10设置有PTT音频客户机A 102，其是控制移动站10以提供传统PTT功能性的合适软件。即，PTT音频客户机A 102使得移动站10能够以传统的方式使用PTT服务。然而，与现有技术的主要区别在于，PTT音频客户机A 102用于向音频路由服务器14发送由手机A产生的数字化音频数据以及移动站10的调用线标识符。

在移动站10内还设置有可视选择器客户机A 104。其是另一软件程序，用于与网络内的接受者确定服务器16进行接口，以在首次启动PTT呼叫时向其发送移动站10的调用线标识符(CLI)，并且在由此确定多于一个的期望接受者的情况下，还从接受者确定服务器16接收候选接受者标识符列表。可视选择器客户机A 104还用于在移动站A的显示器上显示给用户的这种最后候选人名单，以允许用户选择期望的接受者。然后将选择信息发回给接受者确定服务器16。

在传统的移动站B 12内，设置有PTT音频客户机B 122，其与设置在移动站10中的PTT音频客户机A 102基本相同。PTT音频客户机B 122用于向移动站B 12提供传统的PTT功能性，并且PTT音频客户机B 122与现有技术之间的仅有区别在于，PTT音频客户机B 122用于从作为音频路由服务器14的一部分的音频缓冲器142接收PTT消息。在所有其它方面，移动站B 12可以是传统的。

下面将参照图2(a)和图2(b)来描述图1实施例的操作。

在该实施例的操作的示例性描述中，假设移动站A不具有任何正进行的PTT呼叫，并且希望向移动站B发送PTT消息。即，移动站A的当前状态为至少在PTT超时时间(通常为20秒)内其没有向任何其它站发送或从其接收任何PTT呼叫。鉴于此，在本发明的实施例中，为了开始从移动站A向移动站B的呼叫，在步骤2.2，用户A按下PTT按钮。按下移动站A上的PTT按钮导致PTT音频客户机102以及可视选择器客户机104开始运行。在步骤2.4，可视选择器客户机104连接至接受者确定服务器16，并向接受者确定服务器16发送移动站A的调用线标识符(CLI)。接下来，(或者几乎同时或者在此之前，步骤2.4和2.6的顺序并不重要)，PTT音频客户机102连接至音频路由服务器14，并开始向音频路由服务器14流送数字化音频。为此，在步骤2.6，移动站A的用户A讲出其希望通过PTT服务发送的消息，并且移动站A将该消息数字化和分组化，从而以音频流的方式流送给音频路由服务器14。这种数字化和分组化在现有技术中是熟知的。除了使音频流送给音频服务器14之外，PTT音频客户机102还向音频路由服务器14发送移动站A的调用线标识符(CLI)。

在步骤2.8，音频路由服务器将所接收的音频流缓冲在音频缓冲器142中，并还在步骤2.10，将音频流的副本转发给语音识别服务器18。同时，音频路由服务器14还将移动站A的调用线标识符发送给语音识别服务器18。

接下来，在步骤2.12，语音识别服务器18使用接收到的移动站A的调用线标识符以访问地址薄和语法数据库20，从而从其检索到存储在其中用于移动站A的特定用户语法。应理解的是，在以CLI为索引的地址薄和语法数据库20中存储有语音识别语法和词汇，以允许检索到专用于移动站A的语法和词汇。

接下来，在步骤2.16，语音识别服务器18对从音频路由服务器14接收的音频流进行语音识别处理。应注意，语音识别服务器18可以在接收音频流时对所接收的音频流进行语音识别，或者另选地可以在开始识别之前进行等待直到在所述流中检测到静区(silence)(或者当释放PTT按钮时的流的末端)。该选择将取决于在语音识别服务器18中选择使用的确切的语音识别软件。由语音识别服务器18进行的语音识别处理起到这样的作用，其使用用于用户的引导识别处理的识别语法来识别包含在从音频路由服务器14接收的音频流内的用户言语。在该实施例中，语音识别服务器然后通过Nuance NL时隙(当使用前面提及的Nuance 7识别器时)向接受者确定服务器返回关键信息，因此例如对于言语“over andout(结束并断开)”，识别器将返回action＝endofcall的关键值对，而对于“Hi bob，it’s Bob(嗨！鲍勃，我是鲍勃)”，识别器将返回两个关键值对：action＝placecall和recipient＝“BobSmith+447711123456”，如由用户语法所确定的。通过关键值对，识别器还提供识别可信值，其表示导致正确的特定关键值对的任何特定识别的可信程度。这种识别可信值在现有技术中是熟知的。

在进行了识别并且向接受者确定服务器输出了关键值对和可信值之后，在步骤2.20，由接受者确定服务器对返回的关键值对的可信值进行评价。这里，可以将可信值与阈值等进行比较，并且如果评价表明识别器确信该结果，则处理可以进行到步骤2.22。这里，在步骤2.22，接受者确定服务器16将从接收关键值对获得的、所确定的(一个或多个)期望接受者的DNI发送给视频路由服务器14，并且还作为确认将其发送给移动站A中的可视选择器客户机104。然后，在步骤2.24，音频路由服务器通过使用PTT通信服务，将来自音频缓冲器142的缓冲音频消息发送给从接受者确定服务器接收的、由(一个或多个)DNI标识的接受者。在这种情况下，假设从接受者确定服务器接收的(一个或多个)DNI标识移动站B，在这种情况下音频路由服务器通过通常的PTT使能网络，使来自音频缓冲器142的音频消息流送给移动站B中的PTT音频客户机122。同时，在步骤2.26，在移动站A处的可视选择器客户机104在移动站A的显示器上向用户A显示所确定的(一个或多个)DNI，作为已正确转发了消息的确认。因此，此时，已经由音频路由服务器在移动站A与移动站B之间建立了PTT呼叫，然后可以以传统的方式继续PTT通信。

这里应重点注意的是，当讲了两个或更多个接受者标识符时(这里考虑消息“皮特，鲍勃，我是大卫”，在这种情况下皮特和鲍勃都是期望的接受者)，语音识别服务器可以确信地识别两个或多个期望的接受者。由于可以识别语法，所以可以返回这两个或所有的期望接受者DNI，并且由于对这两个或所有的可信识别，因此可以清楚所述消息期望发送给两个或所有接受者。在这种情况下，接受者确定服务器控制音频路由服务器，以对每一个确定的期望接受者(在该示例中为皮特和鲍勃)建立群组PTT呼叫。因此，该特征允许通过在消息中简单地表示各期望接受者(他们是群组呼叫的参与者)的姓名，而呼叫待被动态定义的群组呼叫的组。

返回步骤2.20，如果此处进行的评价没有表明有可信结果，则接受者确定服务器在步骤2.28进行进一步评价，以确定是否有一个或多个从语音识别器返回的非可信结果。如果是没有返回关键值对的情况，则识别处理失败。在这种情况下，在步骤2.36，接受者确定服务器向识别失败的移动站A处的可视选择器客户机104发送消息，然后在移动站A处向用户显示识别失败消息。在这种情况下，用户A然后必须使用传统的图形用户界面来选择其消息的期望接受者。

然而，相反地，如果步骤2.28的评价表明有一个或多个非可信结果，则邀请用户确认所述一个或多个非可信结果。因此，在步骤2.30，接受者确定服务器16向移动站A处的可视选择器客户机104发送所述一个或多个非可信结果列表。可视选择器客户机104然后在移动站A的显示器上在用户显示器上向用户显示接收的列表，并且在步骤2.32，用户从该列表选择期望的接受者。可视选择器客户机104然后在步骤2.34将选择信息发回给接受者服务器16。接受者确定服务器接收该选择信息而后返回步骤2.22，在该步骤，将所选的DNI(或者在选择多个期望接受者情况下为多个DNI)发送给音频路由服务器。处理然后进行到步骤2.24，并如前所述地进行。

因此，鉴于以上描述，可以看出本发明的实施例允许方便的PTT通信，而用户无需经历特定拨号阶段并等待随后连接。在此方面，本发明利用PTT通信中的固有等待时间，具体地为其VoIP方案，并且利用该潜在时间对消息进行语音识别和随后的期望接受者确定，从而允许的自动接受者或目的地选择。因此，本发明提供的改进的用户经历优于由现有技术中已知的传统PTT通信服务提供的经历。

应理解，可以对所述实施例进行各种修改以得到其他实施例。例如，在另一实施例中，为了开始识别和接受者确定处理，在移动站A处的用户A必须例如通过双击PTT按钮而发送来自移动站A的启动信号。这种“双击”会致使可视选择器客户机A 104向接受者确定服务器16发送启动信号，这又会向语音识别服务器18发送启动信号。这种显式启动操作可有益于防止本发明在不期望情况下进行操作。

作为另一变型例，在另一实施例中，用户A可以使用本发明进行群组呼叫。使用PTT进行群组呼叫本身在现有技术中是已知的，其通过在各用户地址薄中包括组名以及形成该组一部分的相关电话号码而被包括以在本发明实施例中使用。在操作时，用户A说出组名，该组名然后被语音识别服务器识别，并将所存储的组名应用用户语法以确定该组的DNI。如果识别出组名，则接受者确定服务器就将属于该组的各DNI发送给音频路由服务器14，其然后以传统的方式连接群组PTT呼叫。

在又一实施例中，设置语音识别服务器用来仅识别消息的前几秒，以节约语音识别器资源。该特征基于这样的前提，即，对于大多数问候，都会在该限制内说出接受者姓名(考虑问候“您好，鲍勃”，“早上好，皮特”等)。为此，在3至5秒之间的识别器时限应该是足够的。

对于在非可信结果的情况下期望接受者的选择，在上述实施例中，描述了可视选择器客户机向用户显示最后候选人名单以供可视选择。然而，在其它实施例中，接受者确定服务器可以包括语音合成器程序，其用于生成关于可用选择的音频提示，然后将其路由至手机上的PTT音频客户机102，以向该用户进行播放。应注意，这可以与由可视选择器客户机显示最后候选人名单同时进行，从而可以由音频和可视界面呈现这些选择，或者另选地可以替换可视选择。为了允许由期望接受者的用户进行口头选择(例如，当读取期望接受者时用户说“是”，并且/或者(可选地)当播放非期望接受者姓名时，或者另选地用户说“鲍勃史密斯”以在鲍勃史密斯和鲍勃约翰之间进行区分时(这在前面简称为“鲍勃”)，用户说“否”)，PTT音频客户机可以通过音频路由服务器将任何用户响应发送给语音识别服务器以识别所述响应。

最后，作为另一任选特征，在本发明的其它实施例中音频路由服务器可用于修整被识别并用于从消息选择期望接受者的音频，并且仅发送消息的没有用于期望接受者确定的部分。

尽管上面描述着重于本发明在建立PTT呼叫之前的操作，在另一模式，本发明的实施例可以在PTT呼叫期间操作(即，在期望消息在呼叫的两方或更多方之间来回传送时的PTT超时期间)以检测预定的“结束呼叫”短语，例如“结束并断开”或者“结束呼叫”，从而操作以关闭呼叫。在该操作模式，将通过音频路由服务器路由的音频流复制到语音识别服务器，其对各个发送的消息进行语音识别以检测所述预定的结束呼叫短语。应注意，可以预定多于一个的结束呼叫短语，并且语音识别服务器可以检测所述预定短语中的任一个。如果检测到这种短语，则语音识别服务器向关闭呼叫的音频路由服务器发信号。同时，语音识别服务器可以向接受者确定服务器16发信号，其可以向用户终端处的可视选择器客户机104发送“呼叫结束”信号。在这种情况下，可视选择器客户机104然后在移动站10的显示屏上向用户显示“呼叫结束”消息。同样地，可以向移动终端发送使用合成或存储音频消息的音频“呼叫结束”输出。

在上述实施例中，移动站A和B通过使用蜂窝式无线网络与服务器进行通信。在另选实施例中，可以使用非蜂窝式无线接入网络，例如无线LAN、Wi-Fi和Bluetooth。在其他另选实施例中，可以固定一个或两个终端(例如，个人计算机)。

除非上下文清楚要求，否则在整个说明书和权利要求书中，词语“包括(comprise，comprising)”等应理解为包含，而与排他或穷举意义相对；也就是说，意义为“包括但并不限于”。

Claims

1、一种通信方法，包括以下步骤：

对所接收的声音流进行缓冲；

根据所识别的言语确定所述声音流的期望接收者；以及

如果确定了期望接收者，则使用由分组交换网络提供的半双工通信服务将所述声音流发送给所确定的期望接收者。

2、根据权利要求1所述的方法，其中，当所述确定步骤根据所识别的言语确定出一个或多个期望接收者时，所述方法还包括下面步骤：

向用户指明所述一个或多个期望接收者；以及

从用户接收选择信号，该信号指明应该向其发送所述声音流的、所确定的所述一个或多个期望接收者。

3、根据权利要求2所述的方法，其中，所述指明步骤还包括：生成与所述一个或多个期望接收者相对应的音频语音提示；以及将所生成的音频语音提示输出给用户。

4、根据前述权利要求中的任一项所述的方法，其中，当所述确定步骤确定出多个期望接收者时，使用半双工通信服务的群组呼叫功能，将所述声音流发送给所确定的各个期望接收者。

5、根据权利要求1所述的方法，其中，仅对所接收的声音流的一部分进行所述语音识别处理。

6、根据权利要求1所述的方法，还包括以下步骤：接收表示生成所述声音流的用户标识的信息；以及根据用户标识选择供所述语音识别处理使用的基于用户的语音语法。

7、根据权利要求1所述的方法，还包括以下步骤：从用户接收语音识别启动信号，其中根据该信号的接收而执行所述语音识别和确定步骤。

8、根据权利要求1所述的方法，还包括以下步骤：监测由所述半双工通信服务传输的声音流；对所监测的声音流进行语音识别处理，以确定其中所包含的相应言语；以及如果确定在所述声音流中的任一个中包含有预定言语，则发送所述半双工通信服务应停止传输声音流的信号。

9、一种通信系统，包括：

用户装置，其被设置成当用户按下在该用户装置上的按钮并开始讲话时、可以操作来接收包含言语的声音流并将该声音流发送至通信网络；

存储装置，用于对所接收的声音流进行缓冲；

语音识别器，其被设置成用于对包含在所接收的声音流中的言语进行识别；

接收者确定装置，其被设置成根据所识别的言语确定所述声音流的期望接收者；以及

声音流发送装置，如果确定了期望接收者，则该声音流发送装置使用由分组交换网络提供的半双工通信服务将所述声音流发送给所确定的期望接收者。

10、根据权利要求9所述的系统，还包括：

指明装置，用于向用户指明所确定的一个或多个期望接收者；以及

选择信号接收装置，用于从用户接收选择信号，该信号指明应该向其发送所述声音流的、所确定的所述一个或多个期望接收者。

11、根据权利要求10所述的系统，其中，所述指明装置还包括：音频提示生成装置，用于生成与所述一个或多个期望接收者相对应的音频语音提示；以及输出器，用于将所生成的音频语音提示输出给用户。

12、根据权利要求9所述的系统，其中，当所述接收者确定装置确定多个期望接收者时，所述声音流发送装置还被设置成使用半双工通信服务的群组呼叫功能，将所述声音流发送给所确定的各个接收者。

13、根据权利要求9所述的系统，其中，所述语音识别器仅对所接收的声音流的一部分进行操作。

14、根据权利要求9所述的系统，还包括：表示接收装置，用于接收表示生成所述声音流的用户标识的信息；以及语法选择装置，用于根据用户标识选择供所述语音识别器使用的基于用户的语音语法。

15、根据权利要求9所述的系统，还包括：语音识别启动信号接收装置，用于从用户接收语音识别启动信号，其中所述语音识别器和接收者确定装置可根据对该语音识别启动信号的接收而进行操作。

16、根据权利要求9所述的系统，还包括：用于监测由所述半双工通信服务传输的声音流的装置；所述语音识别器还被设置成对所监测的声音流进行语音识别处理，以确定其中所包含的相应言语；所述系统还包括信号发送装置，如果确定在所述声音流中的任一个中包含有预定言语，则发送所述半双工通信服务应停止传输声音流的信号。