KR20060133002A - Method and system for sending an audio message - Google Patents

Method and system for sending an audio message Download PDF

Info

Publication number
KR20060133002A
KR20060133002A KR1020067021037A KR20067021037A KR20060133002A KR 20060133002 A KR20060133002 A KR 20060133002A KR 1020067021037 A KR1020067021037 A KR 1020067021037A KR 20067021037 A KR20067021037 A KR 20067021037A KR 20060133002 A KR20060133002 A KR 20060133002A
Authority
KR
South Korea
Prior art keywords
audio
message
audio message
receiver
messaging system
Prior art date
Application number
KR1020067021037A
Other languages
Korean (ko)
Inventor
에릭 텔렌
토마스 포르텔
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20060133002A publication Critical patent/KR20060133002A/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail

Abstract

The invention describes a method for sending an audio message (AM) from a sender (US) to a recipient (UR) over an audio messaging system. Thereby, a sender's (US) audio message is first collected by a transmitting device (2T). The audio message (AM) is then analysed for detection of a control information part (CP) concerning communication specifications of the message (AM) and a main part (MP) comprising the effective message which is to be sent to the recipient (UR). The control information part (CP) of the audio message (AM) is at least partially interpreted for controlling the audio messaging system (1) for communicating the (specific) audio message (AM). At least the main part (MP) of the audio message (AM) is transmitted to a receiving device (3) and presented to the recipient (UR). Furthermore, an appropriate audio messaging system, a transmitting device and a receiving device for such an audio messaging system are described.

Description

오디오 메시지를 전송하기 위한 방법 및 시스템{METHOD AND SYSTEM FOR SENDING AN AUDIO MESSAGE}METHOD AND SYSTEM FOR SENDING AN AUDIO MESSAGE}

본 발명은, 오디오 메시징 시스템을 통해 발신자로부터 수신자에게 오디오 메시지를 전송하는 방법 및 적절한 오디오 메시징 시스템에 관한 것이다. 게다가, 본 발명은 이러한 오디오 메시징 시스템을 위한 전송 디바이스 및 수신 디바이스에 관한 것이다.The present invention relates to a method for transmitting an audio message from a sender to a receiver via an audio messaging system and to an appropriate audio messaging system. In addition, the present invention relates to a transmitting device and a receiving device for such an audio messaging system.

문자-기반 메시징 서비스의 인기는 수년전의 이러한 도입 이후에 상당히 증가되어 왔다. 널리 배포된 단문 메시징 서비스(SMS; Short Messaging Service)는 이러한 서비스의 일례일 뿐이다. AOL의 인스턴트 메신저, 마이크로소프트의 MSN 메신저 및 야후의 PC용 메신저와 같은 문자 뉴스 시스템은 필요한 무료 소프트웨어를 다운로드한 후 무료로 사용될 수 있다. 이들 PC-기반 메시징 제공자들의 일부는 문자 메시징 서비스 이외에 음성-채팅 기능을 제공한다. 게다가, 일부 다른 제공자들은, 음성 채팅을 특화하였으며, 궁극적으로 IP(internet protocol)를 이용한 음성 시나리오를 유도한다.The popularity of text-based messaging services has increased significantly since this introduction several years ago. The widely deployed Short Messaging Service (SMS) is just one example of such a service. Text news systems such as AOL's instant messenger, Microsoft's MSN messenger and Yahoo's messenger for PC can be used free of charge after downloading the required free software. Some of these PC-based messaging providers provide voice-chat functionality in addition to text messaging services. In addition, some other providers have specialized in voice chat, ultimately leading to voice scenarios using the Internet protocol (IP).

음성 채팅 기능과 문자 메시징 간의 뚜렷한 구별은 사용자가, 예를 들어 채팅 윈도우를 선택하고 거기에 타이핑함으로써 또는 워드 문서를 작성하고 이를 전 송하는 것과 같은 다른 행위를 통해 명시적으로 상호작용할 수 있는 가능성이다. 다른 한편, 음성 대화는 연속적으로 전송되는데, 즉 중단없는 대화가 발생한다. 이는, 사용자가 다른 사람과 방에 있어서 메시지로서 특정 발언만을 전송하고자 하는 반면, 방안의 다른 사람에게 그가 지정한 발언들은 전송되어서는 안 되는 경우에 종종 사용자가 실제로 원치 않을 수 있다. 일반 전화는 사용자가 손으로 마이크를 가리거나 전화를 '조용히' 상태로 전환함으로써 이러한 문제를 회피할 수 있다. 명백히, 이는 핸드-프리(hands-free) 전화 또는 헤드셋(headset)을 사용할 때 가능하지 않다. 메시지의 수신자는 유사한 문제를 가지고 있다. 제 3자가 같은 방에 있는 경우에 조차 문자-기반 메시징 서비스를 사용하여, 제 3자가 볼 수 없는 스크린 또는 디스플레이에서 메시지를 읽음으로써 수신된 사적인 메시지를 읽을 수 있는 반면, 메시지를 헤드폰으로 듣지 않는 이상, 메시지의 수신 대상이 아닌 제 3자가 청취가능한 메시지를 듣지 않도록 보장하는 것은 거의 불가능하다.A clear distinction between voice chat functionality and text messaging is the possibility that the user can explicitly interact, for example, by selecting and typing in a chat window or through other actions such as creating and sending a word document. . On the other hand, voice conversations are transmitted continuously, i.e., uninterrupted conversations occur. This is often what the user does not really want if the user wants to send only a specific statement as a message in the room with someone else, while the statements he specifies should not be sent to someone else in the room. A regular phone can circumvent this problem by covering the microphone with the user's hand or by placing the phone in a "quiet" state. Clearly, this is not possible when using hands-free phones or headsets. The recipient of the message has a similar problem. Even if a third party is in the same room, you can use a text-based messaging service to read a private message received by reading the message on a screen or display that the third party cannot see, while not listening to the message on headphones. For example, it is almost impossible to ensure that a third party who is not the recipient of the message does not hear the audible message.

문자 메시징 시스템은 실제로 음성 채팅 기능보다 더 큰 수용 레벨을 누리는 것으로 보인다. 이는 아마도 사용자가 영구적인 대화 경험을 실제로 원치 않는 경향으로 인한 것이다. 한편으로는, 사용자는 다른 사람과 접속할 수 있길 바란다. 다른 한편으로는, 이들은 모든 그들의 발언이 전달되는 진행중인 대화에 영구적으로 포함되는 오프라인 모드로 동등하게 접속되길 바랄 수 있다. Text messaging systems actually appear to enjoy greater levels of acceptance than voice chat capabilities. This is probably due to the user's tendency to actually not want a permanent conversation experience. On the one hand, the user wants to be able to connect with others. On the other hand, they may wish to be equally connected in an offline mode where all their speech is permanently included in the ongoing conversation in which they are conveyed.

그러므로, 본 발명의 목적은 사용자에게 본질적으로 문자 메시징 시스템과 동일한 경험을 제공하는 오디오 메시징 시스템과 적절한 오디오 메시징 시스템을 통해 발신자로부터 수신자에게 오디오 메시지를 전송하는 방법을 제공하는 것이다. 특히, 사용자는 특정 발언을 오디오 메시지로서 용이하게 전송할 수 있어야 하는 한편, 다른 발언들이 메시징 시스템에 의해 전송되는 것을 막을 수 있어야 한다. It is therefore an object of the present invention to provide an audio messaging system that provides a user with essentially the same experience as a text messaging system and a method of transmitting an audio message from a sender to a receiver via an appropriate audio messaging system. In particular, the user should be able to easily send certain speech as an audio message, while preventing other speech from being sent by the messaging system.

이를 위해, 본 발명은 다음 단계를 포함하는 오디오 메시징 시스템을 통해 발신자로부터 수신자에게 오디오 메시지를 전송하는 방법을 제공한다.To this end, the present invention provides a method for transmitting an audio message from a sender to a receiver via an audio messaging system comprising the following steps.

우선, 발신자의 오디오 메시지는 전송 디바이스에 의해 수집된다. 메시지는 대개 발신자가 메시지를 말함으로써 생성된다. 그럼에도 불구하고, 발신자는 노래를 하거나, 악기를 연주하거나, 손뼉을 치는 등의 다른 형태로 메시지 또는 메시지의 일부를 생성하는 것 또한 가능하다. First, the sender's audio message is collected by the sending device. The message is usually created by the sender speaking the message. Nevertheless, it is also possible for the caller to generate the message or part of the message in other forms, such as singing, playing an instrument, or clapping.

이러한 오디오 메시지는 이후, 메시지의 통신 규격의 세부 사항과 같은 지시를 포함하는, 다음의 "오디오 헤더"라고 하는 제어 정보부; 및 이하 "오디오 본체"라고 하는 수신자에게 전송될 유효 메시지 또는 유효 정보를 포함하는 주요부를 검출하기 위해 분석될 것이다.This audio message may then be referred to as a control information section called " audio header ", which includes instructions such as details of the communication specification of the message; And a main part including valid message or valid information to be transmitted to a receiver referred to as " audio main body " hereinafter.

"발신자" 및 "수신자"라는 용어는 반드시 개별 사용자를 의미하는 것은 아니지만, 사용자 그룹 또는 이러한 사용자 그룹의 회원 또는 모든 회원을 의미할 수 있다. 예를 들어, 디바이스가 속하는 가족의 구성원 또는 해당 사무실에 지정된 디바이스를 사용하는 사무실 내의 직원과 같은 사용자 그룹은 하나의 공유된 전송 또는 수신 디바이스를 사용할 수 있다. 사용자 그룹은 또한 각자가 그 자신의 디바이스를 소유하는 사용자 그룹을 의미할 수 있으며, 이러한 경우, 사용자 그룹을 위한 메시지는 모든 수신 디바이스로 전송될 것이다.The terms "sender" and "recipient" do not necessarily mean an individual user, but may mean a user group or a member or all members of such a user group. For example, a user group, such as a member of a family to which a device belongs or an employee in an office using a device designated for that office, may use one shared transmitting or receiving device. A user group may also mean a user group, each of which owns its own device, in which case a message for the user group will be sent to all receiving devices.

제어 정보부 내에 결합된, 메시지의 통신 사양은, 예를 들어, 메시지 유형 및/또는 전송 모드(예, 메시지가 기밀이며, 사적이며, 긴급하다는 것 등을 나타내는 정보)와 같은 전송 및/또는 제공 규격의 임의의 유형이 될 수 있다. 제어 정보부는 또한 발신자 식별 또는 메시지의 수신자를 지정하기 위한 정보를 포함할 수 있다. 예컨대, 일반적인 오디오 헤더는 "Bob으로부터 Carl로의 개인 메시지"일 수 있다. 이러한 오디오 메시지의 제어 정보부는 특정 오디오 메시지를 전송 및/또는 제공하기 위해 오디오 메시징 시스템을 제어하기 위해 적어도 부분적으로 해석된다. 예컨대, 전송 디바이스 및/또는 수신 디바이스 및/또는 오디오 메시징 시스템의 송수신국(transceiving stations), 라우터 등과 같은 다른 부분을 위한 제어 신호는 제어 정보부에 기초하여 생성될 수 있다.The communication specification of a message, coupled within the control information section, is a transmission and / or provision specification such as, for example, the message type and / or mode of transmission (e.g., information indicating that the message is confidential, private, urgent, etc.). Can be of any type. The control information may also include information for specifying the sender identification or the recipient of the message. For example, a typical audio header may be "Personal Message from Bob to Carl." The control information portion of such an audio message is at least partially interpreted to control the audio messaging system to transmit and / or provide a particular audio message. For example, control signals for other parts, such as transmitting stations, routers, and the like of the transmitting device and / or the receiving device and / or the audio messaging system, may be generated based on the control information.

추가적인 단계에서, 오디오 메시지의 적어도 주요부는 수신자의 근처에 위치한 수신 디바이스로 전송되며 이 디바이스에서 수신자에게 제공된다.In an additional step, at least the major part of the audio message is sent to a receiving device located near the receiver and provided to the receiver at this device.

이 방법에 따라 발신자로부터 수신자에게 오디오 메시지를 전송하기 위한 적절한 오디오 메시징 시스템은, 발신자의 오디오 메시지를 수집하기 위한 사용자 인터페이스를 구비한 전송 디바이스 및 오디오 메시지의 통신 사양에 관한 제어 정보부와 수신자에게 전송될 실제 메시지를 포함하는 주요부를 검출하기 위한 오디오 메시지를 분석하는 메시지 분석 수단을 포함한다. 게다가, 오디오 메시징 시스템은 특정 오디오 메시지를 전송하기 위한 오디오 메시징 시스템을 제어하기 위한 오디오 메시지의 제어 정보부를 적어도 부분적으로 해석하기 위한 해석 유닛을 포함한다. 또한, 오디오 메시징 시스템은 오디오 메시지의 적어도 주요부를 수신자에게 제공하기 위한 사용자 인터페이스를 구비한 수신 디바이스를 포함한다. 마지막으로, 오디오 메시징 시스템은 전송 디바이스로부터 수신 디바이스로 오디오 메시지의 적어도 주요부를 전송하기 위한 수단을 필요로 한다.According to this method, a suitable audio messaging system for transmitting an audio message from a sender to a receiver can be transmitted to a receiver and a control information relating to a communication specification of the audio message and a transmission device having a user interface for collecting the sender's audio message. Message analyzing means for analyzing the audio message for detecting the main part including the actual message. In addition, the audio messaging system includes an interpretation unit for at least partially interpreting the control information portion of the audio message for controlling the audio messaging system for transmitting the specific audio message. The audio messaging system also includes a receiving device having a user interface for providing at least a major portion of the audio message to the recipient. Finally, the audio messaging system needs a means for transmitting at least the major part of the audio message from the transmitting device to the receiving device.

본 발명에 따른 방법 및 오디오 메시징 시스템의 도움으로, 사용자는 오디오 메시지에 포함된 명령에 의해 오디오 메시징 시스템을 제어하며, 따라서 사용자가 말하는 모든 것을 지속적으로 전송하는 것을 회피한다. 다시 말해, 사용자는 메시지의 실제 오디오 컨텐츠와 함께 발언 내의 "메타-정보"를 시스템에 제공할 수 있다. 이 시스템은 이에 따라 오디오 메시지를 분석하고 전송을 위한 임의의 발언을 포함한 오디오 본체로부터 제어 정보를 포함하는 오디오 헤더를 분리한다. 시스템이 특정 방법으로 특정인에게 메시지를 전송하기 위한 적절한 지시를 가진 오디오 헤더를 검출할 수 없는 경우, 어떠한 것도 전송되지 않을 것이다.With the aid of the method and the audio messaging system according to the invention, the user controls the audio messaging system by the instructions contained in the audio message, thus avoiding the continuous transmission of everything the user speaks. In other words, the user can provide the system with "meta-information" in the utterance along with the actual audio content of the message. The system thus parses the audio message and separates the audio header containing control information from the audio body including any speech for transmission. If the system cannot detect an audio header with the appropriate indication to send a message to a particular person in a particular way, nothing will be sent.

이는 다음의 간단한 예에서 설명된다: 시스템의 사용자가 "Carl에게의 메시지: 축구 경기는 7.00pm에 시작한다"라고 말한 경우, 이 말은 전송 디바이스의 사용자 인터페이스가 수집하여 분석한다. 오디오 헤더 "Carl에게의 메시지"는 검출되고 해석될 것이며, 메시지 "축구 경기는 7.00pm에 시작한다"는 "Carl"이라는 수신자에게 전송될 것이다. 반면, 사용자가 "Pete, 축구 경기가 7.00pm에 시작하는 것 알고 있지"라고 하여 축구의 시작 시간에 대해 방안에 있는 다른 사람에게 알리려고 하는 경우, 작동된 오디오 메시징 시스템 또는 대응 전송 디바이스는, 이러한 발언을 분석하여, 오디오 헤더를 포함하지 않는다고 결론을 내릴 것이다. 이 발언은 그 결과, 오디오 메시지로 식별되지 않을 것이며 전송되지 않을 것이다.This is illustrated in the following simple example: If a user of the system said "Message to Carl: Soccer game starts at 7.00pm", this is collected and analyzed by the user interface of the transmitting device. The audio header "message to Carl" will be detected and interpreted and the message "football game starts at 7.00pm" will be sent to the receiver "Carl". On the other hand, if the user wants to inform someone in the room about the start time of the football by saying "Pete, I know the football game starts at 7.00pm", the activated audio messaging system or the corresponding transmitting device may We will analyze the speech and conclude that it does not include the audio header. This remark will therefore not be identified as an audio message and will not be sent.

그러므로, 본 발명은 매우 간단하고 사용이 간편한 시스템 제어 수단을 제공하여서, 오직 특정 발언만이 오디오 메시징 시스템을 통해 다른 사람에게 전송되며, 이 때 예를 들어 마이크 또는 스피커와 같은 시스템 또는 시스템의 일부의 작동을 해제시킬 필요가 없다. 게다가, 전송 사용자는 메시지를 전송하고 이를 제공하는 것에 대해 시스템을 제어할 수 있으며, 이에 따라 모든 제어 명령어는, 사용자가 임의의 수동 작동을 행할 필요 없이, 오디오 헤더 내에 적절한 형태로 메시지 내에 편안하게 포함될 수 있다. 즉, 오디오 메시징 시스템의 전체 제어는 핸드-프리 세트를 사용하여 편안하게 수행될 수 있다. 이에 따라, 이러한 시스템은, 예를 들어 자동 핸드-프리 세트 내에서와 같이, 일반적인 휴대폰에 대한 일반 음성 제어에 대한 이점을 제공하며, 이에 따라 다른 참가인에 대한 접속은 음성 명령을 사용하여 개시되고 제어될 수 있지만, 영구적인 접속은 사용자와 참가인 사이에 이후 유지된다. 모든 사용자 발언들은 다른 참가자에게 전송되며, 전화를 "조용히" 모드로 하는 것은 적절히 명령함으로써, 또는 마이크 등을 덮어서 가능하다.Therefore, the present invention provides a very simple and easy to use system control means, so that only certain remarks are transmitted to others via an audio messaging system, where a part of the system or part of the system, such as a microphone or speaker, for example There is no need to disable it. In addition, the sending user can control the system for sending and providing the message, such that all control instructions are comfortably included in the message in the appropriate form in the audio header without the user having to perform any manual operation. Can be. That is, the overall control of the audio messaging system can be performed comfortably using the hand-free set. Thus, such a system offers the advantage of general voice control for a typical mobile phone, for example in an automatic hand-free set, so that access to other participants is initiated and controlled using voice commands. Persistent access is then maintained between the user and the participant. All user remarks are sent to other participants, and putting the phone in "quiet" mode can be done by commanding appropriately, or by covering the microphone or the like.

종속 청구항 및 이후 설명은 특히 본 발명의 유리한 실시예와 특성들을 개시한다.The dependent claims and the following description particularly disclose advantageous embodiments and features of the invention.

본 발명의 바람직한 실시예에서, 오디오 메시지의 제어 정보부는 또한 수신 디바이스로 적어도 부분적으로 전송되며 오디오 메시지의 수신자에게 제공을 제어하기 위해 해석된다. 즉, 수신 디바이스는, 예를 들어, 언제, 어떻게 그리고 어떤 사용자에게 오디오 메시지 또는 오디오 메시지의 오디오 본체가 출력될지에 관한, 오디오 헤더의 지원으로, 적절한 정보를 수신한다. 바람직하게, 오디오 헤더는 또한 수신자에게 적어도 부분적으로 출력될 수 있다.In a preferred embodiment of the invention, the control information portion of the audio message is also at least partly transmitted to the receiving device and interpreted to control the provision to the receiver of the audio message. That is, the receiving device receives appropriate information, for example with the support of an audio header, when, how and to which user the audio message or the audio body of the audio message is to be output. Preferably, the audio header may also be output at least in part to the receiver.

제어 정보부가 사용자가 말한 명령을 처리하는 것이 바람직하므로, 자동 음성 인식 기술은 오디오 메시지 내의 제어 정보부를 식별하는데 사용될 수 있으며, 이에 따라 이러한 경우 자동 음성 인식은 엄밀히 말해 음성 인식이 아닌, 언어 이해 기술을 의미한다. 이 목적을 위해, 전송 디바이스는 자동 음성 인식 장치를 포함해야 한다.Since it is preferable that the control information unit processes the command spoken by the user, the automatic speech recognition technique can be used to identify the control information portion in the audio message, and in this case, the automatic speech recognition technique is strictly speaking language understanding technique, not speech recognition technique. it means. For this purpose, the transmitting device should comprise an automatic speech recognition device.

오디오 메시지 내의 제어 정보부의 식별을 지원하기 위해, 오디오 메시지는 제어 정보부가 주요부에 관한 특정 위치에 위치된 한정된 복합 구조로 구성되는 것이 바람직하다. 제어 정보부는 오디오 메시지의 시작부에 위치되고 주요부가 후속되는 것이 더 바람직하다. 이것의 이점은 제어 정보부가 음성 인식 장치에 의해 검출된 첫 번째 것이며, 다음의 주요부는 오직 전송을 위해 버퍼링되거나 준비되어야 한다. 그러나, 제어 정보부는 예를 들어, 메시지의 종료부에서, 메시지 내에 임의의 적절한 위치에 위치될 수 있거나, 제어 정보부는 메시지 내의 여러 위치에 대해 분포될 수 있어서, 특정 제어 정보는 메시지의 시작부에 위치되며 추가적인 제어 정보는 메시지의 중간 또는 종료부를 향해 위치된다.In order to support identification of the control information part in the audio message, the audio message is preferably composed of a defined complex structure in which the control information part is located at a specific position with respect to the main part. More preferably, the control information part is located at the beginning of the audio message and follows the main part. The advantage of this is that the control information part is the first detected by the speech recognition device, and the following main part should be buffered or ready for transmission only. However, the control information may be located at any suitable location within the message, for example at the end of the message, or the control information may be distributed over several locations within the message, such that certain control information may be located at the beginning of the message. And additional control information is located towards the middle or end of the message.

자동 음성 인식기의 지원을 받는 오디오 메시지의 분석은, 전송 디바이스 또는 수신 디바이스 내의 저장 유닛과 같은 적절한 메모리 내에 오디오 메시징 시스템에 의해 저장될 수 있는 특정 키-워드를 검색하는 단계를 수반할 수 있다. 이러한 키-워드의 일반적인 예는, 예를 들어 "기밀의", "사적인" 또는 "긴급한"과 같은 메시지 또는 전송 방법의 유형을 지정하는 키워드뿐만 아니라, 메시지의 가능한 수신자에 대한 설명자인, "메시지", "~에게로의 메시지" 등이 될 수 있다.Analysis of audio messages supported by an automatic speech recognizer may involve retrieving a particular key-word that may be stored by an audio messaging system in a suitable memory, such as a storage unit in a transmitting device or a receiving device. Common examples of such key-words are "messages," which are descriptors for possible recipients of the message, as well as keywords that specify the type of message or transmission method, such as, for example, "confidential", "private", or "urgent." "," Message to ... ", and the like.

메시지의 전송을 가능한 쉽게 만들기 위해, 고유한 식별자 문자열은 오디오 메시징 시스템의 가능한 사용자 또는 사용자 그룹과 연관된다. 이러한 고유한 식별자 문자열은, 예를 들어 사용자의 실제 이름을 포함할 수 있거나, 다양한 사용자의 신원을 숨기는 임의의 다른 문자열일 수 있다. 특히, 전체 사용자 그룹은 단일한 문자열을 사용하여 집합적으로 식별될 수 있다. 다른 사용자가 가장 용이하게 상기할 수 있는 별명 또는 가명의 사용은 바람직하다. 이들 별명은 시스템의 단어에 포함되며 단지 별명을 말함으로써 오디오 헤더 내에 동료 사용자를 효율적으로 지정하는데 사용될 수 있다. 게다가, 그룹들은 정의될 수 있어서, 모든 접속된 회원들이 오디오 헤더가 그룹의 이름을 포함하는 경우 메시지를 수신할 것이다.To make the transmission of the message as easy as possible, a unique identifier string is associated with a possible user or group of users in the audio messaging system. Such a unique identifier string may include, for example, the real name of the user, or may be any other string that hides the identity of the various users. In particular, the entire group of users can be identified collectively using a single string. The use of aliases or pseudonyms that are most easily recalled by other users is desirable. These aliases are included in the words of the system and can only be used to efficiently assign fellow users within the audio header by saying the alias. In addition, groups can be defined so that all connected members will receive a message if the audio header contains the name of the group.

바람직하게, 가능한 수신자의 식별자 문자열은 전송 디바이스의 메모리 내에, 그리고 필요한 경우 수신 디바이스 내에, 또는 오디오 메시징 시스템 내의 추가적인 적절한 위치 내에 대응하는 주소록 엔트리와 함께 저장된다.Preferably, the identifier string of possible recipients is stored with corresponding address book entries in the memory of the transmitting device and, if necessary, in the receiving device or in an additional suitable location in the audio messaging system.

오디오 메시지들은 종종 다수의 사람들에게 동시에 전송될 것이다. 더 긴 대화중에 수신자의 동일한 목록은 종종 사용될 것이다. 오디오 헤더로 말하자면, 모든 수신자의 모든 이름들이 매번 말해져야 하는 경우 사용자에게 불편하다. 그러므로, 별명 또는 다른 식별자 문자열을 관련 어드레스 북 엔트리의 목록과 동적으로 연관시키는 것은 메시지의 전송을 더욱 편하게 만들 것이다.Audio messages will often be sent to multiple people simultaneously. During longer conversations, the same list of recipients will often be used. Speaking of the audio header, it is inconvenient for the user if all names of all receivers have to be spoken every time. Therefore, dynamically associating an alias or other identifier string with a list of related address book entries will make the transmission of the message easier.

바람직하게, "대답" 또는 이와 유사한 키워드는 오디오 헤더에서 연관된 오디오 메시지가 수신된 마지막 메시지의 발신자에게 그리고 가능하게 마지막 메시지가 전송되었던 모든 사용자에게 전송되어야 한다는 것을 나타내기 위해 사용된다.Preferably, an "answer" or similar keyword is used to indicate that the associated audio message in the audio header should be sent to the sender of the last message received and possibly to all users to whom the last message was sent.

전송 디바이스는 대화 시스템으로서 실현되는 것이 바람직하며, 이러한 대화 시스템을 포함하거나, 이러한 대화 시스템의 일부인 것이 바람직하다. 이러한 특정한 바람직한 경우에서, 자동 대화는 자동 음성 인식기의 인식 결과의 모호성 값(예, 내부 신뢰 측정치에 기초함)이 특정 모호성 임계 레벨에 도달하거나 이를 초과할 때 오디오 메시지의 제어 정보부를 식별하기 위해, 오디오 메시징 시스템 또는 더 구체적으로 전송 디바이스와 발신자 사이에서 개시될 수 있다. The transmitting device is preferably realized as a conversation system, and preferably comprises or is part of such a conversation system. In this particular preferred case, the automatic conversation is used to identify the control information portion of the audio message when the ambiguity value (eg, based on an internal confidence measure) of the recognition result of the automatic speech recognizer reaches or exceeds a certain ambiguity threshold level. It may be initiated between an audio messaging system or more specifically between the transmitting device and the sender.

다시 말해, 시스템이 메시지가 전송되어야 할지 여부, 이를 누구에게 전송해야 할지 또는 어떠한 방법으로 이를 전송해야 할지에 관해 불분명한 경우, 시스템은 확인을 요구하는 사용자에게 프롬프트(prompt)를 발행할 수 있거나, 가정된 오디오 헤더의 정정을 허용하기 위해 사용자와의 대화를 시작할 수 있다. 이렇게 하여, 시스템은 어떠한 메시지도 의도적이지 않게 전송되거나, 잘못된 수신자에게 전송되는 일이 없도록 한다.In other words, if the system is unclear as to whether a message should be sent, to whom, or how to send it, the system may issue a prompt to the user requesting confirmation, A conversation with the user can be initiated to allow correction of the assumed audio header. In this way, the system ensures that no message is sent unintentionally or to the wrong recipient.

이미 언급한 것처럼, 제어 정보부는, 바람직한 실시예에서, 또한 수신 디바이스로 적어도 부분적으로 전송되며, 오디오 메시지의 출력을 제어하도록 해석된다. 이는 특히 예컨대, 식별자 문자열과 같은, 수신자 ID에 속하는 정보가 또한 전송될 때 유용하다. 식별자 문자열의 지원으로, 사용자는 오디오 메시지의 오디오 본체의 오디오 메시지의 출력이 발생하기 전에 수신 디바이스의 일부 상에서 식별될 수 있다.As already mentioned, the control information part, in a preferred embodiment, is also at least partly transmitted to the receiving device and is interpreted to control the output of the audio message. This is particularly useful when information pertaining to the recipient ID, such as an identifier string, is also transmitted. With the support of the identifier string, the user can be identified on the part of the receiving device before the output of the audio message of the audio body of the audio message occurs.

이것을 위해, 특히 바람직한 실시예에서, 사용자 또는 사용자 그룹의 식별자 문자열은 특정 사용자, 사용자 그룹 또는 사용자 그룹의 구성원의 식별자 특성에 연결된다. 식별자 특성은, 예를 들어, 특성의 기밀 시퀀스, 화자(speaker) 식별자의 특성 및/또는 적절한 사용자의 생체 측정 데이터와 같은 비디오 특성이 될 수 있다. 이들 식별자 특성의 지원으로, 특정 오디오 메시지의 인증받은 수신자는, 오디오 메시지의 주요부를 출력하기 전에, 메시지를 수신할 때, 수신 디바이스의 근처에 존재하는 다른 가능한 사용자 중에서 식별될 수 있다. To this end, in a particularly preferred embodiment, the identifier string of the user or user group is linked to the identifier property of the particular user, user group or member of the user group. The identifier characteristic may be, for example, a video characteristic such as a confidential sequence of characteristics, a characteristic of a speaker identifier and / or biometric data of a suitable user. With the support of these identifier properties, an authenticated recipient of a particular audio message can be identified among other possible users present near the receiving device when receiving the message, before outputting the main portion of the audio message.

바람직하게, 식별자 특성은 수신 디바이스가 액세스를 가진 메모리에 저장될 수 있으며, 수신 디바이스는 이들 식별자 특성에 근거하여 수신자를 식별하는 수단을 포함한다.Preferably, the identifier characteristics may be stored in a memory to which the receiving device has access, the receiving device comprising means for identifying the recipient based on these identifier characteristics.

다른 가능성은 카메라가 방안에 있는 사람들을 관찰하고, 생체 측정 데이터의 도움으로 그리고 알려진 이미지 처리 기술을 사용하여 수신자의 얼굴을 식별하는 것일 수 있다.Another possibility may be that the camera looks at the people in the room and identifies the recipient's face with the aid of biometric data and using known image processing techniques.

대안적으로, 디바이스는 사용자를 음성을 통해 식별할 수 있다. 예를 들어, 오디오 헤더는 출력될 수 있으며, 적절한 프롬프트가 후속될 수 있다. 사용자가 답하는 경우, 화자의 ID를 통해 적합한 사용자로서 식별될 수 있다. 메시지는 일단 사용자의 신원이 성공적으로 확인되면 출력된다.Alternatively, the device may identify the user via voice. For example, an audio header may be output, followed by an appropriate prompt. If the user answers, it can be identified as a suitable user through the speaker's ID. The message is output once the user's identity has been successfully verified.

바람직한 실시예에서, 오디오 메시지의 발신자는 식별자 특성을 통해 식별될 수 있으며, 발신자에 관한 대응 정보는 오디오 메시지와 함께 전송될 수 있다. 발신자가, 예를 들어 "Bob이 Carl에게 보내는 메시지"의 형태와 같은, 오디오 헤더로 자신을 밝힌 한, 식별자 특성의 도움으로 발신자의 유효성을 확인할 수 있다.In a preferred embodiment, the sender of the audio message can be identified via an identifier property and the corresponding information about the sender can be sent with the audio message. As long as the sender identifies himself with an audio header, for example in the form of "Message Bob sends to Carl," the sender can validate the sender with the aid of the identifier property.

대개, 오디오 메시지는 주제별 배열(topicality)로 인해, 인증받은 수신자에게 즉시 출력되어야 한다. 그러나, 예를 들어, 기밀 또는 개인 메시지가 출력되어야 하고, 수신자가 방에 혼자 있지 않거나, 그렇지 않으면 사람들로 가득차 있고 메시지를 수신할 수 없을 때와 같이, 출력이 부적절할 수 있는 상황이 존재한다. 수신자가 대화 또는 전화 통화 중일 수 있다. 이러한 상황을 고려하는 것은 특히 중요한데, 이는 오디오 메시지가 지속 중이 아니기 때문이다. 사용자가 방에 없거나 주의를 기울이지 않고 메시지가 즉시 출력되는 경우, 이는 검색 불가능하게 손실될 것이다.Usually, due to topicality, the audio message should be immediately output to the authorized recipient. However, there are situations where output may be inadequate, for example when a confidential or private message is to be output and the recipient is not alone in the room or otherwise is full of people and cannot receive the message. The recipient may be talking or talking on the phone. Considering this situation is particularly important because the audio message is not persistent. If the user is not in the room or the message is output immediately without paying attention, it will be lost unsearchable.

이를 위해, 본 발명에 따른 바람직한 방법은 식별된 수신자가 현재 포함되고, 오디오 메시지가 상황에 따라 특정한 형태로 그리고/또는 특정한 시간에 수신자에게 제공되는 상황을 자동적으로 분석한다. 예를 들어, 수신자가 존재하고 몰입하는 작업(예, 전화 대화)을 행하지 않는 경우, 유입 메시지는 즉시 재생될 수 있다. 그렇지 않으면 메시지는 사용자가 방으로 들어가거나 그의 작업을 마치자마자 버퍼링되고 재생될 수 있다. 더 긴 메시지의 중단이 필요한 경우(예, 인입 전화 통화로 인해) 재생은 더 나중 시점에서 재개될 것이다.To this end, the preferred method according to the invention automatically analyzes the situation in which the identified recipient is currently included and the audio message is provided to the recipient in a particular form and / or at a specific time, depending on the situation. For example, if the recipient is present and does not engage in immersive work (eg, phone conversation), the incoming message can be played immediately. Otherwise the message can be buffered and played as soon as the user enters the room or finishes his work. If longer messages need to be interrupted (eg due to an incoming phone call) playback will resume at a later point in time.

수신자가 현재 개입된 상황을 자동으로 분석하는 여러 방법이 존재한다. 바람직한 실시예에서, 매우 만족스러운 수신 디바이스는 카메라 또는 유사한 디바이스를 통해 환경의 화상을 수신하는 추가적인 능력을 갖는 대화 시스템으로서 실현된다. 수신자 및/또는 현재 상황의 식별은 이후 알려진 이미지 처리 기술을 사용함으로써 결정될 수 있다. 수신자를 식별하고/하거나 현재 상황을 분석하는 가장 쉬운 방법은 오디오 메시징 시스템/수신 디바이스 및 수신자 사이의 자동 대화를 개시하는 것이다. 예를 들어, 디바이스는 오디오 헤더 "Carl을 위한 메시지"를 출력한 다음 "메시지를 수신할 준비가 되었습니까?"라는 프롬프트를 발행함으로써 전술한 대화에 선행될 수 있다. 사용자가 "예"라고 답변한 경우, 메시지는 제공될 것이며, 그렇지 않으면 사용자가 나중에 메시지를 명시적으로 요청할 때까지 버퍼링될 것이다.There are several ways to automatically analyze the situation in which the receiver is currently involved. In a preferred embodiment, a very satisfactory receiving device is realized as a conversation system with the additional ability to receive an image of the environment via a camera or similar device. Identification of the recipient and / or current situation can then be determined by using known image processing techniques. The easiest way to identify the recipient and / or analyze the current situation is to initiate an automatic conversation between the audio messaging system / receiving device and the recipient. For example, the device may precede the conversation described above by outputting the audio header "Message for Carl" and then issuing the prompt "Are you ready to receive the message?" If the user answered "yes", the message will be provided, otherwise it will be buffered until the user explicitly requests the message later.

이미 앞서 설명한 것처럼, 발신자의 근처에 위치한 전송 디바이스 이외에, 오디오 메시징 시스템은 또한 실제 수신자의 근처에 위치된 수신 디바이스를 필요로 한다.As already explained above, in addition to the transmitting device located near the sender, the audio messaging system also requires the receiving device located near the actual receiver.

적절한 전송 디바이스는 적어도 다음 성분을 포함한다:Suitable transmission devices include at least the following components:

- 발신자의 오디오 메시지를 수집하는 사용자 인터페이스;A user interface for collecting the caller's audio message;

- 오디오 메시지의 전송 사양에 관한 제어 정보부와 특정 수신자에게 전송될 유효 메시지를 포함하는 주요부를 검출하기 위한 오디오 메시지를 분석하기 위한 메시지 분석 수단;-Message analyzing means for analyzing an audio message for detecting a main portion including a control information portion relating to a transmission specification of the audio message and a valid message to be transmitted to a specific receiver;

- 오디오 메시지의 전송에 대해 오디오 메시징 시스템을 제어하는 오디오 메시지의 제어 정보부를 적어도 부분적으로 해석하기 위한 해석 유닛;An interpretation unit for at least partially interpreting the control information portion of the audio message for controlling the audio messaging system for transmission of the audio message;

- 오디오 메시지의 적어도 주요부를 수신 디바이스로 전송하기 위한 전송 인터페이스.A transmission interface for transmitting at least the main part of the audio message to the receiving device.

적절한 수신 디바이스는 적어도 다음 성분을 포함해야 한다:Suitable receiving devices should contain at least the following components:

- 전송 디바이스에 의해 전송된 오디오 메시지를 수신하고 오디오 메시지의 전송 사양에 관한 제어 정보부와 특정 수신자에게 전송된 유효 메시지를 포함하는 주요부를 포함하는 수신 인터페이스;A receiving interface which receives an audio message sent by the transmitting device and includes a main part including control information about the transmission specification of the audio message and a valid message sent to a specific receiver;

- 오디오 메시지의 적어도 주요부를 수신자에게 제공하기 위한 사용자 인터페이스;A user interface for providing at least the main part of the audio message to the recipient;

- 오디오 메시지의 제공에 대해 오디오 메시징 시스템을 제어하는 오디오 메시지의 제어 정보부를 적어도 부분적으로 해석하는 해석 유닛.An interpretation unit for at least partially interpreting the control information portion of the audio message which controls the audio messaging system with respect to the provision of the audio message.

앞서 이미 설명한 것처럼, 전송 디바이스 및/또는 수신 디바이스는 대화 시스템으로서 실현되는 것이 바람직하다. 전송 디바이스와 수신 디바이스는 동일하게 구성될 수 있으며 수신 메시지뿐만 아니라 전송 메시지에 대한 모든 필요한 성분을 포함할 수 있다. 다른 디바이스의 제어와 같은 다른 목적을 위해 사용된 대화 시스템은 적절한 성분을 구비할 수 있으며, 따라서 이러한 대화 시스템은 본 발명에 따른 오디오 메시징 시스템에 대한 전송 디바이스 및/또는 수신 디바이스로서 사용될 수 있다.As already explained above, the transmitting device and / or the receiving device is preferably realized as a conversation system. The transmitting device and the receiving device may be configured identically and may include all necessary components for the transmitting message as well as the receiving message. The conversation system used for other purposes, such as the control of other devices, may be equipped with suitable components, such that the conversation system may be used as a transmitting device and / or a receiving device for the audio messaging system according to the present invention.

특히 바람직한 실시예에서, 전송 디바이스와 수신 디바이스는 DE 102 49060 A1에서 설명된 것과 같은 대화 시스템의 일부를 포함한다. 이러한 경우, 대화 시스템은 통신 네트워크를 통해 오디오 메시지를 전송할 수 있도록 적절한 메시지 분석 수단, 해석 유닛 및 송신기/수신기 인터페이스가 더 장착되어야 한다. 메시지 분석 수단은, 오디오 헤더의 검출을 위한 적절한 단어가 제공된, 이러한 디바이스에 이미 존재하는 본질적으로 음성 인식 유닛일 수 있다. 오디오 메시지의 제어 정보부를 해석하기 위한 해석 유닛은 실제 대화 제어 유닛 내에 또는, 대화 시스템의 프로세서 상에서 실행되는 소프트웨어의 다른 형태로 소프트웨어 루틴으로서 실현될 수 있는 것이 바람직하다. 해석 유닛은 오디오 헤더 내에 포함된 제어 명령을 제어 신호를 변환할 수 있어야 하며, 따라서 메시지는 발신자의 전송 디바이스로부터 수신자의 수신 디바이스로 의도된 방법으로 전송되거나, 수신된 메시지는 수신 디바이스에 의해 적합한 수신자에게 올바른 방법으로 제공된다.In a particularly preferred embodiment, the transmitting device and the receiving device comprise part of a conversation system as described in DE 102 49060 A1. In this case, the conversation system should be further equipped with appropriate message analysis means, interpretation unit and transmitter / receiver interface to be able to transmit audio messages via the communication network. The message parsing means may be essentially a speech recognition unit already present in such a device, provided with a suitable word for the detection of the audio header. The interpretation unit for interpreting the control information portion of the audio message is preferably realized as a software routine in the actual conversation control unit or in another form of software executed on the processor of the conversation system. The interpretation unit must be able to convert the control signal into a control command contained in the audio header, so that the message is transmitted from the sender's sending device to the receiver's receiving device in the intended manner, or the received message is received by the receiving device as appropriate. Is provided in the right way.

본 발명의 다른 목적과 특성들은 첨부한 도면과 연관하여 고려된 다음의 자세한 설명으로부터 명백해 질 것이다. 그러나, 도면들은 단지 설명 목적일 뿐 본 발명의 제한의 한정으로서 설계된 것이 아니라는 사실을 이해할 것이다.Other objects and features of the present invention will become apparent from the following detailed description considered in conjunction with the accompanying drawings. It will be understood, however, that the drawings are for illustrative purposes only and are not intended as limitations of the present invention.

도 1은 본 발명에 따른 오디오 메시징 시스템의 일 실시예를 도시하는 개략도.1 is a schematic diagram illustrating one embodiment of an audio messaging system according to the present invention;

도 2는 도 1에 따른 오디오 메시징 시스템을 위한 전송 및/또는 수신 디바이스의 바람직한 실시예의 사시도.2 is a perspective view of a preferred embodiment of a transmitting and / or receiving device for the audio messaging system according to FIG. 1.

도 3은 본 발명에 따른 구조를 구비한 오디오 메시지를 위한 매우 간단한 예를 도시한 도면.3 shows a very simple example for an audio message with a structure according to the invention.

도 4는 오디오 메시지의 전송까지 사용자 입력으로 시작한 전송 디바이스 내의 프로세스 흐름을 도시한 흐름도.4 is a flow diagram illustrating a process flow in a transmitting device beginning with user input until the transmission of an audio message.

도 1은, 간략함을 위해, 오직 2개의 디바이스, 즉 발신자(US) 근처의 전송 디바이스(2T) 및 수신자(UR) 근처의 수신 디바이스(2R)를 구비한 오디오 메시징 시스템을 도시하며, 전송 디바이스(2T)와 수신 디바이스(2R)는 서로 네트워크(N)에 의해 연결된다.1 shows, for simplicity, an audio messaging system with only two devices: a transmitting device 2 T near the sender U S and a receiving device 2 R near the receiver U R. The transmitting device 2 T and the receiving device 2 R are connected to each other by a network N.

통신 네트워크(N)는 전화 네트워크, 휴대폰 네트워크, 인터넷, 사무실 인트라넷 또는 가정용-통신 네트워크와 같은, 임의의 유형의 네트워크가 될 수 있다. 2개의 디바이스(2T 및 2R)가 적절한 인터페이스(14)를 통해 서로 통신할 수 있는 것만이 필요하다.The communication network N can be any type of network, such as a telephone network, a cellular network, the Internet, an office intranet or a home-communication network. It is only necessary for the two devices 2 T and 2 R to be able to communicate with each other via the appropriate interface 14.

일반적으로, 이러한 오디오 메시징 시스템(1)은 상당히 더 큰 수의 디바이스를 포함한다. 임의의 수의 디바이스는 결합될 수 있다. 특히, 특정 메시지가 한 특정 디바이스로부터 다른 디바이스로 단지 전송될 필요는 없다. 이러한 메시지는 예를 들어, 한 사용자로부터 사용자 그룹, 즉 많은 수신자에게 메시지를 전송하기 위해 여러 디바이스로 동시에 전송될 수 있다.In general, such an audio messaging system 1 comprises a significantly larger number of devices. Any number of devices can be combined. In particular, a particular message need not only be sent from one particular device to another. Such a message may be sent simultaneously to several devices, for example, to send a message from one user to a group of users, ie, many recipients.

도시된 예에서, 전송 디바이스(2T)와 수신 디바이스(2R)는 일반적으로 동일한 방법으로 구성되는데, 즉, 이들은 수신 및 전송 오디오 메시지 양자에 대해 사용될 수 있다. 참조부호(2T 및 2R)는 명확성을 위해 수신 디바이스(2R)와 전송 디바이스(2T) 간을 구별하는 역할만을 한다. 일반적으로, 메시지는 또한 반대 방향으로 전송될 수 있다. 그러므로, 문제를 단순화하기 위해, 디바이스는 또한 적절한 경우, "송수신 디바이스"(2T 및 2R)라고도 한다. In the example shown, the transmitting device 2 T and the receiving device 2 R are generally configured in the same way, ie they can be used for both receiving and transmitting audio messages. Reference numerals 2 T and 2 R only serve to distinguish between the receiving device 2 R and the transmitting device 2 T for clarity. In general, messages can also be sent in the opposite direction. Therefore, to simplify the problem, the device is also referred to as " transmission and reception device " ( 2T and 2R ) as appropriate.

이러한 송수신 디바이스(2T 및 2R)는 대화 시스템으로서 유리한 장치로 구성된다.These transmitting and receiving devices 2 T and 2 R are constituted by a device advantageous as a conversation system.

이러한 유형의 대화 시스템은, 도면에 도시되지 않은 다른 성분과 함께, 마이크 또는 이와 유사한 것에 의해, 음성 또는 노래와 같은 사용자로부터의 오디오 신호를 취하거나 수집하기 위한 장치를 구비한 사용자 인터페이스(10)를 포함한다. 이러한 사용자 인터페이스(10)는 또한 스피커와 같은, 음향 출력 장치(12)를 특징으로 한다. 게다가, 사용자 인터페이스(10)는 디스플레이 및/또는 카메라와 같이, 시각 출력 또는 입력을 위한 성분을 포함할 수 있다.This type of conversation system, along with other components not shown in the figures, may include a user interface 10 having a device for taking or collecting audio signals from a user, such as voice or song, by a microphone or the like. Include. This user interface 10 also features a sound output device 12, such as a speaker. In addition, the user interface 10 may include components for visual output or input, such as a display and / or a camera.

도 2에 도시된, 바람직한 실시예에서, 사용자 인터페이스는 이동가능한데, 예를 들어, 축 주변으로 회전할 수 있으며, 하우징(18) 상에 장착되고, 이 하우징은 송수신 디바이스(2T 및 2R)의 임의의 추가적 성분을 포함할 수 있다. 사용자 인터페이스(10)는 명백히 인식가능한 전면 외관(17)을 구비하며, 스피커(12), 2개의 마이크(11) 및 카메라(16)를 포함한다. 게다가, 이러한 실시예는 정보의 시각 출력을 위한 디스플레이 유닛(미도시)을 포함할 수 있다. 이러한 디스플레이 유닛을 구비한 바람직한 대화 시스템은 DE 102 49 060 A1에 기술된 가정용 대화 시스템이며, 이는 본 명세서에 그 전문이 병합되어 있다. 본 발명을 위해 유리하며 송수신 디바이스(2T 및 2R)의 이러한 실현으로 달성된 추가적인 기능은 나중에 설명된다.In the preferred embodiment, shown in FIG. 2, the user interface is movable, for example can be rotated about an axis, mounted on a housing 18, which is a transceiving device 2 T and 2 R. It may include any additional component of. The user interface 10 has a clearly recognizable front appearance 17 and includes a speaker 12, two microphones 11 and a camera 16. In addition, this embodiment may include a display unit (not shown) for visual output of the information. A preferred conversation system with such a display unit is the home conversation system described in DE 102 49 060 A1, which is hereby incorporated in its entirety. Additional functions which are advantageous for the present invention and achieved with this realization of the transmitting and receiving devices 2 T and 2 R are described later.

송수신 디바이스(2T 및 2R)의 추가적 성분은 오디오 제어 유닛(8)으로서, 이는 예를 들어, 사용자 인터페이스(10)의 오디오 기능을 제어하며 나중의 처리 단계 를 위해 인입 음성 신호를 준비한다. 이러한 나중의 처리 단계의 일례는 자동 음성 인식 장치(7)이며, 후속 언어 이해 유닛(6)이 후속되는 실제 음성 인식 유닛(5)을 포함한다. 이들 성분의 지원으로, 사용자(US)의 인입 음성 신호는 일반적인 방법으로 분석되고 인식될 수 있으며, 즉, 음성 입력의 기본적인 의미가 결정될 수 있다.An additional component of the transmitting and receiving devices 2 T and 2 R is the audio control unit 8, which, for example, controls the audio function of the user interface 10 and prepares incoming voice signals for later processing steps. An example of this later processing step is the automatic speech recognition device 7, which comprises a real speech recognition unit 5 followed by a subsequent language understanding unit 6. With the support of these components, the incoming voice signal of the user U S can be analyzed and recognized in the usual way, ie the basic meaning of the voice input can be determined.

음성 인식 결과는 이후 대화 제어 유닛(3)으로 전송되며, 이 유닛은 사용자와의 실제 대화를 제어하고, 오디오 메시지를 전송하거나 수신하기 위해 애플리케이션(이 경우, 메시지 송수신 애플리케이션(12))과 함께 작동한다. 이러한 메시지 송수신 애플리케이션(13)은, 통신 네트워크(N)에 연결된 물리적 네트워크 인터페이스(14)와 함께, 메시지가 적절한 전자 형태로 송신되고 수신될 수 있다는 것을 보장한다. 그러므로 네트워크 인터페이스(14)와 함께 메시지 송수신 애플리케이션(13)은 또한 "수신 인터페이스" 또는 "전송 인터페이스" 또는 적절한 경우 "송수신 인터페이스"로서도 간주될 수 있다.The speech recognition result is then sent to the conversation control unit 3, which works with the application (in this case, the message sending and receiving application 12) to control the actual conversation with the user and to send or receive audio messages. do. This message transceiving application 13, together with the physical network interface 14 connected to the communication network N, ensures that messages can be transmitted and received in the appropriate electronic form. Therefore, the message transmitting and receiving application 13 together with the network interface 14 may also be regarded as a "receiving interface" or "transmission interface" or, as appropriate, a "transmit and receive interface".

사용자에 대한 출력이 사용자(US,UR)와의 대화를 허용해야 하므로, 시스템은 또한 출력 프롬프트를 생성하기 위한 프롬프트 생성기(9)를 특징으로 한다. 이러한 프롬프트 생성기(9)는 메모리로부터 검색된 사전-생성된 프롬프트를 출력할 수 있거나 문자 프롬프트를 음성 신호로 변환하기 위한 음성 생성 유닛을 포함할 수 있고, 이 음성 신호는 오디오 제어기(8)와 사용자 인터페이스(12)에 의해 합성 음성으로서 출력될 수 있다.The system also features a prompt generator 9 for generating an output prompt, since the output to the user must allow a conversation with the user U S , U R. Such prompt generator 9 may output a pre-generated prompt retrieved from memory or may comprise a speech generating unit for converting a text prompt into a speech signal, which speech signal is connected to the audio controller 8 and the user interface. By 12, it can be output as synthesized speech.

송신 사용자(US)의 오디오 메시지는 다음의 방법으로, 이 경우에는 다른 개 별 사용자인, 수신자(UR)에게 전송될 수 있다:The audio message of the sending user U S can be sent to the receiver U R , in this case another individual user:

송신자(US)는 사용자 인터페이스(10), 또는 더 정확하게는, 송수신 디바이스(2T)의 오디오 검출 배열(11)에 의해 검출되는 오디오 메시지(AM)를 말한다. 기록된 음성 신호는 이후 오디오 제어 유닛(8)에 의해 사전-처리되며 자동 음성 인식 유닛(5)의 커널(kernel)로 전송되며, 이 인식 유닛은 후속 언어 이해 유닛(6)과 함께 사용자(US)의 발언을 분석한다.The sender U S refers to an audio message AM which is detected by the user interface 10, or more precisely, the audio detection arrangement 11 of the transmitting and receiving device 2 T. The recorded speech signal is then pre-processed by the audio control unit 8 and sent to the kernel of the automatic speech recognition unit 5, which recognition unit user U together with the subsequent language understanding unit 6. Analyze the speech of S ).

본 발명에 따라, 이러한 오디오 메시지(AM)는 소위 주요부(MP)라고 하는 전송될 실제 정보와 함께 제어 정보부(CP)(오디오 헤더)를 포함한다. 이러한 구조는 도 3에 도시된다. 본 명세서에서 도시된 메시지, "Carl로의 개인 메시지: 회의는 7.00pm에 시작함"은 주요부(MP), "회의는 7.00pm에 시작함"이 따르는, 제어 정보부(CP) "Carl로의 개인 메시지"를 포함한다.According to the invention, this audio message AM comprises a control information part CP (audio header) with the actual information to be transmitted, called the main part MP. This structure is shown in FIG. The message shown in this specification, "Personal Message to Carl: Meeting Starts at 7.00pm" is followed by the main part (MP), "Meeting Begins at 7.00pm", Control Information Unit (CP) "Personal Message to Carl" It includes.

자동 음성 인식 장치(7)는 제어 정보부(CP)를 식별할 수 있고 이를 주요부(MP)로부터 분리할 수 있는 방법으로 구성된다. 이를 위해, 자동 음성 인식 장치(7)의 단어는 특정 제어 단어(CW)를 포함하며, 이 제어 단어는 특정 구문 내에서 사용되는 경우, 오디오 메시지(AM)의 제어 정보부(CP)에 속하는 것으로 식별될 것이다.The automatic speech recognition device 7 is configured in such a way that it is possible to identify the control information part CP and to separate it from the main part MP. To this end, the word of the automatic speech recognition device 7 includes a specific control word CW, which, when used within a specific phrase, is identified as belonging to the control information part CP of the audio message AM. Will be.

이들 제어 단어(CW)는 수신 디바이스(2T) 내의 메모리 유닛(15)에 저장된다. 게다가, 이 메모리 유닛(15)은 또한 가능한 수신자일 수 있는 오디오 메시징 시스 템의 다양한 사용자의 별명과 같은, 식별자 문자열(IS)을 저장한다. 오디오 메시징 시스템(1) 내에 잠재적 수신자의 별명과 그들의 주소를 포함하는, 대응하는 "친구 목록"은, 전송 디바이스(2T)의 사용자에 의해 어셈블링될 수 있다. 이 목록은 전송 디바이스(2T) 내에 또는 예를 들어, 서비스 제공자의 서버 상에, 오디오 메시징 시스템(1)의 다른 위치에 저장될 수 있다. These control words CW are stored in the memory unit 15 in the receiving device 2 T. In addition, this memory unit 15 also stores an identifier string IS, such as aliases of various users of the audio messaging system, which may be possible recipients. The corresponding "friend list", including aliases of potential recipients and their addresses in the audio messaging system 1, can be assembled by the user of the transmitting device 2 T. This list can be stored in the transmitting device 2 T or at another location of the audio messaging system 1, for example on the server of the service provider.

도면에 도시된 예에서, 오디오 메시지(AM)의 주요부(MP)와 제어 정보부(CP) 모두는 자동 음성 인식 장치(7)에서 대화 제어 모듈(3)로 전달되며, 여기에서 예를 들어, 소프트웨어 루틴의 형태인, 해석 유닛(4)은 설치된다. 이러한 해석 유닛(4)은 또한 메모리(15) 내의 제어 단어(CW)와 식별자 문자열(IS)에 대한 액세스를 가지며, 그러므로, 오디오 메시징 시스템(1), 특히 전송 디바이스(2T)에 대한 대응 제어 신호를 생성하고, 이에 따라 오디오 메시징 시스템, 특히 전송 디바이스(2T)를 제어하기 위해 오디오 메시지(AM)의 제어 정보부(CP)를 해석할 수 있다. 제어 정보부(CP)가 명확히 식별가능하지 않은 경우, 대화 제어 유닛(3)은, 예를 들어, 프롬프트 생성기(9)가 적절한 프롬프트(예, "개인 메시지를 Carl에게 전송하시겠습니까?)를 발신자(US)에게 발행하도록 함으로써, 대화를 개시한다. 발신자(US)는 가정된 제어 헤더(CP)를 확인하기 위해 또는 잘못 검출된 제어 헤더(CP)의 경우의 절차를 종료하기 위해, 적절한 경우 단순히 "예" 또는 "아니오"로 답변할 수 있다.In the example shown in the figure, both the main part MP and the control information part CP of the audio message AM are transferred from the automatic speech recognition device 7 to the conversation control module 3, where, for example, software The analysis unit 4, which is in the form of a routine, is installed. This interpretation unit 4 also has access to the control word CW and the identifier string IS in the memory 15 and, therefore, the corresponding control for the audio messaging system 1, in particular the transmission device 2 T. It is possible to interpret the control information part CP of the audio message AM in order to generate a signal and thus control the audio messaging system, in particular the transmitting device 2 T. If the control information section CP is not clearly identifiable, the dialogue control unit 3 may, for example, prompt the generator 9 to send an appropriate prompt (eg, “Do you want to send a personal message to Carl?”). and, initiating a dialogue by having issued to S). caller (U S) is to shut down the process in the case of a control header (CP), a control header (CP to confirm or incorrectly detecting the home), simply, if appropriate You can answer "yes" or "no".

시스템이 제어 헤더가 올바르게 식별되었다는 것을 확인한 경우, 또는 사용 자가 다음의 대화를 통해, 가정된 제어 헤더를 확인한 경우, 오디오 헤더(CP)에 첨부된, 오디오 메시지(AM)의 주요부(MP)는 식별자 문자열(IS)에 의해 오디오 헤더(CP)에서 지정된 수신자(UR)에게 전송되며, 이전의 예의 경우에 이는 별명이 "Carl"인 사용자이다.If the system confirms that the control header has been correctly identified, or if the user has confirmed the assumed control header through the following dialogue, the main part (MP) of the audio message (AM) attached to the audio header (CP) is an identifier. It is sent by the string IS to the receiver U R specified in the audio header CP, which in the previous example is a user with the alias "Carl".

이를 위해, 대화 제어 유닛(3)은 주요부(MP)와 바람직하게 또한 제어 정보부(CP)를 메시지 송수신 애플리케이션(13)에 전달하며, 동시에 임의의 대응 제어 신호 상에서 전달하여서, 오디오 메시지(AM)는, 통신 네트워크(N)를 통해 별명이 "Carl"인 사용자의 수신 디바이스(2R)의 주소로 전송될 수 있다. 오디오 메시지(AM)의 제어 정보부(CP)와 주요부(MP)는 이후 통신 네트워크(N)에 연결된 네트워크 인터페이스(14)를 통해 수신 디바이스(2R)로 전송된다.For this purpose, the conversation control unit 3 delivers the main part MP and preferably also the control information part CP to the message transmission / reception application 13, and simultaneously on any corresponding control signal, so that the audio message AM , Via the communication network N, can be transmitted to the address of the receiving device 2 R of the user whose alias is "Carl". The control information part CP and the main part MP of the audio message AM are then transmitted to the receiving device 2 R via the network interface 14 connected to the communication network N.

전송 디바이스(2T) 내의 동작 시퀀스는 도 4의 흐름도에서 도시된다. 이 프로세스는 사용자 입력과 함께 단계 I에서 시작한다. 단계 II에서, 적절한 분석은 사용자 입력이 오디오 헤더(CP)를 포함하는지 여부를 결정하며, 이에 따라 다음 단계 III은 오디오 헤더의 모든 요구된 부분들이 존재하고 명백히 식별가능한지를 확인하기 위해 점검한다. 그렇지 않은 경우, 단계 IV는 대화를 개시하고, 즉 질문들이 사용자에게 던져지며 답변들은 오디오 헤더의 모든 요구된 부분들이 식별될 때까지 분석된다. 해석 오류의 일반적인 경우는 다음과 같이 발생할 수 있다:"Julie에게 도착한 개인 메시지: Ann, 오늘 점심시간에 만나자.". 이 메시지는 "Julie에게 도착한 개인 메시지"라는 오디오 헤더 및 "Ann, 오늘 점심시간에 만나자"라는 주요부 또는 "Julian에게 도착한 개인 메시지" 및 "오늘 점심시간에 만나자"라는 오디오 헤더를 제공하는 것으로 해석될 수 있다. 이 경우 시스템은 "Julian에게 개인 메시지를 전송하시겠습니까?"라고 프롬프팅할 수 있다. 발신자(US)는 "아니오, 개인 메시지를 Julie에게 전송하고자 합니다"라고 답할 수 있다. 여기서, 대답은 가능한 대안의 첫 번째를 지정함으로써 해석 오류를 분명히 한다. 단계 V에서, 오디오 본체, 즉 주요부(MP)는 오디오 헤더(CP)로부터 분리될 수 있다. 이후, 추가적 처리 단계는 대화 내에서 가능하다. 위의 예에서, 사용자는 추가적 정보가 오디오 메시지(AM)와 함께 전송되는지 여부, 즉 이미지 또는 비디오가 전송되어야 하는지 여부를 질문받는다. 다른 첨부는, 문서와 같은 오디오 메시지(AM)를 동등하게 수반할 수 있다. 사용자가 확인한 경우, 처리 단계 VII는 어떤 이미지 또는 비디오가 메시지에 첨부되어야 하는지를 결정할 수 있다. 단계 VI 내의 다른 프롬프트는 더 첨부되어야 하는 사진, 비디오 등이 있는지 여부를 질문할 수 있다. 일단 메시지가 완료되면, 단계 VIII는 메시지의 전송을 마무리한다. The sequence of operations in the transmitting device 2 T is shown in the flowchart of FIG. 4. This process begins in step I with user input. In stage II, an appropriate analysis determines whether the user input includes an audio header (CP), so that next stage III checks to see if all required portions of the audio header are present and clearly identifiable. Otherwise, step IV initiates the conversation, i.e. the questions are thrown to the user and the answers are analyzed until all required parts of the audio header are identified. A common case of misinterpretation can occur as follows: "Personal message to Julie: Ann, see you at lunch today.". This message may be interpreted as providing an audio header called "Personal message arrived at Julie" and an audio header "Ann, meet me at lunch today" or an audio header "personal message arrived at Julian" and "Meet at lunch today". Can be. In this case, the system might prompt, "Do you want to send a private message to Julian?" The sender U S may reply, "No, I want to send a personal message to Julie." Here, the answer clarifies the interpretation error by specifying the first of the possible alternatives. In step V, the audio body, ie the main part MP, can be separated from the audio header CP. Thereafter, further processing steps are possible within the conversation. In the above example, the user is asked whether additional information is sent with the audio message AM, ie whether an image or video should be sent. Other attachments may involve an audio message AM, such as a document. If confirmed by the user, processing step VII may determine which image or video should be attached to the message. Another prompt in step VI may ask whether there are pictures, videos, etc. that should be further attached. Once the message is complete, step VIII finishes sending the message.

수신 디바이스(2R)에서, 오디오 메시지(AM)의 제어 정보부(CP)와 주요부(MP)는 네트워크 인터페이스(14) 상에서 수신되며 디바이스 내의 메시지 전송 애플리케이션(13)에 의해 처리된다. 메시지의 출력은 대화 제어 유닛(3), 필요한 경우 프롬프트 생성기(9) 및 수신 디바이스(2R)의 사용자 인터페이스(10)의 스피커(12)뿐만 아니라 오디오 제어 유닛(8)으로 행해진다.In the receiving device 2 R , the control information part CP and the main part MP of the audio message AM are received on the network interface 14 and processed by the message transmission application 13 in the device. The output of the message is directed to the audio control unit 8 as well as the dialog control unit 3, if necessary the prompt generator 9 and the speaker 12 of the user interface 10 of the receiving device 2 R.

의도한 수신자(UR)가 방에 없거나, 그렇지 않으면 그 시간에 방에 있거나, 메시지의 내용의 수신인이 아닌 다른 사람과 함께 있는 경우 메시지의 출력을 회피하기 위해, 수신 디바이스(2R)는 미리 상황을 분석한다. 예를 들어, 이동가능한 사용자 인터페이스(도 2 참조)는 카메라(16)의 도움으로 전체 방을 스캐닝하기 위해 회전 고리로 돌릴 수 있다. 알려진 이미지 처리 기술을 사용하여, 의도한 수신자(UR)가 방에 있는지 여부가 결정될 수 있다. 의도한 수신자(UR)는 메모리에 저장된 다양한 식별자 문자열(IS)과 연관된 식별자 특성(IC)의 도움으로 식별될 수 있다.In order to avoid the output of the message if the intended recipient U R is not in the room, or if it is in the room at that time, or with someone other than the recipient of the content of the message, the receiving device 2 R may advance in advance. Analyze the situation. For example, a movable user interface (see FIG. 2) can be turned into a rotating ring to scan the entire room with the aid of camera 16. Using known image processing techniques, it may be determined whether the intended recipient U R is in the room. The intended recipient U R can be identified with the aid of the identifier characteristic IC associated with the various identifier strings IS stored in memory.

이를 위해, 메시지를 수반하는 식별자 문자열(IS)은 메모리(15)로부터 대응하는 식별자 특성(IC)을 검색하고 이들 식별자 특성(IC)을 사용하여 수신자(UR)를 식별하기 위해, 메시지 송수신 애플리케이션(12) 또는 수신 디바이스(2R)의 유사하게 적합한 모듈에 의해 사용된다. 식별자 특성(IC)은 방의 다른 사람들로부터 수신자(UR)를 식별하기 위한 이미지 처리에 사용된 생체 측정 데이터일 수 있다.To this end, the identifier string (IS) accompanying the message retrieves the corresponding identifier characteristics (IC) from the memory 15 and uses these identifier characteristics (IC) to identify the receiver U R , a message transceiving application. 12, or is used by analogy to the appropriate module of the receiving device (2 R). The identifier characteristic IC may be biometric data used in image processing to identify the recipient U R from others in the room.

동일하게, 화자 ID 특징은 적용될 수 있다. 이러한 경우, 예를 들어, 대화 제어 유닛(3)은, 오직 오디오 헤더(CT)-"Carl에게 도착한 개인 메시지"-만이 오디오 제어 유닛(8)과 수신 디바이스(2R)의 사용자 인터페이스(10)를 통해 출력되며, 첨부 메시지인 "지금 메시지를 청취하시겠습니까?"가 후속되며, 이는 프롬프트 생성기(9)가 생성한다는 것을 보장할 수 있다. 따라서 메시지를 받은 사용자가 대답할 때, 대답은 음성 인식 유닛(5)과 언어 이해 유닛에 의해 계속 분석될 수 있으 며, 동시에 화자 식별에 의해 유효성이 확인되며, 이에 따라 추출된 특성은, 적합한 사용자와 인증받은 수신자(UR)가 답변하고 있는지 여부를 결정하기 위해, 메모리(15) 내에서 정보 특성(IC)과 비교된다. Equally, the speaker ID feature can be applied. In this case, for example, the dialogue control unit 3 can only have the audio header CT-"Personal message arriving at Carl"-the user interface 10 of the audio control unit 8 and the receiving device 2 R. Is outputted, followed by an attachment message "Do you want to listen to the message now?", Which can ensure that the prompt generator 9 generates. Thus, when the user who receives the message responds, the answer can continue to be analyzed by the speech recognition unit 5 and the language understanding unit, and at the same time validated by the speaker identification, and the extracted feature is thus a suitable user. And an information characteristic IC in the memory 15 to determine whether or not the authorized recipient U R is answering.

게다가, 카메라(16)와 일반적인 이미지 처리 기술의 도움으로, 사용자가 다른 사용자와의 대화에 참여하는지 여부, 통화 중인지 여부, 또는 메시지를 수신하지 못하는 다른 상황에 처해 있는지 여부가 판정될 수 있다.In addition, with the help of the camera 16 and general image processing techniques, it may be determined whether the user is participating in a conversation with another user, whether he is on a call, or in other situations where he or she is not receiving a message.

수신자(UR)가 방에 없거나, 메시지(AM)를 수신할 수 없는 경우, 메시지는 버퍼링되고 나중에 출력된다. 수신자(UR)가 메시지를 혼자만 청취하고 싶다고 한 경우, 수신 디바이스(2R)는 또한 오디오 메시지(AM)를 버퍼링할 것이며 이를 수신자(UR)가 방에 다시 혼자 있을 때까지 또는 수신자(UR)가 예를 들어 헤드폰 등을 착용하여, 오디오 메시지(AM)를 개인적으로 청취할 수 있다는 것을 보장할 때까지 이를 재생하지 않을 것이다.If the receiver U R is not in the room or the message AM cannot be received, the message is buffered and output later. If the receiver U R wants to listen to the message alone, the receiving device 2 R will also buffer the audio message AM and this will be until the receiver U R is alone again in the room or the receiver U R ) will not play it until it is guaranteed to be able to listen to the audio message AM personally, for example by wearing headphones or the like.

수신 디바이스(2R)의 사용자 인터페이스(10)는 유리하게 수신 디바이스(2R)로 인식된, 메시지의 인증받은 수신자에게 그 전면 외관(17)을 제공하게 되는데, 즉, 수신 디바이스(2R)는 대화 프롬프트 또는 오디오 메시지(AM) 또는 오디오 메시지(AM)의 주요부를 출력할 때 직접 수신자(UR)와 마주보게 된다. 대화 시스템의 형태로 실현된, 수신 디바이스(2R) 또는 송수신 디바이스(2T)의 출력 또는 사용의 다 른 유리한 수단은 문헌 DE 102 49 060 A1에서 설명된다.The user interface 10 of the receiving device (2 R) is there is that to authorized recipient of the advantageously recognized to the receiving device (2 R), message service that the front facade (17), that is, the receiving device (2 R) Is directly facing the receiver U R when outputting a dialog prompt or the main part of an audio message AM or an audio message AM. Other advantageous means of output or use of the receiving device 2 R or the transmitting and receiving device 2 T , realized in the form of a dialogue system, are described in document DE 102 49 060 A1.

본 발명이 바람직한 실시예와 그 변형예의 형태로 개시되었지만, 수많은 추가적인 변형예와 변경예가 본 발명의 범주를 이탈하지 않고 이루어질 수 있음을 이해할 것이다. 특히, 전송 디바이스 및/또는 수신 디바이스는, 예를 들어, 전술한 것과 다른 아키텍처를 사용하여 구성될 수 있다.Although the invention has been disclosed in the form of preferred embodiments and variations thereof, it will be understood that numerous additional modifications and variations can be made without departing from the scope of the invention. In particular, the transmitting device and / or the receiving device may be configured using an architecture different from that described above, for example.

명확성을 위해, 또한 본 출원에서의 단수 요소는 복수 요소를 배제하지 않으며, "포함하다"는 다른 단계 또는 요소를 배제하지 않는다는 것을 이해할 것이다. "유닛"은 단일 개체로서 명시적으로 기술되지 않는 한은, 다수의 블록 또는 디바이스를 포함할 수 있다.For clarity, it will also be understood that singular elements in the present application do not exclude a plurality of elements and that “comprises” does not exclude other steps or elements. A "unit" may include a number of blocks or devices unless explicitly stated as a single entity.

본 발명은, 오디오 메시징 시스템을 통해 발신자로부터 수신자에게 오디오 메시지를 전송하는 방법 및 적절한 오디오 메시징 시스템에 관한 것으로서, 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 오디오 메시징 시스템 등에 이용가능하다.The present invention relates to a method for transmitting an audio message from a sender to a receiver via an audio messaging system and to an appropriate audio messaging system, comprising: audio messaging for transmitting an audio message (AM) from a sender (U S ) to a receiver (U R ). System and the like.

Claims (16)

오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법으로서, A method of transmitting an audio message (AM) from a sender (U S ) to a receiver (U R ) through an audio messaging system, - 전송 디바이스(2Γ)를 사용하여 발신자(US)의 오디오 메시지를 수집하는 단계;Collecting an audio message of the sender U S using the transmitting device 2 Γ ; - 메시지(AM)의 통신 사양과 관련된 제어 정보부(CP)와 수신자(UR)에게 전송될 유효 메시지를 포함하는 주요부(MP)를 검출하기 위한 오디오 메시지(AM)의 분석 단계로서, 오디오 메시지(AM)의 제어 정보부(CP)는 (특정) 오디오 메시지(AM)를 전송하기 위해 오디오 메시징 시스템(1)을 제어하기 위해 적어도 부분적으로 해석되는, 오디오 메시지(AM)의 분석 단계;Analysis of the audio message AM for detecting the main part MP including the control information CP related to the communication specification of the message AM and the valid message to be transmitted to the receiver U R , the audio message ( The control information section CP of the AM comprises an analysis step of the audio message AM, which is at least partly interpreted to control the audio messaging system 1 for transmitting the (specific) audio message AM; - 오디오 메시지(AM)의 적어도 주요부(MP)를 수신 디바이스(3)에 전송하는 단계;Sending at least the main part MP of the audio message AM to the receiving device 3; - 적어도 오디오 메시지(AM)의 주요부(MP)를 수신자(UR)에게 제공하는 단계Providing at least the principal part MP of the audio message AM to the receiver U R. 를 포함하는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.And transmitting the audio message (AM) from the sender (U S ) to the receiver (U R ) via the audio messaging system. 제 1항에 있어서, 오디오 메시지(AM)의 제어 정보부(CP)는 수신 디바이스(3) 로 적어도 부분적으로 전송되며 수신자(UR)에게 오디오 메시지(AM)를 제공하는 것을 제어하기 위해 해석되는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.The method according to claim 1, wherein the control information part CP of the audio message AM is at least partly transmitted to the receiving device 3 and interpreted to control providing the audio message AM to the receiver U R. A method of transmitting an audio message (AM) from a sender (U S ) to a receiver (U R ) via an audio messaging system. 제 1항 또는 제 2항에 있어서, 오디오 메시지(AM)의 제어 정보부(CP)는 수신자(UR)에게 적어도 부분적으로 제공되는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.The receiver U R from the sender U S via an audio messaging system according to claim 1, wherein the control information part CP of the audio message AM is at least partially provided to the receiver U R. To send an audio message (AM) to a user 제 1항 내지 제 3항 중 어느 한 항에 있어서, 오디오 메시지(AM)는 제어 정보부(CP)가 주요부(MP)에 대해 특정한 위치에서 위치되는 한정된 복합 구조로 구성되는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.The sender of any one of the preceding claims, wherein the audio message (AM) consists of a finite complex structure in which the control information part (CP) is located at a specific position with respect to the main part (MP). A method of sending an audio message (AM) from (U S ) to a receiver (U R ). 제 1항 내지 제 4항 중 어느 한 항에 있어서, 제어 정보부(CP)는 자동 음성 인식 기술을 사용함으로써 오디오 메시지에서 식별되는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.The control information unit (CP) according to any one of the preceding claims, wherein the control information unit (CP) is identified from the sender (U S ) to the receiver (U R ) via an audio messaging system, which is identified in the audio message by using an automatic speech recognition technique. How to send an audio message (AM). 제 5항에 있어서, 자동 음석 인식 장치(7)의 인지 결과의 모호성 값이 특정 모호성 제한에 도달하거나 이를 초과하는 경우, 오디오 메시징 시스템(1)과 발신자 간의 자동 대화는 오디오 메시지(AM)의 제어 정보부(CP)를 확인하기 위해 개시되는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.The automatic conversation between the audio messaging system 1 and the caller is controlled by the audio message AM when the ambiguity value of the recognition result of the automatic speech recognition device 7 reaches or exceeds a certain ambiguity limit. A method for transmitting an audio message (AM) from a sender (U S ) to a receiver (U R ) via an audio messaging system, which is initiated to identify an information unit (CP). 제 1항 내지 제 6항 중 어느 한 항에 있어서, 고유한 식별자 문자열(IS)은 오디오 메시징 시스템의 가능한 사용자 또는 사용자 그룹과 연관되며 오디오 메시지(AM)의 제어 정보부(CP)는 이러한 오디오 메시지(AM)의 수신자(UR)와 연관된 식별자 문자열(IS)을 포함하는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.7. A unique identifier string (IS) is associated with a possible user or group of users of an audio messaging system and the control information part (CP) of the audio message (AM) is connected to this audio message (7). how to transfer the receiver (U R) with the associated identifier string (IS) audio message (AM to the receiver (U R) from a sender (U S), through the audio messaging system comprising a) the AM). 제 1항 내지 제 7항에 있어서, 사용자 또는 사용자 그룹의 식별자 문자열(IS)은 사용자 또는 사용자 그룹 및/또는 사용자 그룹의 다른 구성원의 식별자 특성(IC)과 연관된, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.A caller (U) via an audio messaging system according to claim 1, wherein the identifier string (IS) of the user or user group is associated with an identifier characteristic (IC) of the user or user group and / or another member of the user group. A method of transmitting an audio message (AM) from S ) to a receiver (U R ). 제 8항에 있어서, 오디오 메시지(AM)의 인증된 수신자(UR)는 오디오 메시지의 주요부(MP)를 제공하기 전에 식별자 특성(IC)에 기초하여 식별되는, 오디오 메 시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.The method of claim 8, wherein the authorized recipient U R of the audio message AM is identified based on the identifier characteristic IC before providing the main part MP of the audio message. A method for transmitting an audio message (AM) from U S ) to a receiver U R. 제 8항 또는 제 9항에 있어서, 오디오 메시지(AM)의 발신자(US)는 식별자 특성(IC)에 기초하여 식별되는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.10. The sender U S of claim 8 or 9, wherein the sender U S of the audio message AM is identified based on the identifier characteristic IC from the sender U S to the receiver U R via an audio messaging system. How to send an audio message (AM). 제 1항 내지 제 10항에 있어서, 식별된 수신자(UR)가 현재 연관된 상황DL 자동적으로 분석되고 오디오 메시지(AM)는 상황에 따라 특정 형태 및/또는 특정 시간에 수신자(UR)에게 제공되는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.The method according to claims 1 to 10, wherein the identified receiver U R is automatically analyzed for the currently associated situation DL and the audio message AM is provided to the receiver U R at a particular form and / or at a specific time according to the situation. Transmitting an audio message (AM) from a sender (U S ) to a receiver (U R ) via an audio messaging system. 제 10항 또는 제 11항에 있어서, 오디오 메시징 시스템(1)과 수신자(UR) 간의 자동 대화는 수신자(UR)를 식별하기 위해 그리고/또는 현재 상황을 분석하기 위해 개시되는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.Audio messaging system according to claim 10 or 11, wherein an automatic conversation between the audio messaging system 1 and the receiver U R is initiated to identify the receiver U R and / or to analyze the current situation. To send an audio message (AM) from the sender (U S ) to the receiver (U R ) via. 제 1항 내지 제 12항 중 어느 한 항에 있어서, 오디오 메시지(AM)의 적어도 주요부(MP)는 메시지의 제공동안 수신지를 향하도록 지시된 자동적으로 지시가능한 전면 외관(17)을 포함하는 사용자 인터페이스(10) 상에서 수신자에게 제공되는, 오디오 메시징 시스템을 통해 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 방법.13. A user interface as claimed in any one of the preceding claims, wherein at least the main part (MP) of the audio message (AM) comprises an automatically directable front face (17) which is directed towards the destination during the presentation of the message. A method for transmitting an audio message (AM) from a sender (U S ) to a receiver (U R ) via an audio messaging system provided to the receiver on (10). 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 오디오 메시징 시스템(1)으로서,An audio messaging system (1) for transmitting an audio message (AM) from a sender (U S ) to a receiver (U R ), - 발신자(US)의 오디오 메시지(AM)를 수집하기 위해 사용자 인터페이스(10)를 구비한 전송 디바이스(2Γ);A sending device 2 Γ with a user interface 10 for collecting the audio message AM of the sender U S ; - 오디오 메시지(AM)의 통신 사양에 관한 제어 정보부(CP) 및 수신자(UR)에게 전송될 유효 메시지를 포함하는 주요부(MP)를 검출하기 위한 오디오 메시지를 분석하기 위한 메시지 분석 수단(7);-Message analyzing means (7) for analyzing an audio message for detecting a main portion (MP) including a control information portion (CP) relating to a communication specification of an audio message (AM) and a valid message to be transmitted to a receiver (U R ); ; - (특정) 오디오 메시지(AM)를 전송하기 위한 오디오 메시징 시스템(1)을 제어하기 위한 오디오 메시지(AM)의 제어 정보부(CP)를 적어도 부분적으로 해석하기 위한 해석 유닛(4);An interpretation unit 4 for at least partially interpreting the control information part CP of the audio message AM for controlling the audio messaging system 1 for transmitting the (specific) audio message AM; - 오디오 메시지(AM)의 적어도 주요부(MP)를 수신자(UR)에게 제공하기 위한 사용자 인터페이스(10)를 구비한 수신 디바이스(2R);A receiving device 2 R with a user interface 10 for providing at least the main part MP of an audio message AM to a receiver U R ; - 전송 디바이스(2Γ)로부터 수신 디바이스(2R)로 적어도 오디오 메시지(AM)의 주요부(MP)를 전송하기 위한 수단(13,13,N);Means (13,13, N) for transmitting at least the main part MP of the audio message AM from the transmitting device 2 Γ to the receiving device 2 R ; 를 포함하는, 발신자(US)로부터 수신자(UR)에게 오디오 메시지(AM)를 전송하는 오디오 메시징 시스템.An audio messaging system for transmitting an audio message (AM) from a sender (U S ) to a receiver (U R ). 제 14항에 따른 오디오 메시징 시스템(1)용 전송 디바이스(2Γ)로서,A transmission device 2 Γ for an audio messaging system 1 according to claim 14, - 발신자(US)의 오디오 메시지(AM)를 수집하기 위한 사용자 인터페이스(10),A user interface 10 for collecting the audio message AM of the sender U S , - 오디오 메시지의 통신 사양에 관한 제어 정보부(CP) 및 특정 수신자(UR)에게 전송될 유효 메시지를 포함하는 주요부(MP)를 검출하기 위한 오디오 메시지(AM)를 분석하기 위한 메시지 분석 수단(7),Message analyzing means (7) for analyzing an audio message (AM) for detecting a main portion (MP) including a control information (CP) relating to a communication specification of an audio message and a valid message to be transmitted to a specific receiver (U R ); ), - 오디오 메시지(AM)를 전송하기 위한 오디오 메시징 시스템(1)을 제어하기 위한 오디오 메시지(AM)의 제어 정보부(CP)를 적어도 부분적으로 해석하기 위한 해석 유닛(4),An interpretation unit 4 for at least partially interpreting the control information part CP of the audio message AM for controlling the audio messaging system 1 for transmitting the audio message AM, - 및 수신 디바이스(2R)로 오디오 메시지(AM)의 적어도 주요부(MP)를 전송하기 위한 전송 인터페이스(13,14)And a transmission interface 13, 14 for transmitting at least the main part MP of the audio message AM to the receiving device 2 R. 를 포함하는, 오디오 메시징 시스템(1)용 전송 디바이스.Comprising a transmission device for an audio messaging system (1). 제 14항에 따른 오디오 메시징 시스템을 위한 수신 디바이스(2R)로서, A receiving device 2 R for an audio messaging system according to claim 14, - 전송 디바이스(2R)에 의해 전송된 오디오 메시지(AM)를 수신하기 위한 수신 인터페이스(13,14)로서, 오디오 메시지(AM)는 오디오 메시지(AM)의 통신 사양에 관한 제어 정보부(CP) 및 특정 수신자(UR)에게 전송될 유효 메시지를 포함하는 주요부(MP)를 포함하는, 수신 인터페이스(13,14),Receiving interfaces 13, 14 for receiving audio messages AM transmitted by the transmitting device 2 R , the audio messages AM being control information part CP relating to a communication specification of the audio messages AM; And a receiving part 13, 14 comprising a main part MP containing a valid message to be sent to a specific receiver U R , - 오디오 메시지의 적어도 주요부를 수신자에게 제공하기 위한 사용자 인터페이스(10),A user interface 10 for providing at least the main part of the audio message to the recipient, - 및 오디오 메시지(AM)를 제공하기 위해 오디오 메시징 시스템(1)을 제어하기 위한 오디오 메시지(AM)의 제어 정보부(CP)를 적어도 부분적으로 해석하기 위한 해석 유닛(4)And an interpretation unit 4 for at least partially interpreting the control information part CP of the audio message AM for controlling the audio messaging system 1 for providing the audio message AM. 을 포함하는, 오디오 메시징 시스템을 위한 수신 디바이스.Comprising a receiving device for an audio messaging system.
KR1020067021037A 2004-04-13 2005-04-08 Method and system for sending an audio message KR20060133002A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04101495.2 2004-04-13
EP04101495 2004-04-13

Publications (1)

Publication Number Publication Date
KR20060133002A true KR20060133002A (en) 2006-12-22

Family

ID=34963001

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067021037A KR20060133002A (en) 2004-04-13 2005-04-08 Method and system for sending an audio message

Country Status (5)

Country Link
EP (1) EP1738277A1 (en)
JP (1) JP2007533236A (en)
KR (1) KR20060133002A (en)
CN (1) CN1943191A (en)
WO (1) WO2005101259A1 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69910412T2 (en) * 1998-09-30 2004-06-24 Lernout & Hauspie Speech Products N.V. VOICE CONTROLLED NAVIGATION FOR AN ELECTRONIC POST READER
US6938024B1 (en) * 2000-05-04 2005-08-30 Microsoft Corporation Transmitting information given constrained resources
US20020032591A1 (en) * 2000-09-08 2002-03-14 Agentai, Inc. Service request processing performed by artificial intelligence systems in conjunctiion with human intervention
EP1191752A1 (en) * 2000-09-26 2002-03-27 Daniel Gens Method and device for information exchange
JP2003308283A (en) * 2002-04-18 2003-10-31 Mitsubishi Electric Corp Communication apparatus, communicating method and on- vehicle navigation system
CN100357863C (en) * 2002-05-14 2007-12-26 皇家飞利浦电子股份有限公司 Dialog control for an electric apparatus

Also Published As

Publication number Publication date
WO2005101259A1 (en) 2005-10-27
EP1738277A1 (en) 2007-01-03
JP2007533236A (en) 2007-11-15
CN1943191A (en) 2007-04-04

Similar Documents

Publication Publication Date Title
US9948772B2 (en) Configurable phone with interactive voice response engine
US9485347B2 (en) Voice-operated interface for DTMF-controlled systems
US7305438B2 (en) Method and system for voice on demand private message chat
CA2648617C (en) Hosted voice recognition system for wireless devices
US7065186B1 (en) Telephone based access to instant messaging
US9154620B2 (en) Method and system of voice carry over for instant messaging relay services
JP6165321B2 (en) Apparatus and method
EP1695586B1 (en) Method and system for transmitting voice messages
AU2009202640A1 (en) Telephone for sending voice and text messages
US20080045256A1 (en) Eyes-free push-to-talk communication
US20220006893A1 (en) Systems and methods for cellular and landline text-to-audio and audio-to-text conversion
KR20060133002A (en) Method and system for sending an audio message
KR20040093510A (en) Method to transmit voice message using short message service
KR20020036009A (en) Method for transmitting and receiving sound data through network and computer-readable medium thereof
US20080086565A1 (en) Voice messaging feature provided for immediate electronic communications
CN113194021A (en) Electronic device, message playing control system and message playing control method
JP2005316849A (en) Personal digital assistant, chat system, text transmitting/receiving method and computer program
EP2150020A1 (en) Method for communicating, a related system for communicating and a related transforming part

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid