WO2001006742A1 - Procede et systeme de restitution sonore a effet spatial, et terminal de telephonie incorporant un tel systeme - Google Patents

Procede et systeme de restitution sonore a effet spatial, et terminal de telephonie incorporant un tel systeme Download PDF

Info

Publication number
WO2001006742A1
WO2001006742A1 PCT/FR2000/001996 FR0001996W WO0106742A1 WO 2001006742 A1 WO2001006742 A1 WO 2001006742A1 FR 0001996 W FR0001996 W FR 0001996W WO 0106742 A1 WO0106742 A1 WO 0106742A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
speakers
sound reproduction
carried out
sound
Prior art date
Application number
PCT/FR2000/001996
Other languages
English (en)
Inventor
Gaël RICHARD
Philip Lockwood
François CAPMAN
Jérôme Boudy
Original Assignee
Matra Nortel Communications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matra Nortel Communications filed Critical Matra Nortel Communications
Priority to AU64522/00A priority Critical patent/AU6452200A/en
Priority to EP00951648A priority patent/EP1195043A1/fr
Publication of WO2001006742A1 publication Critical patent/WO2001006742A1/fr

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • H04M3/569Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants using the instant speaker's algorithm

Definitions

  • the present invention relates to spatialization techniques for sound sources. It finds a particular non-exclusive application in the field of teleconferencing.
  • the listening comfort of the user is improved by producing an effect of locating the sound sources in space.
  • a teleconferencing system is organized in such a way that the speech signals coming from a source are accompanied by indications on the origin of this source or on its positioning, which the receiver uses to produce the effect of location (see for example US Patents 5,020,098 and 5,335,011). But in many cases, such indications are not available. For example, a telephone terminal receiving via ordinary telephone lines audio signals comprising contributions from several speakers will not be able to spatially separate these speakers by the above method.
  • Telephone systems using voice verification functions of the caller are also known, in order to authorize access to secure services.
  • the voice signature of the caller is compared with that recorded in a verification module (see US patents 5,623,539, 5,465,290 or 5,414,755).
  • Such verification is sometimes used to perform a function similar to that of a password (see US Patent 5,365,574 or 5,517,558).
  • An object of the present invention is to allow the spatialization of sound sources, without requiring specific information on the position of the sources.
  • the invention thus provides a method of sound reproduction from an input audio signal, in which the input signal is analyzed so as to discriminate between portions of the signal from different speakers, and a sound reproduction of at least some of the signal portions with a spatial effect depending on the result of the discrimination.
  • the method combines speaker discrimination techniques and audio spatialization techniques.
  • the separation between the different sources is carried out on the basis of the audio signal itself and not of a extrinsic information.
  • the spatial effects applied in the sound reproduction may possibly include effects other than the location of a source, such as for example effects of distance, reverberation or any other room effect.
  • the discrimination between the signal portions from the different speakers may in particular include an identification of a speaker from a set of determined speakers.
  • the sound reproduction of a portion of the signal is then accompanied by the presentation of an image of the identified speaker, which is advantageously positioned in a manner dependent on a direction of perception of the sound restored.
  • the directions of perception of sources are on the contrary arbitrary. They can optionally be defined by the user.
  • the method can be applied to the field of teleconferencing, the sound reproduction being carried out in a telephony terminal.
  • the analysis of the input signal can be carried out either in the same telephony terminal, or in a network for routing the input signal (for example at a PABX).
  • the process applications are not limited to teleconferencing. It can for example also be used in a car interior, to restore different sound sources in a three-dimensional space.
  • Source placement can be done for the same purpose as for teleconference application, but it can also be done for the purpose of placing in certain places sound sources containing priority or more important information or coming from different systems (navigation systems, telephone, radio, ).
  • the method is still applicable to guidance systems, road information, ...
  • Another aspect of the present invention relates to a sound reproduction system comprising means for analyzing an input audio signal, capable of discriminating between portions of the signal coming from different speakers, and reproduction means sound of some at least portions of the signal with a spatial effect depending on the result of the discrimination made by the analysis means.
  • this system is incorporated into a telephony terminal.
  • FIG. 1 is a block diagram of a teleconferencing system implementing the method according to the invention.
  • FIG. 2 is a block diagram of a sound reproduction system incorporated in a telephony terminal of the system of Figure 1.
  • a user Z is in communication with several distant speakers A, B, C, D.
  • Distant speakers can be located in the same place or in different places.
  • each of speakers A and B uses their own telephone terminal, while speakers C and D share the same terminal.
  • a public and / or private telecommunications network 5 connects user Z and his interlocutors A-D.
  • the audio signal S sent from the network 5 to the telephone terminal 6 of the user Z thus consists of a superposition of signal portions respectively from the speakers A-D.
  • the terminal 6 is capable of carrying out a sound reproduction with spatial effects depending on the distant speaker speaking.
  • the part of the telephone terminal 6 processing the received audio signal S is illustrated diagrammatically in FIG. 2.
  • a signal processing module 10 analyzes the audio signal S in order to discriminate which of the speakers AD is at the origin of the current signal portion .
  • the module 10 operates without prior knowledge on the different speakers. It can thus include a unit 20 which discriminates with a learning process as the various interlocutors A-D speak.
  • the learning does not require any prior vocal data, and can possibly be configured by the user Z.
  • the module 10 can also include a unit 21 which uses a database 22 making it possible to differentiate various categories of voice, and assign each portion of the audio signal S to one of these categories, for example according to a maximum likelihood criterion, in order to discriminate between the different speakers.
  • the module 10 can also include a unit 23 discriminating by identification of the remote speaker.
  • This unit 23 can in particular implement one of the methods conventionally used for the purpose of verifying the identity of a speaker (cf. for example US Patents 5,623,539, 5,465,290, 5,414,755, 5,365,574 and 5 517 558).
  • the identification module 10 has files stored in a memory 24, containing voice data representative of the different speakers in conference. Such files can be exchanged before communication, or be shared between different users of the same group.
  • the speaker discrimination information produced by the module 10 is sent to a module 12 which controls the sound reproduction by the terminal.
  • the terminal comprises for example several speakers 13.
  • the module 12 assigns a direction of perception of sound to each speaker discriminated by the module 10, and controls the speakers 13 so that the corresponding portion of the signal is perceived by user Z as coming from this direction.
  • module 12 can be used by module 12 in order to produce a spatial effect dependent on a simulated direction of perception of sound, for example the methods described in American patents 5,335,011 and 5,020,098 in teleconferencing applications, or also the method described in application WO94 / 10816.
  • the user can perceive portions of speech from different speakers but included in the same signal S as coming from different directions, as shown schematically in the figure. 1.
  • the telephone terminal 6 can be associated with means capable of presenting images of distant speakers AD, such as for example a display screen 15.
  • the display of these images is controlled by a module 16 of the terminal, from images stored in a memory 17.
  • the images stored in the memory 17 can be loaded before the start of the communication. They can also be transmitted by an audiovisual signal, and be generated by means of recording means associated with the telephone terminal 6, such as a camera.
  • the identification of the speaker can moreover be carried out on the basis of voice and visual data.
  • Different methods can be applied by the module 16 to control the display on the screen 15.
  • One possibility is to present on the screen 15 an image of each of the remote speakers A-D present in the communication.
  • the image of each of the AD speakers is then positioned in a way corresponding to the virtual positions of the sound sources generated by the playback module 12. This makes it possible to draw the attention of the user Z to the picture of speaker speaking.
  • Another possibility is to display the same image of the different speakers, and to indicate in a particular way (highlighting, change of color, ...) that of the speakers identified by the module 10.
  • Another possibility is to display only the image of the identified speaker.
  • the telephone terminal 6 can be an ordinary telephone associated with a unit comprising the signal processing 10 and sound reproduction modules with spatial effects 12, these modules 10, 12 typically operating on digital signals, for example using processors signal processing (DSP).
  • Terminal 6 can also be of the “webphone” type, or include a computer equipped with telephony software or software for controlling an external telephone. In the latter case, the screen 15 can be that of the computer, and the modules 10, 12, 16 relate to applications executed by the computer.
  • the module 10 which performs the analysis of the input audio signal S is not located in the telephone terminal, but in the network 5 which routes the signal S. It can in particular be placed in a PABX private which transmits with the audio signal S data indicating the discriminated speaker.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

On analyse un signal audio d'entrée (S) de manière à effectuer une discrimination entre des portions de signal issues de différents locuteurs (A-D), cette discrimination pouvant comporter une identification des locuteurs. On effectue une restitution sonore de certaines au moins des portions de signal avec un effet spatial dépendant du résultat de la discrimination.

Description

PROCEDE ET SYSTEME DE RESTITUTION SONORE A EFFET SPATIAL. ET TERMINAL DE TELEPHONIE INCORPORANT UN TEL SYSTEME
La présente invention concerne les techniques de spatialisation de sources sonores. Elle trouve une application particulière, non exclusive, dans le domaine de la téléconférence.
Dans certains systèmes de téléconférence, le confort d'écoute de l'utilisateur est amélioré en produisant un effet de localisation des sources sonores dans l'espace. En général, un tel système de téléconférence est organisé de telle sorte que les signaux de phonie issus d'une source sont accompagnés d'indications sur l'origine de cette source ou sur son positionnement, que le récepteur utilise pour produire l'effet de localisation (voir par exemple les brevets US 5 020 098 et 5 335 011 ). Mais dans de nombreux cas, de telles indications ne sont pas disponibles. Par exemple, un terminal téléphonique recevant par des lignes téléphoniques ordinaires des signaux audio comportant des contributions de plusieurs locuteurs ne pourra pas séparer spatialement ces locuteurs par la méthode ci-dessus.
On connaît d'autre part des systèmes téléphoniques utilisant des fonctions de vérification vocale de l'appelant, dans le but d'autoriser l'accès à des services sécurisés. Pour cela, la signature vocale de l'appelant est confrontée avec celle enregistrée dans un module de vérification (voir brevets US 5623 539, 5465290 ou 5414755). Une telle vérification est parfois utilisée pour accomplir une fonction analogue à celle d'un mot de passe (voir brevet américain 5 365 574 ou 5 517 558).
Un but de la présente invention est de permettre de spatialiser des sources sonores, sans requérir d'information spécifique sur la position des sources.
L'invention propose ainsi un procédé de restitution sonore à partir d'un signal audio d'entrée, dans lequel on analyse le signal d'entrée de manière à effectuer une discrimination entre des portions de signal issues de différents locuteurs, et on effectue une restitution sonore de certaines au moins des portions de signal avec un effet spatial dépendant du résultat de la discrimination.
Le procédé associe des techniques de discrimination de locuteurs et des techniques de spatialisation audio. La séparation entre les différentes sources est effectuée sur la base du signal audio lui-même et non d'une information extrinsèque.
On peut ainsi améliorer l'ergonomie de la restitution sonore d'un simple signal audio, en plaçant virtuellement les sources représentées par les différents locuteurs dans un espace sonore tridimensionnel. Les effets spatiaux appliqués dans la restitution sonore peuvent éventuellement comprendre des effets autres que la localisation d'une source, comme par exemple des effets de distance, de réverbération ou tout autre effet de salle.
La discrimination entre les portions de signal issues des différents locuteurs peut notamment comporter une identification d'un locuteur parmi un ensemble de locuteurs déterminés. Dans une application audiovisuelle, la restitution sonore d'une portion de signal est alors accompagnée par la présentation d'une image du locuteur identifié, qui est avantageusement positionnée de manière dépendante d'une direction de perception du son restitué. On peut ainsi former une sorte de salle de conférence virtuelle. II est à noter que le procédé n'a pas à reproduire les places exactes des locuteurs distants. Les directions de perception des sources sont au contraire arbitraires. Elles peuvent éventuellement être définies par l'utilisateur.
Le procédé peut s'appliquer au domaine de la téléconférence, la restitution sonore étant effectuée dans un terminal de téléphonie. L'analyse du signal d'entrée peut être effectuée soit dans le même terminal de téléphonie, soit dans un réseau d'acheminement du signal d'entrée (par exemple au niveau d'un autocommutateur).
Les applications du procédé ne sont pas limitées à la téléconférence. On peut par exemple l'utiliser également dans un habitacle d'automobile, pour restituer différentes sources sonores dans un espace tridimensionnel. Le placement des sources peut être fait dans le même but que dans le cas de l'application à la téléconférence, mais il peut aussi être fait dans le but de placer à certains endroits des sources sonores contenant des informations prioritaires ou plus importantes ou provenant de système différents (systèmes de navigation, téléphone, autoradio, ... ).
Le procédé est encore applicable à des systèmes de guidage, d'information routière, ...
Un autre aspect de la présente invention se rapporte à un système de restitution sonore comprenant des moyens d'analyse d'un signal audio d'entrée, propres à effectuer une discrimination entre des portions de signal issues de différents locuteurs, et des moyens de restitution sonore de certaines au moins des portions de signal avec un effet spatial dépendant du résultat de la discrimination effectuée par les moyens d'analyse. Dans une application particulière, ce système est incorporé dans un terminal de téléphonie.
D'autres particularités et avantages de la présente invention apparaîtront dans la description ci-après d'exemples de réalisation non limitatifs, en référence aux dessins annexés, dans lesquels :
- la figure 1 est un schéma de principe d'un système de téléconférence mettant en œuvre le procédé selon l'invention ; et
- la figure 2 est un schéma synoptique d'un système de restitution sonore incorporé dans un terminal de téléphonie du système de la figure 1.
Dans la téléconférence illustrée schématiquement par la figure 1 , un utilisateur Z est en communication avec plusieurs locuteurs distants A, B, C, D.
Les locuteurs distants peuvent être situés au même endroit ou à des endroits différents. Dans l'exemple dessiné, chacun des locuteurs A et B utilise un terminal téléphonique propre, alors que les locuteurs C et D partagent le même terminal.
Un réseau public et/ou privé de télécommunications 5 met en communication l'utilisateur Z et ses interlocuteurs A-D. Le signal audio S envoyé du réseau 5 vers le terminal téléphonique 6 de l'utilisateur Z se compose ainsi d'une superposition de portions de signal respectivement issues des locuteurs A-D.
A partir de ce signal audio unique, le terminal 6 est capable de procéder à une restitution sonore avec des effets spatiaux dépendant du locuteur distant en train de parler. La partie du terminal téléphonique 6 traitant le signal audio reçu S est illustrée schématiquement sur la figure 2. Un module de traitement de signal 10 analyse le signal audio S afin de discriminer lequel des locuteurs A-D est à l'origine de la portion de signal courante.
Dans un mode de réalisation préféré de l'invention, le module 10 fonctionne sans connaissance a priori sur les différents locuteurs. Il peut ainsi comporter une unité 20 qui effectue une discrimination avec un processus d'apprentissage à mesure que les différents interlocuteurs A-D parlent.
L'apprentissage ne nécessite aucune donnée vocale préalable, et peut éventuellement être paramétré par l'utilisateur Z. Le module 10 peut aussi comporter une unité 21 qui utilise une base de données 22 permettant de différencier diverses catégories de voix, et affecte chaque portion du signal audio S à l'une de ces catégories, par exemple selon un critère de maximum de vraisemblance, afin de discriminer entre les différents locuteurs.
Comme indiqué sur la figure 2, le module 10 peut encore comporter une unité 23 procédant à une discrimination par identification du locuteur distant. Cette unité 23 peut notamment mettre en œuvre l'une des méthodes utilisées classiquement à des fins de vérification d'identité d'un locuteur (cf. par exemple brevets US 5 623 539, 5 465 290, 5414 755, 5 365 574 et 5 517 558). Dans ce cas, le module d'identification 10 dispose de fichiers stockés dans une mémoire 24, contenant des données vocales représentatives des différents locuteurs en conférence. De tels fichiers peuvent être échangés préalablement à la communication, ou être partagés entre différents utilisateurs d'un même groupe.
L'information de discrimination du locuteur produite par le module 10 est adressée à un module 12 qui contrôle la restitution sonore par le terminal. Afin d'inclure des effets spatiaux dans cette restitution, le terminal comprend par exemple plusieurs haut-parleurs 13. Le module 12 affecte une direction de perception du son à chaque locuteur discriminé par le module 10, et commande les haut-parleurs 13 de façon que la portion du signal correspondante soit perçue par l'utilisateur Z comme provenant de cette direction.
Diverses méthodes classiques peuvent être employées par le module 12 afin de produire un effet spatial dépendant d'une direction simulée de perception du son, par exemple les méthodes décrites dans les brevets américains 5 335 011 et 5 020 098 dans des applications de téléconférence, ou encore la méthode décrite dans la demande WO94/10816.
Grâce au procédé combinant la discrimination du locuteur et la spatialisation appliquée à la restitution sonore, l'utilisateur peut percevoir des portions de parole issues de différents locuteurs mais comprises dans un même signal S comme provenant de différentes directions, comme l'illustre schématiquement la figure 1.
Notamment lorsque le module de traitement de signal 10 effectue une identification de locuteur, le terminal téléphonique 6 peut être associé à des moyens aptes à présenter des images des locuteurs distants A-D, comme par exemple un écran d'affichage 15. L'affichage de ces images est commandé par un module 16 du terminal, à partir d'images stockées dans une mémoire 17. Comme les données vocales contenues dans la mémoire 24, les images stockées dans la mémoire 17 peuvent être chargées avant le début de la communication. Elles peuvent aussi être transmises par un signal audiovisuel, et être générées par l'intermédiaire de moyens d'enregistrement associés au terminal téléphonique 6, tels qu'une caméra. Dans le cas où le signal S est un signal audiovisuel, l'identification du locuteur peut de plus être effectuée à partir des données vocales et visuelles.
Différentes méthodes peuvent être appliquées par le module 16 pour commander l'affichage sur l'écran 15. Une possibilité est de présenter sur l'écran 15 une image de chacun des locuteurs distants A-D présents dans la communication. De façon avantageuse, l'image de chacun des locuteurs A-D est alors positionnée d'une façon correspondant aux positions virtuelles des sources sonores générées par le module de restitution 12. Ceci permet d'attirer l'attention de l'utilisateur Z sur l'image du locuteur en train de parler. Un autre possibilité est d'afficher la même image des différents locuteurs, et de signaler de façon particulière (surbrillance, changement de couleur, ...) celui des locuteurs identifié par le module 10. Une autre possibilité encore est de n'afficher que l'image du locuteur identifié.
Le terminal téléphonique 6 peut être un téléphone ordinaire associé à une unité comportant les modules de traitement de signal 10 et de restitution sonore avec effets spatiaux 12, ces modules 10,12 fonctionnant typiquement sur des signaux numériques, par exemple à l'aide de processeurs de traitement de signal (DSP). Le terminal 6 peut encore être de type « webphone », ou comprendre un ordinateur équipé de logiciels de téléphonie ou de logiciels pour la commande d'un téléphone externe. Dans ce dernier cas, l'écran 15 peut être celui de l'ordinateur, et les modules 10, 12, 16 relèvent d'applications exécutées par l'ordinateur.
Dans une variante de réalisation, le module 10 qui effectue l'analyse du signal audio d'entrée S n'est pas situé dans le terminal téléphonique, mais dans le réseau 5 qui achemine le signal S. Il peut notamment être placé dans un autocommutateur privé qui transmet avec le signal audio S des données indiquant le locuteur discriminé.
Le procédé selon l'invention a été décrit ci-dessus dans son application à la téléconférence. On notera qu'il peut être prévu dans d'autres contextes, en particulier dans un véhicule.

Claims

R E V E N D I C A T I O N S
1. Procédé de restitution sonore à partir d'un signal audio d'entrée (S), caractérisé en ce qu'on analyse le signal d'entrée de manière à effectuer une discrimination entre des portions de signal issues de différents locuteurs (A-D), et on effectue une restitution sonore de certaines au moins des portions de signal avec un effet spatial dépendant du résultat de la discrimination.
2. Procédé selon la revendication 1 , dans lequel la discrimination comporte une identification de locuteur.
3. Procédé selon la revendication 2, dans lequel ladite identification s'effectue parmi un ensemble de locuteurs (A-D).
4. Procédé selon la revendication 2 ou 3, dans lequel la restitution sonore d'au moins une portion de signal est accompagnée par la présentation d'une image d'un locuteur identifié.
5. Procédé selon la revendication 4, dans lequel ladite image du locuteur identifié est positionnée de manière dépendante d'une direction de perception du son restitué.
6. Procédé selon l'une quelconque des revendications 1 à 5, dans lequel l'analyse du signal d'entrée (S) et la restitution sonore sont effectuées dans un terminal de téléphonie (6).
7. Procédé selon l'une quelconque des revendications 1 à 5, dans lequel la restitution sonore est effectuée dans un terminal de téléphonie (6), et l'analyse du signal d'entrée (S) est effectuée dans un réseau d'acheminement du signal d'entrée (5).
8. Système de restitution sonore, caractérisé en ce qu'il comprend des moyens (10) d'analyse d'un signal audio d'entrée (S), propres à effectuer une discrimination entre des portions de signal issues de différents locuteurs (A-D), et des moyens (12, 13) de restitution sonore de certaines au moins des portions de signal avec un effet spatial dépendant du résultat de la discrimination effectuée par les moyens d'analyse.
9. Système selon la revendication 8, dans lequel la discrimination effectuée par les moyens d'analyse (10, 23) comporte une identification de locuteur.
10. Système selon la revendication 9, dans lequel ladite identification s'effectue parmi un ensemble de locuteurs (A-D).
11. Système selon la revendication 9 ou 10, comprenant en outre des moyens (15, 16) de présentation d'une image d'un locuteur identifié en relation avec une portion de signal, positionnée de manière dépendante d'une direction de perception du son restitué.
12. Terminal de téléphonie (6), incorporant un système de restitution sonore selon l'une quelconque des revendications 8 à 11.
PCT/FR2000/001996 1999-07-16 2000-07-11 Procede et systeme de restitution sonore a effet spatial, et terminal de telephonie incorporant un tel systeme WO2001006742A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
AU64522/00A AU6452200A (en) 1999-07-16 2000-07-11 Sound retrieval system with spatial effect, and telephone terminal incorporatingsame
EP00951648A EP1195043A1 (fr) 1999-07-16 2000-07-11 Procede et systeme de restitution sonore a effet spatial, et terminal de telephonie incorporant un tel systeme

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9909243A FR2797132B1 (fr) 1999-07-16 1999-07-16 Procede et systeme de restitution sonore a effet spatial, et terminal de telephone incorporant un tel systeme
FR99/09243 1999-07-16

Publications (1)

Publication Number Publication Date
WO2001006742A1 true WO2001006742A1 (fr) 2001-01-25

Family

ID=9548178

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2000/001996 WO2001006742A1 (fr) 1999-07-16 2000-07-11 Procede et systeme de restitution sonore a effet spatial, et terminal de telephonie incorporant un tel systeme

Country Status (4)

Country Link
EP (1) EP1195043A1 (fr)
AU (1) AU6452200A (fr)
FR (1) FR2797132B1 (fr)
WO (1) WO2001006742A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9961208B2 (en) 2012-03-23 2018-05-01 Dolby Laboratories Licensing Corporation Schemes for emphasizing talkers in a 2D or 3D conference scene

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5020098A (en) * 1989-11-03 1991-05-28 At&T Bell Laboratories Telephone conferencing arrangement
GB2303516A (en) * 1995-07-20 1997-02-19 Plessey Telecomm Teleconferencing

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2271745A1 (fr) * 1997-10-01 1999-04-08 Pierre David Wellner Procede et appareil permettant de stocker et d'extraire des donnees d'intervalles etiquetees pour des enregistrements multimedia

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5020098A (en) * 1989-11-03 1991-05-28 At&T Bell Laboratories Telephone conferencing arrangement
GB2303516A (en) * 1995-07-20 1997-02-19 Plessey Telecomm Teleconferencing

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
See also references of EP1195043A1 *
SHOJI SHIMADA ET AL: "A NEW TALKER LOCATION RECOGNITION THROUGH SOUND IMAGE LOCALIZATION CONTROL IN MULTIPOINT TELECONFERENCES SYSTEM", ELECTRONICS & COMMUNICATIONS IN JAPAN, PART I - COMMUNICATIONS,US,SCRIPTA TECHNICA. NEW YORK, vol. 72, no. 2, 1 February 1989 (1989-02-01), pages 20 - 27, XP000124912, ISSN: 8756-6621 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9961208B2 (en) 2012-03-23 2018-05-01 Dolby Laboratories Licensing Corporation Schemes for emphasizing talkers in a 2D or 3D conference scene

Also Published As

Publication number Publication date
FR2797132B1 (fr) 2001-10-05
EP1195043A1 (fr) 2002-04-10
AU6452200A (en) 2001-02-05
FR2797132A1 (fr) 2001-02-02

Similar Documents

Publication Publication Date Title
US20070263823A1 (en) Automatic participant placement in conferencing
EP3158719B1 (fr) Procede et systeme de filtrage d'appels telephoniques entrants indesirables
US9083822B1 (en) Speaker position identification and user interface for its representation
US8249233B2 (en) Apparatus and system for representation of voices of participants to a conference call
CN110113316B (zh) 会议接入方法、装置、设备及计算机可读存储介质
FR3059191B1 (fr) Dispositif a casque audio perfectionne
US11432086B2 (en) Centrally controlling communication at a venue
FR3071689A1 (fr) Presentation de communications
EP2009892A1 (fr) Positionnement de locuteurs en conférence audio 3D
CN110544532A (zh) 一种基于app的声源空间定位能力检测系统
WO2020231883A1 (fr) Séparation et rendu de signaux vocaux et d'ambiance
EP2009891B1 (fr) Transmission de signal audio dans un système de conférence audio immersive
WO2020017284A1 (fr) Haut-parleur de collecte de sons, son procédé et programme
EP3412036B1 (fr) Procédé d'aide au suivi d'une conversation pour personne malentendante
WO2001006742A1 (fr) Procede et systeme de restitution sonore a effet spatial, et terminal de telephonie incorporant un tel systeme
EP3149968A1 (fr) Procédé d'aide au suivi d'une conversation pour personne malentendante
CN116057928A (zh) 信息处理装置、信息处理终端、信息处理方法和程序
EP3434002B1 (fr) Procede et dispositif de commande d'un systeme d'intercommunication
WO2023249786A1 (fr) Téléconférence distribuée utilisant des modèles d'amélioration personnalisés
EP3828886A1 (fr) Procede et systeme pour separer dans un flux audio la composante voix et la composante bruit
FR3069124A1 (fr) Identification de recepteur telephonique

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CR CU CZ DE DK DM DZ EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT TZ UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2000951648

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2000951648

Country of ref document: EP

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Ref document number: 2000951648

Country of ref document: EP