RU2426247C2 - Система, способ и многоточечный блок управления для реализации многоязычной конференцсвязи - Google Patents

Система, способ и многоточечный блок управления для реализации многоязычной конференцсвязи Download PDF

Info

Publication number
RU2426247C2
RU2426247C2 RU2009116477/09A RU2009116477A RU2426247C2 RU 2426247 C2 RU2426247 C2 RU 2426247C2 RU 2009116477/09 A RU2009116477/09 A RU 2009116477/09A RU 2009116477 A RU2009116477 A RU 2009116477A RU 2426247 C2 RU2426247 C2 RU 2426247C2
Authority
RU
Russia
Prior art keywords
conference
audio data
control unit
language
terminals
Prior art date
Application number
RU2009116477/09A
Other languages
English (en)
Other versions
RU2009116477A (ru
Inventor
Чжихой ЛЮ (CN)
Чжихой ЛЮ
Чжунхой ЮЭ (CN)
Чжунхой ЮЭ
Original Assignee
Хуавэй Текнолоджиз Ко., Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Хуавэй Текнолоджиз Ко., Лтд. filed Critical Хуавэй Текнолоджиз Ко., Лтд.
Publication of RU2009116477A publication Critical patent/RU2009116477A/ru
Application granted granted Critical
Publication of RU2426247C2 publication Critical patent/RU2426247C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/20Aspects of automatic or semi-automatic exchanges related to features of supplementary services
    • H04M2203/2061Language aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Machine Translation (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Abstract

Изобретение относится к области связи, и в частности к системе для реализации многоязычной конференцсвязи. Техническим результатом является собственно создание системы реализации многоязычной конференцсвязи, в которой каждый из сайтов конференцсвязи использует только выбранный язык для участия в конференции с небольшими ресурсами перевода в многоязычной системе многоточечной конференцсвязи. Система включает в себя терминалы конференцсвязи (ТКС) и многоточечный блок управления (МБУ). ТКС способны передавать речь сайта конференцсвязи после обработки на МБУ, обрабатывать аудиоданные, принятые от МБУ, и выводить их. По меньшей мере, один из ТКС является терминалом перевода, способным переводить речь сайта конференцсвязи согласно аудиоданным, переданным с МБУ, обрабатывать переведенные аудиоданные и передавать обработанные аудиоданные на МБУ, при этом МБУ осуществляет процесс микширования звука для аудиоданных от ТКС на разных звуковых каналах согласно типам языка и затем передает аудиоданные после процесса микширования звука на ТКС. 3 н. и 10 з.п. ф-лы, 16 ил.

Description

Перекрестная ссылка на родственные заявки
Данная заявка притязает на приоритет международной патентной заявки № PCT/CN2007/070835, поданной 29 сентября 2007 г., которая притязает на приоритет китайской патентной заявки № 200610063017.7, поданной 30 сентября 2006 г.
Область техники
Настоящее изобретение относится к области технологии связи, и в частности к системе, способу и многоточечному блоку управления для реализации многоязычной конференцсвязи.
Уровень техники
В последние годы, с развитием технологий связи, видеоконференция находит все более широкое применение. Под видеоконференцией в общем случае можно понимать службу телевизионной конференцсвязи. Посредством мультимедийной связи конференцсвязь поддерживается с использованием телевизионного оборудования и сетей связи для реализации взаимодействия изображений, речевых сигналов и данных одновременно между двумя или более местами. Согласно фиг. 1 видеоконференция обычно состоит из видеотерминалов (т.е. терминалов конференцсвязи), сети связи и многоточечного блока управления (MCU).
Оборудование видеотерминала в основном включает в себя оборудование ввода/вывода видеосигнала, оборудование ввода/вывода аудиосигнала, видеокодек, аудиокодек, оборудование передачи информации и оборудование мультиплексирования/распределения сигнала и т.д. Основной функцией видеотерминалов является осуществление кодирования со сжатием сигналов изображения, производимых локальными камерами, звуковых сигналов, выдаваемых микрофонами, и передачи сигналов на удаленный сайт конференцсвязи через сеть связи. В то же время видеотерминалы принимают сигналы с удаленного сайта конференцсвязи, преобразуют сигналы в аналоговые изображения и звуковые сигналы после декодирования. Обработка аудиосигналов показана на фиг. 2, и ее описание приведено ниже.
Для формирования полной системы телевизионной конференцсвязи оборудование видеотерминалов и MCU должны быть соединены друг с другом сетью связи, и каналы связи могут иметь вид оптических волокон, электрических кабелей, микроволн или спутников.
MCU является управляющим ядром видеоконференции. Когда количество терминалов конференцсвязи, участвующих в конференции, больше двух, необходимо управление посредством MCU. Все терминалы конференцсвязи должны быть подключены к MCU через стандартные интерфейсы. MCU реализован согласно таким протоколам, как международный стандарт H.221 и H.245. MCU, в основном призван осуществлять микширование и обмен изображениями и речевыми сигналами и осуществлять управление всеми сайтами конференцсвязи.
MCU обрабатывает аудиоданные для реализации микширования звука сайтов многоточечной конференцсвязи, и сайты конференцсвязи, участвующие в микшировании звука, являются сайтами конференцсвязи с более высокой громкостью среди сайтов многоточечной конференцсвязи. Если реализовано трехточечное микширование звука, сайты конференцсвязи, участвующие в микшировании звука, представляют собой три сайта конференцсвязи с наибольшей громкостью среди сайтов многоточечной конференцсвязи. Политика микширования звука осуществляется следующим образом.
1) Когда речь звучит на одном сайте конференцсвязи, диктор на своем сайте конференцсвязи не может слышать свой собственный голос, а участники на всех остальных сайтах конференцсвязи могут слышать голос говорящего сайта конференцсвязи.
2) Когда речь звучит на двух сайтах конференцсвязи, оба диктора на говорящих сайтах конференцсвязи могут слышать голоса друг друга, но не могут слышать свои собственные голоса, а участники на всех остальных сайтах конференцсвязи могут одновременно слышать голоса двух говорящих сайтов конференцсвязи.
3) Когда речь звучит на трех или более сайтах конференцсвязи, три сайта конференцсвязи с наибольшей громкостью участвуют в микшировании звука. Согласно фиг. 3 T1, T2, T3 - это три сайта конференцсвязи с наибольшей громкостью звука среди текущих сайтов конференцсвязи, диктор на любом из трех сайтов конференцсвязи может слышать голос двух других сайтов конференцсвязи, например диктор на сайте конференцсвязи T1 может слышать голос сайтов конференцсвязи T2 и T3, и дикторы на всех остальных сайтах конференцсвязи могут одновременно слышать голоса трех сайтов конференцсвязи.
Когда конференция поддерживается с использованием современной видеосистемы конференцсвязи, обработка звука системой конференцсвязи показана на фиг. 2. Данные говорящего сайта конференцсвязи поступают на MCU после кодирования, MCU осуществляет процесс микширования звука на звуковых данных говорящего сайта конференцсвязи и передает обработанные звуковые данные на терминалы конференцсвязи, и участники на других терминалах может слышать звук говорящего сайта конференцсвязи после декодирования звуковых данных. В современных видеосистемах конференцсвязи MCU и видеотерминал обрабатывают звуковые данные определенного сайта конференцсвязи в виде одного потока данных. Когда только один язык используется во всей системе конференцсвязи, общение между множественными сайтами конференцсвязи может осуществляться беспрепятственно. Но когда два или более языка используются во всей системе конференцсвязи, могут возникать языковые препятствия между участниками. В отношении этой проблемы уровень техники имеет следующие два решения. В нижеследующем описании, в порядке примера, рассмотрен случай конференции с микшированием китайского и английского языков и рассмотрен случай, когда говорят участники на одном из множественных сайтов конференцсвязи.
Первый способ состоит в том, что все остальные китайские сайты конференцсвязи снабжены своими собственными переводчиками, соответственно для перевода с английского на китайский для своих собственных сайтов конференцсвязи для обеспечения понимания содержания речи вышеописанного английского сайта конференцсвязи. В результате, если масштаб конференции достаточно велик, требуется большое количество переводчиков, что приводит к разрастанию персонала. Кроме того, когда переводчик на каждом китайском сайте конференцсвязи переводит, микрофон доставляет переведенные данные на другие сайты конференцсвязи, из-за чего сцена может быть хаотической и не осуществимой в реальности. Если микрофон не предназначен для доставки переведенных данных на другие сайты конференцсвязи, говорящий сайт конференцсвязи не знает, выполнен ли перевод на китайских сайтах конференцсвязи, и не может контролировать свою собственную скорость речи, что приводит к низкому качеству конференции в целом.
Второй способ состоит в том, что сайт конференцсвязи назначается в качестве выделенного терминала перевода для перевода речи сайтов конференцсвязи, участвующих в микшировании звука. Однако решение имеет и недостатки. Если на сайте конференцсвязи говорят по-английски и терминал перевода переводит с английского на китайский, участники на каждом из сайтов конференцсвязи могут слышать сначала английскую речь, а затем китайскую речь. Однако фактически участникам на китайских сайтах конференцсвязи не нужно слышать английскую речь, и участникам на английских сайтах конференцсвязи также не нужно слышать переведенную китайскую речь. В результате участникам приходится слышать много бесполезной информации. Китайский и английский смешиваются, что приводит к беспорядку на конференции, из-за чего участники быстро устают. Кроме того, перевод может замедлять темп конференции и снижать ее эффективность.
В случае когда участники конференции говорят на трех или более языках и разноязычная речь одновременно звучит на множественных сайтах конференцсвязи, вышеописанные два решения приводят к снижению качества конференции и не применимы к эффекту микширования звука.
Сущность изобретения
Ввиду вышесказанного варианты осуществления настоящего изобретения предусматривают систему, способ и многоточечный блок управления для реализации многоязычной конференцсвязи, благодаря которым каждый из сайтов конференцсвязи использует только выбранный язык для участия в конференции с небольшими ресурсами перевода в многоязычной системе многоточечной конференцсвязи.
Вариант осуществления настоящего изобретения предусматривает систему для реализации многоязычной конференцсвязи, которая включает в себя терминалы конференцсвязи и многоточечный блок управления.
Терминалы конференцсвязи способны передавать речь сайта конференцсвязи после обработки на многоточечный блок управления, обрабатывать аудиоданные, принятые от многоточечного блока управления, и выводить обработанные аудиоданные. По меньшей мере, один из терминалов конференцсвязи является терминалом перевода, способным переводить речь сайта конференцсвязи согласно аудиоданным, переданным с многоточечного блока управления, обрабатывать переведенные аудиоданные и передавать обработанные аудиоданные на многоточечный блок управления.
Многоточечный блок управления способен осуществлять процесс микширования звука для аудиоданных от терминалов конференцсвязи на разных звуковых каналах согласно типам языка и передавать аудиоданные после процесса микширования звука на терминалы конференцсвязи, которым соответствующим образом назначены языки, причем аудиоданные на одном языке обрабатывают в одном звуковом канале.
Вариант осуществления настоящего изобретения предусматривает способ реализации многоязычной конференцсвязи, который включает в себя следующие этапы.
Многоточечный блок управления принимает аудиоданные, переданные с каждого из терминалов конференцсвязи, осуществляет процесс микширования звука для аудиоданных от каждого из терминалов конференцсвязи на разных звуковых каналах согласно типам языка и передает обработанные аудиоданные на терминалы конференцсвязи, которым соответствующим образом назначены языки, причем аудиоданные на одном языке обрабатывают в одном звуковом канале.
Аудиоданные, принятые многоточечным блоком управления, включают в себя аудиоданные, переданные на многоточечный блок управления после того, как терминалы конференцсвязи, обрабатывают речь сайта конференцсвязи, и/или аудиоданные, переданные на многоточечный блок управления после того, как терминал перевода переводит речь сайта конференцсвязи согласно аудиоданным, переданным с многоточечного блока управления, и обрабатывает переведенные аудиоданные.
Вариант осуществления настоящего изобретения предусматривает многоточечный блок управления, способный осуществлять этапы способа для реализации многоязычной конференцсвязи.
Как известно из вышеприведенной технической схемы согласно вариантам осуществления настоящего изобретения, поскольку используется многоканальная технология, участники на каждом из сайтов конференцсвязи могут слышать речь на одном языке и также могут слышать речь на любом нужном языке, тем самым успешно избегая бесполезной языковой информации. Поскольку используется многоканальная технология, успешно реализуется разговор на множественных языках в системе конференцсвязи, при этом множественные языки не мешают друг другу и разные языки беспрепятственно объединяются, тем самым удовлетворяя требованию языков для разных регионов.
Краткое описание чертежей
Фиг.1 - схема системы для поддержки многоточечной видеоконференции, отвечающей уровню техники.
Фиг.2 - схематическое представление схемы обработки аудиоданных на терминалах конференцсвязи согласно уровню техники.
Фиг.3 - схема политики микширования звука многоточечного блока управления согласно уровню техники.
Фиг.4 - схема возможного применения варианта осуществления настоящего изобретения.
Фиг.5 - схема системы согласно варианту осуществления настоящего изобретения.
Фиг.6 - схематическое представление схемы обработки аудиоданных на терминалах конференцсвязи в системе согласно первому варианту осуществления настоящего изобретения.
Фиг.7 - схематическое представление схемы обработки аудиоданных на многоточечном блоке управления в системе согласно первому варианту осуществления настоящего изобретения.
Фиг.8 - схематическое представление схемы микширования звука, когда три языка, а именно китайский, английский и русский, существуют в системе согласно первому варианту осуществления настоящего изобретения.
Фиг.9 - схематическое представление схемы микширования звука, когда три языка, а именно китайский, английский и русский, существуют в системе согласно первому варианту осуществления настоящего изобретения.
Фиг.10 - схема взаимодействия между терминалами конференцсвязи и многоточечным блоком управления в системе согласно второму или третьему варианту осуществления настоящего изобретения.
Фиг.11 - схематическое представление схемы реализации многоточечного блока управления в системе согласно третьему варианту осуществления настоящего изобретения.
Фиг.12 - схема системы согласно четвертому варианту осуществления настоящего изобретения.
Фиг.13 - схема системы согласно пятому варианту осуществления настоящего изобретения.
Фиг.14 - схематическое представление схемы реализации многоточечного блока управления в системе согласно пятому варианту осуществления настоящего изобретения.
Фиг.15 - первая схема решения микширования звука, когда три языка, а именно китайский, английский и русский, существуют в системе согласно варианту осуществления настоящего изобретения.
Фиг.16 - вторая схема решения микширования звука, когда три языка, а именно китайский, английский и русский, существуют в системе согласно варианту осуществления настоящего изобретения.
Подробное описание
В системе и способе, описанных согласно варианту осуществления настоящего изобретения, благодаря использованию технологии многоканальной обработки на MCU системы многоточечной конференцсвязи, разные звуковые каналы задаются согласно разным языкам, и аудиоданные на разных языках обрабатывается согласно разным звуковым каналам. Процесс согласно разным звуковым каналам относится к обработке аудиоданных на различных языках через соответствующие звуковые каналы. Например, аудиоданные китайского языка обрабатываются на звуковом канале 1, аудиоданные английского языка обрабатываются на звуковом канале 2, и процессы обработки аудиоданных на различных языках не мешают друг другу. Система многоточечной конференцсвязи, описанная согласно варианту осуществления настоящего изобретения, включает в себя не только традиционную систему чисто голосовой многоточечной конференцсвязи, но также систему телевизионной конференцсвязи или видеосистему конференцсвязи.
Вариант осуществления настоящего изобретения описан, в порядке примера, применительно к китайско-английской многоточечной конференции, и другие конференции, использующие два языка или более, обрабатываются аналогичным образом.
На фиг.4 описано возможное применение варианта осуществления настоящего изобретения. Каждый из сайтов конференцсвязи соответствует терминалу конференцсвязи, и любой из сайтов конференцсвязи в системе многоточечной конференцсвязи назначается как переводческий сайт конференцсвязи, отвечающий за перевод с китайского на английский или перевод с английского на китайский для речи каждого из сайтов конференцсвязи. Согласно фиг.5 система согласно варианту осуществления настоящего изобретения включает в себя каждый из терминалов конференцсвязи и MCU.
Ниже описан первый вариант осуществления системы, отвечающей настоящему изобретению.
Терминал конференцсвязи и терминал перевода (терминал конференцсвязи переводческого сайта конференцсвязи называется “терминалом перевода”) используют только один входной и выходной интерфейс, MCU применяет микширование звуков из множественных звуковых каналов, и MCU назначает языки, которым соответствуют терминалы конференцсвязи, и терминал конференцсвязи, выступающий в роли терминала перевода. В этой схеме не существует особых требований к терминалам конференцсвязи и терминалу перевода, и большая часть работы выполняется MCU. Ниже приведено подробное описание различных частей.
Согласно фиг. 6 терминал конференцсвязи собирает локально введенные аудиосигналы, кодирует сигналы и передает кодированные сигналы на MCU. Терминал конференцсвязи также принимает кодовый поток аудиосигнала, переданный с MCU, и воспроизводит кодовый поток аудиосигнала после декодирования. По этой причине терминалу конференцсвязи не требуется различать входной и выходной языки.
Терминал перевода отвечает за перевод с языка, используемого на каждом из сайтов конференцсвязи, например перевод с китайского языка на английский или перевод с английского языка на китайский. В этом варианте осуществления переводчики могут осуществлять синхронный перевод на переводческом сайте конференцсвязи, или также может осуществляться интеллектуальный синхронный машинный перевод с использованием автоматических переводчиков. Благодаря использованию синхронного перевода, задержкой конференции, обусловленной переводом, можно, по существу, пренебречь, что позволяет эффективно обеспечивать плавное течение конференции.
Согласно фиг. 7 при управлении конференцией MCU сначала назначает информацию языка для каждого из терминалов конференцсвязи и назначает терминал конференцсвязи, имеющий функцию синхронного перевода, терминалом перевода. Например, язык терминала конференцсвязи 1 назначается как китайский, язык терминала конференцсвязи 2 назначается как английский и при этом терминал конференцсвязи 3 назначается терминалом перевода. Когда MCU принимает аудиоданные от терминала конференцсвязи, сначала осуществляется декодирование, после чего декодированные голосовые данные поступают на соответствующий языковой микшер для микширования звука согласно информации языка, назначенной для терминала конференцсвязи. Например, для терминала конференцсвязи, которому назначен китайский язык, MCU передает принятые аудиоданные этого терминала конференцсвязи на микшер китайского языка для микширования звука и передает аудиоданные терминала конференцсвязи, которому назначен английский язык, на микшер английского языка для микширования звука. Аудиоданные, переданные терминалом перевода на MCU, всегда участвуют в микшировании звука, и язык микширования звука, в котором он участвует, вводится ниже. После того как MCU осуществляет микширование звука по отдельности согласно разным языкам, политику микширования звука для различных языков можно получить согласно уровню техники, данные после микширования звука поступают на соответствующие терминалы конференцсвязи, которым назначены языки. Например, терминалы конференцсвязи, участвующие в микшировании звука китайского языка, принимают соответствующие данные, подлежащие микшированию звука китайского языка, и терминалы конференцсвязи, участвующие в микшировании звука английского языка, принимают соответствующие данные, подлежащие микшированию звука английского языка.
Микширование звука на MCU осуществляется в два этапа. Во-первых, сравниваются величины громкости всех сайтов конференцсвязи, и, во-вторых, сайты конференцсвязи, звук которых подлежит вещанию, выбираются согласно величине их громкости, и звук поступает на принимающие сайты конференцсвязи. Микширование звука может осуществляться как одностороннее микширование звука, двустороннее микширование звука, трехстороннее микширование звука, даже четырех- или более стороннее микширование звука. При одностороннем микшировании звука только сторона с наивысшим звуком вещает на каждый из сайтов конференцсвязи. При двустороннем микшировании звука только две стороны с наивысшим звуком вещают после смешивания, и участники на двух сайтах конференцсвязи с наивысшим звуком, с которых осуществляется вещание, не могут слышать свой собственный звук, но могут слышать звук другой стороны. Одностороннему микшированию звука и двустороннему микшированию звука присущ недостаток обрывания слов в интерактивной конференции с участием более чем трех сайтов конференцсвязи. Поэтому предлагается использовать трехстороннее микширование звука, и схема трехстороннего микширования звука показана на фиг. 3.
Громкости разных сайтов конференцсвязи сравниваются для определения трех сайтов конференцсвязи с наибольшим звуком, а именно T1, T2 и T3, которые участвуют в микшировании звука. Данные T1, T2 и T3 поступают на другие сайты конференцсвязи, которые не участвуют в микшировании звука, после суммирования данных. Участники на T1, T2 и T3 слышат соответственно смешанный звук двух других сайтов конференцсвязи, т.е. участники на T1 слышат смешанный звук сайтов конференцсвязи T2 и T3, участники на T2 слышат смешанный звук сайтов конференцсвязи T1 и T3 и участники на T3 слышат смешанный звук сайтов конференцсвязи T1 и T2. Одностороннее микширование звука легко реализовать, и оно относительно пригодно для случая, когда говорит только председатель, но не годится для интерактивной связи. Двустороннее микширование звука допускает некоторый уровень интерактивности, но, когда третья сторона вставляет слово, возможен случай, когда звук одной стороны прерывается. Трехстороннее микширование звука дает сравнительно хороший интерактивный эффект.
После того как MCU независимо микширует звук согласно разным языкам, результат микширования звука поступает соответственно на соответствующие терминалы конференцсвязи, которым назначены языки. Например, терминалы конференцсвязи, участвующие в микшировании звука китайского языка, принимают соответствующие данные, подлежащие микшированию звука китайского языка, и терминалы конференцсвязи, участвующие в микшировании звука английского языка, принимают соответствующие данные, подлежащие микшированию звука английского языка.
Согласно фиг.7 каждая пара языков использует только один терминал перевода, например терминал китайско-английского перевода может переводить с китайского на английский и также может переводить с английского на китайский. Поскольку работа по переводу различных сайтов конференцсвязи сконцентрирована в небольшом количестве сайтов конференцсвязи, это позволяет в значительной степени экономить ресурсы перевода, в то же время гарантируя качество перевода, и, таким образом, снизить стоимость конференции. При использовании одностороннего микширования звука звук стороны на китайском и английском языках с наивысшим звуком поступает на терминал перевода. Терминал перевода, который не участвует в сравнении громкости, передает аудиоданные с наивысшей громкостью на переводческий сайт конференцсвязи. Если китайская речь звучит с наивысшей громкостью, значит, язык аудиоданных, поступающих на терминал перевода, является китайским. При следующем микшировании звука аудиоданные терминала перевода участвуют в микшировании звука английского языка. Если английская речь звучит с наивысшей громкостью, язык аудиоданных, поступающих на терминал перевода, является английским. При следующем микшировании звука, аудиоданные терминала перевода участвуют в микшировании звука китайского языка. Хотя только более громко звучащий из китайского и английского языков поступает на терминал перевода, само по себе микширование звука китайского языка или английского языка может представлять собой одностороннее, двустороннее, трехстороннее, даже четырех- или более стороннее микширование звука. Терминал перевода всегда участвует в микшировании звука соответствующего языка с наивысшей громкостью или одной из наивысших громкостей.
При использовании двустороннего микширования звука аудиоданные с наивысшей громкостью двух сторон выбираются для передачи на терминал перевода для перевода, и, таким образом, требуется два терминала перевода. Один терминал перевода переводит звук сайта конференцсвязи с первой наивысшей громкостью, и другой терминал перевода переводит звук сайта конференцсвязи со второй наивысшей громкостью. Громкость переводческого сайта конференцсвязи не участвует в сравнении громкости. Переведенный звук поступает на микшер соответствующего языка для микширования звука. Если обе стороны с наивысшей громкостью говорят на китайском или английском, данные, переведенные терминалами перевода, участвуют в микшировании звука английского или китайского языка при следующем микшировании звука в качестве двух сторон с наивысшей громкостью или двух из нескольких сторон с наивысшей громкостью. Если одна из двух сторон с наивысшей громкостью говорит по-китайски, а другая по-английски, то две стороны участвуют в микшировании звука английского языка и китайского языка соответственно после перевода соответствующим терминалом перевода. Терминал перевода всегда участвует в микшировании звука, и его громкость может быть равна громкости сайта конференцсвязи, для которого он переводит, или может быть одной из наивысших громкостей. Аналогично, микшер китайского языка или микшер английского языка может применять двустороннее, трехстороннее или многостороннее микширование звука.
При использовании трехстороннего или многостороннего микширования звука обработка микширования звука аналогична обработке двустороннего микширования звука, и три или более терминала перевода требуются для перевода речи нескольких сторон с наивысшей громкостью.
Многоязычная конференцсвязь на двух языках, китайском и английском, описана выше для упрощения иллюстрации, и многоязычную конференцсвязь на любых двух языках можно реализовать согласно вышеописанному способу. Количество языков, одновременно используемых при осуществлении конференцсвязи, может быть больше двух. При добавлении языка обработка терминалов не изменяется, и MCU, соответственно, добавляет микшер. Согласно фиг. 8 в случае конференции на трех языках, а именно китайском, английском и русском, в порядке примера, предусмотрены три терминала перевода, причем один используется для реализации китайско-английского перевода, один используется для реализации китайско-русского перевода и один используется для реализации англо-русского перевода. Результат микширования звука китайской, английской и русской речи поступает на соответствующий слушающий сайт конференцсвязи. Одностороннее микширование звука используется на фиг. 8, данные одной стороны с наивысшей громкостью из китайской, английской и русской поступают на соответствующий терминал перевода конференцсвязи после кодирования, и громкость терминала перевода конференцсвязи не участвует в сравнении. Если китайская речь звучит с наивысшей громкостью, данные китайского языка поступают на китайско-английский и китайско-русский переводческие сайты конференцсвязи. Если английская или русская речь звучит с наивысшей громкостью, способ обработки аналогичен. Согласно этому способу переводится только одна сторона из китайской, английской и русской с наивысшей громкостью. Случай четырех или более языков можно вывести по аналогии.
Обработка двух- или более стороннего микширования звука аналогична описанной выше, но несколько больше терминалов перевода необходимо для перевода звука сайта конференцсвязи со второй наивысшей громкостью.
На фиг. 9 показан более гибкий подход к реализации микширования звука. При микшировании звука сравнивается громкость китайской и английской, китайской и русской и английской и русской речи соответственно, и данные одной стороны с наивысшей громкостью поступают на соответствующий терминал перевода для перевода. Например, если китайская и английская речь сравниваются по величине громкости, одна сторона с более высокой громкостью поступает на терминал китайско-английского перевода конференцсвязи. Если китайская и русская речь сравниваются по величине громкости, одна сторона с более высокой громкостью поступает на терминал китайско-русского перевода конференцсвязи. Если английская и русская речь сравниваются по величине громкости, одна сторона с более высокой громкостью поступает на англо-русский терминал перевода конференцсвязи. Переведенные аудиоданные участвуют в микшировании звука соответствующего языка. Например, данные, участвующие в микшировании звука китайского языка, содержат данные китайской речи, китайской речи в переводе с английского и китайской речи в переводе с русского. Микширование звука китайского языка включает в себя одностороннее микширование звука, двустороннее микширование звука, трехстороннее микширование звука и даже более стороннее микширование звука. При микшировании звука китайского языка громкость китайской речи в переводе с английского участвует в микшировании звука согласно громкости английской речи, и громкость китайской речи в переводе с русского участвует в микшировании звука согласно громкости русской речи. Обработка микширования звука на английском и русском аналогична соответствующей обработке для китайского языка, и случай четырех или более языков можно вывести по аналогии.
Согласно фиг. 9 двух- или более стороннее микширование звука также можно реализовать для каждой пары языков, но соответственно увеличивается количество терминалов перевода.
Ниже описан второй вариант осуществления системы, отвечающей настоящему изобретению.
Терминалы конференцсвязи и терминал перевода используют только один входной и выходной интерфейс. Терминал конференцсвязи должен сообщить MCU свой язык или сообщить MCU, что он является терминалом перевода, посредством сигнализации. MCU применяет микширование звуков из множественных звуковых каналов. Кодеки, используемые терминалами конференцсвязи, терминалом перевода и MCU, являются одноканальными кодеками. Ниже приведено подробное описание различных частей.
Реализация терминалов конференцсвязи, по существу, такая же, как в первом варианте осуществления. Отличие состоит в том, что, как показано на фиг. 10, терминалы конференцсвязи поддерживают назначение языка для сайтов конференцсвязи и подтверждают MCU языки сайтов конференцсвязи посредством сигнализации, например H.245. Например, терминал конференцсвязи выбирает китайский язык, и MCU информируется о том, что терминал конференцсвязи принадлежит китайскому сайту конференцсвязи.
Реализация терминала перевода такая же, как в первом варианте осуществления, отличие состоит в том, что терминал конференцсвязи назначается как терминал перевода и MCU информируется о том, что терминал конференцсвязи является терминалом перевода, посредством сигнализации, например H.245.
Реализация MCU такая же, как в первом варианте осуществления, отличие состоит в том, что MCU знает язык, назначенный терминалам конференцсвязи, или выступает ли терминал конференцсвязи в качестве терминала перевода, посредством сигнализации, например H.245. Таким образом, информация назначения сайта конференцсвязи, показанная на фиг. 7, поступает от терминалов конференцсвязи посредством сигнализации, например H.245.
Ниже описан третий вариант осуществления системы, отвечающей настоящему изобретению.
Терминалы конференцсвязи и терминал перевода используют только один входной и выходной интерфейс. Терминал конференцсвязи должен сообщить MCU свой язык в рамках сетевого взаимодействия или сообщить MCU, что он является терминалом перевода. MCU применяет микширование звуков из множественных звуковых каналов. Кодеки, используемые терминалами конференцсвязи, терминалом перевода и MCU, являются одноканальными кодеками. Ниже приведено подробное описание различных частей.
Реализация терминала конференцсвязи такая же, как во втором варианте осуществления, отличие состоит в том, что терминал конференцсвязи принимает и кодирует входные аудиоданные и упаковывает кодированный кодовый поток и информацию языка, соответствующую кодовому потоку, для передачи на MCU. См. фиг. 10, например, китайский терминал конференцсвязи добавляет идентификаторы китайского языка в кодовый поток, подлежащий передаче на MCU, и английский терминал конференцсвязи добавляет идентификаторы английского языка в кодовый поток, подлежащий передаче на MCU, вместо того, чтобы указывать MCU свой язык посредством сигнализации.
Реализация терминала перевода такая же, как во втором варианте осуществления, отличие состоит в том, что терминал конференцсвязи назначается как терминал перевода, терминал перевода добавляет идентификатор терминала перевода в кодовый поток, подлежащий передаче на MCU, для сообщения MCU, что он является терминалом перевода, вместо того, чтобы указывать MCU свою идентичность как терминала перевода посредством сигнализации, см. фиг. 10.
Реализация MCU такая же, как во втором варианте осуществления, отличие состоит в том, что, см. фиг. 11, MCU определяет язык кодового потока и является ли терминал конференцсвязи терминалом перевода, анализируя принятый кодовый поток аудиосигнала, а не посредством сигнализации.
Ниже описан четвертый вариант осуществления системы, отвечающей настоящему изобретению.
Иногда, на одном сайте конференцсвязи, может звучать речь на множественных языках. Если множественные языки на сайте конференцсвязи используются попеременно, язык терминала конференцсвязи нужно непрерывно обновлять согласно вышеописанному способу, что крайне неудобно в ходе работы. В такой реализации терминал конференцсвязи использует множественные входные/выходные интерфейсы.
Терминал конференцсвязи имеет два входных канала, модуль назначения языка канала терминала конференцсвязи назначает язык, соответствующий каждому входному каналу, например китайский язык соответствует каналу 1 и английский язык соответствует каналу 2. Сначала данные канала 1 и канала 2 сравниваются по громкости, до передачи на кодер, сторона с более высокой громкостью поступает на кодер для кодирования, как показано на фиг. 12. Информация языка, соответствующая каналу, добавляется в кодированный кодовый поток до того, как кодированный кодовый поток поступит на MCU. Например, когда на сайте конференцсвязи говорят только на китайском языке, данные на канале 1 поступают на кодер для кодирования, и кодированный кодовый поток поступает на MCU после установки идентификатора китайского языка в кодовом потоке. Когда на сайте конференцсвязи говорят только на английском языке, данные на канале 2 поступают на кодер для кодирования, и кодированный кодовый поток поступает на MCU после установки идентификатора английского языка в кодовом потоке. Если говорят одновременно на китайском и английском языках, сторона с более высокой громкостью поступает на MCU после кодирования и снабжается соответствующей информацией языка.
Терминал конференцсвязи, назначенный как терминал перевода, добавляет идентификатор терминала перевода в кодовый поток для передачи на MCU. Конечно, терминал конференцсвязи, назначенный как терминал перевода, также может указывать MCU свою идентичность посредством сигнализации, например H.245.
Согласно фиг. 11, получив кодовый поток аудиосигнала от терминала конференцсвязи, MCU идентифицирует язык, соответствующий кодовому потоку, и определяет, поступил ли кодовый поток от терминала перевода, на основании языка терминала и идентификатора терминала перевода. Будучи декодирован, кодовый поток поступает на микшеры для разных языков для микширования звука согласно информации языка после идентификации. Например, китайский язык поступает на микшер китайского языка для микширования звука, и английский язык поступает на микшер английского языка для микширования звука. После микширования звука результаты микширования звука китайского и английского языков спариваются один за другим согласно величине громкости, кодируются и маркируются идентификаторами языка соответственно и затем поступают на соответствующие принимающие терминалы конференцсвязи. Например, пара с наивысшей громкостью, включающая в себя выход микширования звука китайского языка и выход микширования звука английского языка, поступает на сайты конференцсвязи, которые принимают наивысшую громкость китайской или английской речи.
Согласно фиг. 12 в этой схеме терминалы конференцсвязи также могут выбирать языки для приема. Терминалы конференцсвязи сообщают MCU язык, который они выбрали для приема, посредством сигнализации, например H.245. После микширования звука MCU передает смешанные данные на терминалы конференцсвязи согласно информации языка, который терминалы конференцсвязи выбрали для прослушивания. Если терминал конференцсвязи выбирает для прослушивания китайский и английский языки, данные, которые MCU передал на терминал конференцсвязи, обрабатываются вышеописанным образом. Если терминал конференцсвязи выбирает для прослушивания только китайский язык, результат микширования звука китайского языка поступает на соответствующий принимающий терминал конференцсвязи, и английский язык обрабатывается аналогично. Терминал перевода должен быть настроен так, чтобы принимать китайский и английский языки.
Терминал конференцсвязи декодирует некоторые или все принятые кодовые потоки MCU согласно назначению языка для прослушивания и затем выводит декодированные кодовые потоки в соответствующие выходные каналы. Например, если выходной канал 1 назначен для вывода китайского языка, выходной канал 2 назначен для вывода английского языка, когда терминал конференцсвязи принимает китайский и английский кодовые потоки, терминал конференцсвязи декодирует кодовые потоки соответственно и выводит декодированные кодовые потоки в соответствующие выходные каналы. Если выходной канал 1 назначен для вывода только китайского языка, данные кодового потока английского языка отбрасываются, и только данные кодового потока китайского языка декодируются и поступают в выходной канал 1 для вывода. Если выходной канал 2 назначен для вывода только английского языка, данные кодового потока китайского языка отбрасываются, и только данные кодового потока английского языка декодируются и поступают в выходной канал 2 для вывода.
Аудиоданные, переданные на терминал перевода и микширования звука языка, в котором участвует терминал перевода, обрабатываются следующим образом. MCU сравнивает величину громкости принятых аудиоданных китайского и английского языков (терминал перевода не участвует в сравнении громкости), передает аудиоданные с наивысшей громкостью на переводческий сайт конференцсвязи. Если китайская речь звучит с наивысшей громкостью, язык аудиоданных, переданных на терминал перевода, является китайским, и при следующем микшировании звука аудиоданные терминала перевода, принятые на MCU, участвуют в микшировании звука английского языка. Если английская речь звучит с наивысшей громкостью, язык аудиоданных, переданных на терминал перевода, является английским, и по завершении перевода терминал перевода передает данные, переведенные на китайский язык, на MCU для участия в микшировании звука китайского языка.
Ниже описан пятый вариант осуществления системы, отвечающей настоящему изобретению.
Эта схема аналогична схеме 4, отличия состоят в использовании многоканальных кодеров.
Согласно фиг. 13 разница между обработкой терминала конференцсвязи в этой схеме и в схеме 4 состоит в том, что кодирование разных языков соответствует кодированию звуковых каналов многоканального кодера. Например, китайский язык кодируется соответственно в левом канале, английский язык кодируется в правом канале, и кодированные данные поступают на MCU после упаковки.
Терминал конференцсвязи назначается как терминал перевода, добавляет терминал перевода идентификатор в кодовый поток, подлежащий передаче на MCU. Он также может указывать MCU свою идентичность посредством сигнализации, например H.245.
Согласно фиг. 14 MCU принимает и декодирует кодовый поток аудиосигнала, поступающий с терминала конференцсвязи, и затем подает данные звукового канала на соответствующие микшеры для микширования звука. Например, данные левого канала поступают на микшер китайского языка для микширования звука, и данные правого канала поступают на микшер английского языка для микширования звука. После микширования звука результаты микширования звука китайского и английского языков спариваются один за другим согласно величине громкости, кодируются в соответствующих звуковых каналах многоканального кодера и затем передаются на терминалы конференцсвязи.
Терминал конференцсвязи принимает и декодирует кодовый поток, поступающий от MCU, передает декодированные данные соответствующего языка на выходной канал согласно выбранному выходному языку. Терминал перевода способен принимать китайский и английский языки.
Аудиоданные, переданные на терминал перевода и микширование звука языка, в котором участвует терминал перевода, обрабатываются следующим образом. MCU сравнивает величину громкости принятых аудиоданных китайского и английского языков (терминал перевода не участвует в сравнении громкости), передает аудиоданные с наивысшей громкостью на переводческий сайт конференцсвязи. Если китайская речь звучит с наивысшей громкостью, язык аудиоданных, переданных на терминал перевода, является китайским, и при следующем микшировании звука аудиоданные терминала перевода, принятые на MCU, участвуют в микшировании звука английского языка. Если английская речь звучит с наивысшей громкостью, язык аудиоданных, переданных на терминал перевода, является английским, и по завершении перевода терминал перевода передает данные, переведенные на китайский язык, на MCU для участия в микшировании звука китайского языка.
Многоязычная конференцсвязь на двух языках, китайском и английском, описана выше для упрощения иллюстрации, и многоязычную конференцсвязь на любых двух языках можно реализовать согласно вышеописанному способу. Количество языков, одновременно используемых при осуществлении конференцсвязи, может быть больше двух. При добавлении языка обработка терминалов не изменяется, но MCU, соответственно, добавляет микшер. Согласно фиг. 15 в порядке примера рассмотрена конференция на трех языках: китайском, английском и русском. Результат микширования звука китайской, английской и русской речи поступает на соответствующий слушающий сайт конференцсвязи. Кроме того, одна сторона из китайской, английской и русской с наивысшей громкостью поступает на соответствующий терминал перевода конференцсвязи после кодирования. Заметим, что громкость от терминала перевода не участвует в сравнении. Если китайская речь звучит с наивысшей громкостью, данные китайского языка поступают на китайско-английский и китайско-русский переводческие сайты конференцсвязи. Если английская или русская речь звучит с наивысшей громкостью, способ обработки аналогичен. Согласно этому способу переводится только одна сторона из китайской, английской и русской с наивысшей громкостью. Случай четырех или более языков можно вывести по аналогии.
На фиг.16 показан более гибкий подход к реализации микширования звука. После микширования звука сравнивается громкость китайской и английской, китайской и русской и английской и русской речи соответственно, и затем языки поступают на соответствующие терминалы перевода для перевода. Таким образом, участники на китайском, английском и русском сайтах конференцсвязи могут говорить одновременно. Случай четырех или более языков можно вывести по аналогии.
Ниже описаны варианты осуществления способа настоящего изобретения.
Аналогично вышеописанным вариантам осуществления системы, различным сайтам конференцсвязи сначала назначается информация языка и входные/выходные интерфейсы, связывающие терминалы конференцсвязи с соответствующими сайтами конференцсвязи, сайт конференцсвязи назначается как переводческий сайт конференцсвязи, отвечающий за перевод речи сайтов конференцсвязи. Когда только два языка существуют в системе многоточечной конференцсвязи, достаточно назначить один сайт конференцсвязи как переводческий сайт конференцсвязи. Когда существуют более трех языков, нужно назначать множественные переводческие сайты конференцсвязи. Каждый терминал конференцсвязи преобразует речь конференции в аудиоданные для передачи на многоточечный блок управления. Способ дополнительно включает в себя следующие этапы.
Переводческий сайт конференцсвязи осуществляет синхронный перевод речи сайтов конференцсвязи и передает переведенную речь на многоточечный блок управления согласно типам языка.
Многоточечный блок управления смешивает аудиоданные от терминалов конференцсвязи на разных звуковых каналах согласно типам языка и передает обработанные аудиоданные на терминалы конференцсвязи согласно языку, заранее заданному многоточечным блоком управления, или выбору языка на терминалах конференцсвязи.
Терминалы конференцсвязи обрабатывают аудиоданные из многоточечного блока управления и выводят обработанные аудиоданные.
Реализации терминалов конференцсвязи и многоточечного блока управления можно получить со ссылкой на варианты осуществления с первого по пятый вышеописанной системы, которые не описаны здесь подробно.
При использовании способа, будь то в случае, когда говорят только участники на переводческом сайте конференцсвязи, или в случае, когда говорят только участники на других сайтах конференцсвязи, или в случае, когда в разговоре принимают участие как переводческий сайт конференцсвязи, так и другие сайты конференцсвязи, может быть успешно реализована обработка на разных звуковых каналах согласно типам языка, речи на различных языках не мешают друг другу, и различные сайты конференцсвязи могут выбирать язык, необходимый им для участия в конференции.
Вышеприведенные варианты осуществления настоящего изобретения опираются, в порядке примера, на конференцию на китайском и английском языках, но в практическом применении варианта осуществления настоящего изобретения языки, используемые в конференции, не ограничиваются китайским и английским, и можно использовать любые два языка. Языки, используемые в конференции, не ограничиваются двумя видами, и можно использовать три или более вида. Политики микширования звука, используемые многоточечным блоком управления, не ограничиваются способом, отвечающим уровню техники, и также применимы другие политики микширования звука. При использовании системы и способа согласно варианту осуществления настоящего изобретения каждый из сайтов конференцсвязи может участвовать в конференции согласно выбранному им языку. Например, когда три языка: китайский, английский и русский, существуют в системе конференцсвязи, достаточно обеспечить три звуковых канала для обработки аудиоданных соответствующих языков. Одновременно назначаются три переводческих сайта конференцсвязи, а именно китайско-английский переводческий сайт конференцсвязи китайско-русский переводческий сайт конференцсвязи и англо-русский переводческий сайт конференцсвязи. Каждый сайт конференцсвязи принимает решение на вывод только того языка, который ему нужен, согласно информации назначения и отбрасывает бесполезную речевую информацию.
Наконец, следует отметить, что вышеописанные варианты осуществления используются только для пояснения, но не для ограничения технического решения настоящего изобретения. Несмотря на подробное описание настоящего изобретения со ссылкой на вышеприведенные предпочтительные варианты осуществления, следует понимать, что специалист в данной области техники может предложить различные модификации, изменения или эквивалентные замены, не отклоняясь от сущности и объема настоящего изобретения, которые заданы формулой настоящего изобретения.

Claims (13)

1. Система для реализации многоязычной конференцсвязи, содержащая терминалы конференцсвязи и многоточечный блок управления, в которой терминалы конференцсвязи способны передавать речь сайта конференцсвязи после обработки на многоточечный блок управления, обрабатывать аудиоданные, принятые от многоточечного блока управления, и выводить обработанные аудиоданные, причем, по меньшей мере, один из терминалов конференцсвязи является терминалом перевода, способным переводить речь сайта конференцсвязи согласно аудиоданным, переданным с многоточечного блока управления, обрабатывать переведенные аудиоданные и передавать обработанные аудиоданные на многоточечный блок управления, и многоточечный блок управления способен осуществлять процесс микширования звука для аудиоданных от терминалов конференцсвязи на разных звуковых каналах согласно типам языка и передавать аудиоданные после процесса микширования звука на терминалы конференцсвязи, которым соответствующим образом назначены языки, причем аудиоданные на одном языке обрабатывают в одном звуковом канале.
2. Система по п.1, в которой каждый из терминалов конференцсвязи является терминалом конференцсвязи, имеющим один входной интерфейс и один выходной интерфейс, или каждый из терминалов конференцсвязи является терминалом конференцсвязи, имеющим множественные входные интерфейсы и множественные выходные интерфейсы.
3. Система по п.2, в которой каждый из терминалов конференцсвязи является терминалом конференцсвязи, использующим одноканальный кодек для осуществления кодирования и декодирования, или каждый из терминалов конференцсвязи является терминалом конференцсвязи, использующим многоканальный кодек для осуществления кодирования и декодирования.
4. Система по п.1, в которой многоточечный блок управления является многоточечным блоком управления, использующим политику одностороннего микширования звука, двустороннего микширования звука, трехстороннего микширования звука или более многостороннего микширования звука.
5. Способ реализации многоязычной конференцсвязи, содержащий этапы, на которых принимают, посредством многоточечного блока управления, аудиоданные, переданные с каждого из терминалов конференцсвязи, осуществляют процесс микширования звука для аудиоданных от каждого из терминалов конференцсвязи на разных звуковых каналах согласно типам языка и передают обработанные аудиоданные на терминалы конференцсвязи, которым соответствующим образом назначены языки, причем аудиоданные на одном языке обрабатывают в одном звуковом канале, в котором аудиоданные, принятые многоточечным блоком управления, содержат аудиоданные, переданные на многоточечный блок управления после обработки речи сайта конференцсвязи терминалами конференцсвязи, и/или аудиоданные, переданные на многоточечный блок управления после того, как терминал перевода из терминалов конференцсвязи переводит речь сайта конференцсвязи согласно аудиоданным, переданным с многоточечного блока управления и обрабатывает переведенные аудиоданные.
6. Способ по п.5, в котором терминал конференцсвязи обрабатывает аудиоданные через один входной интерфейс и один выходной интерфейс, или терминал конференцсвязи обрабатывает аудиоданные через множественные входные интерфейсы и множественные выходные интерфейсы.
7. Способ по п.6, в котором терминалы конференцсвязи обрабатывают аудиоданные с использованием одноканального кодека или терминалы конференцсвязи обрабатывают аудиоданные с использованием многоканального кодека.
8. Способ по п.6, в котором процесс микширования звука представляет собой процесс одностороннего микширования звука, двустороннего микширования звука, трехстороннего микширования звука или более многостороннего микширования звука.
9. Способ по п.5, в котором на этапе передачи обработанных аудиоданных на терминалы конференцсвязи передают посредством многоточечного блока управления, аудиоданные после процесса микширования звука соответствующего звукового канала на терминалы конференцсвязи согласно информации языка, соответствующей терминалам конференцсвязи, и информации идентификатора терминала перевода.
10. Способ по п.9, дополнительно содержащий этапы, на которых предварительно задают посредством многоточечного блока управления, информацию языка, соответствующую терминалам конференцсвязи и/или информацию идентификатора терминала перевода, и/или принимают и сохраняют посредством многоточечного блока управления информацию языка и/или информацию идентификатора терминала перевода, переданные с терминалов конференцсвязи.
11. Способ по любому из пп.6-10, дополнительно содержащий этапы, на которых выбирают посредством многоточечного блока управления сайты конференцсвязи согласно величине громкости речи каждого из сайтов конференцсвязи и передают аудиоданные выбранных сайтов конференцсвязи на терминал перевода.
12. Способ по п.11, в котором выбранные сайты конференцсвязи содержат один или несколько сайтов конференцсвязи, и аудиоданные, переданные с терминала перевода, всегда участвуют в обработке микширования звука на разных звуковых каналах.
13. Многоточечный блок управления, способный осуществлять этапы способа по любому из пп.5, 8-12.
RU2009116477/09A 2006-09-30 2007-09-29 Система, способ и многоточечный блок управления для реализации многоязычной конференцсвязи RU2426247C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200610063017.7 2006-09-30
CN2006100630177A CN1937664B (zh) 2006-09-30 2006-09-30 一种实现多语言会议的系统及方法

Publications (2)

Publication Number Publication Date
RU2009116477A RU2009116477A (ru) 2010-11-20
RU2426247C2 true RU2426247C2 (ru) 2011-08-10

Family

ID=37954920

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009116477/09A RU2426247C2 (ru) 2006-09-30 2007-09-29 Система, способ и многоточечный блок управления для реализации многоязычной конференцсвязи

Country Status (7)

Country Link
US (1) US9031849B2 (ru)
EP (1) EP2073543B9 (ru)
JP (1) JP5534813B2 (ru)
CN (1) CN1937664B (ru)
AT (1) ATE515884T1 (ru)
RU (1) RU2426247C2 (ru)
WO (1) WO2008040258A1 (ru)

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101496387B (zh) 2006-03-06 2012-09-05 思科技术公司 用于移动无线网络中的接入认证的系统和方法
CN1937664B (zh) * 2006-09-30 2010-11-10 华为技术有限公司 一种实现多语言会议的系统及方法
US8041018B2 (en) * 2007-12-03 2011-10-18 Samuel Joseph Wald System and method for establishing a conference in two or more different languages
CN101471804B (zh) 2007-12-28 2011-08-10 华为技术有限公司 一种音频处理方法、系统和控制服务器
US8355041B2 (en) 2008-02-14 2013-01-15 Cisco Technology, Inc. Telepresence system for 360 degree video conferencing
US8797377B2 (en) 2008-02-14 2014-08-05 Cisco Technology, Inc. Method and system for videoconference configuration
US8319819B2 (en) 2008-03-26 2012-11-27 Cisco Technology, Inc. Virtual round-table videoconference
US8390667B2 (en) 2008-04-15 2013-03-05 Cisco Technology, Inc. Pop-up PIP for people not in picture
US8694658B2 (en) 2008-09-19 2014-04-08 Cisco Technology, Inc. System and method for enabling communication sessions in a network environment
CN101510988B (zh) * 2009-02-19 2012-03-21 华为终端有限公司 一种语音信号的处理、播放方法和装置
US8659637B2 (en) 2009-03-09 2014-02-25 Cisco Technology, Inc. System and method for providing three dimensional video conferencing in a network environment
US8477175B2 (en) 2009-03-09 2013-07-02 Cisco Technology, Inc. System and method for providing three dimensional imaging in a network environment
GB2469329A (en) * 2009-04-09 2010-10-13 Webinterpret Sas Combining an interpreted voice signal with the original voice signal at a sound level lower than the original sound level before sending to the other user
US20100283829A1 (en) * 2009-05-11 2010-11-11 Cisco Technology, Inc. System and method for translating communications between participants in a conferencing environment
US8659639B2 (en) 2009-05-29 2014-02-25 Cisco Technology, Inc. System and method for extending communications between participants in a conferencing environment
US9082297B2 (en) 2009-08-11 2015-07-14 Cisco Technology, Inc. System and method for verifying parameters in an audiovisual environment
US9225916B2 (en) 2010-03-18 2015-12-29 Cisco Technology, Inc. System and method for enhancing video images in a conferencing environment
USD628968S1 (en) 2010-03-21 2010-12-14 Cisco Technology, Inc. Free-standing video unit
USD626102S1 (en) 2010-03-21 2010-10-26 Cisco Tech Inc Video unit with integrated features
USD628175S1 (en) 2010-03-21 2010-11-30 Cisco Technology, Inc. Mounted video unit
USD626103S1 (en) 2010-03-21 2010-10-26 Cisco Technology, Inc. Video unit with integrated features
US20110246172A1 (en) * 2010-03-30 2011-10-06 Polycom, Inc. Method and System for Adding Translation in a Videoconference
US9313452B2 (en) 2010-05-17 2016-04-12 Cisco Technology, Inc. System and method for providing retracting optics in a video conferencing environment
US8896655B2 (en) 2010-08-31 2014-11-25 Cisco Technology, Inc. System and method for providing depth adaptive video conferencing
US8599934B2 (en) 2010-09-08 2013-12-03 Cisco Technology, Inc. System and method for skip coding during video conferencing in a network environment
US8599865B2 (en) 2010-10-26 2013-12-03 Cisco Technology, Inc. System and method for provisioning flows in a mobile network environment
US8699457B2 (en) 2010-11-03 2014-04-15 Cisco Technology, Inc. System and method for managing flows in a mobile network environment
US9143725B2 (en) 2010-11-15 2015-09-22 Cisco Technology, Inc. System and method for providing enhanced graphics in a video environment
US9338394B2 (en) 2010-11-15 2016-05-10 Cisco Technology, Inc. System and method for providing enhanced audio in a video environment
US8902244B2 (en) 2010-11-15 2014-12-02 Cisco Technology, Inc. System and method for providing enhanced graphics in a video environment
US8730297B2 (en) 2010-11-15 2014-05-20 Cisco Technology, Inc. System and method for providing camera functions in a video environment
US8542264B2 (en) 2010-11-18 2013-09-24 Cisco Technology, Inc. System and method for managing optics in a video environment
US8723914B2 (en) 2010-11-19 2014-05-13 Cisco Technology, Inc. System and method for providing enhanced video processing in a network environment
US9111138B2 (en) 2010-11-30 2015-08-18 Cisco Technology, Inc. System and method for gesture interface control
US20120143592A1 (en) * 2010-12-06 2012-06-07 Moore Jr James L Predetermined code transmission for language interpretation
USD682294S1 (en) 2010-12-16 2013-05-14 Cisco Technology, Inc. Display screen with graphical user interface
USD682854S1 (en) 2010-12-16 2013-05-21 Cisco Technology, Inc. Display screen for graphical user interface
USD678307S1 (en) 2010-12-16 2013-03-19 Cisco Technology, Inc. Display screen with graphical user interface
USD682293S1 (en) 2010-12-16 2013-05-14 Cisco Technology, Inc. Display screen with graphical user interface
USD678320S1 (en) 2010-12-16 2013-03-19 Cisco Technology, Inc. Display screen with graphical user interface
USD682864S1 (en) 2010-12-16 2013-05-21 Cisco Technology, Inc. Display screen with graphical user interface
USD678894S1 (en) 2010-12-16 2013-03-26 Cisco Technology, Inc. Display screen with graphical user interface
USD678308S1 (en) 2010-12-16 2013-03-19 Cisco Technology, Inc. Display screen with graphical user interface
US9059860B2 (en) 2011-02-04 2015-06-16 Microsoft Technology Licensing, Llc Techniques for announcing conference attendance changes in multiple languages
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
US8692862B2 (en) 2011-02-28 2014-04-08 Cisco Technology, Inc. System and method for selection of video data in a video conference environment
US8670019B2 (en) 2011-04-28 2014-03-11 Cisco Technology, Inc. System and method for providing enhanced eye gaze in a video conferencing environment
US8786631B1 (en) 2011-04-30 2014-07-22 Cisco Technology, Inc. System and method for transferring transparency information in a video environment
US8934026B2 (en) 2011-05-12 2015-01-13 Cisco Technology, Inc. System and method for video coding in a dynamic environment
US8175244B1 (en) 2011-07-22 2012-05-08 Frankel David P Method and system for tele-conferencing with simultaneous interpretation and automatic floor control
US8947493B2 (en) 2011-11-16 2015-02-03 Cisco Technology, Inc. System and method for alerting a participant in a video conference
US8682087B2 (en) 2011-12-19 2014-03-25 Cisco Technology, Inc. System and method for depth-guided image filtering in a video conference environment
US8838459B2 (en) 2012-02-29 2014-09-16 Google Inc. Virtual participant-based real-time translation and transcription system for audio and video teleconferences
US8874429B1 (en) * 2012-05-18 2014-10-28 Amazon Technologies, Inc. Delay in video for language translation
CN102915743B (zh) * 2012-10-12 2014-12-17 华为技术有限公司 一种会议系统中播放提示语音的方法及设备
CN103838714A (zh) * 2012-11-22 2014-06-04 北大方正集团有限公司 一种语音信息转换方法及装置
US9031827B2 (en) 2012-11-30 2015-05-12 Zip DX LLC Multi-lingual conference bridge with cues and method of use
US9681154B2 (en) 2012-12-06 2017-06-13 Patent Capital Group System and method for depth-guided filtering in a video conference environment
SE1450295A1 (sv) * 2014-03-17 2015-09-18 Simultanex Ab System och metod för simultantolkning
WO2016047818A1 (ko) * 2014-09-23 2016-03-31 (주)두드림 멀티 코덱, 멀티 채널 기반의 동시통역 서비스 제공 시스템 및 방법
US9672831B2 (en) * 2015-02-25 2017-06-06 International Business Machines Corporation Quality of experience for communication sessions
JP6090757B2 (ja) 2015-04-14 2017-03-08 シントレーディング株式会社 通訳配信装置、通訳配信方法、およびプログラム
CN105611221A (zh) * 2015-12-24 2016-05-25 湖南工程学院 一种移动互联网下的智能会议系统
CN105930322B (zh) * 2016-07-14 2018-11-20 无锡科技职业学院 一种远程高效转换无稿同声传译装置系统
DE102017106359A1 (de) * 2017-03-24 2018-09-27 Sennheiser Electronic Gmbh & Co. Kg Vorrichtung und Verfahren zur Verarbeitung von Audiosignalen zur Verbesserung der Sprachverständlichkeit
CN107484075A (zh) * 2017-08-31 2017-12-15 深圳市豪恩声学股份有限公司 混音装置及声音处理系统
CN108076306B (zh) * 2017-12-29 2021-09-17 中兴通讯股份有限公司 会议实现方法、装置、设备和系统、计算机可读存储介质
CN108259986B (zh) * 2018-01-17 2021-06-01 海信电子科技(深圳)有限公司 多声道的音频播放方法及装置、电子设备、存储介质
CN108712271A (zh) * 2018-04-02 2018-10-26 深圳市沃特沃德股份有限公司 翻译方法和翻译装置
WO2019191877A1 (zh) * 2018-04-02 2019-10-10 深圳市沃特沃德股份有限公司 翻译方法、装置和翻译设备
CN109218038B (zh) * 2018-09-05 2022-03-01 四川译讯信息科技有限公司 一种多语言即时会话平台
CN109889699B (zh) * 2019-02-15 2023-11-28 深圳市昊一源科技有限公司 无线通话主机、无线通话tally系统及转发方法
CN110290344B (zh) * 2019-05-10 2021-10-08 上海平安智慧教育科技有限公司 基于远程会议的在线翻译方法、系统、设备及存储介质
CN111639503B (zh) * 2020-05-22 2021-10-26 腾讯科技(深圳)有限公司 会议数据处理方法、装置、存储介质及设备
CN113626790B (zh) * 2021-04-27 2023-04-07 自然资源部第一海洋研究所 一种海洋科学合作控制系统、方法、介质、设备及终端
US20230153547A1 (en) * 2021-11-12 2023-05-18 Ogoul Technology Co. W.L.L. System for accurate video speech translation technique and synchronisation with the duration of the speech
CN115113573B (zh) * 2022-08-16 2024-03-08 广东保伦电子股份有限公司 一种数字会议主机的会议控制方法

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1685696A (en) * 1926-10-11 1928-09-25 Frank Gustav Clamp
CN86201054U (zh) 1986-02-25 1986-12-17 上海机械专科学校 多路音频信号选听装置
SU1570025A1 (ru) 1988-08-05 1990-06-07 Предприятие П/Я В-2785 Устройство громкоговор щей конференцсв зи
DE3901909A1 (de) 1989-01-24 1990-07-26 Philips Patentverwaltung Schaltungsanordnung zur herstellung von konferenzverbindungen mit einer ringleitung
JPH05167698A (ja) 1991-12-11 1993-07-02 Mitsubishi Electric Corp 会議電話装置
JPH07162989A (ja) 1993-12-13 1995-06-23 Nippon Telegr & Teleph Corp <Ntt> 音声信号選択処理装置
US6292769B1 (en) * 1995-02-14 2001-09-18 America Online, Inc. System for automated translation of speech
WO1996038983A1 (en) 1995-06-02 1996-12-05 Intel Corporation Method and apparatus for controlling participant input in a conferencing environment
US5815196A (en) * 1995-12-29 1998-09-29 Lucent Technologies Inc. Videophone with continuous speech-to-subtitles translation
US5818442A (en) * 1996-04-30 1998-10-06 Intel Corporation Method and apparatus for modeling business card exchanges in an international electronic conference
WO1998023075A2 (en) 1996-11-22 1998-05-28 Unisys Corporation Multimedia teleconferencing bridge
ATE236488T1 (de) * 1998-06-04 2003-04-15 Roberto Trinca Verfahren und vorrichtung zur durchführung von videokonferenzen mit gleichzeitiger einfügung von zusatzinformation und filmen mit fernsehmodalitäten
CN1209023A (zh) 1998-06-08 1999-02-24 林竣宏 多种语音文字无线自动寻呼应答系统
AU1473401A (en) * 1999-11-10 2001-06-06 Global Market Insite, Inc. Reporting and analyzing data from a multi-region research survey
JP2002207832A (ja) * 2000-12-28 2002-07-26 Atsushi Takahashi インターネット技術指導教育配信システム、及び通信網を利用した指導システム
CA2446707C (en) * 2001-05-10 2013-07-30 Polycom Israel Ltd. Control unit for multipoint multimedia/audio system
US20020169592A1 (en) * 2001-05-11 2002-11-14 Aityan Sergey Khachatur Open environment for real-time multilingual communication
JP2003032373A (ja) 2001-07-11 2003-01-31 Contents Station:Kk 三者間通話を可能とする多言語オペレートシステム
US6781963B2 (en) 2002-02-14 2004-08-24 Qualcomm Inc Method and an apparatus for terminating a user from a group call in a group communication network
GB2392056B (en) * 2002-08-15 2007-03-21 Iml Ltd A participant response system and method
TW200405988A (en) 2002-09-17 2004-04-16 Ginganet Corp System and method for sign language translation
JPWO2004030328A1 (ja) * 2002-09-27 2006-01-26 株式会社ギンガネット テレビ電話通訳システムおよびテレビ電話通訳方法
TW200421849A (en) * 2002-09-27 2004-10-16 Ginganet Corp Telephone translation system
JP4150725B2 (ja) * 2002-09-27 2008-09-17 株式会社ギンガネット 電話通訳補助装置およびそれを用いた電話通訳システム
JP2004187126A (ja) * 2002-12-05 2004-07-02 Megachips System Solutions Inc テレビ会議システム
US7617094B2 (en) * 2003-02-28 2009-11-10 Palo Alto Research Center Incorporated Methods, apparatus, and products for identifying a conversation
JP2004274258A (ja) 2003-03-06 2004-09-30 Takada Informex Co Ltd 多地点同時コミュニケーションシステム
US20050021344A1 (en) * 2003-07-24 2005-01-27 International Business Machines Corporation Access to enhanced conferencing services using the tele-chat system
US7688961B2 (en) * 2003-09-26 2010-03-30 Concerto Software, Inc Efficient multiplex conferencing engine
JP2005184583A (ja) 2003-12-22 2005-07-07 Fuji Xerox Co Ltd 情報処理装置及びコミュニケーション方法
US20050251421A1 (en) * 2004-03-29 2005-11-10 Calvin Chang Providing video interpreting services
US20060055771A1 (en) * 2004-08-24 2006-03-16 Kies Jonathan K System and method for optimizing audio and video data transmission in a wireless system
JP2006203548A (ja) 2005-01-20 2006-08-03 Yamaha Corp 複数話者の音声信号を処理する音声信号処理装置およびプログラム
JP2006268561A (ja) * 2005-03-24 2006-10-05 Communication Bridge:Kk 通訳管理システム
US20060248210A1 (en) * 2005-05-02 2006-11-02 Lifesize Communications, Inc. Controlling video display mode in a video conferencing system
CN1741008A (zh) 2005-09-13 2006-03-01 徐菲菲 一种使用便携式翻译机的翻译方法
CN1801860A (zh) 2005-11-03 2006-07-12 翟斌 一种远程口语翻译系统
CN1845573A (zh) * 2006-04-30 2006-10-11 南京大学 支持大容量混音的同声传译视频会议系统及方法
JP4271224B2 (ja) * 2006-09-27 2009-06-03 株式会社東芝 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム
CN101702762B (zh) 2006-09-30 2012-03-21 华为技术有限公司 一种实现多语言会议的多点控制单元和会议终端
CN1937664B (zh) * 2006-09-30 2010-11-10 华为技术有限公司 一种实现多语言会议的系统及方法

Also Published As

Publication number Publication date
US9031849B2 (en) 2015-05-12
EP2073543A1 (en) 2009-06-24
EP2073543B1 (en) 2011-07-06
EP2073543B9 (en) 2012-02-29
RU2009116477A (ru) 2010-11-20
CN1937664A (zh) 2007-03-28
ATE515884T1 (de) 2011-07-15
JP2010506444A (ja) 2010-02-25
EP2073543A4 (en) 2009-09-23
JP5534813B2 (ja) 2014-07-02
CN1937664B (zh) 2010-11-10
US20090187400A1 (en) 2009-07-23
WO2008040258A1 (en) 2008-04-10

Similar Documents

Publication Publication Date Title
RU2426247C2 (ru) Система, способ и многоточечный блок управления для реализации многоязычной конференцсвязи
JP4231698B2 (ja) 多地点マルチメディア/音声システムの制御ユニット
US8243120B2 (en) Method and device for realizing private session in multipoint conference
CN108076306B (zh) 会议实现方法、装置、设备和系统、计算机可读存储介质
US7940705B2 (en) Method and system for blocking communication within a conference service
EP1360798B1 (en) Control unit for multipoint multimedia/audio conference
US8649300B2 (en) Audio processing method, system, and control server
US7058168B1 (en) Method and system for participant control of privacy during multiparty communication sessions
US7929011B2 (en) Method and system for handling video signals of conference
US20110261151A1 (en) Video and audio processing method, multipoint control unit and videoconference system
US8170191B2 (en) Method and system for handling audio signals of conference
CN101656863A (zh) 一种会议控制的方法、装置和系统
CN101702762A (zh) 一种实现多语言会议的多点控制单元和会议终端
WO2014026478A1 (zh) 一种视频会议信号处理的方法、视频会议服务器及系统
JPH0698030A (ja) 通信会議方式および装置
KR20020014068A (ko) 화상 회의 시스템과 이를 위한 통화 환경 구축 방법
KR20020014067A (ko) 압축된 음성 데이터를 이용한 회의 통화 시스템과 이를위한 통화 환경 구축 방법