RU2370829C2 - Method for authorisation of voice commands used in interactive video presentation system - Google Patents

Method for authorisation of voice commands used in interactive video presentation system Download PDF

Info

Publication number
RU2370829C2
RU2370829C2 RU2007142859/09A RU2007142859A RU2370829C2 RU 2370829 C2 RU2370829 C2 RU 2370829C2 RU 2007142859/09 A RU2007142859/09 A RU 2007142859/09A RU 2007142859 A RU2007142859 A RU 2007142859A RU 2370829 C2 RU2370829 C2 RU 2370829C2
Authority
RU
Russia
Prior art keywords
presentation
image
computer
command
commands
Prior art date
Application number
RU2007142859/09A
Other languages
Russian (ru)
Other versions
RU2007142859A (en
Inventor
Виктор Валентинович БУЧА (RU)
Виктор Валентинович Буча
Original Assignee
Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд."
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." filed Critical Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд."
Priority to RU2007142859/09A priority Critical patent/RU2370829C2/en
Priority to KR1020080082367A priority patent/KR20090052794A/en
Priority to US12/274,634 priority patent/US20090132926A1/en
Publication of RU2007142859A publication Critical patent/RU2007142859A/en
Application granted granted Critical
Publication of RU2370829C2 publication Critical patent/RU2370829C2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Position Input By Displaying (AREA)

Abstract

FIELD: information technologies.
SUBSTANCE: invention is related to functioning of video presentation systems, namely to methods for organisation of interaction between user and presentation system by means of radiation device and device that performs recording and analysis of speech. This result is achieved due to processing of obtained voice command parallel with processing of confirmation light signal. At the same time light signal used is projection of light image to presentation screen from pre-established set of reference images, for every of which an association is pre-established with one of voice commands included into pre-established set of commands. In case when confirmation light signal is recognised by control device as matching with reference image, voice command is converted into command for computer and is performed.
EFFECT: higher accuracy in system performance of maximum number of user-performed operations with demonstrated video images.
2 dwg

Description

Изобретение относится к функционированию видеопрезентационных систем, а более конкретно - к способам организации взаимодействия между пользователем и презентационной системой посредством излучающего устройства, например лазерной указки, устройства, производящего запись и анализ речи.The invention relates to the operation of video presentation systems, and more particularly, to methods for organizing interaction between a user and a presentation system by means of a radiating device, such as a laser pointer, a device that records and analyzes speech.

В настоящее время практически каждая компьютерная презентационная система управляется с помощью активных компьютерных устройств ввода, таких как устройства типа «мышь», световое перо, трек-бол или клавиатура. Однако использование таких устройств во время презентации не очень удобно, так как выступающий должен переключать свое внимание со зрителей на компьютерный дисплей, устройство управления или прибегать к помощи ассистента, управляющего ходом презентации. Также известны устройства дистанционного управления презентацией, передающие управляющие сигналы посредством инфракрасной или радиосвязи. Однако и данный тип устройств требует повышенного внимания докладчика и взаимодействия с проектором или компьютером с помощью устройства дистанционного управления.Currently, almost every computer presentation system is controlled using active computer input devices, such as mouse devices, a light pen, trackball, or keyboard. However, the use of such devices during the presentation is not very convenient, since the speaker must switch his attention from the audience to a computer display, control device or resort to the help of an assistant who manages the presentation. Presentation remote control devices transmitting control signals via infrared or radio are also known. However, this type of device also requires increased speaker attention and interaction with a projector or computer using a remote control device.

Также известны интерактивные презентационные системы, управляемые с помощью устройств типа лазерная указка. Суть данных систем состоит в следующем: лазерный луч проецируется на презентационный экран, формируя световой сигнал в определенной области экрана. Положение спроецированного лазерного пятна и другие его характеристики (цвет, характер движения и т.п.) фиксируются видеокамерой и обрабатываются в модуле управления для распознавания характеристик спроецированного лазерного пятна; данные характеристики используются для изменения положения курсора компьютера или выполнения определенных команд, например переход к следующему слайду.Also known are interactive presentation systems controlled by laser pointer devices. The essence of these systems is as follows: a laser beam is projected onto a presentation screen, forming a light signal in a specific area of the screen. The position of the projected laser spot and its other characteristics (color, nature of movement, etc.) are recorded by the video camera and processed in the control module to recognize the characteristics of the projected laser spot; These characteristics are used to change the position of the computer cursor or execute certain commands, for example, moving to the next slide.

Известны системы управления презентацией с помощью голосовых команд, которые распознаются в управляющем устройстве и преобразовываются в соответствующие команды. Однако другой человек или сам выступающий может произнести случайно или намерено голосовую команду, на которую не следует реагировать. Поэтому необходимо обеспечить естественный и удобный способ управления компьютерной презентацией, который сочетал бы в себе удобное управление курсором компьютера и санкционированное выступающим выполнение голосовых команд, управляющих ходом презентации.Presentation control systems using voice commands are known that are recognized in the control device and converted into corresponding commands. However, another person or the speaker himself may accidentally or intentionally utter a voice command that should not be responded to. Therefore, it is necessary to provide a natural and convenient way to control a computer presentation, which would combine convenient control of the computer cursor and authorized performance of voice commands that control the presentation.

В патентах США No.5,138,304 [1] и 5,181,015 [2] описывается интерактивная видеосистема, которая управляется с помощью светового пера. В этой системе свет, отраженный от спроецированного изображения, сравнивается с исходным видеосигналом для определения местоположения светового пера. Местоположение светового пера используется для управления компьютерным курсором. Однако световые перья, используемые в данных патентах, позволяют осуществлять управление курсором только с небольшого расстояния и соединены с компьютером проводной связью.US Pat. Nos. 5,138,304 [1] and 5,181,015 [2] describe an interactive video system that is controlled by a light pen. In this system, the light reflected from the projected image is compared with the original video signal to determine the location of the light pen. The location of the light pen is used to control the computer cursor. However, the light pens used in these patents allow the cursor to be controlled only from a short distance and are wired to the computer.

В патенте США No.5,115,230 [3] обычное световое неизлучающее световое перо заменяется на излучающую ручную лазерную указку. Видеокамера размещается позади проекционного экрана для записи видео, которое обрабатывается в анализирующем модуле для определения позиции лазерного пятна. Информация о позиции передается в компьютер и используется для отображения компьютерного курсора.In US Pat. No. 5,115,230 [3], a conventional light-emitting non-emitting light pen is replaced with an emitting hand-held laser pointer. The video camera is located behind the projection screen for recording video, which is processed in the analysis module to determine the position of the laser spot. Information about the position is transmitted to the computer and used to display the computer cursor.

Комбинация лазерной указки и инфракрасной связи для передачи команд, эмулирующих работу манипулятора типа мышь, описана в патентах США No.6,910,778 [4] и No.6,331,848 [5]. Выполнение команд для управления презентацией, таких как увеличение масштаба, следующий слайд, выделение объектов, может быть затруднено.The combination of a laser pointer and infrared communication for transmitting commands emulating the operation of a mouse-type manipulator is described in US Pat. Nos. 6,910,778 [4] and No.6,331,848 [5]. Executing commands to control the presentation, such as zooming in, the next slide, selecting objects, can be difficult.

Исполнение таких команд можно обеспечить следующим способом. В патенте США No6,331,848 [6] программные кнопки проецируют на экран. Указывая и удерживая в течение некоторого времени на соответствующей кнопке лазерное пятно, можно добиться исполнения команды, ассоциированной с данной кнопкой. Однако такой подход может быть не всегда удобным, так как требует размещения дополнительных элементов на экране, что снижает качество восприятия презентации.The execution of such commands can be ensured in the following way. In US Pat. No. 6,331,848 [6], soft buttons project onto the screen. By pointing and holding the laser spot on the corresponding button for some time, you can achieve the execution of the command associated with this button. However, this approach may not always be convenient, since it requires the placement of additional elements on the screen, which reduces the quality of perception of the presentation.

Наиболее близким по техническим признакам к данному изобретению является патент США 7,091,949 [7], в котором описывается презентационная система, способная выполнять команды в зависимости от цвета/формы/размеров и других свойств спроецированного лазерного пятна. Основное отличие данного изобретения состоит в том, что спроецированное лазерное пятно используется не самостоятельно, а для авторизации и выполнения голосовой команды. Другими словами, управление презентацией основано на анализе голосовой команды выступающего, а авторизация производиться с помощью лазерной указки.The closest in technical features to this invention is US patent 7,091,949 [7], which describes a presentation system that can execute commands depending on the color / shape / size and other properties of the projected laser spot. The main difference of this invention is that the projected laser spot is not used independently, but for authorization and voice command execution. In other words, presentation management is based on the analysis of the speaker’s voice command, and authorization is performed using a laser pointer.

Общим недостатком, присущим большинству существующих способов управления ходом презентации, является то, что они не позволяют обеспечить естественное для пользователя управление компьютерным курсором и выполнение презентационных команд. Действительно, наиболее естественным способом управления ходом презентации можно считать голосовую команду, при этом система презентации должна выделять голосовую команду выступающего (докладчика) из окружающего акустического шума, например реплик и вопросов аудитории. Поскольку устройства для идентификации голоса являются сложными и дорогостоящими, то чаще применяются другие технические средства, которые в сочетании с голосовой командой обеспечивают выполнение интерактивной системой видеопрезентации требуемых действий. Это наиболее явно представлено в прототипе [7].A common drawback inherent in most of the existing methods for controlling the presentation is that they do not allow the user to control the computer cursor naturally and execute presentation commands. Indeed, the most natural way to control the presentation can be considered as a voice command, while the presentation system should distinguish the voice command of the speaker (speaker) from ambient acoustic noise, for example, replicas and audience questions. Since devices for voice identification are complex and expensive, other technical means are more often used, which, in combination with a voice command, ensure that the interactive video presentation system performs the required actions. This is most clearly represented in the prototype [7].

Задача, на решение которой направлено заявляемое изобретение, заключается в разработке такого способа авторизации голосовых команд, который позволил бы докладчику с минимальным отвлечением внимания санкционировать выполнение максимального числа операций с демонстрируемыми видеоизображениями. Подразумевается, что новый способ потребует также разработки новой системы - совокупности определенных устройств - для оптимальной реализации такого способа.The task to which the claimed invention is directed is to develop such a method of authorizing voice commands that would allow the speaker with minimal distraction to authorize the execution of the maximum number of operations with the displayed video images. It is understood that the new method will also require the development of a new system - a set of specific devices - for the optimal implementation of this method.

Поставленная задача решена за счет разработки усовершенствованного способа авторизации голосовых команд, используемых в интерактивной видеопрезентационной системе, включающего в себя обработку полученной голосовой команды параллельно с обработкой подтверждающего светового сигнала, отличающегося тем, что в качестве светового сигнала используют проекцию на презентационный экран светового образа из предустановленного набора образов, для каждого из которых предустанавливают ассоциацию с одной из голосовых команд, включенных в предустановленный набор команд.The problem is solved by developing an improved method for authorizing voice commands used in an interactive video presentation system, which includes processing the received voice command in parallel with processing the confirming light signal, characterized in that the projection onto the presentation screen of the light image from a predefined set images for each of which preset an association with one of the voice commands included in the pre an established set of commands.

Этот способ предлагается реализовывать с помощью интерактивной видеопрезентационной системы, включающей в себя:This method is proposed to be implemented using an interactive video presentation system, including:

проекционный экран, презентационный компьютер с подключенными к нему проектором видеоизображений и микрофоном, регистрирующим голосовые команды, а также излучающее устройство, формирующее световой сигнал на проекционном экране, при этом излучающее устройство выполнено с возможностью проецирования на проекционный экран любого из образов, выбранных пользователем из заложенного в излучающее устройство набора образов, при этом в систему дополнительно включены следующие элементы, подключенные к презентационному компьютеру: по меньшей мере, одна видеокамера, установленная с возможностью захвата изображений, формируемых на презентационном экране; управляющее устройство, выполненное с возможностью распознавания проецируемых излучающим устройством образов и захваченных микрофоном голосовых команд; модуль генерации компьютерных команд, выполненный с возможностью формирования и передачи команд в презентационный компьютер для модификации проецируемого изображения.a projection screen, a presentation computer with a video projector and a microphone that records voice commands, as well as a radiating device that generates a light signal on the projection screen, while the radiating device is configured to project onto the projection screen any of the images selected by the user from a radiating device of a set of images, while the following elements connected to a presentation computer are additionally included in the system: at least Leray, one video camera mounted with the ability to capture images formed on the presentation screen; a control device configured to recognize images projected by the radiating device and voice commands captured by the microphone; a module for generating computer commands, configured to generate and transmit commands to a presentation computer to modify the projected image.

Иными словами, для предотвращения несанкционированного исполнения голосовой команды предлагается использовать проецируемый с помощью лазерной указки или другого излучающего устройства образ на проекционный экран. Данный образ распознается устройством управления и сопоставляется с эталоном. При их совпадении голосовая команда преобразуется в команду для компьютера и выполняется. С другой стороны, требуется обеспечить управление компьютерным курсором для выполнения операций выделения текста и объектов и т.д. Наиболее естественным способом такого взаимодействия пользователя с презентационной системой является использование лазерной указки для проецирования на презентационный экран лазерного пятна/образа, местоположение которого определяется системой управления и используется для передвижения/модификации компьютерного курсора и проецируемого изображения.In other words, to prevent unauthorized execution of a voice command, it is proposed to use the image projected on a projection screen using a laser pointer or other emitting device. This image is recognized by the control device and compared with the standard. When they match, the voice command is converted into a command for the computer and executed. On the other hand, it is required to provide control of the computer cursor to perform operations of selecting text and objects, etc. The most natural way of this user interaction with the presentation system is to use a laser pointer to project a laser spot / image onto the presentation screen, the location of which is determined by the control system and used to move / modify the computer cursor and the projected image.

Что касается реализации заявляемого способа, то для этого предложена интерактивная презентационная система, с которой пользователь взаимодействует с помощью излучающего устройства (ручная лазерная указка) и голосовых команд. Лазерная указка способна проецировать на презентационный экран лазерное пятно (образ) различной формы. Проецируемый образ выбирается нажатием соответствующих кнопок, расположенных на корпусе излучающего устройства. Количество кнопок, их расположение и проецируемые образы зависят от конкретной реализации презентационной системы. Конкретизация конструкции соответствующего излучающего устройства, способного проецировать образы различных форм, выходит за рамки текущего изобретения, однако на сегодняшний день электронный рынок предлагает весьма широкий выбор многофункциональных световых указок.As for the implementation of the proposed method, an interactive presentation system is proposed for this, with which the user interacts using a radiating device (hand-held laser pointer) and voice commands. The laser pointer is capable of projecting a laser spot (image) of various shapes onto the presentation screen. The projected image is selected by pressing the appropriate buttons located on the body of the emitting device. The number of buttons, their location and the projected images depend on the specific implementation of the presentation system. Concretization of the design of the corresponding radiating device capable of projecting images of various shapes is beyond the scope of the current invention, however, today the electronic market offers a very wide selection of multifunctional light pointers.

Спроецированный на презентационный экран образ и изображение презентации записывают с помощью одного или нескольких устройств видеозаписи. Устройства видеозаписи размещают либо перед экраном, либо за ним. Записанную видеопоследовательность передают в управляющее устройство, где и обрабатывают ее в режиме реального времени. Также в управляющее устройство передают цифровое аудио, которое содержит презентационное выступление и голосовые команды докладчика. Запись аудиоинформации выполняют с помощью микрофона, преобразование в цифровой вид выполняют с помощью цифроаналогового преобразователя (ЦАП).The image and presentation image projected onto the presentation screen are recorded using one or more video recorders. Video recorders are placed either in front of or behind the screen. The recorded video sequence is transmitted to the control device, where it is processed in real time. Also, digital audio is transmitted to the control device, which contains a presentation speech and voice commands of the speaker. Recording audio information is performed using a microphone, conversion to digital form is performed using a digital-to-analog converter (DAC).

Процесс работы предлагаемой презентационной системы может быть описан следующим образом. Во время презентации с помощью компьютера генерируют презентационные изображения, которые проецируют на презентационный экран с помощью проектора. В тот же самый момент докладчик может проецировать на тот же экран световой образ с помощью лазерной указки. Видеокамера фиксирует формируемое на презентационном экране изображение, которое состоит из презентационного изображения и проецируемого лазерного образа. С помощью системы управления анализируют получаемую видеокамерой видеопоследовательность для нахождения светового образа и вычисляют его местоположение в координатах презентационного изображения. Каждый световой образ ассоциируют с презентационной командой, такой, например, как нажатие клавиши мыши, выделение текста, рисование на презентационном изображении, следующий слайд и т.д. Распознавание светового образа осуществляют с помощью известных методов распознавания образов и обработки изображений. Распознанный образ преобразовывают в команду, которая передается и выполняется на презентационном компьютере. В результате презентационное изображение изменяют по желанию выступающего.The process of the proposed presentation system can be described as follows. During the presentation, presentation images are generated using a computer and projected onto the presentation screen using a projector. At the same moment, the presenter can project a light image onto the same screen using a laser pointer. The camcorder captures the image formed on the presentation screen, which consists of the presentation image and the projected laser image. Using the control system, the video sequence received by the camera is analyzed to find the light image and its location is calculated in the coordinates of the presentation image. Each light image is associated with a presentation team, such as, for example, pressing a mouse button, highlighting text, drawing on a presentation image, the next slide, etc. The recognition of the light image is carried out using well-known methods of pattern recognition and image processing. The recognized image is converted into a command, which is transmitted and executed on the presentation computer. As a result, the presentation image is changed at the request of the speaker.

Движение светового образа также отслеживается в управляющей системе и используется для изменения местоположения компьютерного курсора. В зависимости от выбранного режима курсор может использоваться для выделения объектов или рисования графических примитивов на презентационном изображении.The movement of the light image is also tracked in the control system and is used to change the location of the computer cursor. Depending on the selected mode, the cursor can be used to highlight objects or draw graphic primitives on a presentation image.

Важной презентационной командой является команда санкционирования голосовой команды, которую записывает с помощью микрофона и анализируют в управляющем устройстве. Выступающий произносит голосовую команду, которая распознается в управляющем устройстве и преобразуется в команду для выполнения на компьютере. Отметим, что отсутствие речи или звуков тоже может рассматриваться как «голосовая команда».An important presentation team is the voice command authorization team, which is recorded using a microphone and analyzed in the control device. The speaker makes a voice command, which is recognized in the control device and converted into a command to be executed on the computer. Note that the absence of speech or sounds can also be considered as a “voice command”.

Однако для выполнения соответствующей компьютерной команды необходимо получить дополнительное подтверждение в виде соответствующего спроецированного на презентационный экран лазерного образа. Данное подтверждение может быть получено непосредственно до, во время и непосредственно после голосовой команды.However, to execute the corresponding computer command, it is necessary to obtain additional confirmation in the form of the corresponding laser image projected onto the presentation screen. This confirmation can be received immediately before, during, and immediately after a voice command.

Также голосовая команда или пауза выступающего может быть использована для авторизации компьютерной команды, сгенерированной проецируемым образом.Also, a voice command or a speaker pause can be used to authorize a computer command generated by the projected image.

Предлагаемый способ позволяет значительно снизить вероятность несанкционированного управления презентационной системой. Также снижается вероятность ошибочной реакции на ключевые слова, содержащиеся в голосовых командах. Данное изобретение позволяет выступающему сконцентрироваться на выступлении и аудитории и обеспечивает естественный способ взаимодействия и управления презентационной системой.The proposed method can significantly reduce the likelihood of unauthorized management of the presentation system. The likelihood of an erroneous reaction to keywords contained in voice commands is also reduced. This invention allows the speaker to concentrate on the presentation and the audience and provides a natural way of interacting and managing the presentation system.

Фиг.1 представляет собой схему компонентов презентационной системы согласно изобретению.Figure 1 is a diagram of the components of a presentation system according to the invention.

Фиг.2 отображает набор световых образов, проецируемых лазерной указкой и распознаваемых устройством управления.Figure 2 displays a set of light images projected by a laser pointer and recognized by the control device.

На Фиг.1 изображены компоненты интерактивной презентационной системы, состоящей из: излучающего устройства 2 (например, лазерная указка), выполненного с возможностью проецирования световых образов разной формы; презентационного компьютера 9, генерирующего презентационные изображения; проектора 7, подключенного к презентационному компьютеру 9 и осуществляющего проецирование изображений на презентационный экран 14; цифровой видеокамеры 8, микрофона 19 и управляющей системы 10 с закодированными образами (Фиг.2) и голосовыми командами для последующего распознавания.Figure 1 shows the components of an interactive presentation system consisting of: a radiating device 2 (for example, a laser pointer), configured to project light images of different shapes; presentation computer 9, generating presentation images; a projector 7 connected to the presentation computer 9 and projecting images onto the presentation screen 14; digital video camera 8, microphone 19 and the control system 10 with encoded images (Figure 2) and voice commands for subsequent recognition.

Во время презентации презентационный компьютер 9 генерирует видеопоток 15.1, состоящий из презентационных изображений. Данный видеопоток преобразуют в световой поток 16, который проецируют на презентационный экран 14, на котором формируется презентационное изображение 5.During the presentation, the presentation computer 9 generates a video stream 15.1, consisting of presentation images. This video stream is converted into a light stream 16, which is projected onto a presentation screen 14, on which a presentation image 5 is formed.

Выступающий 1 интерактивно управляет презентационной системой с помощью излучающего устройства 2 путем проецирования на презентационный экран 14 световых образов (Фиг.2). Излучающее устройство 2 имеет функциональные клавиши 4. Путем нажатия на одну из таких клавиш выбирают соответствующий образ, который проецируют на презентационный экран 14 с помощью лазерного луча 3.The speaker 1 interactively controls the presentation system using the emitting device 2 by projecting light images onto the presentation screen 14 (FIG. 2). The radiating device 2 has function keys 4. By pressing one of these keys, the corresponding image is selected, which is projected onto the presentation screen 14 using a laser beam 3.

Каждый проецируемый образ ассоциируют с определенной командой. Поэтому выступающий 1 должен нажать соответствующую клавишу 4 для авторизации закрепленной за ней команды. Ассоциация команды с образом либо жестко фиксируется и программируется, либо назначается пользователем во время установки и настройки презентационной системы.Each projected image is associated with a specific team. Therefore, speaker 1 must press the corresponding key 4 to authorize the team assigned to it. The association of the team with the image is either fixed and programmed rigidly, or assigned by the user during installation and configuration of the presentation system.

Спроецированный образ 6 и презентационное изображение 5 формируют общее изображение 17, которое записывается цифровой видеокамерой 8. Последовательность записанных изображений 13 передается в систему управления 10. На вход системы управления 10 также подается исходное презентационное изображение для проецирования 15.2. Система управления 10 также содержит закодированные образы 12, которые идентичны образам, проецируемым с помощью излучающего устройства 2. Система управления включает в себя модуль распознавания образов и речи 11, который сравнивает проецируемые изображения 15.2 с захваченными камерой изображениями 13, осуществляет поиск проецируемых образов и их местоположение. Затем распознанный образ конвертируют в команду или в авторизацию голосовой команды с помощью модуля генерации команд 18, согласно ассоциации образа и команды. Сгенерированная команда передается в презентационный компьютер для модификации проецируемого изображения. Для дополнительного подтверждения выполнения сгенерированной команды можно использовать соответствующую голосовую команду или паузу выступающего.The projected image 6 and the presentation image 5 form a common image 17, which is recorded by a digital video camera 8. The sequence of recorded images 13 is transmitted to the control system 10. An initial presentation image for projection 15.2 is also input to the control system 10. The control system 10 also contains encoded images 12, which are identical to the images projected using the emitting device 2. The control system includes an image and speech recognition module 11, which compares the projected images 15.2 with the images captured by the camera 13, searches for projected images and their location . Then, the recognized image is converted into a command or voice command authorization using the command generation module 18, according to the image and command association. The generated command is transmitted to the presentation computer to modify the projected image. To further confirm the execution of the generated command, you can use the corresponding voice command or the speaker pause.

Модуль распознавания образов и речи 11 также отвечает за распознавание голосовых команд, записываемых с помощью микрофона 19. Для выполнения распознанной речевой команды необходимо получить подтверждение в виде определенного образа, спроецированного на презентационный экран.The pattern and speech recognition module 11 is also responsible for recognizing voice commands recorded using the microphone 19. To execute the recognized speech command, you need to receive confirmation in the form of a specific image projected onto the presentation screen.

Презентационная система, использующая заявляемый способ взаимодействия, может найти применение для помехоустойчивого управления компьютерными презентациями и электронными досками. Предложенный способ и реализующая его система могут использоваться вместо активных устройств (мышь, клавиатура и т.д.) для управления компьютерным курсором, для выбора и выполнения компьютерных команд, а также для ввода текстовой информации.A presentation system using the claimed method of interaction may find application for noise-immune control of computer presentations and electronic boards. The proposed method and its implementing system can be used instead of active devices (mouse, keyboard, etc.) to control the computer cursor, to select and execute computer commands, and also to enter text information.

Claims (1)

Способ авторизации голосовых команд, используемых в интерактивной видеопрезентационной системе, включающий в себя обработку полученной голосовой команды параллельно с обработкой подтверждающего светового сигнала, отличающийся тем, что в качестве светового сигнала используют проекцию на презентационный экран светового образа из предустановленного набора образов-эталонов, для каждого из которых предустанавливают ассоциацию с одной из голосовых команд, включенных в предустановленный набор команд, при этом голосовая команда преобразуется в команду для компьютера и выполняется только в том случае, если подтверждающий световой образ распознается устройством управления как совпадающий с образом-эталоном. A method of authorizing voice commands used in an interactive video presentation system, including processing the received voice command in parallel with processing the confirming light signal, characterized in that the projection onto the presentation screen of the light image from a predefined set of image standards is used as a light signal, for each of which preset the association with one of the voice commands included in the predefined set of commands, while the voice command converts It is entered into the command for the computer and is executed only if the confirming light image is recognized by the control device as coinciding with the reference image.
RU2007142859/09A 2007-11-21 2007-11-21 Method for authorisation of voice commands used in interactive video presentation system RU2370829C2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2007142859/09A RU2370829C2 (en) 2007-11-21 2007-11-21 Method for authorisation of voice commands used in interactive video presentation system
KR1020080082367A KR20090052794A (en) 2007-11-21 2008-08-22 Interactive presentation system and method of authorization of voice commands, controlling process of presentation
US12/274,634 US20090132926A1 (en) 2007-11-21 2008-11-20 Interactive presentation system and authorization method for voice command controlling interactive presentation process

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2007142859/09A RU2370829C2 (en) 2007-11-21 2007-11-21 Method for authorisation of voice commands used in interactive video presentation system

Publications (2)

Publication Number Publication Date
RU2007142859A RU2007142859A (en) 2009-05-27
RU2370829C2 true RU2370829C2 (en) 2009-10-20

Family

ID=40860461

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2007142859/09A RU2370829C2 (en) 2007-11-21 2007-11-21 Method for authorisation of voice commands used in interactive video presentation system

Country Status (2)

Country Link
KR (1) KR20090052794A (en)
RU (1) RU2370829C2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016183013A1 (en) * 2015-05-11 2016-11-17 Lily Robotics, Inc. External microphone for an unmanned aerial vehicle
US9922659B2 (en) 2015-05-11 2018-03-20 LR Acquisition LLC External microphone for an unmanned aerial vehicle

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200012408A (en) * 2018-07-27 2020-02-05 (주)휴맥스 Smart projector and method for controlling thereof

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016183013A1 (en) * 2015-05-11 2016-11-17 Lily Robotics, Inc. External microphone for an unmanned aerial vehicle
US9598182B2 (en) 2015-05-11 2017-03-21 Lily Robotics, Inc. External microphone for an unmanned aerial vehicle
US9922659B2 (en) 2015-05-11 2018-03-20 LR Acquisition LLC External microphone for an unmanned aerial vehicle

Also Published As

Publication number Publication date
RU2007142859A (en) 2009-05-27
KR20090052794A (en) 2009-05-26

Similar Documents

Publication Publication Date Title
US20090132926A1 (en) Interactive presentation system and authorization method for voice command controlling interactive presentation process
US7113169B2 (en) Apparatus and method for a multiple-user interface to interactive information displays
US6840627B2 (en) Interactive display device
US8555171B2 (en) Portable virtual human-machine interaction device and operation method thereof
US9031847B2 (en) Voice-controlled camera operations
JP5601045B2 (en) Gesture recognition device, gesture recognition method and program
US20110242054A1 (en) Projection system with touch-sensitive projection image
EP3759707B1 (en) A method and system for musical synthesis using hand-drawn patterns/text on digital and non-digital surfaces
CN103365617B (en) One kind projection control system, device and method for controlling projection
US20040061680A1 (en) Method and apparatus for computer control
US6538645B1 (en) Computer input system utilizing a camera to sense point source
CN108646578B (en) Medium-free aerial projection virtual picture and reality interaction method
CN101359251A (en) Optical remote-control system and method applying to computer projection picture
RU2370829C2 (en) Method for authorisation of voice commands used in interactive video presentation system
US20070164992A1 (en) Portable computing device for controlling a computer
AU2011362920B2 (en) Method and device for generating image keyboard
JP2014526183A (en) Sensor means for a television receiver.
KR20130054131A (en) Display apparatus and control method thereof
US20190073808A1 (en) Terminal apparatus, information processing system, and display control method
CN112822468A (en) Projection control method and device, projection equipment and laser controller
KR101491648B1 (en) System and Method for remote control using camera
JP2020037155A (en) Gesture control device and gesture control program
KR102036279B1 (en) Presentation control system using user presentation pattern
CN117389415A (en) Operation method, device, electronic equipment and readable storage medium
Kavitha et al. Interactive Screens Using Hand Gestures and Microcontroller

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20151122