RU2792947C2 - Method and system for audio signal supplement - Google Patents
Method and system for audio signal supplement Download PDFInfo
- Publication number
- RU2792947C2 RU2792947C2 RU2021121563A RU2021121563A RU2792947C2 RU 2792947 C2 RU2792947 C2 RU 2792947C2 RU 2021121563 A RU2021121563 A RU 2021121563A RU 2021121563 A RU2021121563 A RU 2021121563A RU 2792947 C2 RU2792947 C2 RU 2792947C2
- Authority
- RU
- Russia
- Prior art keywords
- given
- audio
- audio clip
- audio signal
- value
- Prior art date
Links
Images
Abstract
Description
Область техники, к которой относится изобретениеThe technical field to which the invention belongs
[001] Настоящее изобретение относится к области обработки сигналов в целом и, в частности, к способу и системе для дополнения аудиоролика.[001] The present invention relates to the field of signal processing in general and, in particular, to a method and system for supplementing an audio clip.
Уровень техникиState of the art
[002] Электронные устройства, такие как смартфоны и планшеты, могут осуществлять доступ к растущему и разнообразному количеству приложений и служб обработки и/или доступ к информации разных типов. Однако начинающие пользователи и/или пользователи с ограниченными возможностями и/или пользователи могут быть не в состоянии эффективно взаимодействовать с такими устройствами в основном из-за разнообразия функций, предоставляемых этими устройствами, или невозможности использовать машинно-пользовательские интерфейсы, предоставляемые такими устройствами (например, клавиатуру). Например, водитель или слабовидящий пользователь может не иметь возможности использовать сенсорный экран или клавиатуру, связанную с некоторыми из этих устройств. [002] Electronic devices such as smartphones and tablets can access a growing and diverse number of applications and processing services and/or access different types of information. However, novice and/or disabled users and/or users may not be able to interact effectively with such devices primarily due to the variety of functions provided by these devices or the inability to use the machine user interfaces provided by such devices (e.g., keyboard). For example, a driver or visually impaired user may not be able to use the touch screen or keyboard associated with some of these devices.
[003] Приложения виртуального помощника были разработаны для выполнения функций в ответ на такие запросы пользователей. Такие приложения виртуального помощника могут использоваться, например, для поиска информации, навигации, а также для широкого спектра команд. Обычное приложение виртуального помощника (такое как приложение виртуального помощника Siri™, приложение виртуального помощника Alexa™ и т.п.) может принимать голосовое высказывание пользователя в форме цифрового аудиосигнала от электронного устройства и выполнять широкий спектр задач для пользователя. Например, пользователь может общаться с приложением виртуального помощника, предоставляя речевые высказывания для запроса, например, какая сейчас погода, где находится ближайший торговый центр и т.п. В ответ приложение виртуального помощника может предоставить пользователю соответственный ответ, например, «Торговый центр Rockland находится всего в 7 минутах ходьбы от Вас» или «На улице тепло и солнечно, Вам не нужно брать зонтик».[003] Virtual assistant applications have been designed to perform functions in response to such user requests. Such virtual assistant applications can be used for information retrieval, navigation, and a wide range of commands, for example. A typical virtual assistant application (such as a Siri™ virtual assistant, Alexa™ virtual assistant application, etc.) can receive the user's voice in the form of a digital audio signal from an electronic device and perform a wide range of tasks for the user. For example, the user may communicate with the virtual assistant application by providing verbal cues to query, such as what the weather is like now, where the nearest mall is, and so on. In response, the virtual assistant application can provide the user with an appropriate response, such as "Rockland Mall is only 7 minutes away from you" or "It's warm and sunny outside, you don't need to take an umbrella."
[004] Чтобы приложение виртуального помощника могло предоставлять такие ответы, прежде всего, алгоритм машинного обучения (MLA) может быть обучен на основе обучающего набора данных, чтобы генерировать соответственные ответы в ответ на команды пользователя. Например, набор обучающих данных может включать в себя разные обучающие объекты, один из которых может включать в себя указание обучающей пользовательской команды и метку, включающую в себя указание соответственного обучающего ответа. Поскольку набор обучающих данных может включать в себя большое количество обучающих объектов (например, тысячи или даже десятки или сотни тысяч), набор обучающих данных может быть получен посредством назначения цифровых задач оценивающим людям через краудсорсинговые платформы, такие как краудсорсинговая платформа Amazon Mechanical Turk™, краудсорсинговая платформа Яндекс Толока™ и т.д., которым были предоставлены инструкции по маркировке обучающих пользовательских команд.[004] In order for the virtual assistant application to provide such responses, first of all, a machine learning algorithm (MLA) can be trained based on the training dataset to generate appropriate responses in response to user commands. For example, the training data set may include different training objects, one of which may include an indication of a training user command and a label including an indication of a corresponding training response. Since the training dataset may include a large number of training objects (e.g., thousands or even tens or hundreds of thousands), the training dataset can be obtained by assigning digital tasks to scoring people through crowdsourcing platforms such as the Amazon Mechanical crowdsourcing platform. Turk™, crowdsourcing platform Yandex Toloka™, etc., who were provided with instructions for labeling training user commands.
[005] Кроме того, после того, как MLA обучен генерировать ответы, ответы могут быть записаны, и тем же или другим оценивающим людям могут быть предоставлены записи и даны инструкции, например, расшифровать их для приложения виртуального помощника и/или проверить, правильно ли работает приложение виртуального помощника, предоставляя ожидаемые ответы на примеры пользовательских команд.[005] In addition, once the MLA has been trained to generate responses, the responses may be recorded and the same or other evaluators may be provided with the recordings and given instructions to, for example, decode them for the virtual assistant application and/or check if the the virtual assistant application works, providing the expected responses to sample user commands.
[006] Однако некоторые оценивающие люди могут намеренно или непреднамеренно открыть публичный доступ к записям, которые им предоставили для выполнения цифровых задач, как указано выше. Например, оценивающие люди могут перезаписывать записи, используя свои личные электронные устройства, и в дальнейшем размещать сгенерированные таким образом копии записей на своих страницах в социальных сетях.[006] However, some evaluators may intentionally or unintentionally make publicly available records that they have been given to perform digital tasks, as described above. For example, evaluators can re-record entries using their personal electronic devices and subsequently post copies of the entries so generated on their social media pages.
[007] Как можно понять, просочившиеся записи могут раскрывать новые функции приложения виртуального помощника до их официального выпуска и могут быть дополнительно изменены и/или неправильно использованы другими пользователями, вызывая репутационный и финансовый ущерб организации, владеющей приложением виртуального помощника.[007] As can be understood, leaked recordings may reveal new features of the virtual assistant application prior to their official release and may be further modified and/or misused by other users, causing reputational and financial damage to the organization owning the virtual assistant application.
[008] Были предложены некоторые подходы предшествующего уровня техники для решения указанной выше технической проблемы.[008] Several prior art approaches have been proposed to solve the above technical problem.
[009] В Патенте США №:9,299,356-B2, выданном 29 марта 2016 г правообладателю Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV под названием «Декодер водяных знаков и способ предоставления данных двоичного сообщения» (“Watermark Decoder and Method for Providing Binary Message Data”), раскрыт декодер водяных знаков, включающий в себя поставщика представления в частотно-временной области, блок памяти, определитель синхронизации и извлекатель водяных знаков. Поставщик представления в частотно-временной области обеспечивает представление в частотной области сигнала с водяными знаками для множества временных блоков. Блок памяти хранит представление в частотной области сигнала с водяными знаками для множества временных блоков. Кроме того, определитель синхронизации идентифицирует временной блок выравнивания на основе представления в частотной области сигнала с водяными знаками множества временных блоков. Извлекатель водяных знаков предоставляет данные двоичного сообщения на основе сохраненных представлений в частотной области сигнала с водяными знаками временных блоков, временно предшествующих идентифицированному временному блоку выравнивания, с учетом расстояния до идентифицированного временного блока выравнивания.[009] BUS Patent No: 9,299,356-B2issued March 29, 2016 to the copyright holder Fraunhofer Gesellschaft zur Vorderung der Angewandten Forschung eV entitled "Watermark Decoder and Method for Providing Binary Message Data" discloses a watermark decoder including a time-frequency domain representation provider, a memory unit, a timing determiner, and a watermark extractor. . The Time-Frequency-Domain Representation Provider provides a watermarked frequency-domain representation of a signal for a plurality of time blocks. The memory unit stores the frequency domain representation of the watermarked signal for a plurality of time blocks. In addition, the timing determiner identifies a time alignment block based on the frequency domain representation of the watermarked signal of the plurality of time blocks. The watermark extractor provides binary message data based on the stored frequency domain representations of the watermarked signal of time blocks temporally preceding the identified time justification block, taking into account the distance to the identified time justification block.
[0010] В Патенте США № 8,300,820-B2, выданном 30 октября 2012 г. правообладателю CUGATE AG под названием «Способ встраивания цифрового водяного знака в полезный сигнал» (“Method of Embedding a Digital Watermark in a Useful Signal”), раскрыты способы встраивания цифрового водяного знака в полезный сигнал, при этом битовая последовательность водяного знака встроена в частотную область полезного сигнала с использованием адаптивной частотной модуляции двух заданных частот посредством отслеживания амплитуд выбранных частот исходного сигнала и их изменения в соответствии с текущим битом битовой последовательности водяного знака.[0010] BUS Patent No. 8,300,820-B2issued on October 30, 2012 to the copyright holder CUGATE AG titled "Method of Embedding a Digital Watermark in a Useful Signal", methods of embedding a digital watermark in a useful signal are disclosed, wherein the watermark bit sequence is embedded in the frequency domain of the useful signal with using adaptive frequency modulation of two given frequencies by tracking the amplitudes of the selected frequencies of the original signal and changing them in accordance with the current bit of the watermark bit sequence.
[0011] В Публикации заявки на патент США №:2020/220,935-A1, опубликованный 9 июля 2020 г. и принадлежащей Amazon Technologies Inc. под названием «Обработка речи, выполняемая в отношении профилей первого и второго пользователей в сеансе диалога» (“Speech Processing Performed with respect to First and Second User Profiles in a Dialog Session”), раскрыты методики реализации «кратковременного» идентификатора пользователя. Система принимает первые входные аудиоданные и на их основе определяет первые результаты обработки речи. Система также определяет первого пользователя, который произнес высказывание, представленное в первых входных аудиоданных. Система устанавливает многооборотный диалоговый сеанс с первым источником контента и принимает первые выходные данные из первого источника контента на основе первых результатов обработки речи и первого пользователя. Система предписывает устройству представлять первый выходной контент, связанный с первыми выходными данными. Затем система принимает вторые входные аудиоданные и на их основе определяет результаты обработки второй речи. Система также определяет, что вторые входные аудиоданные соответствуют одному и тому же многооборотному диалоговому сеансу. Система определяет второго пользователя, который произнес высказывание, представленное во вторых входных аудиоданных, и принимает вторые выходные данные из первого источника контента на основе результатов обработки второй речи и второго пользователя. Система предписывает устройству представлять второй выходной контент, связанный со вторыми выходными данными.[0011] U.S. Patent Application Publication No: 2020/220,935-A1 published July 9, 2020, owned by Amazon Technologies Inc. titled “Speech Processing Performed with respect to First and Second User Profiles in a Dialog Session”), techniques for implementing a “short-term” user identifier are disclosed. The system receives the first input audio data and determines the first results of speech processing based on them. The system also determines the first user who spoke the utterance represented in the first audio input. The system establishes a multi-turn conversational session with the first content source and receives the first output from the first content source based on the first speech processing results and the first user. The system causes the device to present the first output content associated with the first output. The system then receives the second audio input and determines the results of processing the second speech based on it. The system also determines that the second audio input corresponds to the same multi-turn dialog session. The system determines the second user who spoke the utterance represented in the second audio input and receives the second output from the first content source based on the results of processing the second speech and the second user. The system causes the device to present the second output content associated with the second output.
Сущность изобретенияThe essence of the invention
[0012] Целью настоящего изобретения является устранение, по меньшей мере, некоторых неудобств, имеющихся в предшествующем уровне техники.[0012] The purpose of the present invention is to eliminate at least some of the inconveniences found in the prior art.
[0013] Разработчики настоящего изобретения обнаружили, что персонализированные записи, которые должны быть отправлены соответственным оценивающим людям, посредством добавления к ним идентификационных водяных знаков, включающих в себя идентификационную информацию оценивающих людей (например, их идентификационный номер на их краудсорсинговой платформе), могут помочь идентифицировать оценивающего человека, от которого произошла утечка информации, и потенциально предотвратить ущерб, понесенный лицом, владеющим приложением виртуального помощника, в случае несанкционированного раскрытия его записей.[0013] The developers of the present invention have found that personalized records to be sent to the respective scoring people, by adding identification watermarks to them, including the identification information of the scoring people (for example, their identification number on their crowdsourcing platform), can help identify evaluating the person from whom the information was leaked, and potentially prevent damage suffered by the person owning the virtual assistant application in the event of unauthorized disclosure of his records.
[0014] Более конкретно, разработчики разработали системы и способы для добавления идентификационного водяного знака в соответственный аудиосигнал заданной записи посредством равной модуляции уровней энергии соответственного аудиосигнала на соответственном наборе предварительно определенных частотных уровней для каждого бита идентификационного водяного знака.[0014] More specifically, developers have developed systems and methods for adding an identification watermark to a respective audio signal of a given recording by equally modulating the energy levels of the respective audio signal at a respective set of predetermined frequency levels for each bit of the identification watermark.
[0015] Таким образом, как только идентификационный водяной знак добавлен к исходному аудиосигналу записи, он может быть дополнительно обнаружен, когда запись воспроизводится вблизи электронного устройства, выполненного с возможностью выполнения описанных здесь способов. Более конкретно, приняв аудиосигнал записи, чтобы распознать данный бит идентификационного водяного знака в нем, такое электронное устройство может быть выполнено с возможностью (1) определения в принятом аудиосигнале уровней энергии на каждом из соответственного набора предварительно определенных частотных уровней, связанных с заданным битом; (2) определения объединенного значения, указывающего определенные уровни энергии; и (3) сравнения объединенного значения с заданным пороговым значением.[0015] Thus, once an identification watermark is added to the original audio of a recording, it can be further detected when the recording is played near an electronic device capable of performing the methods described herein. More specifically, upon receiving a recording audio signal to recognize a given bit of the identification watermark therein, such an electronic device may be configured to (1) determine energy levels in the received audio signal at each of a respective set of predetermined frequency levels associated with a given bit; (2) determining a combined value indicating specific energy levels; and (3) comparing the combined value with a predetermined threshold value.
[0016] Таким образом, разработчики обнаружили, что в отличие от подхода, при котором значение каждого заданного бита соответствует уровню энергии на единственном соответственном частотном уровне соответственного аудиосигнала, настоящие способы добавления идентификационного водяного знака могут повысить надежность их обнаружения по отношению к разным типам шума, накладываемых на исходный аудиосигнал во время его передачи, воспроизведения и преобразования. В результате настоящие способы и системы могут позволить повысить качество обнаружения идентификационных водяных знаков в аудиосигналах записей, являющихся частью интеллектуальной собственности организаций, связанных с приложением виртуального помощника, что может дополнительно позволить идентифицировать оценивающих людей, нарушающих NDA. Кроме того, после выявления недобросовестных оценивающих людей, против них могут быть своевременно приняты превентивные меры, такие как ограничение дальнейшего доступа к их учетным записям на краудсорсинговых платформах, чтобы предотвратить дальнейшую утечку информации.[0016] Thus, developers have found that, in contrast to the approach in which the value of each given bit corresponds to the energy level at a single corresponding frequency level of the corresponding audio signal, the present methods of adding an identification watermark can increase the reliability of their detection with respect to different types of noise, superimposed on the original audio signal during its transmission, playback and conversion. As a result, the present methods and systems may improve the detection of identification watermarks in the audio signals of recordings that are part of the intellectual property of organizations associated with the virtual assistant application, which may further allow the identification of NDA violating raters. In addition, after unscrupulous evaluators are identified, preventive measures can be taken against them in a timely manner, such as restricting further access to their accounts on crowdsourcing platforms, in order to prevent further leakage of information.
[0017] Как можно понять, настоящие способы и системы, направленные на идентификацию пользователей, нарушающих NDA, не ограничиваются исключительно записями, используемыми в приложениях виртуального помощника; а могут, скорее, использоваться для защиты разных типов аудиороликов от незаконного раскрытия, таких как аудиоролики компаний по производству аудиозаписей, приложений по подписке на музыку и т.п.[0017] As can be understood, the present methods and systems for identifying NDA violating users are not limited solely to records used in virtual assistant applications; rather, they can be used to protect different types of audio clips from illegal disclosure, such as audio clips from audio recording companies, music subscription apps, and the like.
[0018] Более конкретно, в соответствии с первым широким аспектом настоящего изобретения предложен компьютерно-реализуемый способ.[0018] More specifically, in accordance with the first broad aspect of the present invention, a computer-implemented method is provided.
[0019] Более конкретно, в соответствии с первым широким аспектом настоящего изобретения предложен компьютерно-реализуемый способ дополнения аудиоролика, подлежащего предоставлению оценивающему человеку для выполнения одной или более цифровых задач. Дополнение предназначено для изменения аудиоролика с целью включения данных, подходящих для определения идентификационной информации оценивающего человека для определения связи между аудиороликом и оценивающим человеком. Способ выполняется на производственном сервере. Способ содержит: прием производственным сервером аудиоролика, при этом аудиоролик был предварительно записан; прием производственным сервером идентификационного указателя оценивающего человека, которому должна быть передана аудиоролика, причем идентификационный указатель представлен уникальной последовательностью битов; генерирование производственным сервером на основе уникальной последовательности битов идентификационного водяного знака, связанного с оценивающим человеком и подлежащего включению в аудиоролик для генерирования дополненного аудиоролика, при этом генерирование включает в себя: определение производственным сервером для заданного бита уникальной последовательности битов по меньшей мере двух разных частотных уровня из предварительно определенного звукового спектра для переноса значения заданного бита в аудиосигнале, связанном с дополненным аудиороликом, причем первый из по меньшей мере двух разных частотных уровней предназначен для указания значения заданного бита; другие из по меньшей мере двух разных частотных уровней предназначены для дублирования значений, указанных первой из по меньшей мере двух частот; и значение заданного бита указывается предварительно определенным уровнем энергии аудиосигнала; изменение производственным сервером аудиосигнала на предмет наличия предварительно определенного уровня энергии на каждом из по меньшей мере двух разных частотных уровней для указания присутствия заданного бита из уникальной последовательности битов, связанной с оценивающим человеком, в дополненном аудиоролике; и передачу дополненного аудиоролика, включающего в себя идентификационный водяной знак, в электронное устройство, связанное с оценивающим человеком, для выполнения одной или более цифровых задач на основе оценки дополненного аудиоролика.[0019] More specifically, in accordance with a first broad aspect of the present invention, there is provided a computer-implemented method for augmenting an audio clip to be provided to an evaluator for performing one or more digital tasks. The addendum is intended to modify the audio clip to include data suitable for determining the identification information of the scoring person to determine the relationship between the audio clip and the scoring person. The method is run on a production server. The method comprises: receiving an audio clip by a production server, wherein the audio clip has been pre-recorded; receiving by the production server an identification indicator of the scoring person to whom the audio clip is to be transmitted, the identification indicator being represented by a unique sequence of bits; generating by the production server, based on the unique bit sequence, an identification watermark associated with the scoring person and to be included in the audio clip to generate the augmented audio clip, wherein the generation includes: determining by the production server for a given bit a unique bit sequence of at least two different frequency levels from a predetermined audio spectrum for carrying the value of a given bit in an audio signal associated with the augmented audio clip, wherein the first of at least two different frequency levels is for indicating the value of the given bit; others of at least two different frequency levels are designed to duplicate the values indicated by the first of at least two frequencies; and the value of the specified bit is indicated by a predetermined energy level of the audio signal; modifying by the production server the audio signal to have a predetermined energy level at each of at least two different frequency levels to indicate the presence of a predetermined bit from the unique bit sequence associated with the scoring person in the augmented audio clip; and transmitting the augmented audio clip including the identification watermark to an electronic device associated with the scoring person to perform one or more digital tasks based on the evaluation of the augmented audio clip.
[0020] В некоторых вариантах реализации способа значение заданного бита представляет собой двоичное значение, при этом «0» представлен нулевым уровнем энергии аудиосигнала, связанного с дополненным аудиороликом, на каждом из по меньшей мере двух разных частотных уровней; и изменение, включающее в себя исключение соответственной части аудиосигнала на каждом из по меньшей мере двух разных частотных уровней.[0020] In some embodiments of the method, the value of a given bit is a binary value, wherein "0" is represented by the zero energy level of the audio signal associated with the augmented audio clip at each of at least two different frequency levels; and a change including excluding a corresponding portion of the audio signal at each of the at least two different frequency levels.
[0021] В некоторых вариантах реализации способа исключение соответственной части из аудиосигнала формирует беззвучный промежуток при воспроизведении дополненного аудиосигнала, причем беззвучный промежуток по существу не распознается человеческим ухом.[0021] In some embodiments of the method, the exclusion of the corresponding part from the audio signal generates a silent gap when playing the augmented audio signal, and the silent gap is essentially not recognizable by the human ear.
[0022] В некоторых вариантах реализации способа исключение включает в себя применение соответственного режекторного фильтра к аудиосигналу.[0022] In some implementations of the method, the exclusion includes applying an appropriate notch filter to the audio signal.
[0023] В некоторых вариантах реализации способа предварительно определенный звуковой спектр содержит звуковой спектр, распознаваемый человеческим ухом.[0023] In some embodiments of the method, the predetermined audio spectrum comprises an audio spectrum recognizable by the human ear.
[0024] В некоторых вариантах реализации способа каждый из по меньшей мере двух разных частотных уровней выбран в соответственном диапазоне предварительно определенного звукового спектра.[0024] In some embodiments of the method, each of at least two different frequency levels is selected within a respective range of a predetermined audio spectrum.
[0025] В некоторых вариантах реализации способа каждый из по меньшей мере двух разных частотных уровней выбирается произвольным образом.[0025] In some embodiments of the method, each of the at least two different frequency levels is randomly selected.
[0026] В некоторых вариантах реализации способа каждый из по меньшей мере двух разных частотных уровней был предварительно выбран произвольным образом.[0026] In some embodiments of the method, each of the at least two different frequency levels has been preselected arbitrarily.
[0027] В некоторых вариантах реализации способа каждый из по меньшей мере двух разных частотных уровней выбирается с предварительно определенным шагом.[0027] In some embodiments of the method, each of at least two different frequency levels is selected in a predetermined step.
[0028] В некоторых вариантах реализации способа изменение аудиосигнала включает в себя сначала преобразование аудиосигнала в его частотно-временное представление.[0028] In some embodiments of the method, modifying an audio signal includes first converting the audio signal into its time-frequency representation.
[0029] В некоторых вариантах реализации способа преобразование включает в себя применение преобразования Фурье к аудиосигналу.[0029] In some embodiments of the method, the transformation includes applying a Fourier transform to the audio signal.
[0030] В соответствии со вторым широким аспектом настоящего изобретения предложен компьютерно-реализуемый способ определения связи между оценивающим человеком и заданным аудиороликом. Способ выполняется электронным устройством. Способ включает в себя: захват электронным устройством находящегося в использовании аудиосигнала, сгенерированного вблизи электронного устройства, в ответ на воспроизведение заданного аудиоролика; определение электронным устройством присутствия идентификационного водяного знака, связанного с оценивающим человеком, в находящемся в использовании аудиосигнале, причем идентификационный водяной знак был сгенерирован на основе идентификационного указателя оценивающего человека, причем идентификационный указатель представлен уникальной последовательности битов; соответственное значение заданного бита из уникальной последовательности битов указано в заданном аудиоролике посредством изменения соответственных уровней энергии исходного аудиосигнала, связанного с ним, по меньшей мере, на двух разных частотных уровнях; определение соответственного значения заданного бита включает в себя: определение электронным устройством соответственного первичного уровня энергии находящегося в использовании аудиосигнала на каждом из по меньшей мере двух разных частотных уровней; определение электронным устройством соответственного вторичного уровня энергии находящегося в использовании аудиосигнала на соответственном смежном частотном уровне для каждого из по меньшей мере двух разных частотных уровней; определение электронным устройством для каждого из по меньшей мере двух разных частотных уровней соответственного разностного значения между соответственным первичным уровнем энергии и соответственным вторичным уровнем энергии находящегося в использовании аудиосигнала; объединение электронным устройством соответственных разностных значений, связанных с по меньшей мере двумя разными частотными уровнями, для определения объединенного разностного значения, связанного с заданным битом; определение на основе объединенного разностного значения соответственного значения заданного бита для включения его в находящуюся в использовании последовательность битов, связанную с находящимся в использовании аудиосигналом; и в ответ на соответствие находящейся в использовании последовательности битов уникальной последовательности битов, связанной с оценивающим человеком, определение присутствия идентификационного водяного знака в находящемся в использовании аудиосигнале, тем самым определяя заданный аудиоролик как персонализированный для оценивающего человека для передачи ему для выполнения одной или более цифровых задач на основе оценки заданного аудиоролика.[0030] In accordance with a second broad aspect of the present invention, a computer-implemented method for determining a relationship between a scoring person and a given audio clip is provided. The method is performed by an electronic device. The method includes: capturing by the electronic device an in-use audio signal generated in the vicinity of the electronic device in response to playing a predetermined audio clip; determining by the electronic device the presence of an identification watermark associated with the scoring person in the audio signal in use, the identification watermark having been generated based on the scoring person's identification indicator, the identification indicator being represented by a unique bit sequence; a respective value of a given bit from the unique bit sequence is indicated in the given audio clip by varying the respective energy levels of the original audio signal associated with it at at least two different frequency levels; determining a respective predetermined bit value includes: determining by the electronic device a respective primary energy level of the audio signal in use at each of at least two different frequency levels; determining by the electronic device a respective secondary energy level of the in-use audio signal at a respective adjacent frequency level for each of the at least two different frequency levels; determining by the electronic device, for each of the at least two different frequency levels, a respective difference between a respective primary energy level and a respective secondary energy level of the audio signal in use; combining by the electronic device the respective deltas associated with at least two different frequency levels to determine a combined delta value associated with a given bit; determining, based on the combined difference value, a corresponding value of a given bit to include in the in-use bit sequence associated with the in-use audio signal; and in response to matching the bit sequence in use to a unique bit sequence associated with the evaluator, determining the presence of the identification watermark in the audio signal in use, thereby determining the given audio clip as being personalized for the evaluator to transmit to him for performing one or more digital tasks. based on the rating of the given audio clip.
[0031] В некоторых вариантах реализации способа соответственное значение заданного бита является двоичным значением, объединение соответственных разностных значений включает в себя: определение первого объединенного значения как суммы соответственных разностных значений, связанных с значениями по меньшей мере двух разных частотных уровней, на которых соответственные первичные уровни энергии указывают на то, что соответственное значение заданного бита равно «1»; определение второго объединенного значения как суммы соответственных разностных значений, связанных со значениями по меньшей мере двух разных частотных уровней, на которых соответственные первичные уровни энергии указывают на то, что соответственное значение заданного бита равно «0»; определение объединенного разностного значения как разности между первым объединенным значением и вторым объединенным значением; и при этом определение соответственного значения заданного бита на основе объединенного разностного значения включает в себя: определение соответственного значения как «1», если объединенное разностное значение является положительным значением; и определение соответственного значения как «0», если объединенное разностное значение является неположительным значением.[0031] In some embodiments of the method, the corresponding value of a given bit is a binary value, combining the corresponding difference values includes: determining the first combined value as the sum of the corresponding difference values associated with the values of at least two different frequency levels, in which the corresponding primary levels energies indicate that the corresponding value of the given bit is "1"; determining the second combined value as the sum of the respective difference values associated with the values of at least two different frequency levels, at which the respective primary energy levels indicate that the respective value of the specified bit is "0"; determining the combined difference value as the difference between the first combined value and the second combined value; and wherein determining a corresponding value of a given bit based on the combined difference value includes: determining a corresponding value as "1" if the combined difference value is a positive value; and determining the corresponding value as "0" if the combined difference value is a non-positive value.
[0032] В некоторых вариантах реализации способа способ дополнительно содержит для заданного частотного уровня из по меньшей мере двух разных частотных уровней, при этом заданный частотный уровень связан с соответственным первичным уровнем энергии находящегося в использовании аудиосигнала на заданном частотном уровне: определение первого соответственного вторичного уровня энергии на первом соответственном смежном частотном уровне, более высоком, чем заданный частотный уровень; определение второго соответственного вторичного уровня энергии на втором смежном частотном уровне, более низком, чем заданный частотный уровень; определение первого соответственного разностного значения между соответственным первичным уровнем энергии и первым соответственным вторичным уровнем энергии; определение второго соответственного разностного значения между соответственным первичным уровнем энергии и вторым соответственным вторичным уровнем энергии, и при этом: определение соответственного разностного значения включает в себя определение минимального из первого соответственного разностного значения и второго соответственного разностного значения.[0032] In some embodiments of the method, the method further comprises, for a given frequency level, from at least two different frequency levels, wherein the given frequency level is associated with the corresponding primary energy level of the audio signal in use at the given frequency level: determining a first corresponding secondary energy level at a first respective adjacent frequency level higher than the predetermined frequency level; determining a second respective secondary energy level at a second adjacent frequency level lower than the predetermined frequency level; determining a first respective difference value between the respective primary energy level and the first respective secondary energy level; determining a second respective difference between the respective primary energy level and the second respective secondary energy level, wherein: determining the respective difference includes determining the minimum of the first respective difference and the second respective difference.
[0033] В некоторых вариантах реализации способа электронное устройство представляет собой электронное устройство, связанное с оценивающим человеком.[0033] In some embodiments of the method, the electronic device is an electronic device associated with the evaluator.
[0034] В некоторых вариантах реализации способа способ выполняется сервером, выполненным с возможностью получения заданного аудиоролика, и при этом находящийся в использовании аудиосигнал генерируется сервером посредством обработки заданного аудиоролика.[0034] In some embodiments of the method, the method is performed by a server configured to receive a given audio clip, and an in-use audio signal is generated by the server by processing the given audio clip.
[0035] В некоторых вариантах реализации способа сервер выполнен с возможностью получения заданного аудиоролика посредством поиска для него по меньшей мере одного сетевого ресурса.[0035] In some embodiments of the method, the server is configured to obtain a given audio clip by searching for at least one network resource for it.
[0036] В некоторых вариантах реализации способа определение присутствия идентификационного водяного знака в находящемся в использовании аудиосигнале включает в себя сначала преобразование находящегося в использовании аудиосигнала в его частотно-временное представление.[0036] In some embodiments of the method, determining the presence of an identification watermark in an audio signal in use includes first converting the audio signal in use into its time-frequency representation.
[0037] В некоторых вариантах реализации способа определение заданного аудиоролика как персонализированного для оценивающего человека дополнительно включает в себя генерирование электронным устройством предварительно определенного уведомления для его передачи субъекту, связанному с производством заданного аудиоролика.[0037] In some embodiments of the method, determining a given audio clip as personalized for the scoring person further includes generating a predefined notification by the electronic device for transmission to a subject associated with the production of the given audio clip.
[0038] В соответствии с третьим широким аспектом настоящего изобретения предоставляется система для дополнения аудиоролика, предоставляемого оценивающему человеку для выполнения одной или более цифровых задач. Дополнение предназначено для изменения аудиоролика на предмет включения данных, подходящих для определения идентификационной информации оценивающего человека для определения связи между аудиороликом и оценивающим человеком. Система включает в себя производственный сервер, включающий в себя: процессор и долговременный машиночитаемый носитель, содержащий инструкции. Процессор после выполнения инструкций приспособлен: принимать аудиоролик, причем аудиоролик был предварительно записан; принимать идентификационный указатель оценивающего человека, которому должна быть передана аудиоролика, причем идентификационный указатель представлен уникальной последовательностью битов; генерировать на основе уникальной последовательности битов идентификационный водяной знак, связанный с оценивающим человеком, подлежащий включению в аудиоролик для генерирования дополненного аудиоролика, посредством: определения для заданного бита из уникальной последовательности битов по меньшей мере двух разных частотных уровней из предварительно определенного звукового спектра для переноса значения заданного бита в аудиосигнале, связанном с дополненным аудиороликом, причем первый из по меньшей мере двух разных частотных уровней предназначен для указания значения заданного бита; другие из по меньшей мере двух разных частотных уровней предназначены для дублирования значений, указанных первой из по меньшей мере двух частот; и значение заданного бита указывается предварительно определенным уровнем энергии аудиосигнала; изменять аудиосигнал, чтобы иметь предварительно определенный уровень энергии на каждом из по меньшей мере двух разных частотных уровней, для указания присутствия заданного бита из уникальной последовательности битов, связанной с оценивающим человеком, в дополненном аудиоролике; и передавать дополненный аудиоролик, включающий в себя идентификационный водяной знак, в электронное устройство, связанное с оценивающим человеком, для выполнения одной или более цифровых задач на основе оценки дополненного аудиоролика.[0038] In accordance with a third broad aspect of the present invention, a system is provided for supplementing an audio clip provided to an evaluator for performing one or more digital tasks. The addendum is intended to modify the audio clip to include data suitable for identifying the scoring person's identification information to determine the relationship between the audio clip and the scoring person. The system includes a production server including: a processor and a non-volatile computer-readable medium containing instructions. The processor, after executing the instructions, is adapted to: receive an audio clip, the audio clip having been pre-recorded; receive an identification indicator of the scoring person to whom the audio clip is to be transmitted, the identification indicator being represented by a unique sequence of bits; generate, based on the unique bit sequence, an identification watermark associated with the scoring person to be included in the audio clip to generate the augmented audio clip by: determining for a given bit from the unique bit sequence at least two different frequency levels from a predetermined audio spectrum to carry the value of the given a bit in the audio signal associated with the augmented audio clip, wherein the first of at least two different frequency levels is for indicating the value of the given bit; others of at least two different frequency levels are designed to duplicate the values indicated by the first of at least two frequencies; and the value of the specified bit is indicated by a predetermined energy level of the audio signal; modify the audio signal to have a predetermined energy level at each of at least two different frequency levels to indicate the presence of a given bit from the unique bit sequence associated with the rater in the augmented audio clip; and transmitting the augmented audio clip including the identification watermark to an electronic device associated with the scoring person to perform one or more digital tasks based on the evaluation of the augmented audio clip.
[0039] В контексте настоящего описания термины «аудиоролик» и «аудиофайл» в широком смысле относятся к любому цифровому аудиофайлу и/или аналоговым аудиодорожкам (включая те, которые являются частью видео) любого формата и характера, включая, но не ограничивающиеся, рекламные объявления, новостные ленты, звуковые дорожки видео в блогах и телешоу и т.д. По существу, аудиоролики, как упоминается здесь, представляют собой объекты электронных носителей, которые представляют электрические сигналы, имеющие частоты, соответствующие человеческому слуху и подходящие для передачи, приема, хранения и воспроизведения с использованием подходящего программного и аппаратного обеспечения.[0039] As used herein, the terms "audio clip" and "audio file" broadly refer to any digital audio file and/or analog audio tracks (including those that are part of a video) of any format and nature, including, but not limited to, advertisements , news feeds, blog video and TV show soundtracks, etc. Essentially, audio clips, as mentioned herein, are electronic media objects that represent electrical signals having frequencies corresponding to human hearing and suitable for transmission, reception, storage, and playback using suitable software and hardware.
[0040] В контексте настоящего описания «сервер» представляет собой компьютерную программу, которая работает на надлежащем аппаратном обеспечении и способна принимать запросы (например, от клиентских устройств) по сети и выполнять эти запросы, или вызывать выполнение этих запросов. Аппаратное обеспечение может быть одним физическим компьютером или одной физической компьютерной системой, но ни то, ни другое не является обязательным требованием для настоящего изобретения. В настоящем контексте использование выражения "сервер" не предполагает, что каждая задача (например, принятые инструкции или запросы) или какая-либо конкретная задача будут приняты, выполнены или вызваны для выполнения одним и тем же сервером (т.е. тем же самым программным обеспечением и/или аппаратным обеспечением); данное выражение предполагает, что любое количество программных элементов или аппаратных устройств может быть задействовано в приеме/отправке, выполнении или вызове для выполнения любой задачи или запроса, или последствий любой задачи или запроса; и все это программное обеспечение и аппаратное обеспечение может быть одним сервером или многочисленными серверами, причем оба данных случая включены в выражение "по меньшей мере один сервер".[0040] As used herein, a "server" is a computer program that runs on appropriate hardware and is capable of receiving requests (eg, from client devices) over a network and fulfilling or causing those requests to be executed. The hardware may be one physical computer or one physical computer system, but neither is a requirement for the present invention. In the present context, the use of the term "server" does not imply that every task (e.g., received instructions or requests) or any particular task will be received, executed, or called for execution by the same server (i.e., the same software software and/or hardware); this expression implies that any number of software elements or hardware devices can be involved in receiving / sending, executing or calling to perform any task or request, or the consequences of any task or request; and all of this software and hardware may be a single server or multiple servers, both of which are included in the expression "at least one server".
[0041] В контексте настоящего описания "клиентское устройство" представляет собой любое компьютерное оборудование, которое способно выполнять программное обеспечение, которое является надлежащим для релевантной поставленной задачи. Таким образом, некоторые (не накладывающие ограничений) примеры клиентских устройств включают в себя персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.д.), смартфоны и планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует отметить, что устройство, выступающее в качестве клиентского устройства в настоящем контексте, не исключается из возможности выступать в качестве сервера для других клиентских устройств. Использование выражения "клиентское устройство" не исключает использования многочисленных клиентских устройств при приеме/отправке, выполнении или вызове для выполнения какой-либо задачи или запроса, или последствий любой задачи или запроса, или этапов любого описанного в данном документе способа.[0041] As used herein, a "client device" is any computer hardware that is capable of executing software that is appropriate for the relevant task at hand. Thus, some (non-limiting) examples of client devices include personal computers (desktops, laptops, netbooks, etc.), smartphones and tablets, and network equipment such as routers, switches, and gateways. It should be noted that a device acting as a client device in the present context is not excluded from acting as a server for other client devices. The use of the term "client device" does not preclude the use of multiple client devices in receiving/sending, executing, or calling to perform any task or request, or the consequences of any task or request, or the steps of any method described herein.
[0042] В контексте настоящего описания "база данных" представляет собой любую структурированную совокупность данных, независимо от ее конкретной структуры, программное обеспечение для администрирования базы данных, или компьютерное оборудование, на котором данные хранятся, реализуются или их делают доступными для использования иным образом. База данных может находиться на том же оборудовании, что и процесс, который хранит или использует информацию, хранящуюся в базе данных, или она может находиться на отдельном оборудовании, например на выделенном сервере или множестве серверов.[0042] As used herein, a "database" is any structured collection of data, regardless of its specific structure, database administration software, or computer equipment on which data is stored, implemented, or otherwise made available for use. The database may reside on the same hardware as the process that stores or uses the information stored in the database, or it may reside on separate hardware such as a dedicated server or multiple servers.
[0043] В контексте настоящего описания выражение "информация" включает в себя информацию любого характера или вида, которая способна храниться в базе данных любым образом. Таким образом, информация включает в себя, помимо прочего, аудиовизуальные произведения (изображения, фильмы, звукозаписи, презентации и т.д.), данные (данные о местоположении, числовые данные и т.д.), текст (мнения, комментарии, вопросы, сообщения и т.д.), документы, электронные таблицы, списки слов и т.д.[0043] In the context of the present description, the expression "information" includes information of any nature or kind that is capable of being stored in the database in any way. Thus, information includes, but is not limited to, audiovisual works (images, films, sound recordings, presentations, etc.), data (location data, numerical data, etc.), text (opinions, comments, questions , messages, etc.), documents, spreadsheets, word lists, etc.
[0044] В контексте настоящего описания, если специально не указано иное, подразумевается, что термин «компонент» включает в себя программное обеспечение (соответственное конкретному аппаратному контексту), которое является как необходимым, так и достаточным для реализации конкретной функции (функций), на которую ссылаются.[0044] As used herein, unless specifically noted otherwise, the term "component" is intended to include software (as appropriate to a particular hardware context) that is both necessary and sufficient to implement a particular function(s), on which is being referenced.
[0045] В контексте настоящего описания предполагается, что выражение "используемый компьютером носитель хранения информации" включает в себя носители любого характера и вида, в том числе RAM, ROM, диски (CD-ROM, DVD, дискеты, накопители на жестких дисках и т.д.), USB-ключи, твердотельные накопители, ленточные накопители и т.д.[0045] As used herein, the expression "computer-used storage medium" is intended to include media of any kind and kind, including RAM, ROM, disks (CD-ROMs, DVDs, floppy disks, hard disk drives, etc.). .d.), USB keys, solid state drives, tape drives, etc.
[0046] В контексте настоящего описания слова "первый", "второй", "третий" и т.д. используются в качестве прилагательных только для того, чтобы позволить отличать существительные, которые они изменяют, друг от друга, а не для описания какой-либо особой взаимосвязи между такими существительными. Таким образом, например, следует понимать, что использование терминов "первый сервер" и "третий сервер" не подразумевает какого-либо конкретного порядка, типа, хронологии, иерархии или ранжирования (например) таких серверов, равно как и их использование (само по себе) не означает, что какой-либо "второй сервер" должен обязательно существовать в любой определенной ситуации. Кроме того, как обсуждается в других контекстах данного документа, ссылка на "первый" элемент и "второй" элемент не исключает того, что эти два элемента фактически являются одним и тем же элементом реального мира. Таким образом, например, в некоторых случаях "первый" сервер и "второй" сервер могут быть одним и тем же программным обеспечением и/или аппаратным обеспечением, в других случаях они могут представлять собой разное программное обеспечение и/или аппаратное обеспечение.[0046] In the context of the present description, the words "first", "second", "third", etc. are used as adjectives only to allow the nouns they modify to be distinguished from each other, and not to describe any particular relationship between such nouns. Thus, for example, it should be understood that the use of the terms "first server" and "third server" does not imply any particular order, type, chronology, hierarchy or ranking (for example) of such servers, nor does their use (in itself ) does not mean that some "second server" must necessarily exist in any given situation. Also, as discussed elsewhere in this document, reference to a "first" element and a "second" element does not exclude that the two elements are in fact the same real world element. Thus, for example, in some cases the "first" server and the "second" server may be the same software and/or hardware, in other cases they may be different software and/or hardware.
[0047] Каждая из реализаций настоящего изобретения обладает по меньшей мере одним из вышеупомянутых аспектов и/или цели, но не обязательно имеет их все. Следует понимать, что некоторые аспекты настоящего изобретения, которые возникли в попытке достичь вышеупомянутой цели, могут не удовлетворять этой цели и/или удовлетворять другим целям, которые не описаны в данном документе явным образом.[0047] Each of the implementations of the present invention has at least one of the above aspects and/or objectives, but not necessarily all of them. It should be understood that some aspects of the present invention, which have arisen in an attempt to achieve the above goal, may not satisfy this goal and/or satisfy other goals that are not explicitly described in this document.
[0048] Дополнительные и/или альтернативные признаки, аспекты и преимущества реализаций настоящего изобретения станут очевидными из нижеследующего описания, сопроводительных чертежей и приложенной формулы изобретения.[0048] Additional and/or alternative features, aspects, and advantages of implementations of the present invention will become apparent from the following description, the accompanying drawings, and the appended claims.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS
[0049] Для лучшего понимания настоящего изобретения, а также других аспектов и ее дополнительных признаков, ссылка приводится на нижеследующее описание, которое должно использоваться в сочетании с сопроводительными чертежами, на которых:[0049] For a better understanding of the present invention, as well as other aspects and additional features thereof, reference is made to the following description, which is to be used in conjunction with the accompanying drawings, in which:
[0050] На Фиг. 1 изображена принципиальная схема примерной компьютерной системы для реализации некоторых не накладывающих ограничений вариантов осуществления систем и/или способов настоящего изобретения;[0050] In FIG. 1 is a schematic diagram of an exemplary computer system for implementing some non-limiting embodiments of systems and/or methods of the present invention;
[0051] На Фиг. 2 изображена сетевая вычислительная среда, подходящая для дополнения аудиоролика соответственным идентификационным водяным знаком заданного оценщика, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения;[0051] In FIG. 2 depicts a networked computing environment suitable for padding an audio clip with an appropriate identification watermark of a given rater, in accordance with some non-limiting embodiments of the present invention;
[0052] На Фиг. 3 изображена схематическая диаграмма процесса генерирования сервером, присутствующим в сетевой вычислительной среде, показанной на Фиг. 2, двоичной последовательности на основе идентификационных указателей заданного оценщика, которая в дальнейшем может использоваться для генерирования соответственного идентификационного водяного знака в соответствии с некоторыми не накладывающими ограничений вариантами осуществления;[0052] In FIG. 3 is a schematic diagram of a generation process by a server present in the networked computing environment shown in FIG. 2, a binary sequence based on the identities of a given estimator, which can then be used to generate a corresponding identity watermark, in accordance with some non-limiting embodiments;
[0053] На Фиг. 4 изображена схематическая диаграмма этапа генерирования сервером, присутствующим в сетевой вычислительной среде на Фиг. 2, частотно-временного представления аудиосигнала, связанного с аудиороликом, для его дополнения соответственным идентификационным водяным знаком заданного оценщика, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения;[0053] In FIG. 4 is a schematic diagram of the generation step by the server present in the networked computing environment of FIG. 2, a time-frequency representation of the audio signal associated with the audio clip to be padded with the appropriate identification watermark of a given evaluator, in accordance with some non-limiting embodiments of the present invention;
[0054] На Фиг. 5 изображена схематическая диаграмма этапа генерирования сервером, присутствующим в сетевой вычислительной среде на Фиг. 2, амплитудно-временного представления аудиосигнала дополненного аудиоролика на Фиг. 4, подлежащего передаче заданному оценщику, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения;[0054] In FIG. 5 is a schematic diagram of the generation step by the server present in the networked computing environment of FIG. 2 of the amplitude-time representation of the audio signal of the augmented audio clip of FIG. 4 to be communicated to a given evaluator, in accordance with some non-limiting embodiments of the present invention;
[0055] На Фиг. 6 изображена блок-схема последовательности операций способа дополнения сервером, присутствующим в сетевой вычислительной среде, показанной на Фиг. 2, аудиоролика, подлежащего передаче заданному оценщику, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения;[0055] In FIG. 6 is a flowchart of a method for adding a server present in the networked computing environment shown in FIG. 2, an audio clip to be submitted to a given evaluator, in accordance with some non-limiting embodiments of the present invention;
[0056] На Фиг. 7 изображена схематическая диаграмма другой реализации сетевой вычислительной среды с Фиг. 2, подходящей для определения связи между заданным оценщиком и находящимся в использовании аудиороликом, воспроизводимым вблизи электронного устройства, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения;[0056] In FIG. 7 is a schematic diagram of another implementation of the network computing environment of FIG. 2 suitable for determining a relationship between a given estimator and an in-use audio clip played near an electronic device, in accordance with some non-limiting embodiments of the present invention;
[0057] На Фиг. 8 изображена схематическая диаграмма этапа генерирования электронным устройством, присутствующим в сетевой вычислительной среде, показанной на Фиг. 7, частотно-временного представления аудиосигнала, связанного с находящимся в использовании аудиороликом, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения;[0057] In FIG. 8 is a schematic diagram of a generation step by an electronic device present in the networked computing environment shown in FIG. 7 of a time-frequency representation of an audio signal associated with an audio clip in use, in accordance with some non-limiting embodiments of the present invention;
[0058] На Фиг. 9 представлена схематическая диаграмма процесса определения электронным устройством сетевой вычислительной среды, показанной на Фиг. 7, присутствия соответственного идентификационного водяного знака в находящемся в использовании аудиоролике, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения. технология; и[0058] In FIG. 9 is a schematic diagram of a process for determining the network computing environment shown in FIG. 7, the presence of an appropriate identification watermark in an audio clip in use, in accordance with some non-limiting embodiments of the present invention. technology; And
[0059] На Фиг. 10 изображена блок-схема последовательности операций способа определения связи между заданным оценщиком и находящимся в использовании аудиороликом, воспроизводимым вблизи электронного устройства сетевой вычислительной среды с Фиг. 7, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящее изобретение.[0059] In FIG. 10 is a flowchart of a method for determining a relationship between a given estimator and an in-use audio clip played in the vicinity of the electronic device of the networked computing environment of FIG. 7 in accordance with some non-limiting embodiments of the present invention.
Подробное описаниеDetailed description
[0060] Приведенные в данном документе примеры и условные формулировки призваны главным образом помочь читателю понять принципы настоящего изобретения, а не ограничивать ее объем такими конкретно приведенными примерами и условиями. Должно быть понятно, что специалисты в данной области смогут разработать разные механизмы, которые, хоть и не описаны в данном документе явным образом, тем не менее воплощают принципы настоящего изобретения и включаются в ее суть и объем.[0060] The examples and conventions set forth herein are intended primarily to help the reader understand the principles of the present invention, and not to limit its scope to such specific examples and terms. It should be clear that specialists in this field will be able to develop various mechanisms that, although not explicitly described in this document, nevertheless embody the principles of the present invention and are included in its spirit and scope.
[0061] Кроме того, нижеследующее описание может описывать варианты реализации настоящего изобретения в относительно упрощенном виде для целей упрощения понимания. Специалисты в данной области поймут, что разные варианты реализации настоящего изобретения могут иметь большую сложность.[0061] In addition, the following description may describe embodiments of the present invention in a relatively simplified manner for purposes of ease of understanding. Those skilled in the art will appreciate that various embodiments of the present invention may be more complex.
[0062] В некоторых случаях также могут быть изложены примеры изменений настоящего изобретения, которые считаются полезными. Это делается лишь для содействия понимаю и, опять же, не для строгого определения объема или очерчивания границ настоящего изобретения. Эти изменения не являются исчерпывающим списком, и специалист в данной области может осуществлять другие изменения, все еще оставаясь при этом в рамках объема настоящего изобретения. Кроме того, случаи, когда примеры изменений не приводятся, не следует толковать так, что никакие изменения не могут быть осуществлены и/или что описанное является единственным способом реализации такого элемента настоящего изобретения.[0062] In some cases, examples of modifications of the present invention that are considered useful can also be set forth. This is done only to assist understanding and, again, not to strictly define the scope or delineate the boundaries of the present invention. These changes are not an exhaustive list, and the person skilled in the art can make other changes while still remaining within the scope of the present invention. In addition, cases where examples of modifications are not given should not be construed to mean that no modifications can be made and/or that what is described is the only way to implement such an element of the present invention.
[0063] Кроме того, все содержащиеся в данном документе утверждения, в которых указываются принципы, аспекты и реализации настоящего изобретения, а также их конкретные примеры, призваны охватить как структурные, так и функциональные эквиваленты, вне зависимости от того, известны ли они в настоящее время или будут разработаны в будущем. Таким образом, например, специалисты в данной области осознают, что любые блок-схемы в данном документе представляют концептуальные виды иллюстративной схемы, воплощающей принципы настоящего изобретения. Аналогичным образом, будет понятно, что любые блок-схемы, схемы последовательности операций, схемы изменения состояний, псевдо-коды и подобное представляют разные процессы, которые могут быть по сути представлены на считываемых компьютерам носителях и исполнены компьютером или процессором вне зависимости от того, показан такой компьютер или процессор явным образом или нет.[0063] In addition, all statements contained herein, which indicate the principles, aspects and implementations of the present invention, as well as their specific examples, are intended to cover both structural and functional equivalents, regardless of whether they are currently known time or will be developed in the future. Thus, for example, those skilled in the art will appreciate that any block diagrams herein represent conceptual views of an illustrative circuit embodying the principles of the present invention. Likewise, it will be understood that any flowcharts, sequence diagrams, state transition diagrams, pseudo-codes, and the like represent different processes that can be as such represented on computer-readable media and executed by a computer or processor, whether or not shown. such a computer or processor explicitly or not.
[0064] Функции разных элементов, показанных на фигурах, в том числе любого функционального блока, помеченного как «процессор» или «графический процессор», могут быть обеспечены посредством специального аппаратного обеспечения, а также аппаратного обеспечения, способного исполнять программное обеспечение, в сочетании с надлежащим программным обеспечением. При обеспечении процессором функции могут быть обеспечены одним выделенным процессором, одним совместно используемым процессором и/или множеством отдельных процессоров, некоторые из которых могут быть совместно используемыми. В некоторых вариантах осуществления настоящего изобретения процессор может быть процессором общего назначения, например центральным блоком управления (CPU), или процессором, предназначенным для определенной цели, например графическим процессором (GPU). Более того, явное использование термина «процессор» или «контроллер» не должно толковаться как относящееся исключительно к аппаратному обеспечению, способному выполнять программное обеспечение, и может неявно включать, без ограничения, аппаратное обеспечение цифрового сигнального процессора (DSP), сетевой процессор, специализированную интегральную схему (ASIC), программируемую вентильную матрицу (FPGA), постоянное запоминающее устройство (память) (ROM) для хранения программного обеспечения, запоминающее устройство с произвольным доступом (RAM) и/или энергонезависимое (долговременное) хранилище. Другое аппаратное обеспечение, традиционное и/или специализированное, также может быть включено в состав.[0064] The functions of the various elements shown in the figures, including any functional block labeled "processor" or "graphics processing unit", can be provided by dedicated hardware, as well as hardware capable of executing software, in combination with proper software. When provided by a processor, the functions may be provided by one dedicated processor, one shared processor, and/or multiple separate processors, some of which may be shared. In some embodiments of the present invention, the processor may be a general purpose processor, such as a central control unit (CPU), or a processor dedicated to a specific purpose, such as a graphics processing unit (GPU). Moreover, explicit use of the term "processor" or "controller" should not be construed as referring solely to hardware capable of executing software, and may implicitly include, without limitation, digital signal processor (DSP) hardware, network processor, ASIC circuit (ASIC), field-programmable gate array (FPGA), read-only memory (memory) (ROM) for storing software, random access memory (RAM), and/or non-volatile (non-volatile) storage. Other hardware, traditional and/or specialized, may also be included.
[0065] Программные модули, или просто модули, в качестве которых может подразумеваться программное обеспечение, могут быть представлены в настоящем документе как любое сочетание элементов блок-схемы последовательности операций или других элементов, указывающих выполнение этапов процесса и/или текстовое описание. Такие модули могут выполняться аппаратным обеспечением, которое явно или неявно показано.[0065] Software modules, or simply modules, which may be understood as software, may be represented herein as any combination of flowchart elements or other elements indicating the execution of process steps and/or textual description. Such modules may be executed by hardware that is explicitly or implicitly shown.
[0066] Учитывая эти основополагающие вещи, рассмотрим некоторые не накладывающие ограничений примеры, чтобы проиллюстрировать разные реализации аспектов настоящего изобретения.[0066] With these fundamentals in mind, consider some non-limiting examples to illustrate different implementations of aspects of the present invention.
Компьютерная системаcomputer system
[0067] На Фиг. 1 изображена компьютерная система 100, подходящая для использования с некоторыми вариантами реализации настоящего изобретения. Компьютерная система 100 содержит разные аппаратные компоненты, включая один или более одноядерных или многоядерных процессоров, совместно представленных процессором 110, графический процессор (GPU) 111, твердотельный накопитель 120, запоминающее устройство 130 с произвольным доступом, интерфейс 140 дисплея и интерфейс 150 ввода/вывода.[0067] In FIG. 1 depicts a
[0068] Взаимодействие между разными компонентами компьютерной системы 100 может быть обеспечено одной или более внутренними и/или внешними шинами 160, включающими в себя, например, без ограничения, шину соединения периферийных компонентов (PCI), универсальную последовательную шину (USB), шину IEEE 1394 «Firewire», шину интерфейса малых компьютерных систем (SCSI), шину последовательного подключения (SATA) и другие, с которыми разные аппаратные компоненты связаны электронным образом.[0068] Communication between various components of the
[0069] Интерфейс 150 ввода/вывода может быть связан с сенсорным экраном 190 и/или с одной или более внутренними и/или внешними шинами 160. Сенсорный экран 190 может быть частью дисплея. В некоторых вариантах осуществления, сенсорный экран 190 является дисплеем. Сенсорный экран 190 может также упоминаться как экран 190. В вариантах осуществления, проиллюстрированных на Фиг. 1, сенсорный экран 190 содержит сенсорное аппаратное обеспечение 194 (например, чувствительные к давлению ячейки, встроенные в слой дисплея, позволяющие обнаруживать физическое взаимодействие между пользователем и дисплеем) и контроллер 192 сенсорного ввода/вывода, обеспечивающий возможность связи с интерфейсом 140 дисплея и/или одной или более внутренними и/или внешними шинами 160. В некоторых вариантах осуществления интерфейс 150 ввода/вывода может быть подключен к клавиатуре (не показана), мыши (не показана) или трекпаду (не показан), позволяя пользователю взаимодействовать с компьютерной системой 100 в дополнение или вместо сенсорного экрана 190. В некоторых вариантах осуществления компьютерная система 100 может содержать один или более микрофонов (не показаны). Микрофоны могут записывать аудио, например, пользовательские высказывания. Пользовательские высказывания могут быть преобразованы в команды для управления компьютерной системой 100.[0069] I/
[0070] Следует отметить, что некоторые компоненты компьютерной системы 100 могут быть опущены в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения. Например, сенсорный экран 190 может отсутствовать, особенно (но не ограничиваясь этим), когда компьютерная система реализована как интеллектуальное громкоговорительное устройство.[0070] It should be noted that some components of the
[0071] Согласно вариантам реализации настоящего изобретения твердотельный накопитель 120 хранит программные инструкции, подходящие для загрузки в запоминающее устройство 130 с произвольным доступом и выполнения их процессором 110 и/или графическим процессором 111. Например, программные инструкции могут быть частью библиотеки или приложения.[0071] In accordance with embodiments of the present invention, the
Сетевая вычислительная средаNetworked Computing Environment
[0072] На Фиг. 2 изображена схематическая диаграмма сетевой вычислительной среды 200, подходящей для использования с некоторыми не накладывающими ограничений вариантами осуществления систем и/или способов настоящего изобретения. В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сетевая вычислительная среда 200 может включать в себя сервер 202, выполненный с возможностью предоставления одной или более цифровых задач для их дальнейшего выполнения соответственным одним из множества оценщиков 208.[0072] In FIG. 2 is a schematic diagram of a
[0073] С этой целью сервер 202 может быть коммуникативно связан через сеть 210 связи с базой 204 данных оценщиков. В соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения база 204 данных оценщиков может содержать идентификационные указатели каждого из множества оценщиков 208 (таких как оценивающие люди), доступных для выполнения по меньшей мере одной цифровой задачи (также называемой в данном документе как «задача человеческого интеллекта (HIT)», задача из краудсорсинга или просто задача), которая будет ему отправлена. В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения идентификационный указатель заданного оценщика 212 из множества оценщиков 208 включает в себя конкретные данные, позволяющие однозначно идентифицировать заданного оценщика 212 среди множества оценщиков 208, которые могут включать в себя, без ограничения, имя и фамилию заданного оценщика 212, разные аббревиатуры и псевдонимы, сгенерированные на основе, по меньшей мере, частичных сочетаний имен и уникального идентификатора данного оценщика 212 и т.п. В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения идентификационный указатель, связанный с заданным оценщиком 212, может включать в себя уникальный идентификационный номер, предварительно сгенерированный для заданного оценщика 212.[0073] To this end, the
[0074] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения база 204 данных оценщиков может находиться под управлением и/или администрированием поставщика краудсорсинговых услуг, такого как ООО «Яндекс» по адресу Россия, 119021, улица Льва Толстого, д.16. В альтернативных не накладывающих ограничений вариантах осуществления настоящего изобретения базой 204 данных оценщиков может управлять другой субъект.[0074] In some non-limiting embodiments of the present invention, the
[0075] Реализация базы 204 данных оценщиков особо не ограничивается, и, как таковая, база 204 данных оценщиков может быть реализована с использованием любой подходящей известной технологии, если предусмотрены функциональные возможности, описанные в данном документе. Кроме того, хотя в вариантах осуществления, изображенных на Фиг. 2, база 204 данных оценщиков связана с сервером 202 через сеть 210 связи, следует отметить, что в альтернативных не накладывающих ограничений вариантах осуществления настоящего изобретения база 204 данных оценщиков может быть соединена с сервером 202 напрямую через соответственную линию связи.[0075] The implementation of the
[0076] Предполагается, что база 204 данных оценщиков может храниться, по меньшей мере, частично на сервере 202 и/или управляться, по меньшей мере, частично сервером 202. В соответствии с не накладывающими ограничений вариантами осуществления настоящего изобретения база 204 данных оценщиков содержит достаточную информацию, связанную с идентификационной информацией по меньшей мере некоторых из множества оценщиков 208, чтобы позволить субъекту, имеющему доступ к базе 204 данных оценщиков, такому как сервер 202, назначать и передавать одну или более цифровых задач, которые должны быть выполнены оценщиками.[0076] It is contemplated that the
[0077] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может управляться тем же субъектом, который управляет базой 204 данных оценщиков. В альтернативных не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может управляться субъектом, отличным от того, который управляет базой 204 данных оценщиков.[0077] In some non-limiting embodiments of the present invention, the
[0078] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть реализован как обычный компьютерный сервер и, таким образом, может содержать некоторые или все компоненты компьютерной системы 100 с Фиг. 1. В качестве не накладывающего ограничений примера сервер 202 может быть реализован как сервер Dell™ PowerEdge™, работающий под управлением операционной системы Microsoft™ Windows Server™. Само собой разумеется, сервер 202 может быть реализован в любом другом подходящем аппаратном и/или программном и/или программно-аппаратном обеспечении или их сочетании. В проиллюстрированном не накладывающем ограничений варианте осуществления настоящего изобретения сервер 202 является единственным сервером. В альтернативных не накладывающих ограничений вариантах осуществления настоящего изобретения функциональные возможности сервера 202 могут быть распределены и могут быть реализованы посредством многочисленных серверов.[0078] In some non-limiting embodiments of the present invention, the
[0079] Кроме того, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения, сервер 202 может быть коммуникативно связан через соответственную линию связи с базой 206 данных задач. Как можно понять, в альтернативных не накладывающих ограничений вариантах осуществления настоящего изобретения база 206 данных задач может быть связана с сервером 202 через сеть 210 связи. Хотя база 206 данных задач схематично проиллюстрирована здесь как единый субъект, предполагается, что база 206 данных задач может быть реализована распределенным образом.[0079] In addition, in accordance with some non-limiting embodiments of the present invention, the
[0080] Вообще говоря, база 206 данных задач может быть заполнена цифровыми задачами, которые должны выполняться, по меньшей мере, некоторыми из множества оценщиков 208. То, как база 206 данных задач заполняется задачами, не ограничено. Вообще говоря, один или более запросчиков задач (отдельно не изображены) могут отправлять одну или более задач для сохранения в базе 206 данных задач. В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения один или более запросчиков задач могут указывать тип оценщиков, которым предназначена задача, и/или бюджет, подлежащий выделению каждому из множества оценщиков 208, предоставляющих результат.[0080] Generally speaking,
[0081] Например, заданный запросчик задачи мог отправить в базу 206 данных задачи заданную цифровую задачу 214; и сервер 202 может быть выполнен с возможностью извлечения заданной цифровой задачи 214 из базы 206 данных задач и назначения заданной цифровой задачи одному из множества оценщиков 208, например заданному оценщику 212. Кроме того, сервер 202 может быть выполнен с возможностью предоставлять заданную цифровую задачу 214 заданному оценщику 212, передавая указание заданной цифровой задачи 214 через сеть 210 связи в соответственное электронное устройство (не помеченное отдельно) заданного оценщика 212.[0081] For example, a given task requestor could send to the task database 206 a given digital task 214; and the
[0082] Согласно разным не накладывающим ограничений вариантам осуществления настоящего изобретения соответственное электронное устройство (не обозначенное отдельно на Фиг. 2), связанное с заданным оценщиком 212 из множества оценщиков 208, может быть устройством, включающим в себя аппаратное обеспечение, на котором выполняется соответственное программное обеспечение, подходящее для выполнения соответственной текущей задачи (такой как заданная цифровая задача 214), включающим в себя, помимо прочего, персональный компьютер, портативный компьютер или смартфон, например. С этой целью соответственное электронное устройство может включать в себя некоторые или все компоненты компьютерной системы 100, изображенной на Фиг. 1.[0082] According to various non-limiting embodiments of the present invention, the respective electronic device (not indicated separately in FIG. 2) associated with a given
[0083] Соответственно, чтобы обеспечить возможность заданному оценщику 212 принимать цифровые задачи от сервера 202 и предоставлять ответы на них с его соответственного электронного устройства, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью выполнения приложения краудсорсинга (не изображено). Например, приложение краудсорсинга может иметь архитектуру клиент-сервер, при этом большая часть его функциональных возможностей выполняется на сервере 202; и заданный оценщик 212 может иметь соответственную учетную запись пользователя в приложении краудсорсинга, позволяющую ему принимать цифровые задачи с сервера 202 и отправлять на него свои ответы. В конкретном не накладывающем ограничений примере приложение краудсорсинга может быть реализовано как платформа краудсорсинга, такая как платформа краудсорсинга Яндекс Толока™, или другая проприетарная или коммерчески доступная платформа краудсорсинга.[0083] Accordingly, to allow a given
[0084] Кроме того, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения заданная цифровая задача 214 включает в себя аудиоролик 216. Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения аудиоролик 216 может включать в себя запись высказывания человеческого голоса, и заданная цифровая задача 214 может быть задачей классификации, предписывающей заданному оценщику 212 определить категорию пользователя, производящую высказывания человеческим голосом, например детский, взрослый и тому подобное. Например, ответ заданного оценщика 212 на такую цифровую задачу можно использовать для генерирования соответственного обучающего набора данных для дальнейшего обучения MLA для классификации пользователей заданного электронного устройства.[0084] In addition, in some non-limiting embodiments of the present invention, the given digital task 214 includes an audio clip 216. task 214 may be a classification task instructing a given
[0085] Однако в других не накладывающих ограничений вариантах осуществления настоящего изобретения аудиоролик 216, связанный с заданной цифровой задачей 214, может содержать запись предварительно определенного голосового ответа, который должен использоваться в данном приложении голосовой службы в ответ на один или более запросов пользователя. Например, заданное приложение голосовой службы может включать в себя приложение виртуального помощника, приспособленное для выполнения голосовых запросов пользователя заданного электронного устройства (например, интеллектуального громкоговорителя), запускающего приложение виртуального помощника. Например, приложение виртуального помощника может быть реализовано как приложение виртуального помощника ALISA™ (предоставлено ООО «Яндекс», Россия, 119021, Москва, ул. Льва Толстого, 16); однако другие коммерческие или проприетарные приложения виртуального помощника также могут быть предусмотрены, не выходя за рамки настоящего изобретения.[0085] However, in other non-limiting embodiments of the present invention, audio clip 216 associated with a given digital task 214 may contain a recording of a predefined voice response to be used in a given voice service application in response to one or more user requests. For example, a given voice service application may include a virtual assistant application adapted to fulfill voice requests from a user of a given electronic device (eg, smart speaker) running the virtual assistant application. For example, the virtual assistant application may be implemented as an ALISA™ virtual assistant application (provided by Yandex LLC, 16 Lev Tolstoy St., Moscow, 119021 Moscow, Russia); however, other commercial or proprietary virtual assistant applications may also be provided without departing from the scope of the present invention.
[0086] Таким образом, в этих вариантах осуществления заданная цифровая задача 214 может включать в себя инструкции для заданного оценщика 212, например, преобразовать предварительно определенный голосовой ответ в его текстовое представление. В другом примере заданная цифровая задача 214 может включать в себя инструкции для заданного оценщика 212 по переводу предварительно определенного голосового ответа на другой язык. Кроме того, в еще одном примере, через выполнение заданной цифровой задачи 214, заданный оценщик 212 может быть приглашен для оценки качества (например, с использованием соответственной шкалы качества) записи, например, с точки зрения количества шума, наложенного на него, четкости произношения предварительно определенного голосового ответа и т.п. В еще одном примере заданная цифровая задача 214 может включать в себя инструкции для определения соответствий между предварительно определенным голосовым ответом и одним или более голосовыми запросами пользователя, в ответ на которые приложение виртуального помощника может быть дополнительно выполнено с возможностью генерирования предварительно определенного голосового ответа. Следует отметить, что приведенные выше примеры не являются исчерпывающим списком, и другие примеры цифровых задач в отношении соответственного аудиоролика также могут быть предусмотрены, не выходя за рамки объема настоящего изобретения.[0086] Thus, in these embodiments, the given digital task 214 may include instructions for the given
[0087] Таким образом, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения, после приема заданной цифровой задачи 214, используя приложение краудсорсинга, заданный оценщик 212 может дать на нее ответ, который соответственное электронное устройство заданного оценщика 212 выполнено с возможностью передать на сервер 202. Однако предоставление доступа к аудиоролику 216, связанному с заданной цифровой задачей 214, заданному оценщику 212 может позволить ему неправильно использовать аудиоролик 216. Например, заданный оценщик 212 может записывать аудиоролик 216, связанный с заданной цифровой задачей 214, используя свои личные электронные устройства (не изображены). Кроме того, заданный оценщик 212 может опубликовать записанный аудиоролик на своих частных страницах в социальной сети и/или переслать записанный таким образом аудиоролик кому-то еще. Как можно понять, эти действия могут привести к несанкционированному публичному раскрытию аудиоролика 216, связанного с заданной цифровой задачей 214, что может дополнительно нанести определенный финансовый и репутационный ущерб организации, владеющей приложением виртуального помощника.[0087] Thus, in accordance with some non-limiting embodiments of the present invention, upon receiving a given digital task 214 using a crowdsourcing application, a given
[0088] С этой целью, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения, сервер 202 может быть выполнен с возможностью персонализации заданной цифровой задачи 214 для выполнения заданным оценщиком 212. Более конкретно, перед отправкой заданной цифровой задачи 214 заданному оценщику 212 в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью добавлять к аудиоролику 216, связанному с заданной цифровой задачей 214, идентификационный водяной знак, указывающий идентификационную информацию заданного оценщика 212 и, таким образом, позволяющий дополнительно определять связь между ним и заданной цифровой задачей 214.[0088] To this end, in accordance with some non-limiting embodiments of the present invention, the
[0089] Таким образом, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью (1) принимать из базы 204 данных оценщиков по меньшей мере один идентификационный указатель 218 заданного оценщика 212, которому исходный аудиоролик заданной цифровой задачи 214 предназначен; (2) генерировать на основе по меньшей мере одного идентификационного указателя 218 заданного оценщика 212 соответственный идентификационный водяной знак, связанный с ним, для добавления к исходному аудиоролику заданной цифровой задачи 214; (3) принимать, из базы 206 данных задах, заданную цифровую задачу 214; (3) извлекать из заданной цифровой задачи 214 аудиоролик 216; (4) добавлять в аудиоролик 216 соответственный идентификационный водяной знак, тем самым генерируя дополненный аудиоролик 220; и (5) включать дополненный аудиоролик 220 в данную цифровую задачу 214 вместо исходного аудиоролика 216 для передачи заданной цифровой задачи 214 заданному оценщику 212 для выполнения.[0089] Thus, in some non-limiting embodiments of the present invention, the
[0090] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения, чтобы добавить соответственный идентификационный водяной знак, сначала сервер 202 может быть выполнен с возможностью представлять по меньшей мере один идентификационный указатель 218 заданного оценщика 212, такой как его имя и уникальный идентификатор, как указано выше, или его имя для входа в краудсорсинговое приложение, например, в виде уникальной двоичной последовательности. С этой целью, например, сервер 202 может быть выполнен с возможностью применения алгоритма 302 кодирования, как изображено на Фиг. 3, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения.[0090] In some non-limiting embodiments of the present invention, in order to add an appropriate identification watermark, the
[0091] В соответствии с не накладывающими ограничений вариантами осуществления настоящего изобретения не ограничивается то, как реализуется алгоритм 302 кодирования; и в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения может включать в себя алгоритм кодирования без потерь, такой как алгоритм арифметического кодирования, алгоритм кодирования Хаффмана, алгоритм кодирования Шеннона и т.п. В других не накладывающих ограничений вариантах осуществления настоящего изобретения алгоритм 302 кодирования может включать в себя алгоритм кодирования с потерями, такой как алгоритм кодирования с линейным предсказанием, алгоритм кодирования с дискретным косинусным преобразованием и т.п.[0091] According to non-limiting embodiments of the present invention, how the
[0092] Таким образом, алгоритм 302 кодирования может быть выполнен с возможностью генерирования, на основе, по меньшей мере, идентификационного указателя 218, двоичной последовательности 304, позволяющей однозначно идентифицировать заданного оценщика 212 среди других из множества оценщиков 208. Хотя в изображенных вариантах осуществления двоичная последовательность 304 имеет 16 бит, следует четко понимать, что в других не накладывающих ограничений вариантах осуществления настоящего изобретения двоичная последовательность 304 может включать в себя 8, 32 или 64 бита, например, не выходя за рамки настоящего изобретения.[0092] Thus, the
[0093] Таким образом, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью кодирования двоичной последовательности 304 в аудиоролик 216, тем самым добавляя к нему соответственный идентификационный водяной знак, связанный с заданным оценщиком 212, и генерируя дополненный аудиоролик 220. Кроме того, как станет очевидно из приведенного ниже описания, после воспроизведения дополненного аудиоролика 220 его дополненный аудиосигнал может быть захвачен электронным устройством, выполненным с возможностью распознавания соответственных идентификационных водяных знаков. Таким образом, в случае, если заданный оценщик 212 неправильно использовал дополненный аудиоролик 220 при выполнении заданной цифровой задачи 214, его идентификационная информация может быть установлена, и могут быть приняты соответственные превентивные меры против него, такие как ограничение доступа к его учетной записи в краудсорсинговом приложении, внесение его в черный список оценщиков, возбуждение против него судебных исков и тому подобное.[0093] Thus, in some non-limiting embodiments of the present invention,
[0094] Как сервер 202 может быть выполнен с возможностью добавления соответственного идентификационного водяного знака к аудиоролику 216 в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения, будет описано ниже со ссылкой на Фиг. 4-6.[0094] How the
[0095] Как соответственный идентификационный водяной знак может быть распознан электронным устройством в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения, будет дополнительно описано ниже со ссылкой на фигуры 7-10.[0095] How a corresponding identification watermark can be recognized by an electronic device in accordance with some non-limiting embodiments of the present invention will be further described below with reference to Figures 7-10.
Сеть связиCommunication network
[0096] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сеть 210 связи представляет собой Интернет. В альтернативных не накладывающих ограничений вариантах осуществления настоящего изобретения сеть 210 связи может быть реализована как любая подходящая локальная сеть (LAN), глобальная сеть (WAN), частная сеть связи и т.п. Следует четко понимать, что варианты реализации для сети связи предназначены только для целей иллюстрации. Как реализуется соответственная линия связи (не пронумерована отдельно) между каждым из серверов 202 и заданным одним из электронных устройств множества оценщиков 208 и сетью 210 связи, будет зависеть, среди прочего, от того, как каждый из сервер 202 и заданное одно из электронных устройств множества оценщиков 208 реализовано. Просто в качестве примера, а не ограничения, в тех вариантах осуществления настоящего изобретения, где заданное одно из соответственных электронных устройств множества оценщиков 208 реализовано как устройство беспроводной связи, такое как интеллектуальный громкоговоритель, линия связи может быть реализована как линия беспроводной связи. Примеры линий беспроводной связи включают в себя, но не ограничиваются ими, линию связи в сети 3G, линию связи в сети 4G и т.п. Сеть 210 связи также может использовать беспроводное соединение с сервером 202 и каждым из электронных устройств множества оценщиков 208.[0096] In some non-limiting embodiments of the present invention,
Генерирование идентификационного водяного знака в аудиороликеGenerating an identification watermark in an audio clip
[0097] Как упоминалось выше, для генерирования дополненного аудиоролика 220 для заданного оценщика 212 в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью генерирования соответственного идентификационного водяного знака в аудиоролике 216, который может быть представлен двоичной последовательностью 304. Другими словами, для генерирования дополненного аудиоролика 220 сервер 202 может быть выполнен с возможностью изменения уровней энергии исходного аудиосигнала аудиоролика 216 посредством кодирования в нем двоичной последовательности 304.[0097] As mentioned above, in order to generate an augmented audio clip 220 for a given
[0098] С этой целью, прежде всего, согласно некоторым не накладывающим ограничений вариантам осуществления настоящего изобретения, сервер 202 может быть выполнен с возможностью генерирования частотно-временного представления начального аудиосигнала, связанного с аудиороликом 216. На Фиг. 4 изображена схематическая диаграмма для процесса генерирования сервером 202 частотно-временного представления 404, связанного с аудиороликом 216, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения.[0098] To this end, first of all, according to some non-limiting embodiments of the present invention, the
[0099] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения, прежде всего, сервер 202 может быть выполнен с возможностью генерирования амплитудно-временного представления 402 начального аудиосигнала, связанного с аудиороликом 216. С этой целью сервер 202 может быть выполнен с возможностью применения одной или более методик дискретизации к начальному аудиосигналу. Например, однако, не ограничиваясь этим, сервер 202 может быть выполнен с возможностью использования методики дискретизации, основанной на частоте Найквиста.[0099] In some non-limiting embodiments of the present invention, first of all, the
[00100] Кроме того, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью применения преобразования Фурье к амплитудно-временному представлению 402 начального аудиосигнала для генерирования частотно-временного представления 404, связанного с ним. Вообще говоря, применение преобразования Фурье позволяет продемонстрировать, как частотные компоненты заданного аудиосигнала (например, начального аудиосигнала, связанного с аудиороликом 216) меняются во времени.[00100] In addition, in some non-limiting embodiments of the present invention, the
[00101] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения преобразование Фурье может включать в себя дискретное преобразование Фурье (ДПФ). То, как сервер 202 может быть выполнен с возможностью вычисления ДПФ, не ограничивается и в разных вариантах осуществления настоящего изобретения может включать в себя применение одного из семейства алгоритмов быстрого преобразования Фурье (БПФ), дополнительно включающего в себя алгоритм БПФ с простым коэффициентом, алгоритм БПФ Брууна, алгоритм БПФ Райдера, алгоритм БПФ Блюстейна и гексагональное БПФ.[00101] In some non-limiting embodiments of the present invention, the Fourier transform may include a discrete Fourier transform (DFT). How the
[00102] Кроме того, следует отметить, что для генерирования частотно-временного представления 404 начального аудиосигнала сервер 202 также может быть выполнен с возможностью применения к нему других дискретных преобразований, включающих в себя, помимо прочего: обобщенное ДПФ, преобразование Фурье в дискретном пространстве, Z-преобразование, измененное дискретное косинусное преобразование, дискретное преобразование Хартли и т.п.[00102] In addition, it should be noted that in order to generate a time-
[00103] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью применения преобразования Фурье к амплитудно-временному представлению 402 с использованием подхода накопления временных окон. Более конкретно, сервер 202 может быть выполнен с возможностью сегментации амплитудно-временного представления 402 на множество его частей на основе предварительно определенного временного окна 406 Δt. Кроме того, сервер 202 может быть выполнен с возможностью применения преобразования Фурье к каждой из множества частей, соответствующих длительности предварительно определенного временного окна 406.[00103] In some non-limiting embodiments of the present invention,
[00104] Следует отметить, что это не ограничивается тем, как определяется длительность предварительно определенного временного окна 406, и в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения длительность предварительно определенного временного окна 406 для аудиоролика 216 может быть выбрана на основе компромисса между временным разрешением и частотным разрешением частотно-временного представления 404, например, чем «уже» заданное временное окно 406, тем лучше временное разрешение и тем хуже частотное разрешение частотно-временного представления 404, связанного с аудиороликом 216, и наоборот.[00104] It should be noted that this is not limited to how the length of the
[00105] Кроме того, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью изменения частотно-временного представления 404 в соответствии с двоичной последовательностью 304, тем самым добавляя в него соответственный идентификационный водяной знак, связанный с заданным оценщиком 212.[00105] In addition, in some non-limiting embodiments of the present invention, the
[00106] Например, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения, сервер 202 может быть выполнен с возможностью кодирования соответственного значения каждого бита двоичной последовательности 304 в частотно-временном представлении 404 посредством изменения исходного аудиосигнала, чтобы он имел соответственный предварительно определенный уровень энергии на соответственном единственном предварительно определенном частотном уровне в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406.[00106] For example, in accordance with some non-limiting embodiments of the present invention, the
[00107] Однако в других не накладывающих ограничений вариантах осуществления настоящего изобретения для заданного бита двоичной последовательности 304 сервер 202 может быть выполнен с возможностью определения соответственного набора предварительно определенных частотных уровней, где первый из них используется для указания значения заданного бита; а другие из соответственного набора предварительно определенных частотных уровней предназначены для воспроизведения значения заданного бита, указанного первым. С этой целью сервер 202 может быть дополнительно выполнен с возможностью изменения начального аудиосигнала аудиоролика 216, чтобы он имел соответственный предварительно определенный уровень энергии на каждом из соответственного набора предварительно определенных частотных уровней в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406. Такой подход к воспроизведению значения заданного бита двоичной последовательности 304 в частотно-временном представлении 404 может позволить повысить устойчивость сгенерированного таким образом соответственного идентификационного водяного знака к разным типам шума, которые могут быть наложены на аудиосигнал дополненного аудиоролика 220 во время его передачи, приема и преобразования.[00107] However, in other non-limiting embodiments of the present invention, for a given bit of binary sequence 304,
[00108] Например, соответственный набор предварительно определенных частотных уровней может включать в себя по меньшей мере два частотных уровня, каждый из которых отличается друг от друга. Следует четко понимать, что это не ограничивается тем, как сервер 202 может быть выполнен с возможностью определения каждого из по меньшей мере двух частотных уровней для указания значения заданного бита двоичной последовательности 304. Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью выбора каждого из по меньшей мере двух частотных уровней из предварительно определенного звукового спектра. В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения предварительно определенный звуковой спектр может быть звуковым спектром, распознаваемым человеческим ухом, например, от примерно 20 Гц до примерно 20000 Гц. Однако в других не накладывающих ограничений вариантах осуществления настоящего изобретения другие звуковые спектры, такие как спектр инфразвука, охватывающий от около 0 Гц до около 20 Гц, или спектр ультразвука, охватывающий от около 20000 Гц до около 200000 Гц, а также конкретные звуковые спектры, включающие в себя, по меньшей мере, частично, некоторые из звуковых спектров, упомянутых выше, также можно представить, не выходя за рамки объема настоящего изобретения.[00108] For example, the corresponding set of predefined frequency levels may include at least two frequency levels, each of which is different from each other. It should be clearly understood that this is not limited to how
[00109] Кроме того, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью выбора каждого из по меньшей мере двух частотных уровней, связанных с заданным битом в пределах предварительно определенного звукового спектра, произвольным образом - например, на основе предварительно определенного распределения (например, нормального распределения) частотных уровней в частотно-временном представлении 404, связанном с аудиороликом 216. Однако в других не накладывающих ограничений вариантах осуществления настоящего изобретения каждый из по меньшей мере двух разных частотных уровней может быть предварительно выбран для заданного бита двоичной последовательности 304, например, до того, как сервер 202 начнет изменять аудиоролик 216. В этих вариантах осуществления каждый из по меньшей мере двух частотных уровней также может быть предварительно выбран произвольным образом из предварительно определенного распределения частотных уровней во множестве аудиороликов, например.[00109] In addition, in some non-limiting embodiments of the present invention, the
[00110] В других не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью выбора другого одного из по меньшей мере двух частотных уровней как разнесенного с первым из по меньшей мере двух частотных уровней с предварительно определенным шагом. Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения предварительно определенный шаг может составлять 0,1 Гц, 20 Гц, 400 Гц или 1300 Гц.[00110] In other non-limiting embodiments of the present invention, the
[00111] В других не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью выбора каждого из двух частотных уровней, связанных с заданным битом, из соответственного поддиапазона предварительно определенного звукового спектра. Например, сервер 202 может быть выполнен с возможностью выбора первого из по меньшей мере двух частотных уровней из нижнего поддиапазона предварительно определенного звукового спектра; и выбора другого из по меньшей мере двух частотных уровней из более высокого поддиапазона предварительно определенного звукового спектра и т.п. Например, в тех вариантах осуществления настоящего изобретения, где предварительно определенный звуковой спектр является звуковым спектром, распознаваемым человеческим ухом, первый из по меньшей мере двух частотных уровней может быть выбран из поддиапазона от примерно 20 Гц до примерно 100 Гц; а другой из по меньшей мере двух частотных уровней может быть выбран из поддиапазона от примерно 1000 Гц до примерно 20 000 Гц. В других не накладывающих ограничений вариантах осуществления настоящего изобретения, как будет очевидно из приведенного ниже описания, сервер 202 может быть выполнен с возможностью выбора другого из по меньшей мере двух частотных уровней, так чтобы начальный аудиосигнал аудиоролика 216 имел то же значение амплитуды (или иначе, в пределах его предварительно определенных вариаций, например, ±5 дБ) на нем, что и на первом из по меньшей мере двух частотных уровней.[00111] In other non-limiting embodiments of the present invention,
[00112] Следует отметить, что другие методики определения частотных уровней для соответственного набора предварительно определенных частотных уровней для указания заданного бита двоичной последовательности 304, например, на основе предварительно определенной функции, также могут быть предусмотрены без отклонения от объема настоящего изобретения.[00112] It should be noted that other techniques for determining frequency levels for a respective set of predetermined frequency levels to indicate a given bit of binary sequence 304, such as based on a predetermined function, may also be provided without departing from the scope of the present invention.
[00113] Кроме того, следует отметить, что в тех вариантах осуществления, где заданный один из по меньшей мере двух частотных уровней недоступен или, другими словами, отсутствует в частотном спектре исходного аудиосигнала, чтобы указать заданный бит двоичной последовательности 304, сервер 202 может быть выполнен с возможностью добавления соответственных предварительно определенных частей к начальному аудиосигналу, тем самым заполняя промежуток, соответствующий заданному одному из по меньшей мере двух частотных уровней. Однако в других не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью выбора по меньшей мере двух частотных уровней только из тех, которые формируют частотный спектр исходного аудиосигнала аудиоролика 216.[00113] In addition, it should be noted that in those embodiments where the given one of the at least two frequency levels is not available, or in other words, is not present in the frequency spectrum of the original audio signal, to indicate the given bit of the binary sequence 304, the
[00114] Кроме того, следует четко понимать, что указание заданного бита двоичной последовательности 304 набором отдельных частотных уровней описывается в данном документе только в целях ясности объяснения настоящего изобретения; и в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью указания заданного бита двоичной последовательности 304 посредством соответственного набора полос частот, при этом каждая полоса частот имеет предварительно определенную ширину полосы, такую как 5 Гц, 10 Гц или 25 Гц, например.[00114] In addition, it should be clearly understood that the indication of a given bit of the binary sequence 304 by a set of individual frequency levels is described in this document only for the purpose of explaining the present invention clearly; and in some non-limiting embodiments of the present invention,
[00115] Таким образом, в качестве примера, как можно понять Из Фиг. 4, сервер 202 может быть выполнен с возможностью определения (i) первого набора частотных уровней 408 для указания в частотно-временном представлении 404, связанном с аудиороликом 216, например, первого бита двоичной последовательности 304, имеющего значение «1»; и (ii) второго набора частотных уровней 410 для указания, например, второго бита двоичной последовательности 304, имеющего значение «0». Кроме того, можно понять, что каждый из первого набора частотных уровней 408 и второго набора частотных уровней 410 включает в себя по меньшей мере два разных частотных уровня, то есть f 1 , f' 1 и f 2 , f' 2 , соответственно . [00115] Thus, as an example, as can be understood from FIG. 4,
[00116] Кроме того, согласно некоторым не накладывающим ограничений вариантам осуществления настоящего изобретения, чтобы указать значения каждого из первого бита и второго бита двоичной последовательности 304 в аудиоролике 216, сервер 202 может быть выполнен с возможностью изменения начального аудиосигнала, так чтобы он имел соответственный предварительно определенный уровень энергии на каждом из первого набора частотных уровней 408 и второго набора частотных уровней 410 в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406. С этой целью в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью модуляции амплитуды начального аудиосигнала на каждом из первого набора частотных уровней 408 и второго набора частотных уровней 410, чтобы он имел их соответственное предварительно определенное значение.[00116] In addition, according to some non-limiting embodiments of the present invention, in order to indicate the values of each of the first bit and second bit of the binary sequence 304 in the audio clip 216, the
[00117] Например, чтобы указать значение «1» первого бита двоичной последовательности 304 в аудиоролике 216, сервер 202 может быть выполнен с возможностью модуляции амплитуды начального аудиосигнала в пределах по меньшей мере одного экземпляра заданного временного окна 406, чтобы он имел на каждом из первого набора частотных уровней 408 первое предварительно определенное значение амплитуды, такое как, например, 30 или 50 дБ. Однако в других не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью изменять начальный аудиосигнал, чтобы он имел соответственное значение амплитуды на каждом из первого набора частотных уровней не меньшее, чем первое предварительно определенное значение амплитуды. В других не накладывающих ограничений вариантах осуществления настоящего изобретения, чтобы указать значение '1' первого бита двоичной последовательности 304, сервер 202 может быть выполнен с возможностью изменять начальный аудиосигнал, чтобы он имел ненулевое соответственное значение амплитуды на каждом из первого набора частотных уровней 408 в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406.[00117] For example, to indicate the value "1" of the first bit of the binary sequence 304 in the audio clip 216, the
[00118] Кроме того, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения, чтобы указать значение «0» второго бита двоичной последовательности 304, сервер 202 может быть выполнен с возможностью модуляции амплитуды начального аудиосигнала таким образом, чтобы он имел второе предварительно определенное значение амплитуды (например, 10 или 20 дБ) на каждом из второго набора частотных уровней 410 в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406. Аналогичным образом, в других не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью изменения начального аудиосигнала, чтобы он имел амплитуду каждого из второго набора частотных уровней 410 не превышающую второе предварительно определенное амплитуды, чтобы указать значение «0» второго бита.[00118] In addition, in accordance with some non-limiting embodiments of the present invention, in order to indicate the value "0" of the second bit of the binary sequence 304, the
[00119] В конкретных не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью указывать значение «0» второго бита двоичной последовательности 304 нулевым уровнем энергии начального аудиосигнала аудиоролика 216 на каждом из второго набора частотных уровней 410 в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406. С этой целью в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью исключения соответственных частей начального аудиосигнала, соответствующих каждому из второго набора частотных уровней 410.[00119] In specific non-limiting embodiments of the present invention, the
[00120] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения, чтобы исключить соответственную часть начального аудиосигнала, соответствующую заданному одному из второго набора частотных уровней 410, сервер 202 может быть выполнен с возможностью применения соответственного режекторного фильтра к начальному аудиосигналу.[00120] In some non-limiting embodiments of the present invention, in order to exclude a corresponding portion of the initial audio signal corresponding to a given one of the second set of
[00121] Вообще говоря, режекторный фильтр (также называемый «полосовым заградительным фильтром») - это фильтр обработки сигнала, выполненный с возможностью удаления (или иного исключения) части данного сигнала (такого как начальный аудиосигнал аудиоролика 216) на конкретном предварительно определенном частотном уровне, которая может быть представлена в соответственном частотно-временном представлении заданного сигнала соответственным пустым промежутком, соответствующим конкретному предварительно определенному частотному уровню.[00121] Generally speaking, a notch filter (also referred to as a "notch filter") is a signal processing filter configured to remove (or otherwise eliminate) a portion of a given signal (such as the initial audio signal of audio clip 216) at a particular predetermined frequency level, which can be represented in a respective time-frequency representation of a given signal by a respective blank space corresponding to a particular predetermined frequency level.
[00122] Таким образом, сервер 202 может быть выполнен с возможностью применения соответственного режекторного фильтра к начальному аудиосигналу аудиоролика 216, чтобы «вырезать» в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406 части начального аудиосигнала, соответствующие каждому из второго набора частотных уровней 410, кодирующих второй бит двоичной последовательности 304, как изображено на Фиг. 4. Соответственно, исключенные таким образом части начального аудиосигнала образуют в нем соответственный беззвучный промежуток при его воспроизведении. [00122] Thus, the
[00123] Следует отметить, что сервер 202 может быть выполнен с возможностью модуляции конкретных параметров соответственного идентификационного водяного знака, которые должны быть добавлены к начальному аудиосигналу, так чтобы соответственный беззвучный промежуток, сформированный в нем, мог быть по существу не распознаваемым человеческим ухом. Например, сервер 202 может быть выполнен с возможностью выполнения по меньшей мере одного из: модуляции (например, уменьшения) размера предварительно определенного временного окна 406, уменьшения количества частотных уровней для кодирования значения второго бита во временно-частотном представлении 404 начального аудиосигнала, дискретизации частотных уровней для второго набора частотных уровней из поддиапазонов предварительно определенного звукового спектра, включающих в себя частотные уровни, плохо воспринимаемые человеческим ухом, и т.п. В связи с этим, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения соответственный набор предварительно определенных частотных уровней для указания значения «0» заданного бита может иметь меньше предварительно определенных частотных уровней, чем тот, который используется для указания значения «1».[00123] It should be noted that the
[00124] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения, чтобы применить соответственный режекторный фильтр, сервер 202 может быть коммуникативно связан с его аналоговой конфигурацией (не изображена). В этих вариантах осуществления соответственный режекторный фильтр может быть реализован в виде электронной схемы, выполненной с возможностью фильтрации заданного одного из второго набора частотных уровней 410. В конкретном не накладывающем ограничений примере соответственный режекторный фильтр может быть одним из типов, доступных от TEXAS INSTRUMENTS INC., 12500 TI Blvd., Dallas, Texas 75243 USA (США, Техас 75243, Даллас, 12500 Бульвар ТИ). Однако следует четко понимать, что настольный сканер может быть реализован в любом другом подходящем оборудовании.[00124] In some non-limiting embodiments of the present invention, in order to apply an appropriate notch filter,
[00125] В других не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен, посредством выполнения соответственных инструкций, с возможностью применения цифрового выполнения соответственного режекторного фильтра, посредством чего сервер 202 выполнен с возможностью применения соответственных математических операций к начальному аудиосигналу, которые эквивалентны применению аналогового выполнения соответственного режекторного фильтра.[00125] In other non-limiting embodiments of the present invention, the
[00126] Таким образом, изменяя начальный аудиосигнал аудиоролика 216 на других соответственных наборах частотных уровней, чтобы указать в нем соответственные значения каждого другого бита двоичной последовательности 304, как описано выше в отношении первого и второго бита, сервер 202 может быть выполнен с возможностью включения соответственного идентификационного водяного знака, связанного с заданным оценщиком 212.[00126] Thus, by changing the initial audio signal of the audio clip 216 at other respective sets of frequency levels to indicate therein the respective values of each other bit of the binary sequence 304, as described above with respect to the first and second bits, the
[00127] Кроме того, на основе частотно-временного представления 404 начального аудиосигнала, измененного таким образом, чтобы включить соответственный идентификационный водяной знак заданного оценщика 212, сервер 202 может быть выполнен с возможностью генерирования дополненного аудиосигнала дополненного аудиоролика 220.[00127] In addition, based on the time-
[00128] На Фиг. 5 изображена схематическая диаграмма процесса для генерирования процессором дополненного амплитудно-временного представления 502 дополненного аудиосигнала, связанного с дополненным аудиороликом 220, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения.[00128] In FIG. 5 is a schematic diagram of a process for generating an augmented audio time-amplitude representation 502 associated with an augmented audio clip 220 by a processor, in accordance with some non-limiting embodiments of the present invention.
[00129] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью применения обратного преобразования Фурье к частотно-временному представлению 404, связанному с аудиороликом 216. Например, сервер 202 может быть выполнен с возможностью применения обратного ДПФ к частотно-временному представлению 404 в каждом экземпляре его предварительно определенного временного окна 406, чтобы генерировать дополненное амплитудно-временное представление 502, связанное с дополненным аудиосигналом 220.[00129] In some non-limiting embodiments of the present invention,
[00130] Таким образом, как описано выше со ссылкой на Фиг. 2, сгенерированный таким образом дополненный аудиоролик 220 может дополнительно быть включен в заданную цифровую задачу 214 для его персонализации, которая должна быть выполнена заданным оценщиком 212. Как дополнительно упомянуто выше, когда воспроизводится дополненный аудиоролик 220, соответственный идентификационный водяной знак может быть обнаружен, например, электронным устройством, тем самым определяя связь между заданным оценщиком 212 и дополненным аудиороликом 220.[00130] Thus, as described above with reference to FIG. 2, the thus generated padded audio clip 220 may further be included in a given digital task 214 for personalization to be performed by a given
Первый способFirst way
[00131] Учитывая архитектуру и примеры, приведенные выше, можно выполнить способ дополнения аудиоролика, подлежащего предоставлению оценивающему человеку, например, персонализировать аудиоролик 216, подлежащий передаче заданному оценщику 212 как часть заданной цифровой задачи 214. На Фиг. 6 изображена блок-схема последовательности операций первого способа 600 согласно не накладывающим ограничений вариантам осуществления настоящего изобретения. Первый способ 600 может выполняться сервером 202.[00131] Given the architecture and examples above, it is possible to perform a method of augmenting the audio clip to be provided to the rater, such as personalizing the audio clip 216 to be submitted to a given
Этап 602: ПРИЕМ ПРОИЗВОДСТВЕННЫМ СЕРВЕРОМ АУДИОРОЛИКА, ПРИЧЕМ АУДИОРОЛИК БЫЛ ПРЕДВАРИТЕЛЬНО ЗАПИСАНStep 602: RECEPTION BY THE PRODUCTION SERVER OF THE AUDIO REVIEW AND THE AUDIO REVIEW HAS BEEN PRE-RECORDED
[00132] Первый способ 600 начинается на этапе 602, на котором сервер 202 может быть выполнен с возможностью приема заданного аудиоролика для добавления в него соответственного идентификационного водяного знака, связанного с заданным оценщиком 212. Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью приема заданного аудиоролика, который был предварительно записан для выполнения заданным оценщиком 212 соответственной цифровой задачи в приложении краудсорсинга, как описано выше - например, аудиоролик 216 заданной цифровой задачи 214.[00132] The
[00133] Таким образом, первый способ переходит к этапу 604.[00133] Thus, the first method proceeds to block 604.
ЭТАП 604: ПРИЕМ ПРОИЗВОДСТВЕННЫМ СЕРВЕРОМ ИДЕНТИФИКАЦИОННОГО УКАЗАТЕЛЯ ОЦЕНИВАЮЩЕГО ЧЕЛОВЕКА, КОТОРОМУ ДОЛЖЕН БЫТЬ ПЕРЕДАН АУДИОРОЛИКSTEP 604: RECEIPT BY THE PRODUCTION SERVER OF THE IDENTIFICATION OF THE EVALUER TO WHOM THE AUDIO REVIEW SHOULD BE TRANSMITTED
[00134] Кроме того, на этапе 604, согласно некоторым не накладывающим ограничений вариантам осуществления настоящего изобретения, сервер 202 может быть выполнен с возможностью приема по меньшей мере одного идентификационного указателя заданного оценщика 212. Как описано выше со ссылкой на Фиг. 2 и 3, по меньшей мере один идентификационный указатель заданного оценщика 212 может включать в себя, без ограничений, его имя и соответственный уникальный идентификатор, его имя для входа в приложение краудсорсинга и т.п.[00134] In addition, at
[00135] Кроме того, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения на основе по меньшей мере одного идентификационного указателя, как описано выше со ссылкой на Фиг. 3, первое электронное устройство 702 может быть выполнено с возможностью генерирования двоичной последовательности 304, однозначно идентифицирующей заданного оценщика 212 среди других из множества оценщиков 208.[00135] In addition, in some non-limiting embodiments of the present invention, based on at least one identification indicator, as described above with reference to FIG. 3, the first
[00136] Таким образом, первый способ переходит к этапу 606.[00136] Thus, the first method proceeds to block 606.
Этап 606: ГЕНЕРИРОВАНИЕ ПРОИЗВОДСТВЕННЫМ СЕРВЕРОМ НА ОСНОВЕ УНИКАЛЬНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ БИТОВ ИДЕНТИФИКАЦИОННОГО ВОДЯНОГО ЗНАКА, СВЯЗАННОГО С ОЦЕНИВАЮЩИМ ЧЕЛОВЕКОМ, ДЛЯ ВКЛЮЧЕНИЯ В АУДИОРОЛИК ДЛЯ ГЕНЕРИРОВАНИЯ ДОПОЛНЕННОГО АУДИОРОЛИКАStep 606: GENERATE BY THE PRODUCTION SERVER, BASED ON THE UNIQUE BIT SEQUENCE, AN IDENTIFICATION WATERMARK ASSOCIATED WITH THE EVALUER TO BE INCLUDED IN THE AUDIO REVIEW TO GENERATE THE ADDED AUDIO REVIEW
[00137] На этапе 606, согласно некоторым не накладывающим ограничений вариантам осуществления настоящего изобретения, сервер 202 может быть выполнен с возможностью кодирования двоичной последовательности 304 в аудиоролике 216, тем самым генерируя дополненный аудиоролик 220, персонализированный для заданного оценщика 212.[00137] At
[00138] С этой целью, как описано выше со ссылкой на Фиг. 4, сервер 202 может быть выполнен с возможностью генерирования частотно-временного представления 404 начального аудиосигнала аудиоролика 216. Например, сервер 202 может быть выполнен с возможностью применения преобразования Фурье к амплитудно-временному представлению 402 начального аудиосигнала. В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью применения преобразования Фурье в подходе накопления окон с предварительно определенным временным окном 406, как дополнительно упомянуто выше.[00138] To this end, as described above with reference to FIG. 4, the
[00139] Кроме того, сервер 202 может быть выполнен с возможностью определения частотных уровней для указания соответственных значений битов двоичной последовательности 304 в начальном аудиосигнале аудиоролика 216. Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения для указания значения заданного бита двоичной последовательности 304 сервер 202 может быть выполнен с возможностью определения соответственного набора предварительно определенных частотных уровней, включающих в себя по меньшей мере два разных частотных уровня, где первый из них используется для указания значения заданного бита; а другие предназначены для воспроизведения значения заданного бита, указанного первым - например, первый набор частотных уровней 408 и второй набор частотных уровней 410, используемые для указания первого и второго битов двоичной последовательности 304 в частотно-временное представление 404 начального аудиосигнала, связанного с аудиороликом 216.[00139] In addition, the
[00140] Как дополнительно описано выше со ссылкой на Фиг. 4, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью определения каждого из соответственного набора предварительно определенных частотных уровней произвольным образом. В других не накладывающих ограничений вариантах осуществления настоящего изобретения каждый из соответственного набора предварительно определенного набора частотных уровней может быть предварительно определен произвольным образом до приема сервером 202 аудиоролика 216. В других не накладывающих ограничений вариантах осуществления настоящего изобретения каждый из соответственного набора предварительно определенного набора частотных уровней может быть предварительно определен на основе предварительно определенного шага, как описано выше.[00140] As further described above with reference to FIG. 4, in some non-limiting embodiments of the present invention, the
[00141] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью выбора каждого соответственного набора предварительно определенных частотных уровней из предварительно определенного звукового спектра, такого как звуковой спектр, распознаваемый человеческим ухом, как дополнительно описано выше.[00141] In some non-limiting embodiments of the present invention,
[00142] Таким образом, первый способ 600 переходит к этапу 608.[00142] Thus, the
Этап 608: ИЗМЕНЕНИЕ ПРОИЗВОДСТВЕННЫМ СЕРВЕРОМ АУДИОСИГНАЛА, ЧТОБЫ ОН ИМЕЛ ПРЕДВАРИТЕЛЬНО ОПРЕДЕЛЕННЫЙ УРОВЕНЬ ЭНЕРГИИ НА КАЖДОМ ИЗ ДВУХ РАЗНЫХ ЧАСТОТНЫХ УРОВНЕЙ, ДЛЯ УКАЗАНИЯ ПРИСУТСТВИЯ ЗАДАННОГО БИТА УНИКАЛЬНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ БИТОВ, СВЯЗАННОЙ С ОЦЕНИВАЮЩИМ ЧЕЛОВЕКОМ, В ДОПОЛНЕННОМ АУДИОРОЛИКЕStage 608: the change in the production server of the audio signal so that it has a pre -determined level of energy at each of the two different frequency levels, to indicate the presence of a given bit by the unique sequence of bits associated with the evaluating person, in an augmented audio rock
[00143] На этапе 608 сервер 202 может быть выполнен с возможностью изменения начального аудиосигнала, например, с использованием его частотно-временного представления 404, чтобы иметь соответственный предварительно определенный уровень энергии на каждом из соответственных наборов частотных уровней, чтобы указывать значение заданного бита двоичной последовательности 304 в аудиоролике 216.[00143] At
[00144] Например, как описано выше, чтобы указать значение «1» первого бита двоичной последовательности 304 в аудиоролике 216, сервер 202 может быть выполнен с возможностью модулирования амплитуды начального аудиосигнала в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406 частотно-временного представления 404, чтобы он имел на каждом из первого набора частотных уровней 408 первое предварительно определенное значение амплитуды, такое как, например, 30 или 50 дБ. Однако в других не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью изменять начальный аудиосигнал, чтобы он имел соответственное значение амплитуды на каждом из первого набора частотных уровней не меньшее, чем первое предварительно определенное значение амплитуды. В других не накладывающих ограничений вариантах осуществления настоящего изобретения, чтобы указать значение «1» первого бита двоичной последовательности 304, сервер 202 может быть выполнен с возможностью изменения начального аудиосигнала, чтобы он имел ненулевое соответственное значение амплитуды на каждом из первого набора частотных уровней 408 в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406 частотно-временного представления 404.[00144] For example, as described above, to indicate the value "1" of the first bit of the binary sequence 304 in the audio clip 216, the
[00145] Кроме того, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения, чтобы указать значение «0» второго бита двоичной последовательности 304, сервер 202 может быть выполнен с возможностью модулирования амплитуды начального аудиосигнала таким образом, чтобы он имел второе предварительно определенное значение амплитуды (например, 10 или 20 дБ) на каждом из второго набора частотных уровней 410 в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406. Аналогичным образом, в других не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью изменения начального аудиосигнала, чтобы амплитуда каждого из второго набора частотных уровней 410 не превышала второе предварительно определенное значение амплитуды для указания значения «0» второго бита.[00145] In addition, in accordance with some non-limiting embodiments of the present invention, in order to indicate the value "0" of the second bit of the binary sequence 304, the
[00146] В конкретных не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью указывать значение «0» второго бита двоичной последовательности 304 нулевым уровнем энергии начального аудиосигнала аудиоролика 216 на каждом из второго набора частотных уровней 410 в пределах по меньшей мере одного экземпляра предварительно определенного временного окна 406 частотно-временного представления 404. С этой целью в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью исключения соответственных частей исходного аудиосигнала, соответствующих каждому из второго набора частотных уровней 410.[00146] In specific non-limiting embodiments of the present invention, the
[00147] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения, чтобы исключить соответственную часть начального аудиосигнала, соответствующую заданному одному из второго набора частотных уровней 410, сервер 202 может быть выполнен с возможностью применения соответственного режекторного фильтра к начальному аудиосигналу, как описано выше.[00147] In some non-limiting embodiments of the present invention, in order to exclude a respective portion of the initial audio signal corresponding to a given one of the second set of
[00148] Как дополнительно описано выше, сервер 202 может быть выполнен с возможностью исключения соответственной части начального аудиосигнала для указания значения второго бита, так чтобы образованный таким образом беззвучный промежуток в нем не распознавался человеческим ухом.[00148] As further described above, the
[00149] Таким образом, посредством определения для каждого бита двоичной последовательности 204 соответственного набора предварительно определенных частотных уровней и изменения уровней энергии начального аудиосигнала в них, как описано выше, сервер 202 может быть выполнен с возможностью генерирования дополненного аудиоролика 220.[00149] Thus, by determining for each bit of the
[00150] Таким образом, первый способ 600 переходит к этапу 610.[00150] Thus, the
ЭТАП 610: ПЕРЕДАЧА ДОПОЛНЕННОГО АУДИОРОЛИКА, ВКЛЮЧАЮЩЕГО В СЕБЯ ИДЕНТИФИКАЦИОННЫЙ ВОДЯНОЙ ЗНАК, В ЭЛЕКТРОННОЕ УСТРОЙСТВО, СВЯЗАННОЕ С ОЦЕНИВАЮЩИМ ЧЕЛОВЕКОМ, ДЛЯ ВЫПОЛНЕНИЯ ОДНОЙ ИЛИ БОЛЕЕ ЦИФРОВЫХ ЗАДАЧ НА ОСНОВЕ ОЦЕНКИ ДОПОЛНЕННОГО АУДИОРОЛИКАSTEP 610: TRANSFER OF THE ADDED AUDIO REVIEW INCLUDING THE IDENTIFICATION WATERMARK TO AN ELECTRONIC DEVICE ASSOCIATED WITH THE JUDGER TO PERFORM ONE OR MORE DIGITAL TASKS BASED ON THE ADDED AUDIO REVIEW EVALUATION
[00151] На этапе 610 сервер 202 может быть выполнен с возможностью включения дополненного аудиоролика 220 в заданную цифровую задачу 214 вместо аудиоролика 216 для передачи заданной цифровой задачи заданному оценщику 212 для выполнения.[00151] At 610, the
[00152] Таким образом, первый способ 600 завершается.[00152] Thus, the
[00153] Таким образом, конкретные варианты осуществления способа 600 позволяют генерировать персонализированные аудиоролики, образующие часть соответственных цифровых задач, которые должны выполняться соответственными оценивающими людьми, например, теми из множества оценщиков 208. Соответственные идентификационные водяные знаки в персонализированных таким образом аудиороликах могут быть дополнительно распознаны при воспроизведении аудиороликов, и оценщики, предположительно неправильно использовавшие аудиоролики, что привело к общедоступному доступу к ним, могут быть идентифицированы. Кроме того, как упоминалось выше, могут быть приняты конкретные меры против идентифицированных оценщиков, направленные на предотвращение дальнейшего ущерба организации, владеющей аудиороликами.[00153] Thus, specific embodiments of the
[00154] Теперь будет описано, как персонализированный аудиоролик, такой как дополненный аудиоролик 220, может быть распознан электронным устройством в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения.[00154] It will now be described how a personalized audio clip, such as augmented audio clip 220, can be recognized by an electronic device in accordance with some non-limiting embodiments of the present invention.
Обнаружение идентификационного водяного знакаID watermark detection
[00155] На Фиг. 7 изображена другой вариант реализации сетевой вычислительной среды 200, подходящей для определения связи между одним из множества оценщиков 208 и заданным находящимся в использовании аудиороликом 720 в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения.[00155] In FIG. 7 depicts another embodiment of a
[00156] Как можно понять из Фиг. 7, сервер 202 может дополнительно быть коммуникативно связан через сеть 210 связи с первым электронным устройством 702, которое, например, может быть связано с пользователем 704.[00156] As can be understood from FIG. 7, the
[00157] Согласно конкретному не накладывающему ограничений варианту осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью определения связи между аудиороликами, воспроизводимыми вблизи 706 от него, и каждым из множества оценщиков 208, таких как заданный оценщик 212. Более конкретно, первое электронное устройство 702 может быть выполнено с возможностью определять, был ли заданный находящийся в использовании аудиоролик 720, воспроизводимый вблизи 706 первого электронного устройства 702, персонализирован для заданного оценщика 212 - например, дополненный аудиоролик 220, как описано выше, - посредством определения присутствия в нем соответственного идентификационного водяного знака, связанного с заданным оценщиком 212.[00157] According to a specific non-limiting embodiment of the present invention, the first
[00158] Как отмечалось выше, заданный оценщик 212 может предоставить общий доступ к дополненному аудиоролику 220, например, посредством по меньшей мере одного из (1) записи дополненного аудиоролика 220 с использованием своих личных электронных устройств; (2) копирования цифровых файлов дополненного аудиоролика 220 на свои личные электронные устройства; и (3) отправки полученных таким образом копий дополненного аудиоролика 220 третьим лицам и/или организациям, например, посредством их размещения на открытых общедоступных веб-ресурсах, например, в социальных сетях (не показаны).[00158] As noted above, a given
[00159] С этой целью, чтобы предоставить возможность первому электронному устройству 702 определить, включает в себя ли заданный находящийся в использовании аудиоролик 720 соответственный идентификационный водяной знак, связанный с одним из множества оценщиков 208, сервер 202 может быть выполнен с возможностью предоставления первому электронному устройству 702 первого пакета 712 данных, включающего в себя данные соответственных идентификационных водяных знаков, связанных с каждым из множества оценщиков 208, который первое электронное устройство 702 может быть выполнено с возможностью хранения в своей локальной памяти (например, одном из твердотельного накопителя 120 и запоминающего устройства 130 с произвольным доступом его компьютерной системы 100) для дальнейшего использования. Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения данные соответственного идентификационного водяного знака, связанного с заданным оценщиком 212, принятые в первом пакете 712 данных, могут включать в себя, без ограничения, по меньшей мере одно из: (i) двоичной последовательности 304, представляющей по меньшей мере один идентификационный указатель заданного оценщика 212; (ii) указания соответственных наборов частотных уровней, используемых для указания каждого из битов двоичной последовательности 304, например, первый набор частотных уровней 408 и второй набор частотных уровней 410, используемых для указания первого и второго битов двоичной последовательности 304, соответственно, как описано выше со ссылкой на Фиг. 4; и (iii) указания соответственных предварительно определенных уровней энергии для указания каждого бита из двоичной последовательности 304 на каждом из соответственных наборов частотных уровней. То, как первое электронное устройство 702 может быть выполнено с возможностью определения присутствия соответственного идентификационного водяного знака в заданном аудиоролике 720 на основе данных, предоставленных сервером 202 в первом пакете 712 данных, будет описано ниже.[00159] To this end, in order to enable the first
[00160] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть реализовано аналогично соответственному электронному устройству оценщика заданного оценщика 212; и как таковое включает в себя один из персонального компьютера, смартфона и т.п., дополнительно включая некоторые или все компоненты компьютерной системы 100, изображенной на Фиг. 1.[00160] In some non-limiting embodiments of the present invention, the first
[00161] Кроме того, в некотором не ограничивающем варианте осуществления настоящего изобретения находящийся в использовании заданный находящийся в использовании аудиоролик 720 может воспроизводиться вблизи 706 первого электронного устройства 702 вторым электронным устройством 710, коммуникативно связанным с сетью 210 связи. Например, второе электронное устройство 710 может быть выполнено с возможностью приема цифровых файлов заданного находящегося в использовании аудиоролика 720 из сети 210 связи и воспроизведения его с использованием его громкоговорителя (отдельно не обозначенного). Таким образом, не ограничивается то, как реализовано второе электронное устройство 710; и в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения второе электронное устройство 710 может быть реализовано аналогично первому электронному устройству 702 и содержать, например, один из портативного компьютера, персонального компьютера, смартфона, телевизора и т.д. С этой целью второе электронное устройство 710 может также включать в себя некоторые или все компоненты компьютерной системы 100, изображенной на Фиг. 1.[00161] In addition, in a certain non-limiting embodiment of the present invention, an in-use predetermined in-
[00162] В конкретных не накладывающих ограничений вариантах осуществления настоящего изобретения пользователь 704 первого электронного устройства 702 может быть заданным оценщиком 212. В этих вариантах осуществления первое электронное устройство 702 может быть частным электронным устройством заданного оценщика 212, а второе электронное устройство 710 может быть его соответственным электронным устройством, предназначенным для выполнения входящих цифровых задач, таких как заданная цифровая задача 214, как описано выше со ссылкой на Фиг. 2.[00162] In specific non-limiting embodiments of the present invention, the user 704 of the first
[00163] Однако следует отметить, что в другом не накладывающем ограничений варианте осуществления настоящего изобретения первое электронное устройство 702 и второе электронное устройство 710 не могут быть связаны с одним и тем же пользователем. С этой целью в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью передачи первому электронному устройству 702 первого пакета 712 данных, включающего в себя данные соответственных идентификационных водяных знаков, связанных с каждым из множества оценщиков 208, присутствие которых первое электронное устройство 702 может быть выполнено с возможностью последовательного определения в каждом находящемся в использовании аудиоролике, воспроизводимом в вблизи 706 от него, например, в заданном находящемся в использовании аудиоролике 720, как будет описано ниже.[00163] However, it should be noted that in another non-limiting embodiment of the present invention, the first
[00164] Таким образом, посредством воспроизведения заданного аудиоролика 720 второе электронное устройство 710 может быть выполнено с возможностью генерирования вблизи 706 первого электронного устройства 702 находящегося в использовании аудиосигнала 708. В этом отношении, чтобы определить, был ли заданный аудиоролик 720 персонализирован для заданного оценщика 212, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью: (1) захватить находящийся в использовании аудиосигнал 708, например, посредством встроенного микрофона (не показан); (2) анализировать на основе данных из первого пакета 712 данных находящийся в использовании аудиосигнал 708 для определения в нем присутствия соответственного идентификационного водяного знака, связанного с заданным оценщиком 212; и (3) в ответ на определение присутствия соответственного идентификационного водяного знака определять связь между заданным аудиороликом 720 и заданным оценщиком 212.[00164] Thus, by playing a given
[00165] В соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения для анализа находящегося в использовании аудиосигнала 708, прежде всего, первое электронное устройство 702 может быть выполнено с возможностью генерирования его частотно-временного представления. На Фиг. 8 изображена схематическая диаграмма процесса для генерирования первым электронным устройством 702 частотно-временного представления 804 находящегося в использовании аудиосигнала 708 в соответствии с некоторыми не накладывающими ограничений варианты осуществления настоящего изобретения.[00165] In accordance with some non-limiting embodiments of the present invention, in order to analyze the
[00166] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью генерирования находящегося в использовании частотно-временного представления 804 аналогично тому, как сервер 202 выполнен с возможностью генерирования частотно-временного представления 404 начального аудиосигнала, связанного с аудиороликом 216, как описано выше со ссылкой на Фиг. 4. Более конкретно, первое электронное устройство 702 может быть выполнено с возможностью (1) генерирования находящегося в использовании амплитудно-временного представления 802 находящегося в использовании аудиосигнала 708; и (2) применения преобразования Фурье к находящемуся в использовании амплитудно-временному представлению 802, тем самым генерируя находящееся в использовании частотно-временное представление 804 находящегося в использовании аудиосигнала 708.[00166] In some non-limiting embodiments of the present invention, the first
[00167] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью применения к находящемуся в использовании амплитудно-временному представлению 802 ту же конфигурацию преобразования Фурье, которую сервер 202 применил к амплитудно-временному представлению 402, чтобы сгенерировать частотно-временное представление 404 начального аудиосигнала, связанного с аудиороликом 216. Например, в тех вариантах осуществления, где сервер 202 применил преобразование Фурье к амплитудно-временному представлению 402 в подходе накопления окон, как описано выше со ссылкой на Фиг. 4, первое электронное устройство 702 также может быть выполнено с возможностью применения преобразования Фурье к находящемуся в использовании амплитудно-временному представления 802 с использованием подхода накопления окон. Кроме того, в этих вариантах осуществления первое электронное устройство 702 может быть выполнено с возможностью применения преобразования Фурье в подходе накопления окон с использованием того же размера предварительно определенного временного окна 406, которое используется сервером 202. Однако другой размер предварительно определенного временного окна 406 или даже другая конфигурация преобразования Фурье для использования при генерировании находящегося в использовании частотно-временного представления 804 также может быть предусмотрена без выхода за рамки настоящего изобретения.[00167] In some non-limiting embodiments of the present invention, the first
[00168] Кроме того, используя находящееся в использовании частотно-временное представление 804, первое электронное устройство 702 может быть выполнено с возможностью определения присутствия соответственного идентификационного водяного знака, связанного с заданным оценщиком 212, в заданном находящемся в использовании аудиоролике 720. С этой целью в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью определения уровней энергии находящегося в использовании аудиосигнала 708 на его частотных уровнях, которые использовались, например, для указания битов двоичной последовательности 304, связанной с заданным оценщиком 212, в дополненном аудиоролике 220.[00168] In addition, using the in-use time-frequency representation 804, the first
[00169] На Фиг. 9 изображена схематическая диаграмма этапа определения первым электронным устройством 702 присутствия соответственного идентификационного водяного знака, связанного с заданным оценщиком 212, в заданном находящемся в использовании аудиоролике 720, в соответствии с некоторыми не накладывающими ограничений вариантами осуществления настоящего изобретения.[00169] In Fig. 9 is a schematic diagram of the step of determining by a first
[00170] Более конкретно, для определения присутствия заданного бита двоичной последовательности 304 в заданном находящемся в использовании аудиосигнале 720 первое электронное устройство 702 может быть выполнено с возможностью определения соответственных уровней энергии находящегося в использовании аудиосигнала 708 на каждом из по меньшей мере двух его частотных уровней, используемых для указания значения заданного бита в соответственном идентификационном водяном знаке, связанном с заданным оценщиком 212. Другими словами, первое электронное устройство 702 может быть выполнено с возможностью определения того, соответствуют ли соответственные уровни энергии находящегося в использовании аудиосигнала 708 на каждом из по меньшей мере двух его частотных уровней тем, которые используются сервером 202, для указания значения заданного бита двоичной последовательности 304 при персонализации аудиороликов для заданного оценщика 212, таких как дополненный аудиоролик 220, как описано выше.[00170] More specifically, to determine the presence of a given bit of the binary sequence 304 in a given in-
[00171] В некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью определения того, было ли указано значение заданного бита в заданном находящемся в использовании аудиоролике 720, посредством сравнения уровней энергии находящегося в использовании аудиосигнала 708 на заданном одном из по меньшей мере двух частотных уровней и смежном с ним частотном уровне.[00171] In some non-limiting embodiments of the present invention, the first
[00172] Таким образом, первое электронное устройство 702 может быть выполнено с возможностью определения первого первичного уровня 902 энергии находящегося в использовании аудиосигнала 708 на первом из первого набора частотных уровней 408, f 1 , используемого для переноса значения первого бита двоичной последовательности 304 в дополненном аудиоролике 220. Кроме того, первое электронное устройство 702 может быть выполнено с возможностью определения первого вторичного уровня 903 энергии находящегося в использовании аудиосигнала 708 на первом смежном частотном уровне 904, , с первым из первого набора частотных уровней 408, f 1 . Кроме того, первое электронное устройство 702 может быть выполнено с возможностью определения первого разностного значения 907 (например, его абсолютного значения) между первичным уровнем 902 энергии и первым вторичным уровнем 903 энергии, связанным с первым одним из первого набора частотных уровней.[00172] Thus, the first
[00173] Следует отметить, что не ограничено то, как первое электронное устройство 702 выполнено с возможностью определения первого смежного частотного уровня 904; и в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью определения первого смежного частотного уровня 904 на основе предварительно определенного шага частоты от первого одного из первого набора частотных уровней 408, который может быть, например, 0,1 Гц, 1 Гц, 10 Гц и т.п.[00173] It should be noted that it is not limited to how the first
[00174] Кроме того, согласно некоторым не накладывающим ограничений вариантам осуществления настоящего изобретения, первое электронное устройство 702 может быть выполнено с возможностью определения первого объединенного разностного значения посредством объединения соответственных разностных значений, связанных с каждым из первого набора частотных уровней 408. Таким образом, на основе первого объединенного разностного значения, как будет описано ниже, первое электронное устройство 702 может быть выполнено с возможностью определения соответственного значения первого бита находящейся в использовании двоичной последовательности 908. Соответственно, если по меньшей мере часть находящейся в использовании двоичной последовательности 908 соответствует двоичной последовательности 304, представляющей по меньшей мере один идентификационный указатель заданного оценщика 212, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью определения присутствия соответственного идентификационного водяного знака в заданном находящемся в использовании аудиоролике 720; или другими словами, что заданный находящийся в использовании аудиоролик 720 был персонализирован для заданного оценщика 212.[00174] In addition, according to some non-limiting embodiments of the present invention, the first
[00175] Следует отметить, что в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения для определения объединенного разностного значения вместо использования соответственных смежных частотных уровней, которые выше, чем каждый из первого набора частотных уровней 408, например, первый смежный частотный уровень 904, первое электронное устройство 702 может быть выполнено с возможностью использования соответственных более низких смежных частотных уровней. Например, первое электронное устройство 702 может быть выполнено с возможностью определения на основе предварительно определенного шага частоты второго смежного частотного уровня 906, . Соответственно, на втором смежном частотном уровне 906 первое электронное устройство 702 может быть выполнено с возможностью определения второго вторичного уровня 905 энергии и, дополнительно, второго разностного значения 909 между ними и первого первичного уровня 902 энергии, который первое электронное устройство 702 может использоваться для определения первого объединенного разностного значения.[00175] It should be noted that in some non-limiting embodiments of the present invention, to determine the combined difference value, instead of using the respective adjacent frequency levels that are higher than each of the first set of
[00176] Кроме того, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения для определения первого объединенного разностного значения, связанного с первым битом находящейся в использовании двоичной последовательности 908, первое электронное устройство 702 может быть выполнено с возможностью выбора одного из соответственных разностных значений, связанных с более низким смежным частотным уровнем и более высоким смежным частотным уровнем каждого из первого набора частотных уровней 408. Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью выбора минимального одного из соответственных разностных значений, связанных с нижним смежным частотным уровнем и более высоким смежным частотным уровнем. Например, если первое электронное устройство 702 определило, что абсолютное значение первого разностного значения 907 ниже, чем абсолютное значение второго разностного значения 909, первое электронное устройство 702 может быть выполнено с возможностью выбора первого разностного значения 907 для генерирования первого объединенного разностного значения, связанного с первым битом находящейся в использовании двоичной последовательности 908.[00176] In addition, in some non-limiting embodiments of the present invention, to determine the first combined delta value associated with the first bit of the
[00177] Однако следует отметить, что в других не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью выбора максимального одного из соответственных разностных значений, связанных с каждым из первого набора частотных уровней 408 для генерирования - такое как второе разностное значение 909 в примере выше.[00177] However, it should be noted that in other non-limiting embodiments of the present invention, the first
[00178] Кроме того, согласно некоторым не накладывающим ограничений вариантам осуществления настоящего изобретения, чтобы сгенерировать первое объединенное разностное значение, связанное с первым битом, первое электронное устройство 702 может быть выполнено с возможностью суммирования абсолютных значений соответственных разностных значений, связанных с каждым из первого набора частотных уровней 408, определенных, как описано выше. Однако в других не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью алгебраического суммирования соответственных разностных значений, то есть с учетом соответственных знаков каждого из соответственных разностных значений. [00178] In addition, according to some non-limiting embodiments of the present invention, in order to generate a first combined difference value associated with the first bit, the first
[00179] Кроме того, первое электронное устройство 702 может быть выполнено с возможностью определения соответственного значения первого бита находящейся в использовании двоичной последовательности 908 посредством сравнения первого объединенного разностного значения с предварительно определенным пороговым значением. Например, в ответ на то, что первое объединенное разностное значение больше заданного порогового значения, первое электронное устройство 702 может быть выполнено с возможностью определения соответственного значения первого бита находящейся в использовании двоичной последовательности 908 как положительного, то есть имеющим значение «1». Соответственно, в ответ на то, что первое объединенное разностное значение равно или ниже предварительно определенного порогового значения, первое электронное устройство 702 может быть выполнено с возможностью определения соответственного значения первого бита как отрицательного, которое имеет значение '0'.[00179] In addition, the first
[00180] Однако в конкретных не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью применения другого подхода к определению первого объединенного разностного значения. Например, первое электронное устройство 702 может быть выполнено с возможностью определения первой объединенной суммы тех соответственных разностных значений, которые связаны с частотными уровнями первого набора частотных уровней 408, на которых находящийся в использовании аудиосигнал 708 имеет соответственные первичные уровни энергии (такие как первый первичный уровень 902 энергии), указывающие, что соответственное значение первого бита находящейся в использовании двоичной последовательности 908 равно «1». Кроме того, первое электронное устройство 702 может быть выполнено с возможностью определения второй объединенной суммы тех соответственных разностных значений, которые связаны с частотными уровнями первого набора частотных уровней 408, при которых находящийся в использовании аудиосигнал 708 имеет соответственные уровни энергии, указывающие, что соответственное значение первого бита находящейся в использовании двоичной последовательности 908 равно «0».[00180] However, in specific non-limiting embodiments of the present invention, the first
[00181] Кроме того, согласно некоторым не накладывающим ограничений вариантам осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью определять первое объединенное разностное значение, связанное с первым битом, как разность между первой объединенной суммой и второй объединенной суммой. В этих вариантах осуществления первое электронное устройство 702 может быть выполнено с возможностью определения соответственного значения первого бита посредством определения того, удовлетворяет ли первое объединенное разностное значение предварительно определенному условию. Например, первое электронное устройство 702 может быть выполнено с возможностью определения соответственного значения первого бита как «1», если первое объединенное разностное значение положительное, то есть больше «0». Напротив, если первое объединенное разностное значение, определенное на основе первой объединенной суммы и второй объединенной суммы, как описано выше, равно или меньше '0', то есть не положительно, первое электронное устройство 702, таким образом, может быть выполнено с возможностью определения соответственного значения первого бита находящейся в использовании двоичной последовательности 908 как «0».[00181] In addition, according to some non-limiting embodiments of the present invention, the first
[00182] В дополнительных не накладывающих ограничений вариантах осуществления настоящего изобретения для определения соответственного значения первого бита находящейся в использовании двоичной последовательности 908 первое электронное устройство 702 может быть выполнено с возможностью определения соответственного уровня достоверности для каждого первичного уровня энергии находящегося в использовании аудиосигнала 708 на каждом из первого набора частотных уровней 408. Заданный уровень достоверности указывает, переносят ли соответственные первичные уровни энергии находящегося в использовании аудиосигнала 708 на соответственном наборе частотных уровней соответственное значение заданного бита двоичной последовательности 304 или нет. Другими словами, заданный уровень частоты указывает на значение вероятности соответственных уровней энергии находящегося в использовании аудиосигнала 708, которые были изменены для указания на соответственном наборе частотных уровней соответственного значения заданного бита двоичной последовательности 304.[00182] In further non-limiting embodiments of the present invention, in order to determine the respective value of the first bit of the in-
[00183] Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью определения соответственного уровня достоверности для заданного первичного уровня энергии находящегося в использовании аудиосигнала 708 в соответствии со следующим уравнением:[00183] For example, in some non-limiting embodiments of the present invention, the first
(1) (1)
где - это заданный первичный уровень энергии, определенный на соответственном одном из соответственного набора частотных уровней, связанных с заданным битом находящейся в использовании двоичной последовательности 908, например, первый первичный уровень 902 энергии, связанный с первым битом находящейся в использовании двоичной последовательности 908;Where is a given primary energy level defined at a respective one of a respective set of frequency levels associated with a given bit of the in-
- это первый соответственный вторичный уровень энергии, определенный на более высоком смежном частотном уровне по отношению к соответственному одному из соответственного набора частотных уровней, например, первый вторичный уровень 903 энергии; и is the first corresponding secondary energy level defined at a higher adjacent frequency level with respect to the corresponding one of the corresponding set of frequency levels, for example, the first
- это второй соответственный вторичный уровень энергии, определенный на более низком смежном частотном уровне по отношению к соответственному одному из соответственного набора частотных уровней, например, второй вторичный уровень 905 энергии. is the second respective secondary energy level defined at a lower adjacent frequency level with respect to the respective one of the respective set of frequency levels, for example, the second
[00184] Таким образом, первое электронное устройство 702 может быть выполнено с возможностью определения соответственных уровней достоверности для каждого первичного уровня энергии находящегося в использовании аудиосигнала 708 на каждом из первого набора частотных уровней 408. Кроме того, первое электронное устройство 702 может быть выполнено с возможностью объединения соответственных уровней достоверности для определения первого объединенного уровня достоверности, связанного с первым битом находящейся в использовании двоичной последовательности 908. Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью определения первого объединенного уровня достоверности, аналогичного первому значению объединенной разности, как описано выше. Более конкретно, первое электронное устройство 702 может быть выполнено с возможностью определения первого объединенного уровня достоверности посредством суммирования соответственных уровней достоверности, связанных с частотными уровнями первого набора частотных уровней 408, на которых находящийся в использовании аудиосигнал 708 имеет соответственные первичные уровни энергии, указывающие, что соответственное значение первого бита находящейся в использовании двоичной последовательности 908 равно «1»; и вычитания тех соответственных уровней достоверности, связанных с соответственными первичными уровнями энергии находящегося в использовании аудиосигнала, указывающих на то, что соответственное значение первого бита находящейся в использовании двоичной последовательности 908 равно «0».[00184] Thus, the first
[00185] Кроме того, первое электронное устройство 702 может быть выполнено с возможностью определения соответственного значения первого бита находящейся в использовании двоичной последовательности 908 как «1», если первый объединенный уровень достоверности имеет положительное значение; иначе определения соответственного значения как «0».[00185] In addition, the first
[00186] Таким образом, анализируя другие уровни энергии находящегося в использовании аудиосигнала 708 на его частотных уровнях, соответствующих другим соответственным наборам частотных уровней, используемых для указания значений других битов двоичной последовательности 304 в дополненном аудиосигнале 220, с использованием находящегося в использовании частотно-временного представления 804, первое электронное устройство 702 может быть выполнено с возможностью определения соответственных значений других битов находящейся в использовании двоичной последовательности 908. Кроме того, первое электронное устройство 702 может быть выполнено с возможностью определения, соответствует ли находящаяся в использовании двоичная последовательность 908 двоичной последовательности 304, связанной с заданным оценщиком 212.[00186] Thus, by analyzing other energy levels of the in-
[00187] Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения первое электронное устройство 702 может быть выполнено с возможностью определения того, что находящаяся в использовании двоичная последовательность 908 соответствует двоичной последовательности 304, если предварительно определенное пороговое количество битов (например, десять, в качестве примера) первой имеет те же значения, что и соответственные биты последней. Не ограничено то, как предварительно определенное пороговое количество битов идентифицируется в находящейся в использовании двоичной последовательности 908; и в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения каждый из предварительно определенного порогового количества битов может иметь соответственную предварительно определенную порядковую позицию в находящейся в использовании двоичной последовательности 908 - например, первую, четвертую, седьмую и т.п. В других не накладывающих ограничений вариантах осуществления настоящего изобретения предварительно определенное пороговое количество битов может быть предварительно определенным пороговым количеством последовательных битов, таких как первые последовательные биты, в пределах находящейся в использовании двоичной последовательности 908.[00187] For example, in some non-limiting embodiments of the present invention, the first
[00188] Таким образом, возвращаясь к Фиг. 7, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения, в ответ на определение того, что находящаяся в использовании двоичная последовательность 908 соответствует двоичной последовательности 304, первое электронное устройство 702 может быть выполнено с возможностью определения присутствия соответственного идентификационного водяного знака, связанного с заданным оценщиком 212 в заданном находящемся в использовании аудиоролике 720, воспроизводимом вблизи 706 него, что может означать, что данный находящийся в использовании аудиоролик 720 был персонализирован для заданного оценщика 212 аналогично дополненному аудиоролику 220, как описано выше. [00188] Thus, returning to FIG. 7, in some non-limiting embodiments of the present invention, in response to determining that
[00189] Следует четко понимать, что настоящее изобретение не ограничивается выполнением вышеупомянутого подхода к обнаружению соответственного идентификационного водяного знака в данном находящемся в использовании аудиоролике 720 на первом электронном устройстве 702; и в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью поиска в сети 210 связи аудиороликов, которые можно рассматривать как конфиденциальную информацию; и применять к таким аудиороликам, с необходимыми поправками, вышеупомянутый подход для определения присутствия в них идентификационных водяных знаков, связанных с одним или более из множества оценщиков 208. Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть выполнен с возможностью поиска в общедоступных веб-ресурсах, таких как социальные сети, форумы и другое, обеспечивающих своих пользователям возможность публичного обмена медиаконтентом, подозрительные аудиоролики и далее анализировать такие аудиоролики, как описано выше. В этих вариантах осуществления сервер 202 может быть выполнен с возможностью идентификации подозрительных аудиороликов на основе, без ограничения, по меньшей мере одного из: (1) его длительность, такая как равная или меньше предварительно определенной длительности, например 20 секунд; (2) его название - например, если название включает в себя конкретные предварительно определенные ключевые слова, такие как «слово для пробуждения»; и (3) степень его принадлежности к одному или более из множества оценщиков 208 - например, если заданный аудиоролик был размещен в социальной сети через личную учетную запись пользователя, связанную с одним или более из множества оценщиков 208, например.[00189] It should be clearly understood that the present invention is not limited to performing the above approach to detecting the corresponding identification watermark in a given
[00190] Кроме того, после определения присутствия соответственного идентификационного водяного знака в заданном находящемся в использовании аудиоролике 720 первое электронное устройство 702 может быть выполнено с возможностью генерирования второго пакета 714 данных, включающего в себя предупреждающее уведомление о распознавании персонализированного аудиоролика вблизи 706 него, то есть данный находящийся в использовании аудиоролик 720; и передачи второго пакета 714 данных на сервер 202, который, возможно, сформировал данный находящийся в использовании аудиоролик 720. В связи с этим, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения после приема второго пакета 714 данных от первого электронного устройства 702 сервер 202 может быть выполнен с возможностью принятия конкретных превентивных действий против заданного оценщика 212, чтобы предотвратить дальнейшее распространение персонализированных аудиороликов, связанных с заданным оценщиком 212.[00190] In addition, after determining the presence of a respective identification watermark in a given in-
[00191] Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения сервер 202 может быть дополнительно выполнен с возможностью ограничения доступа заданного оценщика 212 к его соответственной учетной записи с помощью приложения краудсорсинга, запущенного на сервере 202. Сервер 202 может быть выполнен с возможностью ограничивать доступ к заданному оценщику 212 в течение предварительно определенного периода, такого как несколько часов, дней или недель, или, например, в то время как экземпляр инициирования публичного доступа к данному находящемуся в использовании аудиоролику 720 исследуется. Кроме того, в других не накладывающих ограничений вариантах осуществления настоящего изобретения для повторяющихся случаев приведения к публичной доступности записей, включенных в цифровые задачи, передаваемые заданному оценщику 212, сервер 202 может быть выполнен с возможностью блокировать соответственную учетную запись пользователя заданного оценщика 212 на неопределенный срок.[00191] For example, in some non-limiting embodiments of the present invention,
Второй способSecond way
[00192] Учитывая архитектуру и примеры, приведенные выше, можно выполнить способ определения связи между заданным аудиороликом и оценивающим человеком, например, между заданным находящимся в использовании аудиороликом 720 и заданным оценщиком 212. На Фиг. 10 изображена блок-схема последовательности операций второго способа 1000 согласно не накладывающим ограничений вариантам осуществления настоящего изобретения. Второй способ 1000 может выполняться первым электронным устройством 702.[00192] Given the architecture and examples above, it is possible to perform a method for determining a relationship between a given audio clip and a scoring person, such as between a given in-
ЭТАП 1002: ЗАХВАТ ЭЛЕКТРОННЫМ УСТРОЙСТВОМ НАХОДЯЩЕГОСЯ В ИСПОЛЬЗОВАНИИ АУДИОСИГНАЛА, СГЕНЕРИРОВАННОГО ВБЛИЗИ ЭЛЕКТРОННОГО УСТРОЙСТВА, В ОТВЕТ НА ВОСПРОИЗВЕДЕНИЕ ЗАДАННОГО АУДИОРОЛИКАSTEP 1002: ELECTRONIC DEVICE CAPTURE A IN-USE AUDIO SIGNAL GENERATED NEAR THE ELECTRONIC DEVICE IN RESPONSIBILITY TO PLAYBACK THE PREDEMINED AUDIO REVIEW
[00193] Второй способ 1000 начинается на этапе 1002, на котором первое электронное устройство 702 выполнено с возможностью приема находящегося в использовании сигнала 708 заданного находящегося в использовании аудиоролика 720, воспроизводимого вблизи 706 первого электронного устройства 702. Например, как описано выше со ссылкой на Фиг. 7, заданный находящийся в использовании аудиоролик 720 может быть воспроизведен вторым электронным устройством 710, расположенным в настоящее время таким образом, что находящийся в использовании аудиосигнал 708 достигает близости 706 первого электронного устройства 702.[00193] The
[00194] Например, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения второе электронное устройство 710 может быть соответственным электронным устройством заданного оценщика 212, предназначенным для выполнения цифровых задач, принятых с сервера 202. С этой целью первое электронное устройство 702 может, например, быть частным электронным устройством заданного оценщика 212. Таким образом, в этих вариантах осуществления до определения присутствия соответственного идентификационного водяного знака, связанного с заданным оценщиком, первое электронное устройство 702 может быть выполнено с возможностью приема с сервера 202 первого пакета 712 данных, включающего в себя данные только соответственного идентификационного водяного знака, связанного с заданным оценщиком 212, как описано выше.[00194] For example, in some non-limiting embodiments of the present invention, the second
[00195] Однако в других не накладывающих ограничений вариантах осуществления настоящего изобретения, где первое электронное устройство 702 и второе электронное устройство 710 не связаны с заданным оценщиком 212, первый пакет 712 данных может включать в себя данные всех соответственных идентификационных водяных знаков, связанных с каждым из множества оценщиков 208, присутствие которого первое электронное устройство 702 может быть выполнено с возможностью последовательного определения, как будет описано ниже в отношении идентификационного водяного знака, связанного с заданным оценщиком 212.[00195] However, in other non-limiting embodiments of the present invention, where the first
[00196] Таким образом, второй способ 1000 переходит к этапу 1004.[00196] Thus, the
ЭТАП 1004: ОПРЕДЕЛЕНИЕ ЭЛЕКТРОННЫМ УСТРОЙСТВОМ ПРИСУТСТВИЯ ИДЕНТИФИКАЦИОННОГО ВОДЯНОГО ЗНАКА, СВЯЗАННОГО С ОЦЕНИВАЮЩИМ ЧЕЛОВЕКОМ, В НАХОДЯЩЕМСЯ В ИСПОЛЬЗОВАНИИ АУДИОСИГНАЛЕ, ПРИ ЭТОМ ИДЕНТИФИКАЦИОННЫЙ ВОДЯНОЙ ЗНАК СГЕНЕРИРОВАН НА ОСНОВЕ ИДЕНТИФИКАЦИОННОГО УКАЗАТЕЛЯ ОЦЕНИВАЮЩЕГО ЧЕЛОВЕКА, ПРИЧЕМ ИДЕНТИФИКАЦИОННЫЙ УКАЗАТЕЛЬ ПРЕДСТАВЛЕН УНИКАЛЬНОЙ ПОСЛЕДОВАТЕЛЬНОСТЬЮ БИТОВ; СООТВЕТСТВЕННОЕ ЗНАЧЕНИЕ ЗАДАННОГО БИТА ИЗ УНИКАЛЬНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ БИТОВ В ЗАДАННОМ АУДИОРОЛИКЕ БЫЛО УКАЗАНО ПОСРЕДСТВОМ ИЗМЕНЕНИЯ СООТВЕТСТВЕННЫХ УРОВНЕЙ ЭНЕРГИИ ИСХОДНОГО АУДИОСИГНАЛА, СВЯЗАННЫХ С НИМИ, НА ПО МЕНЬШЕЙ МЕРЕ ДВУХ РАЗНЫХ ЧАСТОТНЫХ УРОВНЯХStage 1004: the determination by the electronic device for the presence of an identification watermark associated with an assessing person in the use of the audio signal, while the identification watermark is generated on the basis of the identification pointer of the evaluating person, and the identification pointer is represented by a unique sequence of bits; THE RESPECTIVE VALUE OF A TARGET BIT FROM A UNIQUE SEQUENCE OF BITS IN A DESIGNATED AUDIO REVIEW HAS BEEN INDICATED BY VARIATION OF THE RESPECTIVE ENERGY LEVELS OF THE ORIGINAL AUDIO SIGNAL ASSOCIATED WITH THEM BY AT LEAST TWO DIFFERENT FREQUENCY LEVELS
[00197] На этапе 1004, захватив находящийся в использовании аудиосигнал 708, первое электронное устройство 702 может быть выполнено с возможностью его анализа для определения присутствия в нем соответственного идентификационного водяного знака по меньшей мере одного из множества оценщиков 208, таких как заданный оценщик 212.[00197] At
[00198] С этой целью, прежде всего, в некоторых не накладывающих ограничений вариантах осуществления настоящей технологии первое электронное устройство 702 может быть выполнено с возможностью генерирования находящегося в использовании частотно-временного представления 804 находящегося в использовании аудиосигнала 708, например, посредством применения преобразования Фурье, как описано выше. Кроме того, первое электронное устройство 702 может быть выполнено с возможностью определения, с использованием находящегося в использовании частотно-временного представления 804, соответственных уровней энергии в каждом наборе предварительно определенных частотных уровней, используемых в первом способе 600 кодирования двоичной последовательности 304, связанной с заданным оценщиком 212 в аудиоролике 216. Кроме того, как описано выше со ссылкой на Фиг. 8 и 9, на основе определенных таким образом уровней энергии находящегося в использовании аудиосигнала 708 первое электронное устройство 702 может быть выполнено с возможностью генерирования находящейся в использовании двоичной последовательности 908 и дальнейшего определения того, соответствует ли находящаяся в использовании двоичная последовательность двоичной последовательности 304, связанной с заданным оценщиком 212.[00198] To this end, first of all, in some non-limiting embodiments of the present technology, the first
[00199] Более конкретно, первое электронное устройство 702 может быть выполнено с возможностью определения соответственного значения первого бита находящейся в использовании двоичной последовательности 908 посредством определения первого первичного значения 902 энергии и второго первичного уровня 910 энергии, соответственно связанных с каждым из первого набора частотных уровней 408, используемых для указания первого бита двоичной последовательности 304 в дополненном аудиоролике 220. Другими словами, первое электронное устройство 702 может быть выполнено с возможностью определения того, был ли изменен находящийся в использовании аудиосигнал 708, чтобы иметь соответственные предварительно определенные уровни энергии на каждом из первого набора частотных уровней 408, чтобы указать в нем значение первого бита двоичной последовательности 304, связанной с заданным оценщиком 212.[00199] More specifically, the first
[00200] Кроме того, как описано выше со ссылкой на Фиг. 9, первое электронное устройство 702 может быть выполнено с возможностью определения соответственных вторичных уровней энергии находящегося в использовании аудиосигнала 708 на частотных уровнях, смежных с каждым из первого набора частотных уровней 408, таких как первый вторичный уровень 903 энергии и второй вторичный уровень 905 энергии, соответственно связанные с первым смежным частотным уровнем 904 и вторым смежным частотным уровнем 906 первого из первого набора частотных уровней 408.[00200] In addition, as described above with reference to FIG. 9, the first
[00201] Кроме того, для определения соответственного значения первого бита находящейся в использовании двоичной последовательности 908 первое электронное устройство 702 может быть выполнено с возможностью определения соответственных разностных значений для каждого первичного уровня энергии находящегося в использовании аудиосигнала 708 на каждом из первого набора частотных уровней 408 - таких как первое разностное значение 907 и второе разностное значение 909, связанные с первым первичным уровнем 902 энергии, как описано выше. Кроме того, первое электронное устройство 702 может быть выполнено с возможностью определения первого объединенного разностного значения, связанного с первым битом находящейся в использовании двоичной последовательности 908. Наконец, если первое объединенное разностное значение соответствует предварительно определенному условию (например, если первое объединенное разностное значение является положительным, в качестве примера), первое электронное устройство 702 может быть выполнено с возможностью определения соответственного значения первого бита как «1», иначе определения того, что первый бит имеет значение «0».[00201] In addition, in order to determine the respective value of the first bit of the in-
[00202] В других не накладывающих ограничений вариантах осуществления настоящего изобретения, как дополнительно описано выше со ссылкой на Фиг. 9, для определения соответственного значения первого бита находящейся в использовании двоичной последовательности 908 первое электронное устройство 702 может быть выполнено с возможностью определения первого объединенного уровня достоверности, связанного с соответственными уровнями первичной энергии находящегося в использовании аудиосигнала 708 на каждом из первого набора частотных уровней 408. С этой целью первое электронное устройство 702 может быть выполнено с возможностью определения соответственных уровней достоверности для каждого из первого первичного уровня 902 энергии и второго уровня 910 энергии в соответствии с уравнением (1), как описано выше.[00202] In other non-limiting embodiments of the present invention, as further described above with reference to FIG. 9, in order to determine the respective value of the first bit of the in-
[00203] Таким образом, итеративно применяя этап 1004 к находящемуся в использовании аудиосигналу 708 на основе данных из первого пакета 712 данных, первое электронное устройство 702 может быть выполнено с возможностью определения других битов находящейся в использовании двоичной последовательности 908.[00203] Thus, by iteratively applying
[00204] Таким образом, второй способ 1000 переходит к этапу 1006.[00204] Thus, the
ЭТАП 1006: В ОТВЕТ НА СООТВЕТСТВИЕ НАХОДЯЩЕЙСЯ В ИСПОЛЬЗОВАНИИ ПОСЛЕДОВАТЕЛЬНОСТИ БИТОВ УНИКАЛЬНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ БИТОВ, СВЯЗАННОЙ С ОЦЕНИВАЮЩИМ ЧЕЛОВЕКОМ, ОПРЕДЕЛЕНИЕ ПРИСУТСТВИЯ ИДЕНТИФИКАЦИОННОГО ВОДЯНОГО ЗНАКА НАХОДЯЩЕГОСЯ В ИСПОЛЬЗОВАНИИ АУДИОСИГНАЛА, ТЕМ САМЫМ ОПРЕДЕЛЯЯ, ЧТО ЗАДАННЫЙ АУДИОРОЛИК БЫЛ ПЕРСОНАЛИЗИРОВАН ДЛЯ ОЦЕНИВАЮЩЕГО ЧЕЛОВЕКА ДЛЯ ПЕРЕДАЧИ ЕМУ ДЛЯ ВЫПОЛНЕНИЯ ОДНОЙ ИЛИ БОЛЕЕ ЦИФРОВЫХ ЗАДАЧ НА ОСНОВЕ ОЦЕНКИ ЗАДАННОГО АУДИОРОЛИККАStage 1006: In response to the compliance of the bits that is in the use of the bits sequence associated with the evaluating person, the determination of the presence of the identification water sign in the use of the audio signal, thereby determining that the specified audiolum was personalized for the evaluating person to transmit him for the execution of one or MORE DIGITAL TASKS BASED ON THE ASSESSMENT OF A TARGET AUDIO REVIEW
[00205] На этапе 1006, согласно некоторым не накладывающим ограничений вариантам осуществления настоящего изобретения, первое электронное устройство 702 может быть выполнено с возможностью определения того, соответствует ли находящаяся в использовании двоичная последовательность 908 двоичной последовательности 304, связанной с заданным оценщиком 212. Соответственно, посредством определения соответствия между находящейся в использовании двоичной последовательностью 908 и двоичной последовательностью 304 первое электронное устройство 702 может быть выполнено с возможностью определения присутствия соответственного идентификационного водяного знака, связанного с заданным оценщиком 212, в заданном находящемся в использовании аудиоролике 720.[00205] At 1006, in accordance with some non-limiting embodiments of the present invention, the first
[00206] Например, как описано выше, первое электронное устройство 702 может быть выполнено с возможностью определения того, что находящаяся в использовании двоичная последовательность 908 соответствует двоичной последовательности 304, если предварительно определенное пороговое количество битов (такое как десять, например) первой имеет те же значения, что и соответственные биты последней.[00206] For example, as described above, the first
[00207] Кроме того, после определения присутствия соответственного идентификационного водяного знака в заданном находящемся в использовании аудиоролике 720, первое электронное устройство 702 может быть выполнено с возможностью генерирования второго пакета 714 данных, включающего в себя предупреждающее уведомление о распознавании персонализированного аудиоролика вблизи 706 него, то есть заданного находящегося в использовании аудиоролика 720; и передачи второго пакета 714 данных на сервер 202. В этом отношении, в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения, после приема второго пакета 714 данных от первого электронного устройства 702 сервер 202 может быть выполнен с возможностью принятия конкретных превентивных действий против заданного оценщика 212, чтобы предотвратить дальнейшее распространение персонализированных аудиороликов, связанных с заданным оценщиком 212, как описано выше. [00207] In addition, after determining the presence of a corresponding identification watermark in a given
[00208] Таким образом, некоторые не накладывающие ограничений варианты осуществления второго способа 1000 позволяют обнаруживать предварительно сгенерированные идентификационные водяные знаки в аудиоролике, воспроизводимом вблизи электронных устройств, что может дополнительно позволить отслеживать источники утечки конфиденциальной информации и предотвращать повреждение связанных прав владения.[00208] Thus, some non-limiting embodiments of the
[00209] Следует отметить, что в некоторых не накладывающих ограничений вариантах осуществления настоящего изобретения второй способ 1000 может выполняться сервером 202, выполненным с возможностью поиска подозрительных аудиороликов в сети 210 связи, как описано выше.[00209] It should be noted that in some non-limiting embodiments of the present invention, the
[00210] Таким образом, второй способ 1000 завершается.[00210] Thus, the
[00211] Следует четко понимать, что не все технические эффекты, упомянутые в настоящем документе, должны быть реализованы в каждом варианте осуществления настоящего изобретения.[00211] It should be clearly understood that not all of the technical effects mentioned herein need to be implemented in every embodiment of the present invention.
[00212] Изменения и улучшения вышеописанных вариантов реализации настоящего изобретения могут стать очевидными для специалистов в данной области техники. Предшествующее описание предназначено для того, чтобы быть примерным, а не ограничивающим. Поэтому предполагается, что объем настоящего изобретения определен лишь объемом прилагаемой формулы изобретения.[00212] Changes and improvements in the above embodiments of the present invention may become apparent to those skilled in the art. The preceding description is intended to be exemplary and not limiting. Therefore, it is intended that the scope of the present invention be defined only by the scope of the appended claims.
Claims (62)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/584,582 US11915711B2 (en) | 2021-07-20 | 2022-01-26 | Method and system for augmenting audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2021121563A RU2021121563A (en) | 2023-01-20 |
RU2792947C2 true RU2792947C2 (en) | 2023-03-28 |
Family
ID=
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9728188B1 (en) * | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
RU2705769C1 (en) * | 2015-10-28 | 2019-11-11 | ФОРД ГЛОУБАЛ ТЕКНОЛОДЖИЗ, ЭлЭлСи | Vehicle speech recognition together with portable device |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2705769C1 (en) * | 2015-10-28 | 2019-11-11 | ФОРД ГЛОУБАЛ ТЕКНОЛОДЖИЗ, ЭлЭлСи | Vehicle speech recognition together with portable device |
US9728188B1 (en) * | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Warden | Speech commands: A dataset for limited-vocabulary speech recognition | |
US11019371B2 (en) | Control of content broadcasting | |
US11170793B2 (en) | Secure audio watermarking based on neural networks | |
US11115410B1 (en) | Secure authentication for assistant systems | |
CN111031329B (en) | Method, apparatus and computer storage medium for managing audio data | |
KR20160027005A (en) | Collaborative audio conversation attestation | |
Ghasemzadeh et al. | Universal audio steganalysis based on calibration and reversed frequency resolution of human auditory system | |
Zhang et al. | FMFCC-a: a challenging Mandarin dataset for synthetic speech detection | |
Ustubioglu et al. | Mel spectrogram-based audio forgery detection using CNN | |
Verma et al. | Speaker-independent source cell-phone identification for re-compressed and noisy audio recordings | |
Eldridge II | Perceiving professional threats: Journalism’s discursive reaction to the rise of new media entities | |
US11875121B2 (en) | Generating responses for live-streamed questions | |
RU2792947C2 (en) | Method and system for audio signal supplement | |
CN115605947A (en) | Micro-segmented secure speech transcription | |
VanDam et al. | You have been caute! early detection of compromised accounts on social media | |
US11915711B2 (en) | Method and system for augmenting audio signals | |
Malik et al. | Acoustic environment identification using unsupervised learning | |
Pavlov et al. | Digital archive and multimedia library for Bulgarian traditional culture and folklore | |
US11908453B2 (en) | Method and system for classifying a user of an electronic device | |
US20210249027A1 (en) | Separating speech by source in audio recordings by predicting isolated audio signals conditioned on speaker representations | |
Ragano et al. | Automatic quality assessment of digitized and restored sound archives | |
US11395051B2 (en) | Video content relationship mapping | |
US20240086759A1 (en) | System and Method for Watermarking Training Data for Machine Learning Models | |
Delgado-Gutiérrez et al. | Acoustic environment identification by Kullback–Leibler divergence | |
US11513767B2 (en) | Method and system for recognizing a reproduced utterance |