SU1476618A1 - Device for determining pauses in speech - Google Patents

Device for determining pauses in speech Download PDF

Info

Publication number
SU1476618A1
SU1476618A1 SU874264886A SU4264886A SU1476618A1 SU 1476618 A1 SU1476618 A1 SU 1476618A1 SU 874264886 A SU874264886 A SU 874264886A SU 4264886 A SU4264886 A SU 4264886A SU 1476618 A1 SU1476618 A1 SU 1476618A1
Authority
SU
USSR - Soviet Union
Prior art keywords
input
output
counter
key
trigger
Prior art date
Application number
SU874264886A
Other languages
Russian (ru)
Inventor
Владимир Викторович Деев
Александр Васильевич Родионов
Александр Николаевич Бахарев
Original Assignee
Военный Инженерный Краснознаменный Институт Им.А.Ф.Можайского
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Военный Инженерный Краснознаменный Институт Им.А.Ф.Можайского filed Critical Военный Инженерный Краснознаменный Институт Им.А.Ф.Можайского
Priority to SU874264886A priority Critical patent/SU1476618A1/en
Application granted granted Critical
Publication of SU1476618A1 publication Critical patent/SU1476618A1/en

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относитс  к электросв зи. Цель изобретени  - обнаружение пауз речи как в системе с импульсно-кодовой модул цией, так и в системе с дельта-модул цией. Устройство имеет основной канал 1, содержащий регистры 2 и 3, реверсивный счетчик 4, элементы ИЛИ 5 и 6, RS-триггер 7, коммутаторы 8,9 и 10, D-триггеры 11 и 12, счетчики 13,14 и 15, ключи 16,17 и 18, дешифратор 19 и инвертор 20, а также дополнительный канал 21, содержащий ключ 22 и блок объединени  23 каналов. При поступлении на вход устройства речевой информации, данное устройство обеспечивает надежное выделение начала слов и отдельных смысловых фрагментов речи, начинающихс  со взрывных звуков, особенно критичных к точности анализа, и не реагирует на отдельно сто щие короткие шумовые импульсы. 1 ил.The invention relates to telecommunications. The purpose of the invention is to detect speech pauses both in a system with pulse code modulation and in a system with delta modulation. The device has a main channel 1 containing registers 2 and 3, a reversible counter 4, elements OR 5 and 6, RS flip-flop 7, switches 8.9 and 10, D-flip-flops 11 and 12, counters 13.14 and 15, keys 16 , 17 and 18, the decoder 19 and the inverter 20, as well as an additional channel 21 containing the key 22 and the combination unit 23 channels. When speech information arrives at the device input, this device provides a reliable selection of the beginning of words and separate semantic fragments of speech, starting with explosive sounds, especially critical to the accuracy of the analysis, and does not respond to separate short noise pulses. 1 il.

Description

Изобретение относится к электросвязи и может быть использовано для обнаружения пауз речи, передаваемой с использованием как импульсно-кодо- $ вой (ИКМ) так и дельта-модуляции , (ДМ) в частности в системах уплотнения речевых сигналов дополнительной информацией.The invention relates to telecommunications and can be used to detect pauses in speech transmitted using both pulse-code (PCM) and delta modulation (DM), in particular, in speech compression systems with additional information.

Цель изобретения - обнаружение ю пауз речи как в системе с импульснокодовой модуляцией, так и в системе с дельта-модуляцией.The purpose of the invention is the detection of speech pauses both in a system with pulse-code modulation and in a system with delta modulation.

На чертеже представлена структурная электрическая схема устройства 15 для обнаружения пауз речи.The drawing shows a structural electrical diagram of a device 15 for detecting pauses in speech.

Устройство содержит основной канал 1, содержащий первый и второй регистры 2 и 3, реверсивный счетчик 4, первый и второй элементы ИЛИ 5 и 6, 20The device contains a main channel 1, containing the first and second registers 2 and 3, a reverse counter 4, the first and second elements OR 5 and 6, 20

RS-триггер 7, первый-третий коммутаторы 8-10, первый и второй D-триггеры 1 1 , 12, первый-третий счетчики 13-15, первый-третий ключи 16-18, дешифратор 19, инвертор 20, а также до-25 полнительный канал 21, содержащий четвертый ключ 22 и блок 23 объединения каналов.RS-flip-flop 7, first-third switches 8-10, first and second D-flip-flops 1 1, 12, first-third counters 13-15, first-third keys 16-18, decoder 19, inverter 20, and also 25, an auxiliary channel 21 comprising a fourth key 22 and a channel combining unit 23.

Устройство для обнаружения пауз βθ речи работает следующим образом.A device for detecting pauses βθ of speech works as follows.

Информация от внешнего речепреобразующего устройства (ИКМ-кодера) поступает в виде отсчетов ИКМ-сигнала в последовательном коде на первый вход устройства. Каждый ИКМ-от- ; счет представлен кодовой коммутацией из К разрядов. При к=8 старший разряд кодовой комбинации несет·информацию о знаке аналогового речевого сиг- дд нала, а остальные разряды характеризуют его уровень. Запись информации в регистр 2 сдвига осуществляется с тактовой частотой , которая подается на тактовый вход регистра 2 д§ (второй вход устройства) из ИКМ-кодера. Поскольку в режиме молчания из-за шумового фона и других причин возможны появления единиц в четырех младших разрядах кодовых комбина- ^д ций, то информацией для принятия решения о переходе абонента в актив-, ное состояние.служит появление единиц в трех старших разрядах отсчета. Дополнительные выходы регистра 2, $$ соответствующие трем старшим разрядам уровня речевого сигнала, подключены к входам элемента ИЛИ 5, Сигнал с выхода элемента ИЛИ 5 поступает на соответствующий вход коммутатора 8. Информационный сигнал с выхода дельта-кодера подается на третий вход устройства. В регистре 3 осуществляется запись цифрового дельта-модулированного сигнала в моменты поступления импульсов частоты fq по четвертому входу. Параллельно дельта-модулированный сигнал поступает на управляющий вход реверсивного счетчика 4, осуществляя его перевод в режим суммирования либо вычитания. В случае присутствия сигнала 1 на третьем входе устройства реверсивный счетчик 4 переходит в режим суммирования импульсов, поступающих по четвертому входу устройства. Сигнал 0” на третьем входе устройства переводит реверсивный счетчик 4 в режим вычитания. Таким образом текущее состояние реверсивного счетчика 4 отражает уровень речевого сигнала. При этом код реверсивного счетчика 4 может рассматриваться как кодовая комбинация ИКМ-сигнала. Аналогично случаю ИКМ-сигнала потенциалы с трех старших разрядов реверсивного счетчика 4· подаются на элемент ИЛИ 6. Сигнал с выхода элемента ИЛИ 6 подается на соответствующий вход коммутатора 8. При работе с ИКМ-кодером RS-триггер 7 импульсами частоты , поступающими на второй вход, устанавливается в единичное состояние. В случае использования дельта-кодера, RS-триггер 7 импульсами частоты f2 поступающими на четвертый вход устанавливается в состояние 0”.) Таким образом, сигнал с выхода I RS-триггера 7 соответствует использованию конкретного типа кодера, работающего с устройством. RS-триггер 7 управляет работой первого коммутатора 8, при единичном сигнале с его выхода подключается выход элемента ИЛИ 5 к соответствующему входу ключа 18, а при нулевом сигнале с выхода RS-триггера 7 подключается выход элемента ИЛИ 6. Аналогично управляются коммутаторы 9 и. 10. Так, если RS-·.. триггер 7 находится в единичном состоянии, то выход регистра 2 через коммутатор 10 скоммутирован на соответствующий вход ключа 17, а пятый ^вход устройства через коммутатор 9 ~ на соответствующий вход ключа 18.Information from an external speech-converting device (PCM encoder) comes in the form of samples of a PCM signal in a serial code to the first input of the device. Each PCM-from-; the account is represented by code switching from K digits. When k = 8, the most significant bit of the code combination carries information about the sign of the analog speech signal, and the remaining bits characterize its level. Information is recorded in shift register 2 with a clock frequency that is supplied to the clock input of register 2 d§ (second input of the device) from the PCM encoder. Since in the silent mode, due to the noise background and other reasons, units may appear in the four least significant bits of the code combinations, the information for deciding on the subscriber's transition to the active, active state is the appearance of units in the three highest bits of the count. Additional outputs of register 2, $$ corresponding to the three most significant bits of the speech signal level are connected to the inputs of the OR element 5, The signal from the output of the OR element 5 is fed to the corresponding input of the switch 8. The information signal from the output of the delta encoder is fed to the third input of the device. In register 3, a digital delta-modulated signal is recorded at the moments of arrival of pulses of frequency fq at the fourth input. In parallel, the delta-modulated signal is fed to the control input of the reverse counter 4, translating it into the summation or subtraction mode. In the case of the presence of signal 1 at the third input of the device, the reverse counter 4 switches to the mode of summing pulses arriving at the fourth input of the device. The signal 0 ”at the third input of the device puts the reversing counter 4 in the subtraction mode. Thus, the current state of the reverse counter 4 reflects the level of the speech signal. In this case, the code of the reverse counter 4 can be considered as a code combination of the PCM signal. Similarly to the case of the PCM signal, the potentials from the three most significant bits of the reversible counter 4 · are supplied to the OR element 6. The signal from the output of the OR element 6 is fed to the corresponding input of the switch 8. When working with the PCM encoder, the RS-flip-flop 7 receives frequency pulses arriving at the second input is set to a single state. In the case of using a delta encoder, the RS-flip-flop 7 with pulses of frequency f 2 supplied to the fourth input is set to 0 ”.) Thus, the signal from the output I of the RS-flip-flop 7 corresponds to the use of a specific type of encoder that works with the device. The RS-trigger 7 controls the operation of the first switch 8, with a single signal from its output, the output of the OR element 5 is connected to the corresponding input of the key 18, and when the signal from the output of the RS-trigger 7 is zero, the output of the OR element 6 is connected. The switches 9 and are controlled similarly. 10. So, if RS- · .. trigger 7 is in a single state, then the output of register 2 through the switch 10 is connected to the corresponding input of the key 17, and the fifth input of the device through the switch 9 ~ to the corresponding input of the key 18.

В противном случае к выходу ключа 17 подключается выход регистра 3, а к входу второго ключа 18 - выход D-триггера 12, который осуществляет формирование сигнала с частотой 8 кГц из сигнала +, поступающего на четвертый вход от дельта-кодера. Таким образом, на выходе коммутатора 9 как в случае работы устройства с ИКМ-кодером, так и дельта-кодером будет · присутствовать сигнал с частотой, равной 8 кГц. Импульсы этой частоты подсчитываются счетчиком с коэффициентом пересчета N=320, который определяет интервал наблюдения tH=N/f3 = =40 мс (время в течение которого произойдет полная замена информации в регистрах 2 и 3 для случаев работы устройства с дельта- или ИКМ-кодером соответственно). Импульсы переноса на выходе счетчика 13 появляются с периодом 40 мс и производят установку в 0” счетчика 15. При наличии хотя бы одной единицы в трех старших разрядах 4 и выходах регистра 2 или реверсивного счетчика 4 соответствующие элементы ИЛИ 5 или 6 формируют сигнал 1, который через коммутатор 8 разрешает прохождение импульсов частоты 8 кГц с выхода коммутатора 9 на счетный вход счетчика 15. Коэффициент пересчета счетчика 15 выбирается из следующих соображений. Во-первых, устройство обнаружения пауз речи не должно реагировать на отдельно стоящие короткие (до 10 мс) шумовые импульсы, во-вторых, должно надежно выделять начало слов и отдельных смысловых фрагментов речи, начинающихся со взрывных звуков, особенно критичных к точности анализа»Otherwise, the output of the register 3 is connected to the output of the key 17, and the output of the D-flip-flop 12 is connected to the input of the second key 18, which generates a signal with a frequency of 8 kHz from the + signal input to the fourth input from the delta encoder. Thus, at the output of switch 9, both in the case of operation of the device with an PCM encoder and a delta encoder, a signal with a frequency equal to 8 kHz will be present. The pulses of this frequency are calculated by a counter with a conversion factor N = 320, which determines the observation interval t H = N / f3 = 40 ms (the time during which the information in registers 2 and 3 will be completely replaced for cases when the device operates with delta or PCM- encoder, respectively). Transfer pulses at the output of counter 13 appear with a period of 40 ms and set to 0 ”counter 15. If there is at least one unit in the three high-order bits 4 and the outputs of register 2 or reversible counter 4, the corresponding elements of OR 5 or 6 form signal 1, which through the switch 8 allows the passage of pulses of frequency 8 kHz from the output of the switch 9 to the counting input of the counter 15. The conversion factor of the counter 15 is selected from the following considerations. Firstly, the device for detecting pauses in speech should not respond to stand-alone short (up to 10 ms) noise impulses, and secondly, it should reliably highlight the beginning of words and individual semantic fragments of speech starting with explosive sounds, especially critical to the accuracy of analysis ”

Если предположить, что отдельно стоящий шумовой импульс будет иметь все отсчеты большого уровня, то за 10 мс через ключ 17 поступит максимум 80 импульсов частоты дискретизации. Поэтому коэффициент пересчета счетчика 15 выбирается равным 80. Такой коэффициент обеспечит, с одной стороны, вырезание коротких отдельно стоящих шумовых импульсов, а с другой - позволит надежно классифицировать начало слов и смысловых фрагментов речи даже в случае наиболее ко- ? ротких фонем. Б том случае, если абонент молчит, то счетчик 15 не успеет насчитать необходимого количества импульсов и будет периодически устанавливаться в 0 импульсом перено са с выхода счетчика 13 в конце каждого интервала наблюдения.If we assume that a separate noise pulse will have all the samples of a large level, then in 10 ms a maximum of 80 sampling frequency pulses will arrive through key 17. Therefore, the conversion factor of the counter 15 is chosen equal to 80. Such a coefficient will provide, on the one hand, cutting out short freestanding noise pulses, and on the other hand, will reliably classify the beginning of words and semantic fragments of speech even in the case of the most mouth phonemes. In the event that the subscriber is silent, then the counter 15 will not have time to count the required number of pulses and will be periodically set to 0 by the transfer pulse from the output of the counter 13 at the end of each observation interval.

При переходе абонента в активное состояние счетчик 15 за длительность интервала наблюдения (40 мс) успеет насчитать необходимое количество импульсов и сформировать на своем выходе импульс переноса, который установит D-триггер 11 по входу S в единичное состояние, а счетчик 14 в нулевое состояние. Сигнал с прямого выхода D-триггера 11 разрешает прохождение импульсов переноса счетчика 13 через ключ 16 на вход счетчика 14. При этом импульс переноса счетчика периодически устанавливает счетчик 14 в нулевое состояние. Счетчик 14 предназначен для задержки отпускания речевого канала на время порядка 160-200 мс после перехода абонента от разговора к молчанию. Импульсы переноса счетчика 13 следуют с периодом 40 мс, поэтому для обеспечения задержки отпускания основного канала в 160-200 мс коэффициент пересчета счетчика 14 устанавливается И = 5-6.When the subscriber enters the active state, the counter 15 for the duration of the observation interval (40 ms) will have time to count the required number of pulses and generate a transfer pulse at its output, which will set the D-trigger 11 at the input S to the single state, and the counter 14 to the zero state. The signal from the direct output of the D-flip-flop 11 allows the passage of the transfer pulses of the counter 13 through the key 16 to the input of the counter 14. In this case, the transfer pulse of the counter periodically sets the counter 14 to zero. The counter 14 is designed to delay the release of the speech channel for a time of the order of 160-200 ms after the subscriber switches from conversation to silence. The transfer pulses of the counter 13 follow with a period of 40 ms, therefore, to ensure a delay in releasing the main channel of 160-200 ms, the conversion factor of the counter 14 is set to I = 5-6.

При переходе абонента от разговора к молчанию D-триггер 1J находится в единичном состоянии, что обеспечивает прохождение импульсов с выхода ключа 16 на вход счетчика 14, который насчитывает заданное число импульсов. При этом на выходе дешифратора 19 появится сигнал, устанавливающий D-триггер 11 по входу R в нулевое состояние. При этом ключ закроется, что обеспечит сохранение состояния счетчика 14, а следовательно и сохранение соответствующего сигнала на выходе дешифратора 19. Таким образом спустя 160-200 мс после того, как абонент замолчит, ключ закроется, а ключ 22 откроется, что обеспечит подключение к входу ' блока 23 дополнительного канала 21.When the subscriber switches from conversation to silence, the D-trigger 1J is in a single state, which ensures the passage of pulses from the output of the key 16 to the input of the counter 14, which has a given number of pulses. At the same time, a signal appears at the output of the decoder 19, setting the D-trigger 11 at the input R to the zero state. In this case, the key is closed, which will ensure that the state of the counter 14 is preserved, and therefore the corresponding signal is saved at the output of the decoder 19. Thus, after 160-200 ms after the subscriber is silent, the key is closed and the key 22 is opened, which will provide a connection to the input 'block 23 of the additional channel 21.

При переходе абонента в активное состояние D-триггер 11 вновь установится в единичное состояние, а счетчик в нулевое. При этом сигнал с выхода дешифратора 19 изменяется наUpon the transition of the subscriber to the active state, the D-trigger 11 will again be set to a single state, and the counter to zero. When this signal from the output of the decoder 19 is changed to

I противоположный, что приводит к открыванию ключа 17 и запиранию клю·ча 22.I opposite, which leads to the opening of the key 17 and the lock key 22.

Claims (1)

Формула изобретенияClaim Устройство для обнаружения пауз речи, содержащее основной и дополни1476618 тельный каналы, при этом основной канал содержит первый регистр, информационный и тактовый входы которого являются первым и вторым входами устройства соответственно, первые выходы регистра соединены с входами первого элемента ИЛИ, последовательно соединенные первый счетчик, первый ключ, второй счетчик и дешифратор, выход которого соединен с выходом инвертора, первым входом второго ключа и первым входом первого триггера, второй вход которого соединен с вторым входом второго счетчика и выходом третьего счетчика, первый вход которого соединен с выходом третьего ключа, первый вход которого через первый счетчик соединен с вторым входом третьего счетчика, выход первого D-триггера соединен с вторым входом первого ключа, а дополнительный канал содержит последовательно соединенные четвертый ключ и блок объединения каналов, выход которого является выходом устройства, причем второй вход блока объединения каналов соединен с выходом второго ключа, а первый вход четвертого ключа соединен с выходом инвертора, отличающееся тем, что, с целью обнаружения пауз речи как в системе с импульсно-кодовой модуляцией, так и в системе с дельта-модуляцией, введены второй регистр, реверсивный счетчик, второй элемент ИЛИ, RS-триггер, второй D-триггер, первый, второй и третий коммутаторы, 5 при этом информационный вход второго регистра объединен с входом управления реверсивного счетчика и является третьим входом устройства, тактовый вход второго регистра объединен с соЮ ответствующими входами реверсивного счетчика RS-триггера и второго D-триг гера, и является четвертым входом устройства, выходы реверсивного счетчика через второй элемент ИЛИ со15 единены с первым входом первого коммутатора, второй вход которого соединен с выходом первого элемента ИЛИ, тактовый вход первого регистра объединен с вторым входом RS-триггера, 2о выход которого соединен с управляющими входами первого, второго и третьего коммутаторов соответственно, выход второго D-триггера через второй коммутатор соединен с первым входом 25 третьего ключа, второй вход которого соединен с выходом первого коммутатора, первый и второй входы третьего коммутатора соединены с вторым выходом первого регистра и вы30 ходом второго регистра соответственно, выход третьего коммутатора соединен с вторым входом второго ключа, а второй вход второго коммутатора является пятым входом устройства.A device for detecting pauses in speech, containing the main and additional 1476618 channels, the main channel containing the first register, the information and clock inputs of which are the first and second inputs of the device, respectively, the first outputs of the register are connected to the inputs of the first OR element, the first counter is connected in series, the first a key, a second counter and a decoder, the output of which is connected to the inverter output, the first input of the second key and the first input of the first trigger, the second input of which is connected to the second input the second counter and the output of the third counter, the first input of which is connected to the output of the third key, the first input of which through the first counter is connected to the second input of the third counter, the output of the first D-trigger is connected to the second input of the first key, and the additional channel contains the fourth key in series and a channel combining unit, the output of which is the output of the device, the second input of the channel combining unit connected to the output of the second key, and the first input of the fourth key connected to the output of the inverter, characterized in that, in order to detect speech pauses both in a system with pulse-code modulation and in a system with delta modulation, a second register, a reverse counter, a second OR element, an RS-trigger, a second D-trigger, the first, the second and third switches, 5 wherein the information input of the second register is combined with the control input of the reversible counter and is the third input of the device, the clock input of the second register is combined with its corresponding inputs of the reverse counter of the RS-trigger and the second D-trigger, and is four the first input of the device, the outputs of the reverse counter through the second OR element are connected to the first input of the first switch, the second input of which is connected to the output of the first OR element, the clock input of the first register is combined with the second input of the RS-trigger, the second output of which is connected to the control inputs of the first, of the second and third switches, respectively, the output of the second D-trigger through the second switch is connected to the first input 25 of the third key, the second input of which is connected to the output of the first switch, the first and second inputs of tego switch connected to the second output of the first register and the second register vy30 stroke respectively a third switch output is connected to the second input of the second switch and the second input of the second switch is the fifth input device.
SU874264886A 1987-06-19 1987-06-19 Device for determining pauses in speech SU1476618A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU874264886A SU1476618A1 (en) 1987-06-19 1987-06-19 Device for determining pauses in speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU874264886A SU1476618A1 (en) 1987-06-19 1987-06-19 Device for determining pauses in speech

Publications (1)

Publication Number Publication Date
SU1476618A1 true SU1476618A1 (en) 1989-04-30

Family

ID=21311986

Family Applications (1)

Application Number Title Priority Date Filing Date
SU874264886A SU1476618A1 (en) 1987-06-19 1987-06-19 Device for determining pauses in speech

Country Status (1)

Country Link
SU (1) SU1476618A1 (en)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Авторское свидетельство СССР № 1307596, кл. Н 04 J 3/17, 1987. *

Similar Documents

Publication Publication Date Title
SU1476618A1 (en) Device for determining pauses in speech
US3838416A (en) Digital/analog subterminal
KR840004337A (en) PCM signal encoder
SU1513632A1 (en) Detector of speech pauses in delta-modulation system
SU896781A1 (en) Synchronization device
SU953743A1 (en) Counting device
SU1307596A1 (en) Device for detecting pauses in speech
SU1000547A1 (en) Electric coded lock
SU1325717A1 (en) Detector of pauses in speech in system with delta-modulation
SU1764141A1 (en) Digital filter
SU1540018A1 (en) Detector of intervals in system with pulse-code modulation
SU1474851A1 (en) Pulse-time code decoder
SU1531226A1 (en) Device for conversion of codes
SU1599916A1 (en) Code converter
SU960880A1 (en) Time interval to code converter
RU2047272C1 (en) Reversible binary counter
SU1524041A1 (en) Information input device
SU1580585A1 (en) Device for conversion of binary-decimal code to linear code of subscriberъs number
SU1541785A1 (en) Device for cycle synchronization and information decoding
SU1453433A1 (en) Apparatus for transmitting information from rotary object
SU1180953A1 (en) Device for reception and transmission of information
SU1462324A2 (en) Device for determining the number of units in information sequence
SU955031A1 (en) Maximum number determination device
SU734662A1 (en) Information receiving device
SU1264354A2 (en) Device for measuring noise level during speech pauses