SU1476618A1 - Device for determining pauses in speech - Google Patents
Device for determining pauses in speech Download PDFInfo
- Publication number
- SU1476618A1 SU1476618A1 SU874264886A SU4264886A SU1476618A1 SU 1476618 A1 SU1476618 A1 SU 1476618A1 SU 874264886 A SU874264886 A SU 874264886A SU 4264886 A SU4264886 A SU 4264886A SU 1476618 A1 SU1476618 A1 SU 1476618A1
- Authority
- SU
- USSR - Soviet Union
- Prior art keywords
- input
- output
- counter
- key
- trigger
- Prior art date
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Изобретение относитс к электросв зи. Цель изобретени - обнаружение пауз речи как в системе с импульсно-кодовой модул цией, так и в системе с дельта-модул цией. Устройство имеет основной канал 1, содержащий регистры 2 и 3, реверсивный счетчик 4, элементы ИЛИ 5 и 6, RS-триггер 7, коммутаторы 8,9 и 10, D-триггеры 11 и 12, счетчики 13,14 и 15, ключи 16,17 и 18, дешифратор 19 и инвертор 20, а также дополнительный канал 21, содержащий ключ 22 и блок объединени 23 каналов. При поступлении на вход устройства речевой информации, данное устройство обеспечивает надежное выделение начала слов и отдельных смысловых фрагментов речи, начинающихс со взрывных звуков, особенно критичных к точности анализа, и не реагирует на отдельно сто щие короткие шумовые импульсы. 1 ил.The invention relates to telecommunications. The purpose of the invention is to detect speech pauses both in a system with pulse code modulation and in a system with delta modulation. The device has a main channel 1 containing registers 2 and 3, a reversible counter 4, elements OR 5 and 6, RS flip-flop 7, switches 8.9 and 10, D-flip-flops 11 and 12, counters 13.14 and 15, keys 16 , 17 and 18, the decoder 19 and the inverter 20, as well as an additional channel 21 containing the key 22 and the combination unit 23 channels. When speech information arrives at the device input, this device provides a reliable selection of the beginning of words and separate semantic fragments of speech, starting with explosive sounds, especially critical to the accuracy of the analysis, and does not respond to separate short noise pulses. 1 il.
Description
Изобретение относится к электросвязи и может быть использовано для обнаружения пауз речи, передаваемой с использованием как импульсно-кодо- $ вой (ИКМ) так и дельта-модуляции , (ДМ) в частности в системах уплотнения речевых сигналов дополнительной информацией.The invention relates to telecommunications and can be used to detect pauses in speech transmitted using both pulse-code (PCM) and delta modulation (DM), in particular, in speech compression systems with additional information.
Цель изобретения - обнаружение ю пауз речи как в системе с импульснокодовой модуляцией, так и в системе с дельта-модуляцией.The purpose of the invention is the detection of speech pauses both in a system with pulse-code modulation and in a system with delta modulation.
На чертеже представлена структурная электрическая схема устройства 15 для обнаружения пауз речи.The drawing shows a structural electrical diagram of a device 15 for detecting pauses in speech.
Устройство содержит основной канал 1, содержащий первый и второй регистры 2 и 3, реверсивный счетчик 4, первый и второй элементы ИЛИ 5 и 6, 20The device contains a main channel 1, containing the first and second registers 2 and 3, a reverse counter 4, the first and second elements OR 5 and 6, 20
RS-триггер 7, первый-третий коммутаторы 8-10, первый и второй D-триггеры 1 1 , 12, первый-третий счетчики 13-15, первый-третий ключи 16-18, дешифратор 19, инвертор 20, а также до-25 полнительный канал 21, содержащий четвертый ключ 22 и блок 23 объединения каналов.RS-flip-flop 7, first-third switches 8-10, first and second D-flip-flops 1 1, 12, first-third counters 13-15, first-third keys 16-18, decoder 19, inverter 20, and also 25, an auxiliary channel 21 comprising a fourth key 22 and a channel combining unit 23.
Устройство для обнаружения пауз βθ речи работает следующим образом.A device for detecting pauses βθ of speech works as follows.
Информация от внешнего речепреобразующего устройства (ИКМ-кодера) поступает в виде отсчетов ИКМ-сигнала в последовательном коде на первый вход устройства. Каждый ИКМ-от- ; счет представлен кодовой коммутацией из К разрядов. При к=8 старший разряд кодовой комбинации несет·информацию о знаке аналогового речевого сиг- дд нала, а остальные разряды характеризуют его уровень. Запись информации в регистр 2 сдвига осуществляется с тактовой частотой , которая подается на тактовый вход регистра 2 д§ (второй вход устройства) из ИКМ-кодера. Поскольку в режиме молчания из-за шумового фона и других причин возможны появления единиц в четырех младших разрядах кодовых комбина- ^д ций, то информацией для принятия решения о переходе абонента в актив-, ное состояние.служит появление единиц в трех старших разрядах отсчета. Дополнительные выходы регистра 2, $$ соответствующие трем старшим разрядам уровня речевого сигнала, подключены к входам элемента ИЛИ 5, Сигнал с выхода элемента ИЛИ 5 поступает на соответствующий вход коммутатора 8. Информационный сигнал с выхода дельта-кодера подается на третий вход устройства. В регистре 3 осуществляется запись цифрового дельта-модулированного сигнала в моменты поступления импульсов частоты fq по четвертому входу. Параллельно дельта-модулированный сигнал поступает на управляющий вход реверсивного счетчика 4, осуществляя его перевод в режим суммирования либо вычитания. В случае присутствия сигнала 1 на третьем входе устройства реверсивный счетчик 4 переходит в режим суммирования импульсов, поступающих по четвертому входу устройства. Сигнал 0” на третьем входе устройства переводит реверсивный счетчик 4 в режим вычитания. Таким образом текущее состояние реверсивного счетчика 4 отражает уровень речевого сигнала. При этом код реверсивного счетчика 4 может рассматриваться как кодовая комбинация ИКМ-сигнала. Аналогично случаю ИКМ-сигнала потенциалы с трех старших разрядов реверсивного счетчика 4· подаются на элемент ИЛИ 6. Сигнал с выхода элемента ИЛИ 6 подается на соответствующий вход коммутатора 8. При работе с ИКМ-кодером RS-триггер 7 импульсами частоты , поступающими на второй вход, устанавливается в единичное состояние. В случае использования дельта-кодера, RS-триггер 7 импульсами частоты f2 поступающими на четвертый вход устанавливается в состояние 0”.) Таким образом, сигнал с выхода I RS-триггера 7 соответствует использованию конкретного типа кодера, работающего с устройством. RS-триггер 7 управляет работой первого коммутатора 8, при единичном сигнале с его выхода подключается выход элемента ИЛИ 5 к соответствующему входу ключа 18, а при нулевом сигнале с выхода RS-триггера 7 подключается выход элемента ИЛИ 6. Аналогично управляются коммутаторы 9 и. 10. Так, если RS-·.. триггер 7 находится в единичном состоянии, то выход регистра 2 через коммутатор 10 скоммутирован на соответствующий вход ключа 17, а пятый ^вход устройства через коммутатор 9 ~ на соответствующий вход ключа 18.Information from an external speech-converting device (PCM encoder) comes in the form of samples of a PCM signal in a serial code to the first input of the device. Each PCM-from-; the account is represented by code switching from K digits. When k = 8, the most significant bit of the code combination carries information about the sign of the analog speech signal, and the remaining bits characterize its level. Information is recorded in shift register 2 with a clock frequency that is supplied to the clock input of register 2 d§ (second input of the device) from the PCM encoder. Since in the silent mode, due to the noise background and other reasons, units may appear in the four least significant bits of the code combinations, the information for deciding on the subscriber's transition to the active, active state is the appearance of units in the three highest bits of the count. Additional outputs of register 2, $$ corresponding to the three most significant bits of the speech signal level are connected to the inputs of the OR element 5, The signal from the output of the OR element 5 is fed to the corresponding input of the switch 8. The information signal from the output of the delta encoder is fed to the third input of the device. In register 3, a digital delta-modulated signal is recorded at the moments of arrival of pulses of frequency fq at the fourth input. In parallel, the delta-modulated signal is fed to the control input of the reverse counter 4, translating it into the summation or subtraction mode. In the case of the presence of signal 1 at the third input of the device, the reverse counter 4 switches to the mode of summing pulses arriving at the fourth input of the device. The signal 0 ”at the third input of the device puts the reversing counter 4 in the subtraction mode. Thus, the current state of the reverse counter 4 reflects the level of the speech signal. In this case, the code of the reverse counter 4 can be considered as a code combination of the PCM signal. Similarly to the case of the PCM signal, the potentials from the three most significant bits of the reversible counter 4 · are supplied to the OR element 6. The signal from the output of the OR element 6 is fed to the corresponding input of the switch 8. When working with the PCM encoder, the RS-flip-flop 7 receives frequency pulses arriving at the second input is set to a single state. In the case of using a delta encoder, the RS-flip-flop 7 with pulses of frequency f 2 supplied to the fourth input is set to 0 ”.) Thus, the signal from the output I of the RS-flip-flop 7 corresponds to the use of a specific type of encoder that works with the device. The RS-trigger 7 controls the operation of the first switch 8, with a single signal from its output, the output of the OR element 5 is connected to the corresponding input of the key 18, and when the signal from the output of the RS-trigger 7 is zero, the output of the OR element 6 is connected. The switches 9 and are controlled similarly. 10. So, if RS- · .. trigger 7 is in a single state, then the output of register 2 through the switch 10 is connected to the corresponding input of the key 17, and the fifth input of the device through the switch 9 ~ to the corresponding input of the key 18.
В противном случае к выходу ключа 17 подключается выход регистра 3, а к входу второго ключа 18 - выход D-триггера 12, который осуществляет формирование сигнала с частотой 8 кГц из сигнала +, поступающего на четвертый вход от дельта-кодера. Таким образом, на выходе коммутатора 9 как в случае работы устройства с ИКМ-кодером, так и дельта-кодером будет · присутствовать сигнал с частотой, равной 8 кГц. Импульсы этой частоты подсчитываются счетчиком с коэффициентом пересчета N=320, который определяет интервал наблюдения tH=N/f3 = =40 мс (время в течение которого произойдет полная замена информации в регистрах 2 и 3 для случаев работы устройства с дельта- или ИКМ-кодером соответственно). Импульсы переноса на выходе счетчика 13 появляются с периодом 40 мс и производят установку в 0” счетчика 15. При наличии хотя бы одной единицы в трех старших разрядах 4 и выходах регистра 2 или реверсивного счетчика 4 соответствующие элементы ИЛИ 5 или 6 формируют сигнал 1, который через коммутатор 8 разрешает прохождение импульсов частоты 8 кГц с выхода коммутатора 9 на счетный вход счетчика 15. Коэффициент пересчета счетчика 15 выбирается из следующих соображений. Во-первых, устройство обнаружения пауз речи не должно реагировать на отдельно стоящие короткие (до 10 мс) шумовые импульсы, во-вторых, должно надежно выделять начало слов и отдельных смысловых фрагментов речи, начинающихся со взрывных звуков, особенно критичных к точности анализа»Otherwise, the output of the register 3 is connected to the output of the key 17, and the output of the D-flip-flop 12 is connected to the input of the second key 18, which generates a signal with a frequency of 8 kHz from the + signal input to the fourth input from the delta encoder. Thus, at the output of switch 9, both in the case of operation of the device with an PCM encoder and a delta encoder, a signal with a frequency equal to 8 kHz will be present. The pulses of this frequency are calculated by a counter with a conversion factor N = 320, which determines the observation interval t H = N / f3 = 40 ms (the time during which the information in registers 2 and 3 will be completely replaced for cases when the device operates with delta or PCM- encoder, respectively). Transfer pulses at the output of counter 13 appear with a period of 40 ms and set to 0 ”counter 15. If there is at least one unit in the three high-order bits 4 and the outputs of register 2 or reversible counter 4, the corresponding elements of OR 5 or 6 form signal 1, which through the switch 8 allows the passage of pulses of frequency 8 kHz from the output of the switch 9 to the counting input of the counter 15. The conversion factor of the counter 15 is selected from the following considerations. Firstly, the device for detecting pauses in speech should not respond to stand-alone short (up to 10 ms) noise impulses, and secondly, it should reliably highlight the beginning of words and individual semantic fragments of speech starting with explosive sounds, especially critical to the accuracy of analysis ”
Если предположить, что отдельно стоящий шумовой импульс будет иметь все отсчеты большого уровня, то за 10 мс через ключ 17 поступит максимум 80 импульсов частоты дискретизации. Поэтому коэффициент пересчета счетчика 15 выбирается равным 80. Такой коэффициент обеспечит, с одной стороны, вырезание коротких отдельно стоящих шумовых импульсов, а с другой - позволит надежно классифицировать начало слов и смысловых фрагментов речи даже в случае наиболее ко- ? ротких фонем. Б том случае, если абонент молчит, то счетчик 15 не успеет насчитать необходимого количества импульсов и будет периодически устанавливаться в 0 импульсом перено са с выхода счетчика 13 в конце каждого интервала наблюдения.If we assume that a separate noise pulse will have all the samples of a large level, then in 10 ms a maximum of 80 sampling frequency pulses will arrive through key 17. Therefore, the conversion factor of the counter 15 is chosen equal to 80. Such a coefficient will provide, on the one hand, cutting out short freestanding noise pulses, and on the other hand, will reliably classify the beginning of words and semantic fragments of speech even in the case of the most mouth phonemes. In the event that the subscriber is silent, then the counter 15 will not have time to count the required number of pulses and will be periodically set to 0 by the transfer pulse from the output of the counter 13 at the end of each observation interval.
При переходе абонента в активное состояние счетчик 15 за длительность интервала наблюдения (40 мс) успеет насчитать необходимое количество импульсов и сформировать на своем выходе импульс переноса, который установит D-триггер 11 по входу S в единичное состояние, а счетчик 14 в нулевое состояние. Сигнал с прямого выхода D-триггера 11 разрешает прохождение импульсов переноса счетчика 13 через ключ 16 на вход счетчика 14. При этом импульс переноса счетчика периодически устанавливает счетчик 14 в нулевое состояние. Счетчик 14 предназначен для задержки отпускания речевого канала на время порядка 160-200 мс после перехода абонента от разговора к молчанию. Импульсы переноса счетчика 13 следуют с периодом 40 мс, поэтому для обеспечения задержки отпускания основного канала в 160-200 мс коэффициент пересчета счетчика 14 устанавливается И = 5-6.When the subscriber enters the active state, the counter 15 for the duration of the observation interval (40 ms) will have time to count the required number of pulses and generate a transfer pulse at its output, which will set the D-trigger 11 at the input S to the single state, and the counter 14 to the zero state. The signal from the direct output of the D-flip-flop 11 allows the passage of the transfer pulses of the counter 13 through the key 16 to the input of the counter 14. In this case, the transfer pulse of the counter periodically sets the counter 14 to zero. The counter 14 is designed to delay the release of the speech channel for a time of the order of 160-200 ms after the subscriber switches from conversation to silence. The transfer pulses of the counter 13 follow with a period of 40 ms, therefore, to ensure a delay in releasing the main channel of 160-200 ms, the conversion factor of the counter 14 is set to I = 5-6.
При переходе абонента от разговора к молчанию D-триггер 1J находится в единичном состоянии, что обеспечивает прохождение импульсов с выхода ключа 16 на вход счетчика 14, который насчитывает заданное число импульсов. При этом на выходе дешифратора 19 появится сигнал, устанавливающий D-триггер 11 по входу R в нулевое состояние. При этом ключ закроется, что обеспечит сохранение состояния счетчика 14, а следовательно и сохранение соответствующего сигнала на выходе дешифратора 19. Таким образом спустя 160-200 мс после того, как абонент замолчит, ключ закроется, а ключ 22 откроется, что обеспечит подключение к входу ' блока 23 дополнительного канала 21.When the subscriber switches from conversation to silence, the D-trigger 1J is in a single state, which ensures the passage of pulses from the output of the key 16 to the input of the counter 14, which has a given number of pulses. At the same time, a signal appears at the output of the decoder 19, setting the D-trigger 11 at the input R to the zero state. In this case, the key is closed, which will ensure that the state of the counter 14 is preserved, and therefore the corresponding signal is saved at the output of the decoder 19. Thus, after 160-200 ms after the subscriber is silent, the key is closed and the key 22 is opened, which will provide a connection to the input 'block 23 of the additional channel 21.
При переходе абонента в активное состояние D-триггер 11 вновь установится в единичное состояние, а счетчик в нулевое. При этом сигнал с выхода дешифратора 19 изменяется наUpon the transition of the subscriber to the active state, the D-trigger 11 will again be set to a single state, and the counter to zero. When this signal from the output of the decoder 19 is changed to
I противоположный, что приводит к открыванию ключа 17 и запиранию клю·ча 22.I opposite, which leads to the opening of the key 17 and the lock key 22.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU874264886A SU1476618A1 (en) | 1987-06-19 | 1987-06-19 | Device for determining pauses in speech |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU874264886A SU1476618A1 (en) | 1987-06-19 | 1987-06-19 | Device for determining pauses in speech |
Publications (1)
Publication Number | Publication Date |
---|---|
SU1476618A1 true SU1476618A1 (en) | 1989-04-30 |
Family
ID=21311986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SU874264886A SU1476618A1 (en) | 1987-06-19 | 1987-06-19 | Device for determining pauses in speech |
Country Status (1)
Country | Link |
---|---|
SU (1) | SU1476618A1 (en) |
-
1987
- 1987-06-19 SU SU874264886A patent/SU1476618A1/en active
Non-Patent Citations (1)
Title |
---|
Авторское свидетельство СССР № 1307596, кл. Н 04 J 3/17, 1987. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
SU1476618A1 (en) | Device for determining pauses in speech | |
US3838416A (en) | Digital/analog subterminal | |
KR840004337A (en) | PCM signal encoder | |
SU1513632A1 (en) | Detector of speech pauses in delta-modulation system | |
SU896781A1 (en) | Synchronization device | |
SU953743A1 (en) | Counting device | |
SU1307596A1 (en) | Device for detecting pauses in speech | |
SU1000547A1 (en) | Electric coded lock | |
SU1325717A1 (en) | Detector of pauses in speech in system with delta-modulation | |
SU1764141A1 (en) | Digital filter | |
SU1540018A1 (en) | Detector of intervals in system with pulse-code modulation | |
SU1474851A1 (en) | Pulse-time code decoder | |
SU1531226A1 (en) | Device for conversion of codes | |
SU1599916A1 (en) | Code converter | |
SU960880A1 (en) | Time interval to code converter | |
RU2047272C1 (en) | Reversible binary counter | |
SU1524041A1 (en) | Information input device | |
SU1580585A1 (en) | Device for conversion of binary-decimal code to linear code of subscriberъs number | |
SU1541785A1 (en) | Device for cycle synchronization and information decoding | |
SU1453433A1 (en) | Apparatus for transmitting information from rotary object | |
SU1180953A1 (en) | Device for reception and transmission of information | |
SU1462324A2 (en) | Device for determining the number of units in information sequence | |
SU955031A1 (en) | Maximum number determination device | |
SU734662A1 (en) | Information receiving device | |
SU1264354A2 (en) | Device for measuring noise level during speech pauses |