RU2010102675A

RU2010102675A - Способ электронного анализа диалога и система для осуществления этого способа

Info

Publication number: RU2010102675A
Application number: RU2010102675/08A
Authority: RU
Inventors: Филипп АМЕЛЬ (FR); Филипп АМЕЛЬ; Жан-Поль ОДРЕН (FR); Жан-Поль ОДРЕН; Пьер-Сильван ЛИКЕ (FR); Пьер-Сильван ЛИКЕ; Эрик ФОРО (FR); Эрик ФОРО
Original assignee: Зеро Ту Уан Текнолоджи (Fr); Зеро Ту Уан Текнолоджи
Priority date: 2007-07-06
Filing date: 2008-06-25
Publication date: 2011-08-20
Also published as: KR101532705B1; CA2691424A1; AU2008274651A1; KR20100056451A; NZ582481A; BRPI0812652A2; WO2009007011A1; JP2013101680A; US8861779B2; AU2008274651B2; DK2012304T3; MA31579B1; JP2010536053A; US20100278377A1; CA2691424C; EP2012304B1; ZA201000248B; RU2472219C2; BRPI0812652B1; JP5634537B2

Abstract

1. Способ автоматического, в частности электронного, оценивания диалога, по меньшей мере, между двумя людьми, включающий следующие шаги: ! a) получение аудиоданных, воспроизводящих диалог, по меньшей мере, между двумя людьми, ! b) анализ аудиоданных с целью определить распределение высказываний, по меньшей мере, двух людей в процессе диалога, в частности во временном домене, ! c) идентифицирование в диалоге одного или более коммуникационных паттернов, в частности, путем сравнения результатов шага анализа с заранее установленными коммуникационными паттернами. ! 2. Способ по п.1, отличающийся тем, что дополнительно включает шаг d) идентифицирования заранее установленных фаз взаимодействия в процессе диалога на основе скользящего среднего значения времени, в течение которого говорит один человек, участвующий в диалоге. ! 3. Способ автоматического, в частности электронного, оценивания диалога, по меньшей мере, между двумя людьми, включающий следующие шаги: ! а) получение аудиоданных, содержащих диалог, по меньшей мере, между двумя людьми, ! d) идентифицирование заранее установленных фаз взаимодействия в процессе диалога на основе скользящего среднего значения времени, в течение которого говорит один человек, участвующий в диалоге. ! 4. Способ по п.2 или 3, отличающийся тем, что указанное идентифицирование, по меньшей мере, одной фазы взаимодействия включает обнаружение перехода от одной фазы взаимодействия к другой путем определения первого момента, в который скользящее среднее принимает первое граничное значение, и второго момента, в который скользящее среднее принимает второе граничное значение, при этом указанный п

Claims

1. Способ автоматического, в частности электронного, оценивания диалога, по меньшей мере, между двумя людьми, включающий следующие шаги:

a) получение аудиоданных, воспроизводящих диалог, по меньшей мере, между двумя людьми,

b) анализ аудиоданных с целью определить распределение высказываний, по меньшей мере, двух людей в процессе диалога, в частности во временном домене,

c) идентифицирование в диалоге одного или более коммуникационных паттернов, в частности, путем сравнения результатов шага анализа с заранее установленными коммуникационными паттернами.

2. Способ по п.1, отличающийся тем, что дополнительно включает шаг d) идентифицирования заранее установленных фаз взаимодействия в процессе диалога на основе скользящего среднего значения времени, в течение которого говорит один человек, участвующий в диалоге.

3. Способ автоматического, в частности электронного, оценивания диалога, по меньшей мере, между двумя людьми, включающий следующие шаги:

а) получение аудиоданных, содержащих диалог, по меньшей мере, между двумя людьми,

d) идентифицирование заранее установленных фаз взаимодействия в процессе диалога на основе скользящего среднего значения времени, в течение которого говорит один человек, участвующий в диалоге.

4. Способ по п.2 или 3, отличающийся тем, что указанное идентифицирование, по меньшей мере, одной фазы взаимодействия включает обнаружение перехода от одной фазы взаимодействия к другой путем определения первого момента, в который скользящее среднее принимает первое граничное значение, и второго момента, в который скользящее среднее принимает второе граничное значение, при этом указанный переход происходит во второй момент.

5. Способ по п.4, отличающийся тем, что первое граничное значение составляет 60-80%, в частности 65%, для фаз, в течение которых один человек, участвующий в диалоге, говорит больше другого человека, и 20-40%, в частности 35%, для фаз, в течение которых один человек, участвующий в диалоге, говорит меньше другого человека, а второе граничное значение составляет 45-55%, в частности 50%.

6. Способ по п.2 или 3, отличающийся тем, что указанное среднее значение рассчитывают на временном интервале, составляющем около 3-10% общей продолжительности диалога, в частности 5% указанной продолжительности.

7. Способ по любому из пп.1-3, отличающийся тем, что дополнительно включает шаг е) анализа аудиоданных с целью идентификации заранее установленных слов в высказываниях, по меньшей мере, двух людей, в частности только в высказывании одного, заранее выбранного человека.

8. Способ по п.7, отличающийся тем, что дополнительно включает шаг f) анализа, в частности подсчета, появлений заранее выбранных слов в одной или более идентифицированных фазах взаимодействия.

9. Способ по любому из пп.1-3, отличающийся тем, что аудиоданные включают потоки данных от различных микрофонов, в частности от микрофонов, каждый из которых ассоциирован только с одним человеком из указанных, по меньшей мере, двух людей и сконфигурирован таким образом, что интенсивность сигнала, поступающего от одного человека, когда он говорит, превышает интенсивность сигнала от остальных людей.

10. Способ по п.1, отличающийся тем, что дополнительно включает шаг g) получения видеоданных, отображающих, по меньшей мере частично, двух людей, и шаг h) анализа видеоданных с целью определения, имеет ли место визуальное взаимодействие, по меньшей мере, между указанными двумя людьми.

11. Способ автоматического, в частности электронного, оценивания диалога, по меньшей мере, между двумя людьми, включающий следующие шаги:

g) получение видеоданных, отображающих, по меньшей мере частично, двух людей, и

h) анализ видеоданных с целью определения, имеет ли место визуальное взаимодействие, по меньшей мере, между указанными двумя людьми в процессе диалога.

12. Способ по п.10 или 11, отличающийся тем, что шаг h) включает определение того, смотрят ли друг на друга, по меньшей мере, двое указанных людей, путем детектирования положения их зрачков.

13. Способ по п.10 или 11, отличающийся тем, что дополнительно включает шаг i) анализа микродвижений глаз, по меньшей мере, двух людей с целью определить, являются ли направления микродвижений глаз однотипными.

14. Способ по п.13, отличающийся тем, что шаг i) включает определение того, являются ли направления микродвижений глаз однотипными, по меньшей мере, в одной заранее установленной фазе взаимодействия.

15. Способ по п.10 или 11, отличающийся тем, что шаг h) включает следующие шаги:

шаг h_1) идентифицирования визуальных признаков в кадре в составе видеоданных с целью определения в кадре зоны, отображающей, по меньшей мере, часть лица, в частности, по меньшей мере, оба глаза, по меньшей мере, одного из двух людей,

шаг h_2) изолирования в указанной зоне полосок, в частности вертикальных, и

шаг h_3) поиска внутри полосок областей, соответствующих глазам, при условии, что на шаге h_2) было изолировано более одной полоски.

16. Способ по п.15, отличающийся тем, что шаг h_2) дополнительно включает идентифицирование внутри полосок контуров, в частности путем их преобразования в формат по серой шкале, и поиск возможных центров идентифицированных контуров путем поиска кругов, которые могут соответствовать зрачку, в частности определением относительных весов их интенсивностей по серой шкале в видеоданных в пределах контуров с заранее установленным цветом, предпочтительно черным.

17. Способ по п.16, отличающийся тем, что дополнительно включает шаг h_4) идентифицирования положения зрачка в области, соответствующей глазу, путем поиска кругов, которые могут соответствовать зрачку, в частности определением относительных весов их интенсивностей по серой шкале в видеоданных в пределах контуров с заранее установленным цветом, предпочтительно черным.

18. Способ по п.17, отличающийся тем, что, по меньшей мере, для следующего кадра в составе видеоданных повторяют только шаг h_4) с целью идентификации положения зрачка в области, соответствующей глазу, за исключением случаев, когда положение зрачка не детектируется.

19. Способ по п.10 или 11, отличающийся тем, что видеоданные содержат потоки данных от различных камер, установленных в различных положениях по отношению к людям, участвующим в диалоге.

20. Способ по п.19, отличающийся тем, что каждая камера снимает только одного человека.

21. Способ по п.10 или 11, отличающийся тем, что шаги h) и/или i) выполняют во временном интервале, более коротком, чем временной интервал между двумя кадрами видеоданных.

22. Система для автоматического, в частности электронного, оценивания диалога, по меньшей мере, между двумя людьми, содержащая:

a) по меньшей мере, один микрофон (3, 5) для улавливания диалога и генерирования аудиоданных и

b) устройство (7) обработки данных, сконфигурированное с возможностью анализа аудиоданных с целью определения распределения высказываний, по меньшей мере, двух людей в процессе диалога, в частности во временном домене, и сконфигурированное с возможностью сравнения шага анализа с заранее установленными коммуникационными паттернами с целью идентификации в диалоге одного или более коммуникационных паттернов.

23. Система по п.22, отличающаяся тем, что устройство (7) обработки данных сконфигурировано с возможностью идентификации заранее установленных фаз взаимодействия в процессе диалога на основе скользящего среднего значения времени, в течение которого говорит один человек, участвующий в диалоге.

24. Система для автоматического, а именно электронного, оценивания диалога, по меньшей мере, между двумя людьми, содержащая:

а) по меньшей мере, один микрофон (3, 5) для улавливания диалога и генерирования аудиоданных и

d) устройство (7) обработки данных, сконфигурированное с возможностью идентификации заранее установленных фаз взаимодействия в процессе диалога на основе скользящего среднего значения времени, в течение которого говорит один человек, участвующий в диалоге.

25. Система по любому из пп.22-24, отличающаяся тем, что устройство (7) обработки данных сконфигурировано с возможностью идентификации заранее выбранных слов в высказываниях.

26. Система по любому из пп.22-24, отличающаяся тем, что содержит по одному микрофону (3, 5) на каждого человека, участвующего в диалоге, при этом каждый микрофон (3, 5) сконфигурирован так, что интенсивность сигнала от соответствующего человека, когда он говорит, превышает интенсивность сигнала от остальных людей.

27. Система по п.22, отличающаяся тем, что дополнительно содержит, по меньшей мере, одну видеокамеру (43, 45) для генерирования видеоданных, по меньшей мере, частично отображающих, по меньшей мере, двух людей во время диалога, при этом устройство обработки (73) сконфигурировано с возможностью определять, имеет ли место визуальное взаимодействие, по меньшей мере, между двумя людьми во время диалога.

28. Система для автоматического, а именно электронного, оценивания диалога, по меньшей мере, между двумя людьми, содержащая, по меньшей мере, одну видеокамеру (43, 45) для генерирования видеоданных, по меньшей мере, частично отображающих, по меньшей мере, двух людей во время диалога, и устройство обработки (47), сконфигурированное с возможностью определять, имеет ли место во время диалога визуальное взаимодействие, по меньшей мере, между двумя людьми.

29. Система по п.27 или 28, отличающаяся тем, что устройство обработки (47, 73) сконфигурировано с возможностью детектирования в видеоданных, содержащих множество последовательных кадров, положения глаз, в частности зрачков, человека, участвующего в диалоге, путем идентифицирования в кадре визуальных признаков с целью определения зоны кадра, отображающей, по меньшей мере, часть лица, в частности, по меньшей мере, оба глаза, человека, выделением в указанной зоне, в частности, вертикальных полосок и поиска внутри полосок областей, соответствующих глазам, при условии, что выделено более одной полоски.

30. Система по п.27 или 28, отличающаяся тем, что содержит по одной видеокамере (43, 45) на каждого человека, участвующего в диалоге, при этом видеокамеры (43, 45) установлены так, что каждая камера (43, 45) снимает только одного человека.

31. Система по п.27 или 28, отличающаяся тем, что устройство обработки (47, 73) сконфигурировано с возможностью определять, являются ли микродвижения глаз двух человек однотипными.