RU2664688C2 - Способ распознавания человеческих лиц, устройство и терминал - Google Patents
Способ распознавания человеческих лиц, устройство и терминал Download PDFInfo
- Publication number
- RU2664688C2 RU2664688C2 RU2017102521A RU2017102521A RU2664688C2 RU 2664688 C2 RU2664688 C2 RU 2664688C2 RU 2017102521 A RU2017102521 A RU 2017102521A RU 2017102521 A RU2017102521 A RU 2017102521A RU 2664688 C2 RU2664688 C2 RU 2664688C2
- Authority
- RU
- Russia
- Prior art keywords
- image
- processed
- partial
- partial image
- human face
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 abstract description 14
- 238000005516 engineering process Methods 0.000 abstract description 8
- 230000000694 effects Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/162—Detection; Localisation; Normalisation using pixel segmentation or colour matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
- Studio Devices (AREA)
- Image Processing (AREA)
Abstract
Изобретение относится к способу распознавания человеческих лиц, устройству распознавания человеческих лиц и терминалу и принадлежит области технологии обработки изображений. Заявленный способ распознавания человеческих лиц содержит этапы, на которых: получают исходное изображение; добавляют заданные числовые пиксели в краевую область исходного изображения для получения изображения, подлежащего обработке; осуществляют распознавание человеческих лиц на изображении, подлежащем обработке, и определяют человеческое лицо в исходном изображении согласно результату распознавания человеческих лиц. Причем осуществление распознавания человеческих лиц на изображении, подлежащем обработке, содержит этапы, на которых: получают множество частичных изображений изображения, подлежащего обработке; и принимают решение, является ли каждое частичное изображение частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц. Технический результат - повышение точности распознавания человеческого лица. 3 н. и 8 з.п. ф-лы, 12 ил.
Description
ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
[0001] Данная заявка базируется на и испрашивает приоритет китайской патентной заявки № CN 201510520457.X, поданной в государственное учреждение по защите интеллектуальной собственности КНР 21 августа 2015 г., содержание которой в полном объеме включено в данное описание посредством ссылки.
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0002] Настоящее изобретение, в общем, относится к области технологии обработки изображений, и, в частности, к способу распознавания человеческих лиц, устройству распознавания человеческих лиц и терминалу.
УРОВЕНЬ ТЕХНИКИ
[0003] В последнее время развиваются технологии распознавания человеческих лиц со все более высоким прикладным значением в областях управления безопасным доступом, визуального обнаружения, извлечения изображения на основании содержания и человекомашинного интерфейса нового поколения. В результате распознавание человеческих лиц в изображении привлекает все большее внимание исследователей.
[0004] В уровне техники человеческое лицо может распознаваться в соответствии с особенностью лица, например, на основании соотношения органов (например, глаз, носа и т.д.) на человеческом лице в качестве особенности лица. Однако если человеческое лицо располагается в краевой области изображения, профиль с соотношением, аналогичным соотношению между органами на лице может не быть найден в таком изображении, поскольку изображение не содержит человеческого лица целиком, таким образом, классификатор человеческих лиц может не распознать человеческое лицо.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0005] Настоящее изобретение обеспечивает в вариантах осуществления способ распознавания человеческих лиц и устройство распознавания человеческих лиц.
[0006] Согласно первому аспекту вариантов осуществления настоящего изобретения обеспечен способ распознавания человеческих лиц, включающий в себя:
получение исходного изображения;
добавление заданных числовых пикселей в краевую область исходного изображения для получения изображения, подлежащего обработке;
осуществление распознавания человеческих лиц на изображении, подлежащем обработке; и
определение человеческого лица в исходном изображении согласно результату распознавания человеческих лиц.
[0007] Совместно с первым аспектом, в первой возможной реализации первого аспекта, добавление заданных числовых пикселей в краевую область исходного изображения включает в себя:
получение пиксельного значения каждого пикселя в краевой области исходного изображения;
определение краевой области, имеющей пиксель цвета лица, согласно пиксельному значению каждого пикселя в краевой области и заранее установленному пиксельному значению для пикселя цвета лица; и
добавление заданных числовых пикселей в краевую область, имеющую пиксель цвета лица.
[0008] Совместно с первым аспектом или первой возможной реализацией первого аспекта во второй возможной реализации первого аспекта осуществление распознавания человеческих лиц на изображении, подлежащем обработке, включает в себя:
получение множества частичных изображений изображения, подлежащего обработке; и
принятие решения, является ли каждое частичное изображение частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц.
[0009] Совместно со второй возможной реализацией первого аспекта в третьей возможной реализации первого аспекта получение множества частичных изображений изображения, подлежащего обработке, включает в себя:
обход изображения, подлежащего обработке, несколько раз с использованием скользящих окон и задание области изображения, покрытой скользящим окном, в каждой позиции каждого обхода как одно частичное изображение изображения, подлежащего обработке, причем скользящие окна, используемые в любых двух обходах, отличаются размерами; или
масштабирование изображения, подлежащего обработке, несколько раз для получения множества изображений, подлежащих обработке, разных размеров, обрезку изображения, подлежащего обработке, по размеру на множество областей изображения заданного размера, и задание каждой области изображения заданного размера как частичного изображения.
[0010] Совместно со второй возможной реализацией первого аспекта в четвертой возможной реализации первого аспекта заранее обученный адаптивно усиленный классификатор человеческих лиц выполнен в виде каскада многостадийных классификаторов; и принятие решения, является ли каждое частичное изображение частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц, включает в себя:
принятие решения, является ли частичное изображение частичным изображением человеческого лица, постадийно, начиная с первой стадии классификатора до последней стадии классификатора в заранее обученном адаптивно усиленном классификаторе человеческих лиц; и
определение, что частичное изображение является частичным изображением человеческого лица, если каждый из результатов, выводимых из всех стадий классификаторов, указывает, что частичное изображение является частичным изображением человеческого лица.
[0011] Совместно со второй возможной реализацией первого аспекта в пятой возможной реализации первого аспекта определение человеческого лица в исходном изображении согласно результату распознавания человеческих лиц включает в себя:
определение позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении, если во множестве частичных изображений изображения, подлежащего обработке, существует частичное изображение, которое является частичным изображением человеческого лица; и
определение человеческого лица в исходном изображении согласно позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении.
[0012] Согласно второму аспекту вариантов осуществления настоящего изобретения обеспечено устройство распознавания человеческих лиц, включающее в себя:
модуль получения, выполненный с возможностью получения исходного изображения;
модуль добавления, выполненный с возможностью добавления заданных числовых пикселей в краевую область исходного изображения, полученного модулем получения, для получения изображения, подлежащего обработке;
модуль распознавания, выполненный с возможностью осуществления распознавания человеческих лиц на изображении, подлежащем обработке, полученном модулем добавления; и
модуль определения, выполненный с возможностью определения человеческого лица в исходном изображении согласно результату распознавания человеческих лиц от модуля распознавания.
[0013] Совместно со вторым аспектом в первой возможной реализации второго аспекта модуль добавления включает в себя:
первый блок получения, выполненный с возможностью получения пиксельного значения каждого пикселя в краевой области исходного изображения;
первый блок определения, выполненный с возможностью определения краевой области, имеющей пиксель цвета лица, согласно пиксельному значению каждого пикселя в краевой области, полученному первым блоком получения и заранее установленному пиксельному значению для пикселя цвета лица; и
блок добавления, выполненный с возможностью добавления заданных числовых пикселей в краевую область, имеющую пиксель цвета лица, определенный первым блоком определения.
[0014] Совместно со вторым аспектом или первой возможной реализации второго аспекта во второй возможной реализации второго аспекта модуль распознавания включает в себя:
второй блок получения, выполненный с возможностью получения множества частичных изображений изображения, подлежащего обработке; и
блок принятия решения, выполненный с возможностью принятия решения, является ли каждое частичное изображение, полученное вторым блоком получения частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц.
[0015] Совместно со второй возможной реализацией второго аспекта в третьей возможной реализации второго аспекта второй блок получения выполнен с возможностью:
обход изображения, подлежащего обработке, несколько раз с использованием скользящих окон и задания области изображения, покрытой скользящим окном, в каждой позиции каждого обхода как одного частичного изображения для изображения, подлежащего обработке, причем скользящие окна, используемые в любых двух обходах, отличаются размерами; или
масштабирования изображения, подлежащего обработке, несколько раз для получения множества изображений, подлежащих обработке, разных размеров, обрезки изображения, подлежащего обработке, по размеру на множество областей изображения заданного размера, и задания каждой области изображения заданного размера как частичного изображения.
[0016] Совместно со второй возможной реализацией второго аспекта в четвертой возможной реализации второго аспекта заранее обученный адаптивно усиленный классификатор человеческих лиц выполнен в виде каскада многостадийных классификаторов, и блок принятия решения выполнен с возможностью:
принятия решения, является ли частичное изображение частичным изображением человеческого лица, постадийно, начиная с первой стадии классификатора до последней стадии классификатора в заранее обученном адаптивно усиленном классификаторе человеческих лиц; и
определения, что частичное изображение является частичным изображением человеческого лица, если каждый из результатов, выводимых из всех стадий классификаторов, указывает, что частичное изображение является частичным изображением человеческого лица.
[0017] Совместно со второй возможной реализацией второго аспекта в пятой возможной реализации второго аспекта модуль определения включает в себя:
второй блок определения, выполненный с возможностью определения позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении, если во множестве частичных изображений изображения, подлежащего обработке, существует частичное изображение, которое является частичным изображением человеческого лица; и
третий блок определения, выполненный с возможностью определения человеческого лица в исходном изображении согласно позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении.
[0018] Согласно третьему аспекту вариантов осуществления настоящего изобретения обеспечен терминал, включающий в себя:
процессор; и
память для хранения инструкций, исполняемых процессором;
причем процессор выполнен с возможностью:
получать исходное изображение;
добавлять заданные числовые пиксели в краевую область исходного изображения для получения изображения, подлежащего обработке;
осуществлять распознавание человеческих лиц на изображении, подлежащем обработке; и
определять человеческое лицо в исходном изображении согласно результату распознавания человеческих лиц.
[0019] Решения, обеспеченные в вариантах осуществления настоящего изобретения, могут иметь следующие полезные эффекты.
[0020] После получения изображения, подлежащего обработке, путем добавления заданных числовых пикселей в краевую область исходного изображения, распознавание человеческих лиц осуществляется на изображении, подлежащем обработке, для определения человеческого лица в исходном изображении. В ходе распознавания человеческих лиц, в краевую область исходного изображения добавляются заданные числовые пиксели, что эквивалентно расширению исходного изображения, так что частичное изображение, содержащее человеческое лицо, может быть найдено в расширенном изображении, если человеческое лицо располагается в краевой области исходного изображения, таким образом, гарантируется, что человеческое лицо, расположенное в краевой области исходного изображения, может быть распознано, и дополнительно повышается точность распознавания человеческого лица.
[0021] Следует понимать, что вышеприведенное общее описание и нижеследующее подробное описание являются лишь иллюстративными и пояснительными и не призваны ограничивать изобретение.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0022] Прилагаемые чертежи, которые включены в это описание изобретения и составляют его часть, иллюстрируют варианты осуществления, согласующиеся с изобретением, и, совместно с описанием, служат для объяснения принципов изобретения.
[0023] Фиг. 1 - блок-схема операций, демонстрирующая способ распознавания человеческих лиц согласно иллюстративному варианту осуществления.
[0024] Фиг. 2 - блок-схема операций, демонстрирующая способ распознавания человеческих лиц согласно иллюстративному варианту осуществления.
[0025] Фиг. 3 - схема исходного изображения согласно иллюстративному варианту осуществления.
[0026] Фиг. 4 - схема изображения, подлежащего обработке, согласно иллюстративному варианту осуществления.
[0027] Фиг. 5 - схема обхода изображения, подлежащего обработке, с использованием скользящих окон разных размеров, согласно иллюстративному варианту осуществления.
[0028] Фиг. 6 - схема изображений, подлежащих обработке, разных размеров, согласно иллюстративному варианту осуществления.
[0029] Фиг. 7 - схема классификатора человеческих лиц Adaboost согласно иллюстративному варианту осуществления.
[0030] Фиг. 8 - блок-схема устройства распознавания человеческих лиц согласно иллюстративному варианту осуществления.
[0031] Фиг. 9 - блок-схема модуля добавления согласно иллюстративному варианту осуществления.
[0032] Фиг. 10 - блок-схема модуля распознавания согласно иллюстративному варианту осуществления.
[0033] Фиг. 11 - блок-схема модуля определения согласно иллюстративному варианту осуществления.
[0034] Фиг. 12 - блок-схема терминала согласно иллюстративному варианту осуществления.
ПОДРОБНОЕ ОПИСАНИЕ
[0035] Обратимся к подробному описанию вариантов осуществления настоящего изобретения. Если иначе не задано или не ограничено, одинаковые или аналогичные элементы и элементы, имеющие одинаковые или аналогичные функции, обозначаются сходными ссылочными позициями на протяжении описания. Пояснительные варианты осуществления настоящего изобретения и их иллюстрации не призваны представлять все реализации, отвечающие настоящему изобретению. Напротив, они иллюстрируют устройство и способ, согласующиеся с некоторыми аспектами настоящего изобретения, описанными в нижеследующей формуле изобретения.
[0036] На фиг. 1 показана блок-схема операций, демонстрирующая способ распознавания человеческих лиц согласно иллюстративному варианту осуществления, и способ распознавания человеческих лиц применяется на терминале. Как показано на фиг. 1, способ распознавания человеческих лиц, обеспеченный в вариантах осуществления настоящего изобретения, включает в себя следующие этапы.
[0037] На этапе S101 получается исходное изображение.
[0038] На этапе S102 заданные числовые пиксели добавляются в краевую область исходного изображения для получения изображения, подлежащего обработке.
[0039] На этапе S103 распознавание человеческих лиц осуществляется на изображении, подлежащем обработке.
[0040] На этапе S104 человеческое лицо в исходном изображении определяется согласно результату распознавания человеческих лиц.
[0041] Согласно способу, обеспеченному вариантами осуществления настоящего изобретения, после получения изображения, подлежащего обработке, путем добавления заданных числовых пикселей в краевую область исходного изображения, распознавание человеческих лиц осуществляется на изображении, подлежащем обработке, для определения человеческого лица в исходном изображении. В ходе распознавания человеческих лиц, в краевую область исходного изображения добавляются заданные числовые пиксели, что эквивалентно расширению исходного изображения, так что частичное изображение, содержащее человеческое лицо, может быть найдено в расширенном изображении, если человеческое лицо располагается в краевой области исходного изображения, и, таким образом, гарантируется, что человеческое лицо, расположенное в краевой области исходного изображения, может быть распознано, и дополнительно повышается точность распознавания человеческого лица.
[0042] В другом варианте осуществления добавление заданных числовых пикселей в краевую область исходного изображения включает в себя:
получение пиксельного значения каждого пикселя в краевой области исходного изображения;
определение краевой области, имеющей пиксель цвета лица, согласно пиксельному значению каждого пикселя в краевой области и заранее установленному пиксельному значению для пикселя цвета лица; и
добавление заданных числовых пикселей в краевую область, имеющую пиксель цвета лица.
[0043] В другом варианте осуществления осуществление распознавания человеческих лиц на изображении, подлежащем обработке, включает в себя:
получение множества частичных изображений изображения, подлежащего обработке; и
принятие решения, является ли каждое частичное изображение частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц.
[0044] В другом варианте осуществления получение множества частичных изображений изображения, подлежащего обработке, включает в себя:
обход изображения, подлежащего обработке, несколько раз с использованием скользящих окон и задание области изображения, покрытой скользящим окном, в каждой позиции каждого обхода как одно частичное изображение изображения, подлежащего обработке, причем скользящие окна, используемые в любых двух обходах, отличаются размерами; или
масштабирование изображения, подлежащего обработке, несколько раз для получения множества изображений, подлежащих обработке, разных размеров, обрезку изображения, подлежащего обработке, по размеру на множество областей изображения заданного размера, и задание каждой области изображения заданного размера как частичного изображения.
[0045] В другом варианте осуществления заранее обученный адаптивно усиленный классификатор человеческих лиц выполнен в виде каскада многостадийных классификаторов в каскаде, и принятие решения, является ли каждое частичное изображение частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц, включает в себя:
принятие решения, является ли частичное изображение частичным изображением человеческого лица, постадийно, начиная с первой стадии классификатора до последней стадии классификатора в заранее обученном адаптивно усиленном классификаторе человеческих лиц; и
определение, что частичное изображение является частичным изображением человеческого лица, если каждый из результатов, выводимых из всех стадий классификаторов, указывает, что частичное изображение является частичным изображением человеческого лица.
[0046] В другом варианте осуществления определение человеческого лица в исходном изображении согласно результату распознавания человеческих лиц включает в себя:
определение позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении, если во множестве частичных изображений изображения, подлежащего обработке, существует частичное изображение, которое является частичным изображением человеческого лица; и
определение человеческого лица в исходном изображении согласно позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении.
[0047] Альтернативные варианты осуществления настоящего изобретения могут быть сформированы любым образом путем объединения вышеописанных альтернативных технических решений, которые не будут здесь рассмотрены.
[0048] На фиг. 2 показана блок-схема операций, демонстрирующая способ распознавания человеческих лиц согласно иллюстративному варианту осуществления, и способ распознавания человеческих лиц применяется на терминале. Как показано на фиг. 2, способ распознавания человеческих лиц, обеспеченный вариантами осуществления настоящего изобретения, включает в себя следующие этапы.
[0049] На этапе 201 получается исходное изображение.
[0050] Исходное изображение представляет собой изображение, в котором необходимо осуществлять распознавание человеческих лиц. Согласно вариантам осуществления настоящего изобретения необходимо распознавать, содержит ли исходное изображение человеческое лицо, и распознавать, в какой области исходного изображения располагается человеческое лицо, если исходное изображение содержит человеческое лицо.
[0051] Существует много способов получения исходного изображения. Например, изображение, считанное из любого запоминающего устройства, можно использовать в качестве исходного изображения. Альтернативно, в качестве исходного изображения можно использовать изображение, загруженное из интернета. Кроме того, исходное изображение можно получить путем сканирования изображения с помощью сканера. Кроме того, в качестве исходного изображения можно использовать изображение, сфотографированное камерой.
[0052] На этапе S202 заданные числовые пиксели добавляются в краевую область исходного изображения для получения изображения, подлежащего обработке.
[0053] Например, краевая область исходного изображения включает в себя пиксели на четырех самых внешних сторонах каждого края исходного изображения. На фиг. 3 показана схема исходного изображения. Человеческое лицо на фиг. 3 располагается в краевой области исходного изображения. Если человеческое лицо располагается на краю исходного изображения, то человеческое лицо может не распознаваться при распознавании человеческого лица. Во избежание этой ситуации, согласно вариантам осуществления настоящего изобретения до распознавания человеческого лица, заданные числовые пиксели добавляются в краевую область исходного изображения для получения изображения, подлежащего обработке. На фиг. 4 показана схема изображения, подлежащего обработке. Изображение, подлежащее обработке, показанное на фиг. 4, получается путем добавления пикселей в четыре краевые области исходного изображения, показанные на фиг. 3. Область с диагоналями, показанными на фиг. 4, представляет добавленные пиксели.
[0054] Заданное числовое значение не имеет ограничений согласно вариантам осуществления настоящего изобретения и может быть, при необходимости, установлено в конкретной реализации. Например, два пикселя, пять пикселей или десять пикселей можно добавлять к периферии каждого пикселя на самых внешних сторонах.
[0055] Дополнительно, все пиксели, добавленные в краевую область исходного изображения, могут иметь одно и то же пиксельное значение, т.е. все пиксели имеют один и тот же цвет. Один и тот же цвет может быть белым, черным или иным, что не ограничивается согласно вариантам осуществления настоящего изобретения. Поскольку пиксели одного и того же цвета имеют одно и то же пиксельное значение, в ситуации, когда добавленные пиксели являются пикселями одного и того же цвета, если обнаружено, что пиксели в некоторой области изображения, подлежащего обработке, имеют одно и то же пиксельное значение в ходе распознавания человеческих лиц для изображения, подлежащего обработке, эти пиксели можно определять как добавленные пиксели, что исключает необходимость в выполнении излишних процедур распознавания, таким образом, повышая скорость распознавания.
[0056] Например, при добавлении заданных числовых пикселей в краевую область исходного изображения заданные числовые пиксели можно добавлять во все из четырех краевых областей исходного изображения. Конечно, количество заданных числовых пикселей, добавленных в каждую краевую область, может различаться. Например, количество заданных числовых пикселей, добавленных в левую краевую область, отличается от количества пикселей, добавленных в правую краевую область. Однако, после добавления пикселей в краевую область исходного изображения, вычисление для распознавания изображения, может увеличиваться. Для минимизации вычисления для распознавания изображения, до добавления пикселей в краевую область исходного изображения, обнаруживается краевая область, в которой может присутствовать человеческое лицо, куда добавляются пиксели.
[0057] В возможной реализации, поскольку пиксельное значение для пикселя цвета лица обычно является конкретным значением или находится в определенном диапазоне значений, можно определять, существует ли человеческое лицо в краевой области, путем обнаружения, является ли пиксельное значение каждого пикселя в краевой области пиксельным значением для пикселя цвета лица. Совместно с содержанием этой части этап добавления заданных числовых пикселей в краевую область исходного изображения включает в себя, но без ограничения, следующие этапы S2021-S2023.
[0058] На этапе S2021 получают пиксельное значение каждого пикселя в краевой области исходного изображения.
[0059] Например, пиксельное значение каждого пикселя в краевой области можно получить путем определения значения RGB каждого пикселя. Определение значения RGB каждого пикселя может осуществляться с помощью датчика цвета, но без ограничения этим.
[0060] На этапе S2022 краевая область, имеющая пиксель цвета лица определяется согласно пиксельному значению каждого пикселя в краевой области и заранее установленному пиксельному значению для пикселя цвета лица.
[0061] В возможной реализации пиксельное значение каждого пикселя в краевых областях можно сравнивать с заранее установленным пиксельным значением для пикселя цвета лица, и затем краевую область, имеющую пиксель цвета лица, можно определять согласно сравнению.
[0062] Например, при сравнении пиксельного значения любого пикселя в краевых областях с заранее установленным пиксельным значением для пикселя цвета лица, если разность между пиксельным значением этого пикселя и заранее установленным пиксельным значением для пикселя цвета лица не превышает первый заранее установленный порог, этот пиксель можно определять как пиксель цвета лица. Конкретное числовое значение первого заранее установленного порога не имеет ограничений согласно вариантам осуществления настоящего изобретения. Однако для точного распознавания, является ли пиксель пикселем цвета лица, первый заранее установленный порог может быть установлен на малое значение.
[0063] Например, при определении краевой области, имеющей пиксель цвета лица, согласно сравнению, для каждой краевой области, можно определять, существует ли пиксель цвета лица в краевой области согласно соотношению пикселя цвета лица ко всем пикселям в краевой области. Если соотношение превышает второй заранее установленный порог, принимается решение, что пиксель цвета лица существует в краевой области, иначе принимается решение, что пиксель цвета лица отсутствует в краевой области. При необходимости, может быть установлено конкретное числовое значение второго заранее установленного порога.
[0064] На этапе S2023 заданные числовые пиксели добавляются в краевую область, имеющую пиксель цвета лица.
[0065] Другими словами, при добавлении пикселей в краевую область исходного изображения, заданные числовые пиксели могут добавляться только в краевую область, имеющую пиксель цвета лица. Например, если пиксель цвета лица существует в верхней краевой области исходного изображения, заданные числовые пиксели могут добавляться только в верхнюю краевую область, для уменьшения вычислений для распознавания изображения.
[0066] На этапе S203 получают множество частичных изображений изображения, подлежащего обработке, и определяют, является ли каждое частичное изображение частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц.
[0067] Этот этап является конкретной реализацией для осуществления распознавания человеческих лиц на изображении, подлежащем обработке. Согласно вариантам осуществления настоящего изобретения распознавание человеческого лица может быть реализовано, прежде всего, путем получения множества частичных изображений изображения, подлежащего обработке, и затем определения, является ли каждое частичное изображение частичным изображением человеческого лица.
[0068] Получение множества частичных изображений изображения, подлежащего обработке, включает в себя, но без ограничения, следующие два способа.
[0069] Первый способ: обход изображения, подлежащего обработке, несколько раз с использованием скользящих окон, задание области изображения, покрытой скользящими окнами в каждой позиции каждого обхода как одно частичное изображение изображения, подлежащего обработке, причем скользящие окна, используемые в любых двух обходах, отличаются размерами.
[0070] Другими словами, согласно вариантам осуществления настоящего изобретения изображение, подлежащее обработке, обходят скользящими окнами разных размеров, соответственно. Размер скользящего окна, используемого каждый раз для обхода изображения, подлежащего обработке, может различаться. Например, для некоторого раза обхода изображения, подлежащего обработке, размер скользящего окна равен 3*3; тогда как для следующего раза обхода изображения, подлежащего обработке, размер скользящего окна равен 5*5, и т.д. На фиг. 5 показана схема обхода изображения, подлежащего обработке, с использованием скользящих окон разных размеров. Каждый квадрат, выполненный жирной линией на фиг. 5, представляет одно скользящее окно.
[0071] При обходе изображения, подлежащего обработке, с использованием скользящего окна любого размера, скользящее окно обходит изображение, подлежащее обработке, с заданным размером шага в горизонтальном направлении (направлении X) и вертикальном направлении (направлении Y) изображения, подлежащего обработке. Когда скользящее окно перемещается на один размер шага в направлении X или направлении Y, оно перемещается в новую позицию изображения, подлежащего обработке. Каждая позиция задает один диапазон изображения, который является частичным изображением изображения, подлежащего обработке. Заданным размером шага может быть один пиксель, два пикселя и т.п.
[0072] Второй способ: многократное масштабирование изображения, подлежащего обработке, для получения множества изображения, подлежащего обработке, разных размеров, обрезка изображения, подлежащего обработке, любого размера на множество областей изображения заданного размера и задание каждой области изображения как частичного изображения.
[0073] При каждом масштабировании изображения, подлежащего обработке, можно получить изображение, подлежащее обработке, одного определенного размера. Для изображения, подлежащего обработке, одного размера, изображение, подлежащее обработке, одного такого размера может быть обрезано на множество областей изображения. Каждая область изображения имеет заданный размер, например, 3*3 (пиксель*пиксель), 5*5 и т.п.
[0074] На фиг. 6 показана схема изображения, подлежащего обработке, разных размеров. На фиг. 6(a)-(c) показаны изображения, подлежащие обработке, некоторого размера, соответственно. На фиг. 6(c) показана схема обрезки изображения, подлежащего обработке, некоторого размера. Как показано на фиг. 6(c), каждый прямоугольник, обведенный жирной линией, является частичным изображением изображения, подлежащего обработке, определенного размера.
[0075] Дополнительно, принятие решения, является ли каждое частичное изображение частичным изображением человеческого лица, может осуществляться заранее обученным классификатором человеческих лиц. Тип заранее обученного классификатора человеческих лиц может различаться. Например, заранее обученный классификатор человеческих лиц может представлять собой классификатор человеческих лиц типа машины опорных векторов, классификатор человеческих лиц типа нейронной сети или классификатора человеческих лиц типа адаптивного усиления (Adaboost) и т.п. Для удобства описания, согласно вариантам осуществления настоящего изобретения, заранее обученный классификатор человеческих лиц, являющийся классификатором человеческих лиц Adaboost, используется в качестве примера для объяснения следующего этапа распознавания человеческого лица.
[0076] В возможной реализации для повышения точности распознавания человеческого лица, согласно вариантам осуществления настоящего изобретения, классификатор человеческих лиц Adaboost выполнен в виде каскада многостадийных классификаторов. Каждая стадия классификатора в классификаторе человеческих лиц Adaboost выполнена с возможностью принятия решения, является ли частичное изображение частичным изображением человеческого лица. Результат, выводимый из каждой стадии классификатора, равен ʺ0ʺ или ʺ1ʺ. Выходной результат ʺ1ʺ указывает, что стадия классификатора определяет, что частичное изображение является частичным изображением человеческого лица. Выходной результат ʺ0ʺ указывает, что стадия классификатора определяет, что частичное изображение не является частичным изображением человеческого лица.
[0077] Каждая стадия классификатора в классификаторе человеческих лиц Adaboost является сильным классификатором. Каждый сильный классификатор включает в себя множество слабых классификаторов. Обучение каждой стадии классификатора в классификаторе человеческих лиц Adaboost может осуществляться путем обучения множества слабых классификаторов, включенных в стадию классификатора. Результат, выводимый из стадии классификатора, определяется согласно обработке данных всех слабых классификаторов, включенных в стадию классификатора. В отношении способа обучения классификатора человеческих лиц Adaboost и способа определения результата, выводимого из каждой стадии классификатора, обратимся к существующему содержанию о классификаторе человеческих лиц Adaboost, которое не рассмотрено согласно вариантам осуществления настоящего изобретения.
[0078] Количество стадий классификаторов, включенных в классификатор человеческих лиц Adaboost, не имеет ограничений согласно вариантам осуществления настоящего изобретения. Для более точного распознавания классификатор человеческих лиц Adaboost может включать в себя гораздо больше стадий классификаторов, например, пять стадий классификаторов, восемь стадий классификаторов. На фиг. 7 показана схема классификатора человеческих лиц Adaboost. Каждая круглая область на фиг. 7 представляет одну стадию классификатора.
[0079] На этом основании при принятии решения, является ли каждое частичное изображение частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц, для любого частичного изображения, он обучается постадийно, начиная с первой стадии классификатора до последней стадии классификатора в заранее обученном классификаторе человеческих лиц Adaboost, так чтобы принимать решение, является ли частичное изображение частичным изображением человеческого лица. Если каждый из результатов, выводимых из всех стадий классификаторов, указывает, что частичное изображение является частичным изображением человеческого лица, частичное изображение определяется как частичное изображение человеческого лица. Если результат из любой стадии классификатора указывает, что частичное изображение не является частичным изображением человеческого лица, частичное изображение определяется как частичное изображение, не содержащее человеческого лица.
[0080] В частности, для любого частичного изображения частичное изображение вводится в классификатор человеческих лиц Adaboost из первой стадии классификатора, если первая стадия классификатора определяет, что частичное изображение является частичным изображением человеческого лица, частичное изображение вводится во вторую стадию классификатора, так что, вторая стадия классификатора решает, является ли частичное изображение частичным изображением человеческого лица, и т.д., до последней стадии классификатора. Если первая стадия классификатора определяет, что частичное изображение не является частичным изображением человеческого лица, первая стадия классификатора получает следующее частичное изображение для распознавания.
[0081] Следует отметить, что, на основании принципа работы заранее обученного классификатора человеческих лиц, если человеческое лицо располагается в краевой области исходного изображения, человеческое лицо, расположенное в краевой области, обычно не удается распознать. Однако человеческое лицо может правильно распознаваться, будучи экранированным. Согласно вариантам осуществления настоящего изобретения заданные числовые пиксели добавляются в краевую область исходного изображения, так что, человеческое лицо, расположенное в краевой области, эквивалентно экранированному добавленными пикселями, так что человеческое лицо, расположенное в краевой области, может быть распознано заранее обученным классификатором человеческих лиц, таким образом, повышается точность распознавания человеческого лица, расположенного в краевой области.
[0082] На этапе S204 человеческое лицо в исходном изображении определяется согласно результату распознавания человеческих лиц.
[0083] После распознавания, является ли каждое частичное изображение частичным изображением человеческого лица, частичное изображение, принадлежащее человеческому лицу, можно определять согласно результату распознавания человеческих лиц. Однако для определения, в какой области располагается человеческое лицо в исходном изображении, необходимо определять человеческое лицо в исходном изображении согласно частичному изображению, принадлежащему человеческому лицу.
[0084] Например, этап определения человеческого лица в исходном изображении согласно результату распознавания человеческих лиц включает в себя, но без ограничения: определение позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении, если частичное изображение, которое является частичным изображением человеческого лица, существует во множестве частичных изображений изображения, подлежащего обработке, и затем определение человеческого лица в исходном изображении согласно позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении.
[0085] В возможной реализации для любого частичного изображения распознавание которого указывает, что оно является частичным изображением человеческого лица, при получении позиции частичного изображения в исходном изображении, извлекается пиксельное значение каждого пикселя в частичном изображении, и извлекается пиксельное значение каждого пикселя в исходном изображении, и затем пиксельное значение каждого пикселя в частичном изображении сравнивается с пиксельным значением каждого пикселя в исходном изображении. Если пиксельное значение каждого пикселя в одной некоторой области исходного изображения равно пиксельному значению каждого пикселя в частичном изображении, позиция частичного изображения может располагаться в исходном изображении. После определения позиции частичного изображения в исходном изображении, можно определить человеческое лицо в исходном изображении.
[0086] Дополнительно, если частичное изображение, которое является частичным изображением человеческого лица, не существует во множестве частичных изображений изображения, подлежащего обработке, определяют, что исходное изображение не содержит человеческое лицо.
[0087] Согласно способу, обеспеченному вариантами осуществления настоящего изобретения, после получения изображения, подлежащего обработке, путем добавления заданных числовых пикселей в краевую область исходного изображения, распознавание человеческих лиц осуществляется на изображении, подлежащем обработке, для определения человеческого лица в исходном изображении. В ходе распознавания человеческих лиц в краевую область исходного изображения добавляются заданные числовые пиксели, что эквивалентно расширению исходного изображения, так что частичное изображение, содержащее человеческое лицо, может быть найдено в расширенном изображении, если человеческое лицо располагается в краевой области исходного изображения, и, таким образом, гарантируется, что человеческое лицо, расположенное в краевой области исходного изображения, может быть распознано, и дополнительно повышается точность распознавания человеческого лица.
[0088] На фиг. 8 показана блок-схема устройства распознавания человеческих лиц согласно иллюстративному варианту осуществления. Согласно фиг. 8, устройство распознавания человеческих лиц включает в себя модуль 801 получения, модуль 802 добавления, модуль 803 распознавания и модуль 804 определения.
[0089] Модуль 801 получения выполнен с возможностью получения исходного изображения.
[0090] Модуль 802 добавления выполнен с возможностью добавления заданных числовых пикселей в краевую область исходного изображения, полученного модулем 801 получения для получения изображения, подлежащего обработке.
[0091] Модуль 803 распознавания выполнен с возможностью осуществления распознавания человеческих лиц на изображении, подлежащем обработке, полученном модулем 802 добавления.
[0092] Модуль 804 определения выполнен с возможностью определения человеческого лица в исходном изображении согласно результату распознавания человеческих лиц от модуля 803 распознавания.
[0093] В устройстве, обеспеченном вариантами осуществления настоящего изобретения, после получения изображения, подлежащего обработке, путем добавления заданных числовых пикселей в краевую область исходного изображения, распознавание человеческих лиц осуществляется на изображении, подлежащем обработке, для определения человеческого лица в исходном изображении. В ходе распознавания человеческих лиц, в краевую область исходного изображения добавляются заданные числовые пиксели, что эквивалентно расширению исходного изображения, так что частичное изображение, содержащее человеческое лицо, может быть найдено в расширенном изображении, если человеческое лицо располагается в краевой области исходного изображения, и, таким образом, гарантируется, что человеческое лицо, расположенное в краевой области исходного изображения, может быть распознано, и дополнительно повышается точность распознавания человеческого лица.
[0094] В другом варианте осуществления согласно фиг. 9, модуль 802 добавления включает в себя первый блок 8021 получения, первый блок 8022 определения и блок 8023 добавления.
[0095] Первый блок 8021 получения выполнен с возможностью получения пиксельного значения каждого пикселя в краевой области исходного изображения.
[0096] Первый блок 8022 определения выполнен с возможностью определения краевой области, имеющей пиксель цвета лица, согласно пиксельному значению каждого пикселя в краевой области, полученному первым блоком 8021 получения и заранее установленному пиксельному значению для пикселя цвета лица.
[0097] Блок 8023 добавления выполнен с возможностью добавления заданных числовых пикселей в краевую область, имеющую пиксель цвета лица, определенный первым блоком 8022 определения.
[0098] В другом варианте осуществления согласно фиг. 10, модуль 803 распознавания включает в себя второй блок 8031 получения и блок 8032 принятия решения.
[0099] Второй блок 8031 получения выполнен с возможностью получения множества частичных изображений изображения, подлежащего обработке.
[00100] Блок 8032 принятия решения выполнен с возможностью принятия решения, является ли каждое частичное изображение, полученное вторым блоком 8031 получения, частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц.
[00101] В другом варианте осуществления второй блок 8031 получения выполнен с возможностью обхода изображения, подлежащего обработке, несколько раз с использованием скользящих окон и задания области изображения, покрытой скользящим окном, в каждой позиции каждого обхода как одного частичного изображения для изображения, подлежащего обработке, причем скользящие окна, используемые в любых двух обходах, отличаются размерами; или масштабирования изображения, подлежащего обработке, несколько раз для получения множества изображений, подлежащих обработке, разных размеров, обрезки изображения, подлежащего обработке, по размеру на множество областей изображения заданного размера, и задания каждой области изображения заданного размера как частичного изображения.
[00102] В другом варианте осуществления заранее обученный адаптивно усиленный классификатор человеческих лиц сформирован из множества каскадов многостадийных классификаторов, и блок 8032 принятия решения выполнен с возможностью: принятия решения, является ли частичное изображение частичным изображением человеческого лица, постадийно, начиная с первой стадии классификатора до последней стадии классификатора в заранее обученном адаптивно усиленном классификаторе человеческих лиц; и определения, что частичное изображение является частичным изображением человеческого лица, если каждый из результатов, выводимых из всех стадий классификаторов, указывает, что частичное изображение является частичным изображением человеческого лица.
[00103] В другом варианте осуществления согласно фиг. 11, модуль 804 определения включает в себя: второй блок 8041 определения и третий блок 8042 определения.
[00104] Второй блок 8041 определения выполнен с возможностью определения позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении, если во множестве частичных изображений изображения, подлежащего обработке, существует частичное изображение, которое является частичным изображением человеческого лица.
[00105] Третий блок 8042 определения выполнен с возможностью определения человеческого лица в исходном изображении согласно позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении.
[00106] В отношении устройства в вышеприведенных вариантах осуществления конкретные режимы осуществления операций для отдельных указанных здесь модулей были подробно описаны в вариантах осуществления, касающихся способа распознавания человеческих лиц, которые не будут здесь рассмотрены. Альтернативные варианты осуществления настоящего изобретения могут быть сформированы любым образом, путем объединения вышеописанных альтернативных технических решений, которые не будут здесь рассмотрены.
[00107] На фиг. 12 показана блок-схема терминала 1200 согласно иллюстративному варианту осуществления, а терминал выполнен с возможностью выполнения способа распознавания человеческих лиц, обеспеченного в вариантах осуществления, соответствующих фиг. 1 или 2. Например, терминалом 1200 может быть мобильный телефон, компьютер, терминал цифрового вещания, устройство обмена сообщениями, игровая консоль, планшет, медицинское устройство, оборудование для упражнений, карманный персональный компьютер и пр.
[00108] Согласно фиг. 12, терминал 1200 может включать в себя один или более из следующих компонентов: компонент 1202 обработки, память 1204, компонент 1206 питания, мультимедийный компонент 1208, аудиокомпонент 1210, интерфейс 1212 ввода/вывода (I/O), компонент 1214 датчика и компонент 1216 связи.
[00109] Компонент 1202 обработки обычно управляет общими операциями терминала 1200, например, операциями, связанными с дисплеем, телефонными вызовами, передачей данных, операциями камеры и операциями записи. Компонент 1202 обработки может включать в себя один или более процессоров 1220 для выполнения инструкций для осуществления всех или части этапов в вышеописанных способах. Кроме того, компонент 1202 обработки может включать в себя один или более модулей, которые облегчают взаимодействие между компонентом 1202 обработки и другим компонентам. Например, компонент 1202 обработки может включать в себя мультимедийный модуль для облегчения взаимодействия между мультимедийным компонентом 1208 и компонентом 1202 обработки.
[00110] Память 1204 выполнена с возможностью хранения различных типов данных для поддержки работы терминала 1200. Примеры таких данных включают в себя инструкции для любых приложений или способов, осуществляемых на терминале 1200, контактные данные, данные телефонной книги, сообщения, изображения, видео и т.д. Память 1204 может быть реализована с использованием любого типа энергозависимых или энергонезависимых запоминающих устройств, или их комбинации, например, статической оперативной памяти (SRAM), электрически стираемой программируемой постоянной памяти (EEPROM), стираемой программируемой постоянной памяти (EPROM), программируемой постоянной памяти (PROM), постоянной памяти (ROM), магнитной памяти, флэш-памяти, магнитного или оптического диска.
[00111] Компонент 1206 питания обеспечивает питание различных компонентов терминала 1200. Компонент 1206 питания может включать в себя систему администрирования мощности, один или более источников питания и любые другие компоненты, связанные с генерацией, администрированием и распределением мощности на терминале 1200.
[00112] Мультимедийный компонент 1208 включает в себя экран, обеспечивающий выходной интерфейс между терминалом 1200 и пользователем. В некоторых вариантах осуществления экран может включать в себя жидкокристаллический дисплей (LCD) и панель (TP) касания. Если экран включает в себя панель касания, экран может быть реализован как экран касания для приема входных сигналов от пользователя. Панель касания включает в себя один или более датчиков касания для считывания касаний, смахиваний и жестов на панели касания. Датчики касания могут не только считывать границу действия касания или смахивания, но и считывать период времени и давление, связанные с действием касания или смахивания. В некоторых вариантах осуществления мультимедийный компонент 1208 включает в себя переднюю камеру и/или заднюю камеру. Передняя камера и задняя камера могут принимать внешние мультимедийные данные, когда терминал 1200 находится в рабочем режиме, например, режиме фотографирования или режиме видеосъемки. Каждая из передней камеры и задней камеры может представлять собой фиксированную оптическую линзовую систему или иметь возможности фокусировки и оптического масштабирования.
[00113] Аудиокомпонент 1210 выполнен с возможностью вывода и/или ввода аудиосигналов. Например, аудиокомпонент 1210 включает в себя микрофон (ʺMICʺ), выполненный с возможностью приема внешнего аудиосигнала, когда терминал 1200 находится в рабочем режиме, например, режиме вызова, режиме записи и режиме распознавания речи. Принятый аудиосигнал может дополнительно сохраняться в памяти 1204 или передаваться через компонент 1216 связи. В некоторых вариантах осуществления аудиокомпонент 1210 дополнительно включает в себя громкоговоритель для вывода аудиосигналов.
[00114] Интерфейс 1212 ввода-вывода обеспечивает интерфейс между компонентом 1202 обработки и модулями периферийного интерфейса, например, клавиатурой, нажимным колесиком, кнопками и пр. Кнопки могут включать в себя, но без ограничения, кнопку возврата в главное меню, кнопку регулировки громкости, кнопку запуска и кнопку блокировки экрана.
[00115] Компонент 1214 датчика включает в себя один или более датчиков для обеспечения оценок статуса различных аспектов терминала 1200. Например, компонент 1214 датчика может обнаруживать открытый/закрытый статус терминала 1200, относительное расположение компонентов, например, дисплея и клавишной панели, терминала 1200, изменение положения терминала 1200 или компонента терминала 1200, наличие или отсутствие контакта пользователя с терминалом 1200, ориентацию или ускорение/замедление терминала 1200 и изменение температуры терминала 1200. Компонент 1214 датчика может включать в себя датчик близости, выполненный с возможностью обнаружения присутствия близлежащих объектов без какого-либо физического контакта. Компонент 1214 датчика также может включать в себя датчик света, например, датчик изображения на основе CMOS или CCD, для использования при формировании изображения приложения. В некоторых вариантах осуществления, компонент 1214 датчика также может включать в себя акселерометрический датчик, гироскопический датчик, магнитный датчик, датчик давления или датчик температуры.
[00116] Компонент 1216 связи выполнен с возможностью облегчения связи, проводной или беспроводной, между терминалом 1200 и другими устройствами. Терминал 1200 может осуществлять доступ к беспроводной сети на основе стандарта связи, например, WIFI, 2G или 3G, или их комбинации. В одном иллюстративном варианте осуществления компонент 1216 связи принимает широковещательный сигнал или широковещательную информацию от внешней широковещательной системы администрирования по широковещательному каналу. В одном иллюстративном варианте осуществления компонент 1216 связи дополнительно включает в себя модуль ближней бесконтактной связи (NFC) для облегчения связи ближнего действия. Например, модуль NFC может быть реализован на основе технологии радиочастотной идентификации (RFID), технологии ассоциации передачи данных в инфракрасном диапазоне (IrDA), технологии ультраширокополосной связи (UWB), технологии Bluetooth (BT) и других технологий.
[00117] В иллюстративных вариантах осуществления, терминал 1200 может быть реализован в виде одной или более специализированных интегральных схем (ASIC), цифровых сигнальных процессоров (DSP), устройств цифровой обработки сигнала (DSPD), программируемых логических устройств (PLD), вентильных матриц, программируемых пользователем (FPGA), контроллеров, микроконтроллеров, микропроцессоров или других электронных компонентов, для осуществления способа распознавания человеческих лиц, обеспеченного вариантами осуществления, соответствующими фиг. 1 и фиг. 2.
[00118] В иллюстративных вариантах осуществления, также обеспечен не временный компьютерно-считываемый носитель данных, включающий в себя инструкции, например память 1204, включающую в себя инструкции, причем инструкции могут исполняться процессором 1220 на терминале 1200, для осуществления вышеописанных способов. Например, не временный компьютерно-считываемый носитель данных может представлять собой ROM, RAM, CD-ROM, магнитную ленту, флоппи-диск, оптическое устройство хранения данных и пр.
[00119] Другие варианты осуществления изобретения будут очевидны специалистам в данной области техники из рассмотрения описания изобретения и практики раскрытого здесь изобретения. Данная заявка призвана охватывать любые разновидности, варианты использования или адаптации изобретения, отвечающие его общим принципам и включающие в себя такие отклонения от настоящего изобретения, которые явствуют из известной или обычной практики в уровне техники. Предполагается, что описание изобретения и примеры рассматриваются исключительно как иллюстративные, при том, что истинный объем и сущность изобретения указаны в нижеследующей формуле изобретения.
[00120] Очевидно, что настоящее изобретение не ограничивается конкретной конструкцией, которая была описана выше и проиллюстрирована в прилагаемых чертежах, и что возможны различные модификации и изменения, не выходящие за рамки его объема. Предполагается, что объем изобретения ограничивается только нижеследующей формулой изобретения.
Claims (53)
1. Способ распознавания человеческих лиц, содержащий этапы, на которых:
получают исходное изображение;
добавляют заданные числовые пиксели в краевую область исходного изображения для получения изображения, подлежащего обработке;
осуществляют распознавание человеческих лиц на изображении, подлежащем обработке,
причем осуществление распознавания человеческих лиц на изображении, подлежащем обработке, содержит этапы, на которых:
получают множество частичных изображений изображения, подлежащего обработке; и
принимают решение, является ли каждое частичное изображение частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц; и
определяют человеческое лицо в исходном изображении согласно результату распознавания человеческих лиц.
2. Способ по п. 1, в котором добавление заданных числовых пикселей в краевую область исходного изображения содержит этапы, на которых:
получают пиксельное значение каждого пикселя в краевой области исходного изображения;
определяют краевую область, имеющую пиксель цвета лица, согласно пиксельному значению каждого пикселя в краевой области и заранее установленному пиксельному значению для пикселя цвета лица; и
добавляют заданные числовые пиксели в краевую область, имеющую пиксель цвета лица.
3. Способ по п. 1, в котором получение множества частичных изображений изображения, подлежащего обработке, содержит этапы, на которых:
обходят изображение, подлежащее обработке, несколько раз с использованием скользящих окон и задают область изображения, покрытую скользящим окном, в каждой позиции каждого обхода как одно частичное изображение изображения, подлежащего обработке, причем скользящие окна, используемые в любых двух обходах, отличаются размерами; или
масштабируют изображение, подлежащее обработке, несколько раз для получения множества изображений, подлежащих обработке, разных размеров, обрезают изображение, подлежащее обработке, по размеру на множество областей изображения заданного размера, и задают каждую область изображения заданного размера как частичное изображение.
4. Способ по п. 1, в котором заранее обученный адаптивно усиленный классификатор человеческих лиц выполнен в виде каскада многостадийных классификаторов, и принятие решения, является ли каждое частичное изображение частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц содержит этапы, на которых:
принимают решение, является ли частичное изображение частичным изображением человеческого лица, постадийно, начиная с первой стадии классификатора до последней стадии классификатора в заранее обученном адаптивно усиленном классификаторе человеческих лиц; и
определяют, что частичное изображение является частичным изображением человеческого лица, если каждый из результатов, выводимых из всех стадий классификаторов, указывает, что частичное изображение является частичным изображением человеческого лица.
5. Способ по п. 1, в котором определение человеческого лица в исходном изображении согласно результату распознавания человеческих лиц содержит этапы, на которых:
определяют позицию частичного изображения, которое является частичным изображением человеческого лица в исходном изображении, если во множестве частичных изображений изображения, подлежащего обработке, существует частичное изображение, которое является частичным изображением человеческого лица; и
определяют человеческое лицо в исходном изображении согласно позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении.
6. Устройство распознавания человеческих лиц, содержащее:
модуль получения, выполненный с возможностью получения исходного изображения;
модуль добавления, выполненный с возможностью добавления заданных числовых пикселей в краевую область исходного изображения, полученного модулем получения, для получения изображения, подлежащего обработке;
модуль распознавания, выполненный с возможностью осуществления распознавания человеческих лиц на изображении, подлежащем обработке, полученном модулем добавления,
причем модуль распознавания содержит:
второй блок получения, выполненный с возможностью получения множества частичных изображений изображения, подлежащего обработке; и
блок принятия решения, выполненный с возможностью принятия решения, является ли каждое частичное изображение, полученное вторым блоком получения частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц; и
модуль определения, выполненный с возможностью определения человеческого лица в исходном изображении согласно результату распознавания человеческих лиц от модуля распознавания.
7. Устройство по п. 6, в котором модуль добавления содержит:
первый блок получения, выполненный с возможностью получения пиксельного значения каждого пикселя в краевой области исходного изображения;
первый блок определения, выполненный с возможностью определения краевой области, имеющей пиксель цвета лица, согласно пиксельному значению каждого пикселя в краевой области, полученному первым блоком получения и заранее установленному пиксельному значению для пикселя цвета лица; и
блок добавления, выполненный с возможностью добавления заданных числовых пикселей в краевую область, имеющую пиксель цвета лица, определенный первым блоком определения.
8. Устройство по п. 6, в котором второй блок получения выполнен с возможностью:
обхода изображения, подлежащего обработке, несколько раз с использованием скользящих окон и задания области изображения, покрытой скользящим окном, в каждой позиции каждого обхода как одного частичного изображения для изображения, подлежащего обработке, причем скользящие окна, используемые в любых двух обходах, отличаются размерами; или
масштабирования изображения, подлежащего обработке, несколько раз для получения множества изображений, подлежащих обработке, разных размеров, обрезки изображения, подлежащего обработке, по размеру на множество областей изображения заданного размера, и задания каждой области изображения заданного размера как частичного изображения.
9. Устройство по п. 6, в котором заранее обученный адаптивно усиленный классификатор человеческих лиц выполнен в виде каскада многостадийных классификаторов, и блок принятия решения выполнен с возможностью:
принятия решения, является ли частичное изображение частичным изображением человеческого лица, постадийно, начиная с первой стадии классификатора до последней стадии классификатора в заранее обученном адаптивно усиленном классификаторе человеческих лиц; и
определения, что частичное изображение является частичным изображением человеческого лица, если каждый из результатов, выводимых из всех стадий классификаторов, указывает, что частичное изображение является частичным изображением человеческого лица.
10. Устройство по п. 6, в котором модуль определения содержит:
второй блок определения, выполненный с возможностью определения позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении, если во множестве частичных изображений изображения, подлежащего обработке, существует частичное изображение, которое является частичным изображением человеческого лица; и
третий блок определения, выполненный с возможностью определения человеческого лица в исходном изображении согласно позиции частичного изображения, которое является частичным изображением человеческого лица в исходном изображении.
11. Терминал, содержащий:
процессор; и
память для хранения инструкций, исполняемых процессором;
причем процессор выполнен с возможностью:
получать исходное изображение;
добавлять заданные числовые пиксели в краевую область исходного изображения для получения изображения, подлежащего обработке;
осуществлять распознавание человеческих лиц на изображении, подлежащем обработке,
причем осуществление распознавания человеческих лиц на изображении, подлежащем обработке, содержит этапы, на которых:
получают множество частичных изображений изображения, подлежащего обработке; и
принимают решение, является ли каждое частичное изображение частичным изображением человеческого лица, с использованием заранее обученного адаптивно усиленного классификатора человеческих лиц; и
определяют человеческое лицо в исходном изображении согласно результату распознавания человеческих лиц.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510520457.X | 2015-08-21 | ||
CN201510520457.XA CN105095881B (zh) | 2015-08-21 | 2015-08-21 | 人脸识别方法、装置及终端 |
PCT/CN2015/099696 WO2017031901A1 (zh) | 2015-08-21 | 2015-12-30 | 人脸识别方法、装置及终端 |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2017102521A RU2017102521A (ru) | 2018-07-26 |
RU2017102521A3 RU2017102521A3 (ru) | 2018-07-26 |
RU2664688C2 true RU2664688C2 (ru) | 2018-08-21 |
Family
ID=54576269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017102521A RU2664688C2 (ru) | 2015-08-21 | 2015-12-30 | Способ распознавания человеческих лиц, устройство и терминал |
Country Status (8)
Country | Link |
---|---|
US (1) | US10007841B2 (ru) |
EP (1) | EP3133527A1 (ru) |
JP (1) | JP6374986B2 (ru) |
KR (1) | KR20170033805A (ru) |
CN (1) | CN105095881B (ru) |
MX (1) | MX2017008481A (ru) |
RU (1) | RU2664688C2 (ru) |
WO (1) | WO2017031901A1 (ru) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9286509B1 (en) * | 2012-10-19 | 2016-03-15 | Google Inc. | Image optimization during facial recognition |
CN105095881B (zh) * | 2015-08-21 | 2023-04-07 | 小米科技有限责任公司 | 人脸识别方法、装置及终端 |
EP3136289A1 (en) * | 2015-08-28 | 2017-03-01 | Thomson Licensing | Method and device for classifying an object of an image and corresponding computer program product and computer-readable medium |
CN106485567B (zh) * | 2016-09-14 | 2021-11-30 | 北京小米移动软件有限公司 | 物品推荐方法及装置 |
CN106372616B (zh) * | 2016-09-18 | 2019-08-30 | Oppo广东移动通信有限公司 | 人脸识别方法、装置及终端设备 |
CN106446884A (zh) * | 2016-09-19 | 2017-02-22 | 广东小天才科技有限公司 | 一种图像的快速截取的方法和装置 |
US10474881B2 (en) * | 2017-03-15 | 2019-11-12 | Nec Corporation | Video retrieval system based on larger pose face frontalization |
CN108280420A (zh) * | 2018-01-19 | 2018-07-13 | 百度在线网络技术(北京)有限公司 | 用于处理图像的系统、方法和装置 |
CN109492550B (zh) * | 2018-10-25 | 2023-06-06 | 腾讯科技(深圳)有限公司 | 活体检测方法、装置及应用活体检测方法的相关系统 |
US10650564B1 (en) * | 2019-04-21 | 2020-05-12 | XRSpace CO., LTD. | Method of generating 3D facial model for an avatar and related device |
CN110401835B (zh) * | 2019-06-05 | 2021-07-02 | 西安万像电子科技有限公司 | 图像处理方法及装置 |
CN110248107A (zh) * | 2019-06-13 | 2019-09-17 | Oppo广东移动通信有限公司 | 图像处理方法和装置 |
CN110533002B (zh) * | 2019-09-06 | 2022-04-12 | 厦门久凌创新科技有限公司 | 基于人脸识别的大数据处理方法 |
JP2022522551A (ja) * | 2020-02-03 | 2022-04-20 | ベイジン センスタイム テクノロジー ディベロップメント カンパニー リミテッド | 画像処理方法及び装置、電子機器並びに記憶媒体 |
CN112132030B (zh) * | 2020-09-23 | 2024-05-28 | 湖南快乐阳光互动娱乐传媒有限公司 | 视频处理方法及装置、存储介质及电子设备 |
CN112966136B (zh) * | 2021-05-18 | 2021-09-07 | 武汉中科通达高新技术股份有限公司 | 一种人脸分类方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2295152C1 (ru) * | 2005-09-15 | 2007-03-10 | Роман Павлович Худеев | Способ распознавания лица человека по видеоизображению |
US20070274573A1 (en) * | 2006-05-26 | 2007-11-29 | Canon Kabushiki Kaisha | Image processing method and image processing apparatus |
CN101488181A (zh) * | 2008-01-15 | 2009-07-22 | 华晶科技股份有限公司 | 多方向的人脸检测方法 |
CN102096802A (zh) * | 2009-12-11 | 2011-06-15 | 华为技术有限公司 | 人脸检测方法及装置 |
CN102270308A (zh) * | 2011-07-21 | 2011-12-07 | 武汉大学 | 一种基于五官相关aam模型的面部特征定位方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4551839B2 (ja) * | 2004-08-16 | 2010-09-29 | キヤノン株式会社 | 撮像装置及び撮像装置の制御方法 |
US7430369B2 (en) | 2004-08-16 | 2008-09-30 | Canon Kabushiki Kaisha | Image capture apparatus and control method therefor |
JP2008181439A (ja) * | 2007-01-26 | 2008-08-07 | Sanyo Electric Co Ltd | 顔検出装置及び方法並びに撮像装置 |
KR100973588B1 (ko) | 2008-02-04 | 2010-08-02 | 한국과학기술원 | 얼굴검출기의 부윈도우 설정방법 |
KR101105435B1 (ko) | 2009-04-14 | 2012-01-17 | 경북대학교 산학협력단 | 얼굴 검출과 얼굴 인지 방법 |
US9042599B2 (en) * | 2010-07-02 | 2015-05-26 | Intel Corporation | Techniques for face detection and tracking |
AU2013205535B2 (en) * | 2012-05-02 | 2018-03-15 | Samsung Electronics Co., Ltd. | Apparatus and method of controlling mobile terminal based on analysis of user's face |
CN105095881B (zh) * | 2015-08-21 | 2023-04-07 | 小米科技有限责任公司 | 人脸识别方法、装置及终端 |
-
2015
- 2015-08-21 CN CN201510520457.XA patent/CN105095881B/zh active Active
- 2015-12-30 JP JP2016567408A patent/JP6374986B2/ja active Active
- 2015-12-30 RU RU2017102521A patent/RU2664688C2/ru active
- 2015-12-30 WO PCT/CN2015/099696 patent/WO2017031901A1/zh active Application Filing
- 2015-12-30 MX MX2017008481A patent/MX2017008481A/es unknown
- 2015-12-30 KR KR1020167015669A patent/KR20170033805A/ko active Search and Examination
-
2016
- 2016-06-14 EP EP16174462.8A patent/EP3133527A1/en not_active Ceased
- 2016-06-28 US US15/195,368 patent/US10007841B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2295152C1 (ru) * | 2005-09-15 | 2007-03-10 | Роман Павлович Худеев | Способ распознавания лица человека по видеоизображению |
US20070274573A1 (en) * | 2006-05-26 | 2007-11-29 | Canon Kabushiki Kaisha | Image processing method and image processing apparatus |
CN101488181A (zh) * | 2008-01-15 | 2009-07-22 | 华晶科技股份有限公司 | 多方向的人脸检测方法 |
CN102096802A (zh) * | 2009-12-11 | 2011-06-15 | 华为技术有限公司 | 人脸检测方法及装置 |
CN102270308A (zh) * | 2011-07-21 | 2011-12-07 | 武汉大学 | 一种基于五官相关aam模型的面部特征定位方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105095881A (zh) | 2015-11-25 |
EP3133527A1 (en) | 2017-02-22 |
RU2017102521A (ru) | 2018-07-26 |
US10007841B2 (en) | 2018-06-26 |
KR20170033805A (ko) | 2017-03-27 |
RU2017102521A3 (ru) | 2018-07-26 |
CN105095881B (zh) | 2023-04-07 |
US20170053156A1 (en) | 2017-02-23 |
WO2017031901A1 (zh) | 2017-03-02 |
MX2017008481A (es) | 2017-10-31 |
JP6374986B2 (ja) | 2018-08-15 |
JP2017534090A (ja) | 2017-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2664688C2 (ru) | Способ распознавания человеческих лиц, устройство и терминал | |
US10284773B2 (en) | Method and apparatus for preventing photograph from being shielded | |
JP6392468B2 (ja) | 領域認識方法及び装置 | |
US9674395B2 (en) | Methods and apparatuses for generating photograph | |
WO2017071064A1 (zh) | 区域提取方法、模型训练方法及装置 | |
EP2998960B1 (en) | Method and device for video browsing | |
US9924090B2 (en) | Method and device for acquiring iris image | |
CN105631803B (zh) | 滤镜处理的方法和装置 | |
US10402619B2 (en) | Method and apparatus for detecting pressure | |
US20180165802A1 (en) | Image processing method and apparatus, and storage medium | |
US11403789B2 (en) | Method and electronic device for processing images | |
US11216075B2 (en) | Method, apparatus and device for triggering shooting mode, and storage medium | |
RU2632578C2 (ru) | Способ и устройство выделения характеристики | |
WO2022095860A1 (zh) | 指甲特效的添加方法及装置 | |
EP3974953A1 (en) | Icon position determination method and device | |
US10438377B2 (en) | Method and device for processing a page | |
US10068151B2 (en) | Method, device and computer-readable medium for enhancing readability | |
CN112784858B (zh) | 一种图像数据的处理方法、装置及电子设备 | |
CN114648802B (zh) | 用户面部表情识别方法、装置和设备 |