KR101144158B1 - 모바일 장치에서의 립리딩을 위한 입술영역 결정방법. - Google Patents
모바일 장치에서의 립리딩을 위한 입술영역 결정방법. Download PDFInfo
- Publication number
- KR101144158B1 KR101144158B1 KR1020100130816A KR20100130816A KR101144158B1 KR 101144158 B1 KR101144158 B1 KR 101144158B1 KR 1020100130816 A KR1020100130816 A KR 1020100130816A KR 20100130816 A KR20100130816 A KR 20100130816A KR 101144158 B1 KR101144158 B1 KR 101144158B1
- Authority
- KR
- South Korea
- Prior art keywords
- reliability
- lip
- candidate
- candidate object
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/60—Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2 내지 도 5는 본 발명의 일실시예에 따른 입술영역 결정방법의 제 2단계의 과정 내지 제 5단계의 과정을 나타내는 블럭도.
도 6 내지 도 10은 본 발명의 일실시예에 따른 제 1신뢰도 함수 내지 제 5신뢰도 함수를 그래프로 나타내는 도면.
Claims (15)
- 입술영상을 분석하여 화자의 입술 움직임을 인식하는 립리딩(lipreading) 시 상기 입술영상 내에서 입술영역을 결정하기 위한 입술영역 결정방법에 있어서,
상기 입술영상 중, RGB 색상값이 유사한 픽셀들을 집단화(clustering)하여 분할함으로써, 제 1후보객체들을 생성하는 제 1단계;
상기 각 제 1후보객체의 픽셀들의 그레이 평균값이 임계값 이상인 제 2후보객체들을 추출하고, 기준이 되는 기준입술영상과의 유사도를 수치화한 신뢰도 함수를 이용하여 상기 제 2후보객체들 중 임계 신뢰도 이하의 제 3후보객체들을 제거하는 제 2단계;
상기 제 2후보객체들의 픽셀들 중 임계 Y축 좌표값 이외의 Y축 좌표값을 갖는 픽셀들을 제거하고, 상기 집단화를 재수행하여 제 4후보객체들을 추출하는 제 3단계;
상기 신뢰도 함수를 이용하여 상기 제 4후보객체들의 신뢰도를 계산하고, 상기 제 4후보객체들 중 가장 높은 신뢰도를 갖는 제 5후보객체를 상기 입술영역으로 결정하는 제 4단계;를 포함하며,
상기 신뢰도 함수는, 상기 입술영상의 폭 및 높이와, 상기 각 후보객체의 폭, 높이, 기울기, 상기 입술영상의 X축 상에서 상기 각 후보객체의 최소 및 최대 X축 좌표값들이 연결된 수평축 및 상기 입술영상의 Y축 상에서 상기 각 후보객체의 최소 및 최대 Y축 좌표값들이 연결된 선인 수직축을 변수로 하여, 상기 후보객체가 상기 화자의 입술과 유사한 정도를 상기 신뢰도로 수치화한 것이며,
상기 후보객체의 폭(LW)과, 상기 입술영상의 폭(W)이 이루는 비율을 계산하여 제 1신뢰도를 산출하는 제 1신뢰도 함수;
상기 후보객체의 높이(LH)와, 상기 후보객체의 폭(LW)이 이루는 비율을 계산하여 제 2신뢰도를 산출하는 제 2신뢰도 함수;
상기 후보객체가 갖는 기울기(LD)을 계산하여 제 3신뢰도를 산출하는 제 3신뢰도 함수;
상기 후보객체의 수평축(LX) 및 상기 입술영상의 폭(W)이 이루는 비율을 계산하여 제 4신뢰도를 산출하는 제 4신뢰도 함수; 및
상기 후보객체의 수직축(LY) 및 상기 입술영상의 높이(H)가 이루는 비율을 계산하여 제 5신뢰도를 산출하는 제 5신뢰도 함수;를 포함하며,
상기 제 1신뢰도, 제 2신뢰도, 제 3신뢰도, 제 4신뢰도 및 제 5신뢰도을 모두 곱한 값을 상기 신뢰도로 계산하는 것을 특징으로 하는 입술영역 결정방법.
- 제 1항에 있어서,
상기 제 1단계 이전에, 상기 입술영상을 좌측 입술영상과, 우측 입술영상으로 세로로 분리하는 제 A단계;를 더 포함하고,
상기 제 1단계의 집단화는 상기 좌측 입술영상 및 상기 우측 입술영상에 대해 각각 수행되는 것을 특징으로 하는 입술영역 결정방법.
- 제 1항 또는 제 2항에 있어서,
상기 집단화는, K-평균 집단화 알고리즘(k-means clustering algorithm)을 이용한 것을 특징으로 하는 입술영역 결정방법.
- 제 1항에 있어서,
상기 임계 Y축 좌표값은, 평균적인 화자의 눈과 입술과의 거리를 기반으로 선택되는 것을 특징으로 하는 입술영역 결정방법.
- 제 2항에 있어서,
상기 제 1단계:는
상기 좌, 우측 입술영상의 각 픽셀의 RGB 색상값으로 이루어지는 색상 벡터를 산출하는 1-1단계; 및
상기 색상 벡터를 이용하여, 집단화하여 상기 제 1후보객체들로 분할하는 제 1-2단계;를 더 포함하는 것을 특징으로 하는 입술영역 결정방법.
- 제 1항에 있어서,
상기 제 2단계:는
상기 제 1후보객체들을 그레이 영상으로 변환하고, 상기 각 그레이 영상의 픽셀들의 상기 그레이 평균값을 계산하는 제 2-1단계;
상기 제 1후보객체들 중 상기 그레이 평균값이 상기 임계값 이상인 상기 제 2후보객체를 추출하는 제 2-2단계; 및
상기 신뢰도 함수를 이용하여, 상기 제 2후보객체들 중 임계 신뢰도 이하의 제 3후보객체들을 제거하는 제 2-3단계;를 더 포함하는 것을 특징으로 하는 입술영역 결정방법.
- 제 1항에 있어서,
상기 제 3단계:는
평균적인 화자의 눈과 입술과의 거리를 기반으로 상기 임계 Y축 좌표값의 범위를 산출하는 제 3-1단계;
상기 제 2후보객체의 픽셀들 중 상기 임계 Y축 좌표값 이외의 상기 Y축 좌표값을 갖는 픽셀들을 제거하는 제 3-2단계; 및
상기 제 2후보객체들의 각 픽셀을 대상으로 상기 집단화를 재수행하여, 상기 제 4후보객체들을 추출하는 제 3-3단계;를 더 포함하는 것을 특징으로 하는 입술영역 결정방법.
- 제 1항에 있어서,
상기 제 4단계:는
상기 신뢰도 함수를 상기 제 4후보객체들에 적용하여, 상기 제 5후보객체를 선정하는 제 4-1단계;
상기 제 5후보객체의 수평길이를 계산하고, 상기 수평길이의 중심점의 좌표값을 획득하는 제 4-2단계; 및
상기 중심점을 중심으로 하고 상기 수평길이를 상변 및 하변의 길이로 하며 일정한 높이를 갖는 사각형 영역을 설정하여, 상기 사각형 영역을 상기 입술영역으로 결정하는 제 4-3단계;를 더 포함하는 것을 특징으로 하는 입술영역 결정방법.
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100130816A KR101144158B1 (ko) | 2010-12-20 | 2010-12-20 | 모바일 장치에서의 립리딩을 위한 입술영역 결정방법. |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100130816A KR101144158B1 (ko) | 2010-12-20 | 2010-12-20 | 모바일 장치에서의 립리딩을 위한 입술영역 결정방법. |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101144158B1 true KR101144158B1 (ko) | 2012-05-10 |
Family
ID=46271760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100130816A Expired - Fee Related KR101144158B1 (ko) | 2010-12-20 | 2010-12-20 | 모바일 장치에서의 립리딩을 위한 입술영역 결정방법. |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101144158B1 (ko) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073937A (zh) * | 2016-11-18 | 2018-05-25 | 北京体基科技有限公司 | 一种在图像中识别手部区域的方法及装置 |
CN108073882A (zh) * | 2016-11-18 | 2018-05-25 | 北京体基科技有限公司 | 基于连通路径的手部区域识别方法及装置 |
CN108073935A (zh) * | 2016-11-18 | 2018-05-25 | 北京体基科技有限公司 | 基于临近像素和连通路径识别手部区域的方法及装置 |
CN108073872A (zh) * | 2016-11-18 | 2018-05-25 | 北京体基科技有限公司 | 基于像素间相似度的手部区域识别方法及装置 |
KR101894422B1 (ko) * | 2018-02-14 | 2018-09-04 | 김성환 | 입술 인식 모바일 컨트롤 단말기 |
KR20230111889A (ko) | 2022-01-19 | 2023-07-26 | 주식회사 인포다이스 | 인공지능에 의한 독순술을 이용하여 발화자의 언어 및 국적을 식별하는 시스템 및 방법 |
-
2010
- 2010-12-20 KR KR1020100130816A patent/KR101144158B1/ko not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
류동엽, 임영환, 윤선희, 서정민, 이창훈, 이근수, 이상문, "얼굴 분석과 유사도 비교를 이용한 사용자 인증 시스템", 멀티미디어학회 논문지, vol.8, no.11, pp.1439-1448, 2005년 11월. * |
송민규, Thanh Trung Pham, 김진영, 황성택, "모바일 환경에서의 시각 음성인식을 위한 눈 정위 기반 입술 탐지에 대한 연구", 한국지능시스템학회 논문지, vol.19, no.4, pp.478-484, 2009년 8월. * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073937A (zh) * | 2016-11-18 | 2018-05-25 | 北京体基科技有限公司 | 一种在图像中识别手部区域的方法及装置 |
CN108073882A (zh) * | 2016-11-18 | 2018-05-25 | 北京体基科技有限公司 | 基于连通路径的手部区域识别方法及装置 |
CN108073935A (zh) * | 2016-11-18 | 2018-05-25 | 北京体基科技有限公司 | 基于临近像素和连通路径识别手部区域的方法及装置 |
CN108073872A (zh) * | 2016-11-18 | 2018-05-25 | 北京体基科技有限公司 | 基于像素间相似度的手部区域识别方法及装置 |
KR101894422B1 (ko) * | 2018-02-14 | 2018-09-04 | 김성환 | 입술 인식 모바일 컨트롤 단말기 |
KR20230111889A (ko) | 2022-01-19 | 2023-07-26 | 주식회사 인포다이스 | 인공지능에 의한 독순술을 이용하여 발화자의 언어 및 국적을 식별하는 시스템 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11450146B2 (en) | Gesture recognition method, apparatus, and device | |
CN113012185B (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
US9483835B2 (en) | Depth value restoration method and system | |
KR101144158B1 (ko) | 모바일 장치에서의 립리딩을 위한 입술영역 결정방법. | |
KR100559471B1 (ko) | 대칭축을 이용한 얼굴 검출 시스템 및 방법 | |
US10319096B2 (en) | Automated tattoo recognition techniques | |
CN104834912B (zh) | 一种基于图像信息检测的天气识别方法及装置 | |
WO2019174276A1 (zh) | 用于定位目标物体区域中心的图像处理方法、装置、设备和介质 | |
US8938117B2 (en) | Pattern recognition apparatus and method therefor configured to recognize object and another lower-order object | |
WO2021135500A1 (zh) | 车损检测模型训练、车损检测方法、装置、设备及介质 | |
US10380853B1 (en) | Presence detection and detection localization | |
EP2980755A1 (en) | Method for partitioning area, and inspection device | |
CN106537416B (zh) | 图像处理装置、文字识别装置、图像处理方法及存储介质 | |
US8290277B2 (en) | Method and apparatus for setting a lip region for lip reading | |
JP2010217954A (ja) | 画像処理装置および方法、学習装置および方法、並びに、プログラム | |
CN112037185A (zh) | 染色体分裂相图像筛选方法、装置及终端设备 | |
KR102579994B1 (ko) | 다중 배경 모델을 이용한 전경 생성 방법 및 그 장치 | |
Lee et al. | Blurred image region detection and segmentation | |
CN112818952A (zh) | 煤岩分界线的识别方法、装置及电子设备 | |
JP4639754B2 (ja) | 画像処理装置 | |
JP2013196136A (ja) | 画像処理装置、及び画像処理方法 | |
JP2015204023A (ja) | 被写体検出装置、被写体検出方法及びプログラム | |
KR100680278B1 (ko) | 입술모양 추출방법 및 그 장치 | |
CN107368832A (zh) | 基于图像的目标检测及分类方法 | |
KR100703528B1 (ko) | 영상 인식 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20101220 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20120131 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20120420 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20120502 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20120503 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20160405 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20160405 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170427 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20170427 Start annual number: 6 End annual number: 6 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20190213 |