CN106570369A - 视频身分确认装置与方法 - Google Patents
视频身分确认装置与方法 Download PDFInfo
- Publication number
- CN106570369A CN106570369A CN201510880332.8A CN201510880332A CN106570369A CN 106570369 A CN106570369 A CN 106570369A CN 201510880332 A CN201510880332 A CN 201510880332A CN 106570369 A CN106570369 A CN 106570369A
- Authority
- CN
- China
- Prior art keywords
- dynamic reminding
- data
- video image
- video
- screen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000005540 biological transmission Effects 0.000 claims abstract description 4
- 241000219739 Lens Species 0.000 claims description 39
- 210000000695 crystalline len Anatomy 0.000 claims description 39
- 238000012790 confirmation Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 8
- 230000000052 comparative effect Effects 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 238000012795 verification Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 210000003128 head Anatomy 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- VIKNJXKGJWUCNN-XGXHKTLJSA-N norethisterone Chemical compound O=C1CC[C@@H]2[C@H]3CC[C@](C)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 VIKNJXKGJWUCNN-XGXHKTLJSA-N 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 206010011469 Crying Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000005242 forging Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003760 hair shine Effects 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4014—Identity check for transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/48—Matching video sequences
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07F—COIN-FREED OR LIKE APPARATUS
- G07F19/00—Complete banking systems; Coded card-freed arrangements adapted for dispensing or receiving monies or the like and posting such transactions to existing accounts, e.g. automatic teller machines
- G07F19/20—Automatic teller machines [ATMs]
- G07F19/207—Surveillance aspects at ATMs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/4223—Cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/441—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
- H04N21/4415—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Accounting & Taxation (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Studio Devices (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种视频身分确认装置与方法。所述装置包含一或多个处理器、一摄影镜头、一麦克风、一屏幕、一数据传送模块、一动态提示模块、一视频影像录制模块及一语音识别模块。所述动态提示模块,以随机方式产生一动态提示,或透过所述数据传送模块接收由所述服务器所产生的所述动态提示;所述视频影像录制模块,利用所述摄影镜头拍摄一用户的一视频影像,并开启所述麦克风以将收音录制至所述视频影像的一音轨,录制后所述视频影像存储至所述内存;所述语音识别模块将所述麦克风的收音辨识结果的数据与所述动态提示的数据进行比较。
Description
技术领域
本发明涉及身分确认技术,尤其涉及一种视频身分确认装置与方法。
背景技术
为因应移动通信、社群媒体、大数据、云端科技等资通信技术的进步,金融服务势必顺应时代潮流、配合信息发展,以提升消费者便利性,因此推动“打造数字化金融环境3.0”计划,并自2015年全面启动。中国台湾证券交易所为此配合修正相关规章并公告开放,以提升证券商服务效能政策,证券商得采足以确认申请人为本人,及其意思表示的通信或电子化方式,办理新客户采非当面开户及相关配套措施。中国台湾证券交易所指出,当证券商提供电子化金融服务受理非当面开户时,得采以下方式确认委托人身分:一、以委由往来交割银行确认委托人身分;二、委托人检附律师、会计师等专业人士证明文件正本,经函证确认;三、采通信开户及视频方式,经访视确认;四、其他足以确认委托人身分为本人。
有鉴于上述开放的确认身分方法,相关业者(如证券商及金融信息厂商)提出的因应技术方法(下称现有技术)包含下列步骤:一、于移动装置(例如智能型手机或平板计算机)安装特定APP (即,应用程序)并执行;二、选择交割银行、输入银行账号、拍摄银行存折并上传至服务器;三、填写个人基本数据;拍摄身分证件并上传至服务器;四、拍摄大头照或以视频验证,以进行身分验证;五、下载电子凭证。其中,现有技术的第四步骤,是以手机拍摄静态的大头照,或是以手机拍摄动态的视频影像(Video),上传至服务器后再由券商人员进行审核作业,然而,现有技术有容易造假的缺失,例如:假冒者以手机翻拍他人的大头照,甚至翻拍另一支手机所播放的他人视频影像,而非拍摄自己。
上述现有技术防堵假冒大头照/视频的唯一关键在于后台的审核人员,然而,当人工审核的作业大量时恐有漏网之鱼,另外,由于伪造技术的进步致使翻拍的破绽不易被认出,意即,现有技术所提供的身分验证并无法满足金融业者的需求,故,实有必要改善现有技术硬件与软件协同运作的资源以提出一种视频身分确认的技术,藉由防止翻拍大头照/视频的技术杜绝假冒身分进行开户,以便弥补现有技术不足之处。
发明内容
有鉴于此,本发明的主要目的在于提供一种视频身分确认装置与方法,利用摄影镜头以及屏幕的动态提示录制影像,以进行身分验证,防止翻拍。
为达到上述目的,本发明的技术方案是这样实现的:
一种视频身分确认装置,所述装置包含:一摄影镜头,拍摄一用户的一视频影像;一麦克风,用以收音;一内存,存储所述视频影像及一麦克风的收音;一屏幕,用以显示一动态提示;一数据传送模块,与一服务器建立连接以传送数据;一动态提示模块,以随机方式产生所述动态提示,或透过所述数据传送模块接收由所述服务器所产生的所述动态提示;一视频影像录制模块,利用所述摄影镜头拍摄所述用户的所述视频影像,并开启所述麦克风以将所述麦克风的收音录制至所述视频影像的一音轨,录制后将所述视频影像存储至所述内存;一处理器,连接所述摄影镜头、所述麦克风、所述内存与所述屏幕;及,一语音识别模块,将所述麦克风的收音以一语音识别引擎转换成一可比对数据,并将所述可比对数据与所述动态提示的数据进行比较,其中,当两者比较吻合时即完成录制所述视频影像,当两者比较不吻合时所述屏幕则显示一重新语音识别提示;其中,所述处理器根据一启动验证指令以显示所述动态提示于所述屏幕并以所述摄影镜头与所述麦克风录制所述视频影像,所述语音识别模块于录制所述视频影像时实时进行比较,以及,所述处理器根据一上传指令驱动所述数据传送模块将经比较吻合的所述视频影像上传至所述服务器。其中,所述摄影镜头与所述屏幕设置于同一面,录制后所上传至所述服务器的所述视频影像包含所述用户依据所述动态提示所录制的所述麦克风的收音。
一种视频身分确认方法,应用于一装置,所述装置包含一摄影镜头、一麦克风及一屏幕,所述方法包含:接收一启动验证指令;由一动态提示模块随机产生一动态提示,或是接收一服务器所传送的所述动态提示;将所述动态提示显示于所述屏幕;一用户念出所述屏幕所显示的所述动态提示时,同时以所述摄影镜头与所述麦克风录制所述用户的一视频影像,所述视频影像包含一音轨,所述音轨记录所述麦克风的收音;将所述麦克风的收音转换成一可比对数据;将所述可比对数据与所述动态提示的数据进行比较,当比较吻合时即完成录制所述视频影像,当比较不吻合时于所述屏幕显示一重新语音识别提示;以及,上传经比较吻合的所述视频影像至所述服务器。
附图说明
图1为本发明实施例装置的系统功能方块图;
图2为本发明实施例应用程序的系统功能方块图;
图3为本发明实施例的屏幕显示动态提示示意图(一);
图4为本发明实施例的屏幕显示动态提示示意图(二);
图5为本发明实施例的屏幕显示动态提示示意图(三);
图6为本发明实施例的屏幕显示动态提示示意图(四);
图7为本发明实施例的屏幕显示动态提示示意图(五);
图8为本发明实施例的屏幕显示动态提示示意图(六);及
图9为本发明实施例的操作流程图。
【主要组件符号说明】
10:视频身分确认装置
12:处理器
14:内存
16:摄影镜头
18:麦克风
20:屏幕
22:通信模块
24:应用程序
26:数据传送模块
28:动态提示模块
30:视频影像录制模块
32:语音识别模块
34:动态提示
36:用户影像。
具体实施方式
下面结合附图及本发明的实施例对本发明的视频身分确认装置与方法作进一步详细的说明。
本发明是使用但不限于个人计算机(PC)、笔记本电脑(Laptop/Notebook/Portable
Computer)、智慧手机(Smartphone)、平板计算机(Tablet
PC)等,凡是配置有屏幕、麦克风以及摄影镜头的装置都可以应用本发明装置与方法,其中,摄影镜头须与屏幕设置于同一侧并面向用户(Facing the User),以利用户一边念出屏幕上的动态提示、一边录制视频影像,例如:笔记本电脑、智能手机与平板计算机的前置镜头(Front-Facing Camera)即与屏幕设置于同一面,或是,将网络视频镜头(Webcam)架设在屏幕上的个人计算机等。至于本发明所谓的摄影镜头,即,具有镜头(Lens)可拍摄动态影像并经由软件与硬件控制而录制成视频影像(Video)的设备,其同义说法包含:摄影镜头、视频镜头、摄像头、网络视频镜头、Camcorder、Video
Cam、Webcam等。
参阅图1,本发明装置10的系统功能方块图,图例仅列出与本发明一较佳实施例相关的核心模块,其余模块省略未描绘。应用程序24是执行于本发明的视频身分确认装置10上。在本发明的一种实施例,本发明视频身分确认装置10包含:一个或多个处理器12、内存14、摄影镜头16、麦克风18、屏幕20以及通信模块22。其中,内存14存储有应用程序24;处理器12执行应用程序24所包含的多个程序指令,并以硬件与软件协同运作的方式实施以下模块:数据传送模块26、动态提示模块28、视频影像录制模块30;摄影镜头16用以拍摄用户的头像、上半身影像或全身影像,而制作为视频影像;麦克风18用以收音(尤指用户的说话声音);屏幕20用以显示应用程序24的接口;通信模块22用以建立Internet网络连接,如:有线宽带、WLAN(Wi-Fi等)、移动通信网络(如3G、4G)等。
继续参阅图2,本发明实施例应用程序24的系统功能方块图,数据传送模块26经由通信模块22所建立的网络与远程服务器(以下简称服务器)建立连接以传送数据,上传至服务器的数据例如:视频影像(Video)、动态提示(当动态提示由客户端产生时即需上传)、身份证的照片、银行存折的照片、个人基本数据(在线注册时所填写的数据)等,而接收服务器的数据例如:动态提示(由服务器产生)。本发明在一些实施例中,接收来自服务器的数据为:金融商品报价数据(即,应用程序24为金融商品报价软件)、银行账户数据(即,应用程序24为网络银行软件)、电子问卷/投票数据(即,应用程序24为电子问卷/投票软件)、电子票证/票券数据(即,应用程序24为电子票证/票券软件)、社群会员相关数据(即,应用程序24为社群交友软件)等。动态提示模块28以随机方式在客户端(即,视频身分确认装置10)产生动态提示,或透过数据传送模块26接收由服务器所产生的动态提示。所谓的动态提示如同动态的“密码”,是每一次录制视频影像时皆不同,其内容可为文字、数字或具有可辨认其意义的图案(例如:圆形、方形、三角形、上/下/左/右箭头符号、笑脸、哭脸、闪电、云、雨、太阳等图案)。视频影像录制模块30利用摄影镜头16与麦克风18录制为视频影像(例如,AVI、MOV、MPG等文件格式),其运用摄影镜头16拍摄用户的头像、上半身影像或全身影像而制作为视频影像(Video),并开启麦克风18以将麦克风的收音录制至视频影像的音轨(Audio Track),录制后将视频影像存储至内存14。
当用户运用本发明装置10要录制一段视频影像以上传供进行身份认证时,是以“启动验证指令”启始录制程序(例如:按下应用程序24中的“录像按键”,未描绘;或以应用程序24中的菜单操作以选取“录像选项”,未描绘),包含:产生动态提示(客户端产生)或接收动态提示(服务器端产生)、显示动态提示于屏幕20上、启动摄影镜头16与麦克风18。接着,用户以口念出屏幕20上的动态提示,在录制视频影像的同时,本发明的语音识别模块32实时进行数据转换与比对,当用户所念出的动态提示所对应的麦克风的收音数据内容与屏幕上所显示的动态提示的数据内容经比对后判定结果为吻合(即两者一致)时,即完成视频影像的录制程序,并产生视频影像以存储至内存14中。
本发明在另一实施例中是用户以“停止录制指令”(例如:按下应用程序24中的“停止录像按键”,未描绘)停止录制程序,并产生视频影像以存储至内存14中。最后,用户再以“上传指令”(例如:按下应用程序24中的“上传视频影像按键”,未描绘)即可透过数据传送模块26将录制好的视频影像上传至服务器。
本发明的主要技术特征之一即在于,用户自拍的视频影像中包含“由用户亲自念出屏幕上所显示的动态提示”的音频内容。由于服务器可记录每一笔动态提示(即使由客户端所产生,亦会上传至服务器端),故,包含“由用户亲自念出屏幕上所显示的动态提示”的音频内容的视频影像足以证明影像的真实性(意即,非翻拍的假冒影像)。本发明在一些实施例中,当用户将视频影像上传至服务器后,是由后台的审核人员以人工方式进行审核作业,例如:比对视频影片中用户所念出的动态提示的数据内容是否与服务器所记录的动态提示的数据内容一致。
本发明的语音识别模块32,将麦克风18的收音利用语音识别引擎(Speech Recognition Engine)(图中未描绘)转换成“可比对数据”。再将“可比对数据”与原本屏幕上显示的动态提示的数据进行比较,当两者比较结果吻合时即完成录制所述视频影像;当两者比较结果不吻合时所述屏幕则显示一重新语音识别提示。意即,本发明的语音识别模块32特别撷取麦克风18的收音来进行语音识别以实现自动辨识的功能,藉由实时性的密码式(动态提示)的声音辨识,防止非本人所录制的问题,可减少后台审核人员的人工操作,甚至可达到完全自动化的身分审核,此是本发明另一主要技术特征。本发明一实施例是将语音识别引擎设置于客户端,转换作业以及比对作业直接在客户端进行。本发明另一实施例是将语音识别引擎设置于服务器端或云端,所述收音经上传后于服务器端/云端进行转换及比对。
就另一实施例而言,判定为吻合的方式,可采用将麦克风的收音数据内容与动态提示的数据内容比对后,产生一比对分数,当比对分数大于或等于默认值时,及判断为吻合。如,默认值为70%时,当动态提示共有10个字,而于辨识出7-10个字时,都判定为吻合。而当比对分数小于所述默认值时,则判定为不吻合,进而产生重新语音识别提示。默认值可以设定为30%~100%不等。由于本发明主要是解决"是否为本人"的问题,而非处理语音识别度须达百分的百的问题,因此,此种模糊的判定方法,将可有效提高辨识效率。
在本发明的不同实施例中,上述各模块应被理解为一种硬件与软件协同运作的资源,各模块的技术特征可以多个程序指令或应用程序的一部份来表达,但是各模块的技术效果必须是以一或多个处理器来执行该些程序指令或应用程序的形式(即硬件与软件协同运作的资源)来实现,而本发明所欲解决的问题即是透过这样的硬件与软件协同运作的资源来获得改善。
就另一实施例而言,本发明也提供了一种计算机程序产品,安装于具有摄影镜头、麦克风、屏幕及内存的装置中(亦即,图1的装置),此计算机程序产品包含了图2的应用程序24的各个模块:数据传送模块26、动态提示模块28,视频影像录制模块30、语音识别模块32等。此计算机程序产品根据启动验证指令以显示动态提示于屏幕并以摄影镜头与麦克风录制视频影像;此计算机程序产品更根据一上传指令驱动数据传送模块将视频影像上传至服务器。
就另一实施例而言,本发明也提供了一种计算机可读取记录媒体,记录了图2的应用程序24,此应用程序24安装于具有摄影镜头、麦克风、屏幕及内存的装置中(亦即,图1的装置),应用程序包含:数据传送模块26、动态提示模块28,视频影像录制模块30、语音识别模块32等。应用程序24根据启动验证指令以显示动态提示于所述屏幕并以摄影镜头与所述麦克风录制所述视频影像,以及,应用程序24根据上传指令驱动数据传送模块将经比较吻合的视频影像上传至服务器。
参阅图3、图4、图5、图6以及图7,本发明实施例的屏幕20显示动态提示的示意图,其说明了本发明一些较佳实施例于屏幕20上所显示的动态提示其可能格式,以及,本发明装置10的摄影镜头16是与屏幕20设置于同一面(面向用户),以便用户在录像时可念出屏幕20上所显示的动态提示34。该些附图是以智能型手机的屏幕样式为例来说明,本发明并未限定使用于智能型手机,本发明亦可使用于个人计算机、笔记本电脑、平板计算机等。
图3说明了本发明一实施例屏幕20所显示的动态提示34为中文字符串,依据图例用户应念出“大道之行也天下为公”,此实施例亦有可能显示前后毫无关联的中文字符串。
图4说明了本发明一实施例屏幕20所显示的动态提示34为英文字符串,依据图例用户应念出“This Is A Dynamic Prompt”,此实施例亦有可能显示前后毫无关联的英文字符串,或为字母的组合,或为其他外文字符串,或为其他外文字母的组合。
图5说明了本发明一实施例屏幕20所显示的动态提示34为图案,依据图例用户应念出“右、下、下、左、上”或是“右边、下面、下面、左边、上面”或是“右方、下方、下方、左方、上方”等同义的说法,此实施例亦有可能以其他可辨认出方向的符号或图案表示。
图6说明了本发明一实施例屏幕20所显示的动态提示34为图案,依据图例用户应念出“三角形、圆形、四方形、三角形、四方形”或是“三角形、圆形、正方形、三角形、正方形”或是“三角、圆、正方、三角、正方”等同义的说法,此实施例亦有可能以其他可辨认出形状的不同图案表示。
图7说明了本发明一实施例屏幕20所显示的动态提示34为图案,依据图例用户应念出“笑脸、云、爱心”或是“笑脸、云朵、心形”或是其他同义的说法,此实施例亦有可能以其他可辨认出含义的图案表示。
除了上述该些实施例,本发明另有一些实施例屏幕20所显示的动态提示34并非一次将全部内容完整显示出来,而是采逐字显示或是分批显示,例如:一次显示一个字/符号/图案(未描绘)、一次显示两个字/符号/图案(未描绘)、一次显示三个字/符号/图案(未描绘)等。以前述的中文动态提示34“大道之行也天下为公”为例来说明,当本发明一实施例采逐字(每次一个字)显示于屏幕20时,所述句动态提示34会分成“9次”显示,此方法是要提高翻拍或伪造的难度。
参阅图8,本发明又一实施例的屏幕20显示动态提示34以及用户影像36的示意图,此实施例除了在屏幕20上显示出动态提示34,另外还显示用户利用摄影镜头16所拍摄的用户影像36,以方便用户实时观看录制效果如何。
参阅图9,本发明实施例的操作流程图,用户利用移动装置(如智能手机/平板计算机)、个人计算机或笔记本电脑执行应用程序24,自拍视频影像并念出动态提示,经语音识别处理后、最后上传视频影像的操作流程,包含:
步骤S101:于装置10上执行本发明应用程序24。用户于移动装置(如智能手机/平板计算机)、个人计算机或笔记本电脑执行应用程序24。
步骤S102:接收启动验证指令。用户按下应用程序24中的“录像按键”(未描绘,其亦可标示为“验证录像”或其他同义文字),或以菜单操作以选取“录像选项”(未描绘,其亦可标示为“验证录像”或其他同义文字),即产生“启动验证指令”。
步骤S103:接收服务器所传送的动态提示,或随机产生。应用程序24接收到启动验证指令后,除了由视频影像录制模块30启动摄影镜头16与麦克风18,并向动态提示模块28索取一组动态提示,本发明一种实施例是由动态提示模块28在装置10上以随机方式产生动态提示,本发明另一种实施例的动态提示是于服务器端产生,再由动态提示模块28透过数据传送模块26向服务器取得。
步骤S104:将动态提示显示于屏幕20上。动态提示模块28产生或接收动态提示后,即显示动态提示34于屏幕20上,如图3、图4、图5、图6或图7所示。
步骤S105:用户念出屏幕20所显示的动态提示34。动态提示34显示于屏幕20时,视频影像录制模块30已启动摄影镜头16与麦克风18,用户念出屏幕20所显示的动态提示34时其影音即被视频影像录制模块30收录。本发明一些实施例中,在此步骤更包含一定时器(未描绘)以及一麦克风音量侦测模块(未描绘),用以限定录制时间,例如:若在“20秒钟”之内麦克风18未侦测到音量,或音量未达一定程度之上(即,仅有环境噪音,而无用户的人声),即刻停止录制程序。
步骤S106:实时进行语音识别。当前一步骤的麦克风18侦测到音量时,语音识别模块32将麦克风18的收音利用语音识别引擎转换成“可比对数据”,并与原本屏幕20上显示的动态提示34的数据进行比较。
步骤S107:两者比较吻合?也就是,比较“可比对数据”是否与动态提示34的数据吻合。若语音识别模块32判定“是”(即,两者比对吻合)则进行步骤S109,若语音识别模块32判定“否”(即,两者比对不吻合)则进行步骤S108。同样地,吻合与否的判定方式,可采用一比对分数来判定,当“可比对数据”是否与动态提示34的数据比较后产生一比对分数,当比对分数超过默认值时(大于或等于),及判定吻合;当比对分数低于默认值时,判定为不吻合,进而实现模糊比对。
步骤S108:当两者比较不吻合时屏幕20则显示重新语音识别提示,例如:“请依照屏幕所显示的动态提示,重新念一次”。本发明一些实施例中,当步骤S107语音识别模块32判定比对失败(两者比对不吻合)时,动态提示模块28即提供另一组不同的动态提示。
步骤S109:当两者比较吻合时即完成录制视频影像,视频影像录制模块30自动结束执行(意即,用户不必手动操作以停止录制,录制完毕即会自动停止),录制后的视频影像存储至内存14。本发明一些实施例中,需接收停止录制指令(用户按下应用程序24中的“停止录像按键”)方可停止录制程序。本发明一些实施例中,当录制视频影像完成后,语音识别模块32自动产生一组“验证成功辨识码”,例如:夹带在所述视频影像中的一个卷标(Tag)或旗标(Flag)、或分开的一个独立档案,所述验证成功辨识码随着视频影像一同上传至服务器,用以供服务器端做自动辨识用。由以上的不同实施例可知,本发明所谓的完成视频影像的录制程序,可以是在比较“可比对数据”是否与动态提示34的数据吻合后自动结束执行录制,或者,由用户操作停止录制键后完成录制。
步骤S110:接收上传指令。录制完成后,用户按下“上传视频影像按键”(未描绘)以产生上传指令,应用程序24接收上传指令后,即透过数据传送模块26将内存14中的视频影像上传至服务器。本发明一些实施例中,当步骤S109结束后即自动产生上传指令,意即,用户不必手动操作以上传视频影像。
对本发明的不同实施例可理解的是,由计算机执行的程序指令可实行流程图中的各个方块、流程图中方块的组合、以及各实施例中的步骤。把所述等程序指令提供给一处理器操作以产生一机器或产生硬件与软件协同运作的资源,藉此在所述处理器上执行所述等指令时,将产生用以实行流程图方块指明的动作或技术效果的构件。不同集合的程序指令亦可使展示于流程图方块中的至少某些操作步骤并行地进行,且一应用程序的各个程序指令所表达的技术内容可能依不同实施例而不同。再者,亦可在不只一个处理器上进行某些所述等步骤,例如移动通信装置中微处理器与周边接口处理器所协同运作的状况。此外,在不偏离本发明范围或精神的条件下,流程图中的一或多个方块或方块的组合亦可与其他方块或方块组合同时地进行,或甚至以不同于展示出的顺序来进行。
因此,本发明流程图的方块支持用以进行指明动作或技术效果的构件组合、用以进行指明动作或技术效果的步骤组合、以及用以进行指明动作或技术效果的程序指令构件。亦将可了解的是,这些指明动作或技术效果是由特殊用途硬件式系统或者特殊用途硬件与程序指令协同运作来实行本发明流程图的各个方块以及流程图的方块组合。
综上所述,本发明提出一种视频身分确认的技术,解决了现有技术大头照/视频被翻拍的问题,藉由防止翻拍大头照/视频的技术杜绝假冒身分进行开户,更可降低后台审核作业的人力需求,弥补了现有技术不足之处。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (10)
1.一种视频身分确认装置,其特征在于,包含:
一摄影镜头,拍摄一用户的一视频影像;
一麦克风,用以收音;
一内存,存储所述视频影像及一麦克风的收音;
一屏幕,用以显示一动态提示;
一数据传送模块,与一服务器建立连接以传送数据;
一动态提示模块,提供一动态提示;
一视频影像录制模块,利用所述摄影镜头拍摄所述用户的所述视频影像,并开启所述麦克风以将所述麦克风的收音录制至所述视频影像的一音轨,录制后将所述视频影像存储至所述内存;
一语音识别模块,将所述麦克风的收音以一语音识别引擎转换成一可比对数据,并将所述可比对数据与所述动态提示的数据进行比较,其中,当两者比较吻合时即完成录制所述视频影像,当两者比较不吻合时所述屏幕则显示一重新语音识别提示;及
一处理器,连接所述摄影镜头、所述麦克风、所述内存与所述屏幕;
其中,所述处理器根据一启动验证指令以显示所述动态提示于所述屏幕并以所述摄影镜头与所述麦克风录制所述视频影像,以及,所述处理器根据一上传指令驱动所述数据传送模块将经比较吻合的所述视频影像上传至所述服务器;
其中,所述摄影镜头与所述屏幕设置于同一面。
2.如权利要求1所述的视频身分确认装置,其特征在于,提供的所述动态提示是选自:由所述动态提示模块于所述装置上以随机方式产生,或,透过所述数据传送模块接收由所述服务器所产生。
3.如权利要求1所述的视频身分确认装置,其特征在于,当所述可比对数据与所述动态提示的数据比较吻合时,所述语音识别模块自动产生一验证成功辨识码,所述验证成功辨识码随着所述视频影像一并上传至所述服务器,用以做自动辨识用。
4.如权利要求1所述的视频身分确认装置,其特征在于,所述处理器控制所述屏幕显示所述动态提示的方法是选自:一次显示所述动态提示的完整内容,逐字显示所述动态提示的内容;或,分批显示所述动态提示的内容。
5.如权利要求1或3所述的视频身分确认装置,其特征在于,所述语音识别模块更依据所述可比对数据与所述动态提示的数据比较结果产生一比对分数,当所述比对分数大于或等于一默认值时,判定为所述可比对数据与所述动态提示的数据吻合,当所述比对分数小于一默认值时,判定为所述可比对数据与所述动态提示的数据不吻合。
6.一种视频身分确认方法,应用于一装置,所述装置包含一摄影镜头、一麦克风及一屏幕,其特征在于,所述方法包含:
接收一启动验证指令;
产生一动态提示;
将所述动态提示显示于所述屏幕;
一用户念出所述屏幕所显示的所述动态提示时,同时以所述摄影镜头与所述麦克风录制所述用户的一视频影像,所述视频影像包含一音轨,所述音轨记录所述麦克风的收音;
将所述麦克风的收音转换成一可比对数据;
将所述可比对数据与所述动态提示的数据进行比较,当比较结果吻合时即完成录制所述视频影像,当比较结果不吻合时于所述屏幕显示一重新语音识别提示;以及,
上传经比较结果吻合的所述视频影像至一服务器。
7. 如权利要求6所述的视频身分确认方法,其特征在于,产生所述动态提示的方法是选自:于所述装置上以随机方式产生所述动态提示,或,经由一通信模块接收所述服务器所产生的所述动态提示。
8.如权利要求6所述的视频身分确认方法,其特征在于,所述动态提示显示于所述屏幕的方法是选自:一次显示所述动态提示的完整内容,逐字显示所述动态提示的内容;或,分批显示所述动态提示的内容。
9.如权利要求6所述的视频身分确认方法,其特征在于,当所述可比对数据与所述动态提示的数据比较结果吻合时,自动产生一验证成功辨识码,所述验证成功辨识码随着所述视频影像一并上传至所述服务器,用以做自动辨识用。
10.如权利要求6或9所述的视频身分确认方法,其特征在于,更包含:依据所述可比对数据与所述动态提示的数据比较结果产生一比对分数,当所述比对分数大于或等于一默认值时,判定为所述可比对数据与所述动态提示的数据吻合,当所述比对分数小于一默认值时,判定为所述可比对数据与所述动态提示的数据不吻合。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104133203A TW201714109A (zh) | 2015-10-08 | 2015-10-08 | 視訊身分確認裝置與方法及其電腦程式產品 |
TW104133203 | 2015-10-08 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106570369A true CN106570369A (zh) | 2017-04-19 |
Family
ID=58498740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510880332.8A Pending CN106570369A (zh) | 2015-10-08 | 2015-12-03 | 视频身分确认装置与方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20170103397A1 (zh) |
CN (1) | CN106570369A (zh) |
TW (1) | TW201714109A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108595233A (zh) * | 2018-03-09 | 2018-09-28 | 福州米鱼信息科技有限公司 | 一种基于语音提示的电子证据采集方法及系统 |
CN111684444A (zh) * | 2019-07-18 | 2020-09-18 | 深圳海付移通科技有限公司 | 一种身份验证方法、终端设备、存储介质 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229457A (zh) | 2017-12-14 | 2018-06-29 | 深圳市商汤科技有限公司 | 证件的验证方法、装置、电子设备和存储介质 |
JP7091065B2 (ja) * | 2017-12-26 | 2022-06-27 | キヤノン株式会社 | 記録制御装置、記録制御装置の制御方法およびプログラム |
CN111093113A (zh) * | 2019-04-22 | 2020-05-01 | 广东小天才科技有限公司 | 一种视频内容的输出方法及电子设备 |
WO2020256160A1 (ko) * | 2019-06-17 | 2020-12-24 | 엘지전자 주식회사 | 인공지능 홈 로봇 및 그의 제어 방법 |
CN113162961A (zh) * | 2020-12-15 | 2021-07-23 | 北京京航计算通讯研究所 | 基于语音控制的视频监控设备搜索系统 |
US11451694B1 (en) | 2021-03-16 | 2022-09-20 | International Business Machines Corporation | Mitigation of obstacles while capturing media content |
CN114125341B (zh) * | 2021-10-29 | 2024-01-23 | 北京达佳互联信息技术有限公司 | 视频处理方法、装置、电子设备、存储介质及产品 |
CN114531613B (zh) * | 2022-02-17 | 2023-12-19 | 北京麦多贝科技有限公司 | 一种视频加密处理方法及装置、电子设备及存储介质 |
US12073839B2 (en) * | 2022-03-24 | 2024-08-27 | Capital One Services, Llc | Authentication by speech at a machine |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324918A (zh) * | 2013-06-25 | 2013-09-25 | 浙江中烟工业有限责任公司 | 一种人脸识别与唇形识别相配合的身份认证方法 |
CN104376250A (zh) * | 2014-12-03 | 2015-02-25 | 优化科技(苏州)有限公司 | 基于音型像特征的真人活体身份验证方法 |
CN204667465U (zh) * | 2015-02-28 | 2015-09-23 | 优化科技(苏州)有限公司 | 电子支付真人活体身份验证系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6167517A (en) * | 1998-04-09 | 2000-12-26 | Oracle Corporation | Trusted biometric client authentication |
US7673135B2 (en) * | 2005-12-08 | 2010-03-02 | Microsoft Corporation | Request authentication token |
US10042993B2 (en) * | 2010-11-02 | 2018-08-07 | Homayoon Beigi | Access control through multifactor authentication with multimodal biometrics |
US9262612B2 (en) * | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US8897500B2 (en) * | 2011-05-05 | 2014-11-25 | At&T Intellectual Property I, L.P. | System and method for dynamic facial features for speaker recognition |
US20130173383A1 (en) * | 2012-01-03 | 2013-07-04 | Zortag Inc. | Method Of, And System For, Authenticating And Custom Marketing Products In Response To Their Authentication |
US20140032718A1 (en) * | 2012-07-24 | 2014-01-30 | Penthera Partners, Inc. | Video uploading from mobile devices |
WO2016012859A1 (en) * | 2014-07-25 | 2016-01-28 | Snapfile Ltd. | System and method for securely managing integrity-verifiable and authenticable information |
-
2015
- 2015-10-08 TW TW104133203A patent/TW201714109A/zh unknown
- 2015-12-03 CN CN201510880332.8A patent/CN106570369A/zh active Pending
-
2016
- 2016-01-12 US US14/993,657 patent/US20170103397A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324918A (zh) * | 2013-06-25 | 2013-09-25 | 浙江中烟工业有限责任公司 | 一种人脸识别与唇形识别相配合的身份认证方法 |
CN104376250A (zh) * | 2014-12-03 | 2015-02-25 | 优化科技(苏州)有限公司 | 基于音型像特征的真人活体身份验证方法 |
CN204667465U (zh) * | 2015-02-28 | 2015-09-23 | 优化科技(苏州)有限公司 | 电子支付真人活体身份验证系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108595233A (zh) * | 2018-03-09 | 2018-09-28 | 福州米鱼信息科技有限公司 | 一种基于语音提示的电子证据采集方法及系统 |
CN111684444A (zh) * | 2019-07-18 | 2020-09-18 | 深圳海付移通科技有限公司 | 一种身份验证方法、终端设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
TW201714109A (zh) | 2017-04-16 |
US20170103397A1 (en) | 2017-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106570369A (zh) | 视频身分确认装置与方法 | |
CN108171032A (zh) | 一种身份鉴定方法、电子装置及计算机可读存储介质 | |
JP6743188B2 (ja) | リモートの契約面談方法、電子装置及びコンピューター読取可能記憶媒体 | |
US7162475B2 (en) | Method for user verification and authentication and multimedia processing for interactive database management and method for viewing the multimedia | |
CN105407042B (zh) | 一种基于微信公众平台的远程sim卡开通方法及系统 | |
CN105654372A (zh) | 远程开户的身份识别方法、服务器及系统 | |
JP2021517303A (ja) | 閾値ベースのマッチングによる遠隔ユーザの身元確認 | |
CN104361274A (zh) | 一种基于视频识别的身份认证方法及其系统 | |
WO2019114615A1 (zh) | 一种原生照片鉴定方法及应用 | |
CN108830230A (zh) | 身份核验方法、身份核验管理系统及设备 | |
CN111898969A (zh) | 一种电子劳动合同在线签约方法及系统 | |
CN113158148A (zh) | 基于区块链的多模态数字人版权管理方法及系统 | |
TWM569875U (zh) | 具有整合介面裝置的影音記錄裝置 | |
CN114553838A (zh) | 远程业务办理的实现方法、系统及服务器 | |
CN114422144B (zh) | 一种提升场景证书区块链存证可信度的方法、系统、设备及存储介质 | |
US10504119B2 (en) | System and method for executing remote electronic authentication | |
TWM624786U (zh) | 互動式遠距簽約系統 | |
KR102154602B1 (ko) | 온라인 대면확인 방법 | |
US20160344558A1 (en) | System and Method for Obtaining Authorization | |
CN111541906A (zh) | 数据发送方法、装置、计算机设备及存储介质 | |
WO2020152840A1 (ja) | 証明書認定システム、証明書認定方法及びプログラム | |
WO2021073270A1 (zh) | 风险管控方法、装置、计算机装置及存储介质 | |
CN202453890U (zh) | 一种u盾 | |
WO2020077890A1 (zh) | 系统安全方法、装置、计算机设备及存储介质 | |
CN109784946A (zh) | 一种电子合同签订系统和电子合同签订方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170419 |
|
RJ01 | Rejection of invention patent application after publication |