CN110458130A - 人物识别方法、装置、电子设备及存储介质 - Google Patents

人物识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110458130A
CN110458130A CN201910760681.4A CN201910760681A CN110458130A CN 110458130 A CN110458130 A CN 110458130A CN 201910760681 A CN201910760681 A CN 201910760681A CN 110458130 A CN110458130 A CN 110458130A
Authority
CN
China
Prior art keywords
video frame
recognition
human body
video
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910760681.4A
Other languages
English (en)
Other versions
CN110458130B (zh
Inventor
高磊磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910760681.4A priority Critical patent/CN110458130B/zh
Publication of CN110458130A publication Critical patent/CN110458130A/zh
Priority to JP2020021940A priority patent/JP6986187B2/ja
Priority to US16/797,222 priority patent/US20210049354A1/en
Application granted granted Critical
Publication of CN110458130B publication Critical patent/CN110458130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • G06F16/784Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics

Abstract

本申请公开了人物识别方法、装置、电子设备及存储介质,涉及图像识别技术领域。具体实现方案为:接收与视频流中的当前视频帧对应的人物识别请求;提取当前视频帧中的人体特征;将当前视频帧中的人体特征与知识库中保存的视频流中的第一视频帧的人体特征相匹配;在匹配成功的情况下,将第一视频帧的第一人物标识作为人物识别请求的识别结果。本申请实施例中,在发出人物识别请求时不需要用户去捕捉有人物正脸的视频帧,根据当前视频帧中的人体特征即可查询到视频中的人物信息,能够提供方便的查询服务,提升用户粘度,用户体验良好。

Description

人物识别方法、装置、电子设备及存储介质
技术领域
本申请涉及一种信息技术领域,尤其涉及一种图像识别技术领域。
背景技术
用户在观看视频的过程中,可能想要查询视频中的人物信息。但当用户发出查询请求时,可能出现视频图像中含有人物正脸的视频帧已经播放过去了,当前视频帧上只有人物的侧脸或背身,或者在当前视频帧中人脸不清晰的情况,利用人脸识别技术无法准确识别出人物身份。这种情况下通常会导致识别失败。用户只能通过暂停在有人物正脸的视频帧或者捕捉人物正脸的时间点来提高识别率和满足度,用户体验不佳。
发明内容
本申请实施例提出一种人物识别方法、装置、电子设备及存储介质,以至少解决现有技术中的以上技术问题。
第一方面,本申请实施例提供了一种人物识别方法,包括:
接收与视频流中的当前视频帧对应的人物识别请求;
提取当前视频帧中的人体特征;
将当前视频帧中的人体特征与知识库中保存的视频流中的第一视频帧的人体特征相匹配;
在匹配成功的情况下,将第一视频帧的第一人物标识作为人物识别请求的识别结果。
本申请实施例中,在发出人物识别请求时不需要用户去捕捉有人物正脸的视频帧,根据当前视频帧中的人体特征即可查询到视频中的人物信息,能够提供方便的查询服务,提升用户粘度,用户体验良好。
在一种实施方式中,接收与视频流中的当前视频帧对应的人物识别请求之前,还包括:
对视频流中的第二视频帧进行人脸识别,得到第二视频帧的第二人物标识,其中,第二视频帧的图像中包括人物脸部;
提取第二视频帧和第一视频帧中的人体特征,其中,第一视频帧的图像中不包括人物脸部;
在第二视频帧中的人体特征和第一视频帧中的人体特征匹配成功的情况下,将第二人物标识作为第一视频帧的第一人物标识;
将第一视频帧及其第一人物标识保存到知识库中。
本申请实施例中,通过对视频流的分析完善知识库,提高人物识别的准确率。
在一种实施方式中,对视频流中的第二视频帧进行人脸识别之前,还包括:
从视频流中截取至少一个第一视频帧和至少一个第二视频帧。
本申请实施例中,预先截取人脸特征与人体特征有对应关系的至少一个时间窗口内的连续视频帧,以确保产生有效的识别结果。
在一种实施方式中,人物识别方法还包括:识别请求中包括当前视频帧的图像,当前视频帧的图像是在视频流的播放端通过截图或拍照获取的。
本申请实施例中,在视频流的播放端发送人物识别请求时,在人物识别请求中需要包括当前视频帧的图像,截图或拍照的方式可确保获取真实的图像数据。
第二方面,本申请实施例提供了一种人物识别装置,包括:
接收单元,用于接收与视频流中的当前视频帧对应的人物识别请求;
提取单元,用于提取当前视频帧中的人体特征;
匹配单元,用于将当前视频帧中的人体特征与知识库中保存的视频流中的第一视频帧的人体特征相匹配;
识别单元,用于在匹配成功的情况下,将第一视频帧的第一人物标识作为人物识别请求的识别结果。
在一种实施方式中,装置还包括知识库构建单元,知识库构建单元包括:
人脸识别子单元,用于:接收与视频流中的当前视频帧对应的人物识别请求之前,对视频流中的第二视频帧进行人脸识别,得到第二视频帧的第二人物标识,其中,第二视频帧的图像中包括人物脸部;
提取子单元,用于提取第二视频帧和第一视频帧中的人体特征,其中,第一视频帧的图像中不包括人物脸部;
标识子单元,用于:在第二视频帧中的人体特征和第一视频帧中的人体特征匹配成功的情况下,将第二人物标识作为第一视频帧的第一人物标识;
保存子单元,用于将第一视频帧及其第一人物标识保存到知识库中。
在一种实施方式中,知识库构建单元还包括截取子单元,截取子单元用于:
对视频流中的第二视频帧进行人脸识别之前,从视频流中截取至少一个第一视频帧和至少一个第二视频帧。
在一种实施方式中,识别请求中包括当前视频帧的图像,当前视频帧的图像是在视频流的播放端通过截图或拍照获取的。
第三方面,本申请实施例提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请任意一项实施例所提供的方法。
第四方面,本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使该计算机执行本申请任意一项实施例所提供的方法。
上述申请中的一个实施例具有如下优点或有益效果:直接从用户信息行为的相关内容中识别出兴趣点,从而保证了为用户推送的兴趣点能够与用户意图相吻合,用户体验良好。因为直接从用户信息行为的相关内容中识别出兴趣点,所以避免了推送的兴趣点不满足用户的需要的问题,进而提升了用户体验。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例的人物识别方法的示意图;
图2是根据本申请实施例的人物识别方法的示意图;
图3本申请一种示例的人物识别方法的流程图;
图4是根据本申请实施例的人物识别装置结构示意图;
图5是根据本申请实施例的人物识别装置结构示意图;
图6是根据本申请实施例的人物识别装置结构示意图;
图7是用来实现本申请实施例的人物识别方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请第一实施例的人物识别方法的示意图。如图1所示,该人物识别方法包括:
步骤S110,接收与视频流中的当前视频帧对应的人物识别请求;
步骤S120,提取当前视频帧中的人体特征;
步骤S130,将当前视频帧中的人体特征与知识库中保存的视频流中的第一视频帧的人体特征相匹配;
步骤S140,在匹配成功的情况下,将第一视频帧的第一人物标识作为人物识别请求的识别结果。
用户在观看视频的过程中,可能想要查询视频中的人物信息。例如,用户可能想要查询当前视频帧中扮演这个角色的演员是谁,进一步还可能想要查询该演员的相关信息。这种情况下用户可在观看视频的过程中,通过观看视频的播放端例如手机、平板电脑、笔记本电脑等发出人物识别请求。人物识别请求中可包括视频流中的当前视频帧的信息。例如人物识别请求中可包括视频流中的当前视频帧的图像。用户通过视频流的播放端将人物识别请求发送到服务器。在步骤S110中,服务器接收携带有当前视频帧的信息的人物识别请求。
在一种情况下,当前视频帧的图像中可能包含有视频中人物的人物正脸。这种情况下可通过人脸识别技术对当前视频帧进行人物识别。在另一种情况下,当前视频帧上可能只有人物的侧脸或背身,或者在当前视频帧中人脸不清晰,利用人脸识别技术无法准确识别出人物身份。在上述步骤S120中,提取当前视频帧中的人体特征,以利用人体特征进行人物识别。
通常视频流中有一部分视频帧的图像中包含有人物正脸且人脸清晰,将这部分视频帧称为第二视频帧;还有一部分视频帧的图像中不包含人物正脸,只包含侧脸或背身,或者视频帧中人脸不清晰,将这部分视频帧称为第一视频帧。
图2是根据本申请实施例的人物识别方法的示意图。如图2所示,在一种实施方式中,在图1中的步骤S110:接收与视频流中的当前视频帧对应的人物识别请求之前,还包括:
步骤S210,对视频流中的第二视频帧进行人脸识别,得到第二视频帧的第二人物标识,其中,第二视频帧的图像中包括人物脸部;
步骤S220,提取第二视频帧和第一视频帧中的人体特征,其中,第一视频帧的图像中不包括人物脸部;
步骤S230,在第二视频帧中的人体特征和第一视频帧中的人体特征匹配成功的情况下,将第二人物标识作为第一视频帧的第一人物标识;
步骤S240,将第一视频帧及其第一人物标识保存到知识库中。
为了能够对第一视频帧进行人物识别,可预先对视频流中的第二视频帧进行人脸识别,得到第二人物标识;同时提取第一视频帧和第二视频帧中的人体特征,如身高、外形、服饰等。在第一视频帧中和第二视频帧中的人体特征匹配成功的情况下,将得到的第二视频帧的第二人物标识标记到第一视频帧上。并将得到的第一视频帧的人体特征和对应的人物标识保存到知识库中。
本申请实施例使用知识库保存视频帧对应的人物标识有明显的优越性。知识库的构造使得其中的知识在被使用的过程中能够有效地存取和搜索,库中的知识能方便地修改和编辑,同时,对库中知识的一致性和完备性能进行检验。建立知识库的过程中要对原有的信息和知识做大规模的收集和整理,按照一定的方法进行分类保存,并提供相应的检索手段。例如在上述方法中通过对第二视频帧进行人脸识别,以及第一视频帧中和第二视频帧中的人体特征匹配,得到第一视频帧对应的人物标识。经过这样一番处理,大量隐含知识被编码化和数字化,信息和知识便从原来的混乱状态变得有序化。这样就方便了信息和知识的检索,并为有效使用打下了基础。知识和信息实现了有序化,其寻找和利用时间大大减少,这就使基于知识库的服务系统提供查询服务的速度大大加快。
本申请实施例中,通过对视频流的分析完善知识库,提高人物识别的准确率。
如前述,由于知识库中已经保存了第一视频帧的人体特征和对应的人物标识,因此在步骤S130中,将当前视频帧中的人体特征与知识库中保存的视频流中的第一视频帧的人体特征相匹配。在匹配成功的情况下,说明用户正在播放的当前视频帧图像中的人物与知识库中的第一视频帧图像中的人物是同一个人。在步骤S140中,将第一视频帧的第一人物标识作为人物识别请求的识别结果。
本申请实施例中,在发出人物识别请求时不需要用户去捕捉有人物正脸的视频帧,根据当前视频帧中的人体特征即可查询到视频中的人物信息,能够提供方便的查询服务,提升用户粘度,用户体验良好。
在一种实施方式中,对视频流中的第二视频帧进行人脸识别之前,还包括:
从视频流中截取至少一个第一视频帧和至少一个第二视频帧。
本申请实施例中,预先截取人脸特征与人体特征有对应关系的至少一个时间窗口内的连续视频帧,以确保产生有效的识别结果。
在一个示例中,可预先从视频库中提取一段视频流去训练用于人物识别的模型。用训练好的模型生成的第一视频帧的人体特征和对应的人物标识保存到知识库中。例如,可从视频流中截取图片组来进行模型训练。在视频流中,人脸特征与人体特征的对应关系并不是一直存在,而通常是存在于一个比较短的时间窗口内。因此可截取至少一个时间窗口内的连续视频帧用于进行模型训练。
图3本申请一种示例的人物识别方法的流程图。如图3所示,语音模块接收用户的语音信息。例如用户可能会问:“这个人是谁?”、“这个明星是谁?”。接收到用户的语音信息之后,语音模块将语音信息转化成文本信息,然后将文本信息发送给意图理解模块。意图理解模块对文本信息进行语义理解,识别出用户意图是要查询视频中的明星信息。接下来意图理解模块将用户请求发送给检索模块。在图3所示的示例中,语音模块、意图理解模块、视频图像获取模块可设置于视频流的播放端,检索模块可设置于服务器端。
上述示例中,在识别出用户意图之后,视频图像获取模块可以根据用户意图控制视频播放端截图或拍照。例如,从语音信息“这个人是谁?”中得到用户意图为查询视频中的明星信息,则截图当前视频帧的图像。在一种实施方式中,人物识别方法还包括:识别请求中包括当前视频帧的图像,当前视频帧的图像是在视频流的播放端通过截图或拍照获取的。在识别出用户意图之后,触发对当前视频帧的图像进行截图或拍照,然后将携带有当前视频帧的图像的人物识别请求发送给服务器。
本申请实施例中,在视频流的播放端发送人物识别请求时,在人物识别请求中需要包括当前视频帧的图像,截图或拍照的方式可确保获取真实的图像数据。
检索模块用于给用户提供检索服务。该模块负责提取来自于视频流的播放端上的人物识别请求中携带的当前视频帧的图像信息,包括人脸特征,人体特征等。然后用这些特征作为输入数据,向用于人物识别的模型请求预测结果,即请求当前视频帧中的人物标识。然后根据该标识从知识库中获取人物的相关信息,并按照一定格式组合发给视频流的播放端上。如图3所示,检索模块包括特征提取模块、人物主体识别模块。
特征提取模块用于从当前视频帧的图像中提取出人体特征,例如身高、体型、服饰,随身携带的包、手机,以及其它随身携带的道具或工具等。
知识库中存储有人体特征和对应的人物标识,以及对应的人物的相关信息。由于在一段时间内人物的衣服、造型(外形特征)不会发出变化,因此,在无人脸信息时可根据人体特征来进行人物识别。
人物主体识别模块的功能包括训练用于人物识别的模型,以及使用训练好的模型进行人物识别。首先通过人脸识别出人物信息,然后在把人物信息与人体特征进行关联,从而在人脸不清晰甚至人物背身的情况下也能识别出人物的信息。具体训练及使用过程如下:
a.对视频帧中的人物进行人脸识别,并将人物的人脸特征和明星介绍等信息进行打包,生成人脸指纹。将人脸指纹存入知识库中。其中明星介绍可包括明星的履历和演艺生涯等用户比较关注的信息。
b.通过人体识别技术提取人体特征,把人体特征与人脸特征进行关联,或者将人体特征与人脸指纹进行关联。在识别人物时,可使用人体特征与人脸特征互补来提高识别率。例如在无人脸信息时仅从人体特征来进行人物识别。
服务器端完成人物识别之后,将人物识别结果及人物的相关信息发送到视频流的播放端上。在视频流的播放端上展示结果。在一个示例中,可在视频流的播放端上内置结果展示模块,用于在服务器返回识别结果及人物的相关信息后,对识别结果及人物相关信息进行渲染和展现。
图4是根据本申请实施例的人物识别装置结构示意图。如图4所示,本申请实施例的人物识别装置包括:
接收单元100,用于接收与视频流中的当前视频帧对应的人物识别请求;
提取单元200,用于提取当前视频帧中的人体特征;
匹配单元300,用于将当前视频帧中的人体特征与知识库中保存的视频流中的第一视频帧的人体特征相匹配;
识别单元400,用于在匹配成功的情况下,将第一视频帧的第一人物标识作为人物识别请求的识别结果。
图5是根据本申请实施例的人物识别装置结构示意图。如图5所示,在一种实施方式中,上述装置还包括知识库构建单元500,知识库构建单元500包括:
人脸识别子单元510,用于:接收与视频流中的当前视频帧对应的人物识别请求之前,对视频流中的第二视频帧进行人脸识别,得到第二视频帧的第二人物标识,其中,第二视频帧的图像中包括人物脸部;
提取子单元520,用于提取第二视频帧和第一视频帧中的人体特征,其中,第一视频帧的图像中不包括人物脸部;
标识子单元530,用于:在第二视频帧中的人体特征和第一视频帧中的人体特征匹配成功的情况下,将第二人物标识作为第一视频帧的第一人物标识;
保存子单元540,用于将第一视频帧及其第一人物标识保存到知识库中。
图6是根据本申请实施例的人物识别装置结构示意图。如图6所示,在一种实施方式中,知识库构建单元500还包括截取子单元505,截取子单元505用于:
对视频流中的第二视频帧进行人脸识别之前,从视频流中截取至少一个第一视频帧和至少一个第二视频帧。
在一种实施方式中,识别请求中包括当前视频帧的图像,当前视频帧的图像是在视频流的播放端通过截图或拍照获取的。
本申请实施例自动驾驶系统的数据通信频率统计装置中的各单元的功能可以参见上述方法中的对应描述,在此不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的人物识别的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示图形用户界面(Graphical User Interface,GUI)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的人物识别的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的人物识别的方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的人物识别的方法对应的程序指令/模块/单元(例如,附图4所示的接收单元100、提取单元200、匹配单元300和识别单元400,附图5所示的知识库构建单元500、人脸识别子单元510、提取子单元520、标识子单元530、保存子单元540,或者附图6所示的截取子单元505)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的人物识别的方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据人物识别方法的电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至人物识别方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
人物识别方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与人物识别方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(Liquid Crystal Display,LCD)、发光二极管(Light EmittingDiode,LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuits,ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(programmable logicdevice,PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(Cathode Ray Tube,阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,直接从用户信息行为的相关内容中识别出兴趣点,从而保证了为用户推送的兴趣点能够与用户意图相吻合,用户体验良好。因为直接从用户信息行为的相关内容中识别出兴趣点,所以避免了推送的兴趣点不满足用户的需要的问题,进而提升了用户体验。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (10)

1.一种人物识别方法,其特征在于,包括:
接收与视频流中的当前视频帧对应的人物识别请求;
提取所述当前视频帧中的人体特征;
将所述当前视频帧中的人体特征与知识库中保存的所述视频流中的第一视频帧的人体特征相匹配;
在匹配成功的情况下,将所述第一视频帧的第一人物标识作为所述人物识别请求的识别结果。
2.根据权利要求1所述的方法,其特征在于,接收与所述视频流中的当前视频帧对应的人物识别请求之前,还包括:
对所述视频流中的第二视频帧进行人脸识别,得到所述第二视频帧的第二人物标识,其中,所述第二视频帧的图像中包括人物脸部;
提取所述第二视频帧和所述第一视频帧中的人体特征,其中,所述第一视频帧的图像中不包括人物脸部;
在所述第二视频帧中的人体特征和所述第一视频帧中的人体特征匹配成功的情况下,将所述第二人物标识作为所述第一视频帧的第一人物标识;
将所述第一视频帧及其第一人物标识保存到所述知识库中。
3.根据权利要求2所述的方法,其特征在于,对视频流中的第二视频帧进行人脸识别之前,还包括:
从所述视频流中截取至少一个所述第一视频帧和至少一个所述第二视频帧。
4.根据权利要求1-3所述的方法,其特征在于,所述方法还包括:所述识别请求中包括所述当前视频帧的图像,所述当前视频帧的图像是在所述视频流的播放端通过截图或拍照获取的。
5.一种人物识别装置,其特征在于,包括:
接收单元,用于接收与视频流中的当前视频帧对应的人物识别请求;
提取单元,用于提取所述当前视频帧中的人体特征;
匹配单元,用于将所述当前视频帧中的人体特征与知识库中保存的所述视频流中的第一视频帧的人体特征相匹配;
识别单元,用于在匹配成功的情况下,将所述第一视频帧的第一人物标识作为所述人物识别请求的识别结果。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括知识库构建单元,所述知识库构建单元包括:
人脸识别子单元,用于:接收与所述视频流中的当前视频帧对应的人物识别请求之前,对所述视频流中的第二视频帧进行人脸识别,得到所述第二视频帧的第二人物标识,其中,所述第二视频帧的图像中包括人物脸部;
提取子单元,用于提取所述第二视频帧和所述第一视频帧中的人体特征,其中,所述第一视频帧的图像中不包括人物脸部;
标识子单元,用于:在所述第二视频帧中的人体特征和所述第一视频帧中的人体特征匹配成功的情况下,将所述第二人物标识作为所述第一视频帧的第一人物标识;
保存子单元,用于将所述第一视频帧及其第一人物标识保存到所述知识库中。
7.根据权利要求6所述的装置,其特征在于,所述知识库构建单元还包括截取子单元,所述截取子单元用于:
对视频流中的第二视频帧进行人脸识别之前,从所述视频流中截取至少一个所述第一视频帧和至少一个所述第二视频帧。
8.根据权利要求5-7所述的装置,其特征在于,所述识别请求中包括所述当前视频帧的图像,所述当前视频帧的图像是在所述视频流的播放端通过截图或拍照获取的。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的方法。
CN201910760681.4A 2019-08-16 2019-08-16 人物识别方法、装置、电子设备及存储介质 Active CN110458130B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910760681.4A CN110458130B (zh) 2019-08-16 2019-08-16 人物识别方法、装置、电子设备及存储介质
JP2020021940A JP6986187B2 (ja) 2019-08-16 2020-02-12 人物識別方法、装置、電子デバイス、記憶媒体、及びプログラム
US16/797,222 US20210049354A1 (en) 2019-08-16 2020-02-21 Human object recognition method, device, electronic apparatus and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910760681.4A CN110458130B (zh) 2019-08-16 2019-08-16 人物识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110458130A true CN110458130A (zh) 2019-11-15
CN110458130B CN110458130B (zh) 2022-12-06

Family

ID=68487296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910760681.4A Active CN110458130B (zh) 2019-08-16 2019-08-16 人物识别方法、装置、电子设备及存储介质

Country Status (3)

Country Link
US (1) US20210049354A1 (zh)
JP (1) JP6986187B2 (zh)
CN (1) CN110458130B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765955A (zh) * 2019-10-25 2020-02-07 北京威晟艾德尔科技有限公司 一种视频文件中人物识别方法
CN111444822A (zh) * 2020-03-24 2020-07-24 北京奇艺世纪科技有限公司 对象识别方法和装置、存储介质和电子装置
CN111641870A (zh) * 2020-06-05 2020-09-08 北京爱奇艺科技有限公司 视频播放方法、装置、电子设备及计算机存储介质
CN111640179A (zh) * 2020-06-26 2020-09-08 百度在线网络技术(北京)有限公司 宠物模型的显示方法、装置、设备以及存储介质
CN112015951A (zh) * 2020-08-28 2020-12-01 北京百度网讯科技有限公司 视频监测方法、装置、电子设备以及计算机可读介质
CN112560772A (zh) * 2020-12-25 2021-03-26 北京百度网讯科技有限公司 人脸的识别方法、装置、设备及存储介质
CN112560772B (zh) * 2020-12-25 2024-05-14 北京百度网讯科技有限公司 人脸的识别方法、装置、设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113222638A (zh) * 2021-02-26 2021-08-06 深圳前海微众银行股份有限公司 门店访客信息的架构方法、装置、设备、介质及程序产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130077835A1 (en) * 2011-09-22 2013-03-28 International Business Machines Corporation Searching with face recognition and social networking profiles
CN103079092A (zh) * 2013-02-01 2013-05-01 华为技术有限公司 在视频中获取人物信息的方法和装置
CN106384087A (zh) * 2016-09-05 2017-02-08 大连理工大学 一种基于多层网络人体特征的身份识别方法
CN107480236A (zh) * 2017-08-08 2017-12-15 深圳创维数字技术有限公司 一种信息查询方法、装置、设备和介质
CN107730810A (zh) * 2017-11-14 2018-02-23 郝思宇 一种基于图像的家庭室内监控方法、系统
CN109829418A (zh) * 2019-01-28 2019-05-31 北京影谱科技股份有限公司 一种基于背影特征的打卡方法、装置和系统
CN109872407A (zh) * 2019-01-28 2019-06-11 北京影谱科技股份有限公司 一种人脸识别方法、装置、设备及打卡方法、装置和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4675811B2 (ja) * 2006-03-29 2011-04-27 株式会社東芝 位置検出装置、自律移動装置、位置検出方法および位置検出プログラム
JP2010092287A (ja) * 2008-10-08 2010-04-22 Panasonic Corp 映像管理装置、映像管理システムおよび映像管理方法
JP5427622B2 (ja) * 2010-01-22 2014-02-26 Necパーソナルコンピュータ株式会社 音声変更装置、音声変更方法、プログラム及び記録媒体
JP5783759B2 (ja) * 2011-03-08 2015-09-24 キヤノン株式会社 認証装置、認証方法、および認証プログラム、並びに記録媒体
EP3418944B1 (en) * 2017-05-23 2024-03-13 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130077835A1 (en) * 2011-09-22 2013-03-28 International Business Machines Corporation Searching with face recognition and social networking profiles
CN103079092A (zh) * 2013-02-01 2013-05-01 华为技术有限公司 在视频中获取人物信息的方法和装置
CN106384087A (zh) * 2016-09-05 2017-02-08 大连理工大学 一种基于多层网络人体特征的身份识别方法
CN107480236A (zh) * 2017-08-08 2017-12-15 深圳创维数字技术有限公司 一种信息查询方法、装置、设备和介质
CN107730810A (zh) * 2017-11-14 2018-02-23 郝思宇 一种基于图像的家庭室内监控方法、系统
CN109829418A (zh) * 2019-01-28 2019-05-31 北京影谱科技股份有限公司 一种基于背影特征的打卡方法、装置和系统
CN109872407A (zh) * 2019-01-28 2019-06-11 北京影谱科技股份有限公司 一种人脸识别方法、装置、设备及打卡方法、装置和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
海兰察: ""鹰眼计划"", 《住宅与房地产》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765955A (zh) * 2019-10-25 2020-02-07 北京威晟艾德尔科技有限公司 一种视频文件中人物识别方法
CN111444822A (zh) * 2020-03-24 2020-07-24 北京奇艺世纪科技有限公司 对象识别方法和装置、存储介质和电子装置
CN111444822B (zh) * 2020-03-24 2024-02-06 北京奇艺世纪科技有限公司 对象识别方法和装置、存储介质和电子装置
CN111641870A (zh) * 2020-06-05 2020-09-08 北京爱奇艺科技有限公司 视频播放方法、装置、电子设备及计算机存储介质
CN111640179A (zh) * 2020-06-26 2020-09-08 百度在线网络技术(北京)有限公司 宠物模型的显示方法、装置、设备以及存储介质
CN111640179B (zh) * 2020-06-26 2023-09-01 百度在线网络技术(北京)有限公司 宠物模型的显示方法、装置、设备以及存储介质
CN112015951A (zh) * 2020-08-28 2020-12-01 北京百度网讯科技有限公司 视频监测方法、装置、电子设备以及计算机可读介质
CN112015951B (zh) * 2020-08-28 2023-08-01 北京百度网讯科技有限公司 视频监测方法、装置、电子设备以及计算机可读介质
CN112560772A (zh) * 2020-12-25 2021-03-26 北京百度网讯科技有限公司 人脸的识别方法、装置、设备及存储介质
CN112560772B (zh) * 2020-12-25 2024-05-14 北京百度网讯科技有限公司 人脸的识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP6986187B2 (ja) 2021-12-22
US20210049354A1 (en) 2021-02-18
CN110458130B (zh) 2022-12-06
JP2021034003A (ja) 2021-03-01

Similar Documents

Publication Publication Date Title
CN110458130A (zh) 人物识别方法、装置、电子设备及存储介质
CN110740389B (zh) 视频定位方法、装置、计算机可读介质及电子设备
US20170116465A1 (en) Video processing method and system, video player and cloud server
CN109493888B (zh) 漫画配音方法及装置、计算机可读存储介质、电子设备
CN104866275B (zh) 一种用于获取图像信息的方法和装置
CN105872717A (zh) 视频处理方法及系统、视频播放器与云服务器
CN111726608A (zh) 一种视频的卡顿测试方法、装置、电子设备及存储介质
CN110166811A (zh) 弹幕信息的处理方法、装置及设备
CN112672219A (zh) 评论信息的交互方法和装置、电子设备
CN110517096A (zh) 内容植入方法、装置、电子设备及存储介质
CN112866577B (zh) 图像的处理方法、装置、计算机可读介质及电子设备
CN110532415A (zh) 图像搜索处理方法、装置、设备及存储介质
CN111405371A (zh) 一种数据处理的方法以及相关装置
CN108958690B (zh) 多屏互动方法、装置、终端设备、服务器及存储介质
CN111654690A (zh) 直播视频延迟时间的确定方法、装置以及电子设备
CN110517079A (zh) 数据处理方法、装置、电子设备和存储介质
CN110493614A (zh) 视频控制方法、装置及设备
CN111931465B (zh) 基于用户操作自动生成用户手册的方法及系统
CN114168775A (zh) 特征信息获取方法及装置、存储介质及电子设备
CN111352685B (zh) 一种输入法键盘的展示方法、装置、设备及存储介质
CN114245193A (zh) 显示控制方法、装置和电子设备
CN111612986A (zh) 监测方法、装置、存储柜及存储介质
CN111708674A (zh) 用于确定重点学习内容的方法、装置、设备及存储介质
CN111355985A (zh) 一种视频广告的生成方法
CN110516030A (zh) 意图词的确定方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210511

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant after: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant