CN114968044B - 图片展示方法、装置、电子设备和存储介质 - Google Patents

图片展示方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN114968044B
CN114968044B CN202210882859.4A CN202210882859A CN114968044B CN 114968044 B CN114968044 B CN 114968044B CN 202210882859 A CN202210882859 A CN 202210882859A CN 114968044 B CN114968044 B CN 114968044B
Authority
CN
China
Prior art keywords
picture
static
dynamic
entity
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210882859.4A
Other languages
English (en)
Other versions
CN114968044A (zh
Inventor
张秋雨
叶娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Toycloud Technology Co Ltd
Original Assignee
Anhui Toycloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Toycloud Technology Co Ltd filed Critical Anhui Toycloud Technology Co Ltd
Priority to CN202210882859.4A priority Critical patent/CN114968044B/zh
Publication of CN114968044A publication Critical patent/CN114968044A/zh
Application granted granted Critical
Publication of CN114968044B publication Critical patent/CN114968044B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/62Extraction of image or video features relating to a temporal dimension, e.g. time-based feature extraction; Pattern tracking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及计算机技术领域,本发明提供一种图片展示方法、装置、电子设备和存储介质,所述方法包括:展示静态图片;响应于动态展示操作,获取动态展示操作在静态图片中的操作位置,并基于操作位置确定待展示区域;对静态图片在待展示区域内的静态图块进行语义理解,得到语义文本,并对语义文本进行实体识别,得到文本实体;对静态图块进行场景分析,得到静态图块的场景信息;基于文本实体和/或场景信息,确定待展示区域对应的动态图块,并在待展示区域展示动态图块。本发明能够实现灵活根据不同待展示区域进行动态展示,避免传统方法中以静态图片展示无法生动表达图片内容以及以视频展示无法根据灵活变更展示区域的问题。

Description

图片展示方法、装置、电子设备和存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种图片展示方法、装置、电子设备和存储介质。
背景技术
在信息化教育背景下,多使用静态图片或视频的方式进行辅助教案展示,以增加课程活动的趣味性和吸引力。
然而,静态图片是以静态形式进行展示,无法展示动态过程,进而会影响教学效果。视频展示的内容虽然是动态的,但视频需要连贯展示,无法根据用户需求灵活变更动态展示的内容。
发明内容
本发明提供一种图片展示方法、装置、电子设备和存储介质,用以解决现有技术中无法根据用户需求灵活进行图片展示的缺陷。
本发明提供一种图片展示方法,包括:
展示静态图片;
响应于动态展示操作,获取所述动态展示操作在所述静态图片中的操作位置,并基于所述操作位置确定待展示区域;
对所述静态图片在所述待展示区域内的静态图块进行语义理解,得到语义文本,并对所述语义文本进行实体识别,得到文本实体;
对所述静态图块进行场景分析,得到所述静态图块的场景信息;
基于所述文本实体和/或所述场景信息,确定所述待展示区域对应的动态图块,并在所述待展示区域展示所述动态图块。
根据本发明提供的一种图片展示方法,所述动态图块基于如下步骤生成:
提取所述静态图块中所述文本实体对应的实体对象;
基于所述场景信息,以及所述实体对象的属性信息,确定所述实体对象的运动模式;
基于所述实体对象以及所述运动模式,生成所述动态图块。
根据本发明提供的一种图片展示方法,所述基于所述场景信息,以及所述实体对象的属性信息,确定所述实体对象的运动模式,包括:
基于所述属性信息,确定所述实体对象对应的多个候选运动模式;
基于所述场景信息,从所述多个候选运动模式中确定所述实体对象的运动模式。
根据本发明提供的一种图片展示方法,所述基于所述实体对象以及所述运动模式,生成所述动态图块,包括:
基于所述运动模式,确定所述实体对象各时刻在所述静态图块中的位置,得到各时刻下的帧图块;
基于各时刻下的帧图块,确定对应的动态图块。
根据本发明提供的一种图片展示方法,所述基于所述运动模式,确定所述实体对象各时刻在所述静态图块中的位置,包括:
基于所述运动模式,确定所述实体对象各时刻的运动轨迹;
基于所述实体对象各时刻的运动轨迹,确定所述实体对象各时刻在所述静态图块中的位置。
根据本发明提供的一种图片展示方法,所述动态展示操作包括用户手动操作或用户语音操作。
根据本发明提供的一种图片展示方法,所述获取所述动态展示操作在所述静态图片中的操作位置,包括:
在检测到所述用户手动操作的情况下,获取所述用户手动操作所指示的所述操作位置;
在检测到所述用户语音操作的情况下,对所述用户语音操作中的语音数据进行语音识别,得到识别文本,基于所述识别文本确定所述操作位置。
本发明还提供一种图片展示装置,包括:
显示单元,用于展示静态图片;
确定单元,用于响应于动态展示操作,获取所述动态展示操作在所述静态图片中的操作位置,并基于所述操作位置确定待展示区域;
识别单元,用于对所述静态图片在所述待展示区域内的静态图块进行语义理解,得到语义文本,并对所述语义文本进行实体识别,得到文本实体;
分析单元,用于对所述静态图块进行场景分析,得到所述静态图块的场景信息;
展示单元,用于基于所述文本实体和/或所述场景信息,确定所述待展示区域对应的动态图块,并在所述待展示区域展示所述动态图块。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述图片展示方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述图片展示方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述图片展示方法。
本发明提供的图片展示方法、装置、电子设备和存储介质,由于动态展示操作用于指示用户所需的待展示区域,从而在响应于动态展示操作后,可以获取动态展示操作在静态图片中的操作位置,并基于操作位置确定满足用户需求的待展示区域。同时,基于待展示区域内静态图块对应的文本实体和/或场景信息,确定待展示区域对应的动态图块,并在待展示区域展示动态图块,实现灵活根据不同待展示区域进行动态展示,避免传统方法中以静态图片展示无法生动表达图片内容以及以视频展示无法根据灵活变更展示区域的问题。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的图片展示方法的流程示意图;
图2是本发明提供的动态图块生成方法的流程示意图;
图3是本发明提供的动态图块生成方法中步骤220的实施方式的流程示意图;
图4是本发明提供的动态图块生成方法中步骤230的实施方式的流程示意图;
图5是本发明提供的动态图块生成方法中步骤231的实施方式的流程示意图;
图6是本发明提供的图片展示装置的结构示意图;
图7是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,多使用静态图片或视频的方式进行辅助教案展示,以增加课程活动的趣味性和吸引力。然而,静态图片展示的内容虽然形象,但其是以静态形式进行展示,无法展示动态过程,进而会影响教学效果。视频展示的内容虽然是动态的,但视频需要连贯展示,无法根据用户需求灵活变更动态展示的内容。
对此,本发明提供一种图片展示方法。图1是本发明提供的图片展示方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤110、展示静态图片。
此处,静态图片即需要进行展示的图片,静态图片中可以包括多个图块,且各图块所展示的内容不同。例如静态图片中可以包括在雷雨天气下猴子爬上电线杆的静态图块、在雷雨天气下狐狸踩在水潭中的静态图块、在雷雨天气下山羊躲在大树下的静态图块、在雷雨天气下兔子躲在房间里的静态图块等。
传统方法中在进行图片展示时,通常是展示该静态图片或该静态图片对应的视频,然而静态图片无法生动展示出图片中的内容,可能会影响教学效果;该静态图片对应的视频虽然可以动态展示出图片中的内容,但需要连贯展示,例如视频可以同时连贯展示在雷雨天气下猴子爬上电线杆的静态图块、在雷雨天气下狐狸踩在水潭中的静态图块、在雷雨天气下山羊躲在大树下的静态图块以及在雷雨天气下兔子躲在房间里的静态图块对应的动态内容,但无法单独展示其中任意一个静态图块对应的动态内容。
步骤120、响应于动态展示操作,获取动态展示操作在静态图片中的操作位置,并基于操作位置确定待展示区域。
具体地,动态展示操作可以理解为用户在指示静态图片中待展示区域对应操作位置时所发出的触发指令,其可以为用户通过遥控、鼠标、点击、触摸等方式指示操作位置所生成的触发指令,也可以用户通过语音方式指示操作位置所生成的触发指令,本发明实施例对此不作具体限定。
待展示区域即静态图片上需要展示的区域,例如待展示区域可以为在雷雨天气下猴子爬上电线杆的静态图块对应的区域,也可以为在雷雨天气下狐狸踩在水潭中的静态图块对应的区域,还可以为其它静态图块区域。
动态展示操作中携带有操作位置,进而根据操作位置可以确定待展示区域,如动态展示操作为用户通过鼠标点击在雷雨天气下猴子爬上电线杆的静态图块,对应的待展示区域则为在雷雨天气下猴子爬上电线杆的静态图块对应的区域。
可以理解的是,动态展示操作中可以包括一个或多个操作位置,也就是待展示区域可以为一个,也可以为多个,其具体可以根据用户的实际需求确定,本发明实施例对此不作具体限定。
步骤130、对静态图片在待展示区域内的静态图块进行语义理解,得到语义文本,并对语义文本进行实体识别,得到文本实体。
步骤140、对静态图块进行场景分析,得到静态图块的场景信息。
具体地,语义文本用于表征待展示区域内的静态图块的语义信息。例如,对在雷雨天气下猴子爬上电线杆的静态图块进行语义理解时,得到的语义文本为“在雷雨天气下猴子爬上电线杆”。
文本实体用于表征静态图块中对应的实物信息,如对语义文本“在雷雨天气下猴子爬上电线杆”进行实体识别后,得到文本实体为“雷”、“雨”、“猴子”和“电线杆”,其与静态图块中的实体对象“雷”、“雨”、“猴子”和“电线杆”对应。
静态图块的场景信息用于指示静态图块的场景。例如,对在雷雨天气下猴子爬上电线杆的静态图块进行场景分析,得到的场景信息为“雷雨天气+猴子爬上电线杆”。
步骤150、基于文本实体和/或场景信息,确定待展示区域对应的动态图块,并在待展示区域展示动态图块。
具体地,动态图块用于表征待展示区域的静态图片对应的动态信息,基于文本实体和/或场景信息,确定待展示区域对应的动态图块并进行展示。例如,可以对文本实体和/或场景信息进行动态渲染,生成对应的动态图块并进行展示,也可以基于文本实体和/或场景信息在存储有多个候选动态图块的图片资源库中查找,确定对应的动态图块,本发明实施例对此不作具体限定。例如,在雷雨天气下狐狸踩在水潭中的静态图块对应的动态图块可以为狐狸被雷电劈到,发出惨叫,身体变形;在雷雨天气下兔子躲在房间里的静态图块对应的动态图块可以为兔子在房间里高兴的蹦蹦跳跳。
可以理解的是,本发明实施例可以预先设置图片资源库,图片资源库中可以存储有不同文本实体对应的动态图块,从而可以根据静态图块对应的文本实体确定动态图块;也可以存储有不同场景信息对应动态图块,从而可以根据静态图块对应的场景信息确定动态图块;还可以存储有在不同场景信息下的文本实体对应的动态图块,从而可以根据静态图块对应的文本实体和场景信息确定动态图块。
本发明实施例提供的图片展示方法,由于动态展示操作用于指示用户所需的待展示区域,从而在响应于动态展示操作后,可以获取动态展示操作在静态图片中的操作位置,并基于操作位置确定满足用户需求的待展示区域。同时,基于待展示区域内静态图块对应的文本实体和/或场景信息,确定待展示区域对应的动态图块,并在待展示区域展示动态图块,实现灵活根据不同待展示区域进行动态展示,避免传统方法中以静态图片展示无法生动表达图片内容以及以视频展示无法根据灵活变更展示区域的问题。
基于上述实施例,图2是本发明提供的动态图块生成方法的流程示意图,如图2所示,动态图块基于如下步骤生成:
步骤210、提取静态图块中文本实体对应的实体对象;
步骤220、基于场景信息,以及实体对象的属性信息,确定实体对象的运动模式;
步骤230、基于实体对象以及运动模式,生成动态图块。
具体地,静态图块中的实体对象与上述语义文本中的文本实体对应,如语义文本“在雷雨天气下猴子爬上电线杆”的文本实体为“雷”、“雨”、“猴子”和“电线杆”,静态图块中的实体对象为“雷”、“雨”、“猴子”和“电线杆”。可选地,在提取静态图块中文本实体对应的实体对象时,可以通过查找边缘算法从静态图块中提取出实体对象的边缘轮廓,然后通过实体对象的边缘轮廓提取得到实体对象。
实体对象的属性信息用于表征实体对象的动态特征信息,进而根据实体对象的动态特征信息可以确定实体对象的多个候选运动模式。可选地,实体对象的属性信息可以根据预设知识库确定,例如静态图块中的实体对象为“兔子”,根据预设知识库可知,兔子的动态特征可以表现为蹦蹦跳跳、全身颤抖、噗通倒下等。
此外,实体对象的运动模式用于表征动态图块中实体对象的运动方式。对于不同的场景信息,实体对象的运动模式不同,即根据场景信息和实体对象的属性信息可以确定实体对象的运动模式。例如对于“兔子在雷雨天气躲在房间里”的场景,由于兔子是安全的,从而兔子对应的运动模式为“蹦蹦跳跳”;又如对于“兔子在雪地上”的场景,由于非常寒冷,从而兔子对应的运动模式为“全身颤抖”。
在确定实体对象的运动模式后,动态图块中的实体对象是按照运动模式进行运动的,从而可以基于实体对象以及运动模式,生成对应的动态图块。
由此可见,本发明实施例基于场景信息以及实体对象的属性信息,可以确定实体对象的运动模式,从而可以基于实体对象以及运动模式,准确生成动态图块,以在待展示区域进行展示。
基于上述任一实施例,图3是本发明提供的动态图块生成方法中步骤220的实施方式的流程示意图,如图3所示,步骤220包括:
步骤221、基于属性信息,确定实体对象对应的多个候选运动模式;
步骤222、基于场景信息,从多个候选运动模式中确定实体对象的运动模式。
具体地,属性信息用于表征实体对象的动态特征信息,进而根据实体对象的动态特征信息可以确定实体对象的多个候选运动模式。例如静态图块中的实体对象为“兔子”,兔子的动态特征可以表现为蹦蹦跳跳、全身颤抖、噗通倒下等,也就是实体对象“兔子”对应的候选运动模式包括蹦蹦跳跳、全身颤抖、噗通倒下等。
此外,对于不同的场景信息,实体对象的运动模式不同,即根据场景信息,可以从多个候选运动模式中确定实体对象的运动模式。例如对于“兔子在雷雨天气躲在房间里”的场景,由于兔子是安全的,从而兔子对应的运动模式为“蹦蹦跳跳”;又如对于“兔子在雪地上”的场景,由于非常寒冷,从而兔子对应的运动模式为“全身颤抖”。
基于上述任一实施例,图4是本发明提供的动态图块生成方法中步骤230的实施方式的流程示意图,如图4所示,步骤230包括:
步骤231、基于运动模式,确定实体对象各时刻在静态图块中的位置,得到各时刻下的帧图块;
步骤232、基于各时刻下的帧图块,确定对应的动态图块。
具体地,由于动态图块中实体对象是按照运动模式进行运动的,从而实体对象各时刻的位置可能不同。对此,本发明实施例根据运动模式,确定实体对象各时刻在静态图块中的位置,从而可以得到每一时刻下的帧图块。其中,各时刻下的帧图块中实体对象的位置可能不同。在得到各时刻下的帧图块后,可以按照帧图块对应的时序信息进行合成,得到对应的动态图块,使得动态图块中实体对象按照运动模式进行运动。
基于上述任一实施例,图5是本发明提供的动态图块生成方法中步骤231的实施方式的流程示意图,如图5所示,步骤231中基于运动模式,确定实体对象各时刻在静态图块中的位置,包括:
步骤2311、基于运动模式,确定实体对象各时刻的运动轨迹;
步骤2312、基于实体对象各时刻的运动轨迹,确定实体对象各时刻在静态图块中的位置。
具体地,运动模式用于指示实体对象各时刻的运动轨迹,各时刻的运动轨迹指实体对象从开始位置到结束为止所经过的路线组成的动作的空间特征。由于运动轨迹通常由运动轨迹方向、运动轨迹形式和运动幅度表示,从而根据实体对象各时刻的运动轨迹,可以确定实体对象各时刻在静态图块中的位置,进而能够根据实体对象各时刻在静态图块中的位置准确生成对应的动态图块,以在待展示区域进行展示。
基于上述任一实施例,动态展示操作包括用户手动操作或用户语音操作。
具体地,用户手动操作可以理解为用户指示操作位置的手动操作,其可以为用户点击操作确定操作位置,也可以为用户触摸操作确定操作位置,本发明实施例对此不作具体限定。
用户语音操作可以理解为用户指示操作位置的语音操作,其可以是通过语音采集设备实时采集得到的用户语音。由于用户语音中包含操作位置,从而可以对于语音进行语音识别,确定操作位置。
基于上述任一实施例,获取动态展示操作在静态图片中的操作位置,包括:
在检测到用户手动操作的情况下,获取用户手动操作所指示的操作位置;
在检测到用户语音操作的情况下,对用户语音操作中的语音数据进行语音识别,得到识别文本,基于识别文本确定操作位置。
具体地,在检测到用户手动操作的情况下,表明用户通过手动操作方式指示操作位置,此时可以获取对应的用户手动操作指令,该指令中携带有操作位置。例如,用户点击屏幕上在雷雨天气下猴子爬上电线杆的静态图块,表明操作位置为该静态图块对应的位置,待展示区域为该静态图块对应的图片区域。
在检测到用户语音操作的情况下,表明用户通过语音方式指示操作位置。此时,可以获取用户语音操作中的语音数据,并对语音数据进行语音识别,得到识别文本,并基于识别文本确定操作位置。例如,语音数据为“展示在雷雨天气下猴子爬上电线杆的静态图块”,则对其进行语音识别后,得到对应的识别文本为“展示在雷雨天气下猴子爬上电线杆的静态图块”,基于该识别文本可以确定操作位置为在雷雨天气下猴子爬上电线杆的静态图块对应的位置,待展示区域为该静态图块对应的图片区域。
由此可见,本发明实施例在检测到用户手动操作或检测到用户语音操作的情况下,均能准确且快速获取用户所需待展示区域对应的操作位置,以满足用户对不同区域的展示需求。
下面对本发明提供的图片展示装置进行描述,下文描述的图片展示装置与上文描述的图片展示方法可相互对应参照。
基于上述任一实施例,图6是本发明提供的图片展示装置的结构示意图,如图6所示,该装置包括:
显示单元610,用于展示静态图片;
确定单元620,用于响应于动态展示操作,获取所述动态展示操作在所述静态图片中的操作位置,并基于所述操作位置确定待展示区域;
识别单元630,用于对所述静态图片在所述待展示区域内的静态图块进行语义理解,得到语义文本,并对所述语义文本进行实体识别,得到文本实体;
分析单元640,用于对所述静态图块进行场景分析,得到所述静态图块的场景信息;
展示单元650,用于基于所述文本实体和/或所述场景信息,确定所述待展示区域对应的动态图块,并在所述待展示区域展示所述动态图块。
基于上述任一实施例,所述装置还包括:
提取单元,用于提取所述静态图块中所述文本实体对应的实体对象;
模式确定单元,用于基于所述场景信息,以及所述实体对象的属性信息,确定所述实体对象的运动模式;
图块生成单元,用于基于所述实体对象以及所述运动模式,生成所述动态图块。
基于上述任一实施例,所述模式确定丹云,包括:
候选模式确定单元,用于基于所述属性信息,确定所述实体对象对应的多个候选运动模式;
筛选单元,用于基于所述场景信息,从所述多个候选运动模式中确定所述实体对象的运动模式。
基于上述任一实施例,所述图块生成单元,包括:
帧图块确定单元,用于基于所述运动模式,确定所述实体对象各时刻在所述静态图块中的位置,得到各时刻下的帧图块;
生成子单元,用于基于各时刻下的帧图块,确定对应的动态图块。
基于上述任一实施例,所述帧图块确定单元,包括:
轨迹确定单元,用于基于所述运动模式,确定所述实体对象各时刻的运动轨迹;
位置确定单元,用于基于所述实体对象各时刻的运动轨迹,确定所述实体对象各时刻在所述静态图块中的位置。
基于上述任一实施例,所述动态展示操作包括用户手动操作或用户语音操作。
基于上述任一实施例,所述确定单元610,用于:
在检测到所述用户手动操作的情况下,获取所述用户手动操作所指示的所述操作位置;
在检测到所述用户语音操作的情况下,对所述用户语音操作中的语音数据进行语音识别,得到识别文本,基于所述识别文本确定所述操作位置。
图7是本发明提供的电子设备的结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、存储器(memory)720、通信接口(Communications Interface)730和通信总线740,其中,处理器710,存储器720,通信接口730通过通信总线740完成相互间的通信。处理器710可以调用存储器720中的逻辑指令,以执行图片展示方法,该方法包括:展示静态图片;响应于动态展示操作,获取所述动态展示操作在所述静态图片中的操作位置,并基于所述操作位置确定待展示区域;对所述静态图片在所述待展示区域内的静态图块进行语义理解,得到语义文本,并对所述语义文本进行实体识别,得到文本实体;对所述静态图块进行场景分析,得到所述静态图块的场景信息;基于所述文本实体和/或所述场景信息,确定所述待展示区域对应的动态图块,并在所述待展示区域展示所述动态图块。
此外,上述的存储器720中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的图片展示方法,该方法包括:展示静态图片;响应于动态展示操作,获取所述动态展示操作在所述静态图片中的操作位置,并基于所述操作位置确定待展示区域;对所述静态图片在所述待展示区域内的静态图块进行语义理解,得到语义文本,并对所述语义文本进行实体识别,得到文本实体;对所述静态图块进行场景分析,得到所述静态图块的场景信息;基于所述文本实体和/或所述场景信息,确定所述待展示区域对应的动态图块,并在所述待展示区域展示所述动态图块。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的图片展示方法,该方法包括:展示静态图片;响应于动态展示操作,获取所述动态展示操作在所述静态图片中的操作位置,并基于所述操作位置确定待展示区域;对所述静态图片在所述待展示区域内的静态图块进行语义理解,得到语义文本,并对所述语义文本进行实体识别,得到文本实体;对所述静态图块进行场景分析,得到所述静态图块的场景信息;基于所述文本实体和/或所述场景信息,确定所述待展示区域对应的动态图块,并在所述待展示区域展示所述动态图块。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种图片展示方法,其特征在于,包括:
展示静态图片,所述静态图片中包括多个图块,且各图块所展示的内容不同;
响应于动态展示操作,获取所述动态展示操作在所述静态图片中的操作位置,并基于所述操作位置确定待展示区域,所述动态展示操作包括用户手动操作或用户语音操作;
对所述静态图片在所述待展示区域内的静态图块进行语义理解,得到语义文本,并对所述语义文本进行实体识别,得到文本实体,所述语义文本用于表征待展示区域内的静态图块的语义信息;
对所述静态图块进行场景分析,得到所述静态图块的场景信息;
基于所述文本实体和/或所述场景信息,确定所述待展示区域对应的动态图块,并在所述待展示区域展示所述动态图块;
所述动态图块基于如下步骤生成:
提取所述静态图块中所述文本实体对应的实体对象,所述实体对象是通过查找边缘算法从静态图块中提取出实体对象的边缘轮廓,然后通过实体对象的边缘轮廓提取得到的;
基于所述场景信息,以及所述实体对象的属性信息,确定所述实体对象的运动模式;
基于所述实体对象以及所述运动模式,生成所述动态图块。
2.根据权利要求1所述的图片展示方法,其特征在于,所述基于所述场景信息,以及所述实体对象的属性信息,确定所述实体对象的运动模式,包括:
基于所述属性信息,确定所述实体对象对应的多个候选运动模式;
基于所述场景信息,从所述多个候选运动模式中确定所述实体对象的运动模式。
3.根据权利要求1所述的图片展示方法,其特征在于,所述基于所述实体对象以及所述运动模式,生成所述动态图块,包括:
基于所述运动模式,确定所述实体对象各时刻在所述静态图块中的位置,得到各时刻下的帧图块;
基于各时刻下的帧图块,确定对应的动态图块。
4.根据权利要求3所述的图片展示方法,其特征在于,所述基于所述运动模式,确定所述实体对象各时刻在所述静态图块中的位置,包括:
基于所述运动模式,确定所述实体对象各时刻的运动轨迹;
基于所述实体对象各时刻的运动轨迹,确定所述实体对象各时刻在所述静态图块中的位置。
5.根据权利要求1所述的图片展示方法,其特征在于,所述获取所述动态展示操作在所述静态图片中的操作位置,包括:
在检测到所述用户手动操作的情况下,获取所述用户手动操作所指示的所述操作位置;
在检测到所述用户语音操作的情况下,对所述用户语音操作中的语音数据进行语音识别,得到识别文本,基于所述识别文本确定所述操作位置。
6.一种图片展示装置,其特征在于,包括:
显示单元,用于展示静态图片,所述静态图片中包括多个图块,且各图块所展示的内容不同;
确定单元,用于响应于动态展示操作,获取所述动态展示操作在所述静态图片中的操作位置,并基于所述操作位置确定待展示区域,所述动态展示操作包括用户手动操作或用户语音操作;
识别单元,用于对所述静态图片在所述待展示区域内的静态图块进行语义理解,得到语义文本,并对所述语义文本进行实体识别,得到文本实体,所述语义文本用于表征待展示区域内的静态图块的语义信息;
分析单元,用于对所述静态图块进行场景分析,得到所述静态图块的场景信息;
展示单元,用于基于所述文本实体和/或所述场景信息,确定所述待展示区域对应的动态图块,并在所述待展示区域展示所述动态图块;
所述动态图块基于如下步骤生成:
提取所述静态图块中所述文本实体对应的实体对象,所述实体对象是通过查找边缘算法从静态图块中提取出实体对象的边缘轮廓,然后通过实体对象的边缘轮廓提取得到的;
基于所述场景信息,以及所述实体对象的属性信息,确定所述实体对象的运动模式;
基于所述实体对象以及所述运动模式,生成所述动态图块。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述图片展示方法。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述图片展示方法。
CN202210882859.4A 2022-07-26 2022-07-26 图片展示方法、装置、电子设备和存储介质 Active CN114968044B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210882859.4A CN114968044B (zh) 2022-07-26 2022-07-26 图片展示方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210882859.4A CN114968044B (zh) 2022-07-26 2022-07-26 图片展示方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN114968044A CN114968044A (zh) 2022-08-30
CN114968044B true CN114968044B (zh) 2023-01-24

Family

ID=82968682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210882859.4A Active CN114968044B (zh) 2022-07-26 2022-07-26 图片展示方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114968044B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117593702B (zh) * 2024-01-18 2024-04-09 深圳市光明顶技术有限公司 远程监控方法、装置、设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3603629B2 (ja) * 1998-12-24 2004-12-22 カシオ計算機株式会社 画像処理装置及び画像処理方法
JP4321374B2 (ja) * 2004-06-17 2009-08-26 株式会社日立製作所 パノラマ映像記録再生装置
JP2010045619A (ja) * 2008-08-13 2010-02-25 Nikon Corp 画像再生装置、撮像装置、画像再生方法、画像再生プログラム
JP2010087722A (ja) * 2008-09-30 2010-04-15 Fujifilm Corp 撮影装置及び動画像編集方法
US9177410B2 (en) * 2013-08-09 2015-11-03 Ayla Mandel System and method for creating avatars or animated sequences using human body features extracted from a still image
CN104318596B (zh) * 2014-10-08 2017-10-20 北京搜狗科技发展有限公司 一种动态图片的生成方法以及生成装置
US10204395B2 (en) * 2016-10-19 2019-02-12 Microsoft Technology Licensing, Llc Stereoscopic virtual reality through caching and image based rendering

Also Published As

Publication number Publication date
CN114968044A (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN110430443B (zh) 视频镜头剪切的方法、装置、计算机设备及存储介质
CN111491173B (zh) 一种直播封面确定方法、装置、计算机设备及存储介质
CN110784759B (zh) 弹幕信息处理方法、装置、电子设备及存储介质
CN109803180B (zh) 视频预览图生成方法、装置、计算机设备及存储介质
CN110602554A (zh) 封面图像确定方法、装置及设备
CN111228821B (zh) 智能检测穿墙外挂方法、装置、设备及其存储介质
CN109815776B (zh) 动作提示方法和装置、存储介质及电子装置
CN114025219B (zh) 增强现实特效的渲染方法、装置、介质及设备
CN114968044B (zh) 图片展示方法、装置、电子设备和存储介质
CN109583443A (zh) 一种基于文字识别的视频内容判断方法
CN108537129A (zh) 训练样本的标注方法、装置和系统
CN104680188A (zh) 一种人体姿态基准图像库的构建方法
CN111225287A (zh) 一种弹幕处理的方法及装置、电子设备、存储介质
CN114007064B (zh) 特效同步评估方法、装置、设备及存储介质
CN108921138B (zh) 用于生成信息的方法和装置
CN105513443A (zh) 依学习历程更新学习记录以回复学习进度的系统及方法
CN112835807B (zh) 界面识别方法、装置、电子设备和存储介质
Abend et al. Geobrowsing behaviour in Google Earth-A semantic video content analysis of on-screen navigation
CN112989112B (zh) 在线课堂内容采集方法及装置
CN113018853B (zh) 数据处理方法、装置、计算机设备和存储介质
CN115988165A (zh) 一种会议视频数据处理方法、系统、会议终端及介质
CN111768729A (zh) 一种vr场景自动解说方法、系统和存储介质
CN113505844A (zh) 标签生成方法、装置、设备、存储介质及程序产品
CN112231220A (zh) 一种游戏测试方法和装置
CN105830095B (zh) 用于选择增强现实标记的评级和建议

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant