CN112602078A - 网页内容自动生成系统 - Google Patents

网页内容自动生成系统 Download PDF

Info

Publication number
CN112602078A
CN112602078A CN201980041576.3A CN201980041576A CN112602078A CN 112602078 A CN112602078 A CN 112602078A CN 201980041576 A CN201980041576 A CN 201980041576A CN 112602078 A CN112602078 A CN 112602078A
Authority
CN
China
Prior art keywords
content
unit
web
source code
web page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980041576.3A
Other languages
English (en)
Inventor
森隆晃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Co Ltd Tsunagu Ai
TsunaguAi
Original Assignee
Co Ltd Tsunagu Ai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Co Ltd Tsunagu Ai filed Critical Co Ltd Tsunagu Ai
Publication of CN112602078A publication Critical patent/CN112602078A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/972Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Abstract

本发明提供一种能够不用编辑编程语言而简单地进行制作的网页内容自动生成系统。网页内容自动生成系统具备:图像化数据取得部,其取得网页内容来作为一个图像数据;源代码取得部,其取得以构成网页内容的HTML数据为代表的源代码;学习部,其通过对图像化数据与源代码进行解析而取得示教数据;图像数据登记部,其输入要制作的网页内容来作为一个图像数据;解析部,其解析所输入的图像数据与存储于示教数据存储部的示教数据的关联度;以及内容源代码生成部,其基于由解析部解析的关联度高的示教数据的源代码,生成与输入的图像数据相关的内容源代码。

Description

网页内容自动生成系统
技术领域
本发明涉及网页内容自动生成系统,尤其是作为用于自动地生成在因特网上公开的网页的系统而有用的网页内容自动生成系统。
背景技术
近年来,企业或运营商为了销售自身的商品、服务而制作介绍商品、服务的网页并作为网站而在因特网上通常公开的事例急剧增加。消费者能够阅览在因特网上公开的各公司的网站并作为购入商品、服务的参考。
这样的网站根据HTML(Hyper Text Markup Language,超文本标记语言)这样的标记语言、用于指定网页的样式的语言即CSS(Cascading Style Sheet)、能够使网页具有动作及交互性的JS(Java Script(注册商标))这样的编程语言、以及显示照片或插图等的jpg或png等基于数据形式的图像数据来制作。在制作及公开网站时,需要与用于制作内容的标记语言及编程语言相关的知识、以及用于将制作的内容上传到网页服务器上的与网页服务器相关的知识。这通常由具有知识和经验的网页制作人来实施这些作业。
然而,据说全世界有几十亿个这样的网站。网站一旦制作,只要公开的信息不过期,则能够一直维持公开。因此,公开的网站的数量不断增加。
而且,伴随着网站增加,运营商拥有网站的重要性不断提高。至今未拥有网站的行业人或者被认为与网站无关的行业都开始陆续制作网站。因此,网站制作的需要高涨,网页制作人的招聘率提高,由于人力资源不足而导致供不应求。
另外,不仅仅是网站的数量增加,上述HTML、CSS及JS这样的语言的版本也提高,因此,在制作网站时要求的水平上升,进而成为网页制作人的负担增加的一个原因。
作为用于减轻网站制作的负担的技术,具有专利文献1所示的使用了模板的方法(专利文献1)。根据专利文献1所记载的技术,准备在网站上发布的文章、图像等在制作网站时需要的素材,将这些素材应用到模板这样的预先决定的框架,由此,即便不具有专业的编程知识,也能够容易地制作网站。
在先技术文献
专利文献
专利文献1:日本特表2016-519347号公报
发明内容
本发明要解决的问题
通过利用这样的技术,希望制作网站的人实际上不用操作编程语言就能够制作网站,因此,起到大幅节省网站制作的时间这样的效果。
然而,在通常的网站中,复杂地配置有多个文章、图像及/或影像。在使用了上述专利文献1所记载的利用了模板的网站的制作方法的情况下,在向预先准备的模板中的各部分应用各个文章、图像及/或影像时耗费时间,产生作业效率差这样的问题。
另外,如果仅仅应用于模板,则页面整体的平衡变差,在应用之后,在文章、图像等的配置、每一行的文字数或换行的位置等中,有时需要进行微调整。在该情况下,通过编辑标记语言及编程语言来实施微调整,因此,进而导致作业效率的恶化。
而且,预先准备的模板通常是由用户从多个模板中选择的模板,因此,上述那样的微调整根据所选择的模板的种类而不同,在每次制作网站时都成为必须的作业。因此,免不了作业效率的进一步的恶化,期望实现减轻作业者的负担的网站制作系统。
本发明是鉴于这种期望而完成的,其目的在于,提供一种即便是具有复杂构造的网站也能够不对编程语言进行编辑而简单地进行制作的网页内容自动生成系统。
用于解决问题的手段
一方案的网页内容自动生成系统是自动地生成通过HTML而记述的网页内容的网页内容自动生成系统,其中,具备:图像化数据取得部,其取得发布到在因特网上公开的网站中的网页内容来作为一个图像数据;源代码取得部,其取得以构成该网页内容的HTML数据为代表的源代码;学习部,其对由图像化数据取得部取得的图像化数据与由源代码取得部取得的源代码进行解析,由此取得示教数据;图像数据登记部,其输入要制作的网页内容来作为一个图像数据;解析部,其解析所输入的图像数据与由学习部取得的示教数据的关联度;以及内容源代码生成部,其基于由解析部解析的关联度高的示教数据的HTML数据,生成与输入的图像数据相关的内容源代码。
根据一方案的网页内容自动生成系统,即便是具有复杂构造的网站,也能够不用编辑编程语言而简单地进行制作。
一方案的网页内容自动生成系统也可以是,还具备检索网站的网站检索部,所述网站检索部基于输入的检索信息,由搜寻器自动地检索在因特网上公开的网站。
根据一方案的网页内容自动生成系统,通过设置自动地检索网站且收集与检索到的网站相关的示教数据的搜寻器,不仅网站的制作能够自动化,示教数据的收集也能够自动化。
一方案的网页内容自动生成系统具备:标签赋予部,其取得发布到在因特网上公开的网站中的网页内容,按照各内容对网页内容进行标签赋予;制作部,其基于用于生成网页内容的源代码,制作构成网页内容的一部分的构成物;学习部,其基于由标签赋予部进行了标签赋予的内容、以及基于源代码和由制作部制作的构成物,取得示教数据;网页设计取得部,其取得用于制作网页内容的网页设计;以及内容源代码生成部,其基于由网页设计取得部取得的网页设计和由学习部取得的示教数据,取得网页设计的内容,生成与该内容相应的源代码。
在一方案的网页内容自动生成系统中也可以是,内容源代码生成部在网页设计的内容中存在与构成物对应的内容的情况下,基于示教数据,生成与该构成物对应的源代码。
在一方案的网页内容自动生成系统中也可以是,内容源代码生成部基于记载网页设计内的内容的位置,生成用于在网页内容中配置内容的位置信息。
在一方案的网页内容自动生成系统中也可以是,网页设计取得部在网页设计中包括图像的情况下,取得与该图像对应的图像数据,内容源代码生成部基于网页设计内的图像的位置,生成用于在网页内容内配置基于图像数据的图像的位置信息。
一方案的网页内容自动生成系统具备:标签赋予部,其取得发布到在因特网上公开的网站中的网页内容,按照各内容对网页内容进行表示该内容的标签赋予;制作部,其基于用于生成网页内容的源代码,制作构成网页内容的一部分的构成物;学习部,其基于由标签赋予部进行了标签赋予的内容、以及基于源代码和由制作部制作的构成物,取得示教数据;网页设计取得部,其取得用于制作网页内容的网页设计;以及内容源代码生成部,其基于由网页设计取得部取得的网页设计和由学习部取得的示教数据,取得网页设计的内容,生成与该内容相应的源代码。
在一方案的网页内容自动系统中也可以是,内容源代码生成部在网页设计的内容的一部分与构成物对应的情况下,基于示教数据生成与构成物对应的源代码。
在一方案的网页内容自动生成系统中也可以是,内容源代码生成部基于网页设计中的内容的位置生成与配置网页内容中的内容的位置相关的位置信息,以使得对应于网页设计的内容的布局。
在一方案的网页内容自动生成系统中也可以是,网页设计取得部在网页设计中包括图像的情况下,取得与该图像对应的图像数据,内容源代码生成部基于网页设计内的图像的位置,生成用于在网页内容内配置基于图像数据的图像的位置信息。
发明效果
根据网页内容自动生成系统,即便是具有复杂构造的网站,也能够不对标记语言及编程语言进行编辑而简单地进行制作。
附图说明
图1是示出第一实施方式中的网页内容自动生成系统1的硬件结构和软件功能的框图。
图2是示出网页内容自动生成的事先准备的流程图。
图3是示出网页数据库310的一例的图。
图4是示出将网页图像化而得到的图像化数据1000的一例的图。
图5是示出作为记述网页的源代码的HTML数据2000的一例的图。
图6是示出网页内容的制作方法的流程图。
图7是用于对第二实施方式的网页内容自动生成系统进行说明的框图。
图8是对第二实施方式的制作示教数据的情况下的处理流程进行说明的流程图。
图9是对第二实施方式的自动地生成网页的情况下的处理流程进行说明的流程图。
图10是用于对变形例的网页内容自动生成系统进行说明的框图。
具体实施方式
以下,参照附图对用于实施本发明的方式进行说明。需要说明的是,这只不过是一例,本发明的技术范围不限于此。
[第一实施方式]
首先,对第一实施方式进行说明。
[网页内容自动生成系统1的结构]
图1是用于说明第一实施方式中的网页内容自动生成系统1的硬件结构和软件功能的框图。
网页内容自动生成系统1具备控制数据的控制部100、与用户、其他设备进行通信的通信部200、存储数据的存储部300、受理来自用户的信息的输入的输入部400、以及输出由控制部100控制的数据、图像的显示部500。
控制部100具备CPU(Central Processing Unit,中央处理器)、RAM(RandomAccess Memory,随机存储器)、ROM(Read Only Memory,只读存储器)、GPU(GraphicProessing Unit,图像处理器)等。
通信部200具备用于能够与其他设备进行通信的设备,例如,依据IEEE802.11的Wi-Fi(Wireless FIDelity,无线上网)兼容设备及搭载有能够利用TCP/IP协议的硬件的设备。
控制部100读入规定的程序,根据需要而与通信部200及存储部300协同配合,由此,实现检索信息登记模块111、网站检索模块112、网页显示模块113、图像化数据取得模块114、HTML数据取得模块(源代码取得模块)115、学习模块116、示教数据存储模块117、图像数据登记模块118、图像解析模块119、以及内容源代码生成模块120。
存储部300是存储数据、文件的装置,具备由硬盘、半导体存储器、记录介质、存储卡等构成的数据的存储部。存储部300存储之后说明的网页数据库310、示教数据数据库320及网页内容数据库330。
输入部400的种类没有特别限定。作为输入部400,例如举出键盘、鼠标、触摸面板等。
显示部500的种类没有特别限定。作为显示部500,例如举出监视器、触摸面板等。
[使用了网页内容自动生成系统1的事先准备]
针对在使用本实施方式中的网页内容自动生成系统1而实施网页内容制作之前进行的事先准备来进行说明。图2是使用了网页内容自动生成系统1的事先准备的流程图。另外,图3是示出网页数据库310的一例的图。图4是示出将网页图像化而得到的图像化数据1000的一例的图,图5是示出作为记述网页的源代码之一的HTML数据2000的一例的图。使用图1~图5,对上述的各硬件和软件模块所执行的处理进行说明。
〔步骤S110~S190:与网页相关的信息的收集〕
首先,作为用于实施网页内容制作的事先准备,收集与关联的网页相关的信息。要利用网页内容自动生成系统1来制作网页内容的用户(包括运营商,以下相同)使用所使用的用户终端(包括运营商终端,以下相同),以规定的格式输入用于检索发布想要作为示教数据而收集的网页的网站的检索信息(步骤S110),经由因特网而访问网页内容自动生成系统1,发送用于检索要收集的网站的检索信息(步骤S120)。
这里作为所输入的检索信息,例如,在想要制作面向职业女性的时尚的邮购销售站点的情况下,举出用于检索关联的网站的“职业”、“女性”、“时尚”、“邮购销售”这样的关键词。需要说明的是,在步骤S120中,经由因特网从用户终端向网页内容自动生成系统1发送了检索信息,但网页内容自动生成系统1也可以与用户终端成为一体。
当接收到来自用户终端的检索信息时,网页内容自动生成系统1的控制部100与存储部300协同配合地执行检索信息登记模块111,将通过用户的操作而输入的该检索信息登记于图3所示的存储部300的网页数据库310(步骤S130)。
在图3所示的网页数据库310中,存储有在步骤S130中登记的检索信息、与该检索信息建立关联地分配给后述的收集到的网页的URL(Uniform Resource Locator,统一资源定位器)、将该网页图像化而得到的图像化数据、显示于该网页的图像数据、作为记述该网页的源代码的HTML数据、用于指定网页的样式的CSS数据、以及使网页具有动作和交互性的JS数据,其中,该检索信息符合用于检索网站的关键词,该网站发布想要作为示教数据而收集的网页。
接着,网页内容自动生成系统1的控制部100与通信部200协同配合地执行网站检索模块112,访问因特网,基于登记在网页数据库310中的关键词,执行符合关键词的网站的检索(步骤S140)。
在步骤S140中得到检索结果的列表时,网页内容自动生成系统1的控制部100与显示部500协同配合地执行网页显示模块113,在浏览器上阅览在步骤S140的检索中搜索到的网站(步骤S150)。
然后,网页内容自动生成系统1的控制部100执行图像化数据取得模块114,取得显示为发布在网站中的网页的画面来作为图像化数据1000(步骤S160),进而,与存储部300协同配合地将取得的图像化数据1000与网页的URL建立关联而存储于所述网页数据库310(步骤S170)。
在将显示为网页的画面图像化时,对显示于浏览器的画面以端到端的形式进行扫描,根据情况而将它们连接在一起,由此,能够得到一个图像化数据1000。所得到的图像化数据1000例如在图4中示出。
在图4中,配置有与商品相关的图像、表示活动的图像,针对各个图像,赋予了成为注释的文章。在步骤S160中,取得这样的全部文本、图像来作为一个图像数据。
同时,网页内容自动生成系统1的控制部100执行源代码取得模块115,取得所阅览的网站的由HTML数据2000、CSS数据及JS数据构成的源代码作为文本数据(步骤S180),进而,与存储部300协同配合地将取得的源代码与网页的URL建立关联而存储于所述网页数据库310(步骤S190)。
源代码能够在浏览器上取得,得到的源代码中的HTML数据2000例如在图5中示出。
针对在步骤S140中搜索到的网站,重复执行这样的向网页数据库310的图像化数据1000及源代码的保存,由此,构筑网页数据库310。
需要说明的是,步骤S140的网站的检索至步骤S190的源代码的收集的步骤由被称为搜寻器的软件自动地检索网站,重复网页的阅览,由此,自动地收集多个图像化数据1000和源代码。
另一方面,也可以不使用网站检索模块112,自动地检索用于收集数据的网站的列表,而是由用户或运营商提供。
〔步骤S200~S210:将图像化数据与源代码建立关联来学习〕
当网页数据库310的构筑结束后,网页内容自动生成系统1的控制部100执行学习模块116,基于在步骤S130中存储的检索信息、在步骤S170中存储的图像化数据1000以及在步骤S190中存储的源代码来进行学习,生成示教数据3000(步骤S200)。例如通过使用卷积神经网络(Conclutional Nueral Network,CNN)等机器学习模型,将与图像、文章的内容及配置相关的信息和源代码建立关联,来进行该学习。需要说明的是,步骤S200中的学习可以在收集完与在步骤S140的检索中搜索到的所有网页相关的信息之后进行,也可以收集与一个网页相关的信息,每次进行学习。
然后,网页内容自动生成系统1的控制部100与存储部300协同配合地执行示教数据存储模块117,将在步骤S200的学习中生成的示教数据3000存储于示教数据数据库320(S210)。
这样,将与关联的多个网站相关的图像化数据1000与源代码建立关联而学习,并存储为示教数据3000,由此,能够学习针对何种图像化数据输出何种源代码。
在向示教数据数据库320的示教数据3000的存储结束后,结束网页内容自动生成用的事先准备。
[使用了网页内容自动生成系统1的网页内容的制作]
接着,针对使用了本实施方式中的网页内容自动生成系统1的网页内容的制作进行说明。图6是示出使用了网页内容自动生成系统1的网页内容的制作方法的流程图。
制作网页内容的用户首先制作表示想要制作的网页内容的图像数据4000(步骤S310),将制作出的图像数据4000发送到网页内容自动生成系统1(步骤S320)。
在步骤S310中制作的图像数据4000使用如下方式:使用文档制作软件等,或者通过手写来配置图像、文章,由此,首先制作为线框,之后,转换成图像数据。
在步骤S320中接收到图像数据4000时,网页内容自动生成系统1的控制部100与存储部300协同配合地执行图像数据登记模块118,将图像数据4000登记于网页内容数据库330(步骤S330)。
在步骤S330中登记了图像数据4000时,网页内容自动生成系统1的控制部100执行图像解析模块119,对登记的图像进行解析(步骤S340)。
在步骤S340中解析图像时,对登记的图像数据4000进行扫描,收集关于图像、文章的内容及配置的信息。此时的图像数据4000的扫描使用与步骤S160中的图像化数据1000的扫描同样的方法。
接着,网页内容自动生成系统1的控制部100与存储部300协同配合地执行内容源代码生成模块120,生成用于生成网页内容的内容源代码5000(步骤S350)。在用于生成网页内容的内容源代码5000中,包括HTML数据、CSS数据等基于标记语言的数据、以及与发布在网页内容中的图像相关的数据。另外,也可以根据需要而包括JS数据。
在步骤S350中生成内容源代码5000时,对通过图像数据4000的扫描而得到的信息与存储于示教数据数据库320的多个示教数据3000进行比较,参照最近的示教数据3000的源代码,输出用于记述图像数据4000所显示的内容的内容源代码5000。另外,根据需要,进行图像的替换、HTML的语法检查等后置处理,完成内容源代码5000的生成。
在步骤S350中生成内容源代码5000时,网页内容自动生成系统1的控制部100将生成的内容源代码5000提供给用户终端,结束内容的自动生成。(步骤S360)。
[变形例1]
在本实施方式的网页内容自动生成系统中,在步骤S350中,基于登记并解析的图像数据4000和最近的示教数据3000,制作出内容源代码5000,但也可以不基于最近的示教数据3000,而基于类似的多个示教数据3000,来制作多个内容源代码5000。在该情况下,生成多个变化的网页内容,因此,能够根据用户的喜好而生成最佳的网页内容。
通过如以上那样构成,可提供即便是具有复杂构造的网站也能够不用编辑编程语言而简单地进行制作的网页内容自动生成系统。
以上,对本发明的实施方式进行了说明,但本发明不限于上述的这些实施方式。另外,本发明的实施方式所记载的效果只不过列举了从本发明产生的最佳的效果,本发明的效果不限于本发明的实施方式所记载的效果。
[第二实施方式]
接着,对第二实施方式进行说明。
图7是用于对第二实施方式的网页内容自动生成系统进行说明的框图。
第二实施方式的网页内容自动生成系统2具备标签赋予部151、制作部153、学习部154、网页设计取得部155、内容源代码生成部156、通信部200、存储部300、输入部400及显示部500。
标签赋予部151、制作部153、学习部154、网页设计取得部155及内容源代码生成部156构成为控制部的一个功能。因此,标签赋予部151、制作部153、学习部154、网页设计取得部155及内容源代码生成部156也可以构成为构成控制部的标签赋予模块、制作模块、学习模块、网页设计取得模块及内容源代码生成模块。
标签赋予部151取得发布到在因特网上公开的网站中的网页内容,按照各内容,对网页内容进行表示该内容的标签赋予。
标签赋予部151取得多个网页内容,按照各个网页内容的各内容而赋予标签。标签赋予部151在由图像化数据取得部(图像化数据取得模块114(参照图1))取得的图像化数据存储于存储部300的情况下,也可以从存储部300取得图像化数据,按照图像化数据的各内容而赋予标签。
标签例如表示图像、文本及按钮等内容的分类。标签赋予部151例如在网页内容(图像化数据)包括图像、文本及按钮的情况下,向图像赋予图像标签,向文本赋予文本标签,向按钮赋予按钮标签。
标签赋予部151例如也可以基于使用了输入部400的用户的指示,按照网页内容的各内容赋予标签。
制作部153基于用于生成网页内容的源代码,制作构成网页内容的一部分的构成物。制作部153例如使用CSS代码等来制作构成物。构成物至少包括在网页内容中显示的显示信息(图像、文字、颜色、形状等),用户能够进行指示。构成物例如是按钮等。需要说明的是,构成物除了上述的按钮之外,例如也可以是背景、背景的一部分区域、以及它们的装饰等。制作部153通过变更CSS代码等,来制作变更了形状、大小及色彩等的多个构成物。
学习部154基于由标签赋予部151进行了标签赋予的内容,来制作示教数据。学习部154例如利用卷积神经网络(CNN)等,掌握内容的特征量,制作示教数据。即,学习部154例如学习内容(图像)是图像、内容(文本)是文本、以及内容(按钮)是按钮等的进行了标签赋予的内容是何种内容。
另外,学习部154基于源代码和由制作部153制作的构成物,来制作示教数据。学习部154例如利用LSTM(Long Short-Term Memory,长短期记忆网络)等,学习由制作部153制作出的CSS代码。另外,学习部154例如也可以利用CNN等,通过制作部153来学习构成物。学习部154通过结合基于LSTM等的CSS的学习结果与基于CNN等的构成物的学习结果,来制作示教数据。作为具体的一例,学习部154通过将CSS代码与构成物建立关联,来制作示教数据。
网页设计取得部155取得用于制作网页内容的网页设计。网页设计也可以是在第一实施方式中说明的图像数据。网页设计取得部155在网页设计中包括图像的情况下,取得该图像的数据(图像数据),将图像数据存储于存储部300。
内容源代码生成部156基于由网页设计取得部155取得的网页设计和由学习部154取得的示教数据,取得网页设计的内容,生成与该内容相应的源代码。
首先,内容源代码生成部156基于示教数据对网页设计进行解析,由此检测网页设计内的内容,按照网页设计的各内容来进行标签赋予。标签可以与由标签赋予部151赋予的标签相同,例如是图像、文本及按钮等的分类。
内容源代码生成部156在网页设计中存在赋予了文本的标签的内容的情况下,对该内容进行文本检测,生成文本数据。需要说明的是,内容源代码生成部156也可以根据由网页设计取得部155取得的网页设计来进行文本检测。
内容源代码生成部156在网页设计的内容的一部分与上述的构成物对应的情况下,也可以基于示教数据,生成与该构成物对应的源代码。内容源代码生成部156在网页设计中存在作为一例而赋予了按钮的标签的构成物的情况下,基于示教数据,生成该构成物的源代码(作为一例,CSS代码)。
如上所述,网页设计取得部155在网页设计中包括图像的情况下,也可以取得与该图像对应的图像数据(图像素材)。在该情况下,内容源代码生成部156也可以基于网页设计内的图像的位置,生成用于在网页内容内配置基于图像数据的图像的位置信息。内容源代码生成部156在网页设计中存在赋予了图像的标签的内容的情况下,将赋予了该标签的图像与由网页设计取得部155取得的图像数据一一建立对应。即,内容源代码生成部156使赋予了图像标签的图像与和该图像一致的图像数据(图像素材)匹配。
需要说明的是,内容源代码生成部156也可以将由网页设计取得部155取得的网页设计所包含的图像与图像数据(图像素材)一一建立对应。在该情况下,如果网页设计所包含的图像与图像数据的类似度越高,则内容源代码生成部156越能够建立对应。
内容源代码生成部156也可以基于网页设计中的内容的位置,生成与配置网页内容中的内容的位置相关的位置信息,使得对应于网页设计的内容的布局。内容源代码生成部156基于检测到网页设计的内容时的检测信息、以及文本检测、按钮的生成及图像匹配的结果,生成与在网页内容中配置文本、按钮及图像等的位置相关的信息(位置信息)。该位置信息是用于在网页内容内例如配置文本、按钮及图像(图像数据)的信息。位置信息例如也可以根据网页设计中的坐标系的坐标而生成网页内容中的坐标系的坐标。另外,位置信息例如可以是内容(文本、按钮及图像等)的中心位置的坐标,也可以是左上(或者右上、左下、右下)的位置的坐标。
即,内容源代码生成部156生成用于在生成的网页内容内配置文本(文本数据)的位置信息,使得对应于网页设计内的文本的位置。另外,内容源代码生成部156生成用于在生成的网页内容内配置按钮的位置信息,使得对应于网页设计内的按钮的位置。此外,内容源代码生成部156生成用于在生成的网页内容内配置图像(图像数据)的位置信息,使得对应于网页设计内的图像的位置。
内容源代码生成部156也可以基于通过用户对输入部400进行操作,来修正标签及位置信息。即,内容源代码生成部156也可以修正文本、图像及按钮等的标签信息、以及它们的位置信息。
内容源代码生成部156通过结合文本、图像(图像数据)、按钮等(构成物)的CSS代码、以及它们的位置信息等,来生成网页内容的源代码。内容源代码生成部156基于生成的源代码,将网页内容显示于显示部500。
第二实施方式的通信部200、存储部300、输入部400及显示部500可以是与第一实施方式中说明的通信部200、存储部300、输入部400及显示部500同样的结构。
接着,对第二实施方式的网页内容自动生成方法进行说明。
首先,说明制作示教数据的情况下的处理流程。
图8是对第二实施方式的制作示教数据的情况下的处理流程进行说明的流程图。
在步骤ST301中,标签赋予部151取得发布到在因特网上公开的网站中的网页内容。标签赋予部151也可以自动地取得多个网页内容。
需要说明的是,网页内容自动生成系统2也可以代替标签赋予部151,与第一实施方式同样地如下那样取得网页内容。即,网站检索部(网站检索模块112:参照图1)经由通信部200而访问因特网,对网站进行检索。网页显示部(网页显示模块113:参照图1)利用浏览器,将通过检索而搜索到的网站显示于显示部500。图像化数据取得部(图像化数据取得模块114:参照图1)取得显示部500所显示的网站的网页内容来作为图像化数据。
在步骤ST302中,标签赋予部151按照各内容,对在步骤ST301中取得的网页内容(图像化数据)进行标签赋予。标签赋予部151例如在网页内容(图像化数据)中包括图像的情况下,对图像赋予图像标签。标签赋予部151例如在网页内容(图像化数据)中包括文本的情况下,对文本赋予文本标签。标签赋予部151例如在网页内容(图像化数据)中包括按钮的情况下,对按钮赋予按钮标签。
在步骤ST303中,制作部153例如基于CSS代码等源代码,制作构成网页内容的一部分的构成物。构成物例如是按钮等。制作部153制作变更了形状、大小及色彩等的多个构成物。
在步骤ST304中,学习部154基于在步骤ST302中进行了标签赋予的内容,来制作示教数据。例如,学习部154基于掌握进行了标签赋予的内容的特征量,来制作示教数据。
另外,学习部154基于在步骤ST304中使用的源代码和生成的构成物,制作示教数据。例如,学习部154通过将源代码与构成物建立关联,来制作示教数据。
接着,对自动地生成网页内容的情况下的处理流程进行说明。
图9是说明第二实施方式的自动地生成网页内容的情况下的处理流程的流程图。
在步骤ST401中,网页设计取得部155取得用于制作网页内容的网页设计。在该情况下,网页设计取得部155在网页设计中包括图像的情况下,当通过用户上传了该图像的数据(图像数据)后,将图像数据存储于存储部300。
在步骤ST402中,内容源代码生成部156按照在步骤ST401中取得的网页设计的各内容而赋予标签,针对赋予了表示文本的文本标签的内容来检测文本。即,内容源代码生成部156在步骤ST401中取得的网页设计中存在赋予了文本标签的内容的情况下,针对该内容,利用学习完毕模型而进行文本检测,生成文本数据。需要说明的是,内容源代码生成部156也可以根据在步骤ST401中取得的网页设计来进行文本检测。
在步骤ST403中,内容源代码生成部156在网页设计的内容中存在与构成物对应的内容的情况下,基于在步骤ST305中生成的示教数据,生成与该构成物对应的源代码。即,内容源代码生成部156在网页内容中存在作为一例而赋予了按钮的标签的构成物的情况下,基于示教数据,生成构成物的源代码(作为一例,CSS代码)。
在步骤ST404中,内容源代码生成部156在网页设计中存在赋予了图像的标签的内容的情况下,将赋予了该标签的图像与在步骤ST401中取得的图像数据一一建立对应。即,内容源代码生成部156使赋予了图像标签的图像与和该图像一致的图像数据匹配。需要说明的是,内容源代码生成部156也可以将在步骤ST401中取得的网页设计所包含的图像与图像数据一一建立。
在步骤ST405中,内容源代码生成部156基于在步骤ST401中取得的网页设计中记载内容的位置,生成用于在网页内容中配置内容的位置信息。内容源代码生成部156基于检测到网页设计的内容时的检测信息、以及文本检测、构成物(按钮)的生成及图像匹配的结果,生成与在网页内容中配置文本、构成物及图像的位置相关的信息(位置信息)。
在步骤ST406中,内容源代码生成部156例如也可以基于通过用户对输入部400进行操作,来修正在步骤ST405中制作出的位置信息等(标签及位置信息)。
在步骤ST407中,内容源代码生成部156基于在步骤ST402中检测到的文本、在步骤ST403中生成的构成物的源代码、在步骤ST404中匹配的图像(图像数据)、在步骤ST405中生成的位置信息、以及在步骤ST406中进行的修正,生成与在步骤ST401中取得的网页设计相应的源代码。
接着,对第二实施方式的效果进行说明。
网页内容自动生成系统2具备:标签赋予部151,其取得网页内容,按照各内容而对网页内容进行标签赋予;制作部153,其基于用于生成网页内容的源代码,制作构成网页内容的一部分的构成物;学习部154,其基于由标签赋予部151进行了标签赋予的内容、以及基于源代码和由制作部153制作的构成物,取得示教数据;网页设计取得部155,其取得网页设计;以及内容源代码生成部156,其基于由网页设计取得部155取得的网页设计和由学习部154取得的示教数据,取得网页设计的内容,生成与该内容相应的源代码。
由此,根据网页内容自动生成系统2,通过预先学习示教数据,当输入网页设计时能够自动地生成源代码。因此,网页内容自动生成系统2能够生成用户所希望的网页内容。
在网页内容自动生成系统2中,内容源代码生成部156在网页设计的内容的一部分与构成物对应的情况下,也可以基于示教数据,生成与该构成物对应的源代码。
由此,网页内容自动生成系统2即便在用户所希望的网页内容中具有按钮等构成物的情况下,也能够生成包括该构成物的网页内容。
在网页内容自动生成系统2中,内容源代码生成部156也可以基于网页设计中的内容的位置,生成与配置网页内容中的内容的位置相关的位置信息,使得对应于网页设计的内容的布局。
由此,网页内容自动生成系统2能够生成与网页设计相应的网页内容。
在网页内容自动生成系统2中,网页设计取得部155在网页设计中包括图像的情况下,也可以取得与该图像对应的图像数据。在该情况下,内容源代码生成部156也可以基于网页设计内的图像的位置,生成用于在网页内容内配置基于图像数据的图像的位置信息。
由此,网页内容自动生成系统2即便在网页设计中包括图像的情况下,也能够生成包括与网页设计相应的图像的网页内容。
上述的网页内容自动生成系统2的各部也可以作为计算机的运算处理装置等的功能来实现。即,网页内容自动生成系统2的标签赋予部151、制作部153、学习部154、网页设计取得部155及内容源代码生成部156也可以作为基于计算机的运算处理装置等的标签赋予功能、制作功能、学习功能、网页设计取得功能及内容源代码生成功能而分别实现。
网页内容自动生成程序能够使计算机实现上述各功能。网页内容自动生成程序也可以记录于外部存储器或光盘等计算机可读取的非暂时性记录介质中。
另外,如上所述,网页内容自动生成系统2的各部也可以由计算机的运算处理装置等实现。该运算处理装置等例如由集成电路等构成。因此,网页内容自动生成系统2的各部也可以作为构成运算处理装置等的电路来实现。即,如图10所示,网页内容自动生成系统2的标签赋予部151、制作部153、学习部154、网页设计取得部155及内容源代码生成部156也可以作为构成计算机的运算处理装置等的标签赋予电路151a、制作电路153a、学习电路154a、网页设计取得电路155a及内容源代码生成电路156a来实现。
另外,网页内容自动生成系统2的通信部200、存储部300、输入部400及显示部500例如也可以通过由集成电路等构成,作为通信电路200a、存储电路300a、输入电路400a及显示电路500a(参照图10)来实现。另外,网页内容自动生成系统2的通信部200、存储部300、输入部400及显示部500例如也可以通过由多个设备构成,作为通信装置、存储装置、输入装置及显示装置而构成。
附图标记说明:
1、2 网页内容自动生成系统
100 控制部
112 网站检索模块
114 图像化数据取得模块
115 源代码取得模块
116 学习模块
119 图像解析模块
120 内容源代码生成模块
151 标签赋予部
153 制作部
154 学习部
155 网页设计取得部
156 内容源代码生成部
200 通信部
300 存储部
310 网页数据库
330 网页内容数据库

Claims (6)

1.一种网页内容自动生成系统,其自动地生成通过HTML而记述的网页内容,其中,
所述网页内容自动生成系统具备:
图像化数据取得部,其取得发布到在因特网上公开的网站中的网页内容来作为一个图像数据;
源代码取得部,其取得以构成该网页内容的HTML数据为代表的源代码;
学习部,其对由所述图像化数据取得部取得的图像化数据与由所述源代码取得部取得的源代码进行解析,由此取得示教数据;
图像数据登记部,其输入要制作的网页内容来作为一个图像数据;
解析部,其解析所输入的图像数据与由所述学习部取得的示教数据之间的关联度;以及
内容源代码生成部,其基于由所述解析部解析的关联度高的示教数据的源代码,生成与输入的图像数据相关的内容源代码。
2.根据权利要求1所述的网页内容自动生成系统,其中,
所述网页内容自动生成系统还具备检索所述网站的网站检索部,所述网站检索部基于输入的检索信息,由搜寻器自动地检索在因特网上公开的网站。
3.一种网页内容自动生成系统,其中,
所述网页内容自动生成系统具备:
标签赋予部,其取得发布到在因特网上公开的网站中的网页内容,按照各内容对所述网页内容进行表示该内容的标签赋予;
制作部,其基于用于生成网页内容的源代码,制作构成网页内容的一部分的构成物;
学习部,其基于由所述标签赋予部进行了标签赋予的内容、以及基于源代码和由所述制作部制作的构成物,取得示教数据;
网页设计取得部,其取得用于制作网页内容的网页设计;以及
内容源代码生成部,其基于由所述网页设计取得部取得的所述网页设计和由所述学习部取得的示教数据,取得所述网页设计的内容,生成与该内容相应的源代码。
4.根据权利要求3所述的网页内容自动生成系统,其中,
所述内容源代码生成部在所述网页设计的内容的一部分与所述构成物对应的情况下,基于示教数据,生成与所述构成物对应的源代码。
5.根据权利要求3或4所述的网页内容自动生成系统,其中,
所述内容源代码生成部基于所述网页设计中的内容的位置生成与配置网页内容中的内容的位置相关的位置信息,以对应于所述网页设计的内容的布局。
6.根据权利要求5所述的网页内容自动生成系统,其中,
所述网页设计取得部在所述网页设计中包括图像的情况下,取得与该图像对应的图像数据,
所述内容源代码生成部基于所述网页设计内的图像的位置,生成用于在网页内容内配置基于所述图像数据的图像的位置信息。
CN201980041576.3A 2018-06-21 2019-06-13 网页内容自动生成系统 Pending CN112602078A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018117710 2018-06-21
JP2018-117710 2018-06-21
PCT/JP2019/023436 WO2019244762A1 (ja) 2018-06-21 2019-06-13 ウェブコンテンツ自動生成システム

Publications (1)

Publication Number Publication Date
CN112602078A true CN112602078A (zh) 2021-04-02

Family

ID=68983703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980041576.3A Pending CN112602078A (zh) 2018-06-21 2019-06-13 网页内容自动生成系统

Country Status (4)

Country Link
US (1) US11507638B2 (zh)
JP (2) JP7175030B2 (zh)
CN (1) CN112602078A (zh)
WO (1) WO2019244762A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7050605B2 (ja) * 2018-07-13 2022-04-08 株式会社日立ソリューションズ アプリケーション生成装置、アプリケーション生成方法、及びアプリケーション生成プログラム
KR102539282B1 (ko) 2022-12-16 2023-06-02 주식회사 유니온플레이스 인공 지능을 이용한 코드 생성 방법

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010049598A (ja) * 2008-08-25 2010-03-04 Naninani.Tv:Kk ウェブサイト作成支援装置及びウェブサイト作成支援プログラム
CN101763395A (zh) * 2009-12-31 2010-06-30 浙江大学 采用人工智能技术自动生成网页的方法
CN101944094A (zh) * 2009-07-06 2011-01-12 富士通株式会社 网页信息提取方法和装置
CN102184266A (zh) * 2011-06-27 2011-09-14 武汉大学 一种页面与数据分离的动态wap网站自动生成方法
CN102629204A (zh) * 2012-03-09 2012-08-08 中国联合网络通信集团有限公司 网页源代码生成方法及装置
KR20120109973A (ko) * 2011-03-28 2012-10-09 (주)티아이솔루션 인터넷상에서 구현가능한 사용자기반의 콘텐츠 위치 및 크기정보 자동 인코딩 방법 및 시스템
CN102780682A (zh) * 2011-05-12 2012-11-14 同济大学 基于html的网站行为模型建模方法
CN103678509A (zh) * 2013-11-25 2014-03-26 北京奇虎科技有限公司 生成网页模板的方法及装置
EP2728498A1 (en) * 2012-11-06 2014-05-07 Open Text S.A. System and method for creation of templates
CN105468766A (zh) * 2015-12-04 2016-04-06 上海斐讯数据通信技术有限公司 网页制作方法及其系统
CN106951505A (zh) * 2017-03-16 2017-07-14 北京搜狐新媒体信息技术有限公司 网页信息获得方法及系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101579978B1 (ko) * 2009-03-10 2015-12-24 엘지전자 주식회사 웹페이지 표시방법 및 이를 적용한 이동 통신 단말기
CN101650745A (zh) 2009-09-10 2010-02-17 中兴通讯股份有限公司 一种基于数据定义的web页面快速生成方法及装置
US8965988B1 (en) * 2013-02-14 2015-02-24 Beamsmart, Inc. System and method for providing an event-based and shared page connectivity platform
MY192602A (en) 2013-03-14 2022-08-29 Wix Com Ltd Device, system, and method of website building by utilizing data lists
US9747556B2 (en) * 2014-08-20 2017-08-29 Vertafore, Inc. Automated customized web portal template generation systems and methods
US10831991B1 (en) * 2015-06-02 2020-11-10 United Service Automobile Association (USAA) Systems and methods for testing content developed for access via a network
JP2017045349A (ja) 2015-08-28 2017-03-02 ダイレクト出版株式会社 ホームページ作成支援装置およびその方法
US10489126B2 (en) * 2018-02-12 2019-11-26 Oracle International Corporation Automated code generation
US10452782B1 (en) * 2018-02-20 2019-10-22 Facebook, Inc. Systems and methods for distributing intent models
US10902254B2 (en) * 2018-09-26 2021-01-26 Salesforce.Com, Inc. Converting a captured image of a layout to a structured document template

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010049598A (ja) * 2008-08-25 2010-03-04 Naninani.Tv:Kk ウェブサイト作成支援装置及びウェブサイト作成支援プログラム
CN101944094A (zh) * 2009-07-06 2011-01-12 富士通株式会社 网页信息提取方法和装置
CN101763395A (zh) * 2009-12-31 2010-06-30 浙江大学 采用人工智能技术自动生成网页的方法
KR20120109973A (ko) * 2011-03-28 2012-10-09 (주)티아이솔루션 인터넷상에서 구현가능한 사용자기반의 콘텐츠 위치 및 크기정보 자동 인코딩 방법 및 시스템
CN102780682A (zh) * 2011-05-12 2012-11-14 同济大学 基于html的网站行为模型建模方法
CN102184266A (zh) * 2011-06-27 2011-09-14 武汉大学 一种页面与数据分离的动态wap网站自动生成方法
CN102629204A (zh) * 2012-03-09 2012-08-08 中国联合网络通信集团有限公司 网页源代码生成方法及装置
EP2728498A1 (en) * 2012-11-06 2014-05-07 Open Text S.A. System and method for creation of templates
CN103678509A (zh) * 2013-11-25 2014-03-26 北京奇虎科技有限公司 生成网页模板的方法及装置
CN105468766A (zh) * 2015-12-04 2016-04-06 上海斐讯数据通信技术有限公司 网页制作方法及其系统
CN106951505A (zh) * 2017-03-16 2017-07-14 北京搜狐新媒体信息技术有限公司 网页信息获得方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王一洲,等: "基于网页聚类的正文信息提取方法", 《小型微型计算机系统》, no. 1, 31 January 2018 (2018-01-31), pages 111 - 115 *

Also Published As

Publication number Publication date
US20210192007A1 (en) 2021-06-24
US11507638B2 (en) 2022-11-22
WO2019244762A1 (ja) 2019-12-26
JP2022179507A (ja) 2022-12-02
JPWO2019244762A1 (ja) 2021-07-08
JP7175030B2 (ja) 2022-11-18

Similar Documents

Publication Publication Date Title
KR102533972B1 (ko) 시각적 검색 플랫폼용 영상 인제스트 프레임워크
CN101288067B (zh) 从电子文档组装、提取和配置内容的方法和装置
Bigham et al. Accessmonkey: a collaborative scripting framework for web users and developers
US8051371B2 (en) Document analysis system and document adaptation system
US20240126826A1 (en) System and method for integrating user feedback into website building system services
US20130326333A1 (en) Mobile Content Management System
US20150006333A1 (en) Generating websites and online stores from seed input
US20150007022A1 (en) Generating websites and business documents from seed input
JP2022179507A (ja) ウェブコンテンツ自動生成システム
US20080065606A1 (en) Method and Apparatus for Searching Images through a Search Engine Interface Using Image Data and Constraints as Input
CN106688215A (zh) 针对内容效能优化的自动点击类型选择
CN106503211B (zh) 面向信息发布类网站的移动版自动生成的方法
US9448983B2 (en) Device, method and computer program product for generating web feeds
CN105677931A (zh) 信息搜索方法和装置
US20110313997A1 (en) System and method for providing a consolidated service for a homepage
CN102096581A (zh) 生成微件的方法及装置
US9135316B2 (en) Information providing device, method, program, information display device, method, program, information search system, and recording medium for enhanced search results
JPWO2018235326A1 (ja) コンピュータプログラム、フォント切替装置及びフォント切替方法
JP5767413B1 (ja) 情報処理システム、情報処理方法、および情報処理プログラム
CN111352623A (zh) 页面生成方法及装置
JP2003085160A (ja) ソースファイル生成装置
KR20110074423A (ko) 상세정보 이미지 파일의 검색 시스템 및 방법
JP2013143097A (ja) 情報提供システムおよび画像管理装置
KR20110074422A (ko) 상세정보 이미지 파일 생성 방법 및 장치
KR102580126B1 (ko) 영업활동지원을 위한 통합 모바일 플랫폼 서비스 제공 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination