CN102087653B - 一种发布网站信息的方法及装置 - Google Patents

一种发布网站信息的方法及装置 Download PDF

Info

Publication number
CN102087653B
CN102087653B CN 200910252094 CN200910252094A CN102087653B CN 102087653 B CN102087653 B CN 102087653B CN 200910252094 CN200910252094 CN 200910252094 CN 200910252094 A CN200910252094 A CN 200910252094A CN 102087653 B CN102087653 B CN 102087653B
Authority
CN
China
Prior art keywords
information
classification
publishing
classification title
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200910252094
Other languages
English (en)
Other versions
CN102087653A (zh
Inventor
蔡景助
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN 200910252094 priority Critical patent/CN102087653B/zh
Publication of CN102087653A publication Critical patent/CN102087653A/zh
Priority to HK11109077.4A priority patent/HK1154965A1/xx
Application granted granted Critical
Publication of CN102087653B publication Critical patent/CN102087653B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种发布网站信息的方法,包括:根据预设的字段属性对输入的发布文档进行解析,以确定该发布文档中包含的第一类目名称集合及相应的类目内容;对指定的信息发布网页进行页面扫描,以确定该信息发布网页上设置的第二类目名称集合;对所述第一类目名称集合与所述第二类目名称集合进行匹配,将匹配成功的第一类目名称对应的类目内容,添加至与其匹配的第二类目名称在信息发布网页内对应的输入框中,以完成信息发布。这样,用户在网站上发布信息时,便无需将信息逐条添加至信息发布网页中对应的输入框内,从而大大简化了信息发布流程的操作步骤,提高了信息发布流程的执行效率。本申请同时公开了一种用于发布网站信息的装置。

Description

一种发布网站信息的方法及装置
技术领域
本申请涉及互联网技术,特别涉及一种发布网站信息的方法及装置。 
背景技术
目前,大多数网站都允许登录用户按照自身需求,在网站页面内发布相关信息。如,电子商务网站的登录用户在网站内发布新型产品的图片、型号及性能说明等等信息。又例如,招聘网站的登录用户在网站内发布个人简历信息。 
现有技术下,用户在网站上发布信息时,仅能按照网页页面内呈现的类目输入框(input框)逐条进行信息输入。例如,用户在发布个人简历信息时,在网站页面提供的input框中逐条输入自身的姓名、学历、工作经历等等。显然,这大大增加了操作流程的繁琐程度,降低了信息输入的执行效率。 
为解决上述技术问题,目前,提供了一种通过填写excel表格上传信息的方法,具体为:先从网站服务器下载excel表格,按照excel表格内预设的表项填写相应的信息内容,再将填写完毕的excel表格上传至网站服务器进行发布。 
然而,采用上述方法存在以下几点缺陷: 
首先,仅能使用execel表格进行信息发布。这种方式限制了其自身的应用范围。 
例如,若用户使用word文档、txt文档记录需要上传的信息,则还需要将这些信息逐条输入下载的execel表格中,显然,这同样增加了操作流程的繁琐程度,并未减轻用户的操作负担。 
其次,仅能按照网页内input框展示的类目顺序填写execel表格。这种方式会在一定程度上造成上传信息的错误。 
例如,网页内input框展示的类目顺序为:先填写年龄,再填写性别,则用户只能在excel表中按照先年龄后性别的顺序进行信息填写,一旦填写顺序发生错误,系统便无法准确识别出需要上传的信息,从而在一定程度上增加了操作流程的繁琐程度。
有鉴于此,需要提供一种新的网站信息发布方法以克服上述缺陷。 
发明内容
本申请实施例提供一种网站信息发布方法及装置,用以简化网站信息发布流程。 
本申请实施例提供的具体技术方案如下: 
一种发布网站信息的方法,包括: 
接收输入的发布文档,并根据预设的字段属性对该发布文档进行解析,以确定该发布文档中包含的第一类目名称集合及相应的类目内容; 
对指定的信息发布网页进行页面扫描,以确定该信息发布网页上设置的第二类目名称集合,其中,所述指定的信息发布页面包括对应所述第二类目名称的输入框; 
对所述第一类目名称集合与所述第二类目名称集合进行匹配,将匹配成功的第一类目名称对应的类目内容,添加至与其匹配的第二类目名称在信息发布网页内对应的输入框中,以完成信息发布。 
一种用于发布网站信息的装置,包括: 
解析器,用于接收输入的发布文档,并根据预设的字段属性对该发布文档进行解析,以确定该发布文档中包含的第一类目名称集合及相应的类目内容; 
扫描单元,用于对指定的信息发布网页进行页面扫描,以确定该信息发布网页上设置的第二类目名称集合,其中,所述指定的信息发布页面包括对应所述第二类目名称的输入框; 
匹配发布单元,用于对所述第一类目名称集合与所述第二类目名称集合进行匹配,将匹配成功的第一类目名称对应的类目内容,添加至与其匹配的第二类目名称在信息发布网页内对应的输入框中,以完成信息发布。 
本申请实施例中,用户可以采用多种格式的文档进行发布信息的撰写,而只需将包含发布信息的文档输入客户端内的解析器中,就可以实现对各种格式文档的自动解析,这在一定程度上减少了用户撰写发布信息的繁琐程度,简化了操作流程。进一步地,用户还可以通过客户端将解析后确定的需要发布的类目名称和相应的类目内容,发送至指定的信息发布网页进行匹配,并将匹配成功的类目名称及相应的类目内容在该信息发布网页上进行发布。这样,用户在网站上发布信息时,便无需将信息逐条添加至信息发布网页中对应的输入框内,从而大大简化了信息发布流程的操作步骤,降低了该操作步骤的繁琐程度,提高了信息发布流程的执行效率。同时,由于客户端会对需要发布的类目名称进行自动匹配,因此,用户无需按照信息发布网页上呈现的类目名称的顺序填写包含发布信息的文档,这样,用户可以根据自身的使用习惯设置包含发布信息的文档,从而进一步提升了信息发布流程的性能,提高了其服务质量。 
附图说明
图1为本申请实施例中网络环境示意图; 
图2为本申请实施例中客户端功能结构示意图; 
图3为本申请实施例中客户端对发布文档进行解析发布简意流程图; 
图4为本申请实施例中第一类发布文档示意图; 
图5为本申请实施例中导入发布文档后操作界面示意图; 
图6为本申请实施例中第二类发布文档示意图; 
图7为本申请实施例中客户端对发布文档进行发布详细流程图。 
具体实施方式
为了降低网站信息发布流程的繁琐程度,简化相关操作流程,本申请实施例中,在客户端内设置一文档解析器,用于对用户预先保存的发布信息进行导入解析,并将解析后的信息自动发布至指定网站,其具体为:接收输入的发布 文档,并根据预设的字段属性对该发布文档进行解析,以确定该发布文档中包含的第一类目名称集合及相应的类目内容;对指定的信息发布网页进行页面扫描,以确定该信息发布网页上设置的第二类目名称集合;对所述第一类目名称集合与所述第二类目名称集合进行匹配,将匹配成功的第一类目名称对应的类目内容,添加至与其匹配的第二类目名称在信息发布网页内对应的输入框中,以完成信息发布。 
下面结合附图对本申请优选的实施方式进行详细说明。 
参阅图1所示,用于进行网站信息发布的网络环境内包括若干客户端10和网站服务器11,其中,参阅图2所示,本申请实施例中,客户端10包括解析器100、扫描单元101和匹配发布单元102,其中, 
解析器100,用于接收输入的发布文档,并根据预设的字段属性对该发布文档进行解析,以确定该发布文档中包含的第一类目名称集合及相应的类目内容; 
扫描单元101,用于对指定的信息发布网页进行页面扫描,以确定该信息发布网页上设置的第二类目名称集合; 
匹配发布单元102,用于对所述第一类目名称集合与所述第二类目名称集合进行匹配,将匹配成功的第一类目名称对应的类目内容,添加至与其匹配的第二类目名称在信息发布网页内对应的输入框中,以完成信息发布。 
基于上述架构,参阅图3所示,本申请实施例中,客户端10对用户导入的文档进行解析并发布的详细流程如下: 
步骤300:接收用户导入的发布文档,该发布文档中包含需要发布至网站的信息内容。 
本实施例中,用户可以通过点击操作界面中设置的“导入文件”按钮,将预先设置完毕的发布文档导入客户端10内的解析器100中。该发布文档可以设置为多种格式的文件,例如,word文档、txt文档、execel表格、html文档等等。 
实际应用中,用户也可以直接将需要发布的信息内容拷贝至解析器100的input框中,本实施例中仅以导入文件的方式为例进行说明。 
步骤310:对导入的发布文档包含的信息内容进行解析,以确定用户指定发布的类目名称和相应的类目内容。 
本实施例中,可以通过点击操作界面中设置的“点击解析”按钮,令解析器100开始对导入的发布文档或者直接拷贝过来的发布文档进行解析。为了令解析器100能够准确识别出发布文档包含的类目名称及相应的类目内容,要求用户采用指定格式撰写发布文档。本实施在对导入的发布文档进行解析之前还包括判断发布文档的文件格式的步骤,以便针对不同的文件格式采用不同的解析规则,即,预先在解析器中针对不同的文件格式设置不同的字段属性,在对发布文档进行解析时,针对不同的文件格式采用不同的字段属性对发布文档进行解析。例如发布文档的文件格式为word,则解析器可以通过该发布文档名称的后缀.doc识别出该发布文档为word格式的文档,从而根据针对word文档预设的字段属性对该发布文档进行解析。以word文档为例,参阅图4所示,解析器中预设的字段属性为分隔符“:”,则客户端在发布文档时,将文档中的类目名称与相应的类目内容用“:”进行间隔,解析器100对发布文档进行内容扫描时,以“:”为分隔符,将“:”之前的信息确定为类目名称,将“:”之后的信息确定为类目内容;进一步地,若扫描到图片格式的文件,如,jpg格式文件、bmp格式文件或者gif格式文件,则直接将其确定为产品图片。 
步骤320:将解析后的内容呈现在操作界面中,即将解析出的类目名称及相应的类目内容呈现给用户,以供用户修改。 
参阅图5所示,解析器100将得到的类目名称排列在操作界面中,并设置相应的input框以供用户修改。 
步骤330:待用户点击操作界面中设置的“确认发布”按钮后,将解析后的发布文档发送至指定的网站进行发布。 
在上述步骤300中记载了以word文档和图片为例的解析方式,而在实际 应用中,客户端10中的解析器100对用户输入的发布文档进行解析时,还可以采用其他方式。 
例如,参阅图6所示,当发布文档为excel表格时,用户可以将记载类目名称和类目内容的单元格设置为不同的文字属性或单元格属性,这样,无论发布文档是以“横排”方式排版还是以“竖排”方式排版,解析器100都可以准确识别出发布文档包含的类目名称和相应的类目内容。 
又例如,当发布文档为html文档时,可以根据html基本命令对HTML文档进行解析,将不同html基本命令(如,添加文字、图形、动画、链接等等)及其操作对象分别作为类目名称和对应的类目内容进行识别。 
由此可见,本申请实施例中,客户端10只需根据预设的字段属性对发布文档进行解析,即可以准确识别出其记载的类目名称和相应的类目内容,而预设的字段属性包括分隔符、图片属性、文字属性、单元格属性和命令属性中的一种或任意组合,在此不再赘述。 
基于上述实施例,参阅图7所示,本申请实施例中,客户端10将解析后的发布文档发送至指定的网站进行发布的详细流程如下: 
步骤3300:按照用户输入的统一资源定位地址(URL地址)登录指定的信息发布网页。 
步骤3310:对上述信息发布网页进行页面扫描,以确定信息发布网页上设置的类目名称,即在信息发布网页上发布信息时需要填写的类目名称。 
步骤3320:从解析后的发布文档中选择一类目名称与信息发布网页上设置的类目名称进行一一匹配。 
步骤3330:判断是否匹配成功?若是,则进行步骤3340;否则,进行步骤3350。 
本实施例中,上述匹配可以是精确匹配,如,在发布文档中选择的类目名称,与信息发布网页上设置的类目名称完全一致,才确定匹配成功;或者,上述匹配也可以是模糊匹配,如,在发布文档中选择的类目名称,与信息发布网 页上设置的类目名称的相似度达到设定阈值,则确定匹配成功。 
步骤3340:将发布文档中包含的与匹配成功的类目名称相对应的类目内容,输入信息发布网页上与该类目名称相对应的input框内;接着,执行步骤3350。 
步骤3350:进一步判断发布文档中是否还存在未匹配的类目名称,若是,则返回步骤3320;否则,执行步骤3360。 
步骤3360:指示网站服务器11将信息发布网页上输入的信息内容进行发布。 
在步骤3360中,客户端10还可以在发布信息之前将解析后确定的未匹配成功的第一类目名称集合及相应的类目内容呈现在操作界面中,以供用户修改,在此不再赘述。 
综上所述,本申请实施例中,用户只需将包含发布信息的文档输入客户端10内的解析器100中,就可以实现对该文档的自动解析,接着,用户还可以通过客户端10将解析后确定的需要发布的类目名称和相应的类目内容,发送至指定的信息发布网页进行匹配,并将匹配成功的类目名称及相应的类目内容在该信息发布网页上进行发布。这样,用户在网站上发布信息时,便无需将信息逐条添加至信息发布网页中对应的输入框内,从而大大简化了信息发布流程的操作步骤,降低了该操作步骤的繁琐程度,提高了信息发布流程的执行效率。同时,由于客户端10会对需要发布的类目名称进行自动匹配,因此,用户无需按照信息发布网页上呈现的类目名称的顺序填写包含发布信息的文档,这样,用户可以根据自身的使用习惯设置包含发布信息的文档,从而进一步提升了信息发布流程的性能,提高了其服务质量。 
显然,本领域的技术人员可以对本申请中的实施例进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请实施例中的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请中的实施例也意图包含 这些改动和变型在内。 

Claims (14)

1.一种发布网站信息的方法,其特征在于,包括: 
接收输入的发布文档,并根据预设的字段属性对该发布文档进行解析,以确定该发布文档中包含的第一类目名称集合及相应的类目内容; 
对指定的信息发布网页进行页面扫描,以确定该信息发布网页上设置的第二类目名称集合,其中,所述指定的信息发布页面包括对应所述第二类目名称的输入框; 
对所述第一类目名称集合与所述第二类目名称集合进行匹配,将匹配成功的第一类目名称对应的类目内容,添加至与其匹配的第二类目名称在信息发布网页内对应的输入框中,以完成信息发布。 
2.如权利要求1所述的方法,其特征在于,所述接收输入的发布文档,具体为:接收以导入方式输入的发布文档,或者,接收以拷贝方式输入的发布文档。 
3.如权利要求1所述的方法,其特征在于,所述预设的字段属性包括分隔符、图片属性、文字属性、单元格属性和命令属性中的一种或任意组合。 
4.如权利要求1所述的方法,其特征在于,所述接收输入的发布文档,并根据预设的字段属性对该发布文档进行解析之前还包括:判断所述发布文档的文件格式,针对不同的文件格式获取预设的相应字段属性对所述发布文档进行解析。 
5.如权利要求1所述的方法,其特征在于,所述发布文档为word文档、txt文档、execel文档或html文档。 
6.如权利要求5所述的方法,其特征在于,所述发布文档的排版方式为横式排版或者竖式排版。 
7.如权利要求1-6任一项所述的方法,其特征在于,在根据预设的字段属性对所述发布文档进行解析,与对指定的信息发布网页进行页面扫描之间,还包括: 
将解析后确定的第一类目名称集合及相应的类目内容呈现在操作界面中,并添加对应的输入框,以供用户修改。 
8.如权利要求1-6任一项所述的方法,其特征在于,所述对第一类目名称集合与第二类目名称集合进行匹配,包括:精确匹配或者模糊匹配。 
9.如权利要求1-6任一项所述的方法,其特征在于,在将匹配成功的第一类目名称对应的类目内容,添加至与其匹配的第二类目名称在信息发布网页内对应的输入框中,与完成信息发布之间,还包括: 
将未匹配成功的第一类目名称及对应的类目内容呈现在操作界面中,以供用户修改。 
10.一种用于发布网站信息的装置,其特征在于,包括: 
解析器,用于接收输入的发布文档,并根据预设的字段属性对该发布文档进行解析,以确定该发布文档中包含的第一类目名称集合及相应的类目内容; 
扫描单元,用于对指定的信息发布网页进行页面扫描,以确定该信息发布网页上设置的第二类目名称集合,其中,所述指定的信息发布页面包括对应所述第二类目名称的输入框; 
匹配发布单元,用于对所述第一类目名称集合与所述第二类目名称集合进行匹配,将匹配成功的第一类目名称对应的类目内容,添加至与其匹配的第二类目名称在信息发布网页内对应的输入框中,以完成信息发布。 
11.如权利要求10所述的装置,其特征在于,所述解析器以导入方式接收所述输入的发布文档,或者,以拷贝方式接收所述输入的发布文档。 
12.如权利要求10或11所述的装置,其特征在于,所述解析器根据预设的字段属性对所述发布文档进行解析后,在所述扫描单元对指定的信息发布网页进行页面扫描之前,将解析后确定的第一类目名称集合及相应的类目内容呈现在操作界面中,并添加对应的输入框,以供用户修改。
13.如权利要求10或11所述的装置,其特征在于,所述匹配发布单元采用精确匹配方式或者模糊匹配方式对所述第一类目名称集合与第二类目名称 集合进行匹配。 
14.如权利要求10或11所述的装置,其特征在于,所述匹配发布单元在将匹配成功的第一类目名称对应的类目内容,添加至与其匹配的第二类目名称在信息发布网页内对应的输入框中后,在完成信息发布之前,将未匹配成功的第一类目名称及对应的类目内容呈现在操作界面中,以供用户修改。 
CN 200910252094 2009-12-08 2009-12-08 一种发布网站信息的方法及装置 Expired - Fee Related CN102087653B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN 200910252094 CN102087653B (zh) 2009-12-08 2009-12-08 一种发布网站信息的方法及装置
HK11109077.4A HK1154965A1 (en) 2009-12-08 2011-08-29 A method and device for publishing website information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200910252094 CN102087653B (zh) 2009-12-08 2009-12-08 一种发布网站信息的方法及装置

Publications (2)

Publication Number Publication Date
CN102087653A CN102087653A (zh) 2011-06-08
CN102087653B true CN102087653B (zh) 2013-09-18

Family

ID=44099466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200910252094 Expired - Fee Related CN102087653B (zh) 2009-12-08 2009-12-08 一种发布网站信息的方法及装置

Country Status (2)

Country Link
CN (1) CN102087653B (zh)
HK (1) HK1154965A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855255B (zh) * 2011-06-30 2016-04-20 北京新媒传信科技有限公司 内容管理发布方法及系统
CN105630521A (zh) * 2014-10-31 2016-06-01 阿里巴巴集团控股有限公司 一种网页的加载方法和装置
CN108563618A (zh) * 2018-03-15 2018-09-21 链家网(北京)科技有限公司 一种纸质文件线上化方法和系统
CN111125565A (zh) * 2019-11-01 2020-05-08 上海掌门科技有限公司 一种在应用中输入信息的方法与设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
CN1801149A (zh) * 2004-12-16 2006-07-12 微软公司 用于将格式化文档转化为网页的系统和方法
CN101370024A (zh) * 2007-08-15 2009-02-18 北京灵图软件技术有限公司 信息的分布式采集方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
CN1801149A (zh) * 2004-12-16 2006-07-12 微软公司 用于将格式化文档转化为网页的系统和方法
CN101370024A (zh) * 2007-08-15 2009-02-18 北京灵图软件技术有限公司 信息的分布式采集方法及系统

Also Published As

Publication number Publication date
CN102087653A (zh) 2011-06-08
HK1154965A1 (en) 2012-05-04

Similar Documents

Publication Publication Date Title
US10437907B2 (en) Link expansion service
KR100490734B1 (ko) 주석기반 문서 자동 생성장치 및 방법
JP2020194567A (ja) ウェブコンテンツ生成方法およびシステム
US9092758B2 (en) Service providing apparatus, information processing system and methods
US20180191798A1 (en) Methods and systems for server-side rendering of native content for presentation
US20120036429A1 (en) Electronic book system and content server
CN110362372A (zh) 页面转译方法、装置、介质及电子设备
US11599584B2 (en) Method and system for processing information in social network system
CN103389969A (zh) 一种用于移动终端预览pdf文件的方法、装置和系统
US20150024351A1 (en) System and Method for the Relevance-Based Categorizing and Near-Time Learning of Words
WO2014160095A1 (en) Systems and methods for creating or updating an application using website content
CN102257488A (zh) 用于经由网络自动聚合内容的技术
CN1996295A (zh) 图像形成装置和搜索和打印网络上的图像的方法
JP5309121B2 (ja) 情報処理方法、プログラム、情報処理システム
KR20110017694A (ko) 온라인 문서 편집 시스템 및 그 방법
CN105740417A (zh) 一种基于网页的目标数据搜索方法、模块、浏览器及终端
CN102087653B (zh) 一种发布网站信息的方法及装置
JP5108272B2 (ja) 共同翻訳装置
CN115587075A (zh) 版式文件处理方法、装置、终端设备及存储介质
KR101724076B1 (ko) 사용자 서버를 이용한 html 제어 시스템 및 방법
CN115114556A (zh) 一种创建页面的方法和装置
KR100446643B1 (ko) 저작 도구 기반 전자 도서 출판 방법 및 시스템
CN115857928A (zh) 一种基于控件式的可视化手机建站系统及方法
CN114676238A (zh) 结合rpa及ai的关键信息获取方法、装置及存储介质
JP5599586B2 (ja) メッセージボード機能提供システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1154965

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1154965

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130918

CF01 Termination of patent right due to non-payment of annual fee