CN110362372B - 页面转译方法、装置、介质及电子设备 - Google Patents
页面转译方法、装置、介质及电子设备 Download PDFInfo
- Publication number
- CN110362372B CN110362372B CN201910533712.2A CN201910533712A CN110362372B CN 110362372 B CN110362372 B CN 110362372B CN 201910533712 A CN201910533712 A CN 201910533712A CN 110362372 B CN110362372 B CN 110362372B
- Authority
- CN
- China
- Prior art keywords
- country
- page
- target
- language type
- target terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/454—Multi-language systems; Localisation; Internationalisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本公开涉及自然语言处理领域,揭示了一种页面转译方法、装置、介质及电子设备。该方法包括:接收并响应用户访问网页的请求,获取发送用户访问网页的请求的目标终端的IP地址;根据目标终端的IP地址确定目标终端所属的国家,并根据所述目标终端所属的国家确定网页中的语言类型;根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,并将所述目标页面向目标终端发送,以使所述目标终端展示所述目标页面。此方法下,通过在用户访问网站页面时,自动识别出适合用户浏览的语言类型,然后将与该语言类型对应的页面发送到目标终端,使得用户直接浏览到的页面中内容的语言更符合用户使用习惯,从而提高了用户获取信息的效率和用户体验。
Description
技术领域
本公开涉及自然语言处理技术领域,特别涉及一种页面转译方法、装置、介质及电子设备。
背景技术
随着经济全球化进程的进一步推进以及互联网的高速发展,国际交往日益频繁和便利,地球已经成为一个地球村,越来越多的同时为多个国家的用户服务的国际站点正在紧锣密鼓的建设中。由于网站需要同时为不同国家的用户服务,而不同国家的用户使用的语言往往是不同的,因此网站页面在不同语言下的转译已经成为了网站建设中亟需解决的重要问题之一。
发明内容
在自然语言处理技术领域,为了解决上述技术问题,本公开的目的在于提供一种页面转译方法、装置、介质及电子设备。
根据本申请的一方面,提供了一种页面转译方法,所述方法包括:
接收并响应用户访问网页的请求,获取发送用户访问网页的请求的目标终端的IP地址;
根据目标终端的IP地址确定目标终端所属的国家,并根据所述目标终端所属的国家确定网页中的语言类型;
根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,并将所述目标页面向目标终端发送,以使所述目标终端展示所述目标页面。
根据本申请的另一方面,提供了一种页面转译装置,所述装置包括:
获取模块,被配置为接收并响应用户访问网页的请求,获取发送用户访问网页的请求的目标终端的IP地址;
确定模块,被配置为根据目标终端的IP地址确定目标终端所属的国家,并根据所述目标终端所属的国家确定网页中的语言类型;
发送模块,被配置为根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,并将所述目标页面向目标终端发送,以使所述目标终端展示所述目标页面。
根据本申请的另一方面,提供了一种计算机可读程序介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行如前所述的方法。
根据本申请的另一方面,提供了一种电子设备,所述电子设备包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如前所述的方法。
本发明的实施例提供的技术方案可以包括以下有益效果:
本发明所提供的页面转译方法包括如下步骤:接收并响应用户访问网页的请求,获取发送用户访问网页的请求的目标终端的IP地址;根据目标终端的IP地址确定目标终端所属的国家,并根据所述目标终端所属的国家确定网页中的语言类型;根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,并将所述目标页面向目标终端发送,以使所述目标终端展示所述目标页面。
此方法下,通过在用户访问网站的页面时,根据发送访问请求的IP地址识别出适合用户浏览的语言类型,然后将与该语言类型对应的目标页面发送到目标终端,使得用户直接浏览到的页面中内容的语言更可能是用户习惯使用的语言,从而提高了用户获取页面中信息的效率,同时提高了用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种页面转译方法的系统构架示意图;
图2是根据一示例性实施例示出的一种页面转译方法的流程图;
图3是根据图2对应实施例示出的一实施例的步骤230之后步骤的流程图;
图4是根据图2对应实施例示出的一实施例的步骤220的细节流程图;
图5是根据图4对应实施例示出的一实施例的预定规则的流程图
图6是根据一示例性实施例示出的一种页面转译装置的框图;
图7是根据一示例性实施例示出的一种实现上述页面转译方法的电子设备示例框图;
图8是根据一示例性实施例示出的一种实现上述页面转译方法的计算机可读存储介质。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
本公开首先提供了一种页面转译方法。页面是指在万维网上能够记录文字、图片、视频、音频以及其他内容的一种文件,其中,还可以包括基于至少一种语言编写的代码。当该文件被浏览器、客户端或者App(Application,应用程序)读取并解析时,在运行该浏览器、客户端或者App的终端上通过显示单元呈现出来的即为页面。常见的页面可以是Web页面或者Html5页面。本公开提供的页面转译方法施加的对象可以是静态页面,也可以是动态页面。应当理解,页面中的文字一般都利用一种特定的语言来编写的,所以页面转译是指将本来向页面请求方终端发送的包含由一种语言记录的文字内容的网页文件转换为由另一种语言记录的文字内容的网页文件的过程。
本公开的实施终端可以是任何具有运算和处理功能的设备,该设备还可以与外部设备相连,用于传输数据,其可以是便携移动设备,例如智能手机、平板电脑、笔记本电脑、PDA(Personal Digital Assistant)等,也可以是固定式设备,例如,计算机设备、现场终端、台式电脑、服务器、工作站等,还可以是多个设备的集合,比如云计算的物理基础设施。
图1是根据一示例性实施例示出的一种页面转译方法的系统构架示意图。如图1所示,包括数据库110、服务器120以及用户终端130,其中,在本实施例中服务器120是本公开的实施终端,服务器120与数据库110之间通过通信链路进行连接,从而使服务器120可以对数据库110中存储的数据进行存取操作,数据库110中存储着预先置于其中的网页文件,服务器120与用户终端130之间也存在着通信链路的连接,用户终端130可以向服务器120发送网络请求,服务器120会根据接收到的该网络请求向用户终端130返回相应的响应,具体可以为:服务器120对该网络请求进行处理,获得该网络请求所需要的网页文件,然后从数据库110获取该网页文件并向用户终端130返回,用户终端130上运行的应用程序,比如浏览器、具有网页解析功能的客户端等都可以读取该网页文件并将其渲染成视觉上的页面,然后可以通过用户终端130的显示单元向用户展示出该页面,其中,服务器120与用户终端130之间的架构可以是C/S架构,即Client/Server(客户端/服务器)架构,也可以是B/S架构,即Browser/Server(浏览器/服务器)架构。在传统方法下,网络页面浏览服务往往是需要由服务器120同时为不同的国家和地区提供的,因此,访问服务器120的用户终端,也经常位于不同的国家和地区,不同国家和地区的用户使用的语言往往是不同的,所以有必要针对不同国家和地区的用户发来的访问请求进行页面转译,而当本申请的一个或多个实施例应用到本实施例的场景下时,即可完成对页面的转译工作。
值得一提的是,图1仅是本公开的一个实施例,虽然在图1示出的实施例中,网页文件存储于与本公开的实施终端连接的数据库之中、本公开的实施终端为服务器、并且用户终端为台式电脑,但在实际应用中,网页文件存储于各种位置,比如可以是本地存储空间,同时本公开的实施终端可以是上述的各种各样的设备,而用户终端也可以是各种终端设备,比如用户终端还可以是智能手机。因此本公开对此不作任何限定,本公开的保护范围也不应因此而受到任何限制。
图2是根据一示例性实施例示出的一种页面转译方法的流程图。如图2所示,包括以下步骤:
步骤210,接收并响应用户访问网页的请求,获取发送用户访问网页的请求的目标终端的IP地址。
用户访问网页的请求可以是基于各种网络协议的请求,比如可以是HTTP协议下的请求,目标终端即发送用户访问网页的请求的终端。
易于理解,在一般情况下,访问网页的请求是用户使用其终端向外发送的,因此用户访问网页的请求本质上是用户的终端发来的请求,两者在实际情况下并无二致,此处为便于理解,使用了用户访问网页的请求进行描述。
在一个实施例中,本公开的实施终端具有日志,该日志可以记录向本端发送访问网页的请求的每一终端的IP地址,通过读取该日志,获取发送用户访问网页的请求的目标终端的IP地址。
在一个实施例中,用户访问网页的请求是基于HTTP协议建立的请求,该请求的报文的头部中记录有发送用户访问网页的请求的目标终端的IP地址,本公开的实施终端通过读取该请求报文的头部,获取目标终端的IP地址。
步骤220,根据目标终端的IP地址确定目标终端所属的国家,并根据所述目标终端所属的国家确定网页中的语言类型。
网页中的语言类型即要向目标终端发送的目标页面中的语言类型。
在一个实施例中,预设有IP地址范围与IP地址所述国家对应关系表,通过查询该表,确定所述目标终端的IP地址所在IP地址范围,然后将与确定出的该IP地址范围对应的国家,作为确定出的目标终端所属的国家。
在一个实施例中,调用能根据IP地址查询目标终端所属国家的API(ApplicationProgramming Interface,应用程序编程接口)来确定目标终端所属的国家。
在一个实施例中,预设有存储着每一国家的典型IP地址的数据库,利用正则表达式匹配的方式,获取与所述目标终端的IP地址匹配的典型IP地址,然后将与匹配出的典型IP地址对应的国家,作为确定出的目标终端所属的国家。
比如,可以利用|、?、/d等字符构成的正则表达式进行匹配。
在一个实施例中,预先设有一个国家与语言类型对应关系表,通过查询该表,获取与所述目标终端所属的国家对应的语言类型,从而完成据所述目标终端所属的国家确定网页中的语言类型。
易于理解,一个名称可以唯一确定一种语言的类型,语言类型即为语言的名称。比如,中文、英文、法文、俄文、意大利文等任意一个都为一种语言类型。每一国家都对应一个语言类型,比如中国对应的语言类型为中文,法国对应的语言类型为法文,德国对应的语言类型为德文。
在一个实施例中,通过调用能根据国家查询相应的语言类型的API获取网页中的语言类型。
步骤230,根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,并将所述目标页面向目标终端发送,以使所述目标终端展示所述目标页面。
目标页面即为要向用户展示的页面,所以目标页面是包含的信息内容与用户访问网页的请求所针对页面内容一致且网页类型为所述网页中的语言类型的页面。
在一个实施例中,对于每一页面中的内容,预先针对页面中的内容建立了对应的每一语言类型的页面,首先获取网页类型与所述网页中的语言类型相同的页面,然后在获取的所述页面中确定出内容与用户访问网页的请求所针对的页面一致的页面,作为目标页面,并将所述目标页面向目标终端发送。
本实施例的好处在于,由于每一语言类型的页面都是预先建立的,可以把控不同语言类型的页面中内容的翻译质量,从而提高用户体验。
在一个实施例中,预先针对页面中的内容建立的对应的每一语言类型的页面是通过人工翻译并录入的方式来进行的。
具体地,在获取的所述页面中确定出内容与用户访问网页的请求所针对的页面一致的页面作为目标页面的具体步骤可以包括:
在用户访问网页的请求所针对的页面中提取预定数目个关键词;
在获取的所述页面中获取包含了提取的所有所述关键词的页面,作为目标页面。
在一个实施例中,对于每一页面中的内容,预先针对该页面中的内容建立了对应的每一语言类型的页面,并存储在预设的存储空间中,用户访问网页的请求所针对的页面是需要从该预设的存储空间中获取的,其中,在所述预设的存储空间中,对应于同一页面内容的各个语言类型的页面被分为一组,根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,具体包括:
确定所述用户访问网页的请求所针对的页面所属的组;在属于确定出的所述组的页面中获取语言类型与所述网页中的语言类型一致的页面,作为目标页面。
在一个实施例中,根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,具体包括:
将所述用户访问网页的请求所针对的页面中的内容对应翻译为所述网页中的语言类型。
具体地,在一个实施例中,通过将所述用户访问网页的请求所针对的页面嵌入翻译脚本语句并在所述脚本语句中添加所述网页中的语言类型这一目标语言参数,从而得到与所述网页中的语言类型对应的目标页面,其中,翻译脚本语句中可以包含调用翻译API的语句。
在一个实施例中,根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,具体包括:
读取所述用户访问网页的请求所针对的页面文件中的内容并对应翻译为所述网页中的语言类型;
将翻译后的内容按照翻译时的对应关系替换所述用户访问网页的请求所针对的页面文件中的内容,以得到与所述网页中的语言类型对应的目标页面。
本实施例的好处在于,由于翻译是自动进行的,而且不需要预先准备大量的不同语言类型的页面文件,省却了前序工作流程,节约了存储资源的消耗。
在一个实施例中,在步骤230之后,还可以包括以下步骤:
获取用户在目标页面中输入的待分析文字信息;
识别所述待分析文字信息的语言类型,并根据所述待分析文字信息的语言类型获取与所述待分析文字信息的语言类型一致且与所述目标页面内容相同的待显示页面,并将获取的所述待显示页面发送至目标终端,以使所述目标终端展示待显示页面;或者
识别所述待分析文字信息的语言类型,并根据所述待分析文字信息的语言类型将目标页面中的信息渲染为与待分析文字信息语言类型一致的信息。
待显示页面是等待向用户所在的目标终端发送的页面,待显示页面中的内容与所述目标页面内容相同。
具体而言,本端获取用户在目标页面中输入的待分析文字信息的方式可以是:利用所述目标页面中的表单接收用户输入的待分析文字信息。
比如,目标页面中可以包含用来接收用户输入的待分析文字信息的控件,通过该控件获取用户输入的待分析文字信息。例如,控件可以是文本框。
在一个实施例中,预先为每一语言类型设立了相应的字典库,所述识别所述待分析文字信息的语言类型,包括:通过遍历每一字典库,确定所述待分析文字信息中的文字所在的字典库;将与确定出的所述字典库对应的语言类型作为所述待分析文字信息的语言类型。
其中,对于根据所述待分析文字信息的语言类型将目标页面中的信息渲染为与待分析文字信息语言类型一致的信息的步骤,具体可以通过如下方式实现:
将所述目标页面的文件内记录的代码中嵌入翻译脚本语句,其中,当被嵌入翻译脚本语句的目标页面被发送到目标终端时,目标终端会根据该翻译脚本语句将原目标页面中的信息对应渲染为与待分析文字信息语言类型一致的信息。
前述针对步骤230之后的步骤所提供的实施例的好处在于,考虑了基于IP地址确定出的语言类型不准确以及用户习惯使用的语言与用户所在地区的通用语言不一致等情况,通过分析用户主动输入的待分析文字信息可以进一步向用户提供更加准确的目标页面,从而提高用户体验。
综上所述,根据图2对应实施例提供的页面转译方法,通过在用户访问网站的页面时,根据发送访问请求的IP地址识别出适合用户浏览的语言类型,接着将与该语言类型对应的目标页面发送到目标终端,使得用户直接浏览到的页面中内容的语言更可能是用户习惯使用的语言,从而提高了用户获取页面中信息的效率,同时提高了用户体验。
图3是根据图2对应实施例示出的一实施例的步骤230之后步骤的流程图。在本实施例中,预设网页页面库中存储有与多个语言类型对应的页面,对于预设网页页面库中的每一页面的内容,所述预设网页页面库中都存储有与该页面的内容对应的多个语言类型的页面,与任一页面的内容对应的所述页面的数目相同,如图3所示,包括以下步骤:
步骤240,获取用户通过所述目标页面上传的待分析语音信息。
在一个实施例中,用户发送访问网页请求的终端,即目标终端具有语音输入单元,通过用户的目标终端上的语音输入单元可以录制用户的语音并上传至本端。比如语音输入单元可以是麦克风、话筒等。
在一个实施例中,用户可以通过位于所述目标页面上的控件触发控制目标终端的语音输入单元开始进行语音的录制,并且还可以通过控件启动上传待分析语音信息的动作。
步骤250,识别所述待分析语音信息的语言类型。
在一个实施例中,预设有与每一语言类型对应的音素库,所述识别所述待分析语音信息的语言类型具体包括:将所述待分析语音信息切分为音素;在与各语言类型对应的音素库中获取包含所有切分成的所述音素的音素库;确定与所述音素库对应的语言类型,作为所述待分析语音信息的语言类型。
步骤260,当预设网页页面库中存在与所述待分析语音信息的语言类型一致且与所述目标页面内容相同的待显示页面时,将与所述待分析语音信息的语言类型一致且与所述目标页面内容相同的待显示页面发送至目标终端,以使所述目标终端展示所述待显示页面。
当一个页面中内容的语言类型与所述待分析语音信息的语言类型一致且该页面的内容与所述目标页面内容相同,就可以说明该页面是符合用户的语言需要且包含用户需要浏览的内容的页面,此时就可以将该页面发送给目标终端。
步骤270,当预设网页页面库中不存在与所述待分析语音信息的语言类型一致且与所述目标页面内容相同的待显示页面时,将所述目标页面中的信息渲染为与所述待分析语音信息的语言类型一致的信息。
通过页面库的方式针对每一页面内容来建立所有语言的页面是很繁重的任务,特别是对于包含众多页面的大型网站来说,是很繁重的工作,所以图3示出的实施例的好处在于,对于预设网页页面库中存在与所述待分析语音信息的语言类型一致且与所述目标页面内容相同的待显示页面的情况,通过将该待显示页面直接发送到目标终端,可以保证页面内容可以具有较高的质量,同时,对于预设网页页面库中不存在与所述待分析语音信息的语言类型一致且与所述目标页面内容相同的待显示页面的这一情况,通过直接渲染的方式向用户呈现出适应用户语言要求的页面,可以提高用户体验,此外,用户只需上传语音信息即可实现用户所需网页中语言类型的进一步确认,提高了访问效率。
图4是根据图2对应实施例示出的一实施例的步骤220的细节流程图。如图4所示,步骤220具体包括:
步骤220',当无法根据目标终端的IP地址确定目标终端所属的国家时,根据预定规则确定网页中的语言类型。
在一个实施例中,所述预定规则包括:获取预设的语言类型作为网页中的语言类型。
比如,预设的语言类型可以是中文、英文、法文等。
在一个实施例中,所述预定规则包括:获取本端所在的IP地址;根据本端所在的IP地址确定本端所属的国家;获取与确定出的所述国家对应的语言类型。
由于本端,即用户访问网页的服务端常常位于其服务的用户所在的地区,所以根据本端所在的IP地址来获取网页中的语言类型更可能满足用户需要,本实施例的好处在于,为在无法根据目标终端的IP地址确定目标终端所属的国家的这一情况下如何确定网页中的语言类型提供了解决方案,保证了用户的体验。
图5是根据图4对应实施例示出的一实施例的预定规则的流程图。如图5所示,包括以下步骤:
步骤510,获取当前时间之前预定时间段内发来访问请求的所有发送端的IP地址所属的国家。
预定时间段是任意的时间段,比如可以是一天、一周、一个月、一年等。
在一个实施例中,本端包含日志系统,该日志系统中的日志记录了发来访问请求的所有发送端的IP地址所属的国家,通过读取该日志系统中的日志,获取发来访问请求的所有发送端的IP地址所属的国家。
在一个实施例中,发来访问请求的每一发送端的IP地址所属的国家和相应的该发送端发送访问请求的时间对应存储在数据库中,通过查询该数据库,获取当前时间之前预定时间段内发来访问请求的所有发送端的IP地址所属的国家。
步骤520,针对每一国家,在所述预定时间段内发来访问请求的所有发送端的IP地址中获取属于该国家的IP地址的数目。
在一个实施例中,本端内嵌有一个计数器,利用该计数器可以对属于每一国家的IP地址的数目进行计数。具体地,针对每一国家,每当该计数器识别出一个IP地址属于该国家,计数器就加1,直至无法再识别出一个IP地址属于该国家,此时该计数器计得的数目即为属于该国家的IP地址的数目。
步骤530,基于所述数目获取目标国家。
在一个实施例中,步骤530包括:获取所述数目最大的国家,作为目标国家。
在一个实施例中,步骤530具体包括:
对各国家按照获取的所述数目从大到小进行排序;获取每一国家的访问高峰时间段;获取每一国家的当地时间和预先为当地时间是否位于访问高峰时间段内而相应设置的评分修正方式;针对每一国家,当该国家的当地时间位于该国家的访问高峰时间段时,获取预先为当地时间位于访问高峰时间段内而相应设置的评分修正方式,当该国家的当地时间不位于该国家的访问高峰时间段时,获取预先为当地时间不位于访问高峰时间段内而相应设置的评分修正方式;针对每一国家,按照针对该国家获取的所述评分修正方式,对该国家在所述排序中的序号进行修正,以得到该国家的评分;获取所述评分最小的国家作为目标国家。
其中,评分修正方式是指对各国家排序的序号进行运算以获得国家的评分的方式。
比如,预先为当地时间位于访问高峰时间段内而相应设置的评分修正方式可以为:对排序序号乘0.9,对应地,预先为当地时间不位于访问高峰时间段内而相应设置的评分修正方式可以为:对排序序号乘1.1。
在一个实施例中,预先为当地时间位于访问高峰时间段内而相应设置的评分修正方式为利用如下公式对各国家排序的序号进行修正:
其中,x是各国家排序的序号,y是修正得到的国家的评分,
对应地,预先为当地时间不位于访问高峰时间段内而相应设置的评分修正方式为利用如下公式对各国家排序的序号进行修正:
y=x2。
由于各国家是按照获取的所述数目从大到小进行排序的,一个国家排序越小,则所述数目越高,也就更可能被选作目标国家,由此可以看出,评分修正方式的本质为增加对当地时间位于访问高峰时间段内的国家与当地时间不位于访问高峰时间段内的国家之间的基于排序序号建立的国家的评分之间的差距,使得获取的国家的评分更为客观,所以评分修正方式可以是任意的,只要拉大当地时间位于访问高峰时间段内的国家与当地时间不位于访问高峰时间段内的国家之间的基于排序序号建立的国家的评分之间的差距即可,所以预先为当地时间是否位于访问高峰时间段内而相应设置的评分修正方式之一还可以为保持国家的排序序号不变。
在一个实施例中,对各国家按照获取的所述数目从大到小进行排序的具体方式为使用冒泡排序算法对各国家按照获取的所述数目从大到小进行排序。
在一个实施例中,所述预定时间段为第一预定时间段,所述数目为第一数目,所述基于所述数目获取目标国家,包括:获取当前时间之前第二预定时间段内发来访问请求的所有发送端的IP地址所属的国家,所述第二预定时间段小于第一预定时间段;针对每一国家,在所述第二预定时间段内发来访问请求的所有发送端的IP地址中获取属于该国家的IP地址的数目,作为第二数目;基于所述第一数目和所述第二数目获取目标国家。
在一个实施例中,基于所述第一数目和所述第二数目获取目标国家,包括:针对每一国家,分别获取第一数目和第二数目的权重;针对每一国家,利用所述权重确定针对该国家获取的所述第一数目和所述第二数目的加权和;获取所述加权和最大的国家作为目标国家。
本实施例的好处在于,综合利用了第一数目和第二数目两方面因素来获取目标国家,提高了获取的目标国家的准确率,从而可以提高最终确定出的网页中的语言类型的准确率。
本公开还提供了一种页面转译装置,以下是本公开的装置实施例。
图6是根据一示例性实施例示出的一种页面转译装置的框图。如图6所示,装置600包括:
获取模块610,被配置为接收并响应用户访问网页的请求,获取发送用户访问网页的请求的目标终端的IP地址。
确定模块620,被配置为根据目标终端的IP地址确定目标终端所属的国家,并根据所述目标终端所属的国家确定网页中的语言类型。
发送模块630,被配置为根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,并将所述目标页面向目标终端发送,以使所述目标终端展示所述目标页面。
据本公开的第三方面,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图7来描述根据本发明的这种实施方式的电子设备700。图7显示的电子设备700仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700以通用计算设备的形式表现。电子设备700的组件可以包括但不限于:上述至少一个处理单元710、上述至少一个存储单元720、连接不同系统组件(包括存储单元720和处理单元710)的总线730。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元710执行,使得所述处理单元710执行本说明书上述“实施例方法”部分中描述的根据本发明各种示例性实施方式的步骤。
存储单元720可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)721和/或高速缓存存储单元722,还可以进一步包括只读存储单元(ROM)723。
存储单元720还可以包括具有一组(至少一个)程序模块725的程序/实用工具724,这样的程序模块725包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线730可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备700也可以与一个或多个外部设备900(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备700交互的设备通信,和/或与使得该电子设备700能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口750进行。并且,电子设备700还可以通过网络适配器760与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器760通过总线730与电子设备700的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
根据本公开的第四方面,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图8所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (6)
1.一种页面转译方法,其特征在于,所述方法包括:
接收并响应用户访问网页的请求,获取发送用户访问网页的请求的目标终端的IP地址;
根据目标终端的IP地址确定目标终端所属的国家,并根据所述目标终端所属的国家确定网页中的语言类型,所述根据目标终端的IP地址确定目标终端所属的国家,并根据所述目标终端所属的国家确定网页中的语言类型,包括:当无法根据目标终端的IP地址确定目标终端所属的国家时,根据预定规则确定网页中的语言类型;所述预定规则包括:获取当前时间之前预定时间段内发来访问请求的所有发送端的IP地址所属的国家;针对每一国家,在所述预定时间段内发来访问请求的所有发送端的IP地址中获取属于该国家的IP地址的数目;基于所述数目获取目标国家;根据所述目标国家确定网页中的语言类型;所述基于所述数目获取目标国家,包括:对各国家按照获取的所述数目从大到小进行排序;获取每一国家的访问高峰时间段;获取每一国家的当地时间和预先为当地时间是否位于访问高峰时间段内而相应设置的评分修正方式;针对每一国家,当该国家的当地时间位于该国家的访问高峰时间段时,获取预先为当地时间位于访问高峰时间段内而相应设置的评分修正方式,当该国家的当地时间不位于该国家的访问高峰时间段时,获取预先为当地时间不位于访问高峰时间段内而相应设置的评分修正方式;针对每一国家,按照针对该国家获取的所述评分修正方式,对该国家在所述排序中的序号进行修正,以得到该国家的评分;获取所述评分最小的国家作为目标国家;或者,所述预定时间段为第一预定时间段,所述数目为第一数目,所述基于所述数目获取目标国家,包括:获取当前时间之前第二预定时间段内发来访问请求的所有发送端的IP地址所属的国家,所述第二预定时间段小于第一预定时间段;针对每一国家,在所述第二预定时间段内发来访问请求的所有发送端的IP地址中获取属于该国家的IP地址的数目,作为第二数目;基于所述第一数目和所述第二数目获取目标国家;
根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,并将所述目标页面向目标终端发送,以使所述目标终端展示所述目标页面。
2.根据权利要求1所述的方法,其特征在于,在根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,并将所述目标页面向目标终端发送,以使所述目标终端展示所述目标页面之后,所述方法还包括:
获取用户在目标页面中输入的待分析文字信息;
识别所述待分析文字信息的语言类型,并根据所述待分析文字信息的语言类型获取与所述待分析文字信息的语言类型一致且与所述目标页面内容相同的待显示页面,并将获取的所述待显示页面发送至目标终端,以使所述目标终端展示待显示页面;或者
识别所述待分析文字信息的语言类型,并根据所述待分析文字信息的语言类型将目标页面中的信息渲染为与待分析文字信息语言类型一致的信息。
3.根据权利要求1所述的方法,其特征在于,预设网页页面库中存储有与多个语言类型对应的页面,在根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,并将所述目标页面向目标终端发送,以使所述目标终端展示所述目标页面之后,所述方法还包括:
获取用户通过所述目标页面上传的待分析语音信息;
识别所述待分析语音信息的语言类型;
当预设网页页面库中存在与所述待分析语音信息的语言类型一致且与所述目标页面内容相同的待显示页面时,将与所述待分析语音信息的语言类型一致且与所述目标页面内容相同的待显示页面发送至目标终端,以使所述目标终端展示所述待显示页面;
当预设网页页面库中不存在与所述待分析语音信息的语言类型一致且与所述目标页面内容相同的待显示页面时,将所述目标页面中的信息渲染为与所述待分析语音信息的语言类型一致的信息。
4.一种页面转译装置,其特征在于,所述装置包括:
获取模块,被配置为接收并响应用户访问网页的请求,获取发送用户访问网页的请求的目标终端的IP地址;
确定模块,被配置为根据目标终端的IP地址确定目标终端所属的国家,并根据所述目标终端所属的国家确定网页中的语言类型,所述根据目标终端的IP地址确定目标终端所属的国家,并根据所述目标终端所属的国家确定网页中的语言类型,包括:当无法根据目标终端的IP地址确定目标终端所属的国家时,根据预定规则确定网页中的语言类型;所述预定规则包括:获取当前时间之前预定时间段内发来访问请求的所有发送端的IP地址所属的国家;针对每一国家,在所述预定时间段内发来访问请求的所有发送端的IP地址中获取属于该国家的IP地址的数目;基于所述数目获取目标国家;根据所述目标国家确定网页中的语言类型;所述基于所述数目获取目标国家,包括:对各国家按照获取的所述数目从大到小进行排序;获取每一国家的访问高峰时间段;获取每一国家的当地时间和预先为当地时间是否位于访问高峰时间段内而相应设置的评分修正方式;针对每一国家,当该国家的当地时间位于该国家的访问高峰时间段时,获取预先为当地时间位于访问高峰时间段内而相应设置的评分修正方式,当该国家的当地时间不位于该国家的访问高峰时间段时,获取预先为当地时间不位于访问高峰时间段内而相应设置的评分修正方式;针对每一国家,按照针对该国家获取的所述评分修正方式,对该国家在所述排序中的序号进行修正,以得到该国家的评分;获取所述评分最小的国家作为目标国家;或者,所述预定时间段为第一预定时间段,所述数目为第一数目,所述基于所述数目获取目标国家,包括:获取当前时间之前第二预定时间段内发来访问请求的所有发送端的IP地址所属的国家,所述第二预定时间段小于第一预定时间段;针对每一国家,在所述第二预定时间段内发来访问请求的所有发送端的IP地址中获取属于该国家的IP地址的数目,作为第二数目;基于所述第一数目和所述第二数目获取目标国家;
发送模块,被配置为根据网页中的语言类型获取与所述网页中的语言类型对应的目标页面,并将所述目标页面向目标终端发送,以使所述目标终端展示所述目标页面。
5.一种计算机可读程序介质,其特征在于,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行根据权利要求1至3中任一项所述的方法。
6.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1至3任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910533712.2A CN110362372B (zh) | 2019-06-19 | 2019-06-19 | 页面转译方法、装置、介质及电子设备 |
PCT/CN2020/087473 WO2020253389A1 (zh) | 2019-06-19 | 2020-04-28 | 页面转译方法、装置、介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910533712.2A CN110362372B (zh) | 2019-06-19 | 2019-06-19 | 页面转译方法、装置、介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110362372A CN110362372A (zh) | 2019-10-22 |
CN110362372B true CN110362372B (zh) | 2022-04-05 |
Family
ID=68217426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910533712.2A Active CN110362372B (zh) | 2019-06-19 | 2019-06-19 | 页面转译方法、装置、介质及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110362372B (zh) |
WO (1) | WO2020253389A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110362372B (zh) * | 2019-06-19 | 2022-04-05 | 深圳壹账通智能科技有限公司 | 页面转译方法、装置、介质及电子设备 |
CN111193713A (zh) * | 2019-12-05 | 2020-05-22 | 贵阳语玩科技有限公司 | 单服务器集群对全球不同国家数据进行管理的系统和方法 |
CN111199427B (zh) * | 2019-12-31 | 2023-09-29 | 上海移为通信技术股份有限公司 | 网络用户的分组管理方法、装置、电子设备及存储介质 |
CN113157354B (zh) * | 2020-01-07 | 2023-11-03 | 北京京东振世信息技术有限公司 | 处理数据的方法、装置、设备和计算机可读介质 |
CN112149072A (zh) * | 2020-09-22 | 2020-12-29 | 北京达佳互联信息技术有限公司 | 平台用户的身份认证方法、装置、设备及介质 |
CN112966179B (zh) * | 2021-03-05 | 2024-03-12 | 北京百度网讯科技有限公司 | 信息的统一管理方法、装置、设备及存储介质 |
CN113076164B (zh) * | 2021-04-16 | 2024-04-16 | 北京沃东天骏信息技术有限公司 | 一种网页语言管理方法和装置 |
CN113821747A (zh) * | 2021-08-31 | 2021-12-21 | 挂号网(杭州)科技有限公司 | 一种数据展示方法、装置、存储介质及电子设备 |
CN113961286A (zh) * | 2021-10-11 | 2022-01-21 | 支付宝(杭州)信息技术有限公司 | 一种应用程序的页面生成方法、装置及设备 |
CN114489557B (zh) * | 2021-12-15 | 2024-03-22 | 青岛海尔科技有限公司 | 语音交互方法、装置、设备及存储介质 |
CN114491359A (zh) * | 2021-12-28 | 2022-05-13 | 北京航天智造科技发展有限公司 | 网页国际化的处理方法和装置 |
CN114510308B (zh) * | 2022-01-28 | 2023-10-03 | 北京百度网讯科技有限公司 | 移动终端存储应用页面的方法、装置、设备和介质 |
CN115065627B (zh) * | 2022-05-20 | 2024-04-12 | 北京奇艺世纪科技有限公司 | 参数修改方法、装置、电子设备及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6138142A (en) * | 1996-12-20 | 2000-10-24 | Intel Corporation | Method for providing customized Web information based on attributes of the requester |
KR20100091923A (ko) * | 2009-02-10 | 2010-08-19 | 오의진 | 다국어 웹페이지 번역 시스템 및 다국어 웹페이지를 번역하여 제공하는 방법 |
CN101567906A (zh) * | 2009-05-25 | 2009-10-28 | 阿里巴巴集团控股有限公司 | 确定网页内容语言的方法及服务器 |
CN104239459B (zh) * | 2014-09-02 | 2018-03-09 | 百度在线网络技术(北京)有限公司 | 语音搜索方法、装置和系统 |
CN104598271A (zh) * | 2014-12-29 | 2015-05-06 | 福建联迪商用设备有限公司 | 一种互联网设备自动设置语言的方法、装置及系统 |
CN104794625A (zh) * | 2015-04-28 | 2015-07-22 | 酷悠悠科技(深圳)有限公司 | 一种跨境电子商务网站运行的方法及系统 |
CN105868320A (zh) * | 2016-03-25 | 2016-08-17 | 乐视控股(北京)有限公司 | 显示方法、装置和系统 |
CN107391122B (zh) * | 2017-07-01 | 2020-03-27 | 珠海格力电器股份有限公司 | 设置终端系统语言的方法、装置和终端 |
CN109068010A (zh) * | 2018-11-06 | 2018-12-21 | 上海闻泰信息技术有限公司 | 语音内容记录方法与装置 |
CN110362372B (zh) * | 2019-06-19 | 2022-04-05 | 深圳壹账通智能科技有限公司 | 页面转译方法、装置、介质及电子设备 |
-
2019
- 2019-06-19 CN CN201910533712.2A patent/CN110362372B/zh active Active
-
2020
- 2020-04-28 WO PCT/CN2020/087473 patent/WO2020253389A1/zh active Application Filing
Non-Patent Citations (3)
Title |
---|
"An instant messaging with automatic language translation";Che-Yu Yang.etc;《2010 3rd IEEE International Conference on Ubi-Media Computing》;20100809;全文 * |
"双语辅助翻译搜索引擎若干问题研究";周星;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20090915;I138-877 * |
"基于Android平台的新蒙文—汉文在线翻译";杨众;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20140915;I138-1378 * |
Also Published As
Publication number | Publication date |
---|---|
CN110362372A (zh) | 2019-10-22 |
WO2020253389A1 (zh) | 2020-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110362372B (zh) | 页面转译方法、装置、介质及电子设备 | |
CN107679211B (zh) | 用于推送信息的方法和装置 | |
CN108572990B (zh) | 信息推送方法和装置 | |
CN111898643A (zh) | 一种语义匹配方法及装置 | |
EP3961426A2 (en) | Method and apparatus for recommending document, electronic device and medium | |
CN113806660B (zh) | 数据评估方法、训练方法、装置、电子设备以及存储介质 | |
US11423219B2 (en) | Generation and population of new application document utilizing historical application documents | |
CN111737443B (zh) | 答案文本的处理方法和装置、关键文本的确定方法 | |
CN105893396B (zh) | 基于附近位置来解释用户查询 | |
CN110362630B (zh) | 数据管理方法、装置、设备与计算机可读存储介质 | |
US20090112833A1 (en) | Federated search data normalization for rich presentation | |
CN111857934A (zh) | 一种页面加载方法、装置、电子设备及存储介质 | |
CN111930891A (zh) | 基于知识图谱的检索文本扩展方法及相关装置 | |
US20230153357A1 (en) | Method of processing an observation information, electronic device and storage medium | |
CN109472028B (zh) | 用于生成信息的方法和装置 | |
US20220300573A1 (en) | Method for presenting information, electronic device, and storage medium | |
CN110362790B (zh) | 字体文件的处理方法、装置、电子设备及可读存储介质 | |
CN109522211B (zh) | 接口参数传递方法、装置、电子设备及存储介质 | |
CN113342954A (zh) | 一种应用于问答系统的图像信息处理方法、装置及电子设备 | |
CN112016017A (zh) | 确定特征数据的方法和装置 | |
CN110990528A (zh) | 一种问答方法、装置及电子设备 | |
CN112288452A (zh) | 广告预览方法、装置、电子设备及存储介质 | |
CN113010812B (zh) | 信息采集方法、装置、电子设备和存储介质 | |
CN111061955B (zh) | 网页正文的提取方法、装置、服务器和存储介质 | |
CN112069771B (zh) | 一种用于解析pdf文件中的图片的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB02 | Change of applicant information |
Address after: 201, room 518000, building A, No. 1, front Bay Road, Qianhai Shenzhen Guangdong Shenzhen Hong Kong cooperation zone (Qianhai business secretary) Applicant after: Shenzhen one ledger Intelligent Technology Co., Ltd. Address before: 518000 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A Applicant before: Shenzhen one ledger Intelligent Technology Co., Ltd. |
|
CB02 | Change of applicant information | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |