NO316006B1 - Plassbesparende fil-håndtering i servere - Google Patents

Plassbesparende fil-håndtering i servere Download PDF

Info

Publication number
NO316006B1
NO316006B1 NO20014884A NO20014884A NO316006B1 NO 316006 B1 NO316006 B1 NO 316006B1 NO 20014884 A NO20014884 A NO 20014884A NO 20014884 A NO20014884 A NO 20014884A NO 316006 B1 NO316006 B1 NO 316006B1
Authority
NO
Norway
Prior art keywords
files
text
language
unique
web server
Prior art date
Application number
NO20014884A
Other languages
English (en)
Other versions
NO20014884L (no
NO20014884D0 (no
Inventor
Emil B Viken
Petter Johnsen
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to NO20014884A priority Critical patent/NO316006B1/no
Publication of NO20014884D0 publication Critical patent/NO20014884D0/no
Priority to PCT/SE2002/001451 priority patent/WO2003032198A1/en
Priority to US10/491,878 priority patent/US20050043938A1/en
Priority to EP02760944A priority patent/EP1435050A1/en
Priority to RU2004114223/09A priority patent/RU2295762C2/ru
Publication of NO20014884L publication Critical patent/NO20014884L/no
Publication of NO316006B1 publication Critical patent/NO316006B1/no

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

Oppfinnelsens område
Den foreliggende oppfinnelse vedrører WEB-servere, nærmere bestemt flerspråklig støtte i WEB-servere for integrerte systemer.
Oppfinnelsens bakgrunn
En av de grunnleggende regler i webdesign er å konstruere websidene slik at de er uavhengige av browsertype som benyttes av klientterminalene, det vil si websidene på en webserver bør se like ut for eksempel både i Netscape og Internet Explorer.
For å oppnå dette har webserverne normalt én HTML-side per språk. Dette gjør at deler av HTML-filene er redundante, det vil si script, HTML-formattering og andre språkuavhengige deler er duplisert.
Denne redundante informasjonen er bortkastet minne/ lagringskapasitet, noe som er et problem i integrerte systemer og andre systemer med begrensede ressurser.
Den eneste kjente løsningen er å ha ett sett med HTML-sider per språk som webserveren støtter.
Problemet med den kjente løsning nevnt ovenfor er at når et sett med HTML-filer er oversatt til forskjellige språk, blir deler av HTML-filinnholdet redundant, det vil si script, HTML-formattering og andre språkuavhengige deler. Dette resulterer i et behov for mer minne/lagringskapasitet, noe som er et problem i integrerte systemer og andre systemer med begrensede ressurser.
I fremtiden vil mobile terminaler/anordninger mest sannsyn-lig inneholde webserverfunksjonalitet. I mange små anordninger er minnekapasiteten begrenset, både på grunn av begrenset størrelse og på grunn av minnekostnåden. Det er verdt å nevne at innholdet (HTML-filer, bilder, etc.) som tilbys av webserveren som er hovedfaktoren som influerer behovet for minne, og ikke webserverapplikasjonen i seg selv. En typisk størrelse på en webserver som er laget for et integrert system vil være på omtrent 30 Kb, mens stør-relsen på innholdet som tilbys av webserveren kan variere mye, fra noen få Kb til flere hundre Kb.
Dermed vil problemene som er nevnt ovenfor vedrørende bortkastet minne/lagringskapasitet, være enda viktigere å løse.
Den flerspråklige funksjonaliteten beskrevet i dette doku-mentet vil derfor hjelpe til å redusere minnestørrelsen som er nødvendig for å lagre de innholdsspesifikke elementer i webserveren.
Oppsummering av oppfinnelsen
Det er et formål ved den foreliggende oppfinnelse å til-veiebringe en fremgangsmåte som løser problemet som er beskrevet ovenfor. Dette formål løses ved en fremgangsmåte som angitt i de vedføyde patentkrav.
Nærmere bestemt tilveiebringer den foreliggende oppfinnelse en fremgangsmåte for å gjøre webservere mer språkuavhengig ved å skanne HTML-filene for unike språkavhengige tekstfraser og erstatte disse frasene med unike identiteter samtidig som det språkuavhengige innhold forblir uforandret. De unike språkavhengige tekstfraser lagres i separate tekstfrasefiler. Disse filene oversettes til et antall ønskede browserspråk, noe som resulterer i ett sett per språk. Når en forespørsel for en fil mottas, skanner webserveren filen for unike identiteter, og, hvis noen blir funnet, hentes de korresponderende tekstfraser fra filsettet som er oversatt til browserspråket som benyttes av terminalen som forespør. Deretter gir webserveren terminalen en respons som inneholder filen hvor de unike identiteter som ble funnet er erstattet med de innhentede tekstfraser.
Kort beskrivelse av tegningene
Figur 1 er en illustrasjon på kompilerings- og kombine-ringsprosessen i henhold til den foreliggende oppfinnelse, Figur 2 er et flytskjema som viser signaleringen i en http-klientforespørsel til en http-server som støtter den flerspråklig funksjonaliteten i forhold til den foreliggende oppfinnelse, Figur 3 viser den flerspråklige funksjonaliteten på en mobilterminal som browses av en PC som er koblet lokalt til denne, Figur 4 viser den flerspråklige funksjonaliteten på en mobilterminal som browses av en PC koblet til terminalen via Internett og et GPRS-nett.
Beskrivelse av den foreli<g>gende oppfinnelse
I det følgende vil en generell beskrivelse av den foreliggende oppfinnelse angis, fulgt av to eksempelutførelser på hvordan oppfinnelsen kan implementeres.
Figur 1 viser i korte trekk de grunnleggende konsepter av den foreliggende oppfinnelse. Den foreslåtte løsning split-ter de språkavhengige og språkuavhengige deler av HTML-filen 1 på en webserver inn i to separate filer 3, 4. Når en HTML-fil aksesseres kombineres de språkavhengige og de språkuavhengige deler, og resultatet er en HTML-fil 6 som inneholder formatteringen og teksten for det valgte språk.
For å oppnå dette må HTML-filen 1 (med et bestemt språk) i henhold til den foreliggende oppfinnelse mates inn i en "språkkompilator" 2 før den legges inn i filsystemet i en webserver. Kompilatoren 2 vil lese HTML-filen 1 og skanne den for tekstfraser. Tekstfrasene som blir funnet, vil tem-porært bli lagret i et minne for søk etter identiske tekstfraser. Legg merke til at tekst og tekstfraser i denne sam-menheng omfatter all språkavhengig filtekst og kommandoer som referanse til grafikk, multimediainnhold, settinger (for eksempel karaktersett) eller ren tekst. Tekstfraser som har forekommet tidligere i søket vil bli slettet for å unngå dobbel identitet av samme frase.
Deretter vil en unik fraseidentitet for hver frase genere-res, og en ny HTML-fil 4 hvor hver tekstfrase er erstattet med sine korresponderende unike identiteter (språkuavhengig HTML-fil) vil erstatte den originale filen 1. Samtidig vil tekstfrasene bli lagt inn i en separat tekstfrasefil 3.
Den genererte frasefil 3 sendes til en oversetter som oversetter filen til de ønskede språk (språkavhengige frasefiler), noe som gir én fil 5 per språk.
Følgelig vil en HTML-side 1 som skal presenteres i mer enn ett språk, dermed ha én HTML-fil 4 med tekst erstattet med unike ideer, og et antall tekstfrasefiler 5 (én for hvert språk), alle lagret i webserverens filsystem. På denne måten vil språkuavhengig innhold ikke bli repetert for hvert språk.
Når en webklient forespør en HTML-side, må filsystemet eller webserveren skanne HTML-filen 4 for unike tekst-ID-er. Når en unik ID er funnet, vil den bli erstattet med den korresponderende tekst fra tekstfrasefilen 5 til det valgte språk, det vil si språket som browseren i webklienten bru-ker.
Figur 2 viser signaleringen som utføres når en http-klient (webbrowser) forespør en HTML-side fra http-serveren (webserveren) som støtter flerspråklig funksjonalitet. Med hen-visning til de tilsvarende nummer i flytskjemaet i figur 1 vil følgende trinn forekomme:
1. Webklienten forespør om en HTML-side fra webserveren ved å utstede en http-request. 2. Webserveren prosesserer forespørselen og henter inn den forespurte side fra filsystemet. 3. Webserveren ber den flerspråklige støttefunksjonen om å skanne HTML-siden for tekstidentiteter. 4. Den flerspråklige støttefunksjon forespør om tekstfrasene fra filsystemet og erstatter tekstidentitetene som ble funnet i websiden. 5. En HTML-fil som er oppdatert med tekstfraser returneres til webserveren. 6. Den forespurte HTML-fil returneres til klienten som forespurte siden.
Eksempelutførelsene som ble beskrevet ovenfor, viser en webserver som er plassert i en mobilterminal. En mobilter-minalprototype som inneholder webserverfunksjonalitet er implementert, noe som viser at det er mulig å ha en webserver i en slik liten anordning.
Som tidligere nevnt, vil mobilterminaler/anordninger i fremtiden sannsynligvis inneholde webserverfunksjonalite-ter. I det følgende vil vi derfor diskutere to eksempelut-førelser av den foreliggende oppfinnelse hvor en mobilterminal fungerer som en webserver.
I det første eksemplet, illustrert i figur 3, er mobilterminalen koblet til en PC ved hjelp av en BlueTooth, en inf-rarød eller en seriekabelforbindelse.
Oppringningsnettverkstilknytning benyttes for å etablere en forbindelse mellom datamaskinen og mobilterminalen.
De språkuavhengige HTML-filer og de språkspesifikke frasefiler lagres i terminalens filsystem (FS).
Når browseren forespør én av HTML-sidene lagret i terminalen, analyserer webserveren den forespurte HTML-side for tekstidentiteter og erstatter tekstidentitetene som ble funnet med de korresponderende tekstfraser lagret i den språkbestemte filen, før dataene sendes tilbake til browseren.
Den språkspesifikke frasefil som benyttes, er avhengig av hva slags språk som webserveren er konfigurert til å bruke.
Som illustrert i figur 4, i det andre eksempel på hvordan den foreliggende oppfinnelse kan benyttes, er mobilterminalen koblet til et GPRS-nett som har tilgang til Internett.
Datamaskinen som benyttes for å aksessere webserveren i mo-bil terminalen, har en internettforbindelse.
Språkuavhengige HTML-filer og språkspesifikke frasefiler er lagret terminalens filsystem (FS).
Når browseren forespør en av HTML-sidene som er lagret i terminalen, analyserer webserveren den forespurte HTML-side for tekstidentiteter og erstatter tekstidentitetene som ble funnet med de korresponderende tekstfraser lagret i den språkspesifikke fil før dataene sendes tilbake til browseren. Den språkspesifikke frasefil som benyttes, er avhengig av hvilket språk webserveren er konfigurert til å bruke.
Den åpenbare fordel med denne løsningen sammenlignet med den kjente løsning er bruken av minne/lagringskapasitet. Grunnen til dette er at bare ett sett av HTML-sider felles for alle språk er nødvendig i tillegg til tekstsfrasefile-ne. På denne måten repeteres ikke dataene, dette fører til en ikke-redundant informasjon (HTML-formattering, script og andre språkuavhengige deler av HTML-siden) i motsetning til løsningen hvor det er ett sett med HTML-sider per språk som støttes av webserveren.
Forbedret utnyttelse av minne/lagringskapasiteten i webserveren vil gjøre det mulig at webserverfunksjonalitet kan implementeres i små anordninger som mobilterminaler. Fordi de neste mobilkommunikasjonsgenerasjoner, som GPRS og UMTS, gjør terminalene "alltid" tilgjengelig (på grunn av pakke-svitsjet teknologi), vil fjernbrowsing på slike terminaler være mulig, og implementering av webserverfunksjonalitet i disse vil være nødvendig.
Den foreliggende oppfinnelse utvider også begrensningene for antallet webbrowsere som er kompatible for en webserver, fordi den effektive utnyttelsen av minne/lagringskapasitet vil gjøre det mulig at sidene kan bli represen-tert i flere språk.
Den foreliggende oppfinnelse er ikke begrenset til tradi-sjonelle webservere som bare inneholder HTML-justerte filer. Oppfinnelsen kan også benyttes i forbindelse med andre filer som er relatert til HTML, som XML-filer som er kompatible med WAP-standarden.

Claims (10)

1. Fremgangsmåte i en server som inneholder kildefiler som er tilpasset til å kunne bli browset av fjerntliggende browsere distribuert på én eller flere terminaler direkte eller indirekte koblet til serveren, karakterisert i følgende trinn: a) å skanne gjennom én eller flere av filene for unike språkavhengige tekstfraser, b) å generere én unik identitet for hver unike tekstfrase og erstatte hver tekstfrase med dens korresponderende unike identitet i én eller flere nye filer hvor hver enkelt henholdsvis korresponderer med én av kildefilene, c) å lagre de unike tekstfraser i én eller flere tekstfrasefiler.
2. Fremgangsmåte som angitt i krav 1, karakterisert ved følgende trinn: d) å oversette tekstfrasene til ett eller flere ønskede språk slik at det resulterer i ett sett med tekstfrasefiler for hvert språk.
3. Fremgangsmåte i henhold til krav 2, karakterisert ved følgende trinn: e) når en forespørsel for en kildefil mottas fra én av terminalene, å skanne gjennom den korresponderende nye filen for unike identiteter, og, hvis det finnes noen, hente inn de korresponderende tekstfraser fra én eller flere filer i filsettet som er oversatt til språket som browseren i den forespørrende terminal be-nytter, f) å gi den forespørrende terminal en respons som inneholder den korresponderende nye filen hvor de unike identiteter som blir funnet er erstattet med de innhentede tekstfraser.
4. Fremgangsmåte i henhold til et av de foregående krav, karakterisert ved at kildefilene er HTML-filer.
5. Fremgangsmåte i henhold til et av de foregående krav, karakterisert ved at webserveren er en http-server, terminalene er http-klienter og forespørselen er en http-request.
6. Fremgangsmåte i henhold til ett av kravene 1-3, karakterisert ved at kildefilene er XML-filer eller andre filer som er kompatible med WAP-standarden.
7. Fremgangsmåte i henhold til et av de foregående krav, karakterisert ved at de språkavhengige tekstfraser er referanser til grafikk og/eller multimediainnhold, kommandoer, setninger og/eller ren tekst.
8. Fremgangsmåte i henhold til et av de foregående krav, karakterisert ved at webterminalen er integrert i en mobilanordning.
9. Fremgangsmåte i henhold til et av de foregående krav, karakterisert ved at terminalene er indirekte koblet til webserveren gjennom Internett og/eller et GPRS-nett.
10. Fremgangsmåte i henhold til et av kravene 1-8, karakterisert ved at terminalene er lokalt koblet til webserveren via en BlueTooth™-link, en infrarød link eller en seriell kabel.
NO20014884A 2001-10-08 2001-10-08 Plassbesparende fil-håndtering i servere NO316006B1 (no)

Priority Applications (5)

Application Number Priority Date Filing Date Title
NO20014884A NO316006B1 (no) 2001-10-08 2001-10-08 Plassbesparende fil-håndtering i servere
PCT/SE2002/001451 WO2003032198A1 (en) 2001-10-08 2002-08-13 Multilingual support in web servers for embedded systems
US10/491,878 US20050043938A1 (en) 2001-10-08 2002-08-13 Mutilingual support in web servers for embedded systems
EP02760944A EP1435050A1 (en) 2001-10-08 2002-08-13 Multilingual support in web servers for embedded systems
RU2004114223/09A RU2295762C2 (ru) 2001-10-08 2002-08-13 Поддержка множества языков в web-серверах для встроенных систем

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
NO20014884A NO316006B1 (no) 2001-10-08 2001-10-08 Plassbesparende fil-håndtering i servere

Publications (3)

Publication Number Publication Date
NO20014884D0 NO20014884D0 (no) 2001-10-08
NO20014884L NO20014884L (no) 2003-04-09
NO316006B1 true NO316006B1 (no) 2003-11-24

Family

ID=19912900

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20014884A NO316006B1 (no) 2001-10-08 2001-10-08 Plassbesparende fil-håndtering i servere

Country Status (5)

Country Link
US (1) US20050043938A1 (no)
EP (1) EP1435050A1 (no)
NO (1) NO316006B1 (no)
RU (1) RU2295762C2 (no)
WO (1) WO2003032198A1 (no)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4121382B2 (ja) * 2003-01-07 2008-07-23 株式会社リコー 情報提供装置、情報表示装置、情報提供システム、及び情報提供方法
US20070061129A1 (en) * 2005-09-14 2007-03-15 Barreiro Lionel P Localization of embedded devices using browser-based interfaces
US8213924B2 (en) * 2008-10-06 2012-07-03 Facebook, Inc. Providing distributed online services for mobile devices
US8645936B2 (en) * 2009-09-30 2014-02-04 Zynga Inc. Apparatuses, methods and systems for an a API call abstractor
US8924556B2 (en) * 2011-03-11 2014-12-30 Qualcomm Incorporated System and method for accessing a device having an assigned network address
US8862693B2 (en) 2011-03-11 2014-10-14 Qualcomm Incorporated Remote access and administration of device content and configuration using HTTP protocol
US9052898B2 (en) 2011-03-11 2015-06-09 Qualcomm Incorporated Remote access and administration of device content, with device power optimization, using HTTP protocol
US8819233B2 (en) 2011-03-11 2014-08-26 Qualcomm Incorporated System and method using a web proxy-server to access a device having an assigned network address
US8799470B2 (en) 2011-03-11 2014-08-05 Qualcomm Incorporated System and method using a client-local proxy-server to access a device having an assigned network address
CN102693322B (zh) * 2012-06-01 2014-10-22 杭州海康威视数字技术股份有限公司 支持多国语言的网页处理方法、网页加载方法及其系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5523946A (en) * 1992-02-11 1996-06-04 Xerox Corporation Compact encoding of multi-lingual translation dictionaries
US6466900B1 (en) * 1998-05-29 2002-10-15 Citicorp Development Center, Inc. Multi-language phrase editor and method thereof
JPH11143877A (ja) * 1997-10-22 1999-05-28 Internatl Business Mach Corp <Ibm> 圧縮方法、辞書の見出し語インデックス・データを圧縮するための方法、及び機械翻訳システム
US7039867B1 (en) * 1997-12-29 2006-05-02 Oce Printing Systems Gmbh Method and system for controlling an operator interface with display fields containing graphics and text
US6526426B1 (en) * 1998-02-23 2003-02-25 David Lakritz Translation management system
US7016977B1 (en) * 1999-11-05 2006-03-21 International Business Machines Corporation Method and system for multilingual web server
JP4011268B2 (ja) * 2000-07-05 2007-11-21 株式会社アイアイエス 多言語翻訳システム
WO2002086737A1 (en) * 2001-04-20 2002-10-31 Wordsniffer, Inc. Method and apparatus for integrated, user-directed web site text translation

Also Published As

Publication number Publication date
NO20014884L (no) 2003-04-09
RU2004114223A (ru) 2005-09-20
WO2003032198A1 (en) 2003-04-17
NO20014884D0 (no) 2001-10-08
RU2295762C2 (ru) 2007-03-20
EP1435050A1 (en) 2004-07-07
WO2003032198A8 (en) 2004-05-06
US20050043938A1 (en) 2005-02-24

Similar Documents

Publication Publication Date Title
US7058626B1 (en) Method and system for providing native language query service
JP5000740B2 (ja) 情報アクセス支援方法
US10541973B2 (en) Service of cached translated content in a requested language
US9858314B2 (en) System and method for refining search results
US9251223B2 (en) Alternative web pages suggestion based on language
EP1446734A2 (en) Method, system, and software for transmission of information
GB2406399A (en) Seaching within a computer network by entering a search term and optional URI into a web browser
JP2002334014A (ja) ファイルを複数言語で提供するシステム
CN101425062A (zh) 用于生成文档内容的呈现配置文件的方法和设备
CN105824939A (zh) 对部分用户输入的词典建议
EP2532157A1 (en) Method for content folding
CN102346738A (zh) 客制化网页处理装置及方法
NO316006B1 (no) Plassbesparende fil-håndtering i servere
US20130268832A1 (en) Method and system for creating digital bookmarks
KR100290731B1 (ko) 3차원 인터넷 검색 엔진의 표시 방법
JP2000330992A (ja) 多国言語対応wwwサーバシステム及びその処理方法
CN101901236A (zh) 专业术语的解说系统及其方法
WO2006076665A1 (en) Systems, methods, and software for retrieving information using multiple query languages
JP2000285052A (ja) Url変換方法および装置
CN106326213A (zh) 一种对web站点进行翻译的方法及装置
KR20000049928A (ko) 다국어 검색엔진의 운영 장치 및 방법
EP0953921A2 (en) Device and method for information processing and storage medium containing a control program for information processing
JP2007087241A (ja) 多言語複層サイト作成システムおよび多言語複層サイト作成プログラム
KR20010084491A (ko) 무선통신 단말기를 위한 인터넷 정보검색 방법
TWI407321B (zh) 客製化網頁處理裝置及方法