FI105954B - Method and system for connection of information in electrical form to information in printed form - Google Patents

Method and system for connection of information in electrical form to information in printed form Download PDF

Info

Publication number
FI105954B
FI105954B FI970585A FI970585A FI105954B FI 105954 B FI105954 B FI 105954B FI 970585 A FI970585 A FI 970585A FI 970585 A FI970585 A FI 970585A FI 105954 B FI105954 B FI 105954B
Authority
FI
Finland
Prior art keywords
information
character string
link
data processing
processing system
Prior art date
Application number
FI970585A
Other languages
Finnish (fi)
Swedish (sv)
Other versions
FI970585A (en
FI970585A0 (en
Inventor
Caj Soedergaard
Christer Baeckstroem
Original Assignee
Valtion Teknillinen
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Valtion Teknillinen filed Critical Valtion Teknillinen
Priority to FI970585A priority Critical patent/FI105954B/en
Publication of FI970585A0 publication Critical patent/FI970585A0/en
Publication of FI970585A publication Critical patent/FI970585A/en
Application granted granted Critical
Publication of FI105954B publication Critical patent/FI105954B/en

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

, 105954, 105954

MENETELMÄ JA JÄRJESTELMÄ SÄHKÖISESSÄ MUODOSSA OLEVAN TIEDON LIITTÄMISEKSI PAINETTUUN TIETOONMETHOD AND SYSTEM FOR CONTAINING ELECTRONIC DATA IN PRINTED DATA

Esillä olevan keksinnön kohteena on patenttivaatimuksen 1 johdanto-osassa määritelty menetelmä * 5 sähköisessä muodossa olevan tiedon, kuten WWW-sivujen, liittämiseksi painettuun tietoon. Lisäksi esillä olevan keksinnön kohteena on patenttivaatimuksen 11 johdanto-osassa määritelty järjestelmä.The present invention relates to a method, as defined in the preamble of claim 1, for incorporating information in electronic form, such as web pages, into printed information. Further, the present invention relates to a system as defined in the preamble of claim 11.

WWW on lyhenne sanoista World Wide Web, joka 10 on CERN-tukimuskeskuksessa englantilaisen Tim Berners-Leen vuonna 1989 kehittämä palvelu, joka tähtää maailmanlaajuiseen multimedia- ja hypertekstitiedon välittämiseen HTTP-protokollan (Hypertext Transfer Protocol, WWW-järjestelmässä käytetty dokumenttien siirto-15 käytäntö) avulla Internet-verkossa. Hypertekstistä on viime aikoina tullut hyvin suosittu sähköisissä julkaisuissa. Hypertekstissä lukija pääsee nk. linkkiank-kuriin (yleispuheessa kuuma sana) linkattuun tai yhdistettyyn lisätietoon osoittamalla tietokonenäytöllä 20 olevaa ankkurisanaa kursorilla tai hiiren osoittimel-la. Tietokoneohjelmien HELP-toiminnossa ja CD-ROM-ohjelmissa linkit viittaavat paikalliseen tietoon, kuten CD-ROM-levylle tai HELP-tiedostoon, samassa tietokoneessa, kun taas WWW-tekniikassa linkatut sivut voi-. 25 vat sijaita missä tahansa Internetiin liitetyssä pal velintietokoneessa ympäri maailman. Näin ollen WWW:n kautta avautuu pääsy yhä kasvavaan tietovarantoon, mikä on tärkeä tuki mm. koulutuksessa, esimerkiksi luentojen ja oppituntien valmistelutyössä. Tällöin voi ol-30 la esimerkiksi tilanne, jossa painettu oppiaineisto, „·. kirjat ja vastaavat muodostavat rungon, johon haetaan WWW-sivuilta lisävalaistusta ja elävyyttä määritelmien, biografioiden, esimerkkien ja visualisointien avulla. Valmistelutyö on assosiatiivista ja epälineaa-35 rista - täten hypertekstiin hyvin soveltuvaa.WWW stands for World Wide Web, a service developed by Tim Berners-Lee, a CERN support center in 1989, to deliver worldwide multimedia and hypertext information over the HTTP (Hypertext Transfer Protocol, a 15-language policy used by the WWW system). with the help of internet. Hypertext has recently become very popular in electronic publications. In hypertext, the reader can access additional information linked or linked to a so-called link anchor (hot word) by pointing the anchor word on a computer screen 20 with the cursor or mouse pointer. In the HELP function of computer programs and in CD-ROM programs, the links refer to local information, such as a CD-ROM or HELP file, on the same computer, whereas pages linked in WWW technology may. It can be located on any PC connected to the Internet anywhere in the world. Thus, the WWW opens up access to an ever-growing pool of information, which is an important support, for example. education, for example in the preparation of lectures and lessons. This may be the case, for example, when a printed textbook, “·. books and the like form the backbone of web pages that are searched for more light and liveliness through definitions, biographies, examples and visualizations. The preparatory work is associative and non-linear-35 - thus well suited for hypertext.

2 1059542,105,954

Nykyään painetussa viestinnässä ei ole voitu hyödyntää hypertekstiä, joskin painetut viitteet, hakemistot ja WWW-osoitteet rajoitetummin täyttävät saman tehtävän. Kuitenkin ongelmana on se, että tiedon 5 hakeminen Internetistä on työlästä, koska käyttäjä joutuu manuaalisesti kopioimaan pitkiäkin osoitetietoja painetusta tekstistä ja syöttämään ne tietokoneeseen tai muuhun mediaan, jonka avulla käyttäjä pääsee selaamaan kyseisiä sivuja. Osoitteiden näppäily on 10 erityisen hidasta, kun on useita WWW-linkkejä. Lisäksi pitkät http-osoitteet vievät tilaa sivulla ja monimutkaistavat tekstin typografian.Today, printed communication has not been able to utilize hypertext, although printed references, directories, and web addresses more limitedly fulfill the same function. However, the problem is that retrieving information 5 from the Internet is laborious because the user has to manually copy long address information from the printed text and enter it into a computer or other media that allows the user to browse those pages. Entering addresses is 10 extremely slow when there are multiple web links. In addition, long http addresses take up space on the page and complicate the typography of the text.

Entuudestaan tunnetaan patenttijulkaisusta WO 95/10813 menetelmä, jolla voidaan osoittaa dokument-15 tiosia, joita tässä kutsutaan "linkkiankkureiksi", joihin dokumenttiosiin on linkattu elektronisia refe-renssitietoja. Viitejulkaisussa esitetään, miten ko-piokoneita/tulostimia voidaan käyttää tehokkaammin esimerkiksi kuvan lukemiseen tai muuhun vastaavaan 20 käyttöön. Viitejulkaisun mukaan painetussa tekstissä oleva referenssitieto merkitään ennalta määrätyn muotoisella laatikolla tai vastaavalla ja siihen linkitetään sähköinen tieto, kuten diakuva. Kun painettu teksti, joka on esimerkiksi painettu paperille, lue-25 taan printterille kopiokoneella tai vastaavalla näytöllä esitettäväksi, yhdistetään näytöllä olevaan julkaisuun merkittyyn kohtiin linkitetty diakuva tai muu vastaava ohjelmistolla toteutettu diagrammi tai kaavio. Tämä kuitenkin edellyttää, että koko asiakirja on 30 luettava kuvanlukijalla, minkä jälkeen linkkiankkurien sijainti määritetään hahmontunnistuksella sovittujen ” - graafisten merkintöjen, tässä esimerkissä suorakaitei den, perusteella. Siten julkaisussa esitetty järjestely ei helpota käyttäjää yhdistettäessä Internetin tie-35 toja painettuun materiaaliin.A method is known in the prior art from WO 95/10813 for identifying documentary portions, herein referred to as "link anchors", to which documentary references are linked with electronic reference information. The reference discloses how copiers / printers can be used more efficiently, for example, for reading an image or other similar use. According to the reference, the reference information in the printed text is marked with a predetermined box or the like, and electronic information such as a slide image is linked to it. When printed text, for example printed on paper, is read to a printer for presentation on a copier or similar screen, a slide image or other similar software-implemented diagram or chart is linked to the positions indicated on the on-screen publication. However, this requires that the entire document be read by 30 scanners, after which the location of the link anchors is determined by the pattern-matching graphic graphics, in this example rectangles. Thus, the arrangement disclosed in the publication does not facilitate the user in combining information from the Internet with printed material.

« 3 105954«3,105,954

Keksinnön tarkoituksena on poistaa edellä mainitut epäkohdat.The object of the invention is to eliminate the above-mentioned drawbacks.

Erityisesti keksinnön tarkoituksena on tuoda esiin järjestelmä ja menetelmä, joka uudella tavalla 5 yhdistää paino- ja verkkomediat. Edelleen keksinnön tarkoituksena on tuoda esiin helppokäyttöinen järjestelmä, jossa pyyhkäisemällä paperijulkaisuun merkattuja sanoja kynäskannerilla tai vastaavalla tai puhumalla merkattuja sanoja ääneen saadaan esille sanoihin 10 liittyvät WWW-sivut.In particular, it is an object of the present invention to provide a system and method that combines print and network media in a novel way. It is a further object of the invention to provide an easy-to-use system whereby by swiping the words labeled in a paper publication with a pencil scanner or the like, or by speaking, the web pages associated with the words 10 are displayed.

Lisäksi esillä olevan keksinnön tarkoituksena on tuoda esiin uusi menetelmä, joka mahdollistaa sähköisessä muodossa olevan lisätiedon linkittämisen painettuun dokumenttiin, kuten oppikirjaan.It is a further object of the present invention to provide a novel method which enables additional information in electronic form to be linked to a printed document such as a textbook.

15 Esillä olevan keksinnön tunnusomaisten seik kojen osalta viitataan patenttivaatimuksiin.With respect to the features of the present invention, reference is made to the claims.

Esillä olevan keksinnön mukaisessa menetelmässä sähköisessä muodossa olevan tiedon, joka on talletettu tietojenkäsittelyjärjestelmään, liittämiseksi 20 painettuun tietoon, kuten painettuun tekstiin, merkitään painetussa tiedossa ennalta määritetyt kohdat, joihin linkitetään sähköisessä muodossa olevaa tietoa. Merkitsemiseen voidaan käyttää monenlaisia visualisoinnin muotoja, kuten eriväristä, alleviivattua 25 tai tummennettua tekstiä tai niiden yhdistelmään, tai kuviota, viivakoodia tai sen tapaista graafista esitysmuotoa. Edelleen muodostetaan luettelo merkatuista kohdista (=linkkiankkureista) ja niihin liittyvistä WWW-osoitteista ja hakutiedosta. Edullisesti luette-30 lossa muodostetaan vastaavuuspareja, jossa parin toisena osana on painettuun tietoon merkitty kohta, kuten · - sana tai kuvio, ja toisena osapuolena sitä vastaava informaatio, joka kertoo tietojenkäsittelyjärjestelmässä miten lisäinformaatio on löydettävissä. Infor-35 maatio voi olla yksi tai useita URL-osoitteita (URL, Uniform Resource Locator, Internet-verkoissa käytettä- 4 105954 vässä WWW-palvelussa oleva linkki, jonka osoitteen perusteella asiakasohjelma ottaa yhteyttä tietyn WWW-palvelimen tiettyyn sivuun), jonkin Internetissä käytetyn hakurobotin tarvitsemat tiedot tai vastaava.In the method of the present invention, the predetermined points in the printed information to which the electronic information is linked are marked on the printed information, such as printed text, to associate the information stored in the electronic processing system with the printed information. Various forms of visualization can be used for labeling, such as different colored, underlined, or shaded text, or a combination thereof, or a pattern, bar code, or similar graphic representation. Further, a list of tagged items (= link anchors) and associated web addresses and search information is compiled. Preferably, the list forms pairs of equivalents where the second part of the pair has a point marked on the printed information, such as a · word or a pattern, and the other side the corresponding information that tells the computing system how to find additional information. The Infor-35 information can be one or more URLs (a URL, a Uniform Resource Locator, a link on a web server used by Internet users to access a specific page on a particular web server), information needed by the crawler or the like.

5 Keksinnön mukaisesti kun halutaan informaa tiota merkityn kohdan perusteella, niin syötetään painettuun tietoon merkitty kohta tietojenkäsittelyjärjestelmään, jossa edelleen tunnistetaan kyseisen kohdan sisältämä informaatio. Merkitty kohta voidaan 10 syöttää tietojenkäsittelyjärjestelmään monella tapaa. Apuna voidaan käyttää kuvanlukijaa eli skanneria ja siihen liittyvää tekstintunnistusta tai hahmontunnistusta, jolloin skannattu teksti tai kuvio voidaan tunnistaa. Lisäksi voidaan käyttää puhetta ja siihen 15 liittyvää puheentunnistusta tai jossain sovellutuksessa voisi olla kätevä käyttää viivakoodimerkintöjä ja niihin liittyviä lukulaitteita. Tämän jälkeen määritetään luettelosta informaatiota vastaava linkki tai hakukomento ja linkin tai hakukomennon perusteella hae-20 taan sähköisessä muodossa oleva tieto tietojenkäsittelyjärjestelmässä esitettäväksi.According to the invention, when information is desired based on a tagged item, the tagged printed item is fed to a data processing system which further identifies the information contained in that paragraph. The marked entry can be entered into the data processing system in many ways. A scanner, with associated OCR or pattern recognition, can be used to identify the scanned text or pattern. In addition, speech and associated speech recognition may be used, or in some applications it may be convenient to use barcode tags and associated readers. Thereafter, a link or search command corresponding to the information in the list is determined and information based on the link or search command is retrieved in electronic form for presentation in the data processing system.

Esillä olevan keksinnön etuna tunnettuun tekniikkaan verrattuna ovat lisätiedon haun vaivattomuus ja nopeus. Lisäksi keksinnön avulla autetaan tekstin 25 lukijaa luomaan nopeita assosiaatioita. Edelleen esil-lä olevan keksinnön ansioista myös kokematon tietokoneen käyttäjä pääsee helposti hyödyntämään Internetissä olevaa tausta-aineistoa.The advantage of the present invention over the prior art is the ease and speed of retrieving additional information. In addition, the invention helps text readers to establish fast associations. Furthermore, due to the present invention, an inexperienced computer user can easily access background information on the Internet.

Keksinnön eräässä sovellutuksessa verrataan 30 syötettyä merkattua kohtaa luettelon linkkiankkureihin ja suoritetaan tietojenkäsittelyjärjestelmään syötetyn ” merkityn kohdan tulkinta käyttämällä apuna merkki- jonoetäisyyttä ja/tai painotettua etäisyysfunktiota. Tällainen vertaaminen ja tulkinta sekä niiden yhtey-35 dessä suoritettava virhekorjaus on olennaista, koska esimerkiksi kynäskannerin tuottama merkkijono voi olla • « 5 105954 virheellinen useista syistä. Skannerin pyyhkäisy on voinut alkaa liian aikaisin, jolloin osa linkkiankku-ria edeltävästä sanasta on luettu mukaan. Samoin on pyyhkäisy voinut alkaa linkkiankkurin keskeltä, loppua 5 kesken tai jatkua linkkiankkuria seuraavalle sanalle. Nykyiset kynäskanneriin liitetyt kaupalliset tekstin-tunnistusohjelmat eivät myöskään osaa tulkita eri typografialla kirjoitettua tekstiä oikein, vaan tietyt merkit, kuten k ja h, sekoittuvat helposti keskenään. 10 Lisäksi, koska pyyhkäisy tapahtuu vaihtelevalla nopeudella, on linkkiankkurista skannattu kuva alusta alkaen vääristynyt, mikä vaikeuttaa tunnistusta.In one embodiment of the invention, the 30 tagged entry points are compared to the list link anchors and the interpretation of the "tagged entry" entered into the data processing system is performed using a string distance and / or weighted distance function. Such comparison and interpretation, as well as error correction in connection therewith, is essential because, for example, a string produced by a pencil scanner may be • «5 105954 invalid for a variety of reasons. Scanner scanning may have started too early, including some of the word preceding the link anchor. Similarly, the sweep may have begun from the middle of the link anchor, end to end 5, or continue to the word following the link anchor. The current commercial text recognition software included with the pen scanner also does not know how to correctly interpret text typed with different typography, but certain characters, such as k and h, are easily confused. In addition, since scanning is performed at variable speeds, the image scanned from the link anchor is initially distorted, which makes recognition more difficult.

Eräässä sovellutuksessa skannatun merkkijonon tunnistus suoritetaan seuraavasti. URL-osoite tai ha-15 kutiedot valitaan luettelosta vertailemalla skannattua merkkijonoa luettelon linkkiankkureihin siten, että valitaan etäisyysmitan mukaisesti lähin linkkiankkuri ja hyväksytään tämä linkkiankkuri vain, jos sekä merkki jonoetäisyys että merkitsevyys ylittävät tietyn, 20 yleensä merkkijonon pituuteen normalisoidun kynnysarvon. Edelleen etäisyyttä kuvataan kahdella tunnusluvulla: merkkijonoetäisyydellä ja painotetulla etäi- syysfunktiolla.In one embodiment, the identification of the scanned string is performed as follows. The URL or look-up information is selected from the list by comparing the scanned string with the list anchors by selecting the nearest link anchor according to the distance dimension and accepting this link anchor only if both the character string distance and significance exceed a given value, typically 20 strings. Further, the distance is described by two parameters: the string distance and the weighted distance function.

Merkkijonoetäisyys muodostetaan muuntamalla 25 merkkijonoa ml merkkijonoksi m2 käyttäen kolmea perus-* operaatiota: insertointi (lisäys), deletointi (poisto) ja substitointi (korvaus). Jokaisella perusoperaatiolla on määritelty sakkofunktio siten että muunnos merkkijonosta ml merkkijonoon m2 aikaansaadaan minimimää-30 rällä operaatioita. Alla olevan taulukon alkiot ilmaisevat esimerkinomaisesti operaatioiden lukumäärät '·'· muunnoksessa aba:sta aabc:lle.String distance is formed by converting 25 strings into ml strings in m2 using three basic * operations: insertion (deletion), deletion (deletion), and substitution (substitution). For each basic operation, a finite function is defined such that a conversion from ml to ml in m2 results in a minimum of 30 operations. The items in the table below represent, by way of example, the number of operations in the '·' · conversion from aba to aabc.

Taulukko 1 , 105954Table 1, 105954

OO

ml/m2__a__a__b__c_ sakko» 0 sakko f 1 __kustannus=0__kustannus»! \___ b ''siih^tituutio sakko»0 ___kustannus»!*y_ a '''"'sbijstituutio sakko»l __kustannus=2ml / m2__a__a__b__c_ fine »0 fine f 1 __cost = 0__cost»! \ ___ b '' target fine »0 ___ cost»! * y_ a '' '"sbi fine» l __ cost = 2

Kustannus : aba_-> aabc: 0+1+0+1=2 5Cost: aba _-> aabc: 0 + 1 + 0 + 1 = 2 5

Taulukko 2 ml/m2__a__a__b__c_ a "substituutio sakko» 0 __kug tannus=0____ b deletointi •' sakko»1 • \ __kustanru>^= 1____ a v substituutio insertio sakko» 0 sakko = 1 ___kustannus»!__kustannus=2__Table 2 ml / m2__a__a__b__c_ a "substitution fine» 0 __kug cost = 0 ____ b deletion • 'fine' 1 • \ __ cost index> ^ = 1____ a v substitution insertion fine »0 fine = 1 ___ cost»! __ cost = 2__

Kustannus : aba_-> aab on 0 + 1 + 0 + 1=2 • I ' 10Cost: aba _-> aab is 0 + 1 + 0 + 1 = 2 • I '10

Esimerkeissä on samat sakkokertoimet kaikilla transi-tioilla kun ml(i) ^ m2(i)The examples have the same fine coefficients for all transactions when ml (i) ^ m2 (i)

Yllä on matriisiesitys merkkijonomuunnosten aba -> aabc ja aba_-> aab vaatimista kustannuksista, 7 105954 mistä voidaan päätellä että aba:n minimietäisyys aabc:sta on 2.Above is a matrix representation of the cost required by the string transforms aba -> aabc and aba _-> aab, 7 105954, which implies that the minimum distance of aba from aabc is 2.

Merkkijonoetäisyystunnusluvun merkitsevyyttä varmistetaan painotettua etäisyyttä kuvaavalla tunnus-5 luvulla. Painotettu etäisyysfunktio muodostetaan paikan funktiona skannatun merkkijonon alijoukkojen tai puhutun merkkijonon ja luettelosta saadun linkkiankku-rimerkkijonon välillä. Etäisyysfunktio normalisoidaan sekä skannatun että ankkurimerkkijonon pituuteen näh-10 den.The significance of the string distance indicator is confirmed by the weighted distance code-5. The weighted distance function is formed as a function of position between subsets or spoken strings of the scanned string and the link anchor string obtained from the list. The distance function is normalized to both the length of the scanned and the anchor string.

Keksinnön mukaiseen järjestelmään sähköisessä muodossa olevan tiedon, joka on talletettu tietojenkäsittelyjärjestelmään, liittämiseksi painettuun tietoon, kuten painettuun tekstiin, kuuluu tietojenkäsit-15 telyjärjestelmä, johon kuuluu lukijalaite painettuun tietoon merkityn kohdan syöttämiseksi tietojenkäsittelyjärjestelmään, tulkintalaite syötetyn merkkijonon tai kuvion tulkitsemiseksi ja sitä vastaavan linkin määrittämiseksi luettelosta, tallennuslaite luettelon 20 tallentamiseksi, välineet tiedon hakemiseksi linkin osoittamasta paikasta tai laitteesta ja tulostuslaite sähköisessä muodossa olevan tiedon esittämiseksi.The system of the invention for integrating information stored electronically in a data processing system with printed information such as printed text includes a data processing system comprising a reader device for entering a marked item into the data processing system, an interpreting device for determining a character string, a recording device for storing a list 20, means for retrieving information from a location or device indicated by a link, and a printing device for displaying information in electronic form.

Edullisesti tietojenkäsittelyjärjestelmä on tietokone, joka on yhdistetty Internet-verkkoon link-. 25 kejä vastaavan tiedon noutamiseksi tai hakemiseksi.Preferably, the computing system is a computer that is connected to an Internet network via a link. 25 to retrieve or retrieve relevant information.

Edelleen järjestelmään voi kuulua tietokoneeseen yhdistetty äänijärjestelmä sähköisessä muodossa olevan tiedon, kuten WWW-sivuotsikkojen, esittämiseksi äänen muodossa.Further, the system may include an audio system connected to a computer for presenting audio information in electronic form, such as web page headers.

30 Seuraavassa keksintöä selostetaan oheisten sovellutusesimerkkien avulla viittaamalla oheiseen ^ · < piirustukseen, jossa kuvio 1 esittää kaaviomaisesti erästä esillä olevan keksinnön mukaista järjestelmää; ja 35 kuvio 2 esittää erästä keksinnön mukaisen järjestelmän sovellutusta.The invention will now be described, by way of example, with reference to the accompanying drawings, in which Figure 1 schematically illustrates a system according to the present invention; and FIG. 2 shows an embodiment of a system according to the invention.

• .•.

β 105954β 105954

Kuviossa 1 on esitetty eräs keksinnön mukainen järjestelmä, joka on toteutettu tietokoneen ja siihen liitettyjen apulaitteiden avulla ja johon kuuluu sinänsä tunnettu kaupallinen kynäskanneri 2, jonka 5 avulla pyyhkäistään tekstiin merkattua linkkiankkuria tekstiin merkityn kohdan syöttämiseksi järjestelmään.Fig. 1 illustrates a system according to the invention implemented by a computer and associated peripheral devices, and includes a commercially available pen scanner 2 for swiping a text-linked link anchor to enter a text-marked point into the system.

Edelleen järjestelmään kuuluu välineet 3 luetun tekstin tunnistamiseksi ja tulkitsemiseksi. Tunnistaminen voidaan suorittaa jollain tunnetulla automaattisella 10 tekstintunnistusohjelmalla OCR. Edelleen tulkintaa varten järjestelmään kuuluu tulkintaohjelma 3a, jonka avulla suoritetaan luetun ja tunnistetun tekstin tulkinta edellä kuvatulla tavalla. Tämä virhekorjaava tulkintaohjelma on järjestelmän ydin ja se tulkitsee 15 kynäskannerin lukemaa merkkijonoa WWW:n URL-osoitteiksi ja Internetin hakurobotin hakukomennoksi.Further, the system includes means 3 for recognizing and interpreting the text read. Recognition may be performed by any known automatic character recognition program OCR. Further, for interpretation, the system includes an interpretation program 3a for performing the interpretation of the read and recognized text as described above. This bug fixer is the core of the system and interprets the 15 strings read by a pen scanner as a web URL and a search command for the Internet crawler.

Tulkinnan pohjana on nk. linkkilista tai luettelo 4, joka on talletettu esimerkiksi tietokoneen kovalevylle ja joka liittää ankkurisanan yhdeksi tai useammaksi 20 URL-osoitteeksi. Linkkilista yleensä noudetaan erityisellä imurointiohjelmalla 8 Internetin välityksellä joltain WWW-palvelimelta 10, joka voi olla painetun tekstin kustantajan palvelin, ja talletetaan tietokoneen 1 muistiin. Tulkintaohjelman 3a linkkilistalta 25 valitsemat URL-osoitteet ja hakukomennot välitetään m ’ kaupalliselle WWW-selainohjelmalle 5, joka esittää tiedot tietokoneen näytöllä 6. Selainohjelma hakee URL-osoitteiden antamat sivut Internetistä siten, että jokainen linkattu sivu näytetään näytöllä 6 ikkunoitu-30 na omassa ikkunassaan. Ikkunointi suoritetaan niin sanotun formatointiohjelman 9 avulla, jolloin sijoiteli taan automaattisesti eri tietoa sisältävät ikkunat op- r timaaliseen katselumuotoon jakamalla näyttö 6 osiin.The interpretation is based on a so-called link list or list 4, which is stored, for example, on the hard disk of a computer and associates an anchor word with one or more 20 URLs. The link list is generally retrieved by a special download program 8 over the Internet from a web server 10, which may be a print publisher server, and stored in the memory of the computer 1. The URLs and search commands selected by the interpreter 3a from the list of links 25 are transmitted to a commercial web browser 5 displaying information on the computer screen 6. The browser retrieves the pages provided by the URLs on the Internet, with each linked page displayed in a windowed window 30. Windowing is accomplished by means of a so-called formatting program 9, whereby windows containing different information are automatically placed in the optimal viewing mode by dividing the screen 6 into sections.

Edelleen tulkintaohjelma muodostaa linkkiankkurista ja - 35 linkkilistan mahdollisista lisätiedoista hakukomennot, jotka välitetään Internetissä olevalle hakurobotille.Further, the interpreter generates search commands from the link anchor and - 35 possible additional list of links, which are transmitted to a crawler on the Internet.

m 9 105954m 9 105954

Lisäksi WWW-sivujen otsikot voidaan kuunnella äänijär-jestelmän 7, johon kuuluu äänensyntetisaattoriohjelman 7a ja kaiuttimet 7b, avulla, jolloin käyttäjä voi keskittyä lukemiseen tarvitsematta siirtää katsettaan 5 pois painetusta tekstistä.In addition, web page titles can be listened to using a sound system 7 including a voice synthesizer program 7a and speakers 7b, allowing the user to concentrate on reading without having to move their gaze 5 away from the printed text.

Kuviossa 2 esitetään havainnollisemmin järjestelmän käyttöä. Esimerkissä opettaja hakee keksinnön mukaisen järjestelmän avulla taustatietoja oppi-tuntiensa valmisteluun. Tässä kurssin oppikirjan että 10 opettajan oppaan keskeisistä termeistä on satoja linkkejä WWW-sivuihin. Opettaja valmistellessaan oppitun-tejaan pyyhkäisee kynäskannerilla haluamiaan hypertekstejä, ja sen perusteella sanoihin linkattu sekä hakurobotin löytämä tieto esitetään keksinnön mukaisen 15 järjestelmän avulla. Linkkejä päivitetään jatkuvasti ja päivitelty linkkilista siirtyy keksinnön mukaisen järjestelmän ja Internetin avulla kirjasarjan kustantajan palvelimelta kouluun asennettuun järjestelmään.Figure 2 illustrates the use of the system more clearly. In the example, the teacher uses the system of the invention to retrieve background information for preparing his lessons. Here are hundreds of links to web pages from the key terms in the course textbook and the 10 teacher's guide. As the teacher prepares his or her lessons, the pencil scanner sweeps the desired hypertext, and on that basis the information linked to the words and found by the search engine is represented by the system of the invention. The links are constantly updated and the updated link list is transferred from the book publisher's server to the school system via the system of the invention and the Internet.

Keksintöä ei rajata pelkästään edellä esitet-20 tyjä sovellutusesimerkkejä koskevaksi, vaan monet muunnokset ovat mahdollisia pysyttäessä patenttivaatimusten määrittelemän keksinnöllisen ajatuksen puitteissa .The invention is not limited to the above embodiments only, but many modifications are possible within the scope of the inventive idea defined by the claims.

• « * ·' m• «* · 'm

Claims (13)

1. Förfarande för sammanfogande av information i elektronisk form, registrerad i ett databehand-lingssystem, med tryckt information, säsom tryckt 5 text, vid vilket förfarande, i den tryckta informationen utmärks pä förhand bestämda ställen, vid vilka information i elektronisk form länkas; ett register over de märkta ställena och tili dem 10 anslutna länkar bildas; informationen som ett märkt ställe innehäller identifieras, kännetecknat därav, att det märkta stället i den tryckta informationen mätäs med hjälp av en skanner, som kan hällas i han-15 den, och textigenkänning, en streckkodsläsare och streckkodsigenkänning eller motsvarande in i databe-handlingssystemet; ur registret bestäms länken som motsvarar informationen; och 20 pä grund av länken söks informationen i elektro nisk form fram för ätergivning pä databehandlingssy-stemets bildskärm, 1judätergivningsanordning eller motsvarande.1. A method for combining information in electronic form, recorded in a data processing system, with printed information, such as printed text, in which method, in the printed information, is marked at predetermined places, to which information in electronic form is linked; a register of the marked sites and associated links is formed; the information contained in a tagged location is identified, characterized in that the tagged location in the printed information is measured by a scanner which can be poured into the hand, and text recognition, a barcode scanner and barcode recognition or the like into the data processing system; from the register is determined the link corresponding to the information; and because of the link, the information is sought in electronic form for rendering on the data processing system's monitor, sound reproducing device or the like. 2. Förfarande enligt patentkrav l, k ä n -25 netecknat därav, att de ställen som skall Iän- I f 9 kas utmärks med ett frän den tryckta informationens normala utstyrsel avvikande tryck, säsom med olikfär-gad text eller motsvarande.2. A method according to claim 1, characterized in that the places to be marked are marked by a pressure deviating from the normal information output of the printed information, such as with different colored text or the like. 3. Förfarande enligt patentkrav 1 eller 2, 30 kännetecknat därav, att en teckensträng eller figur, som är utmärkt i den tryckta informationen, m registreras i registret, och den mot teckensträngen eller figuren svarande länken, vilken är en WWW-adress, ett filnamn, data som en sökrobot behöver el-35 ler liknande, med vars hjälp databehandlingssystemet kan lokalisera den önskade informationen i elektronisk - - form. 105954 14Method according to claim 1 or 2, characterized in that a character string or figure, which is excellent in the printed information, is registered in the register, and the link corresponding to the character string or figure, which is a WWW address, a file name , data that a crawler needs or similar, with the help of which the data processing system can locate the desired information in electronic form. 105954 14 4. Förfarande enligt nägot av de föregäende patentkraven 1 - 3, kännetecknat därav, att den inmatade informationen i bestämningsskedet i mot-svarande länk jämförs med det inmatade märkta stället 5. registrets länkar och tolkningen av det i databe-handlingssystemet inmatade utmärkta stället utförs ge-nom att som hjälp använda teckensträngdistans och/el-ler vägd distansfunktionMethod according to any of the preceding claims 1 - 3, characterized in that the input information at the determining stage in the corresponding link is compared with the input marked location 5. The links of the register and the interpretation of the excellent place entered in the data processing system are carried out. - by using character string spacing and / or weighted spacing function 5. Förfarande enligt nägot av föregäende palo tentkrav 1 - 4, kännetecknat därav, att teckensträngdistansen bildas genom att transformera den inmatade teckensträngen (ml) tili teckensträngen (m2) genom användning av tre grundoperationer, vilka väljs ur mängden: ökning, radering och ersättning. 15Method according to any of the preceding claims 1-4, characterized in that the character string distance is formed by transforming the input character string (ml) into the character string (m2) using three basic operations, which are selected from the set: increase, delete and replace. 15 6. Förfarande enligt nägot av föregäende pa- tentkrav 1 - 5, kännetecknat därav, att den vägda distansfunktionen bildas mellan den inmatade teckensträngens olika länga undergrupper och den frän länkregistret erhällna teckensträngen. 20Method according to any of the preceding patent claims 1 - 5, characterized in that the weighted distance function is formed between the various long subgroups of the input character string and the character string received from the link register. 20 7. Förfarande enligt nägot av patentkraven 1 - 6, kännetecknat därav, att den vägda di stansfunktionen bildas som en funktion av ett enskilt teckens plats mellan en inmatad teckensträng och en ur länkregistret erhällen teckensträng. 25Method according to any of claims 1 to 6, characterized in that the weighted die punch function is formed as a function of the position of an individual character between an input character string and a character string obtained from the link register. 25 8. Förarande enligt patentkrav 7, k ä n n e - t e c k n a t därav, att distansfunktionen normalise-ras i förhällande tili den inmatade och ur länkregistret erhällna teckensträngens längd.8. A driver according to claim 7, characterized in that the distance function is normalized relative to the length of the character string entered and retrieved from the link register. 9. Förfarande enligt nägot av patentkraven 5 30 - 8, kännetecknat därav, att för distanspa- rametern sätts ett pä förhand bestämt tröskelvärde och ” den inmatade teckensträngen godkänns som riktig, om « distansparametern överskrider tröskelvärdet.9. A method according to any of claims 5 to 8, characterized in that for the distance parameter a predetermined threshold value is set and "the entered character string is accepted as correct if the" distance parameter exceeds the threshold value. 10. System för sammanfogande av information i 35 elektronisk form, registrerad i ett databehandlingssy- stem (1), med tryckt information, säsom tryckt text, . . och framförande pä databehandlingsanordningens bild- 15 105954 skärm, 1judätergivningsanordning eller motsvarande, tili vilket databehandlingssystem hör - en registreringsanordning (4) för registrerande av länkregistret; 5 medel (5) för sökande av data frän det ställe el ler den anordning länken visar; och en utskrivningsanordning (6) för framställande av informationen i elektronisk form, känneteck-n a t därav, att tili databehandlingssystemet hör 10 en läsanordning (2), som kan hällas i handen, för inmatning av det ställe som utmärkts i tryckt information i databehandlingssystemet; och en tolkningsanordning (3) för tolkning av den in-matade teckensträngen eller figuren och bestämning av 15 den länk som motsvarar densamma ur registret.10. System for combining information in electronic form, registered in a data processing system (1), with printed information, such as printed text,. . and rendering on the image processing device's display screen, sound reproducing device or the equivalent to which data processing system belongs - a recording device (4) for registering the link register; Means (5) for searching data from the location or the device shown by the link; and a printing device (6) for producing the information in electronic form, characterized in that the data processing system includes a readable device (2) which can be poured into the hand for entering the place marked in printed information in the data processing system; and an interpretation device (3) for interpreting the input character string or figure and determining the link corresponding thereto from the register. 11. System enligt patentkrav 10, känne-t e c k n a t därav, att databehandlingssystemet (1) utgörs av en dator.11. A system according to claim 10, characterized in that the data processing system (1) is a computer. 12. System enligt patentkrav 10 eller 11, 20 kännetecknat därav, att dator (1) är förenad med Internet-nätet för hämtande av information som motsvarar länkarna.System according to claims 10 or 11, 20, characterized in that computer (1) is connected to the Internet network for retrieving information corresponding to the links. 13. System enligt nägot av föregäende patent-kraven 10 - 12, kännetecknat därav, att tili . 25 systemet hör ett tili datorn anordnat ljudsystem (7) för framförande av informationen i elektronisk form i form av ljud. > · < wA system according to any one of the preceding claims 10 - 12, characterized in that the system. The system includes a sound system (7) arranged for the computer to convey the information in electronic form in the form of sound. > · <W
FI970585A 1997-02-11 1997-02-11 Method and system for connection of information in electrical form to information in printed form FI105954B (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FI970585A FI105954B (en) 1997-02-11 1997-02-11 Method and system for connection of information in electrical form to information in printed form

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI970585A FI105954B (en) 1997-02-11 1997-02-11 Method and system for connection of information in electrical form to information in printed form
FI970585 1997-02-11

Publications (3)

Publication Number Publication Date
FI970585A0 FI970585A0 (en) 1997-02-11
FI970585A FI970585A (en) 1998-08-12
FI105954B true FI105954B (en) 2000-10-31

Family

ID=8548182

Family Applications (1)

Application Number Title Priority Date Filing Date
FI970585A FI105954B (en) 1997-02-11 1997-02-11 Method and system for connection of information in electrical form to information in printed form

Country Status (1)

Country Link
FI (1) FI105954B (en)

Also Published As

Publication number Publication date
FI970585A (en) 1998-08-12
FI970585A0 (en) 1997-02-11

Similar Documents

Publication Publication Date Title
US6616038B1 (en) Selective text retrieval system
US6957233B1 (en) Method and apparatus for capturing and rendering annotations for non-modifiable electronic content
JP4509366B2 (en) A system that scans and formats information on documents
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
CA2080552C (en) Electronic information delivery system
KR101443404B1 (en) Capture and display of annotations in paper and electronic documents
US8798366B1 (en) Electronic book pagination
US7712028B2 (en) Using annotations for summarizing a document image and itemizing the summary based on similar annotations
US7640494B1 (en) Document generation from web pages
US20070185837A1 (en) Detection of lists in vector graphics documents
US20020116421A1 (en) Method and system for page-like display, formating and processing of computer generated information on networked computers
US20020095443A1 (en) Method for automated generation of interactive enhanced electronic newspaper
US20060224942A1 (en) Electronic manual display apparatus
JP2008234658A (en) Course-to-fine navigation through whole paginated documents retrieved by text search engine
US20070022114A1 (en) Apparatus, system, and server capable of effectively specifying information in document
US9310971B2 (en) Document viewing device for display document data
JP2006065477A (en) Character recognition device
JP6469919B1 (en) Judgment sentence database creation method, judgment sentence database search method, sentence creation method, judgment sentence database creation apparatus, judgment sentence database retrieval apparatus, sentence creation apparatus, judgment sentence database creation program, judgment sentence database retrieval program, And sentence creation program
FI105954B (en) Method and system for connection of information in electrical form to information in printed form
Klindt PDF/A considered harmful for digital preservation.
JP4515186B2 (en) Speech dictionary creation device, speech dictionary creation method, and program
JP2000020549A (en) Device for assisting input to document database system
JPH09244847A (en) Computer system
York Children's and Young Adult Literature by Latino Writers: A Guide for Librarians, Teachers, Parents, and Students.
JPH10240763A (en) System for managing document information

Legal Events

Date Code Title Description
MA Patent expired