SE517295C2 - Sätt och anordning för upptagning, behandling, lagring och överföring av text och blandad text- och bildinformation - Google Patents

Sätt och anordning för upptagning, behandling, lagring och överföring av text och blandad text- och bildinformation

Info

Publication number
SE517295C2
SE517295C2 SE0002736A SE0002736A SE517295C2 SE 517295 C2 SE517295 C2 SE 517295C2 SE 0002736 A SE0002736 A SE 0002736A SE 0002736 A SE0002736 A SE 0002736A SE 517295 C2 SE517295 C2 SE 517295C2
Authority
SE
Sweden
Prior art keywords
image
text
camera
original
blocks
Prior art date
Application number
SE0002736A
Other languages
English (en)
Other versions
SE0002736D0 (sv
SE0002736L (sv
Inventor
Jacob Weitman
Original Assignee
Jacob Weitman
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jacob Weitman filed Critical Jacob Weitman
Priority to SE0002736A priority Critical patent/SE517295C2/sv
Publication of SE0002736D0 publication Critical patent/SE0002736D0/sv
Priority to SE0004231A priority patent/SE519405C2/sv
Priority to JP2002518411A priority patent/JP2004506274A/ja
Priority to AU2001272869A priority patent/AU2001272869B2/en
Priority to AT01952074T priority patent/ATE341034T1/de
Priority to AU7286901A priority patent/AU7286901A/xx
Priority to CN01812966A priority patent/CN1443339A/zh
Priority to IL15397301A priority patent/IL153973A0/xx
Priority to BR0113000-5A priority patent/BR0113000A/pt
Priority to PCT/SE2001/001637 priority patent/WO2002013128A1/en
Priority to KR10-2003-7000699A priority patent/KR20030024786A/ko
Priority to US10/333,066 priority patent/US20040101196A1/en
Priority to RU2003104828/09A priority patent/RU2287183C2/ru
Priority to EP01952074A priority patent/EP1312041B1/en
Priority to DE60123441T priority patent/DE60123441T2/de
Publication of SE0002736L publication Critical patent/SE0002736L/sv
Publication of SE517295C2 publication Critical patent/SE517295C2/sv

Links

Classifications

    • G06K9/2054
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Studio Devices (AREA)
  • Character Discrimination (AREA)

Description

517 295 _2- Grundläggande för uppfinningen är användning av en kompakt intelligent digitalkamera, företrädesvis utrustad med optik för vidvinkel, hög ljusstyrka och stort skärpedjup även på korta avstånd, där intelligensen baseras på programvara för behandling och tolkning av h e l a bilden på så sätt att textdelarna igenkännes och transformeras till samt lagras som t.ex. ASCII- eller EBCDlC-kod, medan den återstående informationen lagras som bild med vald upplösning.
Kännetecknande för sättet enligt uppfinningen är vidare att programvaran har intelligens för tolkning av bildkvaliteter som font och layout och förmåga att utifrån gjord tolkning återskapa/syntetisera den tolkade textmassan och matcha den mot (lägga den över) den ursprungliga texten. Vid godtagbar matchning raderas de delar av den ursprungliga kamerabilden, vilken utgörs av textblock, varefter den lagrade informationen utgörs av kodad text, layoutinformation samt bild. l de fall då acceptabel matchning av ursprunglig och återskapad/ syntetiserad bild av textblocken ej lyckas, lagras den ursprungliga bilden i originalformat. Matchningsresultatet kan t.ex. uttryckas som procentuell dotöverensstämmelse. Även vid procentuellt sett mycket god matchning kan det finnas enstaka tecken, ord eller avsnitt, som ej kunnat tolkas korrekt. Sådan ej tolkad eller feltolkad grundinformation raderas ej ur textblocket, utan återges som en i den tolkade texten infogad, på lämpligt sätt markerad bild av ursprungstexten.
Användaren har därigenom möjlighet att senare gå in och hjälpa programmet med tolkningen på de markerade punkterna. 517 295 -3_ Ett ytterligare kännetecken för sättet enligt uppfinningen är att tolkningsprogrammet, som företrädesvis ligger i kameran, men som givetvis också kan förläggas utanför denna, innefattar algoritmer baserade på t.ex. vektorgrafiska metoder, för att analysera och lagra information om den ursprungliga bildens layout och att denna information användes vid matchningen av ursprunglig och syntetiserad bild samt optionellt för att vid senare utskrift av den syntetiska bilden återskapa en layout som är anpassad till valt utskriftsformat (t.ex. A4) och så nära som möjligt återger den ursprungliga layouten. Detta är viktigt, eftersom layouten (vari innefattas aspekter som understrykningar, kursiveringar, indelning i stycken, etc.) kan vara väsentlig för förståelsen av sammanhang och innehåfl Som option kan kameran förses med framefunktioner, så att enbart valda delar av bilden lagras och bearbetas, varigenom text- eller bildinformation som anses mistlig (t.ex. bild med blå himmel och vajande sädesfält i artikel om vår miljö, eller bild på kurvig dam i artikel om könsroller) elimineras redan initialt.
Enligt uppfinningen kan informationen taggas redan i den intelligenta kamerans program, så att senare informationshantering i databaser underlättas. Detta uppnås genom inbyggd funktionalitet för automatisk igenkänning av karatäristika såsom rubriker och författarnamn samt automatiskt val av nyckelord ur rubriker.
För ökad användbarhet kan den intelligenta kamerans program utökas med optioner för översättning mellan olika språk, och/eller för tolkning av matematiska symboler och formler och/eller läsning av en eller flera handstilar. Handstilstolkningen baseras lämpligen på algoritmer för självlärning i neurala system. 517 295 Beroende på utvecklingsläget då det gäller minnes- och processor- kapacitet, förlägges en så stor del av intelligensen som möjligt till själva kameran. Funktioner och optioner, som vid en viss tidpunkt i utvecklingen bedöms som alltför krävande ur minnes- eller processorkapacitetssynpunkt, kan dock inom ramen för uppfinningen exekveras utanför kameran, varvid snabba kommunikationsprotokoll (typ FIRE WIRE 1394) kan vara till stor nytta.
Genom koppling av den intelligenta mobila digitalkameran till en mobiltelefon med bredbandsöverföringskapacitet, kan överföring av tolkade och komprimerade data ske till egen databas eller till tredje part. Överföring kan antingen ske i realtid eller fördröjt, och då av lagrade data.
Ett ur praktisk synpunkt viktigt apparativt kännetecken enligt uppfinningen är att kameran utrustas för extrem vidvinkelfotografering, så att t.ex. en helsida ur den inledningsvis nämnda tidnings- publikationen kan fångas med en enda exponering vid normalt betraktningsavstånd ( 0,3 à 0,5 m). Detta kan uppnås antingen genom speciella vidvinkelobjektiv, varvid distorsioner korrigeras numeriskt, eller genom facettobjektiv enligt appositions- eller superpositionsprincipen, varvid helhetsbilden syntetiseras genom databehandling, eller också genom scannande objektiv med t.ex. rörlig spegel, varvid helhetsbilden också sammansättes mjukvaru- mässigt.
Det är självfallet tillåtet inom ramen för uppfinningen att den intelligenta digitala kameran även kan användas som en konventionell digital kamera.

Claims (1)

1. 517 295 _5- Patentkrav Sätt för mobil upptagning, lagring, behandling och överföring av bilder innehållande tolkningsbara tecken såsom tryckta eller handskrivna bokstäver, ord-eller stavelsetecken, symboler och streckkod, omfattande en digitalkamera med en eller flera processorer, minne och programvara samt eventuellt transmissionsutrustning, k ä n n e t e c k n at därav att bilden uppdelas (segmenteras) i delmängder, varav minst en kan bli föremål för tolkning/översättning till exempelvis ASCll-kod, att delmängderna i tillämpliga fall utgörs av block med text baserad på tryckta bokstäver eller symboler, och/eller block med text baserad på handskrivna bokstäver eller symboler, och/eller block med övrig kod såsom streckkod och/eller block med grafik//foto och att samtliga i en viss bild förekommande block taggas så att de kan lagras, behandlas, tolkas och överföras var för sig antingen i kameran eller i en anslutande separat enhet och när så önskas återkombineras till en avbild av ursprungsbilden. Sätt enligt krav 1, k ä n n e t e c k n at därav att i de block som omfattar tolkningsbara tecken och text, egenskaper såsom font, understrykningar, fet stil och liknande igenkännes och lägges till den tolkade informationen. Sätt enligt kraven 1 och 2, k ä n n e t e c k n a t därav att grundbilden analyseras med avseende på övrig specifik information, såsom indelning i stycken samt layout, att den samlade informationen om den tolkade bilden användes för att skapa en syntetisk bild som jämföres med den ursprungliga bilden samt att sistnämnda raderas från kamerans minne vid tillräckligt god match mellan ursprunglig och syntetisk bild. Sätt enligt krav 3, k ä n n e t e c k n a t därav att information som ej kunnat tolkas ej raderas utan återges i den tolkade/syntetiska bilden som lämpligt markerad bild av det berörda _ ursprungliga tecknet/ordet/textavsnittet, så att användaren därigenom beredes möjlighet att förbättra tolkningen. Sätt enligt krav 4, k ä n n e t e c k n a t därav att kamerans tolkningsprogram innefattar algoritmer eller neurala system med intelligens för självlärning, så att den i krav 4 angivna återkopplingen från användare till kamerasystem kan utnyttjas för att successivt träna upp och förbättra kamerasystemets tolkningsförmåga. Sätt enligt kraven 1-5, k ä n n e t e c k n a t därav att kameran förses med framefunktioner, så att användaren kan ange att endast bestämda delar av bilden skall lagras och bearbetas eller transmitteras. 10. 11. 12. 13. 14. 517 295 'Åffïtš _6- Sätt enligt kraven 1-3, k ä n n e t e c k n a t därav att vid återgivning av den rekombinerade bilden på annat format än den ursprungliga, återgivningen sker på ett sådant sätt att den återgivna bildens layout så nära som möjligt överensstämmer med ursprungsbildens. Sätt enligt krav 1, k ä n n e t e c k n a t därav att informationsblock innehållande text automatiskt avsökes med avseende på samt taggas med karaktäristika såsom publikationsnamn, författarnamn, rubrik eller nyckelord hämtade ur rubrik, som underlättar systematisk lagring och sökning av information i databaser. Anordning för mobil upptagning, lagring, behandling och överföring av bilder innehållande tolkningsbara tecken såsom tryckta eller handskrivna bokstäver, ord-eller stavelsetecken, symboler och streckkod, omfattande en digitalkamera med en eller flera processorer, minne, display, program och eventuellt transmissionsutrustning, k ä n n e t e c k n a d därav att kameran kan kopplas om mellan användning som en konventionell digital kamera och som en avancerad kamera, varvid med avancerad kamera avses en kamera enligt beskrivningstexten och kraven 1-8. Anordning enligt krav 9, k ä n n e t e c k n a d därav att den för de avancerade funktionerna resp. för eventuell mobil kommunikation erforderliga hårdvaran och mjukvaran placeras i själva kameran eller i en separat enhet. Anordning enligt krav 9 och 10, k ä n n e t e c k n a d därav att kamera- objektivet är utformat för extrem vidvinkel. Anordning enligt krav 11, k ä n n e t e c k n a d därav att distorsioner i objektivet korrigeras numeriskt, så att en oförvrängd bild kan återskapas. Anordning enligt krav 11, k ä n n e t e c k n a d därav att objektivet är uppbyggt som ett facettobjektiv enligt appositionsprincipen, med viss överlappning mellan delbilderna, och att en sammanhängande helhetsbild skapas mjukvarumässigt. Anordning enligt krav 11, k ä n n e t e c k n a d därav att objektivet är uppbyggt som ett facettobjektiv enligt superpositionsprincipen och att distorsioner vid behov korrigeras mjukvarumässigt. o o n a vc n Sammandrag Sätt för mobil intelligent upptagning, behandling, lagring och överföring av blandad text- och bildinformation med hjälp av en digitalkamera med processor och programvara, kännetecknad därav att hela bilden först analyseras med avseende på sin textinformation, att ursprungsbilden därefter uppdelas i ett textblock och ett bildblock, att textblocket tolkas med t.ex. OCR-teknik och omvandlas till kompakt kod, exempelvis ASCII-kod, att textkoden kompletteras med grafisk information som tillåter skapandet av en syntetisk textblocksbild, vilken genom överlagring jämföres med det ursprungliga textblocket för att få ett mått på tolkningskvaliteten och att text och bildblocken taggas med relevant information för databashantering, så att de kan lagras, bearbetas och transmitteras var för sig och rekombineras för optimal återgivning på valt format. Även anordning för sättet, kännetecknad främst därav att digital- kameran tillåter extrem vidvinkelupptagning och att bilddistorsioner eller överlappningar i t.ex. facettobjektiv korrigeras mjukvaru- mässigt.
SE0002736A 2000-07-19 2000-07-19 Sätt och anordning för upptagning, behandling, lagring och överföring av text och blandad text- och bildinformation SE517295C2 (sv)

Priority Applications (15)

Application Number Priority Date Filing Date Title
SE0002736A SE517295C2 (sv) 2000-07-19 2000-07-19 Sätt och anordning för upptagning, behandling, lagring och överföring av text och blandad text- och bildinformation
SE0004231A SE519405C2 (sv) 2000-07-19 2000-11-17 Tillämpningar för en avancerad digitalkamera som tolkar den tagna bilden utifrån dess informationsinnehåll, såsom att överföra bilden, beordra en tjänst, styra ett flöde mm
DE60123441T DE60123441T2 (de) 2000-07-19 2001-07-16 Verfahren und mittel zur mobilen erfassung, verarbeitung, speicherung und übertragung von text und gemischten informationen, die zeichen und bilder enthalten
CN01812966A CN1443339A (zh) 2000-07-19 2001-07-16 移动捕捉、处理、存储和传输文本包含字符和图像的混合信息的方法和装置
PCT/SE2001/001637 WO2002013128A1 (en) 2000-07-19 2001-07-16 Method and means for mobile capture,processing, storage and transmission of text and mixed information containing characters and images
AT01952074T ATE341034T1 (de) 2000-07-19 2001-07-16 Verfahren und mittel zur mobilen erfassung, verarbeitung, speicherung und übertragung von text und gemischten informationen, die zeichen und bilder enthalten
AU7286901A AU7286901A (en) 2000-07-19 2001-07-16 Method and means for mobile capture,processing, storage and transmission of textand mixed information containing characters and images
JP2002518411A JP2004506274A (ja) 2000-07-19 2001-07-16 テキスト情報と、文字および画像を含んだ混合情報と、を移動中に取り込み、処理、格納および送信を行うための方法および手段
IL15397301A IL153973A0 (en) 2000-07-19 2001-07-16 Method and means for mobile capture processing, storage and transmission of text and mixed information containing characters and images
BR0113000-5A BR0113000A (pt) 2000-07-19 2001-07-16 Método e meios para captura móvel, processamento, armazenagem e transmissão de texto e informações mistas contendo caracteres e imagens
AU2001272869A AU2001272869B2 (en) 2000-07-19 2001-07-16 Method and means for mobile capture, processing, storage and transmission of text and mixed information containing characters and images
KR10-2003-7000699A KR20030024786A (ko) 2000-07-19 2001-07-16 텍스트 및 문자와 이미지를 포함하는 혼합 정보의 이동식포착, 처리, 저장 및 전송을 위한 방법 및 장치
US10/333,066 US20040101196A1 (en) 2000-07-19 2001-07-16 Method and means for mobile capture, processing, storage and transmission of test and mixed information containing characters and images
RU2003104828/09A RU2287183C2 (ru) 2000-07-19 2001-07-16 Способ и средство для мобильного захвата, обработки, хранения и передачи текста и смешанной информации, содержащей знаки и изображения
EP01952074A EP1312041B1 (en) 2000-07-19 2001-07-16 Method and means for mobile capture,processing, storage and transmission of text and mixed information containing characters and images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0002736A SE517295C2 (sv) 2000-07-19 2000-07-19 Sätt och anordning för upptagning, behandling, lagring och överföring av text och blandad text- och bildinformation

Publications (3)

Publication Number Publication Date
SE0002736D0 SE0002736D0 (sv) 2000-07-19
SE0002736L SE0002736L (sv) 2002-01-20
SE517295C2 true SE517295C2 (sv) 2002-05-21

Family

ID=20280561

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0002736A SE517295C2 (sv) 2000-07-19 2000-07-19 Sätt och anordning för upptagning, behandling, lagring och överföring av text och blandad text- och bildinformation

Country Status (2)

Country Link
RU (1) RU2287183C2 (sv)
SE (1) SE517295C2 (sv)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5847807B2 (ja) * 2011-04-18 2016-01-27 キヤノン株式会社 データ処理装置、データ処理装置の制御方法、及びプログラム

Also Published As

Publication number Publication date
RU2287183C2 (ru) 2006-11-10
SE0002736D0 (sv) 2000-07-19
SE0002736L (sv) 2002-01-20

Similar Documents

Publication Publication Date Title
US9530050B1 (en) Document annotation sharing
EP0774729B1 (en) Character recognizing and translating system
US8156115B1 (en) Document-based networking with mixed media reality
US7639387B2 (en) Authoring tools using a mixed media environment
US20070070408A1 (en) Image album creating system, image album creating method and image album creating program
US8072495B2 (en) Automatic image capturing system
US20060055804A1 (en) Picture taking device
AU2001272869B8 (en) Method and means for mobile capture, processing, storage and transmission of text and mixed information containing characters and images
US20040076342A1 (en) Automatic image placement and linking
JP2007025980A (ja) 情報指定システム、情報指定方法、サーバ装置、情報指定装置及び情報指定プログラム
AU2001272869A1 (en) Method and means for mobile capture, processing, storage and transmission of text and mixed information containing characters and images
KR102043693B1 (ko) 기계 학습 기반의 문서 관리 시스템
CN114005121A (zh) 一种移动终端的文本识别方法及设备
KR20060001392A (ko) 문자 인식을 이용한 내용검색 기반의 문서 이미지 저장 방법
US20130315441A1 (en) System for extracting text from a document
CN117391201A (zh) 问答方法、装置及电子设备
CN111275048A (zh) 一种基于ocr文字识别技术的ppt复现方法
SE517295C2 (sv) Sätt och anordning för upptagning, behandling, lagring och överföring av text och blandad text- och bildinformation
CN112365402B (zh) 智能组卷方法、装置、存储介质及电子设备
WO1997004409A1 (fr) Dispositif de recherche de fichiers
Pattnaik et al. A Framework to Detect Digital Text Using Android Based Smartphone
CN112259074A (zh) 一种基于高拍仪获得语音播放方法和系统
JP2012049860A (ja) 画像処理装置、画像処理方法およびプログラム
JP2010009579A (ja) 書類内容即時検出システム及び方法
KR101911613B1 (ko) 뉴스 인터뷰 영상의 오버레이 텍스트 기반 인물 인덱싱 방법 및 장치

Legal Events

Date Code Title Description
NUG Patent has lapsed