FI121583B - Sökning av en symbolsträng - Google Patents

Sökning av en symbolsträng Download PDF

Info

Publication number
FI121583B
FI121583B FI20021330A FI20021330A FI121583B FI 121583 B FI121583 B FI 121583B FI 20021330 A FI20021330 A FI 20021330A FI 20021330 A FI20021330 A FI 20021330A FI 121583 B FI121583 B FI 121583B
Authority
FI
Finland
Prior art keywords
symbol
calculation
point
distance
queues
Prior art date
Application number
FI20021330A
Other languages
English (en)
Finnish (fi)
Other versions
FI20021330A (sv
FI20021330A0 (sv
Inventor
Joerkki Hyvoenen
Original Assignee
Syslore Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syslore Oy filed Critical Syslore Oy
Priority to FI20021330A priority Critical patent/FI121583B/sv
Publication of FI20021330A0 publication Critical patent/FI20021330A0/sv
Priority to PCT/FI2003/000540 priority patent/WO2004006126A1/en
Priority to EP03762696A priority patent/EP1552429A1/en
Priority to AU2003242800A priority patent/AU2003242800A1/en
Priority to US10/520,171 priority patent/US8532988B2/en
Publication of FI20021330A publication Critical patent/FI20021330A/sv
Application granted granted Critical
Publication of FI121583B publication Critical patent/FI121583B/sv

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Claims (7)

1. Förfarande för sökning av en inmatad symbolkö frän en mängd symbolköer, väri: man skapar (A) en trie-datastruktur av symbolköerna, varvid sym-5 bolköerna grupperas i förgreningar, sä att symbolköer som börjar pä samma symboler tillhör samma förgrening, och symbolköerna i samma förgrening för-delas pä nya förgreningar vid de symboler, med början av vilka symbolköerna avviker frän varandra, mottar (B) en inmatning bestaende av en inmatad symbolkö, 10 framskrider (C) fran trie-datastrukturens begynnelsepunkt längs för- greningen tili en beräkningspunkt som anges av följande symbol, beräknar (D) avständsmätt i beräkningspunkten mellan en sampel-symbolkö bildad av ifrägavarande beräkningspunkts samt föregäende beräk-ningspunkters symboler i förgreningen och den inmatade symbolkön genom att 15 placera dessa mittemot varandra pä alternative sätt, väljer (E) upprepat följande förgrening längs vilken framskrides (C) tili en beräkningspunkt som anges av följande symbol, väri nämnda beräkning (D) upprepas beträffande den nya beräkningspunkten, efter att beräkningen (G) är avslutad, väljer en eller flera symbolkö-20 er, vilkas avstandsmätt tili den inmatade symbolkön är minst pä basis av de utförda beräkningarna, och använder den/de valda symbolkön/-köerna för att producera en re-spons, kännetecknatav ? att man beräknar (D) i beräkningspunkterna förutom avständsmätt ^ 25 även den minsta möjliga längdskillnad som motsvarar varje avständsmätt, vil- V ken längdskillnad anger hur mycket längden av slutdelen av den inmatade symbolkön som lämnats obeaktad vid beräkning av ifrägavarande avständs- | mätt skiljer sig frän längderna efter beräkningspunkten för symbolköerna som gär via ifrägavarande beräkningspunkt, och pä basis av varje avständsmätt co 30 och motsvarande längdskillnad beräknas ett referensvärde, och g att man utför nämnda vai (E) av förgrening sä att man härnäsi fram- o skrider frän den beräkningspunkt som gett som resultat det lägsta referensvär-det.
2. Förfarande enligt patentkrav 1,kännetecknat av att man jämför den för producerandet av respons använda symbolköns eller symbolköernas och den inmatade symbolköns avständsmätt med ett förut bestämt maximiavständ, och den producerade responsen omvandlas att ange att den inmatade 5 symbolkön inte hittades, sävida avständsmättet överskrider maximiavständet.
3. Förfarande enligt patentkrav 1 eller 2, k ä n n e t e c k n a t av att i samband med valet av förgrening jämför man nämnda lägsta refe-rensvärde med det förut bestämda maximiavstandet, och avslutar beräkningen, savida det lägsta referensvärdet överskrider 10 maximiavstandet.
4. Förfarande enligt nägot av patentkraven 1-3, kännetecknat av att i samband med valet av förgrening kontrollerar man huruvida beräkningen redan utförts i nägon förgrening beträffande den sista beräknings-15 punkten, och avslutar beräkningen ifall det visar sig att man beträffande nagon förgrenings sista beräkningspunkt erhallit ett referensvärde, som är mindre än de beträffande alla andra beräkningspunkter erhällna referensvärdena.
5. Datorprogram, kännetecknat av att det omfattar datorpro-20 grammedel, vilka är anordnade att utföra alla steg i förfarandet enligt nägot av patentkraven 1-4, da nämnda program utförs i datorn.
6. Med dator läsbart datamedel, kännetecknat av att frän da-tamedlet kan avläsas ett datorprogram, som omfattar datorprogrammedel, vilka är anordnade att utföra alla steg i förfarandet enligt nägot av patentkraven ^ 25 1-4, dä nämnda program utförs i datorn.
™ 7. Anordning (10) för sökning av en symbolkö frän en mängd sym- v bolköer, vilken anordning omfattar: ^ medel (12) för att skapa en trie-datastruktur frän symbolköerna ge- c nom att gruppera symbolköerna i förgreningar, sä att symbolköer som börjar 0 30 pä samma symboler tillhör samma förgrening, och symbolköer i samma för- co grening fördelar sig pä nya förgreningar vid de symboler frän och med vilka o symbolköerna avviker frän varandra, o w en ingäng (11) för mottagning av en inmatad symbolkö som bestär av en inmatad symbolkö, 35 beräkningsmedel (14) för beräkning av avständsmätt i beräknings- punkten mellan en sampelsymbolkö bildad av ifragavarande beräkningspunkts samt föregäende beräkningspunkters symboler i förgreningen och den inmata-de symbolkön genom att placera dessa mittemot varandra pä alternativa sätt, valmedel (15), vilka upprepat väljer följande förgrening längs vilken 5 framskrides tili en beräkningspunkt som anges av följande symbol, väri nämn-da beräkning upprepas beträffande en ny beräkningspunkt, valmedel (16), vilka efter att beräkningen (G) är avslutad väljer en eller flera symbolköer, vilkas avständsmätt tili inmatningen är minst pä basis av de utförda beräkningarna, 10 medel (17) för producerande av respons, vilka producerar respon- sen genom att använda den/de valda symbolkön/-köerna, och en utgäng (18) för matning av responsen vidare, känne-t e c k n a t av att anordningen är anordnad: att beräkna (D) i beräkningspunkterna förutom avständsmätt även 15 den minsta möjliga längdskillnad som motsvarar varje avständsmätt, vilken längdskillnad anger hur mycket längden av slutdelen av den inmatade symbolkön som lämnats obeaktad vid beräkning av ifrägavarande avständsmätt skiljer sig frän längderna efter beräkningspunkten för symbolköerna som gär via ifrägavarande beräkningspunkt, och pä basis av varje avständsmätt och motsva-20 rande längdskillnad beräkna ett referensvärde, och att utföra nämnda vai av förgrening sä att följande framskridande sker frän den beräkningspunkt som gett som resultat det lägsta referensvärdet. o δ CM CD CM X cc CL o CO CO CM O O CM
FI20021330A 2002-07-05 2002-07-05 Sökning av en symbolsträng FI121583B (sv)

Priority Applications (5)

Application Number Priority Date Filing Date Title
FI20021330A FI121583B (sv) 2002-07-05 2002-07-05 Sökning av en symbolsträng
PCT/FI2003/000540 WO2004006126A1 (en) 2002-07-05 2003-07-03 Searching for symbol string
EP03762696A EP1552429A1 (en) 2002-07-05 2003-07-03 Searching for symbol string
AU2003242800A AU2003242800A1 (en) 2002-07-05 2003-07-03 Searching for symbol string
US10/520,171 US8532988B2 (en) 2002-07-05 2003-07-03 Searching for symbol string

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20021330A FI121583B (sv) 2002-07-05 2002-07-05 Sökning av en symbolsträng
FI20021330 2002-07-05

Publications (3)

Publication Number Publication Date
FI20021330A0 FI20021330A0 (sv) 2002-07-05
FI20021330A FI20021330A (sv) 2004-01-06
FI121583B true FI121583B (sv) 2011-01-14

Family

ID=8564312

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20021330A FI121583B (sv) 2002-07-05 2002-07-05 Sökning av en symbolsträng

Country Status (5)

Country Link
US (1) US8532988B2 (sv)
EP (1) EP1552429A1 (sv)
AU (1) AU2003242800A1 (sv)
FI (1) FI121583B (sv)
WO (1) WO2004006126A1 (sv)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7895218B2 (en) * 2004-11-09 2011-02-22 Veveo, Inc. Method and system for performing searches for television content using reduced text input
US7788266B2 (en) 2005-08-26 2010-08-31 Veveo, Inc. Method and system for processing ambiguous, multi-term search queries
US7779011B2 (en) 2005-08-26 2010-08-17 Veveo, Inc. Method and system for dynamically processing ambiguous, reduced text search queries and highlighting results thereof
US20070088681A1 (en) * 2005-10-17 2007-04-19 Veveo, Inc. Method and system for offsetting network latencies during incremental searching using local caching and predictive fetching of results from a remote server
US7644054B2 (en) 2005-11-23 2010-01-05 Veveo, Inc. System and method for finding desired results by incremental search using an ambiguous keypad with the input containing orthographic and typographic errors
US7774294B2 (en) 2006-03-06 2010-08-10 Veveo, Inc. Methods and systems for selecting and presenting content based on learned periodicity of user content selection
US8073860B2 (en) 2006-03-30 2011-12-06 Veveo, Inc. Method and system for incrementally selecting and providing relevant search engines in response to a user query
WO2007124429A2 (en) 2006-04-20 2007-11-01 Veveo, Inc. User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content
EP2062171A4 (en) 2006-09-14 2010-10-06 Veveo Inc METHOD AND SYSTEMS FOR THE DYNAMIC REORGANIZATION OF SEARCH RESULTS IN HIERARCHICALLY ORGANIZED CLAUSE CLUSTERS
WO2008045690A2 (en) 2006-10-06 2008-04-17 Veveo, Inc. Linear character selection display interface for ambiguous text input
WO2008063987A2 (en) 2006-11-13 2008-05-29 Veveo, Inc. Method of and system for selecting and presenting content based on user identification
US8549424B2 (en) 2007-05-25 2013-10-01 Veveo, Inc. System and method for text disambiguation and context designation in incremental search
US8424043B1 (en) 2007-10-23 2013-04-16 Strategic Design Federation W, Inc. Method and system for detecting unscheduled events and recording programming streams
FR2940693B1 (fr) * 2008-12-30 2016-12-02 Thales Sa Procede et systeme optimises de gestion des noms propres pour l'optimisation de la gestion et de l'interrogation des bases de donnees.
US9166714B2 (en) 2009-09-11 2015-10-20 Veveo, Inc. Method of and system for presenting enriched video viewing analytics
US9208259B2 (en) * 2009-12-02 2015-12-08 International Business Machines Corporation Using symbols to search local and remote data stores
US20110191330A1 (en) 2010-02-04 2011-08-04 Veveo, Inc. Method of and System for Enhanced Content Discovery Based on Network and Device Access Behavior
US10037238B2 (en) * 2016-02-10 2018-07-31 Dell Products, L.P. System and method for encoding exception conditions included at a remediation database
US11941018B2 (en) 2018-06-13 2024-03-26 Oracle International Corporation Regular expression generation for negative example using context
US11580166B2 (en) * 2018-06-13 2023-02-14 Oracle International Corporation Regular expression generation using span highlighting alignment
US11354305B2 (en) 2018-06-13 2022-06-07 Oracle International Corporation User interface commands for regular expression generation
US20190384796A1 (en) 2018-06-13 2019-12-19 Oracle International Corporation Regular expression generation using longest common subsequence algorithm on regular expression codes

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5580183A (en) * 1978-12-12 1980-06-17 Nippon Telegr & Teleph Corp <Ntt> On-line recognition processing system of hand-written character
US4400828A (en) * 1981-03-27 1983-08-23 Bell Telephone Laboratories, Incorporated Word recognizer
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
US5377281A (en) * 1992-03-18 1994-12-27 At&T Corp. Knowledge-based character recognition
US5353376A (en) * 1992-03-20 1994-10-04 Texas Instruments Incorporated System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment
US6243493B1 (en) * 1994-01-21 2001-06-05 At&T Corp. Method and apparatus for handwriting recognition using invariant features
US5699456A (en) * 1994-01-21 1997-12-16 Lucent Technologies Inc. Large vocabulary connected speech recognition system and method of language representation using evolutional grammar to represent context free grammars
JP3095623B2 (ja) * 1994-06-16 2000-10-10 松下電器産業株式会社 属性判定方法
US5768423A (en) * 1994-09-02 1998-06-16 Panasonic Technologies Inc. Trie structure based method and apparatus for indexing and searching handwritten databases with dynamic search sequencing
EP0702311A1 (en) * 1994-09-14 1996-03-20 Kabushiki Kaisha Toshiba Data processing system,data retrieval system,data processing method and data retrieval method
JP3152871B2 (ja) * 1995-11-10 2001-04-03 富士通株式会社 ラティスをキーとした検索を行う辞書検索装置および方法
US6490555B1 (en) * 1997-03-14 2002-12-03 Scansoft, Inc. Discriminatively trained mixture models in continuous speech recognition
NO983175L (no) * 1998-07-10 2000-01-11 Fast Search & Transfer Asa Soekesystem for gjenfinning av data
US6226332B1 (en) * 1998-11-13 2001-05-01 Broadcom Corporation Multi-pair transceiver decoder system with low computation slicer
US6370237B1 (en) * 1998-12-29 2002-04-09 Alcatel Usa Sourcing, Lp Voice activated dialing with reduced storage requirements
JP4085500B2 (ja) * 1999-01-29 2008-05-14 株式会社エクォス・リサーチ 車両状況把握装置、エージェント装置、および、車両制御装置
US6662180B1 (en) * 1999-05-12 2003-12-09 Matsushita Electric Industrial Co., Ltd. Method for searching in large databases of automatically recognized text
US6438181B1 (en) * 1999-05-28 2002-08-20 Koninklijke Philips Electronics N.V. Efficient metric memory configuration for a Viterbi decoder
US20020002550A1 (en) * 2000-02-10 2002-01-03 Berman Andrew P. Process for enabling flexible and fast content-based retrieval
US7043439B2 (en) * 2000-03-29 2006-05-09 Canon Kabushiki Kaisha Machine interface
US6560576B1 (en) * 2000-04-25 2003-05-06 Nuance Communications Method and apparatus for providing active help to a user of a voice-enabled application
JP3501725B2 (ja) * 2000-05-12 2004-03-02 日本電気株式会社 ビタビ復号器
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US7328211B2 (en) * 2000-09-21 2008-02-05 Jpmorgan Chase Bank, N.A. System and methods for improved linguistic pattern matching
US7027974B1 (en) * 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US7627596B2 (en) * 2001-02-22 2009-12-01 International Business Machines Corporation Retrieving handwritten documents using multiple document recognizers and techniques allowing both typed and handwritten queries
US6985861B2 (en) * 2001-12-12 2006-01-10 Hewlett-Packard Development Company, L.P. Systems and methods for combining subword recognition and whole word recognition of a spoken input
US7092567B2 (en) * 2002-11-04 2006-08-15 Matsushita Electric Industrial Co., Ltd. Post-processing system and method for correcting machine recognized text

Also Published As

Publication number Publication date
WO2004006126A1 (en) 2004-01-15
FI20021330A (sv) 2004-01-06
FI20021330A0 (sv) 2002-07-05
AU2003242800A1 (en) 2004-01-23
US8532988B2 (en) 2013-09-10
EP1552429A1 (en) 2005-07-13
US20050278175A1 (en) 2005-12-15

Similar Documents

Publication Publication Date Title
FI121583B (sv) Sökning av en symbolsträng
CN111309915B (zh) 联合学习的自然语言训练方法、系统、设备及存储介质
Zhang et al. Approximate tree matching in the presence of variable length don′ t cares
US10726198B2 (en) Method, device, and system, for identifying data elements in data structures
CN111401049A (zh) 一种实体链接方法及装置
JP2002229987A (ja) パターン検索方法、パターン検索装置、コンピュータプログラム及び記憶媒体
Fredriksson et al. Practical and optimal string matching
Fredriksson et al. Efficient parameterized string matching
WO2007048015A2 (en) Method and apparatus for a restartable hash in a trie
CN101251845B (zh) 利用改进的Wu-Manber算法进行多模式串匹配的方法
CN110347782A (zh) 文章查重方法、装置和电子设备
CN111079437B (zh) 一种实体识别方法、电子设备及存储介质
CN104021202B (zh) 一种知识共享平台的词条处理装置和方法
CN108833052A (zh) 信道极化译码路径度量值排序方法
CN113158627A (zh) 代码复杂度的检测方法及装置、存储介质、电子设备
CN110309364A (zh) 一种信息抽取方法及装置
US6931424B1 (en) Storage efficient minimization logic
Fishel et al. Automatic translation error analysis
Barton et al. Crochemore’s partitioning on weighted strings and applications
CN109241124A (zh) 一种快速检索相似字符串的方法及系统
CN112825268B (zh) 测序结果比对方法及其应用
CN111708891B (zh) 一种多源食材数据之间的食材实体链接方法和装置
KR101088290B1 (ko) 접미사 배열을 이용한 최장공통비상위문자열 검색 방법
Bladier et al. From partial neural graph-based LTAG parsing towards full parsing
Amir et al. Approximate periodicity

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 121583

Country of ref document: FI

MM Patent lapsed