FI121583B - Sökning av en symbolsträng - Google Patents
Sökning av en symbolsträng Download PDFInfo
- Publication number
- FI121583B FI121583B FI20021330A FI20021330A FI121583B FI 121583 B FI121583 B FI 121583B FI 20021330 A FI20021330 A FI 20021330A FI 20021330 A FI20021330 A FI 20021330A FI 121583 B FI121583 B FI 121583B
- Authority
- FI
- Finland
- Prior art keywords
- symbol
- calculation
- point
- distance
- queues
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Claims (7)
1. Förfarande för sökning av en inmatad symbolkö frän en mängd symbolköer, väri: man skapar (A) en trie-datastruktur av symbolköerna, varvid sym-5 bolköerna grupperas i förgreningar, sä att symbolköer som börjar pä samma symboler tillhör samma förgrening, och symbolköerna i samma förgrening för-delas pä nya förgreningar vid de symboler, med början av vilka symbolköerna avviker frän varandra, mottar (B) en inmatning bestaende av en inmatad symbolkö, 10 framskrider (C) fran trie-datastrukturens begynnelsepunkt längs för- greningen tili en beräkningspunkt som anges av följande symbol, beräknar (D) avständsmätt i beräkningspunkten mellan en sampel-symbolkö bildad av ifrägavarande beräkningspunkts samt föregäende beräk-ningspunkters symboler i förgreningen och den inmatade symbolkön genom att 15 placera dessa mittemot varandra pä alternative sätt, väljer (E) upprepat följande förgrening längs vilken framskrides (C) tili en beräkningspunkt som anges av följande symbol, väri nämnda beräkning (D) upprepas beträffande den nya beräkningspunkten, efter att beräkningen (G) är avslutad, väljer en eller flera symbolkö-20 er, vilkas avstandsmätt tili den inmatade symbolkön är minst pä basis av de utförda beräkningarna, och använder den/de valda symbolkön/-köerna för att producera en re-spons, kännetecknatav ? att man beräknar (D) i beräkningspunkterna förutom avständsmätt ^ 25 även den minsta möjliga längdskillnad som motsvarar varje avständsmätt, vil- V ken längdskillnad anger hur mycket längden av slutdelen av den inmatade symbolkön som lämnats obeaktad vid beräkning av ifrägavarande avständs- | mätt skiljer sig frän längderna efter beräkningspunkten för symbolköerna som gär via ifrägavarande beräkningspunkt, och pä basis av varje avständsmätt co 30 och motsvarande längdskillnad beräknas ett referensvärde, och g att man utför nämnda vai (E) av förgrening sä att man härnäsi fram- o skrider frän den beräkningspunkt som gett som resultat det lägsta referensvär-det.
2. Förfarande enligt patentkrav 1,kännetecknat av att man jämför den för producerandet av respons använda symbolköns eller symbolköernas och den inmatade symbolköns avständsmätt med ett förut bestämt maximiavständ, och den producerade responsen omvandlas att ange att den inmatade 5 symbolkön inte hittades, sävida avständsmättet överskrider maximiavständet.
3. Förfarande enligt patentkrav 1 eller 2, k ä n n e t e c k n a t av att i samband med valet av förgrening jämför man nämnda lägsta refe-rensvärde med det förut bestämda maximiavstandet, och avslutar beräkningen, savida det lägsta referensvärdet överskrider 10 maximiavstandet.
4. Förfarande enligt nägot av patentkraven 1-3, kännetecknat av att i samband med valet av förgrening kontrollerar man huruvida beräkningen redan utförts i nägon förgrening beträffande den sista beräknings-15 punkten, och avslutar beräkningen ifall det visar sig att man beträffande nagon förgrenings sista beräkningspunkt erhallit ett referensvärde, som är mindre än de beträffande alla andra beräkningspunkter erhällna referensvärdena.
5. Datorprogram, kännetecknat av att det omfattar datorpro-20 grammedel, vilka är anordnade att utföra alla steg i förfarandet enligt nägot av patentkraven 1-4, da nämnda program utförs i datorn.
6. Med dator läsbart datamedel, kännetecknat av att frän da-tamedlet kan avläsas ett datorprogram, som omfattar datorprogrammedel, vilka är anordnade att utföra alla steg i förfarandet enligt nägot av patentkraven ^ 25 1-4, dä nämnda program utförs i datorn.
™ 7. Anordning (10) för sökning av en symbolkö frän en mängd sym- v bolköer, vilken anordning omfattar: ^ medel (12) för att skapa en trie-datastruktur frän symbolköerna ge- c nom att gruppera symbolköerna i förgreningar, sä att symbolköer som börjar 0 30 pä samma symboler tillhör samma förgrening, och symbolköer i samma för- co grening fördelar sig pä nya förgreningar vid de symboler frän och med vilka o symbolköerna avviker frän varandra, o w en ingäng (11) för mottagning av en inmatad symbolkö som bestär av en inmatad symbolkö, 35 beräkningsmedel (14) för beräkning av avständsmätt i beräknings- punkten mellan en sampelsymbolkö bildad av ifragavarande beräkningspunkts samt föregäende beräkningspunkters symboler i förgreningen och den inmata-de symbolkön genom att placera dessa mittemot varandra pä alternativa sätt, valmedel (15), vilka upprepat väljer följande förgrening längs vilken 5 framskrides tili en beräkningspunkt som anges av följande symbol, väri nämn-da beräkning upprepas beträffande en ny beräkningspunkt, valmedel (16), vilka efter att beräkningen (G) är avslutad väljer en eller flera symbolköer, vilkas avständsmätt tili inmatningen är minst pä basis av de utförda beräkningarna, 10 medel (17) för producerande av respons, vilka producerar respon- sen genom att använda den/de valda symbolkön/-köerna, och en utgäng (18) för matning av responsen vidare, känne-t e c k n a t av att anordningen är anordnad: att beräkna (D) i beräkningspunkterna förutom avständsmätt även 15 den minsta möjliga längdskillnad som motsvarar varje avständsmätt, vilken längdskillnad anger hur mycket längden av slutdelen av den inmatade symbolkön som lämnats obeaktad vid beräkning av ifrägavarande avständsmätt skiljer sig frän längderna efter beräkningspunkten för symbolköerna som gär via ifrägavarande beräkningspunkt, och pä basis av varje avständsmätt och motsva-20 rande längdskillnad beräkna ett referensvärde, och att utföra nämnda vai av förgrening sä att följande framskridande sker frän den beräkningspunkt som gett som resultat det lägsta referensvärdet. o δ CM CD CM X cc CL o CO CO CM O O CM
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20021330A FI121583B (sv) | 2002-07-05 | 2002-07-05 | Sökning av en symbolsträng |
EP03762696A EP1552429A1 (en) | 2002-07-05 | 2003-07-03 | Searching for symbol string |
US10/520,171 US8532988B2 (en) | 2002-07-05 | 2003-07-03 | Searching for symbol string |
AU2003242800A AU2003242800A1 (en) | 2002-07-05 | 2003-07-03 | Searching for symbol string |
PCT/FI2003/000540 WO2004006126A1 (en) | 2002-07-05 | 2003-07-03 | Searching for symbol string |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20021330 | 2002-07-05 | ||
FI20021330A FI121583B (sv) | 2002-07-05 | 2002-07-05 | Sökning av en symbolsträng |
Publications (3)
Publication Number | Publication Date |
---|---|
FI20021330A0 FI20021330A0 (sv) | 2002-07-05 |
FI20021330A FI20021330A (sv) | 2004-01-06 |
FI121583B true FI121583B (sv) | 2011-01-14 |
Family
ID=8564312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI20021330A FI121583B (sv) | 2002-07-05 | 2002-07-05 | Sökning av en symbolsträng |
Country Status (5)
Country | Link |
---|---|
US (1) | US8532988B2 (sv) |
EP (1) | EP1552429A1 (sv) |
AU (1) | AU2003242800A1 (sv) |
FI (1) | FI121583B (sv) |
WO (1) | WO2004006126A1 (sv) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7895218B2 (en) * | 2004-11-09 | 2011-02-22 | Veveo, Inc. | Method and system for performing searches for television content using reduced text input |
US7779011B2 (en) | 2005-08-26 | 2010-08-17 | Veveo, Inc. | Method and system for dynamically processing ambiguous, reduced text search queries and highlighting results thereof |
US7788266B2 (en) | 2005-08-26 | 2010-08-31 | Veveo, Inc. | Method and system for processing ambiguous, multi-term search queries |
US20070088681A1 (en) * | 2005-10-17 | 2007-04-19 | Veveo, Inc. | Method and system for offsetting network latencies during incremental searching using local caching and predictive fetching of results from a remote server |
US7644054B2 (en) * | 2005-11-23 | 2010-01-05 | Veveo, Inc. | System and method for finding desired results by incremental search using an ambiguous keypad with the input containing orthographic and typographic errors |
US7739280B2 (en) | 2006-03-06 | 2010-06-15 | Veveo, Inc. | Methods and systems for selecting and presenting content based on user preference information extracted from an aggregate preference signature |
US8073860B2 (en) | 2006-03-30 | 2011-12-06 | Veveo, Inc. | Method and system for incrementally selecting and providing relevant search engines in response to a user query |
EP4209927A1 (en) | 2006-04-20 | 2023-07-12 | Veveo, Inc. | User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content |
CA2989780C (en) | 2006-09-14 | 2022-08-09 | Veveo, Inc. | Methods and systems for dynamically rearranging search results into hierarchically organized concept clusters |
US7925986B2 (en) | 2006-10-06 | 2011-04-12 | Veveo, Inc. | Methods and systems for a linear character selection display interface for ambiguous text input |
US8078884B2 (en) | 2006-11-13 | 2011-12-13 | Veveo, Inc. | Method of and system for selecting and presenting content based on user identification |
WO2008148012A1 (en) | 2007-05-25 | 2008-12-04 | Veveo, Inc. | System and method for text disambiguation and context designation in incremental search |
US8424043B1 (en) | 2007-10-23 | 2013-04-16 | Strategic Design Federation W, Inc. | Method and system for detecting unscheduled events and recording programming streams |
US8943539B2 (en) | 2007-11-21 | 2015-01-27 | Rovi Guides, Inc. | Enabling a friend to remotely modify user data |
FR2940693B1 (fr) * | 2008-12-30 | 2016-12-02 | Thales Sa | Procede et systeme optimises de gestion des noms propres pour l'optimisation de la gestion et de l'interrogation des bases de donnees. |
US9166714B2 (en) | 2009-09-11 | 2015-10-20 | Veveo, Inc. | Method of and system for presenting enriched video viewing analytics |
US9208259B2 (en) * | 2009-12-02 | 2015-12-08 | International Business Machines Corporation | Using symbols to search local and remote data stores |
US20110191332A1 (en) | 2010-02-04 | 2011-08-04 | Veveo, Inc. | Method of and System for Updating Locally Cached Content Descriptor Information |
US10037238B2 (en) * | 2016-02-10 | 2018-07-31 | Dell Products, L.P. | System and method for encoding exception conditions included at a remediation database |
US11269934B2 (en) | 2018-06-13 | 2022-03-08 | Oracle International Corporation | Regular expression generation using combinatoric longest common subsequence algorithms |
US11580166B2 (en) * | 2018-06-13 | 2023-02-14 | Oracle International Corporation | Regular expression generation using span highlighting alignment |
US11941018B2 (en) | 2018-06-13 | 2024-03-26 | Oracle International Corporation | Regular expression generation for negative example using context |
US11354305B2 (en) | 2018-06-13 | 2022-06-07 | Oracle International Corporation | User interface commands for regular expression generation |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5580183A (en) * | 1978-12-12 | 1980-06-17 | Nippon Telegr & Teleph Corp <Ntt> | On-line recognition processing system of hand-written character |
US4400828A (en) * | 1981-03-27 | 1983-08-23 | Bell Telephone Laboratories, Incorporated | Word recognizer |
US5144671A (en) * | 1990-03-15 | 1992-09-01 | Gte Laboratories Incorporated | Method for reducing the search complexity in analysis-by-synthesis coding |
US5377281A (en) * | 1992-03-18 | 1994-12-27 | At&T Corp. | Knowledge-based character recognition |
US5353376A (en) * | 1992-03-20 | 1994-10-04 | Texas Instruments Incorporated | System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment |
US6243493B1 (en) * | 1994-01-21 | 2001-06-05 | At&T Corp. | Method and apparatus for handwriting recognition using invariant features |
US5699456A (en) * | 1994-01-21 | 1997-12-16 | Lucent Technologies Inc. | Large vocabulary connected speech recognition system and method of language representation using evolutional grammar to represent context free grammars |
JP3095623B2 (ja) * | 1994-06-16 | 2000-10-10 | 松下電器産業株式会社 | 属性判定方法 |
US5768423A (en) * | 1994-09-02 | 1998-06-16 | Panasonic Technologies Inc. | Trie structure based method and apparatus for indexing and searching handwritten databases with dynamic search sequencing |
EP0702311A1 (en) * | 1994-09-14 | 1996-03-20 | Kabushiki Kaisha Toshiba | Data processing system,data retrieval system,data processing method and data retrieval method |
JP3152871B2 (ja) * | 1995-11-10 | 2001-04-03 | 富士通株式会社 | ラティスをキーとした検索を行う辞書検索装置および方法 |
US6490555B1 (en) * | 1997-03-14 | 2002-12-03 | Scansoft, Inc. | Discriminatively trained mixture models in continuous speech recognition |
NO983175L (no) * | 1998-07-10 | 2000-01-11 | Fast Search & Transfer Asa | Soekesystem for gjenfinning av data |
US6226332B1 (en) * | 1998-11-13 | 2001-05-01 | Broadcom Corporation | Multi-pair transceiver decoder system with low computation slicer |
US6370237B1 (en) * | 1998-12-29 | 2002-04-09 | Alcatel Usa Sourcing, Lp | Voice activated dialing with reduced storage requirements |
JP4085500B2 (ja) * | 1999-01-29 | 2008-05-14 | 株式会社エクォス・リサーチ | 車両状況把握装置、エージェント装置、および、車両制御装置 |
US6662180B1 (en) | 1999-05-12 | 2003-12-09 | Matsushita Electric Industrial Co., Ltd. | Method for searching in large databases of automatically recognized text |
US6438181B1 (en) * | 1999-05-28 | 2002-08-20 | Koninklijke Philips Electronics N.V. | Efficient metric memory configuration for a Viterbi decoder |
US20020002550A1 (en) * | 2000-02-10 | 2002-01-03 | Berman Andrew P. | Process for enabling flexible and fast content-based retrieval |
US7043439B2 (en) * | 2000-03-29 | 2006-05-09 | Canon Kabushiki Kaisha | Machine interface |
US6560576B1 (en) * | 2000-04-25 | 2003-05-06 | Nuance Communications | Method and apparatus for providing active help to a user of a voice-enabled application |
JP3501725B2 (ja) * | 2000-05-12 | 2004-03-02 | 日本電気株式会社 | ビタビ復号器 |
SE519985C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US7328211B2 (en) * | 2000-09-21 | 2008-02-05 | Jpmorgan Chase Bank, N.A. | System and methods for improved linguistic pattern matching |
US7027974B1 (en) * | 2000-10-27 | 2006-04-11 | Science Applications International Corporation | Ontology-based parser for natural language processing |
US7627596B2 (en) * | 2001-02-22 | 2009-12-01 | International Business Machines Corporation | Retrieving handwritten documents using multiple document recognizers and techniques allowing both typed and handwritten queries |
US6985861B2 (en) * | 2001-12-12 | 2006-01-10 | Hewlett-Packard Development Company, L.P. | Systems and methods for combining subword recognition and whole word recognition of a spoken input |
US7092567B2 (en) * | 2002-11-04 | 2006-08-15 | Matsushita Electric Industrial Co., Ltd. | Post-processing system and method for correcting machine recognized text |
-
2002
- 2002-07-05 FI FI20021330A patent/FI121583B/sv not_active IP Right Cessation
-
2003
- 2003-07-03 US US10/520,171 patent/US8532988B2/en active Active
- 2003-07-03 AU AU2003242800A patent/AU2003242800A1/en not_active Abandoned
- 2003-07-03 EP EP03762696A patent/EP1552429A1/en not_active Ceased
- 2003-07-03 WO PCT/FI2003/000540 patent/WO2004006126A1/en not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
FI20021330A (sv) | 2004-01-06 |
AU2003242800A1 (en) | 2004-01-23 |
US8532988B2 (en) | 2013-09-10 |
EP1552429A1 (en) | 2005-07-13 |
FI20021330A0 (sv) | 2002-07-05 |
WO2004006126A1 (en) | 2004-01-15 |
US20050278175A1 (en) | 2005-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI121583B (sv) | Sökning av en symbolsträng | |
Zhang et al. | Approximate tree matching in the presence of variable length don′ t cares | |
US8849841B2 (en) | Memory circuit for Aho-corasick type character recognition automaton and method of storing data in such a circuit | |
US10726198B2 (en) | Method, device, and system, for identifying data elements in data structures | |
US8645350B2 (en) | Dictionary compilations | |
CN102073654B (zh) | 生成与维护网页内容抽取模板的方法和设备 | |
Fredriksson et al. | Practical and optimal string matching | |
US20060036627A1 (en) | Method and apparatus for a restartable hash in a trie | |
US20070038447A1 (en) | Pattern matching method and apparatus and speech information retrieval system | |
Fredriksson et al. | Efficient parameterized string matching | |
CN110347782A (zh) | 文章查重方法、装置和电子设备 | |
CN101251845A (zh) | 利用改进的Wu-Manber算法进行多模式串匹配的方法 | |
CN111079437B (zh) | 一种实体识别方法、电子设备及存储介质 | |
CN108833052A (zh) | 信道极化译码路径度量值排序方法 | |
Spencer et al. | Collating texts using progressive multiple alignment | |
CN112800775A (zh) | 语义理解方法、装置、设备及存储介质 | |
CN107273360A (zh) | 基于语义理解的中文实词提取算法 | |
CN112825268B (zh) | 测序结果比对方法及其应用 | |
US6931424B1 (en) | Storage efficient minimization logic | |
Fishel et al. | Automatic translation error analysis | |
CN105653061B (zh) | 针对拼音输入法的词条检索及错词检测的方法和系统 | |
CN114036371A (zh) | 搜索词推荐方法、装置、设备和计算机可读存储介质 | |
CN109241124A (zh) | 一种快速检索相似字符串的方法及系统 | |
CN111708891B (zh) | 一种多源食材数据之间的食材实体链接方法和装置 | |
KR101088290B1 (ko) | 접미사 배열을 이용한 최장공통비상위문자열 검색 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Ref document number: 121583 Country of ref document: FI |
|
MM | Patent lapsed |