TR201816343T4 - Farklı bir karakter setinde yazılmış sorguları ve/veya farklı sayfalardan dili kullanarak aramaya yönelik sistemler ve yöntemler. - Google Patents

Farklı bir karakter setinde yazılmış sorguları ve/veya farklı sayfalardan dili kullanarak aramaya yönelik sistemler ve yöntemler. Download PDF

Info

Publication number
TR201816343T4
TR201816343T4 TR2018/16343T TR201816343T TR201816343T4 TR 201816343 T4 TR201816343 T4 TR 201816343T4 TR 2018/16343 T TR2018/16343 T TR 2018/16343T TR 201816343 T TR201816343 T TR 201816343T TR 201816343 T4 TR201816343 T4 TR 201816343T4
Authority
TR
Turkey
Prior art keywords
format
query
search
variants
user
Prior art date
Application number
TR2018/16343T
Other languages
English (en)
Inventor
Mittal Vibhu
M Ponte Jay
Sahami Mehran
Ghemawat Sanjay
A Bauer John
Original Assignee
Google Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google Llc filed Critical Google Llc
Publication of TR201816343T4 publication Critical patent/TR201816343T4/tr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/972Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools

Abstract

Buluş ile tutarlı yöntemler ve aparatlar, bir kullanıcının belirsiz bir arama sorgusu göndermesini ve ilgili arama sonuçlarını almasını olanaklı kılacaktır. Sorgular aranacak verilerin en azından bir kısmının karakter setinden ve/veya dilinden farklı olan karakter setleri ve/veya dilleri kullanılarak ifade edilebilir. Bu karakter setleri ve/veya dilleri arasında bir çeviri hizalanan metindeki terimlerin kullanımını inceleyerek gerçekleştirilebilir. Olasılıklar her olası çeviri ile ilişkili olabilir. Kullanıcı etkileşimlerini arama sonuçları ile inceleyerek bu olasılıklarda iyileştirmeler yapılabilir.

Description

TARIFNAME FARKLI BIR KARAKTER SETINDE YAZILMIS SORGULARI VENEYA FARKLI SAYFALARDAN DILI KULLANARAK ARAMAYA YÖNELIK SISTEMLER VE YÖNTEMLER ILGILI BASVURULARA QAPRAZ REFERANS basvurusu yapilan " METHODS AND APPARATUS FOR PROVIDING SEARCH RESULTS IN RESPONSE TO AN AMBIGUOUS SEARCH QUERY”, baslikli U.S.
Patent Basvuru Seri No. 09/748,431'in kismen devamidir.
BULU UN ALT YAPISI 1. Bulusun Sahasi Mevcut bulus, genel olarak bilgi arama ve alimi ile ilgilidir. Daha spesifik olarak, aranacak belgelerin en azindan bazilarinin karakter dizisinden veya dilinden farkli olan bir karakter setinde veya dilinde yazilan sorgulari kullanarak aramalar yapmaya yönelik sistemler ve yöntemler açiklanir. 2. Ilgili Teknigin Açiklamasi Çogu arama motoru son kullanicinin, alfanümerik dizilerin girisinin zor olmadigi, klasik bir klavye gibi bir sey kullanarak arama sorgulari girdigi varsayimi altinda çalisir.
Ancak, küçük cihazlar giderek daha yaygin hale geldiginden, bu varsayim her zaman geçerli degildir. Örnegin, kullanicilar WAP (Kablosuz Uygulama Protokolü) standardini destekleyen bir kablosuz telefon bir kablosuz telefonu kullanan arama motorlarini sorgulayabilir. Kablosuz telefonlar gibi cihazlar tipik olarak bir veri girisi arayüzü içerir, burada kullanicinin belirli bir eylemi (örnegin bir tusa basma) birden fazla alfanümerik karaktere karsilik gelebilir. WAP mimarisinin detayli bir açiklamasi httpzl/wwwl.wapforum.org/tech/documents/SPEC-WAPArch-19980439.pdf'te ("WAP 100 Kablosuz Uygulama Protokolü Mimari Spesifikasyonu") bulunur.
Alisilmis durumda, WAP kullanicisi arama sorgusu sayfasina gider ve ona arama sorgularini girdikleri bir form ile sunulur. Klasik yöntemlerde, kullanici belirli bir harfi seçmek üzere birçok tusa basmasi gerekebilir. Standart bir telefon tus takiminda, örnegin, kullanici “2" tusuna iki defa basarak “b" harfini seçebilir veya “7” tusuna dört defa basarak ”s” harfini seçebilir. Dolayisiyla, "ben smith“ adina bir sorgu girmek amaciyla, kullanicinin olagan bir sekilde asagidaki tus basma dizisine girmesi 22-›b 33-›e 66-›n 0-›bosluk 7777-›5 444-›i 44-›h Kullanici arama taleplerini girdikten sonra, arama motoru kelimeyi veya kelimeleri kullanicidan alir ve kullanicinin klasik bir klavye kullandigi bir masaüstü tarayicisindan talep almis gibi devam eder. Önceki örnekten görülebildigi üzere, bu veri girisi formu “ben smith" ifadesine karsilik gelen dokuz alfanümerik karakterlere girmek üzere on sekiz tus girisi gerektirmesi nedeniyle yetersizdir.
Hedef dile ait olmayan klavyeleri kullanirken benzer sorunlar ortaya çikabilir. Örnegin, Japonca metin hiçbiri Roma alfabesine dayanan tipik ASClI klavyesi kullanarak kolaylikla girilmeyen hiragana, katakana ve kanji dâhil olmak üzere çesitli farkli karakter setlerini kullanarak ifade edilebilir. Böyle bir durumda, kullanici romaji'de yazilan metni (bir fonetik, Japoncanin Roma alfabesiyle ifadesi) katakana, hiragana ve kanji'ye dönüstürebilen çogu zaman Ichitaro gibi Japonya'nin Tokushima City sehrindeki JustSystem Corp. Tarafindan üretilen bir kelime islemciyi kullanacaktir. Kelime islemciyi kullanarak, kullanici romaji'de bir sorgu yazabilir ve sonra çevrilen metni kelime islemcinin ekranindan tarayicidaki bir arama kutusuna kesip yapistirabilir. Bu yaklasim bir sakincasi, oldukça yavas ve zahmetli olabilir ve kullanicinin maliyet ve/veya bellek kisitlamalari nedeniyle uygulanabilir olmayan, kelime islemcinin bir kopyasina erismek zorunda olmasini gerektirir.
Dolayisiyla burada belirsiz bir arama sorgusuna karsi ilgili arama sonuçlari saglamaya yönelik yöntemlere ve aparata bir ihtiyaç bulunmaktadir.
BULUSUN KISA AÇIKLAMASI BuIUSun kapsami, ekli istemler yoluyla tanimlanir.
SEKILLERIN KISA AÇIKLAMASI Bu spesifikasyona eklenen ve bu spesifikasyonun bir parçasini olusturan ekteki sekiller bulusun örneklerini gösterir ve açiklama ile birlikte bulusun avantajlarini ve prensiplerini açiklama amaci tasir. Sekillerde: SEKIL 1 mevcut bulus ile uyumlu yöntemlerin ve aparatin uygulanabildigi bir sistemin bir blok çizelgesini gösterir; SEKIL 2 bulus ile uyumlu bir istemci cihazin bir blok çizelgesini gösterir; SEKIL 3 üç belgeyi gösteren bir çizelgeyi gösterir; SEKIL 4a klasik bir alfanümerik dizini gösterir; SEKIL 4b klasik bir alfanümerik arama sorgusu karsisinda arama sonuçlari saglamaya yönelik bir akis çizelgesini gösterir; SEKIL 5a belirsiz bir arama sorgusu karsisinda arama sonuçlari saglamaya yönelik bulus ile tutarli bir akis çizelgesini gösterir; SEKIL 5b alfanümerik bilgiyi nümerik bilgiye eslestirmeye yönelik bir çizelgeyi gösterir; SEKIL 6 belirsiz bir arama sorgusu karsisinda arama sonuçlari saglamaya yönelik bulus ile uyumlu, bir baska akis çizelgesini gösterir.
SEKIL 7 mevcut bulusun örnekleri uyarinca bir arama gerçeklestirmeye yönelik bir yöntemi gösterir.
SEKIL 8 bir karakter seti çevirilerinin olasiliksal sözlügünü gösterir.
SEKIL 9 bir olasiliksal sözlük olusturmak üzere paralel baglanti metninin kullanimini gösterir.
SEKIL 10 baglanti metni kullanilarak baglanan bir belge koleksiyonunu gösterir.
SEKILLER 11A ve 118, SEKIL 10'da gösterilen baglanti metnine göre benzeri çevirilerin hesaplamasini gösterir.
SEKIL 12 bir açiklayici kelime çevirisi ile iliskili bir olasilik dagilimini gösterir.
Bu noktada ekteki sekillerde gösterildigi gibi mevcut bulusun detayli düzenlemelerine referans yapilacaktir. Sekillerde ve asagidaki açiklamada ayni veya benzer parçalari refere etmek üzere ayni referans numaralari kullanilabilir. Asagidaki açiklama teknikte uzman herhangi bir kisinin çalismanin bulus gövdesini yapmasini ve kullanmasini olanakli kilmak üzere sunulur. Spesifik örneklerin ve basvurularin açiklamalari sadece örnekler olarak saglanir ve çesitli modifikasyonlar teknikte uzman kisiler tarafindan kolaylikla anlasilacaktir. Örnegin, örneklerin birçogu Internet web sayfalarinin baglaminda açiklanmis olmasina ragmen, mevcut bulusun örneklerinin kitaplar, gazeteler, dergiler veya benzeri gibi diger belge ve/veya bilgi tiplerini aramak üzere kullanilabilir. Ayni sekilde, örneklerin birçogu açiklama amaciyla Japonca metnin romaji'den katakana, hiragana ve/veya kanji'ye çevrilmesine ragmen, teknikte uzman kisiler mevcut bulusun sistemlerinin ve yöntemlerinin herhangi bir uygun çeviriye uygulanabilecegini anlayacaktir. Örnegin, sinirlama olmaksizin, mevcut bulusun örnekleri bazi diger formatta (örnegin pinyin veya romaja) alinan sorgulara göre, örnegin geleneksel Çin karakterleri veya Kore hangul veya hanja karakterlerinde yazilan metni aramak üzere kullanilabilir. Burada açiklanan genel prensipler bulusun kapsamindan ayrilmadan diger örneklere ve basvurulara uygulanabilir. Dolayisiyla, mevcut bulus burada açiklanan prensipler ve özellikler ile uyumlu çok sayida alternatifi, modifikasyonu ve esdegeri içeren en genis kapsamina uygun hale getirilmelidir. Daha iyi anlasilirlik saglanmasi amaciyla, bulus ile ilgili sahalarda bilinen teknik materyal ile ilgili detaylar mevcut bulusu gereksiz bir sekilde belirsiz hale getirmemek üzere detayli açiklanmamistir.
A. Genel Bakis Bulus ile uyumlu yöntemler ve aparatlar, bir kullanicinin belirsiz bir arama sorgusu göndermesini ve potansiyel olarak belirsizligi giderilmis arama sonuçlari almasini olanakli kilacaktir. Bir örnekte standart telefon tus takiminin bir kullanicisindan alinan bir rakam dizisi, potansiyel olarak ilgili bir alfanümerik dizi setine çevrilir. Bu potansiyel olarak uyumlu alfanümerik diziler bir boole degeri “OR” ifadesi kullanilarak bir klasik arama motoruna bir girdi olarak saglanir. Böylece, arama motoru kullanicinin almaya ilgi duyabilecegi arama sonuçlarini sinirlamaya yardimci olmak üzere kullanilir.
B. Mimari SEKIL 1 mevcut bulus ile uyumlu yöntemlerin ve aparatin uygulanabildigi bir sistemin üzerinden baglanan çoklu istem cihazlarini (110) içerebilir. Ag (140) bir yerel alan agi (LAN), bir genis alan agi (WAN), Kamu Telefon Sebekesi (PSTN) gibi bir telefon agi, bir intranet, Internet veya bir ag kombinasyonunu içerebilir. Iki istemci cihazi (110) ve üç sunucu (120 ve 130) basitlik saglamak amaciyla aga (140) bagli olarak gösterilmistir. Uygulamada, daha fazla veya daha az istemci cihazlari ve sunucular olabilir. Ayrica, bazi örneklerde, bir istemci cihazi bir sunucunun fonksiyonlarini yerine getirebilir ve bir sunucu bir istemci cihazin fonksiyonlarini yerine getirebilir.
Istemci cihazlari (110) ana bilgisayarlar, mini bilgisayarlar, kisisel bilgisayarlar, dizüstü bilgisayarlar, kisisel dijital yardimcilar veya benzeri aga (140) baglanabilen cihazlari içerebilir. Istemci cihazlari(110) bir kablolu, kablosuz ve optik baglanti araciligiyla ag (140) üzerinden veri iletebilir veya agdan (140) veri alabilir.
SEKIL 2 mevcut bulus ile uyumlu bir örnek istemci cihazini (110) gösterir. Istemci okunur bellegi (ROM) (240), bir depolama cihazini (250), bir giris cihazini (260), bir çikis cihazini (270) ve bir iletisim arayüzünü (280) içerebilir.
Veri yolu (210) istemci cihazin (110) bilesenleri arasinda iletisime izin veren bir veya daha fazla klasik veri yolunu içerebilir. Islemci (220) yönergeleri yorumlayan ve yürüten herhangi tipte klasik islemci veya mikroislemci içerebilir. Ana bellek (230) bir rastgele erisimli bellek (RAM) veya islemci (220) tarafindan yürütmeye yönelik bilgileri ve yönergeleri depolayan bir baska tip dinamik depolama cihazi içerebilir. ROM (240) klasik bir ROM cihazi veya islemci (220) tarafindan kullanmaya yönelik statik bilgileri ve yönergeleri depolayan bir baska tip statik depolama cihazi içerebilir. Depolama cihazi (250) bir manyetik ve/veya optik kayit ortami ve ilgili sürücüsünü içerebilir.
Giris cihazi (260), bir kullanicinin bir klavye, bir fare, bir kalem, ses algilama ve/veya biyometrik mekanizmalar, vb. gibi istemci cihazina (110) bilgi girmesini saglayan bir veya daha fazla klasik mekanizmalar içerebilir. Çikis cihazi (270) bir ekran, bir yazici, bir hoparlör, vb. içeren kullaniciya bilgi gönderen bir veya daha fazla klasik mekanizma içerebilir. Iletisim arayüzü (280) istemci cihazin (110) diger cihazlar ve/veya sistemler ile iletisim kurmasini saglayan herhangi bir alici benzeri mekanizma içerebilir. Örnegin, iletisim arayüzü (280), ag (140) gibi bir ag üstünden bir baska cihaz veya sistem araciligiyla iletisim kurmaya yönelik mekanizmalar içerebilir.
Asagida daha detayli açiklanacagi üzere, mevcut bulus ile uyumlu istemci cihazlar (110) belirli arama ile ilgili islemleri gerçeklestirir. Istemci cihazlar (110), bu islemleri bellek (230) gibi bir bilgisayarda okunabilir ortamda bulunan yazilim yönergelerini yürüten bir islemci (220) karsisinda gerçeklestirebilir. Bilgisayarda okunabilir bir ortam bir veya daha fazla bellek cihazlari ve/veya tasiyici dalgalari olarak tanimlanabilir.
Yazilim yönergeleri veri depolama cihazi (250) gibi bir baska bilgisayarda okunabilir ortamdan veya iletisim arayüzü (280) araciligiyla bir baska cihazdan bellege (230) okunabilir. Bellekte (230) bulunan yazilim yönergeleri islemcinin (220) asagida açiklanan arama ile ilgili aktiviteleri gerçeklestirmesine neden olur. Alternatif olarak, mevcut bulus ile uyumlu prosesleri uygulamak üzere yazilim yönergelerinin yerine veya birlikte donanimla bütünlesik kullanilabilir. Bu yüzden, mevcut bulus donanim devresi ve yazilimin herhangi bir spesifik kombinasyonu ile sinirli degildir. kurmasini saglamak üzere aga (140) baglanabilen bir ana bilgisayar, mini bilgisayar veya kisisel bilgisayar gibi bir veya daha fazla bilgisayar sistemi tipi içerebilir. Alternatif uygulamalarda, sunucular (120 ve 130) bir veya daha fazla istemci cihazina (110) dogrudan baglanmaya yönelik mekanizmalar içerebilir. Sunucular (120 ve 130) bir kablolu, kablosuz ve optik baglanti araciligiyla ag (140) üzerinden veri iletebilir veya agdan (140) veri alabilir.
Sunucular istemci cihaza (110) yönelik SEKIL 2'ye göre yukarida açiklanan benzer bir sekilde konfigüre edilebilir. Mevcut bulus ile uyumlu bir uygulamada, sunucu (120) istemci cihazlar (110) tarafindan kullanilabilen bir arama motorunu (125) içerebilir.
Sunucular (130) istemci cihazlar (110) tarafindan erisilebilen belgeleri (veya web sayfalarini) depolayabilir.
C. Mimari Çalisma SEKIL 3 örnegin sunucularin (130) birinde depolanabilen üç belgeyi gösteren bir çizelgeyi gösterir.
Bir birinci belge (Belge 1) iki giris--"Car repair" ve "car rental"-- içerir ve altinda "3" olarak sayi ile ifade edilir. Bir ikinci belge (Belge 2) “video rental” girisini içerir. Bir üçüncü belge (Belge 3) üç giris--"wine . champagne” ve "bar items"-- içerir ve Belge Z'ye bir baglanti (veya referans) içerir.
Gösterim basitligi saglamak amaciyla, SEKIL 3'te gösterilen belgeler sadece alfanümerik bilgi dizilerini içerir (örnegin, "car", "repair", “Wine", vb.). Ancak teknikte uzman kisiler diger durumlarda belgelerin fonetik veya görsel isitsel bilgiler gibi diger bilgi türlerini içerebildigini anlayacaktir.
SEKIL 4a, SEKIL 3'te gösterilen belgelere göre klasik bir alfanümerik dizini gösterir.
Dizinin birinci sütunu bir alfanümerik terim listesi içerir ve ikinci sütun bu terimlere karsilik gelen belgelerin bir listesini içerir. Alfanümerik terim “3” gibi bazi terimler sadece bir belgeye karsilik gelir (örnegin görünür)--bu durumda Belge 1. “rental” gibi diger terimler birçok belgeye--bu durumda Belge 1 ve 2'ye karsilik gelir.
SEKIL 4b bir arama motoru (125) gibi klasik bir arama motorunun, bir alfanümerik arama sorgusu karsisinda arama sonuçlari saglamak üzere SEKIL 4a'da gösterilen dizini nasil kullandigi gösterilir. Alfanümerik sorgu herhangi bir klasik teknik kullanilarak olusturulabilir. Gösterme amaciyla, SEKIL 4b iki alfanümerik sorguyu gösterir: "car" ve sorgu alir ve 0 sorguya (adim (420)) karsilik gelen belgeleri belirlemek üzere alfanümerik dizini kullanir. Bu örnekte, klasik bir arama motoru (125) “araba” kelimesinin Belge 1'e karsilik geldigini belirlemek üzere SEKIL 4alda gösterilen dizini kullanacak ve Belge 1'i (ona bir referansi) kullaniciya bir arama sonucu olarak geri verecektir. Benzer bir sekilde, klasik bir arama motoru “sarap" kelimesinin Belge 3'e karsilik geldigini belirleyecek ve Belge 3lü (ona bir referansi) kullaniciya (adim (430)) geri verecektir.
SEKIL 5a, sirasiyla SEKILLER 3 ve 4a'da gösterilen belgelere ve dizine göre, bir nümerik arama sorgusu karsisinda arama sonuçlari saglamaya yönelik tercih edilen bir teknigin bulus ile uyumlu, bir akis çizelgesini gösterir. Kolaylik saglamak amaciyla, SEKIL 5a standart bir telefon ahizesinin eslestirmesine dayanarak bir nümerik tus islemeye yönelik özel bir teknigi açiklar, fakat teknikte uzman kisi bulus ile uyumlu diger tekniklerin kullanilabilecegini anlayacaktir.
Adimda (510) bir dizi “227” ("2", "2" ve "7” nümerik bilesenlerinden olusan) bir kullanicidan alinir. Adimda (520), nümerik bilesenlerin harflere nasil eslestigi hakkinda bilgi elde edilir. Kullanicinin bilgileri standart bir telefon tus takimindan girdigi kabul edildiginde, bu eslestirme bilgileri SEKIL 5b'de gösterilir. SEKIL 5b'de gösterildigi gibi, harflerinin her biri “1” rakamina eslesir, p , q , r ve "s“ harflerinin her biri “7” rakamina eslesir ve benzeri.
Adimda (530), bu eslestirme bilgisini kullanarak, dizi "227” potansiyel alfanümerik esdegerlerine çevrilir. SEKIL 5b7de gösterilen bilgiye dayanarak, asagidakileri içeren, abp, bbp, bar car ccs. Rakamlar olasi kombinasyonlarda yer aldiginda (örnegin, yerine, olusturulan esdegerlerinin bazi sözlüklere göre sinirlanmasi istenebilir. Örnegin, sadece bir sözlükte, önceki arama sorgularinin arama motoru günlügünde ve benzerinde görünen alfanümerik esdegerleri olusturmak veya bilinen istatistiksel teknikleri (örnegin belirli sözcüklerin birlikte görülme olasiligi) kullanarak alfanümerik esdegerleri sinirlamak istenebilir.
Adimda (540) bu alfanümerik es degerler, klasik bir arama motoruna bir mantiksal “OR” islemi kullanarak SEKILLER 4a ve 4b'ye referansta açiklandigi gibi klasik bir arama motoruna bir giris olarak saglanir. Örnegin, arama motoruna saglanan arama sorgusu es degerler arama motoruna saglanabildigi halde, bunun yerine amaçlanmayan es degerlerini ortadan kaldirmak üzere klasik teknikleri kullanarak bir alt set kullanilabilir. Örnegin, harflerin veya sözcüklerin kullanimi hakkinda olasiliksal bilgiden yararlanan teknikleri kullanarak olasi kombinasyonlarin daha dar bir listesini olusturabilir: bir kullanici "qt" ile baslayan kombinasyonlari hariç tutabilir fakat "qu” ile baslayan kombinasyonlari dâhil edebilir (ve tercih edebilir).
Adimda (550), arama sonuçlari arama motorundan elde edilir. Arama motorunun dizininde "aap" ve "abp" gibi terimler görülmediginden, bunlar etkili bir sekilde hariç tutulabilir. Aslinda, SEKIL 4b'de gösterilen dizin içinde sadece “araba” ve “bar” terimleri bulunur ve bu yüzden yalnizca Belgeler 1 ve 3'e referans yapan arama sonuçlari geri verilir. Adimda (560), bu arama sonuçlari kullaniciya sunulur. Arama sonuçlari arama motoru ile saglanan ayni düzende sunulabilir veya kullanicinin dili gibi degerlendirmelere göre tekrar düzenlenebilir. Kullanicinin sadece “bar” terimi içeren belgelerle ilgilendigini kabul ettigimiz takdirde, kullanici istenen sonucun (Belge 1) yani sira istenmeyen bir sonuç (Belge 3) alacaktir. Ancak, arama sorgusunu formüle etmek üzere üç tusa basmak zorunda olmasi nedeniyle kullanicinin yararina olacaktir.
SEKIL 6, sirasiyla SEKILLER 3 ve 4a'da gösterilen belgelere ve dizine göre, bir nümerik arama sorgusu karsisinda arama sonuçlari saglamaya yönelik tercih edilen bir teknigin bulus ile uyumlu, bir diger akis çizelgesini gösterir. Bu akis çizelgesi alinan dizinin boyutunu artirmanin kullanici tarafindan istenen arama sonuçlarini sinirlamaya nasil yardimci olabilecegini gösterir. Gösterim kolayligi saglamak amaciyla, SEKIL 6 standart bir telefon ahizesinin eslestirmesine bagli olarak bir nümerik sorguyu islemeye yönelik özel bir teknigi açiklar, fakat teknikte uzman kisiler bulus ile uyumlu diger tekniklerin de kullanilabilecegini anlayacaktir. bilesenlerinden olusan) bir kullanicidan alinir. Açiklama saglamak amaciyla. dizi “227" bir “rakam sözcügü” olarak adlandirilacak ve tüm dizi "227 48367” bir rakam ifadesi olarak adlandirilacaktir. Bir rakam sözcügünün olasi alfanümerik esdegerleri “harf sözcükleri” olarak adlandirilacak ve bir rakam ifadesinin olasi alfanümerik esdegerleri Adimda (620), nümerik bilesenlerin harflere nasil eslestigi hakkinda bilgi elde edilir.
Ayni eslestirme bilgisinin SEKIL 5b'de gösterildigi gibi kullanildigi kabul edildiginde, SEKIL 5btde gösterilen bilgiye dayanarak, "227 48367” dizisine karsilik gelen olasi harf ifadeleri 11664 bulunur.
Adimda (640), bu harf ifadeleri SEKILLER 4a ve 4b'ye göre açiklananlar gibi bir mantiksal ”OR” islemi kullanilarak klasik bir arama motoruna bir giris olarak saglanir. Örnegin, arama motoruna saglanan arama sorgusu "'aap gtdmp' OR 'aap htdmp' OR saglanabildigi halde, bunun yerine amaçlanmayan es degerlerini ortadan kaldirmak üzere klasik teknikleri kullanarak bir alt set kullanilabilir.
Adimda (650), arama sonuçlari arama motorundan elde edilir. Arama motorlarinin çogu aranan tam ifadeyi içeren belgeleri yüksek düzeyde siralamak üzere tasarlandigindan, Belge 3 muhtemelen en yüksek siralanan arama sonucu olacaktir (baska bir deyisle, olusturulan diger harf ifadelerini içermez. Ayrica, birçok arama motoru tüm Ifade yerine bir ifadenin bazi parçalarini içeren arama sonuçlarini hariç birakilir (veya çikarilir). Örnegin, harf ifadesinin ikinci parçasina karsilik gelen herhangi bir harf içermediginden, harf ifadesinin birinci parçasina karsilik gelen “araba” harf sözcügünü içerdiginden Belge 1 hariç birakilir (veya çikarilir). Son olarak, arama motorunun dizininde görünen hiçbir harf sözcügü içermediginden “aaa htdmp" gibi harf ifadeleri etkili bir sekilde hariç birakilir.
Adimda (660), arama sonuçlari kullaniciya sunulur. Gösterilen örnekte, kullaniciya gösterilen ilk sonuç, kullanicinin sorgusu ile muhtemelen en ilgili olan, Belge 3 olacaktir. Belge 1, olasi harf ifadelerinden birini içermediginden tamamen hariç birakilabilir. Böylece, kullaniciya en ilgili sarama sonuçlari saglanir.
SEKILLER 5 ve 6'ya göre açiklamalar nümerik bilgiyi almaya ve bunu alfanümerik bilgiye eslestirmeye referansla yapildigindan, teknikte uzman kisiler bulus ile uyumlu diger uygulamalarin bulus ile uyumlu olmasinin mümkün oldugunu anlayacaktir. Örnegin, bir kullanici tarafindan basilan tuslara karsilik gelen rakamlarin bir dizisini almak yerine, alinan dizi kullanici tarafindan basilan tuslara karsilik gelen birinci harflerden olusabilir. Bir baska deyisle, "227" ifadesini almak yerine, alinan dizi "aap” olabilir. Bulus ile uyumlu olarak, adimlarda (530 veya 630) olusturulan esdeger harf dizileri "aap" ifadesine karsilik gelen baska harf dizileri (örnegin “bar”) olabilir. Aslinda, alinan dizi fonetik, görsel isitsel veya baska herhangi bir tipte bilgi bileseni içerebilir.
Dizinin alindigi form göz önünde bulundurulmaksizin, genellikle alinan dizinin, genellikle bilginin arama motorunun dizininde depolandigi formata karsilik gelen bir diziye çevrilmesi tercih edilir. Örnegin, arama motorunun dizini alfanümerik dizinde depolandiginda, alinan dizi alfanümerik dizilere çevrilmelidir.
Ayrica, genellikle bilgi bilesenlerinin alinan dizisini çevirmek üzere kullanilan eslestirme tekniginin kullanicinin girisini cihaz tarafindan olusturulan bilgi ile eslestirmek üzere kullanicinin cihazinda kullanilan ayni teknik olmasi tercih edilir. Ancak kullanici girisine yönelik kullanilandan farkli bir eslestirme teknigi kullanmak üzere tercih edilebilir durumlar olabilir. Mevcut bulusun örnekleri hedef olmayan dil klavyelerini kullanarak girilen aramalari yapmasini saglayabilir. Örnegin, Japonca metin içeren bir web sayfasi kanji olarak yazilabilir, 0 sayfayi aramaya çalisan bir kullanici sadece Roma alfabesine dayanan standart bir ASCII klavyesine (veya ahize) erisebilir.
SEKIL 7 bu tür bir aramayi gerçeklestirmeye yönelik bir yöntemi gösterir. SEKIL 7'de gösterildigi üzere, bir kullanici standart bir giris cihazini (örnegin bir ASCII klavyesi, bir telefon ahizesi, vb.) kullanarak bir sorguyu yazar ve sorguyu arama motoruna gönderir.
Sorgu, bazi belgelerin yazildigi (örnegin kanji) karakter setinden farkli bir karakter setinde (örnegin romanji) yazilabilir. Arama motoru sorguyu (blok (702)) alir, onu ilgili forma/formlara (blok (704)) çevirir ve örnegin klasik arama tekniklerini (blok (706)) kullanarak çevrilen sorguya karsilik gelen belgelere yönelik bir arama gerçeklestirir.
Arama motoru sonra kullaniciya (blok (708)) bir belge listesini (ve/veya belgelerin kendilerinin kopyalari) geri verir. Örnegin, sonuçlar yukarida SEKIL 6 ile baglantili açiklananlara benzer bir sekilde geri verilebilir.
SEKIL 7'de gösterildigi üzere, kullanicinin sorgusu, istemcinin aksine, tercihen arama motorunun sunucusunda çevrilir, böylece kullanicinin çeviriyi yapmak üzere özel amaçli yazilim elde etme ihtiyacini hafifletir. Ancak, diger örneklerde, çevirinin bazilarinin veya tamaminin istemcide gerçeklestirilebildigi anlasilacaktir. Ayrica, bazi örneklerde sorgu bir telefon klavyesi gibi bir cihaz kullanarak girilebilir. Bu tür örneklerde, baslangiç, nümerik sorgu ilk olarak örnegin, düsük olasilik eslestirmelerini çikarmak üzere (örnegin romaji'de ortaya çikmayan kombinasyonlari içeren harf eslestirmeleri) bir sözlük ve/veya olasilik tekniklerinin uygulanmasini içeren, SEKILLER 5ve6 ile baglantili olarak yukarida açiklanan eslestirme tekniklerini kullanarak alfanümerik forma (örnegin romaji) dönüstürülebilir. Sorgunun bir alfanümerik çevirisi elde edildiginde, SEKIL 7'de gösterilen adimlarin kalani gerçeklestirilebilir (baska bir deyisle 704, 706 ve 708).
Sorgunun bir karakter seti veya dilinden digerine çevrilmesi (baska bir deyisle, SEKIL 7'deki blok (704)) çesitli sekillerde yapilabilir. Bir teknik sorgudaki her terimi hedef dil veya karakter setindeki ilgili terime eslestirmek üzere kelime anlamlarinin veya çevirilerinin klasik, statik anlamlarini kullanmaktir. Ancak bu yaklasimin bir sorunu, kelimeler çogu zaman belirsiz oldugundan ve sorgular çogu zaman bu belirsizligi çözmeye yönelik yeterli baglamsal ipuçlarina saglamak üzere çok kisa oldugundan siklikla yanlis sonuçlar vermesidir. Örnegin, Ingilizce "bank" sözcügü, bir nehir kiyisi, finansal bir kurulus veya bir uçak tarafindan yapilan manevra anlamlarina gelebilir, bu nedenle de özet kisminda dogru çeviri yapilmasini zorlastirir. Ayrica, sözlük oldukça büyük olmadiginda ve/veya siklikla güncellenmediginde, arama motorunun karsilasabilecegi, seyrek kullanilan sözcükler, argo, deyimler, özel isimler ve benzeri gibi tüm terimlere yönelik girdiler içermeyebilir. Mevcut bulusun örnekleri bir dilden veya karakter setinden (örnegin ASCII) digerine (örnegin kanji) sorgu terimlerini çevirmek üzere bir olasiliksal sözlük kullanarak bu sorunlarin bazilari veya tamami çözülebilir veya düzeltilebilir. Tercih edilen bir örnekte olasiliksal sözlük bir terim setini bir diger terim setine eslestirir ve bir olasiligi eslestirmelerin her biri ile iliskilendirir. Uygunluk saglamak amaciyla, bir “terim” veya “jeton” sözcüklere, ifadelere ve/veya (daha genellikle) bosluklar içerebilen bir veya daha fazla karakter dizisine refere edecektir.
SEKIL 8 yukarida açiklanan gibi bir olasiliksal sözlügün (800) bir örnegini gösterir.
SEKIL 8'de gösterilen örnek olasiliksal sözlük (800) romaji (Japoncanin Roma alfabesinde bir ifadesi) olarak yazilan sözcükleri kanji (Roma olmayan, kavram yazi tabanli Japonca karakter seti) olarak yazilan sözcükler ile eslestirir. Açiklamayi kolaylastirmak üzere, SEKIL 8romaji terimleri liromaji ve kanji terimleri Ingilizce çevirilerin yerine gerçek romaji ve kanji sözcüklerinin kullanilacagi anlasilacaktir. Bu nedenle, SEKIL 8tin, Japonca metnin gerçek karakterlerini ve anlamini göstermek üzere degil mevcut bulusun düzenlemelerinin bir açiklamasini kolaylastirmak üzere saglandigi anlasilacaktir.
Ayrica sözlük bu tür ifadenin dogru olduguna iliskin bir ilgili olasilik (806) ile birlikte, kanji (804) olarak yazilan bu terimlerin her birinin olasi ifadelerini içerir. Örnegin, romaji terimi olarak yazilan Ingilizce "bank" sözcügü, 0.3 olasiligi ile “dik yamaç” kanji terim anlamina, 0.4 olasiligi ile “finansal kurulus" terim anlamina ve 0.2 olasiligi ile “bir uçak tarafindan yapilan manevra” terim anlamina eslesebilir. 0.1 olasiligi ile, terim, her terimi sözlükte bulunmayabilen terimlere eslestirmeyi saglayan bir genel yöntem olan “diger” ile eslesebilir.
Ayni sekilde, SEKIL 8'de gösterilen örnegin, bir birinci karakter seti veya dilindeki belirli bir terimin (örnegin “banka” kelimesi) bir baska karakter setinde veya dilinde birden fazla terime eslesebilecegini göstermek üzere olusturuldugu anlasilacaktir. Ancak teknikte uzman bir kisi, açiklik saglamak amaciyla, SEKIL 8'deki belirli örnek bu ilkeyi Ingilizce sözcükleri ve anlamlarini kullanarak gösterir, “bank" sözcügünün gerçek romaji ifadesi, örnegin, Ingilizce esdegeri (örnegin bir mali kurulusa iliskin sözcük ile bir uçak tarafindan yapilan manevraya yönelik sözcük arasinda hiçbir belirsizlik olmayabilir) ile ayni sekilde belirsiz olmayabilir. Ayrica açiklamayi kolaylastirmak amaciyla, SEKIL 8'de gösterilen sözlük diger açilardan da basitlestirilmistir. Örnegin bir gerçek olasiliksal sözlük her terime yönelik daha birçok olasi eslestirme içerebilir veya sadece önceden belirlenmis olasilik esigini asan eslestirmeler içerebilir.
Mevcut bulusun tercih edilen örnekleri bir dil ve/veya karakter setindeki sorgulari bir diger dile ve/veya karakter setine çevirmek üzere bir olasiliksal sözlük kullanir, böylece kullanicilarin orijinal sorgu yerine farkli bir karakter setinde ve/veya dilinde yazilan belgeleri bulmasini saglar. Örnegin, kullanici romaji olarak yazilan "cars" kelimesine yönelik bir sorgu girdiginde, olasiliksal sözlük "cars" romaji terimini örnegin "cars” kanji terimi ile eslestirmek üzere kullanilabilir. Böylece, sorgularin (örnegin romaji) karakter seti ve eslesen belgelerin (örnegin kanji) karakter seti ayni olmadiginda kullanicilar sorgulari ile ilgili belgeler bulabilir. Bu belirli örnekte, sorgunun gerçek dili degismez (Japoncayi ifade etmek üzere hem romaji hem de kanji kullanilir), sadece karakter kodlamasi degisir.
Yine bir diger olarak, ASCII ingilizcede “tired" sözcügü, umlaut-u karakteri ASCIl'de bulunmadigindan, Latin 1 karakter kodlamasini kullanan Almanca "müde” terimin eslesebilir. Bu örnekte sözlügün hem bir baska dile çeviri (Ingilizce ile Almanca) hem de bir baska karakter kodlamasina (ASCII ile Latin 1) bir çeviri saglar.
Tercih edilen düzenlemelerde. yukarida açiklanan eslestirme sözlügü istatistiksel sözlükler ile baglantili ag üzerinde bulunan bilgiyi kullanarak otomatik bir sekilde olusturulur. Tercih edilen düzenlemeler dogru çevirilere ulasmak üzere farkli dillerde ve/veya karakter setlerinde yazilan paralel, hizalanmis çift dilli korpora kullanir. Bu veriyi kullanarak, tercih edilen düzenlemeler olasi sözcük eslesmelerinin bir sözlügünü olusturabilir. Bu örnegin, dildeki (Si) (kaynak dil) bir simgenin ayni zamanda hizalanmis metin çiftinde (örnegin baglantilar, cümleler, vb.) bir simge (Tj) (hedef dil) ortaya çikma sayisini sayarak kolaylikla yapilabilir. Ancak herhangi bir uygun teknigin kullanilabilecegi anlasilacaktir.
Yeterince büyük ve dogru hizalanan veri setleri bulunmadiginda, bu yöntem oldukça belirsiz çok-çok eslesmeleri olusturabilir. Bu nedenle, örnegin 81'in biraz olasilikla T2, T3, T7 ve Tab eslesebildigi belirlenebilir. Ancak, bu kabul edilebilir ve asagida daha detayli açiklandigi gibi, örnegin önceki kullanici sorgularini, sonuçlarin sayfasindaki ögelerin kullanici seçimini ve/veya benzerini inceleyerek her eslestirmenin ilgili olasiligini artirmak üzere ek gelistirmeler yapilabilir.
SEKIL 9 bir olasiliksal sözlük olusturmak üzere paralel baglanti metninin kullanimini gösterir. Baglanti metni web sayfalari (veya belirli bir web sayfasi içindeki konumlar) arasinda bir üst baglanti ile iliskili metni içerir. Örnegin, hiper metin isaretleme dilinde (HTML),komut asagidaki gibidir: "Banks and Savings and Loans", http://www.abc.com adresinde bulunan web sayfasina isaret eden bir üst baglanti olarak "Banks and Savings and Loans" ifadesinin görüntülenmesine neden olur. "Banks and Savings and Loans" metni baglanti metni olarak adlandirilir ve tipik olarak isaret ettigi web sayfasina (örnegin www.abc.com) kisa bir açiklama saglar.
Aslinda, baglanti metni çogu zaman sayfanin kendisinden daha dogru bir açiklamasini saglayacaktir ve dolayisiyla isaret ettigi web sayfasinin dogasini belirlemede özellikle yararli olabilir. Ayrica, baglanti metnindeki sözcük kullanimi ve dagilim çogunlukla kullanici sorgularinda bulunan içerige ve uzunluga yakindir. Bu durumda belirli bir sayfaya isaret eden baglantilarin birçogunun ayni veya büyük ölçüde benzer metni içerecektir. Örnegin, www.google.com'a isaret eden baglantilar çogu zaman “Google” kolaylikla diyecektir veya bu terimi diger metin ile birlikte kullanacaktir. Bu yüzden, katakana gibi tamamini inceleyerek, www.google.com'a isaret eden baglantilar, arayarak oldukça yüksek derecede bir güven ile sonuç verebilir (muhtemelen “click here” ifadesini içerenler gibi, belirli önceden tanimlanmis, düsük bilgi-içerikli baglantilari çikardiktan sonra). Mevcut bulusun tercih edilen örnekleri dogru çeviriler saglamak üzere baglanti metninin bu karakteristik özelliklerinden yararlanir.
SEKIL 9'a refere edildiginde, bir birinci karakter setinde (örnegin ASClI) (blok 902) yazilan bir terimi içeren bir sorgunun alinmasindan sonra, sunucu terimin göründügü bir baglanti metni setini belirler (blok 904). Örnegin, sunucu terimi içeren bu baglantilari belirlemek üzere tüm bilinen baglantilarin bir dizinini inceleyebilir. Sonra, bu baglanti noktalarinin belirlendigi (blok (906)) web sayfalari, bu sayfalara (blok (908)) isaret eden hedef dil veya hedef karakter setinde (örnegin hiragana, katakana ve/veya kanji) yazilan tüm baglantilar gibidir. Sistem bu noktada iki belge setine sahip olacaktir (burada baglanti metni bir belge formu olarak degerlendirilir). Bir belge setindeki (örnegin orijinal ASCII sorgusunu içeren baglantilar) sorgu teriminin dagilimi sonra diger belge setindeki (örnegin paralel baglantilar) çevrilen ifadeye yönelik en olasi adaylari belirlemek üzere kullanilir. Istatistikler baglanti metni terimlerinin göründügü sikliga göre yapilabilir ve bu istatistikler orijinal sorgunun (blok (910)) dogru çevirisi olan baglanti metninde bulunan terimlerin ilgili sikliklarini ve olasiliklarini belirlemek üzere kullanilabilir. Çoklu kelimeleri olan sorgularda, her sözcüge yönelik olarak yukarida açiklanan proses tekrar edilebilir veya tüm sorgu tek bir terim olarak islenebilir veya bazi uygun sözcük gruplari kullanilabilir. Örnegin, sorgu “büyük evler” oldugunda, olasi çevirilerin bir sözlügü o ifadeyi (veya ifadedeki sözcüklerden en azindan birini) içeren hizalanmis baglanti metnini bularak olusturulabilir. Ayni sekilde, sorgu ikiden fazla terim içerdiginde, uygun bir eslestirme belirlemeye yönelik çalismalar sorgu terimlerinin uygun alt setlerini toplayarak ve bu terimlere iliskin sonuçlara olusturarak olusturulabilir.
Bir çeviriyi SEKIL 9'da gösterildigi gibi yapmanin bir avantaji, çeviri sisteminin bir dil veya karakter seti ile hedef setindeki terimler arasindaki eslestirmelerin önceden bilgisine sahip olmasi gerekmez. Bunun yerine, eslestirmeler istatistiksel analiz yapmak üzere bulunan verinin gövdesinde dinamik olarak belirlenebilir. Bu yüzden, örnegin bir klasik statik sözlügü koruma çalismasina veya harcamasina girmeden argo terimlere, deyimlere, özel isimlere ve benzerine yönelik dogru çeviriler bulmak mümkün hale gelecektir. Önceki çeviri tekniklerinin bir açiklayici örnegi bu noktada SEKILLER 10-12 ile baglantili olarak açiklanacaktir. Bu örnekte, kullanicinin “house" sorgu terimini girdigi ve Ispanyolca yazilan arama sonuçlarini elde etmek istedigi kabul edilir. Dolayisiyla sunucu Ingilizce ” house” terimini Ispanyolca esdegerine çevirmeye çalisacaktir. iliskili baglantili metni Ingilizce yazilir (baska bir deyisle 959a-e ve 963a-t) ve bazilari Ispanyolca yazilir (baska bir deyisle sayfalar 961a-e ve 965a-j). Sunucu ilk olarak depolanan baglanti metninin bir dizinini arayarak yerlestirilebilir. Bu tür bir dizini kullanarak, sunucu ilk olarak her biri “big house” ifadesini kullanan ve web sayfasina (972) isaret eden bes baglantiyi (960) bulabilir. Sunucu sonra sayfaya (972) isaret eden bes hedef dil (baska bir deyisle Ispanyolca) baglantisi (962) oldugunu da belirler.
SEKIL 10'da gösterilen örnekte bu baglantilar "casa grande” metnini içerir. Ayni sayfaya veya buna önceden tanimlanmis iliskiye dayanan sayfalar isaret eden baglantilar (baglantilar (960) ve baglantilar (962) gibi) ”hizalanmis” olarak Ifade edilir, burada daha gen bir açidan, hizalanma tipik olarak hizalanmis ögelerin esdegerine SEKIL 11A her hedef dil teriminin hedef dil baglantilarinda (962) görülme sikligini gösterir. SEKIL 11A'da gösterildigi gibi, "casa" ve "grande” terimlerinin her biri bes defa görünür (baska bir deyisle her baglantida (962) bir defa). Bu yüzden, hedef baglantilarda (962) (baska bir deyisle bes baglantinin her birinde iki terimi) görünen toplam on terimden “casa” yarisina ve “grande” diger yarisina karsilik gelir. Dolayisiyla, SEKIL 11A'da gösterildigi üzere, bu noktada "house" terimi, her iki terim de esit siklikla göründügünden "casa" veya "grande“ terimine esit siklik ile eslesebilir.
Ancak, SEKIL 10'da gösterildigi üzere, sistem ayrica "house" terimini içeren ve sayfaya (974) isaret eden yirmi Ingilizce baglanti (964) ve "casa" terimini içeren ve ayni zamanda sayfaya (974) isaret eden en Ispanyolca baglanti (966) bulur. SEKIL 11B'de gösterildigi üzere, bu noktada "house" terimi 0.75 (baska bir deyisle 15/20) ve "grande" terimi 0.25 olasilik (baska bir deyisle 5/20) ile eslesecektir. Bu olasiliklar hedef dil baglantisinda (baska bir deyisle “casa” örnegin on bes) her terimin toplam ortaya çikma sayisini hedef dil bagIantisindaki-kopyalari-içeren-terimlerin toplam sayisina (baska bir deyisle yirmi terim: baglantilarda (962) yer alan on ve baglantilarda (964) yer alan on) kolaylikla bölünmesi ile hesaplanabilir. Alternatif olarak veya bunun yani sira, belirli bir çeviri veya eslestirmenin olasiliklarini hesaplamak ve/veya iyilestirmek üzere baska teknikler kullanilabilir. Örnegin, teknikte uzman kisi Bayes yöntemi, histogram düzeltme, kernel düzeltme, çekme tahmin edicileri ve/veya diger tahmin teknikleri gibi olasilik tahminlerinin varyans hatasini azaltmaya yönelik olarak çesitli iyi bilinen tekniklerin kullanilabilecegini anlayacaktir.
Daha fazla baglanti metni bulundugunda, olasiliklar daha da iyilestirilebilir. Örnegin, son bir olasilik dagilimi SEKIL 12'de gösterilene benzer olabilir, burada “house" oldukça yüksek bir olasilik ile “casa” ve daha küçültmeli formu "casita" ve "casino" ve terimler ile eslesir. Bu yüzden, çevrilen dillerin ve/veya karakter setlerinin bilgisi olmadan benzer es anlamlarin yani sira dogru bir çeviri elde edilebilir.
Sorgu terimler çevrildikten sonra, sunucu artik bu noktada çeviriyi kullanarak bir arama yapabilir. Örnegin, bir kullanici "hotels in Kyoto” ifadesine yönelik bir romaji sorgusunu girecek oldugunda, sunucunun bu sorgulari kullanarak sorgunun katakana, hiragana ve kanji formlarinda sonuç vermesini saglamak, bu sorgulari kullanarak aramalar yapmak üzere ve sonra kullaniciya bir ilgili kullanici arayüzü içinde bu sorgu formlarinin her birine yönelik kombine sonuçlar sunmak üzere yukarida açiklanan teknikler kullanilabilir.
SEKILLER 10-12 ile baglantili açiklanan örnegin sadece gösterim amaciyla saglandigi ve sinirlama olmaksizin burada gösterilen yönteme birçok degisiklik yapilabilecegi anlasilmalidir. Örnegin, farkli istatistiksel teknikler olasiliklara ulasmak üzere kullanilabilir ve yukarida açiklanan temel tekniklerde degisiklikler yapilabilir. Ayni sekilde, yukarida açiklanan çeviri tekniginin kullanicilar tarafindan girilen sözcüklerin veya ifadelerin çevirilerini gerçeklestirmek üzere kolaylikla kullanilabilir ve bir iliskili Internet aramasini yapmak veya bir olasiliksal sözlük olusturmak üzere kullanilmasi gerekmez. Ayrica, önceki örnek çeviri prosesini bir kullanicinin sorgusu alindiktan sonra gerçeklesiyor olarak açiklamasina ragmen, diger örneklerde eslestirme prosesi kullanici sorgusu alinmadan önce gerçeklestirilebildigi anlasilmalidir. Bu tür önceden hesaplanan eslestirmeler SEKIL 8'de açiklandigi gibi, alindiklari gibi kullanici sorgularini çevirmek üzere uygulanabilir. Son olarak, hizalanmis baglanti metninin çeviriyi yapmak üzere kullanilabildigi anlasilmalidir. Örnegin, hizalanmis cümleler veya diger veriler benzer bir sekilde kullanilabilir. Birçok ülkede birden fazla resmi veya kabul edilen dil bulunur ve gazeteler ve dergilerin çogu zaman bu dillerin her birinde yazilan ayni makaleyi içerecektir. Bu paralel geçisler, sözcük çevirilerinin olasilik sözlüklerini hazirlamak üzere Önceden açiklanan baglanti metni ile ayni sekilde kullanilabilir.
Bu nedenle, tercih edilen örnekler kullanicilarin sorgulari ve/veya çeviri taleplerini uygun bir sekilde (örnegin bir ASCII klavyesini kullanarak) girmesini ve dogru ve otomatik bir çeviri ve arama saglamasini olanakli kilar. Bazi örneklerde yukarida açiklanan model ek iyilestirmeler yapilabilir. Örnegin, bazi örneklerde, orijinal sorguda ve/veya diger hizalanmis baglantilardaki terim sayisina benzer bir dizi terim içeren baglantilara bir tercih (agirlik) verilebilir. Örnegin, SEKIL 10`da gösterildigi üzere, orijinal sorgu gibi, her biri tek bir terim içerdiginden sayfaya (974) isaret eden baglantilar tercih edilebilir. Ayni sekilde, “la casa grande” metnini içeren bir baglanti ayrica sayfa 972'ye isaret ettiginde, hizalandigi diger baglantilardan daha fazla terim (baska bir deyisle 3), içerdiginden onun agirligi bir ilgili faktör ile azaltilabilir. Bu tür bir agirlik semasi, bu baglantilarin terimleri ile iliskili sikliklari uygun bir faktör ile çarparak SEKIL 11B'de gösterilen olasilik hesaplamasinda yansitilabilir.
Yukarida açiklanan gibi çeviri prosesi ayrica aramanin kendisinin etkililigini gelistirmek üzere kullanilabilir. Örnegin, olasiliksal sözlük hareket halindeki sorgulari örnegin orijinal sorgu terimlerinin çesitli çevirilerini ve es anlamlarini içerecek sekilde genisletmek üzere kullanilabilir. Kullanici sorgularini belgeyi almadan önce genisletmek üzere, ayni kavramlara yönelik es zamanli aramalar gerçeklestirilebilir, böylece arama sonuçlarinin kullanicinin aramasini içerecegine Iliskin olasiligi artirir. Alternatif olarak veya bunun yani sira, olasiliksal sözlük, belge terimlerinin genislemelerini saglayan normal belge dizini olusturma prosesini desteklemek üzere kullanilabilir. Örnegin, bir belgede bulunan terimler olasiliksal sözlükten çeviriler olan belge dizininde desteklenebilir, böylece belgenin orijinal belgede bulunan ayni terimleri tam olarak kullanmayan aramalar ile esit olarak konumlandirilma olasiligini artiracaktir.
Yukarida açiklanan çeviri tekniklerini kullanirken ortaya çikabilen bir sorun veri seyrekligi (örnegin sonuçta "casa" teriminin "house” ile eslesmesini belirlemek üzere yeterli) veya veri bulunmamasi nedeniyle (örnegin baglantilarin tümü ayni seyi ifade eder), sistem yeterince dogru olasiliksal eslestirmelere ulasamayabilir. Bu nedenle, bazi örneklerde olasiliksal eslestirmeler kullanici davranisini inceleyerek daha da gelistirilebilir. Birçok ömekleyici teknik asagida açiklanir. Örnegin, bir kez daha sunucunun“ev” terimine yönelik bir çeviri elde etmek istedigini kabul edelim. Ancak, bulunabilen tek sadece baglanti metninin “big house” ifadesini veya “oasa grande” ifadesini içerdigini kabul edelim. Baglanti metninde çesitlilik bulunmamasi nedeniyle, olasiliksal sözlük asagidaki eslestirmelerde sonuçlanabilir: house -› casa, 0.5 olasilik house -› grande, 0.5 olasilik big -› casa, 0.5 olasilik big -› grande, 0.5 olasilik grande -› house, 0.5 olasilik grande -› big, 0.5 olasilik casa -› house, 0.5 olasilik casa -› big, 0.5 olasilik Bir kullanicinin bu noktada arama motorunu “casa” terimi ile aradigini düsünelim. Bu noktada, arama motoru “casa” terimini içeren ve ayrica sadece “house” terimini içeren N sonuçlarinda karistiran sayfalari ve sadece ”big” terimini içeren M sonuçlarini geri verebilir. Uygulamada, N ve M eslestirmelerin temeldeki olasiliklarini göz önünde tutmak üzere ayarlanabilir, bu yüzden oldukça benzemeyen eslestirmeler daha az sonucun görüntülenmesiyle sonuçlanacaktir. Kullanicilarin sadece “big" terimini içeren sonuçlara tikladigindan on kat daha fazla “house” terimini içeren sonuçlara tikladiginda, eslestirmelerin olasiliklari örnegin asagidaki gibi ayarlanabilir: house -› casa, 0.9 olasilik house -› grande, 0.1 olasilik big -› casa, 0.1 olasilik big 4 grande, 0.9 olasilik grande -› house, 0.1 olasilik grande -› big, 0.9 olasilik casa -› house, 0.9 olasilik casa a big, 0.1 olasilik Gerçek sayilarin, tiklamalari hesaba katilmis kullanici sayisi, her iki terimi içeren sayfadaki tiklama sayisi, sonuç seti içindeki söz konusu terimleri içeren sonuçlari yerlestirme ve/veya benzeri gibi çesitli faktörlere bagli olabildigi unutulmamalidir. Bu örnekte (baska bir deyisle 0.1 ve 0.9) verilen ayarlanmis olasiliklarin sadece açiklama amaçlarina yönelik verildigi unutulmamalidir. Teknikte uzman bir kisi yukarida açiklanan gibi kullanici geri bildirimine verilen gerçek agirligin herhangi bir uygun sekilde uygulanabilecegini anlayacaktir.
Ayrica kullanici geri bildiriminin kullaniminin açiklamasini kolaylastirmak üzere basitlestirilmis oldugu unutulmamalidir. Örnegin, bazi sistemlerde, belirli bir çeviriyi yapmada yardimci olmak üzere diger çevirilerden elde edilen bilgiden yararlanmak mümkün olacaktir. Örnegin, yukarida verilen örnekte, “house” terimi sadece “big house” geçen baglanti metninde göründügünde bile, “house" teriminin “grande” teriminden daha fazla “casa” terimi ile uygun bir sekilde eslestigini belirlemek halen daha mümkün olabilir. Örnegin, çok yüksek olasiligi ve yeterince fazla veri setinden fazla “big” teriminin “grande” terimine eslestigi önceden belirlenmis oldugunda (ve baglanti metninin nadiren bir es anlamli listesinden olustugu kabul edildiginde), baglantilar “house” veya “casa” etkisiz oldugunda bile, bu durumda house-to-casa eslestirmesi yine de house-to-grande eslestirmesine tercih edilebilir.
Ayrica çevirinin dogrulugu ve/veya arama sonuçlarinin yararliligi kullanicinin sorgu oturumu geçmisini inceleyerek gelistirilebilir. Örnegin, çogu durumda sistem kullanicinin girdigi önceki sorgulari (örnegin bir kullanicinin hesabinda depolanan çerezler veya bilgiler araciligiyla) bilecektir. Geçmis verisi bu kullanicidan olasi sorgu anlamlarini siralamak üzere kullanilabilir, böylece “bank” ifadesinin balik tutma ile ilgili sorgularinin belirsizligini uçma ile ilgili olanlardan potansiyel olarak ortadan kaldirir.
Böylece, bu proses olasi çeviri setini daraltmak üzere kullanilabilir. Bazi düzenlemelerde, sistem kullanici arayüzünde "Did you mean to search for X" gibi bir mesaj ile baglantili olarak görüntüleyerek bunlari önerebilir, bununla beraber ayrica olasi formülasyonlarin her birinde az sayida sonucu sonuçlarin ilk sayfasinda potansiyel olarak gösterir. Bir kullanici "did you mean ekrani ile önerilen alternatiflerin birini veya sonuçlar sayfasinda verilen sonuçlardan birini seçtiginde, sistem kullanicinin olasi arama sapmasinin yani sira sorgu sözcügünün(sözcüklerinin) olasi çeviriler hakkinda ek kanit elde edecektir. Bu sinyallerin her ikisi de kullaniciya özgü durumun yani sira genel durumdaki terim eslestirmelerine yönelik olasilik puanlarini (örnegin olasiliksal sözlük) güncellemek üzere sistem tarafindan kullanilabilir.
D. Sonuç Yukarida daha detayli açiklandigi gibi, bulus ile uyumlu yöntemler ve sistemler terimleri karakter setine ve/veya dillere çevirmek üzere belirsiz arama sorgulari karsisinda arama sonuçlari saglamak üzere kullanilabilir. Çesitli çeviri ve arama teknikleri ve sistemleri açiklanmistir. Ancak, önceki açiklamanin gösterim amaciyla sunulmus oldugu ve yukaridaki ögretilerin isiginda birçok modifikasyonun ve varyasyonun veya bulusun uygulanmasi yoluyla mümkün oldugu anlasilacaktir. Örnegin, önceki açiklama bir istemci-sunucu mimarisine dayanmasina ragmen, teknikte uzman kisiler bulus ile uyumlu bir uçtan uca mimarinin kullanilabilecegini anlayacaktir. Ayrica, açiklanan uygulama yazilim içermesine ragmen, bulus donanim ve yazilimin bir kombinasyonu halinde veya sadece bir donanimda uygulanabilir. Ayrica, mevcut bulusun açilari bellekte depolanmis olarak açiklanmasina ragmen, teknikte uzman bir kisi bu açilarin sabit diskler, disketler, CD-ROM gibi sekonder depolama cihazlari gibi bilgisayarda okunabilir diger ortam türlerinde, Internetten bir tasiyici dalga veya diger RAM veya ROM formlarinda depolanabilecegini anlayacaktir. Dolayisiyla bulusun kapsami istemler ve bunlarin esdegerleri ile belirlenecektir.

Claims (1)

  1. ISTEMLER Bilgisayar tarafindan uygulanan bir yöntem olup özelligi asagidakileri içermesidir: bir birinci formatta yazilan en az bir sorgu terimini içeren bir sorgu alma; sorgu terimini bir olasiliksal sözlügü (800) kullanarak bir ikinci formatta yazilan birçok varyanta çevirme, olasiliksal sözlük birinci formattaki bir terim setini (802) ikinci formattaki bir diger terim setine (804) eslestirir ve bir olasiligi (806) eslestirmelerin her biri ile eslestirir; ve sorguya karsilik gelen ikinci formatta yazilan bilgiye yönelik arama yapmak üzere bir veya daha fazla varyant kullanma; ve olasiliksal sözlükteki (800) olasiliklari (806) bir kullanicinin arama sonuçlari ile etkilesimini kullanarak güncelleme. Istem 1'e göre yöntem olup, özelligi ayrica asagidaki adimlari içermesidir: kullanicidan önceki sorgulari kullanarak sorgunun olasi anlamlarini siralama. Istem 1'e göre yöntem olup özelligi ayrica asagidaki adimlari içermesidir: bir mesaj önerme alternatifleri ile baglantilari olarak bir kullanici arayüzünde bir olasi çeviri setinde görüntüleme, bununla beraber olasi çevirilerden bir dizi sonuç görüntüleme, burada kullanici önerilen alternatiflerden birini veya görüntülenen sonuçlardan birini seçtiginde olasiliklar (806) güncellenir. Istem 1'e göre yöntem olup, özelligi güncellemenin kullanicinin sonuçlara tiklamasina bagli olmasidir. Istem 1'e göre yöntem olup, özelligi eslestirmenin sorgu alinmadan önce gerçeklesmesidir. Istem 1'e göre yöntem olup, özelligi terimin ikinci formatta bir veya daha fazla varyant olasiligi ile eslesmesidir. Istem 1'e göre yöntem olup, özelligi olasiliksal sözlügün (800) arama gerçeklesmeden önce varyantlari bir üçüncü formata çevirmek üzere ayrica kullanilmasidir. Istem 1”e göre yöntem olup, özelligi sorgunun bir telefon tus takimindan girilen bir nümerik sorgu olmasi, ikinci formatin alfanümerik metin olmasi, çevirinin asagidakileri içermesidir: sorgu terimini birinci formattaki potansiyel alfanümerik çeviriler grubuna çevirme; önceden tanimlanmis düsük olasilikli karakter kombinasyonlarini içermek üzere belirlenen potansiyel alfanümerik çevirilerin bir veya daha fazlasini çikarma; kalan potansiyel alfanümerik çevirileri birinci formattan ikinci formatta yazilan çok sayida varyanta bir olasiliksal sözlügü kullanarak çevirme; varyantlarin bir veya daha fazlasini kullanma asagidakini içerir: alfanümerik çevirileri kullanarak ikinci formatta bir arama yapma. Istem 1'e göre yöntem olup, özelligi birinci formatin bir telefon tus takimindan girilen bir rakam dizisini içermesidir; ve burada ikinci format alfanümerik metni Istem 1'e göre yöntem olup, özelligi ayrica asagidaki adimlari içermesidir: önceden tanimlanmis bir sözlügün parçasi olmayan çok sayida varyanttaki varyantlari çikararak bir veya daha fazla varyant elde etme. Istem 1'e göre yöntem olup, özelligi ayrica asagidaki adimlari içermesidir: önceden tanimlanmis düsük olasilikli karakter kombinasyonlarini içeren çok sayida varyanttaki varyantlari çikararak bir veya daha fazla varyant elde etme. Istem 1'e göre yöntem olup, özelligi birinci formatin romaji, romaja ve pinyin'den olusan gruptan seçilen bir karakter setinde yazilan alfanümerik metni içermesi; ve burada ikinci formatin kanji, katakana, hiragana, hangul. hanja ve geleneksel Çince karakterlerden olusan gruptan seçilen bir karakter setinde yazilan Istem 8'e göre yöntem olup, özelligi birinci formatin romaji, romaja ve pinyin'den olusan gruptan seçilen bir karakter setinde yazilan metni içermesi; ve burada ikinci formatin kanji, katakana, hiragana, hangul, hanja ve geleneksel Çince karakterlerden olusan gruptan seçilen bir karakter setinde yazilan metni içermesidir. Bir bilgisayarda okunabilir ortamda bulunan bir bilgisayar program ürünü olup, özelligi bilgisayar programi ürününün, bilgisayar sisteminin yöntemler 1 ila 13'ten herhangi birine göre islemler gerçeklestirmesine neden olmak üzere çalistirilabilen yönergeler içermesidir.
TR2018/16343T 2003-09-30 2004-09-13 Farklı bir karakter setinde yazılmış sorguları ve/veya farklı sayfalardan dili kullanarak aramaya yönelik sistemler ve yöntemler. TR201816343T4 (tr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/676,724 US8706747B2 (en) 2000-07-06 2003-09-30 Systems and methods for searching using queries written in a different character-set and/or language from the target pages

Publications (1)

Publication Number Publication Date
TR201816343T4 true TR201816343T4 (tr) 2018-11-21

Family

ID=34422117

Family Applications (1)

Application Number Title Priority Date Filing Date
TR2018/16343T TR201816343T4 (tr) 2003-09-30 2004-09-13 Farklı bir karakter setinde yazılmış sorguları ve/veya farklı sayfalardan dili kullanarak aramaya yönelik sistemler ve yöntemler.

Country Status (13)

Country Link
US (3) US8706747B2 (tr)
EP (3) EP2388709B1 (tr)
JP (4) JP4717821B2 (tr)
KR (4) KR101140187B1 (tr)
CN (2) CN102236702B (tr)
AT (1) ATE426206T1 (tr)
DE (1) DE602004020086D1 (tr)
ES (1) ES2323786T3 (tr)
HK (1) HK1163846A1 (tr)
PL (1) PL2388709T3 (tr)
RU (1) RU2363983C2 (tr)
TR (1) TR201816343T4 (tr)
WO (1) WO2005033967A2 (tr)

Families Citing this family (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7136854B2 (en) * 2000-07-06 2006-11-14 Google, Inc. Methods and apparatus for providing search results in response to an ambiguous search query
US8706747B2 (en) 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
US9009590B2 (en) * 2001-07-31 2015-04-14 Invention Machines Corporation Semantic processor for recognition of cause-effect relations in natural language documents
CA2371731A1 (en) * 2002-02-12 2003-08-12 Cognos Incorporated Database join disambiguation by grouping
US8055669B1 (en) * 2003-03-03 2011-11-08 Google Inc. Search queries improved based on query semantic information
US7917483B2 (en) * 2003-04-24 2011-03-29 Affini, Inc. Search engine and method with improved relevancy, scope, and timeliness
JP2007514249A (ja) * 2003-12-16 2007-05-31 スピーチギア,インコーポレイティド 翻訳機データベース
US20050138007A1 (en) * 2003-12-22 2005-06-23 International Business Machines Corporation Document enhancement method
US20060047649A1 (en) * 2003-12-29 2006-03-02 Ping Liang Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation
US8825591B1 (en) * 2003-12-31 2014-09-02 Symantec Operating Corporation Dynamic storage mechanism
US8655904B2 (en) * 2004-02-11 2014-02-18 Ebay, Inc. Method and system to enhance data integrity in a database
US7487145B1 (en) 2004-06-22 2009-02-03 Google Inc. Method and system for autocompletion using ranked results
US7836044B2 (en) 2004-06-22 2010-11-16 Google Inc. Anticipated query generation and processing in a search engine
US8392453B2 (en) 2004-06-25 2013-03-05 Google Inc. Nonstandard text entry
US8972444B2 (en) 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
CN101091155B (zh) * 2004-06-29 2012-11-28 布莱克·布克斯塔夫 用于自动智能电子广告的方法和系统
US7895218B2 (en) 2004-11-09 2011-02-22 Veveo, Inc. Method and system for performing searches for television content using reduced text input
US7499940B1 (en) 2004-11-11 2009-03-03 Google Inc. Method and system for URL autocompletion using ranked results
US20060106769A1 (en) * 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters
US8122034B2 (en) 2005-06-30 2012-02-21 Veveo, Inc. Method and system for incremental search with reduced text entry where the relevance of results is a dynamically computed function of user input search string character count
US10735576B1 (en) * 2005-07-14 2020-08-04 Binj Laboratories, Inc. Systems and methods for detecting and controlling transmission devices
US7788266B2 (en) 2005-08-26 2010-08-31 Veveo, Inc. Method and system for processing ambiguous, multi-term search queries
US7779011B2 (en) 2005-08-26 2010-08-17 Veveo, Inc. Method and system for dynamically processing ambiguous, reduced text search queries and highlighting results thereof
US7737999B2 (en) 2005-08-26 2010-06-15 Veveo, Inc. User interface for visual cooperation between text input and display device
US7672831B2 (en) * 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
US7805455B2 (en) * 2005-11-14 2010-09-28 Invention Machine Corporation System and method for problem analysis
US7644054B2 (en) 2005-11-23 2010-01-05 Veveo, Inc. System and method for finding desired results by incremental search using an ambiguous keypad with the input containing orthographic and typographic errors
US7895223B2 (en) * 2005-11-29 2011-02-22 Cisco Technology, Inc. Generating search results based on determined relationships between data objects and user connections to identified destinations
US7729901B2 (en) * 2005-12-13 2010-06-01 Yahoo! Inc. System for classifying words
US8010523B2 (en) 2005-12-30 2011-08-30 Google Inc. Dynamic search box for web browser
US7849144B2 (en) 2006-01-13 2010-12-07 Cisco Technology, Inc. Server-initiated language translation of an instant message based on identifying language attributes of sending and receiving users
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
US7657526B2 (en) 2006-03-06 2010-02-02 Veveo, Inc. Methods and systems for selecting and presenting content based on activity level spikes associated with the content
JP5057546B2 (ja) * 2006-03-24 2012-10-24 キヤノン株式会社 文書検索装置および文書検索方法
US8073860B2 (en) 2006-03-30 2011-12-06 Veveo, Inc. Method and system for incrementally selecting and providing relevant search engines in response to a user query
US8762358B2 (en) * 2006-04-19 2014-06-24 Google Inc. Query language determination using query terms and interface language
US8380488B1 (en) 2006-04-19 2013-02-19 Google Inc. Identifying a property of a document
US8442965B2 (en) * 2006-04-19 2013-05-14 Google Inc. Query language identification
US8255376B2 (en) 2006-04-19 2012-08-28 Google Inc. Augmenting queries with synonyms from synonyms map
EP3822819A1 (en) 2006-04-20 2021-05-19 Veveo, Inc. User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content
US8732314B2 (en) * 2006-08-21 2014-05-20 Cisco Technology, Inc. Generation of contact information based on associating browsed content to user actions
US7536384B2 (en) 2006-09-14 2009-05-19 Veveo, Inc. Methods and systems for dynamically rearranging search results into hierarchically organized concept clusters
US7925986B2 (en) 2006-10-06 2011-04-12 Veveo, Inc. Methods and systems for a linear character selection display interface for ambiguous text input
US7979425B2 (en) * 2006-10-25 2011-07-12 Google Inc. Server-side match
WO2008063987A2 (en) 2006-11-13 2008-05-29 Veveo, Inc. Method of and system for selecting and presenting content based on user identification
US8549424B2 (en) 2007-05-25 2013-10-01 Veveo, Inc. System and method for text disambiguation and context designation in incremental search
US8296294B2 (en) 2007-05-25 2012-10-23 Veveo, Inc. Method and system for unified searching across and within multiple documents
ITTO20070508A1 (it) * 2007-07-11 2009-01-12 Selex Communications Spa Procedimento per la codifica di dati numerici in un elaboratore e procedimento per la codifica di strutture dati per la trasmissione in un sistema di telecomunicazioni, basato su detto procedimento di codifica di dati numerici
EP2570945A1 (en) * 2007-09-21 2013-03-20 Google Inc. Cross-language search
US8725756B1 (en) 2007-11-12 2014-05-13 Google Inc. Session-based query suggestions
US8232973B2 (en) 2008-01-09 2012-07-31 Apple Inc. Method, device, and graphical user interface providing word recommendations for text input
US20090287474A1 (en) * 2008-05-16 2009-11-19 Yahoo! Inc. Web embedded language input arrangement
US8312032B2 (en) 2008-07-10 2012-11-13 Google Inc. Dictionary suggestions for partial user entries
KR20120009446A (ko) * 2009-03-13 2012-01-31 인벤션 머신 코포레이션 자연 언어 텍스트의 자동화 의미적 라벨링 시스템 및 방법
US8275604B2 (en) * 2009-03-18 2012-09-25 Microsoft Corporation Adaptive pattern learning for bilingual data mining
US8577910B1 (en) 2009-05-15 2013-11-05 Google Inc. Selecting relevant languages for query translation
US8572109B1 (en) 2009-05-15 2013-10-29 Google Inc. Query translation quality confidence
US8577909B1 (en) * 2009-05-15 2013-11-05 Google Inc. Query translation using bilingual search refinements
US8538957B1 (en) 2009-06-03 2013-09-17 Google Inc. Validating translations using visual similarity between visual media search results
WO2010139277A1 (en) 2009-06-03 2010-12-09 Google Inc. Autocompletion for partially entered query
US9870572B2 (en) 2009-06-29 2018-01-16 Google Llc System and method of providing information based on street address
US20150261858A1 (en) * 2009-06-29 2015-09-17 Google Inc. System and method of providing information based on street address
KR101083540B1 (ko) * 2009-07-08 2011-11-14 엔에이치엔(주) 통계적인 방법을 이용한 한자에 대한 자국어 발음열 변환 시스템 및 방법
US9166714B2 (en) 2009-09-11 2015-10-20 Veveo, Inc. Method of and system for presenting enriched video viewing analytics
US20110191332A1 (en) 2010-02-04 2011-08-04 Veveo, Inc. Method of and System for Updating Locally Cached Content Descriptor Information
US8577915B2 (en) 2010-09-10 2013-11-05 Veveo, Inc. Method of and system for conducting personalized federated search and presentation of results therefrom
US20140379680A1 (en) * 2010-09-21 2014-12-25 Qiliang Chen Generating search query suggestions
US20120167009A1 (en) * 2010-12-22 2012-06-28 Apple Inc. Combining timing and geometry information for typing correction
CN102737015A (zh) * 2011-04-07 2012-10-17 英业达股份有限公司 具即时翻译的写作系统及其写作方法
US20140310585A1 (en) * 2011-04-28 2014-10-16 Rakuten, Inc. Browsing system, terminal, image server, program, computer-readable recording medium storing program, and method
US9779722B2 (en) * 2013-11-05 2017-10-03 GM Global Technology Operations LLC System for adapting speech recognition vocabulary
US9313219B1 (en) * 2014-09-03 2016-04-12 Trend Micro Incorporated Detection of repackaged mobile applications
RU2580432C1 (ru) 2014-10-31 2016-04-10 Общество С Ограниченной Ответственностью "Яндекс" Способ для обработки запроса от потенциального несанкционированного пользователя на доступ к ресурсу и серверу, используемый в нем
RU2610280C2 (ru) 2014-10-31 2017-02-08 Общество С Ограниченной Ответственностью "Яндекс" Способ авторизации пользователя в сети и сервер, используемый в нем
KR102244110B1 (ko) 2015-02-17 2021-04-26 삼성전자주식회사 이종 언어간 동일성을 판단하는 전자 장치 및 방법
US9762385B1 (en) 2015-07-20 2017-09-12 Trend Micro Incorporated Protection of program code of apps of mobile computing devices
CN105069171B (zh) * 2015-08-31 2018-07-13 百度在线网络技术(北京)有限公司 汉字查询方法和系统
CN105335357B (zh) * 2015-11-18 2018-07-06 成都优译信息技术有限公司 翻译系统中语料推荐方法
US9916448B1 (en) 2016-01-21 2018-03-13 Trend Micro Incorporated Detection of malicious mobile apps
US10169414B2 (en) 2016-04-26 2019-01-01 International Business Machines Corporation Character matching in text processing
US9760627B1 (en) * 2016-05-13 2017-09-12 International Business Machines Corporation Private-public context analysis for natural language content disambiguation
US10375576B1 (en) 2016-09-09 2019-08-06 Trend Micro Incorporated Detection of malware apps that hijack app user interfaces
US10614109B2 (en) * 2017-03-29 2020-04-07 International Business Machines Corporation Natural language processing keyword analysis
US11509794B2 (en) * 2017-04-25 2022-11-22 Hewlett-Packard Development Company, L.P. Machine-learning command interaction
US10831801B2 (en) 2017-05-12 2020-11-10 International Business Machines Corporation Contextual-based high precision search for mail systems
US10387576B2 (en) * 2017-11-30 2019-08-20 International Business Machines Corporation Document preparation with argumentation support from a deep question answering system
CN110111793B (zh) 2018-02-01 2023-07-14 腾讯科技(深圳)有限公司 音频信息的处理方法、装置、存储介质及电子装置
JP7247460B2 (ja) * 2018-03-13 2023-03-29 富士通株式会社 対応関係生成プログラム、対応関係生成装置、対応関係生成方法、及び翻訳プログラム
KR102637340B1 (ko) * 2018-08-31 2024-02-16 삼성전자주식회사 문장 매핑 방법 및 장치
US11250221B2 (en) * 2019-03-14 2022-02-15 Sap Se Learning system for contextual interpretation of Japanese words
US11308096B2 (en) * 2019-03-29 2022-04-19 Rovi Guides, Inc. Bias quotient measurement and debiasing for recommendation engines
JP7238199B2 (ja) 2019-07-04 2023-03-13 キヤノン株式会社 テレコンバータレンズ、レンズ装置、および、撮像装置
JP7171519B2 (ja) 2019-07-04 2022-11-15 キヤノン株式会社 テレコンバータレンズ、レンズ装置、および、撮像装置
US11227101B2 (en) * 2019-07-05 2022-01-18 Open Text Sa Ulc System and method for document translation in a format agnostic document viewer
CN111368557B (zh) * 2020-03-06 2023-04-07 北京字节跳动网络技术有限公司 视频内容的翻译方法、装置、设备及计算机可读介质
US11458409B2 (en) * 2020-05-27 2022-10-04 Nvidia Corporation Automatic classification and reporting of inappropriate language in online applications

Family Cites Families (168)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4674112A (en) * 1985-09-06 1987-06-16 Board Of Regents, The University Of Texas System Character pattern recognition and communications apparatus
US4754474A (en) * 1985-10-21 1988-06-28 Feinson Roy W Interpretive tone telecommunication method and apparatus
DE69032576T2 (de) * 1990-02-27 1999-04-15 Oracle Corp Dynamische Optimierung eines einzelnen relationalen Zugriffs
KR950008022B1 (ko) * 1991-06-19 1995-07-24 가부시끼가이샤 히다찌세이사꾸쇼 문자처리방법 및 장치와 문자입력방법 및 장치
RU2039376C1 (ru) 1991-11-01 1995-07-09 Сергей Станиславович Ковалевский Устройство для информационного поиска
US5535119A (en) 1992-06-11 1996-07-09 Hitachi, Ltd. Character inputting method allowing input of a plurality of different types of character species, and information processing equipment adopting the same
US5337347A (en) * 1992-06-25 1994-08-09 International Business Machines Corporation Method and system for progressive database search termination and dynamic information presentation utilizing telephone keypad input
US6760695B1 (en) * 1992-08-31 2004-07-06 Logovista Corporation Automated natural language processing
GB2272091B (en) 1992-10-30 1996-10-23 Canon Europa Nv Apparatus for use in aligning bilingual corpora
JP3919237B2 (ja) * 1994-05-20 2007-05-23 キヤノン株式会社 画像記録再生装置、画像再生装置、及びその方法
US5543789A (en) * 1994-06-24 1996-08-06 Shields Enterprises, Inc. Computerized navigation system
AU3734395A (en) * 1994-10-03 1996-04-26 Helfgott & Karas, P.C. A database accessing system
US5787230A (en) * 1994-12-09 1998-07-28 Lee; Lin-Shan System and method of intelligent Mandarin speech input for Chinese computers
US5758145A (en) * 1995-02-24 1998-05-26 International Business Machines Corporation Method and apparatus for generating dynamic and hybrid sparse indices for workfiles used in SQL queries
JP3571408B2 (ja) 1995-03-31 2004-09-29 株式会社日立製作所 文書加工方法および装置
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US5701469A (en) 1995-06-07 1997-12-23 Microsoft Corporation Method and system for generating accurate search results using a content-index
AU5969896A (en) * 1995-06-07 1996-12-30 International Language Engineering Corporation Machine assisted translation tools
US5818437A (en) * 1995-07-26 1998-10-06 Tegic Communications, Inc. Reduced keyboard disambiguating computer
CN1154910C (zh) * 1995-07-26 2004-06-23 蒂吉通信系统公司 压缩键盘的明义系统
US5634053A (en) * 1995-08-29 1997-05-27 Hughes Aircraft Company Federated information management (FIM) system and method for providing data site filtering and translation for heterogeneous databases
JP3819959B2 (ja) * 1996-03-27 2006-09-13 シャープ株式会社 音声による情報検索装置
US5920859A (en) * 1997-02-05 1999-07-06 Idd Enterprises, L.P. Hypertext document retrieval system and method
US5778157A (en) * 1996-06-17 1998-07-07 Yy Software Corporation System and method for expert system analysis using quiescent and parallel reasoning and set structured knowledge representation
US5845273A (en) 1996-06-27 1998-12-01 Microsoft Corporation Method and apparatus for integrating multiple indexed files
US5878386A (en) * 1996-06-28 1999-03-02 Microsoft Corporation Natural language parser with dictionary-based part-of-speech probabilities
US5832480A (en) * 1996-07-12 1998-11-03 International Business Machines Corporation Using canonical forms to develop a dictionary of names in a text
US5953073A (en) * 1996-07-29 1999-09-14 International Business Machines Corp. Method for relating indexing information associated with at least two indexing schemes to facilitate the play-back of user-specified digital video data and a video client incorporating the same
US5745894A (en) * 1996-08-09 1998-04-28 Digital Equipment Corporation Method for generating and searching a range-based index of word-locations
US5987446A (en) * 1996-11-12 1999-11-16 U.S. West, Inc. Searching large collections of text using multiple search engines concurrently
US5953541A (en) * 1997-01-24 1999-09-14 Tegic Communications, Inc. Disambiguating system for disambiguating ambiguous input sequences by displaying objects associated with the generated input sequences in the order of decreasing frequency of use
JPH10247201A (ja) * 1997-03-05 1998-09-14 Nippon Telegr & Teleph Corp <Ntt> 情報評価値付き情報案内システム
US6278992B1 (en) * 1997-03-19 2001-08-21 John Andrew Curtis Search engine using indexing method for storing and retrieving data
JP3143079B2 (ja) * 1997-05-30 2001-03-07 松下電器産業株式会社 辞書索引作成装置と文書検索装置
US6061718A (en) * 1997-07-23 2000-05-09 Ericsson Inc. Electronic mail delivery system in wired or wireless communications system
US6055528A (en) 1997-07-25 2000-04-25 Claritech Corporation Method for cross-linguistic document retrieval
JP2965010B2 (ja) * 1997-08-30 1999-10-18 日本電気株式会社 関連情報検索方法及び装置並びにプログラムを記録した機械読み取り可能な記録媒体
KR100552085B1 (ko) * 1997-09-25 2006-02-20 테직 커뮤니케이션 인코포레이티드 감소된 키보드 명확화 시스템
US6026411A (en) * 1997-11-06 2000-02-15 International Business Machines Corporation Method, apparatus, and computer program product for generating an image index and for internet searching and querying by image colors
US6377965B1 (en) * 1997-11-07 2002-04-23 Microsoft Corporation Automatic word completion system for partially entered data
US5945928A (en) * 1998-01-20 1999-08-31 Tegic Communication, Inc. Reduced keyboard disambiguating system for the Korean language
KR100313462B1 (ko) * 1998-01-23 2001-12-31 윤종용 웹검색엔진에서검색된정보를지역적으로근접한순서대로표시하는방법
US6185558B1 (en) * 1998-03-03 2001-02-06 Amazon.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US5974121A (en) * 1998-05-14 1999-10-26 Motorola, Inc. Alphanumeric message composing method using telephone keypad
GB2337611A (en) * 1998-05-20 1999-11-24 Sharp Kk Multilingual document retrieval system
US6144958A (en) * 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6470333B1 (en) * 1998-07-24 2002-10-22 Jarg Corporation Knowledge extraction system and method
US6226635B1 (en) * 1998-08-14 2001-05-01 Microsoft Corporation Layered query management
US6370518B1 (en) * 1998-10-05 2002-04-09 Openwave Systems Inc. Method and apparatus for displaying a record from a structured database with minimum keystrokes
US7194679B1 (en) * 1998-10-20 2007-03-20 International Business Machines Corporation Web-based file review system utilizing source and comment files
IE980941A1 (en) * 1998-11-16 2000-05-17 Buy Tel Innovations Ltd A transaction processings system
JP2000163441A (ja) 1998-11-30 2000-06-16 Nippon Telegr & Teleph Corp <Ntt> 辞書作成方法及び装置及び辞書作成プログラムを格納した記憶媒体及び検索要求作成方法及び装置及び検索要求作成プログラムを格納した記憶媒体及び多言語対応情報検索システム
JP3842913B2 (ja) * 1998-12-18 2006-11-08 富士通株式会社 文字通信方法及び文字通信システム
GB2347247A (en) * 1999-02-22 2000-08-30 Nokia Mobile Phones Ltd Communication terminal with predictive editor
US20020038308A1 (en) * 1999-05-27 2002-03-28 Michael Cappi System and method for creating a virtual data warehouse
US6421662B1 (en) * 1999-06-04 2002-07-16 Oracle Corporation Generating and implementing indexes based on criteria set forth in queries
US6598039B1 (en) 1999-06-08 2003-07-22 Albert-Inc. S.A. Natural language interface for searching database
US20010003184A1 (en) * 1999-07-16 2001-06-07 Ching Jamison K. Methods and articles of manufacture for interfacing, advertising and navigating with internet television
CN1176432C (zh) 1999-07-28 2004-11-17 国际商业机器公司 提供本国语言查询服务的方法和系统
US6606486B1 (en) * 1999-07-29 2003-08-12 Ericsson Inc. Word entry method for mobile originated short messages
US6601026B2 (en) * 1999-09-17 2003-07-29 Discern Communications, Inc. Information retrieval by natural language querying
US6453315B1 (en) * 1999-09-22 2002-09-17 Applied Semantics, Inc. Meaning-based information organization and retrieval
US6353820B1 (en) * 1999-09-29 2002-03-05 Bull Hn Information Systems Inc. Method and system for using dynamically generated code to perform index record retrieval in certain circumstances in a relational database manager
US6484179B1 (en) 1999-10-25 2002-11-19 Oracle Corporation Storing multidimensional data in a relational database management system
US7165019B1 (en) * 1999-11-05 2007-01-16 Microsoft Corporation Language input architecture for converting one text form to another text form with modeless entry
US6633846B1 (en) * 1999-11-12 2003-10-14 Phoenix Solutions, Inc. Distributed realtime speech recognition system
US6675165B1 (en) 2000-02-28 2004-01-06 Barpoint.Com, Inc. Method for linking a billboard or signage to information on a global computer network through manual information input or a global positioning system
US7120574B2 (en) * 2000-04-03 2006-10-10 Invention Machine Corporation Synonym extension of search queries with validation
US7177798B2 (en) * 2000-04-07 2007-02-13 Rensselaer Polytechnic Institute Natural language interface using constrained intermediate dictionary of results
US6564213B1 (en) 2000-04-18 2003-05-13 Amazon.Com, Inc. Search query autocompletion
US7107204B1 (en) * 2000-04-24 2006-09-12 Microsoft Corporation Computer-aided writing system and method with cross-language writing wizard
US6604101B1 (en) * 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
US6714905B1 (en) * 2000-05-02 2004-03-30 Iphrase.Com, Inc. Parsing ambiguous grammar
JP2001325252A (ja) 2000-05-12 2001-11-22 Sony Corp 携帯端末及びその情報入力方法、辞書検索装置及び方法、媒体
US6456234B1 (en) 2000-06-07 2002-09-24 William J. Johnson System and method for proactive content delivery by situation location
JP3686312B2 (ja) * 2000-07-05 2005-08-24 日本電信電話株式会社 訳語検索方法、訳語検索装置及び訳語検索プログラムを記録した記録媒体
US6529903B2 (en) * 2000-07-06 2003-03-04 Google, Inc. Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query
US7136854B2 (en) * 2000-07-06 2006-11-14 Google, Inc. Methods and apparatus for providing search results in response to an ambiguous search query
US8706747B2 (en) 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
WO2002009302A1 (en) 2000-07-25 2002-01-31 Cypus Communication terminal capable for searching internet domain name, system and method for searching internet domain name using the same
US6968179B1 (en) 2000-07-27 2005-11-22 Microsoft Corporation Place specific buddy list services
US20020021311A1 (en) * 2000-08-14 2002-02-21 Approximatch Ltd. Data entry using a reduced keyboard
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
GB2366698A (en) * 2000-09-01 2002-03-13 Nokia Mobile Phones Ltd Insertion of pre-stored text strings
JP2002092018A (ja) 2000-09-18 2002-03-29 Nec Software Hokkaido Ltd 片仮名平仮名も含めた検索システム
CA2323856A1 (en) * 2000-10-18 2002-04-18 602531 British Columbia Ltd. Method, system and media for entering data in a personal computing device
US20060149686A1 (en) * 2000-11-30 2006-07-06 Allison Debonnett Method of payment and settlement of goods and services via the INTERNET
US7028306B2 (en) 2000-12-04 2006-04-11 International Business Machines Corporation Systems and methods for implementing modular DOM (Document Object Model)-based multi-modal browsers
EP1215659A1 (en) * 2000-12-14 2002-06-19 Nokia Corporation Locally distibuted speech recognition system and method of its operation
EP1215661A1 (en) * 2000-12-14 2002-06-19 TELEFONAKTIEBOLAGET L M ERICSSON (publ) Mobile terminal controllable by spoken utterances
JP2002215660A (ja) * 2001-01-16 2002-08-02 Mitsubishi Heavy Ind Ltd 検索システム及びこれに用いられるソフトウェア
JP3768105B2 (ja) * 2001-01-29 2006-04-19 株式会社東芝 翻訳装置、翻訳方法並びに翻訳プログラム
GB0103053D0 (en) * 2001-02-07 2001-03-21 Nokia Mobile Phones Ltd A communication terminal having a predictive text editor application
US7027987B1 (en) * 2001-02-07 2006-04-11 Google Inc. Voice interface for a search engine
JP2002251410A (ja) 2001-02-26 2002-09-06 Sharp Corp 情報検索装置、情報検索プログラムおよび情報検索プログラムを記録したコンピュータ読取可能な記録媒体
JP3764058B2 (ja) * 2001-03-01 2006-04-05 株式会社東芝 翻訳装置、翻訳方法及び翻訳プログラム
JP3379090B2 (ja) * 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US7231381B2 (en) * 2001-03-13 2007-06-12 Microsoft Corporation Media content search engine incorporating text content and user log mining
US8744835B2 (en) * 2001-03-16 2014-06-03 Meaningful Machines Llc Content conversion method and apparatus
US7103534B2 (en) * 2001-03-31 2006-09-05 Microsoft Corporation Machine learning contextual approach to word determination for text input via reduced keypad keys
KR20020084739A (ko) 2001-05-02 2002-11-11 이재원 숫자입력을 이용한 인터넷 검색 및 접속 방법
GB0111012D0 (en) * 2001-05-04 2001-06-27 Nokia Corp A communication terminal having a predictive text editor application
US7366712B2 (en) 2001-05-31 2008-04-29 Intel Corporation Information retrieval center gateway
US6947770B2 (en) * 2001-06-22 2005-09-20 Ericsson, Inc. Convenient dialing of names and numbers from a phone without alpha keypad
US20030035519A1 (en) * 2001-08-15 2003-02-20 Warmus James L. Methods and apparatus for accessing web content from a wireless telephone
JP3895955B2 (ja) * 2001-08-24 2007-03-22 株式会社東芝 情報検索方法および情報検索システム
US20030054830A1 (en) * 2001-09-04 2003-03-20 Zi Corporation Navigation system for mobile communication devices
US6944609B2 (en) * 2001-10-18 2005-09-13 Lycos, Inc. Search results using editor feedback
KR100501079B1 (ko) 2001-11-12 2005-07-18 주식회사 아이니드 네트워크 기반의 유사어 검색기술 응용시스템 및 방법
US7533093B2 (en) 2001-11-13 2009-05-12 Koninklijke Philips Electronics N.V. Method and apparatus for evaluating the closeness of items in a recommender of such items
US7149550B2 (en) * 2001-11-27 2006-12-12 Nokia Corporation Communication terminal having a text editor application with a word completion feature
US6785654B2 (en) * 2001-11-30 2004-08-31 Dictaphone Corporation Distributed speech recognition system with speech recognition engines offering multiple functionalities
US7283992B2 (en) * 2001-11-30 2007-10-16 Microsoft Corporation Media agent to suggest contextually related media content
US20030125947A1 (en) * 2002-01-03 2003-07-03 Yudkowsky Michael Allen Network-accessible speaker-dependent voice models of multiple persons
US7565367B2 (en) * 2002-01-15 2009-07-21 Iac Search & Media, Inc. Enhanced popularity ranking
US6952691B2 (en) 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
US7167831B2 (en) * 2002-02-04 2007-01-23 Microsoft Corporation Systems and methods for managing multiple grammars in a speech recognition system
EP1347362B1 (en) 2002-03-22 2005-05-11 Sony Ericsson Mobile Communications AB Entering text into an electronic communications device
US20030187658A1 (en) * 2002-03-29 2003-10-02 Jari Selin Method for text-to-speech service utilizing a uniform resource identifier
US7089178B2 (en) * 2002-04-30 2006-08-08 Qualcomm Inc. Multistream network feature processing for a distributed speech recognition system
JP2004054918A (ja) * 2002-05-30 2004-02-19 Osaka Industrial Promotion Organization 情報処理システム、情報表示装置、コンピュータプログラム、及び記録媒体
US7013154B2 (en) * 2002-06-27 2006-03-14 Motorola, Inc. Mapping text and audio information in text messaging devices and methods therefor
US7103854B2 (en) * 2002-06-27 2006-09-05 Tele Atlas North America, Inc. System and method for associating text and graphical views of map information
US7380724B2 (en) * 2002-07-01 2008-06-03 Sony Ericsson Mobile Communications Ab Entering text into an electronic communication device
US7016895B2 (en) * 2002-07-05 2006-03-21 Word Data Corp. Text-classification system and method
US7386442B2 (en) * 2002-07-03 2008-06-10 Word Data Corp. Code, system and method for representing a natural-language text in a form suitable for text manipulation
EP2154613A1 (en) 2002-07-23 2010-02-17 Research in Motion Limited Systems and methods of building and using custom word lists
US7249012B2 (en) * 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
US20040163032A1 (en) 2002-12-17 2004-08-19 Jin Guo Ambiguity resolution for predictive text entry
GB2396529B (en) * 2002-12-20 2005-08-10 Motorola Inc Location-based mobile service provision
EP1584023A1 (en) * 2002-12-27 2005-10-12 Nokia Corporation Predictive text entry and data compression method for a mobile communication terminal
US7076428B2 (en) * 2002-12-30 2006-07-11 Motorola, Inc. Method and apparatus for selective distributed speech recognition
US7369988B1 (en) * 2003-02-24 2008-05-06 Sprint Spectrum L.P. Method and system for voice-enabled text entry
FI116168B (fi) * 2003-03-03 2005-09-30 Flextronics Odm Luxembourg Sa Datan syöttö
US7729913B1 (en) 2003-03-18 2010-06-01 A9.Com, Inc. Generation and selection of voice recognition grammars for conducting database searches
KR100563787B1 (ko) 2003-04-03 2006-03-30 주식회사 시티기술단 단위 옹벽판넬에 설치된 고강도 철근을 커플러로상호연결하여 단면력에 저항토록하면서, 프리스트레스를도입한 단위 옹벽판넬로 이루어진 옹벽조립체 및 이의조립시공방법
KR100515641B1 (ko) 2003-04-24 2005-09-22 우순조 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법
US7395203B2 (en) * 2003-07-30 2008-07-01 Tegic Communications, Inc. System and method for disambiguating phonetic input
US8200865B2 (en) * 2003-09-11 2012-06-12 Eatoni Ergonomics, Inc. Efficient method and apparatus for text entry based on trigger sequences
GB2433002A (en) * 2003-09-25 2007-06-06 Canon Europa Nv Processing of Text Data involving an Ambiguous Keyboard and Method thereof.
US7240049B2 (en) * 2003-11-12 2007-07-03 Yahoo! Inc. Systems and methods for search query processing using trend analysis
US20050114312A1 (en) * 2003-11-26 2005-05-26 Microsoft Corporation Efficient string searches using numeric keypad
US20050188330A1 (en) * 2004-02-20 2005-08-25 Griffin Jason T. Predictive text input system for a mobile communication device
US7293019B2 (en) 2004-03-02 2007-11-06 Microsoft Corporation Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics
US8676830B2 (en) 2004-03-04 2014-03-18 Yahoo! Inc. Keyword recommendation for internet search engines
US7218249B2 (en) 2004-06-08 2007-05-15 Siemens Communications, Inc. Hand-held communication device having navigation key-based predictive text entry
US8595687B2 (en) 2004-06-23 2013-11-26 Broadcom Corporation Method and system for providing text information in an application framework for a wireless device
US8392453B2 (en) 2004-06-25 2013-03-05 Google Inc. Nonstandard text entry
US8972444B2 (en) 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
WO2006047654A2 (en) * 2004-10-25 2006-05-04 Yuanhua Tang Full text query and search systems and methods of use
US7779011B2 (en) 2005-08-26 2010-08-17 Veveo, Inc. Method and system for dynamically processing ambiguous, reduced text search queries and highlighting results thereof
US7788266B2 (en) * 2005-08-26 2010-08-31 Veveo, Inc. Method and system for processing ambiguous, multi-term search queries
US7737999B2 (en) 2005-08-26 2010-06-15 Veveo, Inc. User interface for visual cooperation between text input and display device
US20070061211A1 (en) * 2005-09-14 2007-03-15 Jorey Ramer Preventing mobile communication facility click fraud
US9471925B2 (en) * 2005-09-14 2016-10-18 Millennial Media Llc Increasing mobile interactivity
US7647228B2 (en) 2005-11-03 2010-01-12 Apptera, Inc. Method and apparatus for speech processing incorporating user intent
JP2007141123A (ja) * 2005-11-22 2007-06-07 Internatl Business Mach Corp <Ibm> 異なるファイルの同一文字列のリンク
US7644054B2 (en) * 2005-11-23 2010-01-05 Veveo, Inc. System and method for finding desired results by incremental search using an ambiguous keypad with the input containing orthographic and typographic errors
AU2006318417B2 (en) * 2005-11-23 2012-01-19 Dun And Bradstreet Corporation System and method for searching and matching data having ideogrammatic content
US20070195063A1 (en) * 2006-02-21 2007-08-23 Wagner Paul T Alphanumeric data processing in a telephone
US7657526B2 (en) 2006-03-06 2010-02-02 Veveo, Inc. Methods and systems for selecting and presenting content based on activity level spikes associated with the content
EP3822819A1 (en) 2006-04-20 2021-05-19 Veveo, Inc. User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content
US7536384B2 (en) * 2006-09-14 2009-05-19 Veveo, Inc. Methods and systems for dynamically rearranging search results into hierarchically organized concept clusters
US7979425B2 (en) * 2006-10-25 2011-07-12 Google Inc. Server-side match
KR20100041145A (ko) * 2008-10-13 2010-04-22 삼성전자주식회사 쿼티 키패드를 갖는 휴대 단말기의 발신 방법 및 전화번호 저장 방법
US20100306249A1 (en) * 2009-05-27 2010-12-02 James Hill Social network systems and methods
US20130304818A1 (en) * 2009-12-01 2013-11-14 Topsy Labs, Inc. Systems and methods for discovery of related terms for social media content collection over social networks

Also Published As

Publication number Publication date
KR101242961B1 (ko) 2013-03-12
JP2011090718A (ja) 2011-05-06
EP2043003A3 (en) 2009-06-03
US20040261021A1 (en) 2004-12-23
RU2006114696A (ru) 2007-11-10
EP2388709A1 (en) 2011-11-23
CN1860473A (zh) 2006-11-08
KR20060090689A (ko) 2006-08-14
PL2388709T3 (pl) 2018-12-31
WO2005033967A2 (en) 2005-04-14
US20170351673A1 (en) 2017-12-07
CN102236702B (zh) 2013-08-14
JP2013084306A (ja) 2013-05-09
KR20110117218A (ko) 2011-10-26
KR101261158B1 (ko) 2013-05-09
JP2010282639A (ja) 2010-12-16
JP5425820B2 (ja) 2014-02-26
DE602004020086D1 (de) 2009-04-30
KR20110117219A (ko) 2011-10-26
WO2005033967A3 (en) 2005-10-13
CN102236702A (zh) 2011-11-09
HK1163846A1 (en) 2012-09-14
US20140188454A1 (en) 2014-07-03
KR101140187B1 (ko) 2012-05-02
EP1676211B1 (en) 2009-03-18
US8706747B2 (en) 2014-04-22
JP2007507796A (ja) 2007-03-29
JP4717821B2 (ja) 2011-07-06
KR20120039755A (ko) 2012-04-25
RU2363983C2 (ru) 2009-08-10
ES2323786T3 (es) 2009-07-24
JP5608766B2 (ja) 2014-10-15
EP2043003A2 (en) 2009-04-01
JP5231491B2 (ja) 2013-07-10
EP2388709B1 (en) 2018-08-08
EP1676211A2 (en) 2006-07-05
US9734197B2 (en) 2017-08-15
ATE426206T1 (de) 2009-04-15

Similar Documents

Publication Publication Date Title
TR201816343T4 (tr) Farklı bir karakter setinde yazılmış sorguları ve/veya farklı sayfalardan dili kullanarak aramaya yönelik sistemler ve yöntemler.
KR101465770B1 (ko) 단어 확률 결정
US10713571B2 (en) Displaying quality of question being asked a question answering system
KR101465769B1 (ko) 사전 단어 및 어구 판정
US7136854B2 (en) Methods and apparatus for providing search results in response to an ambiguous search query
US20090055389A1 (en) Ranking similar passages
US20080312911A1 (en) Dictionary word and phrase determination
US20170109449A1 (en) Discovery engine
WO2009026850A1 (en) Domain dictionary creation
EP1221082B1 (en) Use of english phonetics to write non-roman characters
Alsmadi et al. Google n-gram viewer does not include arabic corpus! towards n-gram viewer for arabic corpus.
JP2013015967A (ja) 検索システム、索引作成装置、検索装置、索引作成方法、検索方法およびプログラム
Sowmya TEXT INPUT METHODS FOR INDIAN LANGUAGES