TR201816343T4 - Farklı bir karakter setinde yazılmış sorguları ve/veya farklı sayfalardan dili kullanarak aramaya yönelik sistemler ve yöntemler. - Google Patents
Farklı bir karakter setinde yazılmış sorguları ve/veya farklı sayfalardan dili kullanarak aramaya yönelik sistemler ve yöntemler. Download PDFInfo
- Publication number
- TR201816343T4 TR201816343T4 TR2018/16343T TR201816343T TR201816343T4 TR 201816343 T4 TR201816343 T4 TR 201816343T4 TR 2018/16343 T TR2018/16343 T TR 2018/16343T TR 201816343 T TR201816343 T TR 201816343T TR 201816343 T4 TR201816343 T4 TR 201816343T4
- Authority
- TR
- Turkey
- Prior art keywords
- format
- query
- search
- variants
- user
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000013519 translation Methods 0.000 claims abstract description 50
- 230000003993 interaction Effects 0.000 claims abstract 2
- 230000014616 translation Effects 0.000 claims description 48
- 238000004590 computer program Methods 0.000 claims 2
- 230000014509 gene expression Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 10
- 230000007246 mechanism Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000003825 pressing Methods 0.000 description 3
- 235000014101 wine Nutrition 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 235000019993 champagne Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000004557 technical material Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/972—Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0237—Character input methods using prediction or retrieval techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
Abstract
Buluş ile tutarlı yöntemler ve aparatlar, bir kullanıcının belirsiz bir arama sorgusu göndermesini ve ilgili arama sonuçlarını almasını olanaklı kılacaktır. Sorgular aranacak verilerin en azından bir kısmının karakter setinden ve/veya dilinden farklı olan karakter setleri ve/veya dilleri kullanılarak ifade edilebilir. Bu karakter setleri ve/veya dilleri arasında bir çeviri hizalanan metindeki terimlerin kullanımını inceleyerek gerçekleştirilebilir. Olasılıklar her olası çeviri ile ilişkili olabilir. Kullanıcı etkileşimlerini arama sonuçları ile inceleyerek bu olasılıklarda iyileştirmeler yapılabilir.
Description
TARIFNAME
FARKLI BIR KARAKTER SETINDE YAZILMIS SORGULARI VENEYA FARKLI
SAYFALARDAN DILI KULLANARAK ARAMAYA YÖNELIK SISTEMLER VE
YÖNTEMLER
ILGILI BASVURULARA QAPRAZ REFERANS
basvurusu yapilan " METHODS AND APPARATUS FOR PROVIDING SEARCH
RESULTS IN RESPONSE TO AN AMBIGUOUS SEARCH QUERY”, baslikli U.S.
Patent Basvuru Seri No. 09/748,431'in kismen devamidir.
BULU UN ALT YAPISI
1. Bulusun Sahasi
Mevcut bulus, genel olarak bilgi arama ve alimi ile ilgilidir. Daha spesifik olarak,
aranacak belgelerin en azindan bazilarinin karakter dizisinden veya dilinden farkli olan
bir karakter setinde veya dilinde yazilan sorgulari kullanarak aramalar yapmaya yönelik
sistemler ve yöntemler açiklanir.
2. Ilgili Teknigin Açiklamasi
Çogu arama motoru son kullanicinin, alfanümerik dizilerin girisinin zor olmadigi, klasik
bir klavye gibi bir sey kullanarak arama sorgulari girdigi varsayimi altinda çalisir.
Ancak, küçük cihazlar giderek daha yaygin hale geldiginden, bu varsayim her zaman
geçerli degildir. Örnegin, kullanicilar WAP (Kablosuz Uygulama Protokolü) standardini
destekleyen bir kablosuz telefon bir kablosuz telefonu kullanan arama motorlarini
sorgulayabilir. Kablosuz telefonlar gibi cihazlar tipik olarak bir veri girisi arayüzü içerir,
burada kullanicinin belirli bir eylemi (örnegin bir tusa basma) birden fazla alfanümerik
karaktere karsilik gelebilir. WAP mimarisinin detayli bir açiklamasi
httpzl/wwwl.wapforum.org/tech/documents/SPEC-WAPArch-19980439.pdf'te ("WAP
100 Kablosuz Uygulama Protokolü Mimari Spesifikasyonu") bulunur.
Alisilmis durumda, WAP kullanicisi arama sorgusu sayfasina gider ve ona arama
sorgularini girdikleri bir form ile sunulur. Klasik yöntemlerde, kullanici belirli bir harfi
seçmek üzere birçok tusa basmasi gerekebilir. Standart bir telefon tus takiminda,
örnegin, kullanici “2" tusuna iki defa basarak “b" harfini seçebilir veya “7” tusuna dört
defa basarak ”s” harfini seçebilir. Dolayisiyla, "ben smith“ adina bir sorgu girmek
amaciyla, kullanicinin olagan bir sekilde asagidaki tus basma dizisine girmesi
22-›b
33-›e
66-›n
0-›bosluk
7777-›5
444-›i
44-›h
Kullanici arama taleplerini girdikten sonra, arama motoru kelimeyi veya kelimeleri
kullanicidan alir ve kullanicinin klasik bir klavye kullandigi bir masaüstü tarayicisindan
talep almis gibi devam eder.
Önceki örnekten görülebildigi üzere, bu veri girisi formu “ben smith" ifadesine karsilik
gelen dokuz alfanümerik karakterlere girmek üzere on sekiz tus girisi gerektirmesi
nedeniyle yetersizdir.
Hedef dile ait olmayan klavyeleri kullanirken benzer sorunlar ortaya çikabilir. Örnegin,
Japonca metin hiçbiri Roma alfabesine dayanan tipik ASClI klavyesi kullanarak
kolaylikla girilmeyen hiragana, katakana ve kanji dâhil olmak üzere çesitli farkli karakter
setlerini kullanarak ifade edilebilir. Böyle bir durumda, kullanici romaji'de yazilan metni
(bir fonetik, Japoncanin Roma alfabesiyle ifadesi) katakana, hiragana ve kanji'ye
dönüstürebilen çogu zaman Ichitaro gibi Japonya'nin Tokushima City sehrindeki
JustSystem Corp. Tarafindan üretilen bir kelime islemciyi kullanacaktir. Kelime
islemciyi kullanarak, kullanici romaji'de bir sorgu yazabilir ve sonra çevrilen metni
kelime islemcinin ekranindan tarayicidaki bir arama kutusuna kesip yapistirabilir. Bu
yaklasim bir sakincasi, oldukça yavas ve zahmetli olabilir ve kullanicinin maliyet
ve/veya bellek kisitlamalari nedeniyle uygulanabilir olmayan, kelime islemcinin bir
kopyasina erismek zorunda olmasini gerektirir.
Dolayisiyla burada belirsiz bir arama sorgusuna karsi ilgili arama sonuçlari saglamaya
yönelik yöntemlere ve aparata bir ihtiyaç bulunmaktadir.
BULUSUN KISA AÇIKLAMASI
BuIUSun kapsami, ekli istemler yoluyla tanimlanir.
SEKILLERIN KISA AÇIKLAMASI
Bu spesifikasyona eklenen ve bu spesifikasyonun bir parçasini olusturan ekteki sekiller
bulusun örneklerini gösterir ve açiklama ile birlikte bulusun avantajlarini ve prensiplerini
açiklama amaci tasir. Sekillerde:
SEKIL 1 mevcut bulus ile uyumlu yöntemlerin ve aparatin uygulanabildigi bir
sistemin bir blok çizelgesini gösterir;
SEKIL 2 bulus ile uyumlu bir istemci cihazin bir blok çizelgesini gösterir;
SEKIL 3 üç belgeyi gösteren bir çizelgeyi gösterir;
SEKIL 4a klasik bir alfanümerik dizini gösterir;
SEKIL 4b klasik bir alfanümerik arama sorgusu karsisinda arama sonuçlari
saglamaya yönelik bir akis çizelgesini gösterir;
SEKIL 5a belirsiz bir arama sorgusu karsisinda arama sonuçlari saglamaya
yönelik bulus ile tutarli bir akis çizelgesini gösterir;
SEKIL 5b alfanümerik bilgiyi nümerik bilgiye eslestirmeye yönelik bir çizelgeyi
gösterir;
SEKIL 6 belirsiz bir arama sorgusu karsisinda arama sonuçlari saglamaya
yönelik bulus ile uyumlu, bir baska akis çizelgesini gösterir.
SEKIL 7 mevcut bulusun örnekleri uyarinca bir arama gerçeklestirmeye yönelik
bir yöntemi gösterir.
SEKIL 8 bir karakter seti çevirilerinin olasiliksal sözlügünü gösterir.
SEKIL 9 bir olasiliksal sözlük olusturmak üzere paralel baglanti metninin
kullanimini gösterir.
SEKIL 10 baglanti metni kullanilarak baglanan bir belge koleksiyonunu gösterir.
SEKILLER 11A ve 118, SEKIL 10'da gösterilen baglanti metnine göre benzeri
çevirilerin hesaplamasini gösterir.
SEKIL 12 bir açiklayici kelime çevirisi ile iliskili bir olasilik dagilimini gösterir.
Bu noktada ekteki sekillerde gösterildigi gibi mevcut bulusun detayli düzenlemelerine
referans yapilacaktir. Sekillerde ve asagidaki açiklamada ayni veya benzer parçalari
refere etmek üzere ayni referans numaralari kullanilabilir. Asagidaki açiklama teknikte
uzman herhangi bir kisinin çalismanin bulus gövdesini yapmasini ve kullanmasini
olanakli kilmak üzere sunulur. Spesifik örneklerin ve basvurularin açiklamalari sadece
örnekler olarak saglanir ve çesitli modifikasyonlar teknikte uzman kisiler tarafindan
kolaylikla anlasilacaktir. Örnegin, örneklerin birçogu Internet web sayfalarinin
baglaminda açiklanmis olmasina ragmen, mevcut bulusun örneklerinin kitaplar,
gazeteler, dergiler veya benzeri gibi diger belge ve/veya bilgi tiplerini aramak üzere
kullanilabilir. Ayni sekilde, örneklerin birçogu açiklama amaciyla Japonca metnin
romaji'den katakana, hiragana ve/veya kanji'ye çevrilmesine ragmen, teknikte uzman
kisiler mevcut bulusun sistemlerinin ve yöntemlerinin herhangi bir uygun çeviriye
uygulanabilecegini anlayacaktir. Örnegin, sinirlama olmaksizin, mevcut bulusun
örnekleri bazi diger formatta (örnegin pinyin veya romaja) alinan sorgulara göre,
örnegin geleneksel Çin karakterleri veya Kore hangul veya hanja karakterlerinde
yazilan metni aramak üzere kullanilabilir. Burada açiklanan genel prensipler bulusun
kapsamindan ayrilmadan diger örneklere ve basvurulara uygulanabilir. Dolayisiyla,
mevcut bulus burada açiklanan prensipler ve özellikler ile uyumlu çok sayida alternatifi,
modifikasyonu ve esdegeri içeren en genis kapsamina uygun hale getirilmelidir. Daha
iyi anlasilirlik saglanmasi amaciyla, bulus ile ilgili sahalarda bilinen teknik materyal ile
ilgili detaylar mevcut bulusu gereksiz bir sekilde belirsiz hale getirmemek üzere detayli
açiklanmamistir.
A. Genel Bakis
Bulus ile uyumlu yöntemler ve aparatlar, bir kullanicinin belirsiz bir arama sorgusu
göndermesini ve potansiyel olarak belirsizligi giderilmis arama sonuçlari almasini
olanakli kilacaktir. Bir örnekte standart telefon tus takiminin bir kullanicisindan alinan
bir rakam dizisi, potansiyel olarak ilgili bir alfanümerik dizi setine çevrilir. Bu potansiyel
olarak uyumlu alfanümerik diziler bir boole degeri “OR” ifadesi kullanilarak bir klasik
arama motoruna bir girdi olarak saglanir. Böylece, arama motoru kullanicinin almaya
ilgi duyabilecegi arama sonuçlarini sinirlamaya yardimci olmak üzere kullanilir.
B. Mimari
SEKIL 1 mevcut bulus ile uyumlu yöntemlerin ve aparatin uygulanabildigi bir sistemin
üzerinden baglanan çoklu istem cihazlarini (110) içerebilir. Ag (140) bir yerel alan agi
(LAN), bir genis alan agi (WAN), Kamu Telefon Sebekesi (PSTN) gibi bir telefon agi,
bir intranet, Internet veya bir ag kombinasyonunu içerebilir. Iki istemci cihazi (110) ve
üç sunucu (120 ve 130) basitlik saglamak amaciyla aga (140) bagli olarak
gösterilmistir. Uygulamada, daha fazla veya daha az istemci cihazlari ve sunucular
olabilir. Ayrica, bazi örneklerde, bir istemci cihazi bir sunucunun fonksiyonlarini yerine
getirebilir ve bir sunucu bir istemci cihazin fonksiyonlarini yerine getirebilir.
Istemci cihazlari (110) ana bilgisayarlar, mini bilgisayarlar, kisisel bilgisayarlar, dizüstü
bilgisayarlar, kisisel dijital yardimcilar veya benzeri aga (140) baglanabilen cihazlari
içerebilir. Istemci cihazlari(110) bir kablolu, kablosuz ve optik baglanti araciligiyla ag
(140) üzerinden veri iletebilir veya agdan (140) veri alabilir.
SEKIL 2 mevcut bulus ile uyumlu bir örnek istemci cihazini (110) gösterir. Istemci
okunur bellegi (ROM) (240), bir depolama cihazini (250), bir giris cihazini (260), bir
çikis cihazini (270) ve bir iletisim arayüzünü (280) içerebilir.
Veri yolu (210) istemci cihazin (110) bilesenleri arasinda iletisime izin veren bir veya
daha fazla klasik veri yolunu içerebilir. Islemci (220) yönergeleri yorumlayan ve yürüten
herhangi tipte klasik islemci veya mikroislemci içerebilir. Ana bellek (230) bir rastgele
erisimli bellek (RAM) veya islemci (220) tarafindan yürütmeye yönelik bilgileri ve
yönergeleri depolayan bir baska tip dinamik depolama cihazi içerebilir. ROM (240)
klasik bir ROM cihazi veya islemci (220) tarafindan kullanmaya yönelik statik bilgileri ve
yönergeleri depolayan bir baska tip statik depolama cihazi içerebilir. Depolama cihazi
(250) bir manyetik ve/veya optik kayit ortami ve ilgili sürücüsünü içerebilir.
Giris cihazi (260), bir kullanicinin bir klavye, bir fare, bir kalem, ses algilama ve/veya
biyometrik mekanizmalar, vb. gibi istemci cihazina (110) bilgi girmesini saglayan bir
veya daha fazla klasik mekanizmalar içerebilir. Çikis cihazi (270) bir ekran, bir yazici,
bir hoparlör, vb. içeren kullaniciya bilgi gönderen bir veya daha fazla klasik mekanizma
içerebilir. Iletisim arayüzü (280) istemci cihazin (110) diger cihazlar ve/veya sistemler
ile iletisim kurmasini saglayan herhangi bir alici benzeri mekanizma içerebilir. Örnegin,
iletisim arayüzü (280), ag (140) gibi bir ag üstünden bir baska cihaz veya sistem
araciligiyla iletisim kurmaya yönelik mekanizmalar içerebilir.
Asagida daha detayli açiklanacagi üzere, mevcut bulus ile uyumlu istemci cihazlar
(110) belirli arama ile ilgili islemleri gerçeklestirir. Istemci cihazlar (110), bu islemleri
bellek (230) gibi bir bilgisayarda okunabilir ortamda bulunan yazilim yönergelerini
yürüten bir islemci (220) karsisinda gerçeklestirebilir. Bilgisayarda okunabilir bir ortam
bir veya daha fazla bellek cihazlari ve/veya tasiyici dalgalari olarak tanimlanabilir.
Yazilim yönergeleri veri depolama cihazi (250) gibi bir baska bilgisayarda okunabilir
ortamdan veya iletisim arayüzü (280) araciligiyla bir baska cihazdan bellege (230)
okunabilir. Bellekte (230) bulunan yazilim yönergeleri islemcinin (220) asagida
açiklanan arama ile ilgili aktiviteleri gerçeklestirmesine neden olur. Alternatif olarak,
mevcut bulus ile uyumlu prosesleri uygulamak üzere yazilim yönergelerinin yerine veya
birlikte donanimla bütünlesik kullanilabilir. Bu yüzden, mevcut bulus donanim devresi
ve yazilimin herhangi bir spesifik kombinasyonu ile sinirli degildir.
kurmasini saglamak üzere aga (140) baglanabilen bir ana bilgisayar, mini bilgisayar
veya kisisel bilgisayar gibi bir veya daha fazla bilgisayar sistemi tipi içerebilir. Alternatif
uygulamalarda, sunucular (120 ve 130) bir veya daha fazla istemci cihazina (110)
dogrudan baglanmaya yönelik mekanizmalar içerebilir. Sunucular (120 ve 130) bir
kablolu, kablosuz ve optik baglanti araciligiyla ag (140) üzerinden veri iletebilir veya
agdan (140) veri alabilir.
Sunucular istemci cihaza (110) yönelik SEKIL 2'ye göre yukarida açiklanan benzer bir
sekilde konfigüre edilebilir. Mevcut bulus ile uyumlu bir uygulamada, sunucu (120)
istemci cihazlar (110) tarafindan kullanilabilen bir arama motorunu (125) içerebilir.
Sunucular (130) istemci cihazlar (110) tarafindan erisilebilen belgeleri (veya web
sayfalarini) depolayabilir.
C. Mimari Çalisma
SEKIL 3 örnegin sunucularin (130) birinde depolanabilen üç belgeyi gösteren bir
çizelgeyi gösterir.
Bir birinci belge (Belge 1) iki giris--"Car repair" ve "car rental"-- içerir ve altinda "3"
olarak sayi ile ifade edilir. Bir ikinci belge (Belge 2) “video rental” girisini içerir. Bir
üçüncü belge (Belge 3) üç giris--"wine . champagne” ve "bar items"-- içerir ve Belge
Z'ye bir baglanti (veya referans) içerir.
Gösterim basitligi saglamak amaciyla, SEKIL 3'te gösterilen belgeler sadece
alfanümerik bilgi dizilerini içerir (örnegin, "car", "repair", “Wine", vb.). Ancak teknikte
uzman kisiler diger durumlarda belgelerin fonetik veya görsel isitsel bilgiler gibi diger
bilgi türlerini içerebildigini anlayacaktir.
SEKIL 4a, SEKIL 3'te gösterilen belgelere göre klasik bir alfanümerik dizini gösterir.
Dizinin birinci sütunu bir alfanümerik terim listesi içerir ve ikinci sütun bu terimlere
karsilik gelen belgelerin bir listesini içerir. Alfanümerik terim “3” gibi bazi terimler
sadece bir belgeye karsilik gelir (örnegin görünür)--bu durumda Belge 1. “rental” gibi
diger terimler birçok belgeye--bu durumda Belge 1 ve 2'ye karsilik gelir.
SEKIL 4b bir arama motoru (125) gibi klasik bir arama motorunun, bir alfanümerik
arama sorgusu karsisinda arama sonuçlari saglamak üzere SEKIL 4a'da gösterilen
dizini nasil kullandigi gösterilir. Alfanümerik sorgu herhangi bir klasik teknik kullanilarak
olusturulabilir. Gösterme amaciyla, SEKIL 4b iki alfanümerik sorguyu gösterir: "car" ve
sorgu alir ve 0 sorguya (adim (420)) karsilik gelen belgeleri belirlemek üzere
alfanümerik dizini kullanir. Bu örnekte, klasik bir arama motoru (125) “araba”
kelimesinin Belge 1'e karsilik geldigini belirlemek üzere SEKIL 4alda gösterilen dizini
kullanacak ve Belge 1'i (ona bir referansi) kullaniciya bir arama sonucu olarak geri
verecektir. Benzer bir sekilde, klasik bir arama motoru “sarap" kelimesinin Belge 3'e
karsilik geldigini belirleyecek ve Belge 3lü (ona bir referansi) kullaniciya (adim (430))
geri verecektir.
SEKIL 5a, sirasiyla SEKILLER 3 ve 4a'da gösterilen belgelere ve dizine göre, bir
nümerik arama sorgusu karsisinda arama sonuçlari saglamaya yönelik tercih edilen bir
teknigin bulus ile uyumlu, bir akis çizelgesini gösterir. Kolaylik saglamak amaciyla,
SEKIL 5a standart bir telefon ahizesinin eslestirmesine dayanarak bir nümerik tus
islemeye yönelik özel bir teknigi açiklar, fakat teknikte uzman kisi bulus ile uyumlu diger
tekniklerin kullanilabilecegini anlayacaktir.
Adimda (510) bir dizi “227” ("2", "2" ve "7” nümerik bilesenlerinden olusan) bir
kullanicidan alinir. Adimda (520), nümerik bilesenlerin harflere nasil eslestigi hakkinda
bilgi elde edilir. Kullanicinin bilgileri standart bir telefon tus takimindan girdigi kabul
edildiginde, bu eslestirme bilgileri SEKIL 5b'de gösterilir. SEKIL 5b'de gösterildigi gibi,
harflerinin her biri “1” rakamina eslesir, p , q , r ve "s“ harflerinin her
biri “7” rakamina eslesir ve benzeri.
Adimda (530), bu eslestirme bilgisini kullanarak, dizi "227” potansiyel alfanümerik
esdegerlerine çevrilir. SEKIL 5b7de gösterilen bilgiye dayanarak, asagidakileri içeren,
abp, bbp, bar car ccs. Rakamlar olasi kombinasyonlarda yer aldiginda (örnegin,
yerine, olusturulan esdegerlerinin bazi sözlüklere göre sinirlanmasi istenebilir. Örnegin,
sadece bir sözlükte, önceki arama sorgularinin arama motoru günlügünde ve
benzerinde görünen alfanümerik esdegerleri olusturmak veya bilinen istatistiksel
teknikleri (örnegin belirli sözcüklerin birlikte görülme olasiligi) kullanarak alfanümerik
esdegerleri sinirlamak istenebilir.
Adimda (540) bu alfanümerik es degerler, klasik bir arama motoruna bir mantiksal “OR”
islemi kullanarak SEKILLER 4a ve 4b'ye referansta açiklandigi gibi klasik bir arama
motoruna bir giris olarak saglanir. Örnegin, arama motoruna saglanan arama sorgusu
es degerler arama motoruna saglanabildigi halde, bunun yerine amaçlanmayan es
degerlerini ortadan kaldirmak üzere klasik teknikleri kullanarak bir alt set kullanilabilir.
Örnegin, harflerin veya sözcüklerin kullanimi hakkinda olasiliksal bilgiden yararlanan
teknikleri kullanarak olasi kombinasyonlarin daha dar bir listesini olusturabilir: bir
kullanici "qt" ile baslayan kombinasyonlari hariç tutabilir fakat "qu” ile baslayan
kombinasyonlari dâhil edebilir (ve tercih edebilir).
Adimda (550), arama sonuçlari arama motorundan elde edilir. Arama motorunun
dizininde "aap" ve "abp" gibi terimler görülmediginden, bunlar etkili bir sekilde hariç
tutulabilir. Aslinda, SEKIL 4b'de gösterilen dizin içinde sadece “araba” ve “bar” terimleri
bulunur ve bu yüzden yalnizca Belgeler 1 ve 3'e referans yapan arama sonuçlari geri
verilir. Adimda (560), bu arama sonuçlari kullaniciya sunulur. Arama sonuçlari arama
motoru ile saglanan ayni düzende sunulabilir veya kullanicinin dili gibi
degerlendirmelere göre tekrar düzenlenebilir. Kullanicinin sadece “bar” terimi içeren
belgelerle ilgilendigini kabul ettigimiz takdirde, kullanici istenen sonucun (Belge 1) yani
sira istenmeyen bir sonuç (Belge 3) alacaktir. Ancak, arama sorgusunu formüle etmek
üzere üç tusa basmak zorunda olmasi nedeniyle kullanicinin yararina olacaktir.
SEKIL 6, sirasiyla SEKILLER 3 ve 4a'da gösterilen belgelere ve dizine göre, bir
nümerik arama sorgusu karsisinda arama sonuçlari saglamaya yönelik tercih edilen bir
teknigin bulus ile uyumlu, bir diger akis çizelgesini gösterir. Bu akis çizelgesi alinan
dizinin boyutunu artirmanin kullanici tarafindan istenen arama sonuçlarini sinirlamaya
nasil yardimci olabilecegini gösterir. Gösterim kolayligi saglamak amaciyla, SEKIL 6
standart bir telefon ahizesinin eslestirmesine bagli olarak bir nümerik sorguyu islemeye
yönelik özel bir teknigi açiklar, fakat teknikte uzman kisiler bulus ile uyumlu diger
tekniklerin de kullanilabilecegini anlayacaktir.
bilesenlerinden olusan) bir kullanicidan alinir. Açiklama saglamak amaciyla. dizi “227"
bir “rakam sözcügü” olarak adlandirilacak ve tüm dizi "227 48367” bir rakam ifadesi
olarak adlandirilacaktir. Bir rakam sözcügünün olasi alfanümerik esdegerleri “harf
sözcükleri” olarak adlandirilacak ve bir rakam ifadesinin olasi alfanümerik esdegerleri
Adimda (620), nümerik bilesenlerin harflere nasil eslestigi hakkinda bilgi elde edilir.
Ayni eslestirme bilgisinin SEKIL 5b'de gösterildigi gibi kullanildigi kabul edildiginde,
SEKIL 5btde gösterilen bilgiye dayanarak, "227 48367” dizisine karsilik gelen olasi harf
ifadeleri 11664 bulunur.
Adimda (640), bu harf ifadeleri SEKILLER 4a ve 4b'ye göre açiklananlar gibi bir
mantiksal ”OR” islemi kullanilarak klasik bir arama motoruna bir giris olarak saglanir.
Örnegin, arama motoruna saglanan arama sorgusu "'aap gtdmp' OR 'aap htdmp' OR
saglanabildigi halde, bunun yerine amaçlanmayan es degerlerini ortadan kaldirmak
üzere klasik teknikleri kullanarak bir alt set kullanilabilir.
Adimda (650), arama sonuçlari arama motorundan elde edilir. Arama motorlarinin çogu
aranan tam ifadeyi içeren belgeleri yüksek düzeyde siralamak üzere tasarlandigindan,
Belge 3 muhtemelen en yüksek siralanan arama sonucu olacaktir (baska bir deyisle,
olusturulan diger harf ifadelerini içermez. Ayrica, birçok arama motoru tüm Ifade yerine
bir ifadenin bazi parçalarini içeren arama sonuçlarini hariç birakilir (veya çikarilir).
Örnegin, harf ifadesinin ikinci parçasina karsilik gelen herhangi bir harf içermediginden,
harf ifadesinin birinci parçasina karsilik gelen “araba” harf sözcügünü içerdiginden
Belge 1 hariç birakilir (veya çikarilir). Son olarak, arama motorunun dizininde görünen
hiçbir harf sözcügü içermediginden “aaa htdmp" gibi harf ifadeleri etkili bir sekilde hariç
birakilir.
Adimda (660), arama sonuçlari kullaniciya sunulur. Gösterilen örnekte, kullaniciya
gösterilen ilk sonuç, kullanicinin sorgusu ile muhtemelen en ilgili olan, Belge 3
olacaktir. Belge 1, olasi harf ifadelerinden birini içermediginden tamamen hariç
birakilabilir. Böylece, kullaniciya en ilgili sarama sonuçlari saglanir.
SEKILLER 5 ve 6'ya göre açiklamalar nümerik bilgiyi almaya ve bunu alfanümerik
bilgiye eslestirmeye referansla yapildigindan, teknikte uzman kisiler bulus ile uyumlu
diger uygulamalarin bulus ile uyumlu olmasinin mümkün oldugunu anlayacaktir.
Örnegin, bir kullanici tarafindan basilan tuslara karsilik gelen rakamlarin bir dizisini
almak yerine, alinan dizi kullanici tarafindan basilan tuslara karsilik gelen birinci
harflerden olusabilir. Bir baska deyisle, "227" ifadesini almak yerine, alinan dizi "aap”
olabilir. Bulus ile uyumlu olarak, adimlarda (530 veya 630) olusturulan esdeger harf
dizileri "aap" ifadesine karsilik gelen baska harf dizileri (örnegin “bar”) olabilir. Aslinda,
alinan dizi fonetik, görsel isitsel veya baska herhangi bir tipte bilgi bileseni içerebilir.
Dizinin alindigi form göz önünde bulundurulmaksizin, genellikle alinan dizinin,
genellikle bilginin arama motorunun dizininde depolandigi formata karsilik gelen bir
diziye çevrilmesi tercih edilir. Örnegin, arama motorunun dizini alfanümerik dizinde
depolandiginda, alinan dizi alfanümerik dizilere çevrilmelidir.
Ayrica, genellikle bilgi bilesenlerinin alinan dizisini çevirmek üzere kullanilan eslestirme
tekniginin kullanicinin girisini cihaz tarafindan olusturulan bilgi ile eslestirmek üzere
kullanicinin cihazinda kullanilan ayni teknik olmasi tercih edilir. Ancak kullanici girisine
yönelik kullanilandan farkli bir eslestirme teknigi kullanmak üzere tercih edilebilir
durumlar olabilir. Mevcut bulusun örnekleri hedef olmayan dil klavyelerini kullanarak
girilen aramalari yapmasini saglayabilir. Örnegin, Japonca metin içeren bir web sayfasi
kanji olarak yazilabilir, 0 sayfayi aramaya çalisan bir kullanici sadece Roma alfabesine
dayanan standart bir ASCII klavyesine (veya ahize) erisebilir.
SEKIL 7 bu tür bir aramayi gerçeklestirmeye yönelik bir yöntemi gösterir. SEKIL 7'de
gösterildigi üzere, bir kullanici standart bir giris cihazini (örnegin bir ASCII klavyesi, bir
telefon ahizesi, vb.) kullanarak bir sorguyu yazar ve sorguyu arama motoruna gönderir.
Sorgu, bazi belgelerin yazildigi (örnegin kanji) karakter setinden farkli bir karakter
setinde (örnegin romanji) yazilabilir. Arama motoru sorguyu (blok (702)) alir, onu ilgili
forma/formlara (blok (704)) çevirir ve örnegin klasik arama tekniklerini (blok (706))
kullanarak çevrilen sorguya karsilik gelen belgelere yönelik bir arama gerçeklestirir.
Arama motoru sonra kullaniciya (blok (708)) bir belge listesini (ve/veya belgelerin
kendilerinin kopyalari) geri verir. Örnegin, sonuçlar yukarida SEKIL 6 ile baglantili
açiklananlara benzer bir sekilde geri verilebilir.
SEKIL 7'de gösterildigi üzere, kullanicinin sorgusu, istemcinin aksine, tercihen arama
motorunun sunucusunda çevrilir, böylece kullanicinin çeviriyi yapmak üzere özel
amaçli yazilim elde etme ihtiyacini hafifletir. Ancak, diger örneklerde, çevirinin
bazilarinin veya tamaminin istemcide gerçeklestirilebildigi anlasilacaktir. Ayrica, bazi
örneklerde sorgu bir telefon klavyesi gibi bir cihaz kullanarak girilebilir. Bu tür
örneklerde, baslangiç, nümerik sorgu ilk olarak örnegin, düsük olasilik eslestirmelerini
çikarmak üzere (örnegin romaji'de ortaya çikmayan kombinasyonlari içeren harf
eslestirmeleri) bir sözlük ve/veya olasilik tekniklerinin uygulanmasini içeren,
SEKILLER 5ve6 ile baglantili olarak yukarida açiklanan eslestirme tekniklerini
kullanarak alfanümerik forma (örnegin romaji) dönüstürülebilir. Sorgunun bir
alfanümerik çevirisi elde edildiginde, SEKIL 7'de gösterilen adimlarin kalani
gerçeklestirilebilir (baska bir deyisle 704, 706 ve 708).
Sorgunun bir karakter seti veya dilinden digerine çevrilmesi (baska bir deyisle, SEKIL
7'deki blok (704)) çesitli sekillerde yapilabilir. Bir teknik sorgudaki her terimi hedef dil
veya karakter setindeki ilgili terime eslestirmek üzere kelime anlamlarinin veya
çevirilerinin klasik, statik anlamlarini kullanmaktir. Ancak bu yaklasimin bir sorunu,
kelimeler çogu zaman belirsiz oldugundan ve sorgular çogu zaman bu belirsizligi
çözmeye yönelik yeterli baglamsal ipuçlarina saglamak üzere çok kisa oldugundan
siklikla yanlis sonuçlar vermesidir. Örnegin, Ingilizce "bank" sözcügü, bir nehir kiyisi,
finansal bir kurulus veya bir uçak tarafindan yapilan manevra anlamlarina gelebilir, bu
nedenle de özet kisminda dogru çeviri yapilmasini zorlastirir. Ayrica, sözlük oldukça
büyük olmadiginda ve/veya siklikla güncellenmediginde, arama motorunun
karsilasabilecegi, seyrek kullanilan sözcükler, argo, deyimler, özel isimler ve benzeri
gibi tüm terimlere yönelik girdiler içermeyebilir. Mevcut bulusun örnekleri bir dilden veya
karakter setinden (örnegin ASCII) digerine (örnegin kanji) sorgu terimlerini çevirmek
üzere bir olasiliksal sözlük kullanarak bu sorunlarin bazilari veya tamami çözülebilir
veya düzeltilebilir. Tercih edilen bir örnekte olasiliksal sözlük bir terim setini bir diger
terim setine eslestirir ve bir olasiligi eslestirmelerin her biri ile iliskilendirir. Uygunluk
saglamak amaciyla, bir “terim” veya “jeton” sözcüklere, ifadelere ve/veya (daha
genellikle) bosluklar içerebilen bir veya daha fazla karakter dizisine refere edecektir.
SEKIL 8 yukarida açiklanan gibi bir olasiliksal sözlügün (800) bir örnegini gösterir.
SEKIL 8'de gösterilen örnek olasiliksal sözlük (800) romaji (Japoncanin Roma
alfabesinde bir ifadesi) olarak yazilan sözcükleri kanji (Roma olmayan, kavram yazi
tabanli Japonca karakter seti) olarak yazilan sözcükler ile eslestirir. Açiklamayi
kolaylastirmak üzere, SEKIL 8romaji terimleri liromaji ve kanji terimleri
Ingilizce çevirilerin yerine gerçek romaji ve kanji sözcüklerinin kullanilacagi
anlasilacaktir. Bu nedenle, SEKIL 8tin, Japonca metnin gerçek karakterlerini ve
anlamini göstermek üzere degil mevcut bulusun düzenlemelerinin bir açiklamasini
kolaylastirmak üzere saglandigi anlasilacaktir.
Ayrica sözlük bu tür ifadenin dogru olduguna iliskin bir ilgili olasilik (806) ile birlikte,
kanji (804) olarak yazilan bu terimlerin her birinin olasi ifadelerini içerir. Örnegin, romaji
terimi olarak yazilan Ingilizce "bank" sözcügü, 0.3 olasiligi ile “dik yamaç” kanji terim
anlamina, 0.4 olasiligi ile “finansal kurulus" terim anlamina ve 0.2 olasiligi ile “bir uçak
tarafindan yapilan manevra” terim anlamina eslesebilir. 0.1 olasiligi ile, terim, her terimi
sözlükte bulunmayabilen terimlere eslestirmeyi saglayan bir genel yöntem olan “diger”
ile eslesebilir.
Ayni sekilde, SEKIL 8'de gösterilen örnegin, bir birinci karakter seti veya dilindeki belirli
bir terimin (örnegin “banka” kelimesi) bir baska karakter setinde veya dilinde birden
fazla terime eslesebilecegini göstermek üzere olusturuldugu anlasilacaktir. Ancak
teknikte uzman bir kisi, açiklik saglamak amaciyla, SEKIL 8'deki belirli örnek bu ilkeyi
Ingilizce sözcükleri ve anlamlarini kullanarak gösterir, “bank" sözcügünün gerçek
romaji ifadesi, örnegin, Ingilizce esdegeri (örnegin bir mali kurulusa iliskin sözcük ile bir
uçak tarafindan yapilan manevraya yönelik sözcük arasinda hiçbir belirsizlik
olmayabilir) ile ayni sekilde belirsiz olmayabilir. Ayrica açiklamayi kolaylastirmak
amaciyla, SEKIL 8'de gösterilen sözlük diger açilardan da basitlestirilmistir. Örnegin bir
gerçek olasiliksal sözlük her terime yönelik daha birçok olasi eslestirme içerebilir veya
sadece önceden belirlenmis olasilik esigini asan eslestirmeler içerebilir.
Mevcut bulusun tercih edilen örnekleri bir dil ve/veya karakter setindeki sorgulari bir
diger dile ve/veya karakter setine çevirmek üzere bir olasiliksal sözlük kullanir, böylece
kullanicilarin orijinal sorgu yerine farkli bir karakter setinde ve/veya dilinde yazilan
belgeleri bulmasini saglar. Örnegin, kullanici romaji olarak yazilan "cars" kelimesine
yönelik bir sorgu girdiginde, olasiliksal sözlük "cars" romaji terimini örnegin "cars” kanji
terimi ile eslestirmek üzere kullanilabilir. Böylece, sorgularin (örnegin romaji) karakter
seti ve eslesen belgelerin (örnegin kanji) karakter seti ayni olmadiginda kullanicilar
sorgulari ile ilgili belgeler bulabilir. Bu belirli örnekte, sorgunun gerçek dili degismez
(Japoncayi ifade etmek üzere hem romaji hem de kanji kullanilir), sadece karakter
kodlamasi degisir.
Yine bir diger olarak, ASCII ingilizcede “tired" sözcügü, umlaut-u karakteri ASCIl'de
bulunmadigindan, Latin 1 karakter kodlamasini kullanan Almanca "müde” terimin
eslesebilir. Bu örnekte sözlügün hem bir baska dile çeviri (Ingilizce ile Almanca) hem
de bir baska karakter kodlamasina (ASCII ile Latin 1) bir çeviri saglar.
Tercih edilen düzenlemelerde. yukarida açiklanan eslestirme sözlügü istatistiksel
sözlükler ile baglantili ag üzerinde bulunan bilgiyi kullanarak otomatik bir sekilde
olusturulur. Tercih edilen düzenlemeler dogru çevirilere ulasmak üzere farkli dillerde
ve/veya karakter setlerinde yazilan paralel, hizalanmis çift dilli korpora kullanir. Bu
veriyi kullanarak, tercih edilen düzenlemeler olasi sözcük eslesmelerinin bir sözlügünü
olusturabilir. Bu örnegin, dildeki (Si) (kaynak dil) bir simgenin ayni zamanda hizalanmis
metin çiftinde (örnegin baglantilar, cümleler, vb.) bir simge (Tj) (hedef dil) ortaya çikma
sayisini sayarak kolaylikla yapilabilir. Ancak herhangi bir uygun teknigin
kullanilabilecegi anlasilacaktir.
Yeterince büyük ve dogru hizalanan veri setleri bulunmadiginda, bu yöntem oldukça
belirsiz çok-çok eslesmeleri olusturabilir. Bu nedenle, örnegin 81'in biraz olasilikla T2,
T3, T7 ve Tab eslesebildigi belirlenebilir. Ancak, bu kabul edilebilir ve asagida daha
detayli açiklandigi gibi, örnegin önceki kullanici sorgularini, sonuçlarin sayfasindaki
ögelerin kullanici seçimini ve/veya benzerini inceleyerek her eslestirmenin ilgili
olasiligini artirmak üzere ek gelistirmeler yapilabilir.
SEKIL 9 bir olasiliksal sözlük olusturmak üzere paralel baglanti metninin kullanimini
gösterir. Baglanti metni web sayfalari (veya belirli bir web sayfasi içindeki konumlar)
arasinda bir üst baglanti ile iliskili metni içerir. Örnegin, hiper metin isaretleme dilinde
(HTML),komut asagidaki gibidir: "Banks and Savings
and Loans", http://www.abc.com adresinde bulunan web sayfasina isaret eden bir
üst baglanti olarak "Banks and Savings and Loans" ifadesinin görüntülenmesine neden
olur. "Banks and Savings and Loans" metni baglanti metni olarak adlandirilir ve tipik
olarak isaret ettigi web sayfasina (örnegin www.abc.com) kisa bir açiklama saglar.
Aslinda, baglanti metni çogu zaman sayfanin kendisinden daha dogru bir açiklamasini
saglayacaktir ve dolayisiyla isaret ettigi web sayfasinin dogasini belirlemede özellikle
yararli olabilir. Ayrica, baglanti metnindeki sözcük kullanimi ve dagilim çogunlukla
kullanici sorgularinda bulunan içerige ve uzunluga yakindir. Bu durumda belirli bir
sayfaya isaret eden baglantilarin birçogunun ayni veya büyük ölçüde benzer metni
içerecektir. Örnegin, www.google.com'a isaret eden baglantilar çogu zaman “Google”
kolaylikla diyecektir veya bu terimi diger metin ile birlikte kullanacaktir. Bu yüzden,
katakana gibi tamamini inceleyerek, www.google.com'a isaret eden baglantilar,
arayarak oldukça yüksek derecede bir güven ile sonuç verebilir (muhtemelen “click
here” ifadesini içerenler gibi, belirli önceden tanimlanmis, düsük bilgi-içerikli baglantilari
çikardiktan sonra). Mevcut bulusun tercih edilen örnekleri dogru çeviriler saglamak
üzere baglanti metninin bu karakteristik özelliklerinden yararlanir.
SEKIL 9'a refere edildiginde, bir birinci karakter setinde (örnegin ASClI) (blok 902)
yazilan bir terimi içeren bir sorgunun alinmasindan sonra, sunucu terimin göründügü
bir baglanti metni setini belirler (blok 904). Örnegin, sunucu terimi içeren bu baglantilari
belirlemek üzere tüm bilinen baglantilarin bir dizinini inceleyebilir. Sonra, bu baglanti
noktalarinin belirlendigi (blok (906)) web sayfalari, bu sayfalara (blok (908)) isaret eden
hedef dil veya hedef karakter setinde (örnegin hiragana, katakana ve/veya kanji)
yazilan tüm baglantilar gibidir. Sistem bu noktada iki belge setine sahip olacaktir
(burada baglanti metni bir belge formu olarak degerlendirilir). Bir belge setindeki
(örnegin orijinal ASCII sorgusunu içeren baglantilar) sorgu teriminin dagilimi sonra
diger belge setindeki (örnegin paralel baglantilar) çevrilen ifadeye yönelik en olasi
adaylari belirlemek üzere kullanilir. Istatistikler baglanti metni terimlerinin göründügü
sikliga göre yapilabilir ve bu istatistikler orijinal sorgunun (blok (910)) dogru çevirisi
olan baglanti metninde bulunan terimlerin ilgili sikliklarini ve olasiliklarini belirlemek
üzere kullanilabilir. Çoklu kelimeleri olan sorgularda, her sözcüge yönelik olarak
yukarida açiklanan proses tekrar edilebilir veya tüm sorgu tek bir terim olarak islenebilir
veya bazi uygun sözcük gruplari kullanilabilir. Örnegin, sorgu “büyük evler” oldugunda,
olasi çevirilerin bir sözlügü o ifadeyi (veya ifadedeki sözcüklerden en azindan birini)
içeren hizalanmis baglanti metnini bularak olusturulabilir. Ayni sekilde, sorgu ikiden
fazla terim içerdiginde, uygun bir eslestirme belirlemeye yönelik çalismalar sorgu
terimlerinin uygun alt setlerini toplayarak ve bu terimlere iliskin sonuçlara olusturarak
olusturulabilir.
Bir çeviriyi SEKIL 9'da gösterildigi gibi yapmanin bir avantaji, çeviri sisteminin bir dil
veya karakter seti ile hedef setindeki terimler arasindaki eslestirmelerin önceden
bilgisine sahip olmasi gerekmez. Bunun yerine, eslestirmeler istatistiksel analiz yapmak
üzere bulunan verinin gövdesinde dinamik olarak belirlenebilir. Bu yüzden, örnegin bir
klasik statik sözlügü koruma çalismasina veya harcamasina girmeden argo terimlere,
deyimlere, özel isimlere ve benzerine yönelik dogru çeviriler bulmak mümkün hale
gelecektir.
Önceki çeviri tekniklerinin bir açiklayici örnegi bu noktada SEKILLER 10-12 ile
baglantili olarak açiklanacaktir. Bu örnekte, kullanicinin “house" sorgu terimini girdigi
ve Ispanyolca yazilan arama sonuçlarini elde etmek istedigi kabul edilir. Dolayisiyla
sunucu Ingilizce ” house” terimini Ispanyolca esdegerine çevirmeye çalisacaktir.
iliskili baglantili metni Ingilizce yazilir (baska bir deyisle 959a-e ve 963a-t) ve bazilari
Ispanyolca yazilir (baska bir deyisle sayfalar 961a-e ve 965a-j). Sunucu ilk olarak
depolanan baglanti metninin bir dizinini arayarak yerlestirilebilir. Bu tür bir dizini
kullanarak, sunucu ilk olarak her biri “big house” ifadesini kullanan ve web sayfasina
(972) isaret eden bes baglantiyi (960) bulabilir. Sunucu sonra sayfaya (972) isaret
eden bes hedef dil (baska bir deyisle Ispanyolca) baglantisi (962) oldugunu da belirler.
SEKIL 10'da gösterilen örnekte bu baglantilar "casa grande” metnini içerir. Ayni
sayfaya veya buna önceden tanimlanmis iliskiye dayanan sayfalar isaret eden
baglantilar (baglantilar (960) ve baglantilar (962) gibi) ”hizalanmis” olarak Ifade edilir,
burada daha gen bir açidan, hizalanma tipik olarak hizalanmis ögelerin esdegerine
SEKIL 11A her hedef dil teriminin hedef dil baglantilarinda (962) görülme sikligini
gösterir. SEKIL 11A'da gösterildigi gibi, "casa" ve "grande” terimlerinin her biri bes defa
görünür (baska bir deyisle her baglantida (962) bir defa). Bu yüzden, hedef
baglantilarda (962) (baska bir deyisle bes baglantinin her birinde iki terimi) görünen
toplam on terimden “casa” yarisina ve “grande” diger yarisina karsilik gelir. Dolayisiyla,
SEKIL 11A'da gösterildigi üzere, bu noktada "house" terimi, her iki terim de esit siklikla
göründügünden "casa" veya "grande“ terimine esit siklik ile eslesebilir.
Ancak, SEKIL 10'da gösterildigi üzere, sistem ayrica "house" terimini içeren ve sayfaya
(974) isaret eden yirmi Ingilizce baglanti (964) ve "casa" terimini içeren ve ayni
zamanda sayfaya (974) isaret eden en Ispanyolca baglanti (966) bulur. SEKIL 11B'de
gösterildigi üzere, bu noktada "house" terimi 0.75 (baska bir deyisle 15/20) ve "grande"
terimi 0.25 olasilik (baska bir deyisle 5/20) ile eslesecektir. Bu olasiliklar hedef dil
baglantisinda (baska bir deyisle “casa” örnegin on bes) her terimin toplam ortaya çikma
sayisini hedef dil bagIantisindaki-kopyalari-içeren-terimlerin toplam sayisina (baska bir
deyisle yirmi terim: baglantilarda (962) yer alan on ve baglantilarda (964) yer alan on)
kolaylikla bölünmesi ile hesaplanabilir. Alternatif olarak veya bunun yani sira, belirli bir
çeviri veya eslestirmenin olasiliklarini hesaplamak ve/veya iyilestirmek üzere baska
teknikler kullanilabilir. Örnegin, teknikte uzman kisi Bayes yöntemi, histogram
düzeltme, kernel düzeltme, çekme tahmin edicileri ve/veya diger tahmin teknikleri gibi
olasilik tahminlerinin varyans hatasini azaltmaya yönelik olarak çesitli iyi bilinen
tekniklerin kullanilabilecegini anlayacaktir.
Daha fazla baglanti metni bulundugunda, olasiliklar daha da iyilestirilebilir. Örnegin,
son bir olasilik dagilimi SEKIL 12'de gösterilene benzer olabilir, burada “house"
oldukça yüksek bir olasilik ile “casa” ve daha küçültmeli formu "casita" ve "casino" ve
terimler ile eslesir. Bu yüzden, çevrilen dillerin ve/veya karakter setlerinin bilgisi
olmadan benzer es anlamlarin yani sira dogru bir çeviri elde edilebilir.
Sorgu terimler çevrildikten sonra, sunucu artik bu noktada çeviriyi kullanarak bir arama
yapabilir. Örnegin, bir kullanici "hotels in Kyoto” ifadesine yönelik bir romaji sorgusunu
girecek oldugunda, sunucunun bu sorgulari kullanarak sorgunun katakana, hiragana ve
kanji formlarinda sonuç vermesini saglamak, bu sorgulari kullanarak aramalar yapmak
üzere ve sonra kullaniciya bir ilgili kullanici arayüzü içinde bu sorgu formlarinin her
birine yönelik kombine sonuçlar sunmak üzere yukarida açiklanan teknikler
kullanilabilir.
SEKILLER 10-12 ile baglantili açiklanan örnegin sadece gösterim amaciyla saglandigi
ve sinirlama olmaksizin burada gösterilen yönteme birçok degisiklik yapilabilecegi
anlasilmalidir. Örnegin, farkli istatistiksel teknikler olasiliklara ulasmak üzere
kullanilabilir ve yukarida açiklanan temel tekniklerde degisiklikler yapilabilir. Ayni
sekilde, yukarida açiklanan çeviri tekniginin kullanicilar tarafindan girilen sözcüklerin
veya ifadelerin çevirilerini gerçeklestirmek üzere kolaylikla kullanilabilir ve bir iliskili
Internet aramasini yapmak veya bir olasiliksal sözlük olusturmak üzere kullanilmasi
gerekmez. Ayrica, önceki örnek çeviri prosesini bir kullanicinin sorgusu alindiktan
sonra gerçeklesiyor olarak açiklamasina ragmen, diger örneklerde eslestirme prosesi
kullanici sorgusu alinmadan önce gerçeklestirilebildigi anlasilmalidir. Bu tür önceden
hesaplanan eslestirmeler SEKIL 8'de açiklandigi gibi, alindiklari gibi kullanici
sorgularini çevirmek üzere uygulanabilir. Son olarak, hizalanmis baglanti metninin
çeviriyi yapmak üzere kullanilabildigi anlasilmalidir. Örnegin, hizalanmis cümleler veya
diger veriler benzer bir sekilde kullanilabilir. Birçok ülkede birden fazla resmi veya kabul
edilen dil bulunur ve gazeteler ve dergilerin çogu zaman bu dillerin her birinde yazilan
ayni makaleyi içerecektir. Bu paralel geçisler, sözcük çevirilerinin olasilik sözlüklerini
hazirlamak üzere Önceden açiklanan baglanti metni ile ayni sekilde kullanilabilir.
Bu nedenle, tercih edilen örnekler kullanicilarin sorgulari ve/veya çeviri taleplerini
uygun bir sekilde (örnegin bir ASCII klavyesini kullanarak) girmesini ve dogru ve
otomatik bir çeviri ve arama saglamasini olanakli kilar. Bazi örneklerde yukarida
açiklanan model ek iyilestirmeler yapilabilir. Örnegin, bazi örneklerde, orijinal sorguda
ve/veya diger hizalanmis baglantilardaki terim sayisina benzer bir dizi terim içeren
baglantilara bir tercih (agirlik) verilebilir. Örnegin, SEKIL 10`da gösterildigi üzere,
orijinal sorgu gibi, her biri tek bir terim içerdiginden sayfaya (974) isaret eden
baglantilar tercih edilebilir. Ayni sekilde, “la casa grande” metnini içeren bir baglanti
ayrica sayfa 972'ye isaret ettiginde, hizalandigi diger baglantilardan daha fazla terim
(baska bir deyisle 3), içerdiginden onun agirligi bir ilgili faktör ile azaltilabilir. Bu tür bir
agirlik semasi, bu baglantilarin terimleri ile iliskili sikliklari uygun bir faktör ile çarparak
SEKIL 11B'de gösterilen olasilik hesaplamasinda yansitilabilir.
Yukarida açiklanan gibi çeviri prosesi ayrica aramanin kendisinin etkililigini gelistirmek
üzere kullanilabilir. Örnegin, olasiliksal sözlük hareket halindeki sorgulari örnegin
orijinal sorgu terimlerinin çesitli çevirilerini ve es anlamlarini içerecek sekilde
genisletmek üzere kullanilabilir. Kullanici sorgularini belgeyi almadan önce genisletmek
üzere, ayni kavramlara yönelik es zamanli aramalar gerçeklestirilebilir, böylece arama
sonuçlarinin kullanicinin aramasini içerecegine Iliskin olasiligi artirir. Alternatif olarak
veya bunun yani sira, olasiliksal sözlük, belge terimlerinin genislemelerini saglayan
normal belge dizini olusturma prosesini desteklemek üzere kullanilabilir. Örnegin, bir
belgede bulunan terimler olasiliksal sözlükten çeviriler olan belge dizininde
desteklenebilir, böylece belgenin orijinal belgede bulunan ayni terimleri tam olarak
kullanmayan aramalar ile esit olarak konumlandirilma olasiligini artiracaktir.
Yukarida açiklanan çeviri tekniklerini kullanirken ortaya çikabilen bir sorun veri
seyrekligi (örnegin sonuçta "casa" teriminin "house” ile eslesmesini belirlemek üzere
yeterli) veya veri bulunmamasi nedeniyle (örnegin baglantilarin tümü ayni seyi ifade
eder), sistem yeterince dogru olasiliksal eslestirmelere ulasamayabilir. Bu nedenle,
bazi örneklerde olasiliksal eslestirmeler kullanici davranisini inceleyerek daha da
gelistirilebilir. Birçok ömekleyici teknik asagida açiklanir.
Örnegin, bir kez daha sunucunun“ev” terimine yönelik bir çeviri elde etmek istedigini
kabul edelim. Ancak, bulunabilen tek sadece baglanti metninin “big house” ifadesini
veya “oasa grande” ifadesini içerdigini kabul edelim. Baglanti metninde çesitlilik
bulunmamasi nedeniyle, olasiliksal sözlük asagidaki eslestirmelerde sonuçlanabilir:
house -› casa, 0.5 olasilik
house -› grande, 0.5 olasilik
big -› casa, 0.5 olasilik
big -› grande, 0.5 olasilik
grande -› house, 0.5 olasilik
grande -› big, 0.5 olasilik
casa -› house, 0.5 olasilik
casa -› big, 0.5 olasilik
Bir kullanicinin bu noktada arama motorunu “casa” terimi ile aradigini düsünelim. Bu
noktada, arama motoru “casa” terimini içeren ve ayrica sadece “house” terimini içeren
N sonuçlarinda karistiran sayfalari ve sadece ”big” terimini içeren M sonuçlarini geri
verebilir. Uygulamada, N ve M eslestirmelerin temeldeki olasiliklarini göz önünde
tutmak üzere ayarlanabilir, bu yüzden oldukça benzemeyen eslestirmeler daha az
sonucun görüntülenmesiyle sonuçlanacaktir. Kullanicilarin sadece “big" terimini içeren
sonuçlara tikladigindan on kat daha fazla “house” terimini içeren sonuçlara
tikladiginda, eslestirmelerin olasiliklari örnegin asagidaki gibi ayarlanabilir:
house -› casa, 0.9 olasilik
house -› grande, 0.1 olasilik
big -› casa, 0.1 olasilik
big 4 grande, 0.9 olasilik
grande -› house, 0.1 olasilik
grande -› big, 0.9 olasilik
casa -› house, 0.9 olasilik
casa a big, 0.1 olasilik
Gerçek sayilarin, tiklamalari hesaba katilmis kullanici sayisi, her iki terimi içeren
sayfadaki tiklama sayisi, sonuç seti içindeki söz konusu terimleri içeren sonuçlari
yerlestirme ve/veya benzeri gibi çesitli faktörlere bagli olabildigi unutulmamalidir. Bu
örnekte (baska bir deyisle 0.1 ve 0.9) verilen ayarlanmis olasiliklarin sadece açiklama
amaçlarina yönelik verildigi unutulmamalidir. Teknikte uzman bir kisi yukarida
açiklanan gibi kullanici geri bildirimine verilen gerçek agirligin herhangi bir uygun
sekilde uygulanabilecegini anlayacaktir.
Ayrica kullanici geri bildiriminin kullaniminin açiklamasini kolaylastirmak üzere
basitlestirilmis oldugu unutulmamalidir. Örnegin, bazi sistemlerde, belirli bir çeviriyi
yapmada yardimci olmak üzere diger çevirilerden elde edilen bilgiden yararlanmak
mümkün olacaktir. Örnegin, yukarida verilen örnekte, “house” terimi sadece “big
house” geçen baglanti metninde göründügünde bile, “house" teriminin “grande”
teriminden daha fazla “casa” terimi ile uygun bir sekilde eslestigini belirlemek halen
daha mümkün olabilir. Örnegin, çok yüksek olasiligi ve yeterince fazla veri setinden
fazla “big” teriminin “grande” terimine eslestigi önceden belirlenmis oldugunda (ve
baglanti metninin nadiren bir es anlamli listesinden olustugu kabul edildiginde),
baglantilar “house” veya “casa” etkisiz oldugunda bile, bu durumda house-to-casa
eslestirmesi yine de house-to-grande eslestirmesine tercih edilebilir.
Ayrica çevirinin dogrulugu ve/veya arama sonuçlarinin yararliligi kullanicinin sorgu
oturumu geçmisini inceleyerek gelistirilebilir. Örnegin, çogu durumda sistem
kullanicinin girdigi önceki sorgulari (örnegin bir kullanicinin hesabinda depolanan
çerezler veya bilgiler araciligiyla) bilecektir. Geçmis verisi bu kullanicidan olasi sorgu
anlamlarini siralamak üzere kullanilabilir, böylece “bank” ifadesinin balik tutma ile ilgili
sorgularinin belirsizligini uçma ile ilgili olanlardan potansiyel olarak ortadan kaldirir.
Böylece, bu proses olasi çeviri setini daraltmak üzere kullanilabilir. Bazi
düzenlemelerde, sistem kullanici arayüzünde "Did you mean to search for X" gibi bir
mesaj ile baglantili olarak görüntüleyerek bunlari önerebilir, bununla beraber ayrica
olasi formülasyonlarin her birinde az sayida sonucu sonuçlarin ilk sayfasinda
potansiyel olarak gösterir. Bir kullanici "did you mean ekrani ile önerilen
alternatiflerin birini veya sonuçlar sayfasinda verilen sonuçlardan birini seçtiginde,
sistem kullanicinin olasi arama sapmasinin yani sira sorgu sözcügünün(sözcüklerinin)
olasi çeviriler hakkinda ek kanit elde edecektir. Bu sinyallerin her ikisi de kullaniciya
özgü durumun yani sira genel durumdaki terim eslestirmelerine yönelik olasilik
puanlarini (örnegin olasiliksal sözlük) güncellemek üzere sistem tarafindan
kullanilabilir.
D. Sonuç
Yukarida daha detayli açiklandigi gibi, bulus ile uyumlu yöntemler ve sistemler terimleri
karakter setine ve/veya dillere çevirmek üzere belirsiz arama sorgulari karsisinda
arama sonuçlari saglamak üzere kullanilabilir. Çesitli çeviri ve arama teknikleri ve
sistemleri açiklanmistir. Ancak, önceki açiklamanin gösterim amaciyla sunulmus
oldugu ve yukaridaki ögretilerin isiginda birçok modifikasyonun ve varyasyonun veya
bulusun uygulanmasi yoluyla mümkün oldugu anlasilacaktir. Örnegin, önceki açiklama
bir istemci-sunucu mimarisine dayanmasina ragmen, teknikte uzman kisiler bulus ile
uyumlu bir uçtan uca mimarinin kullanilabilecegini anlayacaktir. Ayrica, açiklanan
uygulama yazilim içermesine ragmen, bulus donanim ve yazilimin bir kombinasyonu
halinde veya sadece bir donanimda uygulanabilir. Ayrica, mevcut bulusun açilari
bellekte depolanmis olarak açiklanmasina ragmen, teknikte uzman bir kisi bu açilarin
sabit diskler, disketler, CD-ROM gibi sekonder depolama cihazlari gibi bilgisayarda
okunabilir diger ortam türlerinde, Internetten bir tasiyici dalga veya diger RAM veya
ROM formlarinda depolanabilecegini anlayacaktir. Dolayisiyla bulusun kapsami
istemler ve bunlarin esdegerleri ile belirlenecektir.
Claims (1)
- ISTEMLER Bilgisayar tarafindan uygulanan bir yöntem olup özelligi asagidakileri içermesidir: bir birinci formatta yazilan en az bir sorgu terimini içeren bir sorgu alma; sorgu terimini bir olasiliksal sözlügü (800) kullanarak bir ikinci formatta yazilan birçok varyanta çevirme, olasiliksal sözlük birinci formattaki bir terim setini (802) ikinci formattaki bir diger terim setine (804) eslestirir ve bir olasiligi (806) eslestirmelerin her biri ile eslestirir; ve sorguya karsilik gelen ikinci formatta yazilan bilgiye yönelik arama yapmak üzere bir veya daha fazla varyant kullanma; ve olasiliksal sözlükteki (800) olasiliklari (806) bir kullanicinin arama sonuçlari ile etkilesimini kullanarak güncelleme. Istem 1'e göre yöntem olup, özelligi ayrica asagidaki adimlari içermesidir: kullanicidan önceki sorgulari kullanarak sorgunun olasi anlamlarini siralama. Istem 1'e göre yöntem olup özelligi ayrica asagidaki adimlari içermesidir: bir mesaj önerme alternatifleri ile baglantilari olarak bir kullanici arayüzünde bir olasi çeviri setinde görüntüleme, bununla beraber olasi çevirilerden bir dizi sonuç görüntüleme, burada kullanici önerilen alternatiflerden birini veya görüntülenen sonuçlardan birini seçtiginde olasiliklar (806) güncellenir. Istem 1'e göre yöntem olup, özelligi güncellemenin kullanicinin sonuçlara tiklamasina bagli olmasidir. Istem 1'e göre yöntem olup, özelligi eslestirmenin sorgu alinmadan önce gerçeklesmesidir. Istem 1'e göre yöntem olup, özelligi terimin ikinci formatta bir veya daha fazla varyant olasiligi ile eslesmesidir. Istem 1'e göre yöntem olup, özelligi olasiliksal sözlügün (800) arama gerçeklesmeden önce varyantlari bir üçüncü formata çevirmek üzere ayrica kullanilmasidir. Istem 1”e göre yöntem olup, özelligi sorgunun bir telefon tus takimindan girilen bir nümerik sorgu olmasi, ikinci formatin alfanümerik metin olmasi, çevirinin asagidakileri içermesidir: sorgu terimini birinci formattaki potansiyel alfanümerik çeviriler grubuna çevirme; önceden tanimlanmis düsük olasilikli karakter kombinasyonlarini içermek üzere belirlenen potansiyel alfanümerik çevirilerin bir veya daha fazlasini çikarma; kalan potansiyel alfanümerik çevirileri birinci formattan ikinci formatta yazilan çok sayida varyanta bir olasiliksal sözlügü kullanarak çevirme; varyantlarin bir veya daha fazlasini kullanma asagidakini içerir: alfanümerik çevirileri kullanarak ikinci formatta bir arama yapma. Istem 1'e göre yöntem olup, özelligi birinci formatin bir telefon tus takimindan girilen bir rakam dizisini içermesidir; ve burada ikinci format alfanümerik metni Istem 1'e göre yöntem olup, özelligi ayrica asagidaki adimlari içermesidir: önceden tanimlanmis bir sözlügün parçasi olmayan çok sayida varyanttaki varyantlari çikararak bir veya daha fazla varyant elde etme. Istem 1'e göre yöntem olup, özelligi ayrica asagidaki adimlari içermesidir: önceden tanimlanmis düsük olasilikli karakter kombinasyonlarini içeren çok sayida varyanttaki varyantlari çikararak bir veya daha fazla varyant elde etme. Istem 1'e göre yöntem olup, özelligi birinci formatin romaji, romaja ve pinyin'den olusan gruptan seçilen bir karakter setinde yazilan alfanümerik metni içermesi; ve burada ikinci formatin kanji, katakana, hiragana, hangul. hanja ve geleneksel Çince karakterlerden olusan gruptan seçilen bir karakter setinde yazilan Istem 8'e göre yöntem olup, özelligi birinci formatin romaji, romaja ve pinyin'den olusan gruptan seçilen bir karakter setinde yazilan metni içermesi; ve burada ikinci formatin kanji, katakana, hiragana, hangul, hanja ve geleneksel Çince karakterlerden olusan gruptan seçilen bir karakter setinde yazilan metni içermesidir. Bir bilgisayarda okunabilir ortamda bulunan bir bilgisayar program ürünü olup, özelligi bilgisayar programi ürününün, bilgisayar sisteminin yöntemler 1 ila 13'ten herhangi birine göre islemler gerçeklestirmesine neden olmak üzere çalistirilabilen yönergeler içermesidir.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/676,724 US8706747B2 (en) | 2000-07-06 | 2003-09-30 | Systems and methods for searching using queries written in a different character-set and/or language from the target pages |
Publications (1)
Publication Number | Publication Date |
---|---|
TR201816343T4 true TR201816343T4 (tr) | 2018-11-21 |
Family
ID=34422117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TR2018/16343T TR201816343T4 (tr) | 2003-09-30 | 2004-09-13 | Farklı bir karakter setinde yazılmış sorguları ve/veya farklı sayfalardan dili kullanarak aramaya yönelik sistemler ve yöntemler. |
Country Status (13)
Country | Link |
---|---|
US (3) | US8706747B2 (tr) |
EP (3) | EP2388709B1 (tr) |
JP (4) | JP4717821B2 (tr) |
KR (4) | KR101140187B1 (tr) |
CN (2) | CN102236702B (tr) |
AT (1) | ATE426206T1 (tr) |
DE (1) | DE602004020086D1 (tr) |
ES (1) | ES2323786T3 (tr) |
HK (1) | HK1163846A1 (tr) |
PL (1) | PL2388709T3 (tr) |
RU (1) | RU2363983C2 (tr) |
TR (1) | TR201816343T4 (tr) |
WO (1) | WO2005033967A2 (tr) |
Families Citing this family (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7136854B2 (en) * | 2000-07-06 | 2006-11-14 | Google, Inc. | Methods and apparatus for providing search results in response to an ambiguous search query |
US8706747B2 (en) | 2000-07-06 | 2014-04-22 | Google Inc. | Systems and methods for searching using queries written in a different character-set and/or language from the target pages |
US9009590B2 (en) * | 2001-07-31 | 2015-04-14 | Invention Machines Corporation | Semantic processor for recognition of cause-effect relations in natural language documents |
CA2371731A1 (en) * | 2002-02-12 | 2003-08-12 | Cognos Incorporated | Database join disambiguation by grouping |
US8055669B1 (en) * | 2003-03-03 | 2011-11-08 | Google Inc. | Search queries improved based on query semantic information |
US7917483B2 (en) * | 2003-04-24 | 2011-03-29 | Affini, Inc. | Search engine and method with improved relevancy, scope, and timeliness |
JP2007514249A (ja) * | 2003-12-16 | 2007-05-31 | スピーチギア,インコーポレイティド | 翻訳機データベース |
US20050138007A1 (en) * | 2003-12-22 | 2005-06-23 | International Business Machines Corporation | Document enhancement method |
US20060047649A1 (en) * | 2003-12-29 | 2006-03-02 | Ping Liang | Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation |
US8825591B1 (en) * | 2003-12-31 | 2014-09-02 | Symantec Operating Corporation | Dynamic storage mechanism |
US8655904B2 (en) * | 2004-02-11 | 2014-02-18 | Ebay, Inc. | Method and system to enhance data integrity in a database |
US7487145B1 (en) | 2004-06-22 | 2009-02-03 | Google Inc. | Method and system for autocompletion using ranked results |
US7836044B2 (en) | 2004-06-22 | 2010-11-16 | Google Inc. | Anticipated query generation and processing in a search engine |
US8392453B2 (en) | 2004-06-25 | 2013-03-05 | Google Inc. | Nonstandard text entry |
US8972444B2 (en) | 2004-06-25 | 2015-03-03 | Google Inc. | Nonstandard locality-based text entry |
CN101091155B (zh) * | 2004-06-29 | 2012-11-28 | 布莱克·布克斯塔夫 | 用于自动智能电子广告的方法和系统 |
US7895218B2 (en) | 2004-11-09 | 2011-02-22 | Veveo, Inc. | Method and system for performing searches for television content using reduced text input |
US7499940B1 (en) | 2004-11-11 | 2009-03-03 | Google Inc. | Method and system for URL autocompletion using ranked results |
US20060106769A1 (en) * | 2004-11-12 | 2006-05-18 | Gibbs Kevin A | Method and system for autocompletion for languages having ideographs and phonetic characters |
US8122034B2 (en) | 2005-06-30 | 2012-02-21 | Veveo, Inc. | Method and system for incremental search with reduced text entry where the relevance of results is a dynamically computed function of user input search string character count |
US10735576B1 (en) * | 2005-07-14 | 2020-08-04 | Binj Laboratories, Inc. | Systems and methods for detecting and controlling transmission devices |
US7788266B2 (en) | 2005-08-26 | 2010-08-31 | Veveo, Inc. | Method and system for processing ambiguous, multi-term search queries |
US7779011B2 (en) | 2005-08-26 | 2010-08-17 | Veveo, Inc. | Method and system for dynamically processing ambiguous, reduced text search queries and highlighting results thereof |
US7737999B2 (en) | 2005-08-26 | 2010-06-15 | Veveo, Inc. | User interface for visual cooperation between text input and display device |
US7672831B2 (en) * | 2005-10-24 | 2010-03-02 | Invention Machine Corporation | System and method for cross-language knowledge searching |
US7805455B2 (en) * | 2005-11-14 | 2010-09-28 | Invention Machine Corporation | System and method for problem analysis |
US7644054B2 (en) | 2005-11-23 | 2010-01-05 | Veveo, Inc. | System and method for finding desired results by incremental search using an ambiguous keypad with the input containing orthographic and typographic errors |
US7895223B2 (en) * | 2005-11-29 | 2011-02-22 | Cisco Technology, Inc. | Generating search results based on determined relationships between data objects and user connections to identified destinations |
US7729901B2 (en) * | 2005-12-13 | 2010-06-01 | Yahoo! Inc. | System for classifying words |
US8010523B2 (en) | 2005-12-30 | 2011-08-30 | Google Inc. | Dynamic search box for web browser |
US7849144B2 (en) | 2006-01-13 | 2010-12-07 | Cisco Technology, Inc. | Server-initiated language translation of an instant message based on identifying language attributes of sending and receiving users |
US7689554B2 (en) * | 2006-02-28 | 2010-03-30 | Yahoo! Inc. | System and method for identifying related queries for languages with multiple writing systems |
US7657526B2 (en) | 2006-03-06 | 2010-02-02 | Veveo, Inc. | Methods and systems for selecting and presenting content based on activity level spikes associated with the content |
JP5057546B2 (ja) * | 2006-03-24 | 2012-10-24 | キヤノン株式会社 | 文書検索装置および文書検索方法 |
US8073860B2 (en) | 2006-03-30 | 2011-12-06 | Veveo, Inc. | Method and system for incrementally selecting and providing relevant search engines in response to a user query |
US8762358B2 (en) * | 2006-04-19 | 2014-06-24 | Google Inc. | Query language determination using query terms and interface language |
US8380488B1 (en) | 2006-04-19 | 2013-02-19 | Google Inc. | Identifying a property of a document |
US8442965B2 (en) * | 2006-04-19 | 2013-05-14 | Google Inc. | Query language identification |
US8255376B2 (en) | 2006-04-19 | 2012-08-28 | Google Inc. | Augmenting queries with synonyms from synonyms map |
EP3822819A1 (en) | 2006-04-20 | 2021-05-19 | Veveo, Inc. | User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content |
US8732314B2 (en) * | 2006-08-21 | 2014-05-20 | Cisco Technology, Inc. | Generation of contact information based on associating browsed content to user actions |
US7536384B2 (en) | 2006-09-14 | 2009-05-19 | Veveo, Inc. | Methods and systems for dynamically rearranging search results into hierarchically organized concept clusters |
US7925986B2 (en) | 2006-10-06 | 2011-04-12 | Veveo, Inc. | Methods and systems for a linear character selection display interface for ambiguous text input |
US7979425B2 (en) * | 2006-10-25 | 2011-07-12 | Google Inc. | Server-side match |
WO2008063987A2 (en) | 2006-11-13 | 2008-05-29 | Veveo, Inc. | Method of and system for selecting and presenting content based on user identification |
US8549424B2 (en) | 2007-05-25 | 2013-10-01 | Veveo, Inc. | System and method for text disambiguation and context designation in incremental search |
US8296294B2 (en) | 2007-05-25 | 2012-10-23 | Veveo, Inc. | Method and system for unified searching across and within multiple documents |
ITTO20070508A1 (it) * | 2007-07-11 | 2009-01-12 | Selex Communications Spa | Procedimento per la codifica di dati numerici in un elaboratore e procedimento per la codifica di strutture dati per la trasmissione in un sistema di telecomunicazioni, basato su detto procedimento di codifica di dati numerici |
EP2570945A1 (en) * | 2007-09-21 | 2013-03-20 | Google Inc. | Cross-language search |
US8725756B1 (en) | 2007-11-12 | 2014-05-13 | Google Inc. | Session-based query suggestions |
US8232973B2 (en) | 2008-01-09 | 2012-07-31 | Apple Inc. | Method, device, and graphical user interface providing word recommendations for text input |
US20090287474A1 (en) * | 2008-05-16 | 2009-11-19 | Yahoo! Inc. | Web embedded language input arrangement |
US8312032B2 (en) | 2008-07-10 | 2012-11-13 | Google Inc. | Dictionary suggestions for partial user entries |
KR20120009446A (ko) * | 2009-03-13 | 2012-01-31 | 인벤션 머신 코포레이션 | 자연 언어 텍스트의 자동화 의미적 라벨링 시스템 및 방법 |
US8275604B2 (en) * | 2009-03-18 | 2012-09-25 | Microsoft Corporation | Adaptive pattern learning for bilingual data mining |
US8577910B1 (en) | 2009-05-15 | 2013-11-05 | Google Inc. | Selecting relevant languages for query translation |
US8572109B1 (en) | 2009-05-15 | 2013-10-29 | Google Inc. | Query translation quality confidence |
US8577909B1 (en) * | 2009-05-15 | 2013-11-05 | Google Inc. | Query translation using bilingual search refinements |
US8538957B1 (en) | 2009-06-03 | 2013-09-17 | Google Inc. | Validating translations using visual similarity between visual media search results |
WO2010139277A1 (en) | 2009-06-03 | 2010-12-09 | Google Inc. | Autocompletion for partially entered query |
US9870572B2 (en) | 2009-06-29 | 2018-01-16 | Google Llc | System and method of providing information based on street address |
US20150261858A1 (en) * | 2009-06-29 | 2015-09-17 | Google Inc. | System and method of providing information based on street address |
KR101083540B1 (ko) * | 2009-07-08 | 2011-11-14 | 엔에이치엔(주) | 통계적인 방법을 이용한 한자에 대한 자국어 발음열 변환 시스템 및 방법 |
US9166714B2 (en) | 2009-09-11 | 2015-10-20 | Veveo, Inc. | Method of and system for presenting enriched video viewing analytics |
US20110191332A1 (en) | 2010-02-04 | 2011-08-04 | Veveo, Inc. | Method of and System for Updating Locally Cached Content Descriptor Information |
US8577915B2 (en) | 2010-09-10 | 2013-11-05 | Veveo, Inc. | Method of and system for conducting personalized federated search and presentation of results therefrom |
US20140379680A1 (en) * | 2010-09-21 | 2014-12-25 | Qiliang Chen | Generating search query suggestions |
US20120167009A1 (en) * | 2010-12-22 | 2012-06-28 | Apple Inc. | Combining timing and geometry information for typing correction |
CN102737015A (zh) * | 2011-04-07 | 2012-10-17 | 英业达股份有限公司 | 具即时翻译的写作系统及其写作方法 |
US20140310585A1 (en) * | 2011-04-28 | 2014-10-16 | Rakuten, Inc. | Browsing system, terminal, image server, program, computer-readable recording medium storing program, and method |
US9779722B2 (en) * | 2013-11-05 | 2017-10-03 | GM Global Technology Operations LLC | System for adapting speech recognition vocabulary |
US9313219B1 (en) * | 2014-09-03 | 2016-04-12 | Trend Micro Incorporated | Detection of repackaged mobile applications |
RU2580432C1 (ru) | 2014-10-31 | 2016-04-10 | Общество С Ограниченной Ответственностью "Яндекс" | Способ для обработки запроса от потенциального несанкционированного пользователя на доступ к ресурсу и серверу, используемый в нем |
RU2610280C2 (ru) | 2014-10-31 | 2017-02-08 | Общество С Ограниченной Ответственностью "Яндекс" | Способ авторизации пользователя в сети и сервер, используемый в нем |
KR102244110B1 (ko) | 2015-02-17 | 2021-04-26 | 삼성전자주식회사 | 이종 언어간 동일성을 판단하는 전자 장치 및 방법 |
US9762385B1 (en) | 2015-07-20 | 2017-09-12 | Trend Micro Incorporated | Protection of program code of apps of mobile computing devices |
CN105069171B (zh) * | 2015-08-31 | 2018-07-13 | 百度在线网络技术(北京)有限公司 | 汉字查询方法和系统 |
CN105335357B (zh) * | 2015-11-18 | 2018-07-06 | 成都优译信息技术有限公司 | 翻译系统中语料推荐方法 |
US9916448B1 (en) | 2016-01-21 | 2018-03-13 | Trend Micro Incorporated | Detection of malicious mobile apps |
US10169414B2 (en) | 2016-04-26 | 2019-01-01 | International Business Machines Corporation | Character matching in text processing |
US9760627B1 (en) * | 2016-05-13 | 2017-09-12 | International Business Machines Corporation | Private-public context analysis for natural language content disambiguation |
US10375576B1 (en) | 2016-09-09 | 2019-08-06 | Trend Micro Incorporated | Detection of malware apps that hijack app user interfaces |
US10614109B2 (en) * | 2017-03-29 | 2020-04-07 | International Business Machines Corporation | Natural language processing keyword analysis |
US11509794B2 (en) * | 2017-04-25 | 2022-11-22 | Hewlett-Packard Development Company, L.P. | Machine-learning command interaction |
US10831801B2 (en) | 2017-05-12 | 2020-11-10 | International Business Machines Corporation | Contextual-based high precision search for mail systems |
US10387576B2 (en) * | 2017-11-30 | 2019-08-20 | International Business Machines Corporation | Document preparation with argumentation support from a deep question answering system |
CN110111793B (zh) | 2018-02-01 | 2023-07-14 | 腾讯科技(深圳)有限公司 | 音频信息的处理方法、装置、存储介质及电子装置 |
JP7247460B2 (ja) * | 2018-03-13 | 2023-03-29 | 富士通株式会社 | 対応関係生成プログラム、対応関係生成装置、対応関係生成方法、及び翻訳プログラム |
KR102637340B1 (ko) * | 2018-08-31 | 2024-02-16 | 삼성전자주식회사 | 문장 매핑 방법 및 장치 |
US11250221B2 (en) * | 2019-03-14 | 2022-02-15 | Sap Se | Learning system for contextual interpretation of Japanese words |
US11308096B2 (en) * | 2019-03-29 | 2022-04-19 | Rovi Guides, Inc. | Bias quotient measurement and debiasing for recommendation engines |
JP7238199B2 (ja) | 2019-07-04 | 2023-03-13 | キヤノン株式会社 | テレコンバータレンズ、レンズ装置、および、撮像装置 |
JP7171519B2 (ja) | 2019-07-04 | 2022-11-15 | キヤノン株式会社 | テレコンバータレンズ、レンズ装置、および、撮像装置 |
US11227101B2 (en) * | 2019-07-05 | 2022-01-18 | Open Text Sa Ulc | System and method for document translation in a format agnostic document viewer |
CN111368557B (zh) * | 2020-03-06 | 2023-04-07 | 北京字节跳动网络技术有限公司 | 视频内容的翻译方法、装置、设备及计算机可读介质 |
US11458409B2 (en) * | 2020-05-27 | 2022-10-04 | Nvidia Corporation | Automatic classification and reporting of inappropriate language in online applications |
Family Cites Families (168)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4674112A (en) * | 1985-09-06 | 1987-06-16 | Board Of Regents, The University Of Texas System | Character pattern recognition and communications apparatus |
US4754474A (en) * | 1985-10-21 | 1988-06-28 | Feinson Roy W | Interpretive tone telecommunication method and apparatus |
DE69032576T2 (de) * | 1990-02-27 | 1999-04-15 | Oracle Corp | Dynamische Optimierung eines einzelnen relationalen Zugriffs |
KR950008022B1 (ko) * | 1991-06-19 | 1995-07-24 | 가부시끼가이샤 히다찌세이사꾸쇼 | 문자처리방법 및 장치와 문자입력방법 및 장치 |
RU2039376C1 (ru) | 1991-11-01 | 1995-07-09 | Сергей Станиславович Ковалевский | Устройство для информационного поиска |
US5535119A (en) | 1992-06-11 | 1996-07-09 | Hitachi, Ltd. | Character inputting method allowing input of a plurality of different types of character species, and information processing equipment adopting the same |
US5337347A (en) * | 1992-06-25 | 1994-08-09 | International Business Machines Corporation | Method and system for progressive database search termination and dynamic information presentation utilizing telephone keypad input |
US6760695B1 (en) * | 1992-08-31 | 2004-07-06 | Logovista Corporation | Automated natural language processing |
GB2272091B (en) | 1992-10-30 | 1996-10-23 | Canon Europa Nv | Apparatus for use in aligning bilingual corpora |
JP3919237B2 (ja) * | 1994-05-20 | 2007-05-23 | キヤノン株式会社 | 画像記録再生装置、画像再生装置、及びその方法 |
US5543789A (en) * | 1994-06-24 | 1996-08-06 | Shields Enterprises, Inc. | Computerized navigation system |
AU3734395A (en) * | 1994-10-03 | 1996-04-26 | Helfgott & Karas, P.C. | A database accessing system |
US5787230A (en) * | 1994-12-09 | 1998-07-28 | Lee; Lin-Shan | System and method of intelligent Mandarin speech input for Chinese computers |
US5758145A (en) * | 1995-02-24 | 1998-05-26 | International Business Machines Corporation | Method and apparatus for generating dynamic and hybrid sparse indices for workfiles used in SQL queries |
JP3571408B2 (ja) | 1995-03-31 | 2004-09-29 | 株式会社日立製作所 | 文書加工方法および装置 |
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US5701469A (en) | 1995-06-07 | 1997-12-23 | Microsoft Corporation | Method and system for generating accurate search results using a content-index |
AU5969896A (en) * | 1995-06-07 | 1996-12-30 | International Language Engineering Corporation | Machine assisted translation tools |
US5818437A (en) * | 1995-07-26 | 1998-10-06 | Tegic Communications, Inc. | Reduced keyboard disambiguating computer |
CN1154910C (zh) * | 1995-07-26 | 2004-06-23 | 蒂吉通信系统公司 | 压缩键盘的明义系统 |
US5634053A (en) * | 1995-08-29 | 1997-05-27 | Hughes Aircraft Company | Federated information management (FIM) system and method for providing data site filtering and translation for heterogeneous databases |
JP3819959B2 (ja) * | 1996-03-27 | 2006-09-13 | シャープ株式会社 | 音声による情報検索装置 |
US5920859A (en) * | 1997-02-05 | 1999-07-06 | Idd Enterprises, L.P. | Hypertext document retrieval system and method |
US5778157A (en) * | 1996-06-17 | 1998-07-07 | Yy Software Corporation | System and method for expert system analysis using quiescent and parallel reasoning and set structured knowledge representation |
US5845273A (en) | 1996-06-27 | 1998-12-01 | Microsoft Corporation | Method and apparatus for integrating multiple indexed files |
US5878386A (en) * | 1996-06-28 | 1999-03-02 | Microsoft Corporation | Natural language parser with dictionary-based part-of-speech probabilities |
US5832480A (en) * | 1996-07-12 | 1998-11-03 | International Business Machines Corporation | Using canonical forms to develop a dictionary of names in a text |
US5953073A (en) * | 1996-07-29 | 1999-09-14 | International Business Machines Corp. | Method for relating indexing information associated with at least two indexing schemes to facilitate the play-back of user-specified digital video data and a video client incorporating the same |
US5745894A (en) * | 1996-08-09 | 1998-04-28 | Digital Equipment Corporation | Method for generating and searching a range-based index of word-locations |
US5987446A (en) * | 1996-11-12 | 1999-11-16 | U.S. West, Inc. | Searching large collections of text using multiple search engines concurrently |
US5953541A (en) * | 1997-01-24 | 1999-09-14 | Tegic Communications, Inc. | Disambiguating system for disambiguating ambiguous input sequences by displaying objects associated with the generated input sequences in the order of decreasing frequency of use |
JPH10247201A (ja) * | 1997-03-05 | 1998-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 情報評価値付き情報案内システム |
US6278992B1 (en) * | 1997-03-19 | 2001-08-21 | John Andrew Curtis | Search engine using indexing method for storing and retrieving data |
JP3143079B2 (ja) * | 1997-05-30 | 2001-03-07 | 松下電器産業株式会社 | 辞書索引作成装置と文書検索装置 |
US6061718A (en) * | 1997-07-23 | 2000-05-09 | Ericsson Inc. | Electronic mail delivery system in wired or wireless communications system |
US6055528A (en) | 1997-07-25 | 2000-04-25 | Claritech Corporation | Method for cross-linguistic document retrieval |
JP2965010B2 (ja) * | 1997-08-30 | 1999-10-18 | 日本電気株式会社 | 関連情報検索方法及び装置並びにプログラムを記録した機械読み取り可能な記録媒体 |
KR100552085B1 (ko) * | 1997-09-25 | 2006-02-20 | 테직 커뮤니케이션 인코포레이티드 | 감소된 키보드 명확화 시스템 |
US6026411A (en) * | 1997-11-06 | 2000-02-15 | International Business Machines Corporation | Method, apparatus, and computer program product for generating an image index and for internet searching and querying by image colors |
US6377965B1 (en) * | 1997-11-07 | 2002-04-23 | Microsoft Corporation | Automatic word completion system for partially entered data |
US5945928A (en) * | 1998-01-20 | 1999-08-31 | Tegic Communication, Inc. | Reduced keyboard disambiguating system for the Korean language |
KR100313462B1 (ko) * | 1998-01-23 | 2001-12-31 | 윤종용 | 웹검색엔진에서검색된정보를지역적으로근접한순서대로표시하는방법 |
US6185558B1 (en) * | 1998-03-03 | 2001-02-06 | Amazon.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
US6421675B1 (en) * | 1998-03-16 | 2002-07-16 | S. L. I. Systems, Inc. | Search engine |
US5974121A (en) * | 1998-05-14 | 1999-10-26 | Motorola, Inc. | Alphanumeric message composing method using telephone keypad |
GB2337611A (en) * | 1998-05-20 | 1999-11-24 | Sharp Kk | Multilingual document retrieval system |
US6144958A (en) * | 1998-07-15 | 2000-11-07 | Amazon.Com, Inc. | System and method for correcting spelling errors in search queries |
US6470333B1 (en) * | 1998-07-24 | 2002-10-22 | Jarg Corporation | Knowledge extraction system and method |
US6226635B1 (en) * | 1998-08-14 | 2001-05-01 | Microsoft Corporation | Layered query management |
US6370518B1 (en) * | 1998-10-05 | 2002-04-09 | Openwave Systems Inc. | Method and apparatus for displaying a record from a structured database with minimum keystrokes |
US7194679B1 (en) * | 1998-10-20 | 2007-03-20 | International Business Machines Corporation | Web-based file review system utilizing source and comment files |
IE980941A1 (en) * | 1998-11-16 | 2000-05-17 | Buy Tel Innovations Ltd | A transaction processings system |
JP2000163441A (ja) | 1998-11-30 | 2000-06-16 | Nippon Telegr & Teleph Corp <Ntt> | 辞書作成方法及び装置及び辞書作成プログラムを格納した記憶媒体及び検索要求作成方法及び装置及び検索要求作成プログラムを格納した記憶媒体及び多言語対応情報検索システム |
JP3842913B2 (ja) * | 1998-12-18 | 2006-11-08 | 富士通株式会社 | 文字通信方法及び文字通信システム |
GB2347247A (en) * | 1999-02-22 | 2000-08-30 | Nokia Mobile Phones Ltd | Communication terminal with predictive editor |
US20020038308A1 (en) * | 1999-05-27 | 2002-03-28 | Michael Cappi | System and method for creating a virtual data warehouse |
US6421662B1 (en) * | 1999-06-04 | 2002-07-16 | Oracle Corporation | Generating and implementing indexes based on criteria set forth in queries |
US6598039B1 (en) | 1999-06-08 | 2003-07-22 | Albert-Inc. S.A. | Natural language interface for searching database |
US20010003184A1 (en) * | 1999-07-16 | 2001-06-07 | Ching Jamison K. | Methods and articles of manufacture for interfacing, advertising and navigating with internet television |
CN1176432C (zh) | 1999-07-28 | 2004-11-17 | 国际商业机器公司 | 提供本国语言查询服务的方法和系统 |
US6606486B1 (en) * | 1999-07-29 | 2003-08-12 | Ericsson Inc. | Word entry method for mobile originated short messages |
US6601026B2 (en) * | 1999-09-17 | 2003-07-29 | Discern Communications, Inc. | Information retrieval by natural language querying |
US6453315B1 (en) * | 1999-09-22 | 2002-09-17 | Applied Semantics, Inc. | Meaning-based information organization and retrieval |
US6353820B1 (en) * | 1999-09-29 | 2002-03-05 | Bull Hn Information Systems Inc. | Method and system for using dynamically generated code to perform index record retrieval in certain circumstances in a relational database manager |
US6484179B1 (en) | 1999-10-25 | 2002-11-19 | Oracle Corporation | Storing multidimensional data in a relational database management system |
US7165019B1 (en) * | 1999-11-05 | 2007-01-16 | Microsoft Corporation | Language input architecture for converting one text form to another text form with modeless entry |
US6633846B1 (en) * | 1999-11-12 | 2003-10-14 | Phoenix Solutions, Inc. | Distributed realtime speech recognition system |
US6675165B1 (en) | 2000-02-28 | 2004-01-06 | Barpoint.Com, Inc. | Method for linking a billboard or signage to information on a global computer network through manual information input or a global positioning system |
US7120574B2 (en) * | 2000-04-03 | 2006-10-10 | Invention Machine Corporation | Synonym extension of search queries with validation |
US7177798B2 (en) * | 2000-04-07 | 2007-02-13 | Rensselaer Polytechnic Institute | Natural language interface using constrained intermediate dictionary of results |
US6564213B1 (en) | 2000-04-18 | 2003-05-13 | Amazon.Com, Inc. | Search query autocompletion |
US7107204B1 (en) * | 2000-04-24 | 2006-09-12 | Microsoft Corporation | Computer-aided writing system and method with cross-language writing wizard |
US6604101B1 (en) * | 2000-06-28 | 2003-08-05 | Qnaturally Systems, Inc. | Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network |
US6714905B1 (en) * | 2000-05-02 | 2004-03-30 | Iphrase.Com, Inc. | Parsing ambiguous grammar |
JP2001325252A (ja) | 2000-05-12 | 2001-11-22 | Sony Corp | 携帯端末及びその情報入力方法、辞書検索装置及び方法、媒体 |
US6456234B1 (en) | 2000-06-07 | 2002-09-24 | William J. Johnson | System and method for proactive content delivery by situation location |
JP3686312B2 (ja) * | 2000-07-05 | 2005-08-24 | 日本電信電話株式会社 | 訳語検索方法、訳語検索装置及び訳語検索プログラムを記録した記録媒体 |
US6529903B2 (en) * | 2000-07-06 | 2003-03-04 | Google, Inc. | Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query |
US7136854B2 (en) * | 2000-07-06 | 2006-11-14 | Google, Inc. | Methods and apparatus for providing search results in response to an ambiguous search query |
US8706747B2 (en) | 2000-07-06 | 2014-04-22 | Google Inc. | Systems and methods for searching using queries written in a different character-set and/or language from the target pages |
WO2002009302A1 (en) | 2000-07-25 | 2002-01-31 | Cypus | Communication terminal capable for searching internet domain name, system and method for searching internet domain name using the same |
US6968179B1 (en) | 2000-07-27 | 2005-11-22 | Microsoft Corporation | Place specific buddy list services |
US20020021311A1 (en) * | 2000-08-14 | 2002-02-21 | Approximatch Ltd. | Data entry using a reduced keyboard |
US20030217052A1 (en) * | 2000-08-24 | 2003-11-20 | Celebros Ltd. | Search engine method and apparatus |
GB2366698A (en) * | 2000-09-01 | 2002-03-13 | Nokia Mobile Phones Ltd | Insertion of pre-stored text strings |
JP2002092018A (ja) | 2000-09-18 | 2002-03-29 | Nec Software Hokkaido Ltd | 片仮名平仮名も含めた検索システム |
CA2323856A1 (en) * | 2000-10-18 | 2002-04-18 | 602531 British Columbia Ltd. | Method, system and media for entering data in a personal computing device |
US20060149686A1 (en) * | 2000-11-30 | 2006-07-06 | Allison Debonnett | Method of payment and settlement of goods and services via the INTERNET |
US7028306B2 (en) | 2000-12-04 | 2006-04-11 | International Business Machines Corporation | Systems and methods for implementing modular DOM (Document Object Model)-based multi-modal browsers |
EP1215659A1 (en) * | 2000-12-14 | 2002-06-19 | Nokia Corporation | Locally distibuted speech recognition system and method of its operation |
EP1215661A1 (en) * | 2000-12-14 | 2002-06-19 | TELEFONAKTIEBOLAGET L M ERICSSON (publ) | Mobile terminal controllable by spoken utterances |
JP2002215660A (ja) * | 2001-01-16 | 2002-08-02 | Mitsubishi Heavy Ind Ltd | 検索システム及びこれに用いられるソフトウェア |
JP3768105B2 (ja) * | 2001-01-29 | 2006-04-19 | 株式会社東芝 | 翻訳装置、翻訳方法並びに翻訳プログラム |
GB0103053D0 (en) * | 2001-02-07 | 2001-03-21 | Nokia Mobile Phones Ltd | A communication terminal having a predictive text editor application |
US7027987B1 (en) * | 2001-02-07 | 2006-04-11 | Google Inc. | Voice interface for a search engine |
JP2002251410A (ja) | 2001-02-26 | 2002-09-06 | Sharp Corp | 情報検索装置、情報検索プログラムおよび情報検索プログラムを記録したコンピュータ読取可能な記録媒体 |
JP3764058B2 (ja) * | 2001-03-01 | 2006-04-05 | 株式会社東芝 | 翻訳装置、翻訳方法及び翻訳プログラム |
JP3379090B2 (ja) * | 2001-03-02 | 2003-02-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム |
US7231381B2 (en) * | 2001-03-13 | 2007-06-12 | Microsoft Corporation | Media content search engine incorporating text content and user log mining |
US8744835B2 (en) * | 2001-03-16 | 2014-06-03 | Meaningful Machines Llc | Content conversion method and apparatus |
US7103534B2 (en) * | 2001-03-31 | 2006-09-05 | Microsoft Corporation | Machine learning contextual approach to word determination for text input via reduced keypad keys |
KR20020084739A (ko) | 2001-05-02 | 2002-11-11 | 이재원 | 숫자입력을 이용한 인터넷 검색 및 접속 방법 |
GB0111012D0 (en) * | 2001-05-04 | 2001-06-27 | Nokia Corp | A communication terminal having a predictive text editor application |
US7366712B2 (en) | 2001-05-31 | 2008-04-29 | Intel Corporation | Information retrieval center gateway |
US6947770B2 (en) * | 2001-06-22 | 2005-09-20 | Ericsson, Inc. | Convenient dialing of names and numbers from a phone without alpha keypad |
US20030035519A1 (en) * | 2001-08-15 | 2003-02-20 | Warmus James L. | Methods and apparatus for accessing web content from a wireless telephone |
JP3895955B2 (ja) * | 2001-08-24 | 2007-03-22 | 株式会社東芝 | 情報検索方法および情報検索システム |
US20030054830A1 (en) * | 2001-09-04 | 2003-03-20 | Zi Corporation | Navigation system for mobile communication devices |
US6944609B2 (en) * | 2001-10-18 | 2005-09-13 | Lycos, Inc. | Search results using editor feedback |
KR100501079B1 (ko) | 2001-11-12 | 2005-07-18 | 주식회사 아이니드 | 네트워크 기반의 유사어 검색기술 응용시스템 및 방법 |
US7533093B2 (en) | 2001-11-13 | 2009-05-12 | Koninklijke Philips Electronics N.V. | Method and apparatus for evaluating the closeness of items in a recommender of such items |
US7149550B2 (en) * | 2001-11-27 | 2006-12-12 | Nokia Corporation | Communication terminal having a text editor application with a word completion feature |
US6785654B2 (en) * | 2001-11-30 | 2004-08-31 | Dictaphone Corporation | Distributed speech recognition system with speech recognition engines offering multiple functionalities |
US7283992B2 (en) * | 2001-11-30 | 2007-10-16 | Microsoft Corporation | Media agent to suggest contextually related media content |
US20030125947A1 (en) * | 2002-01-03 | 2003-07-03 | Yudkowsky Michael Allen | Network-accessible speaker-dependent voice models of multiple persons |
US7565367B2 (en) * | 2002-01-15 | 2009-07-21 | Iac Search & Media, Inc. | Enhanced popularity ranking |
US6952691B2 (en) | 2002-02-01 | 2005-10-04 | International Business Machines Corporation | Method and system for searching a multi-lingual database |
US7167831B2 (en) * | 2002-02-04 | 2007-01-23 | Microsoft Corporation | Systems and methods for managing multiple grammars in a speech recognition system |
EP1347362B1 (en) | 2002-03-22 | 2005-05-11 | Sony Ericsson Mobile Communications AB | Entering text into an electronic communications device |
US20030187658A1 (en) * | 2002-03-29 | 2003-10-02 | Jari Selin | Method for text-to-speech service utilizing a uniform resource identifier |
US7089178B2 (en) * | 2002-04-30 | 2006-08-08 | Qualcomm Inc. | Multistream network feature processing for a distributed speech recognition system |
JP2004054918A (ja) * | 2002-05-30 | 2004-02-19 | Osaka Industrial Promotion Organization | 情報処理システム、情報表示装置、コンピュータプログラム、及び記録媒体 |
US7013154B2 (en) * | 2002-06-27 | 2006-03-14 | Motorola, Inc. | Mapping text and audio information in text messaging devices and methods therefor |
US7103854B2 (en) * | 2002-06-27 | 2006-09-05 | Tele Atlas North America, Inc. | System and method for associating text and graphical views of map information |
US7380724B2 (en) * | 2002-07-01 | 2008-06-03 | Sony Ericsson Mobile Communications Ab | Entering text into an electronic communication device |
US7016895B2 (en) * | 2002-07-05 | 2006-03-21 | Word Data Corp. | Text-classification system and method |
US7386442B2 (en) * | 2002-07-03 | 2008-06-10 | Word Data Corp. | Code, system and method for representing a natural-language text in a form suitable for text manipulation |
EP2154613A1 (en) | 2002-07-23 | 2010-02-17 | Research in Motion Limited | Systems and methods of building and using custom word lists |
US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases |
US20040163032A1 (en) | 2002-12-17 | 2004-08-19 | Jin Guo | Ambiguity resolution for predictive text entry |
GB2396529B (en) * | 2002-12-20 | 2005-08-10 | Motorola Inc | Location-based mobile service provision |
EP1584023A1 (en) * | 2002-12-27 | 2005-10-12 | Nokia Corporation | Predictive text entry and data compression method for a mobile communication terminal |
US7076428B2 (en) * | 2002-12-30 | 2006-07-11 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
US7369988B1 (en) * | 2003-02-24 | 2008-05-06 | Sprint Spectrum L.P. | Method and system for voice-enabled text entry |
FI116168B (fi) * | 2003-03-03 | 2005-09-30 | Flextronics Odm Luxembourg Sa | Datan syöttö |
US7729913B1 (en) | 2003-03-18 | 2010-06-01 | A9.Com, Inc. | Generation and selection of voice recognition grammars for conducting database searches |
KR100563787B1 (ko) | 2003-04-03 | 2006-03-30 | 주식회사 시티기술단 | 단위 옹벽판넬에 설치된 고강도 철근을 커플러로상호연결하여 단면력에 저항토록하면서, 프리스트레스를도입한 단위 옹벽판넬로 이루어진 옹벽조립체 및 이의조립시공방법 |
KR100515641B1 (ko) | 2003-04-24 | 2005-09-22 | 우순조 | 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법 |
US7395203B2 (en) * | 2003-07-30 | 2008-07-01 | Tegic Communications, Inc. | System and method for disambiguating phonetic input |
US8200865B2 (en) * | 2003-09-11 | 2012-06-12 | Eatoni Ergonomics, Inc. | Efficient method and apparatus for text entry based on trigger sequences |
GB2433002A (en) * | 2003-09-25 | 2007-06-06 | Canon Europa Nv | Processing of Text Data involving an Ambiguous Keyboard and Method thereof. |
US7240049B2 (en) * | 2003-11-12 | 2007-07-03 | Yahoo! Inc. | Systems and methods for search query processing using trend analysis |
US20050114312A1 (en) * | 2003-11-26 | 2005-05-26 | Microsoft Corporation | Efficient string searches using numeric keypad |
US20050188330A1 (en) * | 2004-02-20 | 2005-08-25 | Griffin Jason T. | Predictive text input system for a mobile communication device |
US7293019B2 (en) | 2004-03-02 | 2007-11-06 | Microsoft Corporation | Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics |
US8676830B2 (en) | 2004-03-04 | 2014-03-18 | Yahoo! Inc. | Keyword recommendation for internet search engines |
US7218249B2 (en) | 2004-06-08 | 2007-05-15 | Siemens Communications, Inc. | Hand-held communication device having navigation key-based predictive text entry |
US8595687B2 (en) | 2004-06-23 | 2013-11-26 | Broadcom Corporation | Method and system for providing text information in an application framework for a wireless device |
US8392453B2 (en) | 2004-06-25 | 2013-03-05 | Google Inc. | Nonstandard text entry |
US8972444B2 (en) | 2004-06-25 | 2015-03-03 | Google Inc. | Nonstandard locality-based text entry |
WO2006047654A2 (en) * | 2004-10-25 | 2006-05-04 | Yuanhua Tang | Full text query and search systems and methods of use |
US7779011B2 (en) | 2005-08-26 | 2010-08-17 | Veveo, Inc. | Method and system for dynamically processing ambiguous, reduced text search queries and highlighting results thereof |
US7788266B2 (en) * | 2005-08-26 | 2010-08-31 | Veveo, Inc. | Method and system for processing ambiguous, multi-term search queries |
US7737999B2 (en) | 2005-08-26 | 2010-06-15 | Veveo, Inc. | User interface for visual cooperation between text input and display device |
US20070061211A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Preventing mobile communication facility click fraud |
US9471925B2 (en) * | 2005-09-14 | 2016-10-18 | Millennial Media Llc | Increasing mobile interactivity |
US7647228B2 (en) | 2005-11-03 | 2010-01-12 | Apptera, Inc. | Method and apparatus for speech processing incorporating user intent |
JP2007141123A (ja) * | 2005-11-22 | 2007-06-07 | Internatl Business Mach Corp <Ibm> | 異なるファイルの同一文字列のリンク |
US7644054B2 (en) * | 2005-11-23 | 2010-01-05 | Veveo, Inc. | System and method for finding desired results by incremental search using an ambiguous keypad with the input containing orthographic and typographic errors |
AU2006318417B2 (en) * | 2005-11-23 | 2012-01-19 | Dun And Bradstreet Corporation | System and method for searching and matching data having ideogrammatic content |
US20070195063A1 (en) * | 2006-02-21 | 2007-08-23 | Wagner Paul T | Alphanumeric data processing in a telephone |
US7657526B2 (en) | 2006-03-06 | 2010-02-02 | Veveo, Inc. | Methods and systems for selecting and presenting content based on activity level spikes associated with the content |
EP3822819A1 (en) | 2006-04-20 | 2021-05-19 | Veveo, Inc. | User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content |
US7536384B2 (en) * | 2006-09-14 | 2009-05-19 | Veveo, Inc. | Methods and systems for dynamically rearranging search results into hierarchically organized concept clusters |
US7979425B2 (en) * | 2006-10-25 | 2011-07-12 | Google Inc. | Server-side match |
KR20100041145A (ko) * | 2008-10-13 | 2010-04-22 | 삼성전자주식회사 | 쿼티 키패드를 갖는 휴대 단말기의 발신 방법 및 전화번호 저장 방법 |
US20100306249A1 (en) * | 2009-05-27 | 2010-12-02 | James Hill | Social network systems and methods |
US20130304818A1 (en) * | 2009-12-01 | 2013-11-14 | Topsy Labs, Inc. | Systems and methods for discovery of related terms for social media content collection over social networks |
-
2003
- 2003-09-30 US US10/676,724 patent/US8706747B2/en not_active Expired - Fee Related
-
2004
- 2004-09-13 TR TR2018/16343T patent/TR201816343T4/tr unknown
- 2004-09-13 DE DE602004020086T patent/DE602004020086D1/de active Active
- 2004-09-13 KR KR1020067006282A patent/KR101140187B1/ko active IP Right Grant
- 2004-09-13 AT AT04783836T patent/ATE426206T1/de not_active IP Right Cessation
- 2004-09-13 EP EP11172796.2A patent/EP2388709B1/en active Active
- 2004-09-13 KR KR1020117020833A patent/KR101261158B1/ko active IP Right Grant
- 2004-09-13 CN CN2011101331474A patent/CN102236702B/zh active Active
- 2004-09-13 EP EP09151235A patent/EP2043003A3/en not_active Ceased
- 2004-09-13 JP JP2006533909A patent/JP4717821B2/ja active Active
- 2004-09-13 ES ES04783836T patent/ES2323786T3/es active Active
- 2004-09-13 WO PCT/US2004/029772 patent/WO2005033967A2/en active Application Filing
- 2004-09-13 PL PL11172796T patent/PL2388709T3/pl unknown
- 2004-09-13 KR KR1020117020834A patent/KR20110117219A/ko active IP Right Grant
- 2004-09-13 KR KR1020127005744A patent/KR101242961B1/ko active IP Right Grant
- 2004-09-13 CN CNA2004800285354A patent/CN1860473A/zh active Pending
- 2004-09-13 EP EP04783836A patent/EP1676211B1/en active Active
- 2004-09-13 RU RU2006114696/09A patent/RU2363983C2/ru active
-
2010
- 2010-07-15 JP JP2010161104A patent/JP5231491B2/ja active Active
-
2011
- 2011-02-07 JP JP2011024457A patent/JP5425820B2/ja active Active
-
2012
- 2012-04-25 HK HK12104074.7A patent/HK1163846A1/xx not_active IP Right Cessation
-
2013
- 2013-01-30 JP JP2013015114A patent/JP5608766B2/ja active Active
-
2014
- 2014-03-06 US US14/199,249 patent/US9734197B2/en not_active Expired - Lifetime
-
2017
- 2017-08-08 US US15/671,968 patent/US20170351673A1/en not_active Abandoned
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TR201816343T4 (tr) | Farklı bir karakter setinde yazılmış sorguları ve/veya farklı sayfalardan dili kullanarak aramaya yönelik sistemler ve yöntemler. | |
KR101465770B1 (ko) | 단어 확률 결정 | |
US10713571B2 (en) | Displaying quality of question being asked a question answering system | |
KR101465769B1 (ko) | 사전 단어 및 어구 판정 | |
US7136854B2 (en) | Methods and apparatus for providing search results in response to an ambiguous search query | |
US20090055389A1 (en) | Ranking similar passages | |
US20080312911A1 (en) | Dictionary word and phrase determination | |
US20170109449A1 (en) | Discovery engine | |
WO2009026850A1 (en) | Domain dictionary creation | |
EP1221082B1 (en) | Use of english phonetics to write non-roman characters | |
Alsmadi et al. | Google n-gram viewer does not include arabic corpus! towards n-gram viewer for arabic corpus. | |
JP2013015967A (ja) | 検索システム、索引作成装置、検索装置、索引作成方法、検索方法およびプログラム | |
Sowmya | TEXT INPUT METHODS FOR INDIAN LANGUAGES |