TWI439877B - 一般化之語言非相關索引儲存系統及檢索方法 - Google Patents

一般化之語言非相關索引儲存系統及檢索方法 Download PDF

Info

Publication number
TWI439877B
TWI439877B TW097114881A TW97114881A TWI439877B TW I439877 B TWI439877 B TW I439877B TW 097114881 A TW097114881 A TW 097114881A TW 97114881 A TW97114881 A TW 97114881A TW I439877 B TWI439877 B TW I439877B
Authority
TW
Taiwan
Prior art keywords
indicator
descriptor
item
database
user
Prior art date
Application number
TW097114881A
Other languages
English (en)
Other versions
TW200910124A (en
Inventor
Weigen Qiu
Gang Chen
Shiqiang Wei
Original Assignee
Zi Corp Canada Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zi Corp Canada Inc filed Critical Zi Corp Canada Inc
Publication of TW200910124A publication Critical patent/TW200910124A/zh
Application granted granted Critical
Publication of TWI439877B publication Critical patent/TWI439877B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

一般化之語言非相關索引儲存系統及檢索方法
本發明係關於識別及提供資訊之裝置及方法。
本申請案主張2007年4月23日申請之美國臨時專利申請案序號60/913,307之優先權益。
廣泛的電子檔案檢索已司空見慣,若干商業"檢索引擎"提供使用關鍵字檢索之能力。對此類服務之接取已提供給行動個人器具,例如PDA(個人數位助理)當然還有蜂巢式電話。欲輸入字母或音節資料之情況下,明確輸入或減小大小之歧義消除系統係處於廣泛使用中。此可能需要調用一瀏覽器及造成器具複製一電腦終端機之性能。
也已使用關鍵字檢索以允許使用者執行本機檢索。在此等情況下,允許使用者輸入一關鍵字以便檢索至少暫時儲存於器具上(即"本機"儲存)之內容。通常可以建立允許一輸入之袖珍鍵盤序列與內容快速匹配的索引,其進而可利於對所搜尋材料之存取。此類功能性之一範例係在名為"User Interface With Augmented Searching Characteristics"公開號為20060158436之已公開美國專利申請案(其係以引用方式併入本文)中加以說明,並在http://www.zicorp.com/Qix.htm處之已公開輔助材料中作進一步說明。由於一器具通常僅由一使用者使用,所以常常以其係採用該使用者通常所使用之語言的一方式儲存本機內容,且此使得可以很容易執行本機關鍵字檢索。
可以採用許多方式實現超出器具之本機環境之邊界的檢索。不過,一限制因素係用以建立檢索關鍵字之條碼協定係受限於一特定語言之字母表結構且可能無法很容易應用於其他語言,尤其係本質上為表意文字的語言。通常藉由本地化技術(其係藉由諸如模式選擇之方法在對話層處加以應用)來處理表意文字語言。
本發明可具體化為一種具有一可檢索索引資訊資料庫之系統。該資料庫中之各索引可以具有(a)至少一描述符,其與一使用者可能提供以便識別一項目的一輸入相匹配,(b)一第一指標,其識別該項目之一位置,及(c)一第二指標,其識別一資訊位置,該資訊可能有助於該使用者決定是否請求該項目之取回。該等描述符之一或多個可為一數字,及/或該等描述符之一或多個可為文字。一第一指標所指向的一項目可為資訊,及/或一電腦程式。一索引之第一指標可以與一不同索引中之第一指標相同。該第二指標可為一類型指示器,其識別一項目所屬於的一一般類別。
本發明可具體化為一種方法。在一此方法中,取回一項目。如此,可以提供一可檢索索引資訊資料庫。該資料庫中之各索引可以具有(a)至少一描述符,其可與預期一使用者欲輸入以便識別該項目的一輸入相匹配,(b)一第一指標,其識別該項目之一位置,及(c)一第二指標,其識別一資訊位置,該資訊可能有助於該使用者決定是否請求該項目之取回。可以輸入一檢索查詢,且可針對與該查詢相匹 配之描述符檢索該資料庫。一旦找到具有一相匹配描述符的一索引,立即可以使用該第一指標定位至少一可選擇圖示且可以使用該第二指標定位可有助於該使用者決定是否請求該等項目之取回的資訊。接著可將一可選擇圖示列表提供給該使用者,該等圖示對應於具有相匹配描述符之索引的第一指標。該可選擇圖示列表可包括藉由該第二指標所識別之資訊。
例如,該第二指標可為一類型指示器,其識別一項目所屬於的一一般類別。藉由獲知該項目之該一般類別,可以使一使用者知曉已提供給該使用者之圖示的一般性質,進而協助該使用者決定是否選擇一特定圖示。例如,經由該第二指標所指向之資訊,可以協助該使用者區分圖示及/或識別該使用者可能需要但其不具有相匹配描述符的索引。
在本發明之一具體實施例中,可以將該類型指示器顯示為一圖示本身,而且一旦選擇該圖示,便可重新配置該圖示列表以在顯示器之一區域中顯示具有該類型指示器的所有圖示。這樣做時,識別及選擇一所需圖示之前可以允許該使用者窄化所需圖示之欄位。此在使用者之查詢不在一所需項目之描述符中時可能特別有幫助。
圖1顯示依據本發明之資料庫10。資料庫10具有與項目相關之索引資訊13。例如,一項目可為一資訊片段或一電腦程式,其係儲存於一電子記憶體中。圖2顯示索引資訊 13之片段之一。各索引13具有至少一描述符16、一第一指標18及一第二指標21。該第二指標21可為一類型指示器。
各描述符16係一使用者可能提供以便找到一項目的一輸入。例如,若使用者需要找到John Smith的聯繫資訊,則使用者可以輸入文字,例如字詞"Smith"或字詞"John"。圖2顯示一索引13,其中描述符16為字母"J"、"O"、"H"及"N"。或者描述符16可以為一數字,例如John Smith之電話號碼中的最初若干數字。應注意,一項目可以具有一或多於一個描述符16。
當使用者視情況而定輸入"John"或John Smith之電話號碼所利用之裝置採用多義鍵時,使用者之輸入可能不為字母"J"與"O",而是可為藉由按其上標有"J"之鍵所提供之信號,隨後藉由按其上標有"O"之鍵所提供之信號。例如,使用許多桌上型電話上存在之袖珍鍵盤,該等按鍵將對應於按具有"5jkl"之鍵("5"鍵),隨後按具有"6mno"之鍵("6"鍵)。因此,最初系統可能不知道使用者之5然後6的輸入係嘗試識別對應於"John Smith"之索引13或對應於"Kojo The Dog"之索引13或具有數字5隨後之數字6的電話號碼。因此,一使用多義鍵之系統可能需要提供(至少最初)對應於John Smith之圖示及對應於Kojo The Dog之圖示以及具有一5隨後一6的電話號碼。不過,一旦使用者(例如)藉由按"4ghi"鍵("4"鍵)而提供一第三輸入,則可以從已顯示列表移除對應於Kojo The Dog之圖示(因為具有描述符5、6、5之索引不會對應於使用者所輸入之5、6、4序列),從而 使使用者之所需圖示選擇更容易。
第一類型之指標18識別一項目之一位置。例如,第一指標18可以識別聯繫資料庫中可以找到John Smith之電話號碼或住址的位置。第一指標18可以直接或間接識別儲存一項目的一記憶體位置。間接方法之一範例係索引13中之第一指標18識別一表中之一位置的情況,在該位置處儲存較長記憶體位址供找到一項目時之取回及使用。此外,第一指標18可以識別一對應於該項目之圖示。
第二指標21可以識別一一般資訊位置,該一般資訊可能有助於使用者決定是否請求該項目之取回。例如,第二指標21可以識別一項目所屬於的一一般類別。例如,第二指標21可以為一識別具有資訊片段之聯繫資料庫的類型指示器,或該類型指示器可以識別一集中於協助使用者將名字及住址輸入聯繫資料庫中的電腦程式。其他類型指示器21可以識別一音樂資料庫或一影像資料庫。
在本發明之一具體實施例中,各索引13包括八個位元組,其每一個可用以識別256個不同值。該等位元組之一或多個可用以以類型指示器之形式儲存第二指標21,該等位元組之一或多個可用以儲存描述符16,且該等位元組之一或多個可用以儲存指標18。在一較佳具體實施例中,該等位元組之一係用以儲存類型指示器,四個位元組係用以儲存描述符16,且三個位元組係用以儲存多於一個第一類型之指標18。圖1所示資料庫10顯示具有八個位元組(標記為B1至B8)之索引13,且識別此等位元組之哪一個係用以 儲存索引之各種組件。
可以在與本發明一致的一方法中使用索引資訊13。該方法可用以取回一項目。圖3顯示一此方法。提供100一可檢索索引資訊資料庫,且該資料庫中之各索引13可以具有(a)至少一描述符16,一使用者可能提供該至少一描述符16以便識別該項目,(b)一第一類型之指標18,其識別(直接或間接)該項目之一位置,及(c)一第二類型之指標21,其識別一一般資訊位置,該一般資訊可能有助於使用者決定是否請求該項目之取回。若一使用者輸入103一檢索查詢,則可使用該資料庫來識別106具有與該檢索查詢相匹配之描述符16的索引13。一旦找到相匹配描述符16,便使用此等索引13來提供109第一類型之指標18。可以提供一列表,其對應於具有與該查詢相匹配之描述符16的索引13所指向之此等項目。接著可以使用112指標18來識別可自其取回項目之位置。
在本發明之一具體實施例中,第一類型指標18識別可顯示在一列表上之圖示。使用者可從該列表選擇該等圖示。藉由選擇該等圖示之一,可以明確識別一特定項目然後提供給使用者。
例如,若一PDA之使用者輸入字母"J"隨後輸入字母"O",則該器具可以檢索具有描述符16 "J"與"O"之索引。例如,該器具可以識別一對應於John Smith之索引13,並以"John Smith"之形式顯示一文字圖示。此外,該器具可以識別一對應於Don Johnson之索引13並顯示Johnson先生 之照片,或可以針對電視節目"Miami Vice"之影迷顯示至網站之鏈接。若使用者選擇對應於John Smith之圖示,則器具可以從藉由第一類型指標18所識別之位置取回資訊。依據圖2,此等位置可為記憶體位置1、5及7。一旦取回指標位置處之資訊,該器具便可將取回之資訊顯示給使用者。例如,取回之資訊可以如下:John Smith 32 Main Street Calgary,Alberta,Canada第一類型指標18亦可利於取回John Smith之照片,或John之生日或電話號碼。
可以實施該方法以允許使用類型指示器以利於找到一所需項目。使用者之查詢與用於所需項目之描述符16不匹配時使用一類型指示器可協助找到所需項目。在此一方法中,一旦描述符16與檢索查詢間相匹配,便可使用具有該匹配之索引資訊13的第二類型指標21來提供110一類型指示器。接著使用所提供之類型指示器來識別具有一相匹配類型指示器的其他索引13。針對使用者之選擇所顯示之列表可加以擴充以包括對應於若干索引13之可選擇圖示,該等索引13具有識別為與一具有相匹配描述符16之索引13的類型指示器相匹配之類型指示器。可以使用以上範例解說概念。若將"J"與"O"輸入PDA中,則該PDA可以識別圖2所示索引,且該PDA可以辨識該索引13之第二指標21具有一為聯繫資料庫的類型指示器。已識別聯繫資料庫後,該 PDA可以顯示一對應於聯繫資料庫之圖示,而且若使用者選擇此圖示,則可以提供來自該聯繫資料庫的一資訊列表,John Smith之輸入上方及下方的輸入係顯示給使用者供選擇用。以此方式,使用者可以快速移至聯繫資料庫中的一點且很容易識別除John Smith之外附近按字母表順序列出其名字的某人。
或者,藉由選擇聯繫資料庫圖示,可對可選擇列表中的其他圖示進行分組以便具有第二類型指標21之索引的此等圖示識別聯繫資料庫。以此方式,使用者能夠更容易且快速地選擇一對應於聯繫資料庫之圖示。
可以基於其他目的使用第二類型指標21。例如,第二類型指標21可用以識別一般資訊,其擴充第一類型指標所識別之圖示,且係提供給使用者。此類一般資訊可將選擇該圖示之條件下將取回之內容更清楚地指示給使用者。為了解說此如何發生,假定圖示"John Smith"可以在可選擇列表中出現兩次,一次係具有一指示將取回John Smith之聯繫資訊的符號,而一第二實例係伴隨有一指示將從配方資料庫取回John Smith之烤肉調味醬配方的符號。因此,為了找到John Smith之聯繫資訊及John Smith之配方兩者,使用者僅需要記得John之名字。若不使用第二類型指標21,則可能會因具有源自輸入查詢之多個可能性無有助於選擇之線索而給使用者造成不便。
應注意,藉由第二類型指標所識別之一般資訊可以視覺或聽覺方式提供給使用者。例如,可以藉由改變第一類型 指標18所指向之圖示的顏色以視覺方式提供一般資訊,或可以採用額外圖示之形式以視覺方式提供一般資訊。若提供一般資訊之聽覺指示,則該指示可以採用一聽覺輸出之形式,該聽覺輸出係藉由一儲存於PDA上之電腦程式來提供且藉由橫跨第一類型指標18所指向之圖示拖曳一游標加以啟動,以便造成從PDA發出一聲音(例如PDA可以說"聯繫資料庫")。
該列表可加以配置以協助使用者識別所需圖示。例如,該列表可加以配置以更突出顯示與具有相匹配描述符16之索引13相對應的此等圖示。可以較不突出地顯示與不具有相匹配描述符16但具有相匹配類型指示器之索引13相對應的圖示。
另一配置圖示之方法係使用一統計分析,藉由該統計分析依據待顯示圖示之統計評估配置列表。在一此類方法中,藉由考量使用者選擇一圖示之頻率,且藉由亦考量自上次選擇一圖示以來已消逝之時間來執行該分析。用於在一列表中配置圖示之其他技術廣為人知(且因此本文不加以說明),且可用於本發明中。
例如,若使用者輸入字母"C"、"A"及"M",則PDA可以識別圖4所示索引13。記憶體位置#2可以指向一圖示及一相對應程式(其操作位於PDA上之相機)。若選擇相機圖示,則將允許使用者拍照及儲存一圖像。記憶體位置#10可以指向一圖示("照片圖示")且指向一取回儲存於PDA中之圖像的程式。由於使用者輸入"C"、"A"及"M",且此輸 入與索引13之用於相機功能之描述符16更緊密相對應(與照片功能之描述符16相比),所以可程式化PDA以在一更突出位置(與用於照片功能之圖示相比)處顯示相機圖示。
若照片功能更緊密地對應於一索引13(像圖5所示索引),則從以上範例應注意即使用於照片功能之描述符16(參見圖5)不包括"C"、"A"或"M",也可經由圖4所示索引13獲得照片功能。以此方式,藉由允許使用者輸入用於相機功能之描述符16而非選擇照片功能可以使得使用者更容易操作PDA。
此外,提供給使用者之列表可加以配置以便將對應於具有相匹配描述符16(此範例中係相機功能)之項目的圖示放置於一位置處,而將對應於無相匹配描述符16(此範例中係照片功能)之項目的圖示放置於另一位置處。以此方式組織圖示時,可有用地提供一與影像資料庫相對應之圖示,以便使用者選擇影像資料庫圖示時,其他圖示係經配置使得與影像資料庫相對應之圖示(像相機功能與照片功能)係在監視器頂部附近顯示給使用者並分組在一起。以此方式,即使使用者已輸入用於相機功能之描述符16,他也能夠快速識別照片功能。
從以上範例應注意,第一指標18可用以識別使用者頭腦中的相關資訊及/或功能,其係藉由造成相關索引具有識別另一項目之位置的指標來執行。此能力在識別同義字時可能有用。此在表意文字語言中可能特別有用。例如,若PDA針對表意字元以及字母等效者(例如拼音)支援筆劃輸 入,則可能使得使用者可以輸入筆劃並接收符號及拼音對應物兩者,或可能使得使用者可以輸入拼音並接收表意字元及拼音對應物兩者。因此,一般而言,使用非字母語言時,一輸入法可用以識別輸入之兩不同表示。同樣地,第二類型指標21可能在兩索引13中係完全不同的,但仍利於使用者頭腦中相關聯之項目的快速取回。
使用中文語言作為一範例(其就此點而言具有相對較高複雜性),使用者可以採用許多方法輸入字元。兩常見方法可能會使用拼音(其中使用者藉由以可能進行一字母輸入的方式輸入各字母而拼出字元之聲音),或使用一筆劃輸入法(其中以通常書寫預期字元所採用之序列輸入分類筆劃)。美國專利5,109,352更完整說明此技術且係以引用方式併入。儘管可能實際上儲存字元然後使用編輯器方法來建立字元接著搜尋匹配,但此可能麻煩。藉由建立可使用按鍵序列之直接輸入加以搜索的索引,可以實現明顯改良。有效的係使索引結構橫跨一減小袖珍鍵盤環境中之大範圍可能輸入一致,且可以藉由保留關於使用者所需要之哪一字元的歧義性(與自動解析歧義性相反)實現一明顯優點。因此,藉由簡單儲存所指派鍵值(而非可能離散字母)並允許使用者由相匹配列表依據上下文消除歧義,可以經濟地實現索引之描述符16欄位且可以一致地支援所有語言。自明地,足夠長序列在大多數語言資料集中係唯一的且取自英文語料庫之典型行動器具辭典之統計一般以少於8個字母或按鍵實現此。因此,由於各按鍵可儲存為一四 位元字或半位元組,所以四個位元組可以允許器具將大多數列表解析為可為使用者接受的一可管理候選殘留。
可以依據上述索引結構對一典型智慧型電話中所儲存之元素編索引,該典型智慧型電話具有範例性字詞與名稱(採用拉丁文與漢字(中文)字元兩者)當然還有數字序列之資料庫。拉丁文與數字序列可以直接儲存於描述符16欄位中但表意字元不可以直接儲存。為了此得以實現,可以將各漢字字元分解為至少兩可編索引部分。對於各漢字字元,拼音值可加以還原然後進行儲存且也可以儲存其筆劃順序。
已說明本發明,應認識到,本發明可用以建立一具有多於一個指向相同項目之索引的系統。此一方法利於與從一多義鍵之袖珍鍵盤所輸入之符號相匹配。除典型電話袖珍鍵盤上通常存在之符號分配之外,也可以指派代表為表意文字之輸入所特有之元素的符號。例如,除傳統標記之外或作為傳統標記之取代,也可以包括為日文Kana集特有之音節元素及為臺灣BoPoMoFo字母表所特有之標記。
依據本發明加以程式化的器具將利於快速檢索,從而協助使用者以受限制數目之序列按鍵定位一項目,該序列可以比一項目之完整描述符16中之總字元數短。
此外,並不預期全儲存係描述符16中必需的。四個位元組/八個四位元字之描述符16欄位可有效地用於許多實際片語長度之片語編索引。在一位元措辭中,該字元可以使用其全拼音序列來編索引且也可使用其初始筆劃類別(本 文所述範例中最多有八個初始筆劃)來編索引。此可能需要建立兩個具有相同指標及相同類型指示器的索引。若存在更多類型指示器,則可能需要其他索引。一般而言,輸入八個筆劃之後,典型語言語料庫中保留有若干歧義性,但在個人器具典型的受限制資料集中,歧義性一般最小。例如,當一片語中包含多於一個表意字元時,可以修改該系統使得如上所述對片語中之第四個字元編索引,且可以簡單忽略片語中隨後之字元並僅僅需要儲存用於四個字元之參數。若片語中之字元少於描述符16欄位中之空間(例如僅有三個字元),則可以將第三字元儲存於一索引中,可以將第二與第三字元儲存於另一索引中及可以將全部三個字元儲存於一第三索引中。對於片語中之各字元,可以建立拼音與筆劃索引13兩個。對於任何片語,通常需要建立不超過八個索引13。一特定片語之所有索引13具有一為該片語之所有索引13共同的指標,且該指標18指向定位該片語並可以取回該片語之位置。
儘管對於一單一字元,可以較佳建立全拼音輸入,但對於現代漢語典型的多音節片語與名稱,可以藉由使用本發明實施一更有效的還原系統以縮減儲存需要,進而減小PDA之記憶體及增加使用者可識別PDA中所儲存之項目的速度。同樣地,對於筆劃索引,需要識別八個以上筆劃以便集中於合理數目之選項對於一單一字元而言很少有用,因此可以針對片語使用縮短之描述符16。存在兩個或更多個字元時,針對片語中之各字元使用拼音輸入之最初兩字 母對於大多數用途而言可能足以了。因此對於片語Zhong Guo Ren Min.....我們僅需要儲存分類初始對"ZH" "GU" "RE" "MI",其(使用標準電話袖珍鍵盤)將為數字序列94487364。實施上述尾綴trie也具有與487364、7364及64相對應之索引13,其全部識別相同片語但也可識別其他片語,因為序列長度減小且展現增加之多義性。可較佳將第四字元作為其全拼音儲存為646,因為就此點而言其係一單一完整字元。以一類似方式,亦可藉由將各字元之初始筆劃對儲存於描述符16欄位中而與一對應於筆劃類別之數字序列相匹配。如此項技術中所熟知,可以藉由處理欄位中之零值向右或左調整描述符16欄位。
在本發明之另一態樣中,可以保存一輔助表,其允許處理檢索錯誤,其中此類錯誤係熟知的,例如系統語言上的異常。例如,某些語言展現字詞或音節發音變化,其取決於與其相關聯之其他字詞或音節。某些歐洲語言之情況下,此可視為一單一字詞之初始字母之變音且一般在需要性別一致時經常發生。從男性變為女性形式係此類變音之最常見原因。例如,在威爾士語中,"他的貓"係寫成"ei gath",而"她的貓"係寫成"ei chath"。此等異常但可重複調適之任一個之效應係修改字詞或字元之聲音之拼寫。因此,若保存一替代拼寫列表,則相匹配演算法可以嘗試與輸入序列以及熟知變體相匹配。除此額外列表之負擔外,可能存在將不合需要匹配顯示給使用者之實例,但重大優點係使用者錯誤較不可能不產生結果。
在一相關態樣中,可以藉由進一步添加至此系統錯誤列表來減少普通錯誤。採用拼音形式,中國南方與中國北方之間語言上的差異帶來常見麻煩。例如,"zhong"可能會輸入成"zong",而在此情況下藉由允許使用替代拼寫,可以找到預期項目。如上所述,對於找不到相匹配索引13之困擾,使用者可能忽略的額外非預期結果可能較佳。
前述者可廣泛應用於使用減小袖珍鍵盤進行資料輸入的任何檢索應用,益處係其獨立於使用中之條碼協定,且熟習此項技術者會明白變體。
儘管已針對一或多個特定具體實施例說明本發明,但應明白,可進行本發明之其他具體實施例而不背離本發明之精神與範疇。因此,認為本發明僅受所附申請專利範圍及其合理解釋限制。
10‧‧‧資料庫
13‧‧‧索引資訊/索引
16‧‧‧描述符
18‧‧‧第一指標
21‧‧‧第二指標
為了更全面理解本發明之性質及目的,應參考附圖及以上說明。簡潔而言,該等圖式係:圖1顯示依據本發明之一資料庫;圖2顯示依據本發明之一索引;圖3係依據本發明之一方法的流程圖;圖4顯示依據本發明之另一索引;及圖5顯示依據本發明之另一索引。
13‧‧‧索引資訊
16‧‧‧描述符
18‧‧‧第一指標
21‧‧‧第二指標

Claims (24)

  1. 一種可檢索索引資訊資料庫,各索引具有:至少一描述符,一使用者可能提供該至少一描述符以便識別一項目;一第一指標,其識別該項目之一位置;及一第二指標,其識別一一般資訊位置,該一般資訊可能有助於該使用者決定是否請求該項目之取回。
  2. 如請求項1之資料庫,其中該等描述符之至少一個為一數字。
  3. 如請求項1之資料庫,其中該等描述符之至少一個為文字。
  4. 如請求項1之資料庫,其中該等項目之至少一個為可以顯示給一使用者的一圖示。
  5. 如請求項1之資料庫,其中藉由該第二指標所識別之該一般資訊係一聽覺輸出。
  6. 如請求項1之資料庫,其中該等項目之至少一個為一電腦程式。
  7. 如請求項1之資料庫,其中該第二指標識別一類型指示器,該類型指示器識別一項目所屬於的一一般類別。
  8. 如請求項7之資料庫,其中該索引資訊包含8個位元組,其至少一個係用以儲存該類型指示器。
  9. 如請求項8之資料庫,其中該等位元組之一係用以儲存一第一描述符。
  10. 如請求項9之資料庫,其中該等位元組之另一位元組係 用以儲存一第二描述符。
  11. 如請求項8之資料庫,其中該等位元組之至少一個係用以儲存該第一指標。
  12. 如請求項1之資料庫,其中該等索引之至少兩個具有一指向相同位置之第一指標,但具有不同描述符。
  13. 一種取回一項目之方法;提供一可檢索索引資訊資料庫,各索引具有(a)至少一描述符,一使用者可能提供該至少一描述符以便識別該項目,(b)一指標,其識別該項目之一位置,及(c)一第二指標,其識別一一般資訊位置,該一般資訊可能有助於該使用者決定是否請求該項目之取回;輸入一檢索查詢;針對與該查詢相匹配之描述符檢索該資料庫;及提供一可選擇圖示列表,該等可選擇圖示對應於具有一與該查詢相匹配之描述符的項目。
  14. 如請求項13之方法,其中該第二指標係一類型指示器,該類型指示器識別一項目所屬於的一一般類別,且該方法進一步包含:識別具有與該查詢相匹配之描述符之項目的類型指示器;針對具有該已識別類型指示器之項目檢索該資料庫;及在該列表中提供與具有該已識別類型指示器之該等項目相對應的圖示。
  15. 如請求項13之方法,其中該列表係經配置以在該列表之 一位置處具有帶相匹配描述符之項目,及在該列表之另一位置處具有無相匹配描述符之項目。
  16. 如請求項13之方法,其中該等描述符之至少一個為一數字。
  17. 如請求項13之方法,其中該等描述符之至少一個為文字。
  18. 如請求項13之方法,其中該等項目之至少一個為一資訊片段。
  19. 如請求項13之方法,其中該等項目之至少一個為一電腦程式。
  20. 如請求項13之方法,其中該索引資訊包含8個位元組,其至少一個係用以儲存該第二指標。
  21. 如請求項20之方法,其中該等位元組之一係用以儲存一第一描述符。
  22. 如請求項21之方法,其中該等位元組之另一位元組係用以儲存一第二描述符。
  23. 如請求項20之方法,其中該等位元組之至少一個係用以儲存該第一指標。
  24. 如請求項13之方法,其中該等索引之至少兩個具有一指向相同位置之第一指標,但具有不同描述符。
TW097114881A 2007-04-23 2008-04-23 一般化之語言非相關索引儲存系統及檢索方法 TWI439877B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US91330707P 2007-04-23 2007-04-23

Publications (2)

Publication Number Publication Date
TW200910124A TW200910124A (en) 2009-03-01
TWI439877B true TWI439877B (zh) 2014-06-01

Family

ID=39873255

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097114881A TWI439877B (zh) 2007-04-23 2008-04-23 一般化之語言非相關索引儲存系統及檢索方法

Country Status (5)

Country Link
US (1) US8099416B2 (zh)
EP (1) EP2140378A1 (zh)
CN (1) CN101715579A (zh)
TW (1) TWI439877B (zh)
WO (1) WO2008128351A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374846B2 (en) 2005-05-18 2013-02-12 Neuer Wall Treuhand Gmbh Text input device and method
US8117540B2 (en) * 2005-05-18 2012-02-14 Neuer Wall Treuhand Gmbh Method and device incorporating improved text input mechanism
US9606634B2 (en) 2005-05-18 2017-03-28 Nokia Technologies Oy Device incorporating improved text input mechanism
US8036878B2 (en) 2005-05-18 2011-10-11 Never Wall Treuhand GmbH Device incorporating improved text input mechanism
EP2133772B1 (en) * 2008-06-11 2011-03-09 ExB Asset Management GmbH Device and method incorporating an improved text input mechanism
EP2354976A1 (en) * 2010-02-09 2011-08-10 ExB Asset Management GmbH Online analysis and display of correlated information
JP5516882B2 (ja) * 2010-07-29 2014-06-11 セイコーエプソン株式会社 プログラム、情報記憶媒体、端末装置、表示システムおよび画像生成方法
EP2503289B1 (en) * 2011-03-22 2016-06-22 Harman Becker Automotive Systems GmbH Management of icons for digital maps
US8972295B2 (en) * 2011-05-23 2015-03-03 Visible Market, Inc. Dynamic visual statistical data display and method for limited display device
CN102682091A (zh) * 2012-04-25 2012-09-19 腾讯科技(深圳)有限公司 基于云服务的视觉搜索方法和系统
US9183655B2 (en) * 2012-07-27 2015-11-10 Semantic Compaction Systems, Inc. Visual scenes for teaching a plurality of polysemous symbol sequences and corresponding rationales
CN104809102B (zh) * 2015-04-01 2018-10-16 北京奇虎科技有限公司 一种基于输入的显示候选词的方法和装置
US10289664B2 (en) * 2015-11-12 2019-05-14 Lenovo (Singapore) Pte. Ltd. Text input method for completing a phrase by inputting a first stroke of each logogram in a plurality of logograms

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2950800A (en) * 1956-10-24 1960-08-30 Graphic Arts Res Foundation In Ideographic type composing machine
US4689743A (en) * 1986-02-11 1987-08-25 Andrew Chiu Method and an apparatus for validating the electronic encoding of an ideographic character
US4951202A (en) * 1986-05-19 1990-08-21 Yan Miin J Oriental language processing system
US5109352A (en) * 1988-08-09 1992-04-28 Dell Robert B O System for encoding a collection of ideographic characters
EP0434588A3 (en) * 1989-12-20 1993-01-20 International Business Machines Corporation Method of expanding user access to a library of shared electronic documents
JPH04310188A (ja) * 1991-03-01 1992-11-02 Internatl Business Mach Corp <Ibm> 文書/画像ライブラリのためのライブラリサービス方法
US5907837A (en) * 1995-07-17 1999-05-25 Microsoft Corporation Information retrieval system in an on-line network including separate content and layout of published titles
US6505160B1 (en) * 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
US5862325A (en) * 1996-02-29 1999-01-19 Intermind Corporation Computer-based communication system and method using metadata defining a control structure
US6003049A (en) * 1997-02-10 1999-12-14 Chiang; James Data handling and transmission systems employing binary bit-patterns based on a sequence of standard decomposed strokes of ideographic characters
US6613100B2 (en) * 1997-11-26 2003-09-02 Intel Corporation Method and apparatus for displaying miniaturized graphical representations of documents for alternative viewing selection
US7372976B2 (en) * 1998-04-16 2008-05-13 Digimarc Corporation Content indexing and searching using content identifiers and associated metadata
US6243713B1 (en) * 1998-08-24 2001-06-05 Excalibur Technologies Corp. Multimedia document retrieval by application of multimedia queries to a unified index of multimedia data for a plurality of multimedia data types
US7181438B1 (en) * 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
JP2001125894A (ja) * 1999-10-29 2001-05-11 Sony Corp 文書編集処理装置及び文書編集処理方法およびプログラム提供媒体
AU2001253403A1 (en) * 2000-04-14 2001-10-30 Justaddsales. Com, Inc. Computer-based interpretation and location system
US6564213B1 (en) 2000-04-18 2003-05-13 Amazon.Com, Inc. Search query autocompletion
US7392326B2 (en) * 2001-02-16 2008-06-24 Microsoft Corporation Method for text entry in an electronic device
US20030023584A1 (en) * 2001-04-27 2003-01-30 Brandin Christopher Lockton Universal information base system
US7013303B2 (en) * 2001-05-04 2006-03-14 Sun Microsystems, Inc. System and method for multiple data sources to plug into a standardized interface for distributed deep search
US6942151B2 (en) * 2001-05-15 2005-09-13 Welch Allyn Data Collection, Inc. Optical reader having decoding and image capturing functionality
US7165022B2 (en) * 2001-06-13 2007-01-16 Fujitsu Limited Chinese language input system
US8005919B2 (en) * 2002-11-18 2011-08-23 Aol Inc. Host-based intelligent results related to a character stream
US7315982B2 (en) * 2003-02-26 2008-01-01 Xerox Corporation User-tailorable romanized Chinese text input systems and methods
JP4381012B2 (ja) * 2003-03-14 2009-12-09 ヒューレット・パッカード・カンパニー 万物識別子を用いたデータ検索システムおよびデータ検索方法
US20050144158A1 (en) * 2003-11-18 2005-06-30 Capper Liesl J. Computer network search engine
US7817140B2 (en) * 2004-08-31 2010-10-19 Research In Motion Limited Handheld electronic device with text disambiguation
US20060129928A1 (en) * 2004-12-02 2006-06-15 Weigen Qiu Use of pointing device to identify ideographic characters
CN101099131B (zh) * 2004-12-07 2011-06-29 字源加拿大公司 用于搜索和发现的设备和方法
US20080065606A1 (en) * 2006-09-08 2008-03-13 Donald Robert Martin Boys Method and Apparatus for Searching Images through a Search Engine Interface Using Image Data and Constraints as Input
US7716224B2 (en) * 2007-03-29 2010-05-11 Amazon Technologies, Inc. Search and indexing on a user device

Also Published As

Publication number Publication date
US20080263015A1 (en) 2008-10-23
US8099416B2 (en) 2012-01-17
WO2008128351A1 (en) 2008-10-30
TW200910124A (en) 2009-03-01
CN101715579A (zh) 2010-05-26
EP2140378A1 (en) 2010-01-06

Similar Documents

Publication Publication Date Title
TWI439877B (zh) 一般化之語言非相關索引儲存系統及檢索方法
US7277029B2 (en) Using language models to expand wildcards
US6735559B1 (en) Electronic dictionary
US20100121870A1 (en) Methods and systems for processing complex language text, such as japanese text, on a mobile device
BRPI0615596B1 (pt) Desambigüização de texto permitindo uma expansão dinâmica de associações de tecla
US8583415B2 (en) Phonetic search using normalized string
US7366984B2 (en) Phonetic searching using multiple readings
JP2008059392A (ja) 辞書検索装置および辞書検索処理プログラム
WO2015075920A1 (ja) 入力支援装置、入力支援方法及び記録媒体
KR20080082985A (ko) 데이터 파일 조작 방법 및 장치
JP2008059169A (ja) 中国語例文検索装置および中国語例文検索処理プログラム
JP2008117310A (ja) 辞書検索装置および辞書検索処理プログラム
JP4004060B1 (ja) 文字検索方法
JP2009104475A (ja) 類似文書検索装置、類似文書検索方法およびプログラム
JPH05250416A (ja) データベースの登録・検索装置
JP2005044071A (ja) 電子辞書
TWI408564B (zh) 搜尋文件方法及其人機介面裝置
JP2011123542A (ja) 電子機器及び情報表示プログラム
JP2008140074A (ja) 例文検索装置および例文検索処理プログラム
JP2000315210A (ja) 文書管理システムおよび文書管理方法
WO2005098672A1 (ja) 電子辞書
JP2006172029A (ja) 検索結果提示方法
JP2006343972A (ja) 検索装置
JPH0721212A (ja) 文書処理装置
JPH07129565A (ja) 情報処理装置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees