TW200805251A - A method and apparatus for accessing a digital file from a collection of digital films - Google Patents
A method and apparatus for accessing a digital file from a collection of digital films Download PDFInfo
- Publication number
- TW200805251A TW200805251A TW095146399A TW95146399A TW200805251A TW 200805251 A TW200805251 A TW 200805251A TW 095146399 A TW095146399 A TW 095146399A TW 95146399 A TW95146399 A TW 95146399A TW 200805251 A TW200805251 A TW 200805251A
- Authority
- TW
- Taiwan
- Prior art keywords
- file
- language
- digital
- name
- information
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000013519 translation Methods 0.000 claims description 3
- 206010011469 Crying Diseases 0.000 claims 1
- 230000000052 comparative effect Effects 0.000 claims 1
- 230000009977 dual effect Effects 0.000 claims 1
- 238000003307 slaughter Methods 0.000 claims 1
- 239000007787 solid Substances 0.000 claims 1
- 230000006870 function Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 239000002023 wood Substances 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/433—Query formulation using audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Description
200805251 W 九、發明說明: 【發明所屬技術領域】 本發明有關一種從數位檔案之集合存取數位檔案的方 - 法與裝置,且更特別有關於使用語音輸入以存取檔案之方 .法與裝置。 、 【先前技術】 近來,此等具有語音啟動控制機構之裝置持續地越來 越廣党歡迎。具有“語音撥號,,功能之行動電話與語音啟動 之玩具是目前可以輕易找到之裝置。 然而,此等裝置通常須要預先規劃將語音輸入與特定 項目相關聯(在—行動電話中’此項目為特㈣體之聯絡號 碼)。當此涉及大數目個體時,例如像是在地址簿或媒體檔 案集合之情形中,這會是—項麻煩之過程。由於其使用不 方便’而使得此種特性對於使用者而言並非所欲。 目別’在-些裝置中併入語音辨識特徵而無須預先規 m此種技術並未足夠成熟’而無法克服在辨識具 二π音或含糊不清的英語之困難。此外,雖然,英語 為在此數位時代用於聯絡地球村之所選擇語言,然而,其 並非為在使用中之唯一组+ ^θΛ ^乍°°5在世界中有眾多人口的國家 像疋中國或印度大部份的 立拉1 τ亚〆又有使用英語,此等具有 #心5L語音辨識特徵之穿 用。如要益、“主 二國家中並不會被廣泛採 用。如果無法特別滿足這些 ^ ^ f+ ^ ^ v 〃扁費者市場之須求,則此 代表對於运些公司機會之損失。 此種智慧型”(smart)裝置在曰& 置在目則並不具有多種語言辨 6 200805251 識功能。因此’此等裝置之製造商對於具有英語以外語言 Γ力須求之市#,須要製造相同產品之不同版本,且這無 思間會增加各裝置之製造成本。這是由於當須要製造此產 品之其錢本時’須要另設專用之生產線/設備,或須要修 改此用於央語版本產品之生產線/設備。 具有多種語言辨識能力以適當地管理與管制不同文字 碼集合,亦是對於此等“智慧型,,裝置之另—種挑戰,文字 碼集合例如是:用於英語_字母數字為主語言之ASCII,用 於傳統繁體中文之Big_5,用於簡體中文t GB,以及用於 曰文之JIS等。 【發明内容】 在本發明之第-個觀點中提供一種方法,用於從此電 子裝置中包括-個以上數位檔案之集合存取至少一個數位 :案此方法包括以下步驟:產生一個索引,其包括從此 木合中各此等一個以上數位檔案所獲得之此等資訊項目, 在匕木〇貝汛中各數位檔案連接至至少一個資訊項目; 在此語音接收模式期間以至少一種語言接收此說話者獨立 之語音輸入;判斷此語音輸入之語言;對於此語音輸入之 語言設定語音接收模式;以及將此語音接收模式期間所接 收之語音輸人與在此索引中之項目比較。當此語音輸人與 此索引中至少一個此等資訊項目符合一致時,貝I丨可以有利 地存取此;^案。此等數位檔案可以儲存於電子裝置中、在 功能上連接至此電子襄置之任何裝置、或上述之組合。此 至少一個數位檔案可以從以下所選擇之來源接收:—記 7 200805251 體衣置、一有線電腦網路、或一無線電腦網路。 此數位檔案較佳為此等形式,例如:文件、試算表、 ^表資料夾、音樂檔案、影像檔案、以及視訊檔案。 貝λ項目亦較佳包括至少_個字元,且由數位播案獲得 資訊,例如:檔案名稱、附加檔案、來自檔案元資料之歌 曲名稱、來自播案元資料之藝術家姓名、㈣播案元資料 之、、工、、伟紐之歌曲名稱、來自檔案元資料之經縮短之藝術家 姓名、以及翻譯之歌曲名稱或其他歌曲名稱。此資訊項目 可以由任何語言構成。 此語音輸入可以為一種語言或至少一種語言之片語所 構成。可以手動或自動方式設定此語音接收模式。 此電子裝置較佳為:一桌上型電腦、一筆記型電腦、 :個人數位助理(PDA)、一可攜式媒體播放器、或一行動 電話=此用於存取在此電子裝置中至少一數位檔案之設備 可以藉由按下一預設按鈕至少一次而操作。 籲 在本發明之第二個觀點中提供一種裝置,用於從包括 於此裝置中所儲存-個以上數位檔案之集合存取至少一個 數位檔案。此裝置包括:一索引器,用於產生一索引,其 包括從此集合中各此等一個以上數位檔案所獲得之資訊項 目,而在此集合資訊中各數位檔案連接至至少一個資訊項 目;-語音接收裝4,用於在&語音接收模式期帛,以至 少一種語言接收此說話者獨立之語音輸入;以及—處理 器,其判斷此語音輸入之語言,1將此語音接收模式期間 所接收之語音輸入與在此索引中之此等項目比較。當此嗜 8 200805251 音輸入與此索引中至少一個此等資訊項目符合一致時,則 可=有利地存取此檑案。此裝置可以由以下裝置所構成之 、、、述出·桌上型電腦、筆記型電腦、個人數位助理(pDA)、 可攜式媒體播放器、以及行動電話。 此語音接收裝置較佳為麥克風。此語音輸入之語言可 j自動地或以手操作方式選擇。此語音輸入可以為一種語 吕或至少一種語言之片語所構成。
匕等資訊項目較佳可以包括任何語言中之至少一個字 =°此資訊項目可以由數位檔案獲得資訊,例如:檔案名 2付力4田案、來自檔案元資料之歌曲名稱、來自檔案元 資料之藝術家姓名、來自檔案元資料之經縮短之歌曲名 稱、來自檔案元資料之經縮短之藝術家姓名、以及翻譯之 歌曲名稱或其他歌曲名稱。 其精由按下此至少一 數位檔案之設備。此裝 此裝置可以包括至少一個按鈕 個按鈕至少一次,以啟動此存取一 置較佳可以包括一顯示器。 為了充分完全瞭解本發明且容易將其付諸實現,現 :::明唯一實施例為非限制性例子,並參考所附圖 δ兄明本發明。 【實施方式】 ,:討論之目的在於提供有關於可以實施本發明之一 二“异裱境之簡短一般性說明。雖然並 :以電腦可執行指令之一般上下文說明,例如, 電腦所執行之程式模組。通常,此等W包括 9 200805251 权式、子70、組件、資料結構,以實施特定 別抽象資料型式。如同熟習此技術人士瞭解=執仃特 其他電腦系統乡且態實施,其包括:手持式裝置、=可= 系統、微處理器為主或可程式消費者電子裝置夕处理益 電腦(PC)、小型(抨於、+ 、、、、罔路個人 j生(迷仏)電腦、主機式電腦等。 以在分散式計算環境中實施通X亦可 遠端處理裝置以勃—/ 4 匕、、二通L網路連接之 ..έ ^. 仃任務。在分散式計算環境中,此程式 杲、、且0以位於本地與遠端記憶體儲存袭置巾。 % -二考t 1 w ’其所揭示流程圖顯示本發明方法之較佳 貝施例,用於從此電子I 孕乂仏 隹八在㈣, 千衣置中所包括-個以上數位檔案之 〉、一個數位檔案。此電子裝置可以例如為.卓 上型電腦、筆記型電腦、個人數位助二= 文件、試算表、播放表、資料Λ 立紅, 了 ^匕括· 以及視訊檔案。在第J s中戶Λ曰Ά案、影像播案、 田茶在弟1圖中所顯示之此實施例中 位檔案是儲存於此等媒體檔案立 ' 隹Α由像θ桌、以及視訊檔案) 二::以從一個來源例如記憶體裝置、有線電滕網 :之=線電子網路接收至少—個數位擋案。此等數位檑 系:之杲合可以存在於雷早梦罢士 隹於冤子衣置_之記憶體裝置中、或可連 接至此電子裝置之記憶體裝置中。 飞了運 非揮發性記憶體、以及可以為;己憶體裝置可以為 、, 巧陕閃纪體、或硬碟機。 :先,啟動—設備而將此電子裝置中之語音接收模式 二此電子裝置可以具有—顯示器以顯示-選單,從 运早可以選擇此設備;或者此裝置可以具有簡捷的開關/ 10 200805251 按鈕,其可以被按下至少一次,以啟動此語音接收模式。 在此時,使用者可以手操作方式選擇用於語音輸入之一種 特疋扣0或夕種浯§ 22。此可以協助此裝置以處理語音輸 入。應注意,此種特定語言之各方言例如中文之廣州話、 潮州話、以及閩南語等被認為是不同語言。 在將語音接收模式致能之後,將一系統初設以從一電 子I置中之集合存取一數位檔案,以準備此用於存取在此 木合中之檔案之即將到來之語音輸入24。在此初設過程期 間,檢查以確認此具有在集合中檔案資訊之任何資訊索引 之存在26。 如果並/又有找到索引、偵測到較少數位檔案(有些檔案 被刪除)、或偵測到新的數位檔案,則搜尋在此電子裝置與 所連接任何記憶體裝置中之媒體檔案28。此從各檔案所擷 取與檢#: 25之資訊可以包括以下至少之—··檐案名稱、 附加檔案、來自檔案元資料之歌曲名稱、纟自檔案元資料 之蟄術豕姓名、來自檔案元資料之經縮短之歌曲名稱、來 自檔案元資料之經縮短藝術家姓名、以及翻譯之歌曲名稱 或其他歌曲名稱。上述資訊亦可以由替代來源獲得29,例 如網際網路;或者如果此電子裝置連接至此替代來源的 活,則可以由主機獲得上述資訊。各資訊項目應包括至少 子兀。此所擷取之資訊可以為任何語言,而無須以英語_ 文數字為主。可以操取各種形式之中文字(簡體字與傳統繁 體字)、各種形式之日文字體(漢字、片假名、平假名)、韓 國子伊斯蘭子等’且可以儲存於資訊索引中。上述非英 11 200805251 W 浯字至英語之字譯(transliteration)亦可以儲存於資訊索引 中。如果此種資訊是包括於檔案元資料中,則上述非英語 字至英語之翻譯亦可以儲存於資訊索引中。此為可能各數 位檔案具有在此資訊索引中複數個資訊項目,以使得此檔 案可以經由各種路徑存取,此各種路徑例如為:經由藝 術家姓名、經由歌曲名稱、經由檔案名稱等。在此偵測到 較少檔案之情形中,則在當產生索引時,將此等不存在播 案之資訊項目去除。使用者可以對一首特定歌曲給予另一 個名稱’且此另一個名稱亦可以包括於索引中。當收集到 關於此等媒體檔案之所有資訊後,_字碼集合辨識功能(27) 为析.各媒體檔案之資訊且辨識使用於各檔案中之一或 多個碼集合。 ——然後,在電子裝置中形成一索引3〇,其包括:來自此 -電子裝置與任何功能上連接記憶體裝置之中各數位播案之 資訊項目’以及字碼集合資訊。在建立此索引後,將此索 引載入於電子裝置中(3 2、,Γ/ μ -f 电卞衣置甲卩2)以致於可以存取在此索引中所 有資訊項目。當建立此資訊索引時,如果並未制到新的 數位4田案,且如果並無數位檔案被刪除,則在轉認此資訊 索引之存在後(26),亦可以載入此資訊索引(32)。 應注意此用於上述步驟所須之時間期間取決於:資料 存取速率、記憶體輸入/輸出速率、以及網路/遠端饲服器 等候時間。其為明顯此等數位檔案越大,則由於此被處理 資料之體積,此用於上述步驟所須時間期間越長。 在此日守,此電子襄置準備好接收語音輸入。此電子裝 12 200805251 置可以發出可以聽到之馨 徒用去 # 、 α 次頌不一視訊警告以提醒此 ,/、已準備好以聲音接收模式接收語立 音輸入與說話者無關 、"。一 …、肩預先錄製,且此電子裝置基
與-使用,,形式。在此方法中之語音處理是足 =輪任何特殊方言—傻,而可以區 ;音輪人於此電子裝置34中。此語音 ^可以-種語言構成。此語音輪入亦可以由包括一種以 語所構成。例如’此歌曲名稱像是“帝女£1〇·,, 二^且可以處理°對於在其元資料中具有翻譯名稱 位槽案,則可以使用原來或翻譯名稱,以允許存取相 同數位權案。例如,“沒有保留的愛”或“N〇 化[_,, 可以允許存取相同的數位檔案。 ▲在將語音輸入於此電子裝置後,處理此語音36。如果 較早並未以手操作方式實施語言選擇22,則可以自動設定 有,於語音輸人語言之適當語音接收模式。如果此語言選 擇疋X手操作方式设定,則將此使用者所設定語言模式載 入。此允許正確判斷語音輸入。參考第3圖,其說明自動 化處理語音之序列。在步驟25獲得媒體頭部資訊361,且 在步驟27獲得字碼集合362 ,以及在步驟29中,將從遠 端來源所收集之媒體資訊363輸入至語言認識辨識功能364 中’以使得能夠將最適合語音辨識語言模式載入365。例 如如果此5吾S認識辨識功能判斷:此使用於媒體樓案之 中之碼集合為屬於ASCII或GB,而此來源國家為美國(USA) 與中華人民共和國(PRC),則將US A英語模式與PRC普通 13 200805251 載入㈣於語音辨識。然後,此語音輸入被進 一步過濾”366,從此語音輪入掘取有意義之媒體資訊例如 歌曲名稱、藝術家姓名、以及專集名稱,且提供給語音辨 識益作為用於語音辨識之標的。例如,此語音輸入“由 :t曰之愛疋不保留”,貝將“愛是不保留,,掘取作為歌 曲名稱貧訊,而將“Shar〇n _,,智慧地擷取為藝術家資 訊0然後,將此所掘敗夕咨 π忾取之貝矾加至語音辨識儲存庫 (Ρ〇〇1)367。亦在此語音輸人上實施過據,而在當實施語言 手操作選擇時22,以騎此進⑼音賴儲存庫中 目。 、 在處理此語音輸人且衫此項目進人語音辨識儲存庫 之後’將此輸入與在帝引中之杳^ 长家引中之貝訊項目比較38。當此在輸 入與至少-資訊項目之間匹配時,則顯示此連接至此資訊 項目之數位檔案’而用於使用者選擇。此所顯示之數位檔 案可以為-結果表,且此使用者可以選擇所想要之歌: 42、選擇所想要之播放| 44、或選擇來自所想要藝術家之 歌曲46。此等選擇僅用於說明目的,而並非用於限制。 參考第2圖’其顯示-裝置5(),用於從儲存與此裝置 5〇中包括一個以上數位檔案之集合存取至少-個數位檔 案。此裝置可以例如為:一桌上型電腦、一筆記、 -個人數位助理(PDA)、—可攜式媒體播放器、或 電話。此等數位檔案可以例如為:文件、試瞀表/ 表、資料爽、音樂檔案、或視訊擋案。此至;:個二 案可以由一來源、例如:一記憶體裝置、-有線電腦網路: 14 200805251 或Γ無線電腦網路接收。此等數位播案之集合可以存在 於·包括於此裝置50中之一記憶體裝置58中;或此等數 位4田案可以存在於可以連接至此裝置5G <個別記憶體裝 置中。此記憶體裝置可以為非揮發性記憶冑,以及可以為 决閃5己憶體或硬碟機。為了啟動此設備以存取一數位檔 案’此裝置50可以具有 '顯示器54以顯示一選單,盆允 :將此設備致能;或者此裝置5〇可以具有—簡捷之開關/ 按鈕(未圖不),其被按壓—次以啟動此設備。 衣置50可以具有一殼體52以容納各種組件。此裝置 5〇可以具有一顯示器54,用於顯示此裝置50之資訊,1 包:有關於儲存於此裝£5〇中之檔案、或可存取此裝置;。 之貢訊。可以設置有—索引器、56,用於產生—素引,其包 括由此集合中各此等一個以上數位檔案所獲得之資訊項 目。在此集合貧訊中之各數位檔案可以連接至至少一個資 訊項目。此資訊項目可以包括至少一個字元且可以任何語 言構成。此從各檑案所擷取與檢索之資訊包括下列至少之 一:檔案名稱、附加檔案、來自檔案元資料之歌曲名稱、 來自檔案元資料之藝術家姓名、來自檔案元資料之經縮短 之歌曲名稱、來自檔案元資料之經縮短之藝術家姓名、以 及縮短之歌曲名稱或其他歌曲名稱。各資訊項目應包括至 少一字元。此所操取之資訊可以由任何語言所構成,且盔 須為以英語文數字字母為主。可以梅取各種形式之中文; (簡體字與傳統繁體字)、各種形式之日文字(漢字、片假名、 平假名)、韓國字、伊斯蘭字等。上述非英語字至英語之字 15 200805251 /、y X儲存於資訊索引中。如果發現此種資訊是在檀案 元資料中,則上述非英語至英語之翻譯亦可以儲存於資訊 索引中。此為可能各數位檔案具有在此資訊索引中複數個 ”項目以使得此檔案可以經由各種路徑存取,此各種 咎例如為·經由藝術家姓名、經由歌曲名稱、經由檔 案名%等。此使用者可以對一首特定歌曲給予另一個名 稱且此另一個名稱亦可以包括於此索引中。 此外,裴置50可以包括語音接收裝置6〇,用於在語 音接收模式期間以至少一種語言接收語音輸入。此語音接 衣置可以為麥克風或允許音訊信號輸入之任何其他裝 置。此語音接收裝置6G將語音輸人傳送至處理器Μ。此 =音輸入可以由一種語言所構成。此語音輸入亦可以為由 種乂上扣δ之片浯所構成。例如,歌曲名稱像是“帝 女flcmer”是可以理解的。對於具有在其元資料中翻譯名稱 之此等數位檔案而t,使用此兩者中任一名稱允許存取相 同數位檔案。例如,“愛是不保留,,或“No Reserve In Love” 可以允許存取相同的數位檔案。處理器、62可以自動判斷 語音輸人之語言。裝置5以可以手動方式設定此語音輸 入之語言,以致於處理器,62無須自動地執行任務。亦可 以使用處理器 62在扭音妓伙#』u 在扣㈢接收杈式期間將所接收之語音輸 人與此在索引中之此等項目比較。此語音輸入與說話者無 Μ ϋ㈣先錄製’且此電子装置基本上為“取得冬使 =,’形式。在此裝置5G中之語音辨識模組是^夠強固,僅 官有任何特殊方言腔調或喃喃咕儂,而可以區別語音輸 16 200805251 - 入° 當此在輸入鱼至φ _次> 〃 舅汛項目之間匹配時,則將此連 接至資訊項目之數位擔查翻一 蘇案顯不於··用於使用者選擇之顯示 裔5 4上。此所顯示之^ ^ . <數位檔案可以為一結果表,且此使 用者可以選擇所想要之都 _ . ^ <歌曲、所想要之播放表、或來自所 想要藝術家之歌曲。此莹、壁埋# m λ 此4選擇僅用於說明目的,而並非用 於限制。 應注意此在第2圖中之箭頭表示,在此裝置50之各種 _組件之間之資料流動方向。 雖然在以上描述中說明本發明之較佳實施例,然而, 熟習此有關技術人士瞭解,在其設計與結構之細節可以作 許多變化或修正,而不會偏離本發明。 【圖式簡單說明】 第1圖為根據本發明一較佳實施例之從數位檔案之集 合中存取數位檔案的方法之流程圖; 第2圖為根據本發明一較佳實施例之從數位檔案之集 籲合中存取數位檔案的裝置之系統概要圖;以及 第3圖為第1圖中語音處理步驟3 6之所包含步驟。 【主要組件符號說明】 20 將語音接收模式致能 22 手動語言選擇 24 糸統初設 25 擷取媒體頭部資訊 26 找到現有索引? 17 200805251 一 27 字碼組辨識 28 搜尋媒體檔案 29 從遠端來源搜尋媒體資訊 30 建立索引 32 載入索引 34 語音輸入於裝置中 36 處理語音 38 將語音輸入與索引比較 • 40 密切匹配之確實結果或列表 42 歌曲表 44 播放表 46 藝術家表 ^ 50 裝置 52 殼體 54 顯示器 56 索引器 • 58記憶體 60 語音接收裝置 62 處理器 361 媒體頭部資訊 362 媒體字碼集合 363 來自遠端來源之媒體資訊 364 語言辨識驗證功能 365 載入辨識語言模式 18 200805251 366 過濾器功能 367 辨識後語音儲存庫
19
Claims (1)
- 200805251 十、申請專利範面: 1.-種用於從-電子裝置中所包括一個以上數位檔案 之一集合存取至少一個數位檔案之方法,其包括以下步 產生-個索引’其包括從該集合中—個以上數位檔案 每者所獲得之資訊項目’而在此集合資訊中該數位檔;各 者連接至至少一個資訊項目; 田/、 在此語音接收模式期間’以至少一種語言接收與說話者獨立之語音輸入;判斷該語音輸入之語言; 對於該語音輸入之語言設定該語音接收模式;以及 將該語音接收模式期間所接收之該語音輪入與在該 引中之此等項目比較, 、 〆” 其中,當該語音輸入與該索引中至少—個該等資訊項 目符合一致時,則存取該檔案。 2. 如申請專利範圍第丨項之方法,其中 該數位檔案由以下所構成之組選出:文件、試算表、 鲁播放表、資料夾、音樂檔案、影像槽案、或視訊標案。 3. 如申請專利範圍g i項之方法,其中該等資訊項目 包括至少一字元。 4·如申請專利範圍第丨項之方法,其中 該資訊項目從該數位檔案所獲得之資訊是由以下所構 成之組選出:檔案名稱、附加檔案、來自檔案元資料之歌 曲名稱、來自該檔案元資料之藝術家姓名、來自該檔案元 資料之經縮短之該歌曲名稱、來自該檔案元資料之經縮短 20 200805251 、其他歌曲名稱、以 其中 之忒藝術家姓名、翻譯之該歌曲名稱 及來自遠端來源之上述任何物件。 5.如申請專利範圍第1項之方法, 且有賴於至少一個字 讀貧訊項目為任何語言所構成 瑪集合。 6·如申請專利範圍第丨項之方法,其中 該語音輸入由—種語言構成,或由至少該一種語言之 句子所構成。 7·如申請專利範圍第丨項之方法,其中 該數位檔案是從一群組中所選出的來源以儲存,該群 組包含:電子裝置、任何以功能連接至該電子裝置之裝置、 以及上述該等裝置之組合。 8. 如申明專利範圍第1項之方法其中 該語音接收模式之該語言是由一群組中所選出之方式 而設定’該群組包含:手動選擇以及自動選擇。 9. 如申請專利範圍第1項之方法,其中 該至少-個數位檔案是由—群組所選出之來源而接 收,該群組包括:—記憶體裂置、—有線電腦網路、以及 一無線電腦網路。 10·如申請專利範圍第丨項之方法,其中 該電子裝置是由以下所構成之組選出:桌上型電腦、 筆記型電腦、個人數位助理(PDA)、可攜式媒體播放哭、 以及行動電話。 m U •如申請專利範圍第1項之方法,其中 21 200805251 該語音輸入係經過濾。 12· —種用於從一儲存於一裝置中所包括一個以上數 位檔案之一集合存取至少一個數位檔案 -索引器,用於產生一索引,其包二二各此 等-個以上數位權案每者所獲得之此等資訊項目,而在此 集合資訊中各該數位檔案連接至至少一個該資訊項目; 一語音接收裝置,在此語音接收模式期間,以至少一 種語言接收此說話者獨立之語音輸入; 一處理器,用於判斷該語音輸入之該語言·, 該處理器能夠將在該語音接收模式 、J間所接收之該扭 音輸入與在該索引中之項目比較, 设叹 其中,當該語音輸入與該索引中至 1固該等資却 目符0 —致時,則可以存取此檔案。 、i、 13·如申請專利範圍第12項之裝置,其中 該裝置是由以下所構成之組選出: 果上型電腦、筌 型電腦、個人數位助理(PDA)、可攜式媒 ° 動電話。 ⑨双态、或仃 14.如申請專利範圍第12項之裝置,其中 該語音接收裝置為一麥克風。 15·如申請專利範圍第12項之裝置,其中 此用於判斷該語音輸入之語言之方式是 , 選出,該群組包含:自動與手動。 群組中所 16.如申請專利範圍第12項之裝置,其中 該數位檔案由以下所構成之群組 、印.文件、試算表、 22 200805251 播放表、資料失、音樂檔 1 7 1由& $ 少、,、像檔案、以及視訊檔案。 .如申印專利範圍第12項之裝置,其中 該等資訊項目包括至少一個字元。 18. 二申請專利範圍第匕項之裝置,其中 邊資訊項目是由一群组選 1 人 &出之该數位檔案獲得該資 , 名%附加檔案、來自檔案元資料 之歌曲名稱、來自該權宰元資料 、 也—一、— ” 科之藝術家姓名、來自該梓 木元貧料之經縮短之歌曲义播 备 …„ 曲名稱來自該槽案元資料之㈣ 短的該藝術家姓名、翻譯之歌曲名稱'、、 及來自遠端來源之上述任何物件。 聃乂 19. 如申請專利範圍第12項之裝置,其中 該資訊項目以任何語言所構 碼集合。 且取决於至少一個字 20. 如申請專利範圍第16項之裝置,其中 該語音輸入由一種語言構成 語所構成。 夕種語g之片 21. 如申請專利範圍第12項之裝置,其中 至少-個該數位檑案是從—群组所選出 收,該群組包括:一記體步w ’、 接 —有線電腦網路、以及 一無線電腦網路。 久 22. 如申請專利範圍第12項之裝置,更包括 一顯示器。 23·如申請專利範圍第12項之裝置,其中 5亥s吾音輸入係經過渡。 23
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SG200508000-7A SG133419A1 (en) | 2005-12-12 | 2005-12-12 | A method and apparatus for accessing a digital file from a collection of digital files |
Publications (1)
Publication Number | Publication Date |
---|---|
TW200805251A true TW200805251A (en) | 2008-01-16 |
Family
ID=38140537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW095146399A TW200805251A (en) | 2005-12-12 | 2006-12-12 | A method and apparatus for accessing a digital file from a collection of digital films |
Country Status (15)
Country | Link |
---|---|
US (1) | US8015013B2 (zh) |
EP (1) | EP1969590A4 (zh) |
JP (1) | JP2009519538A (zh) |
KR (1) | KR20080083290A (zh) |
CN (1) | CN101341531A (zh) |
AU (1) | AU2006325555B2 (zh) |
BR (1) | BRPI0619607A2 (zh) |
CA (1) | CA2633505A1 (zh) |
NO (1) | NO20083087L (zh) |
NZ (1) | NZ569291A (zh) |
RU (1) | RU2008128440A (zh) |
SG (1) | SG133419A1 (zh) |
TW (1) | TW200805251A (zh) |
WO (1) | WO2007070013A1 (zh) |
ZA (1) | ZA200805567B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100197255A1 (en) * | 2009-02-05 | 2010-08-05 | Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America | Method and apparatus for dynamic station preset configuration in a radio |
US10140320B2 (en) | 2011-02-28 | 2018-11-27 | Sdl Inc. | Systems, methods, and media for generating analytical data |
US20120221319A1 (en) * | 2011-02-28 | 2012-08-30 | Andrew Trese | Systems, Methods and Media for Translating Informational Content |
US20120284276A1 (en) * | 2011-05-02 | 2012-11-08 | Barry Fernando | Access to Annotated Digital File Via a Network |
US8983963B2 (en) * | 2011-07-07 | 2015-03-17 | Software Ag | Techniques for comparing and clustering documents |
US9984054B2 (en) | 2011-08-24 | 2018-05-29 | Sdl Inc. | Web interface including the review and manipulation of a web document and utilizing permission based control |
KR102081925B1 (ko) * | 2012-08-29 | 2020-02-26 | 엘지전자 주식회사 | 디스플레이 디바이스 및 스피치 검색 방법 |
US9916306B2 (en) | 2012-10-19 | 2018-03-13 | Sdl Inc. | Statistical linguistic analysis of source content |
KR102115397B1 (ko) | 2013-04-01 | 2020-05-26 | 삼성전자주식회사 | 휴대 장치 및 휴대 장치의 재생목록 표시 방법 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4833714A (en) * | 1983-09-30 | 1989-05-23 | Mitsubishi Denki Kabushiki Kaisha | Speech recognition apparatus |
JPH0594512A (ja) * | 1991-10-02 | 1993-04-16 | Kobe Nippon Denki Software Kk | 電子フアイリング装置 |
CA2115088A1 (en) | 1993-02-08 | 1994-08-09 | David Michael Boyle | Multi-lingual voice response unit |
CA2091658A1 (en) * | 1993-03-15 | 1994-09-16 | Matthew Lennig | Method and apparatus for automation of directory assistance using speech recognition |
US6081774A (en) * | 1997-08-22 | 2000-06-27 | Novell, Inc. | Natural language information retrieval system and method |
JP4036528B2 (ja) * | 1998-04-27 | 2008-01-23 | 富士通株式会社 | 意味認識システム |
US20020193989A1 (en) * | 1999-05-21 | 2002-12-19 | Michael Geilhufe | Method and apparatus for identifying voice controlled devices |
JP4292646B2 (ja) * | 1999-09-16 | 2009-07-08 | 株式会社デンソー | ユーザインタフェース装置、ナビゲーションシステム、情報処理装置及び記録媒体 |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
JP2001285759A (ja) * | 2000-03-28 | 2001-10-12 | Pioneer Electronic Corp | Av情報処理装置及びav情報処理用プログラムがコンピュータで読取り可能に記録された情報記録媒体 |
US20020099533A1 (en) * | 2001-01-23 | 2002-07-25 | Evan Jaqua | Data processing system for searching and communication |
FI20010644A (fi) * | 2001-03-28 | 2002-09-29 | Nokia Corp | Merkkisekvenssin kielen määrittäminen |
US7043431B2 (en) * | 2001-08-31 | 2006-05-09 | Nokia Corporation | Multilingual speech recognition system using text derived recognition models |
ES2281626T3 (es) * | 2002-01-17 | 2007-10-01 | Siemens Aktiengesellschaft | Procedimiento de funcionamiento de un reconocedor automatico de voz para el reconocimiento por voz, independiente del orador, de palabras en distintos idiomas y reconocedor automatico de voz. |
US6952691B2 (en) * | 2002-02-01 | 2005-10-04 | International Business Machines Corporation | Method and system for searching a multi-lingual database |
US7188066B2 (en) * | 2002-02-04 | 2007-03-06 | Microsoft Corporation | Speech controls for use with a speech system |
US6907397B2 (en) * | 2002-09-16 | 2005-06-14 | Matsushita Electric Industrial Co., Ltd. | System and method of media file access and retrieval using speech recognition |
US7046984B2 (en) * | 2002-11-28 | 2006-05-16 | Inventec Appliances Corp. | Method for retrieving vocabulary entries in a mobile phone |
US7321852B2 (en) * | 2003-10-28 | 2008-01-22 | International Business Machines Corporation | System and method for transcribing audio files of various languages |
US7725318B2 (en) * | 2004-07-30 | 2010-05-25 | Nice Systems Inc. | System and method for improving the accuracy of audio searching |
US7711542B2 (en) * | 2004-08-31 | 2010-05-04 | Research In Motion Limited | System and method for multilanguage text input in a handheld electronic device |
US7376648B2 (en) * | 2004-10-20 | 2008-05-20 | Oracle International Corporation | Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems |
TWI258087B (en) * | 2004-12-31 | 2006-07-11 | Delta Electronics Inc | Voice input method and system for portable device |
EP1693828B1 (en) * | 2005-02-21 | 2008-01-23 | Harman Becker Automotive Systems GmbH | Multilingual speech recognition |
US7840399B2 (en) * | 2005-04-07 | 2010-11-23 | Nokia Corporation | Method, device, and computer program product for multi-lingual speech recognition |
-
2005
- 2005-12-12 SG SG200508000-7A patent/SG133419A1/en unknown
-
2006
- 2006-12-11 NZ NZ569291A patent/NZ569291A/en unknown
- 2006-12-11 CN CNA2006800468015A patent/CN101341531A/zh active Pending
- 2006-12-11 WO PCT/SG2006/000384 patent/WO2007070013A1/en active Application Filing
- 2006-12-11 AU AU2006325555A patent/AU2006325555B2/en active Active
- 2006-12-11 RU RU2008128440/09A patent/RU2008128440A/ru not_active Application Discontinuation
- 2006-12-11 JP JP2008545547A patent/JP2009519538A/ja active Pending
- 2006-12-11 CA CA002633505A patent/CA2633505A1/en not_active Abandoned
- 2006-12-11 KR KR1020087015673A patent/KR20080083290A/ko not_active Application Discontinuation
- 2006-12-11 BR BRPI0619607-1A patent/BRPI0619607A2/pt not_active IP Right Cessation
- 2006-12-11 EP EP06835979A patent/EP1969590A4/en not_active Ceased
- 2006-12-11 US US11/637,357 patent/US8015013B2/en active Active
- 2006-12-12 TW TW095146399A patent/TW200805251A/zh unknown
-
2008
- 2008-06-25 ZA ZA200805567A patent/ZA200805567B/xx unknown
- 2008-07-09 NO NO20083087A patent/NO20083087L/no not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
NZ569291A (en) | 2010-03-26 |
NO20083087L (no) | 2008-09-01 |
CA2633505A1 (en) | 2007-06-21 |
US20070136065A1 (en) | 2007-06-14 |
CN101341531A (zh) | 2009-01-07 |
JP2009519538A (ja) | 2009-05-14 |
US8015013B2 (en) | 2011-09-06 |
EP1969590A1 (en) | 2008-09-17 |
WO2007070013A1 (en) | 2007-06-21 |
KR20080083290A (ko) | 2008-09-17 |
SG133419A1 (en) | 2007-07-30 |
RU2008128440A (ru) | 2010-01-20 |
AU2006325555B2 (en) | 2012-03-08 |
EP1969590A4 (en) | 2010-01-06 |
ZA200805567B (en) | 2009-06-24 |
AU2006325555A1 (en) | 2007-06-21 |
BRPI0619607A2 (pt) | 2011-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW200805251A (en) | A method and apparatus for accessing a digital file from a collection of digital films | |
US7162412B2 (en) | Multilingual conversation assist system | |
US8903847B2 (en) | Digital media voice tags in social networks | |
US20100082344A1 (en) | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis | |
US20070088556A1 (en) | Flexible speech-activated command and control | |
US20090327272A1 (en) | Method and System for Searching Multiple Data Types | |
US20100082328A1 (en) | Systems and methods for speech preprocessing in text to speech synthesis | |
US20100082346A1 (en) | Systems and methods for text to speech synthesis | |
US10402407B2 (en) | Contextual smart tags for content retrieval | |
TWI313558B (zh) | ||
CN101467142A (zh) | 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法 | |
JP2015156099A (ja) | 会議支援装置、会議支援装置の制御方法、及びプログラム | |
US20070276668A1 (en) | Method and apparatus for accessing an audio file from a collection of audio files using tonal matching | |
EP3522031A1 (en) | Smart speaker with music recognition | |
CN106021398A (zh) | 一种发布信息的方法和装置 | |
KR20220052581A (ko) | 검색 질의의 의도를 반영한 검색 결과 제공 방법 및 시스템 | |
TW201931158A (zh) | 自然語言的語義解析方法 | |
CN101446975B (zh) | 一种文件定位方法、装置 | |
JP2012108594A (ja) | 検索システム、端末、サーバ、検索方法、プログラム | |
CN106682188B (zh) | 田间科研数据随身读写方法 | |
JP6687078B2 (ja) | 会議支援装置、会議支援装置の制御方法、及びプログラム | |
CN106547753B (zh) | 一种信息分析方法及电子设备 | |
JP5894074B2 (ja) | テキスト変換装置、テキスト変換方法、及びプログラム | |
TWI345158B (en) | Computer-readable storage media, computer programming product, electronic device, automatic searching method of electric note and system thereof | |
US20150112465A1 (en) | Method and Apparatus for On-Demand Conversion and Delivery of Selected Electronic Content to a Designated Mobile Device for Audio Consumption |