TW424382B - Sound scanner - Google Patents

Sound scanner Download PDF

Info

Publication number
TW424382B
TW424382B TW88111405A TW88111405A TW424382B TW 424382 B TW424382 B TW 424382B TW 88111405 A TW88111405 A TW 88111405A TW 88111405 A TW88111405 A TW 88111405A TW 424382 B TW424382 B TW 424382B
Authority
TW
Taiwan
Prior art keywords
unit
sound
text
image
scanning device
Prior art date
Application number
TW88111405A
Other languages
English (en)
Inventor
Dung-Kai Jiang
Original Assignee
Microtek Int Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microtek Int Inc filed Critical Microtek Int Inc
Priority to TW88111405A priority Critical patent/TW424382B/zh
Application granted granted Critical
Publication of TW424382B publication Critical patent/TW424382B/zh

Links

Landscapes

  • Machine Translation (AREA)

Description

五、發明說明(1) [發明之技術領域] 本發明係有關於一種掃描裝 種利用影像掃描裝置’結合 波即時轉譯裝置以及發音裝 描文字影像進而即時發音之 [發明背景與先前技術] 依習知技術,目前影像掃描 電腦裝置之應用’當成週邊 安裝過程,係利用連接線使 連接,再於個人電腦裝置中 獲得被掃描物之影像數位資 現行的文字辨識軟體,則是 操作環境,再配置週邊裝置 文字之影像數位資料來處理 此外,將選定或指定文字產 音波轉譯技術,而此技術的 人電腦裝置,配合制σ八裝置 似電子字典裝置_,將已事 產生有聲輸出。 置,更明確地說,本發明是一 圖文自動分離技術、文字-音 置之有聲掃描裝置,以達到掃 功效。 裝置的使用環境仍需配合個人 產品。因此,影像掃描裝置的 影像掃描裝置與個人電腦裝置 安裝驅動程式與應用軟體,以 料。 安裝於個人電腦裝置為其使用 —影像掃描裝置,進而以包含 ’達到文字辨識之目的。 生有聲輸出,則是利用文字-實施可藉由軟體方式安裝於個 產生有聲輸出’或是實施於類 先設定在裝置中文字資料轉譯 然’上述的各項技術的择彳七揮^ 一 π β 4 Γ ^ ^ 兄中,對於視覺障礙人士而 5’部並非可輕易地操作而產 效,P疋相關軟體與影 =含ί 人電腦以,對視覺障礙人士欲進 ’輸入到個人電腦裝置再… 產對應該被掃描物上之文字的有聲輪出,幾乎無法
III 第4頁 〜 L· 五、發明說明(2) =作從各個分離的應用軟體加以整合以獲得前述 聲輪出。 4 J β 雖然,上述的各項技術發展皆已達到運用至商品化產。, ^:衰顧目前有的應用軟體與裝置,無沒有可達到將各項。技 字:ι合於一體之產品所以,欲達到從掃描影像到文 匕=’非得由使用者自行完成各項技術的介面檀 =接:換,這當然對視覺障礙人士是一項困難的事, 介iii用者而言,亦需有基本的技術概念方可完成 動即睥發:轉3 °0此,若能提供-種可自影像輪入而自 ^即時發音之有聲掃描裝[將可提供視覺障礙人士 =^ 一般書籍或平面紙張作有聲輸出, 减少點字書籍不足之缺‘點,再者,使用本二::’並可 有聲輪出之㈣,可提供—般:母發:之裝置具有 具。 從伢股又母親教育小孩之輔助工 主的二提供-種整合影像掃插、圖文分離、 福裝Ϊ 曰波轉譯以及發音技術於-體之有聲掃 明之另__目的係提供_種無需連接個人電腦裝 置。1】將文字影像自動掃插而即時有聲翻譯之有聲^裝° [發明概述] :鑑術中並無整合影像掃描、圖文分離、文字辨 體裝置,因此,本發明提供一薄餐^々體之軟體方法或硬 不赞月耠供一種整合各項技術之有聲掃椙
第5頁 4243 五 '發明說明(3) ------ 裝置。本發明裝置主要包含中央處理單元、影 像掃描單元、影像處理單元、文字辨識單元、字-音轉擇 單元以及音效單元,而本發明為一整合獨立裝1 /具有無 需連結個人電腦裝置即可進行操作之特性,故可達到即時 有聲翻譯、容易攜帶之優點,同時不需額外增加購置電腦 設備之成本’此外’本發明具有自動/手動模式之設定, 對於不善使用影像掃描裝置或視障者可以自動模式進行操 作,皆能方便使用,而對於一般使用者亦可利用手動模 式,將一般掃描影像以列印、檔案,連結個人電腦等方式 輸出。 [圖式之簡單說明] 本,明有聲掃描裝置之諸多實施例及其優點與特徵將從下 述詳細說明及所附圖式中得到進一步的瞭解。 圖一為本發明之主要組成方塊圖。 圖二為本發明有聲掃描裝置的組成方塊圖。 圖三為本發明有聲掃描裝置的處理流程圖。 圖四為字-音轉譯方塊圖。 j五為本發明另一實施例掃描—音譯專用機的組成方塊 機的處理流程圖 圖六為本發明掃描-音譯專用 [圖式標號說明] 10中央處理單元20控制單元 30影像掃描單元4〇影像處理單元 5〇文字辨識單元60字—音轉譯單^元
第6頁 424§§^ 424§§^
五、發明說明(4) 70音效產生單元80輸入介面單元 90輸出介面單元21馬達 22燈管23電源管理 3 1時脈產生器3 2影像感測器 33前級處理41圖片影像 71音效產生器72錄音 73音量調整74耳機 7 5喇《八81設定面板 82人機介面91顯示 92列印93存檔 9 4個人電腦 [發明之詳細說明] 雖然本發明將參閱含有本發明較佳實施例之所附圖式予以 描述’但在此描述之前應瞭解熟悉本行之人士可修^在$ 文中所描述之發明主要組成,同時獲致本發明之功效。因 此’須瞭解以下之描述對熟悉本行技藝之人士而言為—廣 ,且其内容不在於限制本發明。,於,:成熟應 用之S知技術將在以下說明中不在贅述。 I先參考圖一,係顯示本發明有聲掃描裝置之主要組成方 ,圖,根據本發明此一較佳實施例,有聲掃描裝置主要包 1走中央Λ理單元10、控制單元20、影像掃描單元30、影 立#ΐ早7040、文字辨識單元50、字—音轉譯單元60以及 ;之邙ίΐ元70述中央處理單元10主要聯絡繫各單元 ; 遞’並且產生下達影像掃描單元30所需之伺服 4243bc
控制信號至控制單元2〇 ’以驅動相關之光學機構及光學組 件動作,進而使景々像掃描單元3〇掃指文件或圖案以獲得影 像之數位資料,影像處理早元40經由與中央處理單元之 間的訊號交換傳遞,而自影像掃插單元3〇接收影像之數位 資料,加以分析,執行圖文分離之演算法後,使得影像資 料中的文字影像部份被抽取出來,傳送至文字辨識單元5〇 進行識別’以轉換文字影像部份為文字格式;所識別的文 字格式將由字-音轉譯單元60計算出該文字的音波頻域資 料,亦或由查表映對方式來實施,最後,再由音效產生單 元70將對應文字的音波信號或資料產生有聲輸出。 此外,本發明有聲掃描裝置的組成尚包含輸入介面單元 以及輸出介面單元90。輸入介面單元80係包括面板之設 定’做為使用者與本裝置之間的人機介面處理,而中央處 理單元10將接收輸入介面單元80的設定信號而產生—連串 相關動作與伺服控制信號。輸出介面單元9〇,使得本裝置 的操作得以連接到個人電腦裝置或輸出檔案等方式,而延 伸本裝置應用的程度β 3青配合參閱圖二,顯示了本發明有聲掃描裝置在較佳實施 例t的詳細組成方塊圖。本發明在此一較佳實施例中,輸 入介面80包含設定面板81與人機介面82,而使用者藉由設 定面板81下達動作,經由人機介面82將設定訊息傳至中央 處理單元10。該等動作包括手動模式,自動模式等系令央 處理單元10係由一微處理機來實施’能夠根據前述設定訊 息,產生控制信號下達給包含馬達21、燈管2 2以及電源管 424382 五、發明說明(6) 理2 3的控制單元2 〇,以驅動掃描裝置的相關機構進行影像 掃描。當然該控制單元20之功能可由包含在CPU10内。 在影像掃描單元3 〇中,時脈產生器3 1提供時脈信號給影像 感測器3 2,以輸入被掃描物之影像。而該影像感測器3 2 — 般是由CCD所實施。其乍前級處理33之功能係將影像感測 器32所擷取之電訊號予以增益及適當調整,並經類比/數 位轉換器轉換後,以利影像處理4〇進行數位影像處理。該 影像處理單元40可包含一專屬影像處理器或DSP,以執行 圖文分離技術之演算法。影像處理單元4〇的輸出可分為文 字部份與圖片影像,其中文字部份將送至文字辨識單元 5〇,以識別確認文字。圖片影像41以及辨識出的文字可藉 由輸出介面單元90以各種型式輸出’這包含了顯示器的顯 示91、印表機的列印92、儲存裝置的存檔93與傳送至個人 電腦94以進行更廣泛的應用。 當文字辨識單元50識別了文字部份後,其結果傳遞至字、 音轉譯單元60 ,以取得對應文字之音波資料,且該音波資 料將交由音效產生器Π處理,可進行錄音7 2或是由喇队7 5 與耳機74進行有聲輪出,其間並可做音量調整73 ^ 接著參考圖三,顯示本發明有聲掃描裝置之處理流程圖, 首先由程序100開始,將文件放置於掃描平台,由使用者 在面板設定上選擇進行手動模式1(n或自動模式丨〇4。在程 序101的手動模4中,# t的程序1〇2將逐次们則文件有無 及大小,而後根據偵測結果在程序1〇3時進行參數調整設 定例如對比、亮度、影像模式等,以進入程序1〇8 :而程
Mr 4243 82 五 '發明說明(7) 序104的自動模式,其接續的程序105在彳貞測文件有無及大 小時,可以包含程序1 0 6的自動翻頁偵測以及程序1 〇 7的連 續讀頁偵測,之後進入程序1 08。程序1 08係由掃描裝置進 行影像掃描,以獲得文件影像資料,該掃描動作與一般之 影像掃描器相同》影像處理單元40接收文件影像資料便執 行程序1 0 9的圖文自動分離之演算法。程序11 〇與1丨2係分 別取得圖片影像資料與文字影像資料,其中文字影像資料 經程序113的文字辨識處理以識別出文字。程序lu的介面 輸出可將圖片影像與識別的文字加以輸出。接著,程序 114係執行文字-音波的轉譯處理,以獲得對應文字之音波 資料’緊接的程序115將判斷本裝置是否有插入錄音片; 是’則進行程序11 6的錄音工作;否,則直接進行程序11 7 的發音輸出。 進一步說明程序114的字-音轉譯處理,在本發明不同的實 施例中,可分別使用查表映對方法或使用將空間域轉換為 頻率域之運算方法’來達到將字型轉譯為音效資料之目… 的。
緊接著’圖四顯示字-音轉譯方塊圖,當文字辯識5〇輸出 被掃描物影像的文字部份後’處理流程進入字—音轉^處 理114 ’首先文字部份將執行形狀及特徵筆劃之比對^首 601 ’以分類出_文字型與英文字型,而分別進行十文^ 型類比映對602及英文字型之類比映對603 ,以取得該文、 所對應音波頻率域範圍,經由頻率域轉換604以進行*音+ 映對605,在音波信號輸出至音效產生丨夕X 这土?5 ί ί i用』,可經聲
第10頁 4 243 8 2 五、發明說明(8) 音頻率調整608,該聲音頻率調整6 08係以音波映對6〇5運 算的結果暫存606,並依指標進行句型重整607的結果來執 行;之後,音波信號才輪出至音效產生器71。 圖五顯示本發明另一實施例掃指-音譯專用機的組成方塊 圖。在本發明另一實施例的掃描-音譯專用機中,與先前 實施例最大的不同在於沒有設置輸出介面,而影像處理4〇 所實施的圖文自動分離方法,將直接去除背景影像,切割 出文字影像交由文字辨識50辨認出文字部份。圖五中,除 了不再將圖片影像與辨認出的文字部份做輸出之外,其餘 基本的纪成方塊皆與先前實施例中相同的組成方瑰有著相 同的功效與操作運算方式。 接著圖六顯示了本發明掃描-音譯專用機的處理流程圖。 在此一實施例中,處理流程可以自動模式1〇4進行,自動 地Y貞測文件有無及大小105 ’其中程序105尚包含自動翻頁 偵測1 0 6與連續讀頁偵測1 〇 7。另外,處理流程可啟動學習 模式’以針對偵測文件之有無及大小的程序1 0 2進行學習 訓練’記錄參數’並且執行參數調整設定1〇3。 在以學習模式或自動模式處理完起始狀態後,便可執行影 像掃描1 0 8及圖文自動分離1 〇 9。該程序1 〇 9將僅切割保留 文字影像112,由文字辨識處理113進行辨認文字部份。接 著’字-音轉譯114將根據辨認的文字部份運算處理以取得 該文字對應之音波信號,透過程序1 1 5判斷是否插入錄音 片’以決定將音波信號予以錄音11 6或由程序11 7執行發聲 輸出。
4243 82 五、發明說明(9) 在詳細說明本發明的各種實施例之後,熟悉該項技術人士 可清楚的瞭解,並在不脫離下述申請專利範圍與精神下可 進行各種變化與改變,而且本發明亦不受限於說明書之實 施例的實施方式,例如:圖文自動分離演算法、字-音效 轉譯處理所使用將空間域轉換為頻率域之運算方法等,可 從諸多已發表的相關論文中獲得解決。 [發明功效] 根據本發明所實施的有聲掃描裝置與掃描-音譯專用機, 提供了一種整合影像掃描、圖文分離、文字辨識、字-音 轉譯及發音技術於一獨立之裝置中,使用者無需個人電腦 裝置來完成各種技術間之介面信號的轉換與資料的處理, 讓使用者可輕易地藉由自動模式或學習模式操作本發明之 裝置而獲得以影像掃描方式處理之文字、圖形的分離輸 出,亦或直接轉譯文字發音,進一步提供視覺障礙者容易 接收更多的資訊,而不必局限於少量的點字書籍》 綜上所述,本發明具有諸多優良特性,並解決習知技術在 實務上與應用上之缺失與不便,提出有效之解決方法,完 成實用可靠之系統’進而達成新穎且附經濟效益之價值, 實已符合發明專利之申請要件,懇請鈞局能予詳審並賜 准專利權益保障,以優惠民生實感德便。

Claims (1)

  1. 4243 六、申請專利範圍 1. 一種有聲掃描裝置,包含: 輸入單元,可產生設定信號: 中央處i單元,用以接收前述輸入單元的設定信號,並反 應產生控制信號; 影像掃描單元,用以接收前述控制信號以驅動光學機構掃 f ¥r *- g像處理j元,用以分離前述影像資料^中的圖形影像資料 字料; ' — 文字辨識單元,用以將文字影像資料轉換成文字格式資 字-音轉譯單元,用以轉換前述文字格式資料成為音波信 至T ~~ — ,用以接收前述音波信號,產生有聲輸出;以及 輸出單元,用以將前述圖形影像資料及文字格式資料以媒 出。 一" — 2.如申請專利範圍第1項所述之有聲掃描裝置,其中前述 影像掃描單元為一影像掃描裝置。 37如~申請專利範圍第1項所述之有聲掃描裝置,其中前述 影像處理單元為一數位信號處理器(DSP)。 —.———~—~ ' *'' 4^如申請專利範圍第1項所述之有聲掃描裝置,其中前述 i > 一音轉譯ϋ包字型與音波對應表。 圍第1項所述之有聲掃描裝置,其中前述 音效單元包含音效產生器與喇。八裝置。 6一^申請!利範圍第1項所述之有聲掃描裝置,其中前述
    第13頁 4^4382 六'申請專利範圍 輸出單元的媒體 7. 如申請專利範 輪出單元的媒體 8, 如申請專利範 輪出單元的媒體 9 ·如申請專利範 輸出單元的媒體 H 一種掃描-音 輸入單元,可產 中央處理單元, 應產生伺服控制 影像掃描單元, 構掃描,產生影 影像處理單元, 料; 文字辨識單元, 資料; 字-音轉譯單元, 號;及 音效單元’用以 型式為顯示裝置。 項所述之有聲掃描裝置,其_前述 忒為列印裝置。 圍第1項#、 呀所返之有聲掃描裝置,其_前述 型,為記錄裝置。 1第1項所述之有聲掃描裴置,其令前述 型式為連接器’可外接個人電腦裝置。 譯專用機,包含: 生設定信號; 用以接收前述輸入單元的設定信號,並反 信號; 用以接收前述伺服控制信號以驅動光學機 像資料: 用以抽離前述影像資料中的文字影像資 用以將前述文字影像資料轉換成文字袼式 用以轉換前述文字格式資料成為音波信 接收音波信號,產生有聲輸出。
    第14頁
TW88111405A 1999-07-06 1999-07-06 Sound scanner TW424382B (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW88111405A TW424382B (en) 1999-07-06 1999-07-06 Sound scanner

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW88111405A TW424382B (en) 1999-07-06 1999-07-06 Sound scanner

Publications (1)

Publication Number Publication Date
TW424382B true TW424382B (en) 2001-03-01

Family

ID=21641403

Family Applications (1)

Application Number Title Priority Date Filing Date
TW88111405A TW424382B (en) 1999-07-06 1999-07-06 Sound scanner

Country Status (1)

Country Link
TW (1) TW424382B (zh)

Similar Documents

Publication Publication Date Title
JP2768727B2 (ja) 報告書作成装置および方法
US8274666B2 (en) Projector/printer for displaying or printing of documents
US20030051210A1 (en) Device-independent apparatus and method for rendering graphical data
US8773696B2 (en) Method and system for generating document using speech data and image forming apparatus including the system
JP2012109901A (ja) 資料提示装置
JP2001318592A (ja) 言語学習装置及びその言語分析方法
CN111144138A (zh) 一种同声传译方法及装置、存储介质
TW424382B (en) Sound scanner
JP2009503628A (ja) マルチメディア・デジタルコード印刷装置及び印刷方法
US7359085B2 (en) Method and apparatus for recording sound information and playing sound information back using an all-in-one printer
KR101125618B1 (ko) 다국어 기능을 갖는 학습 보조 장치
JP2021117371A (ja) 情報処理装置、情報処理方法および情報処理プログラム
KR200197477Y1 (ko) 언어 학습 장치
JP2002342049A (ja) 音声対応印刷処理システムおよびその制御方法、並びに記録媒体、コンピュータプログラム
JP2003058360A (ja) 印刷システムにおける音声ガイダンス方法および情報処理装置
JP6229433B2 (ja) 操作案内サーバ、操作案内システム、画像形成装置およびプログラム
KR20030030328A (ko) 음성합성엔진을 이용한 전자책 브라우저 시스템
WO2019234952A1 (ja) 音声処理装置および翻訳装置
JP3240126B2 (ja) 音声入力文字出力装置及びその記録媒体
JP2001134290A (ja) 音声認識システム、方法及び記録媒体
JP3838193B2 (ja) 文章読み上げ装置、同装置のためのプログラム及び記録媒体
JP2000339132A (ja) 文書音声化装置および文書音声化方法
JP2007256502A (ja) 演奏データ遠隔通信システムおよびその制御方法を実現するためのプログラム
JP2004178091A (ja) 情報処理システム
JP4319334B2 (ja) 音声・画像処理装置

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees