TW201227716A - Apparatus and method for converting voice to text - Google Patents

Apparatus and method for converting voice to text Download PDF

Info

Publication number
TW201227716A
TW201227716A TW099147409A TW99147409A TW201227716A TW 201227716 A TW201227716 A TW 201227716A TW 099147409 A TW099147409 A TW 099147409A TW 99147409 A TW99147409 A TW 99147409A TW 201227716 A TW201227716 A TW 201227716A
Authority
TW
Taiwan
Prior art keywords
voice
text
module
data
text conversion
Prior art date
Application number
TW099147409A
Other languages
English (en)
Inventor
yuan-fu Huang
Tien-Ping Liu
Chien-Huang Chang
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Priority to TW099147409A priority Critical patent/TW201227716A/zh
Priority to US13/204,958 priority patent/US20120173236A1/en
Priority to JP2011271264A priority patent/JP2012141596A/ja
Publication of TW201227716A publication Critical patent/TW201227716A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Description

201227716 六、發明說明: 【發明所屬之技術領域】 [0001] 本發明涉及一種語音識別領域,尤指一種語音文字轉換 裝置及方法。 【先前技術·】 [0002] 於許多場合,例如會議、培訓中,我們經常對比較重要 之内容進行記錄,而在做筆記時或中途離開而漏聽了其 他内容,業界推出了一種語音文字轉換裝置,該裝置將 語音轉換成之文字進行存儲,用戶針對重要之資訊亦可 〇 輸入一些關鍵字,然而用戶輸入之關鍵字與轉換出之文 字無法對應,用戶需自己去找匹配用戶自己輸入之關鍵 字之文字部分。 【發明内容】 [0003] 鑒於以上内容,有必要提供一種用戶輸入文字與語音轉 換之文字保持同步之裝置及方法。 [0004] 一種語音文字轉換裝置,包括一語音接收模組、一語音 Q 識別模組及一顯示模組,所述語音文字轉換裝置還包括 一文字輸入模組及一控制模組,所述語音接收模組用於 接收外部之語音信號,所述文字識別模組用於在不同之 時間段内轉換每一時間段内之語音信號為文字資料並發 送給所述控制模組,所述文字輸入模組用於將用戶輸入 之文字發送給所述控制模組,所述控制模組用於將同一 時間段内之用戶輸入之文字、語音資料及所述同一時間 段一起藉由所述顯示模組顯示。 [0005] —種語音文字轉換方法,應用於一語音文字轉換裝置中 099147409 表單編號A0101 第3頁/共11頁 0992081452-0 201227716 ’所述語音文字轉換裝置存儲有對應不同語音資料之文 子貝料,所述語音文字轉換方法包括: [0006] [0007] [0008] [0009] [0010] [0011] [0012] [0013] 接收外部之語音信號; 於不同之時間段内轉換每一時間段内之語音信號為文字 資料; 於接收到用戶輸入之文字後顯示同一時間段内之用戶輸 入之文字、文字資料及所述同一時間段。 與習知技術相比,於上述裝置及方法中’同一時間段内 之用戶輪入之文字、語音資料及所述同一時間段一起顯 — 不’從而保證了語音資料與用戶輸入之文字之同步性。 【實施方式】 。月參閱圖1,本發明較佳實施例語音文字轉換裝置包括一 存儲模組10、一語音接收模組20、一語音識別模組3〇、 —操作模組40、一文字輸入模組50、一控制模組6〇、一 顯不杈組70。於本實施例中,所述文字輸入模組5〇為一 手寫屏,所述操作模組4〇為一接鈕,所述語音接收模組 2〇為一麥克風,所述文字輸入模組5〇為一手寫屏。 所述存儲模組10存儲有對應不同語音資料之文字資料。 所述語音接收模組20用於接收外部之語音信號。 所述語音識別模組30用於將一時間段内之語音信號轉換 為語音資料並於所述存儲模組10中尋找與所述語音資料 匹配之文字資料,並發送匹配所述語音資料之文字資料 給所述控制模組60。 099147409 表單編號A0101 第4頁/共11頁 0992081452-0 201227716 14]所述操作模組40用於被按壓後發送一用戶不於場之資訊 給所述控制模組60。 [〇〇15]所述文字輪入模組50用於藉由用戶輸入文字而發送所述 文字給所述控制模組60。 [〇〇16]所述控制模組60用於判斷接收到之轉換成之文字貢料所 處於之時間段内是否接收到用戶輸入之文字,如果有’ 則將文字資料及所述用戶輸入之文字藉由所述顯示模組 7 〇 —起顯示,如果沒有,則將所述文字資料藉由所述顯 Ο 示模組70單獨顯示。例如,以1分鐘將時間分為多個時間 段,〇到1分鐘這個時間段内,用戶沒有輸入文字,語音 轉換成之文字為:年中技術表彰大會開始’則所述顯示 模組70顯示為:00:00:00-00 : 01:00,年t技術表彰大 會開始,如果20-21分鐘這個時間段内,語音轉換成之文 字為:下面張經理為我們帶來的是電路板走線設計報告 ,用戶輸入之文字為:電路板走線,則所述顯示模組7〇 並列顯示為:〇〇: 20 21 : 〇〇, $面張經理為我們 〇 帶來的是電路板走線設計報♦,00:20:00-00:21 :〇〇, 電路板走線設計。如果用戶中途離場,按一下所述操作 模組40 ’則所述控制模組6〇將離場這段時間内轉換成之 文字加上不同之顏色以示區別。 [ΟΟΠ]請參閱圖1及圖2,本發明較佳實施例語音文字轉換方法 包括如下步驟: [0018] S201,所述語音接收模組2〇接收到外部之語音信號並傳 送給所述語音識別模組3〇 ; 099147409 表單編號Α0101 0992081452-0 201227716 [0019] S202,將一時間段内之語音信號轉換為語音資料並於所 述存儲模組10中尋找與所述語音資料匹配之文字資料, 並發送匹配所述語音資料之文字資料給所述控制模組60 y [0020] S203,所述控制模組60判斷該段時間内是否接收到用戶 輸入之文字,若是,轉至步驟S204,若否,轉至步驟 S205 ; [0021] S204,將所述文字資料、所述用戶輸入之文字及對應之 時間段藉由所述顯示模組70進行顯示; [0022] S205,將所述文字資料單獨藉由所述顯示模組70進行顯 示。 [0023] 綜上所述,本創作確已符合發明專利要求,爰依法提出 專利申請。惟,以上所述者僅為本發明之較佳實施方式 ,舉凡熟悉本發明技藝之人士,爰依本發明之精神所作 之等效修飾或變化,皆應涵蓋於以下之申請專利範圍内 〇 【圖式簡單說明】 [0024] 圖1係本發明較佳實施例語音文字轉換裝置之示意圖。 [0025] 圖2係本發明較佳實施例語音文字轉換方法之流程圖。 【主要元件符號說明】 [0026] 存儲模組:10 [0027] 語音接收模組:20 [0028] 語音識別模組:30 099147409 表單編號A0101 第6頁/共11頁 0992081452-0 201227716 [0029] 操作模組:4 0 [0030] 文字輸入模組:5 0 [0031] 控制模組:60 [0032] 顯示模組:7 0 Ο ο 099147409 表單編號Α0101 第7頁/共11頁 0992081452-0

Claims (1)

  1. 201227716 七、申請專利範圍: 1 . 一種語音文字轉換裝置,包括一語音接收模組、一語音識 別模組及一顯示模組,其改進在於:所述語音文字轉換裝 置還包括一文字輸入模組及一控制模組,所述語音接收模 組用於接收外部之語音信號,所述文字識別模組用於在不 同之時間段内轉換每一時間段内之語音信號為文字資料並 發送給所述控制模組,所述文字輸入模組用於將用戶輸入 之文字發送給所述控制模組,所述控制模組用於將同一時 間段内之用戶輸入之文字、語音資料及所述同一時間段一 起藉由所述顯示模組顯示。 2 .如申請專利範圍第1項所述之語音文字轉換裝置,其中所 述控制模組用於在一時間段内沒有接收到用戶輸入之文字 時,將所述時間段内之文字資料及所述時間段藉由所述顯 示模組顯示。 3 .如申請專利範圍第1項所述之語音文字轉換裝置,其中所 述語音文字轉換裝置還包括一操作模組,所述操作模組用 於被按壓後產生一信號給所述控制模組,所述控制模組用 於根據所述信號將後來之文字資料以另一方式藉由所述顯 示模組顯示以區別於所述控制模組接收所述信號之前之語 音資料。 4 .如申請專利範圍第3項所述之語音文字轉換裝置,其中所 述另一方式為添加另一顏色之方式。 5 .如申請專利範圍第1項所述之語音文字轉換裝置,其中所 述文字輸入模組為一手寫屏。 6 . —種語音文字轉換方法,應用於一語音文字轉換裝置中, 099147409 表單編號A0101 第8頁/共11頁 0992081452-0 201227716 所述語音文字轉換裝置存儲有對應不同語音資料之文字資 料,其改進在於:所述語音文字轉換方法包括: 接收外部之語音信號; 於不同之時間段内轉換每一時間段内之語音信號為文字資 料; 在接收到用戶輸入之文字後顯示同一時間段内之用戶輸入 之文字、文字資料及所述同一時間段。 G 8 . 10 . Ο 如申請專利範圍第6項所述之語音文字轉換方法,其中於 一時間段内未接收到用戶輸入之文字,顯示所述時間段内 之文字資料及所述時間段。 如申請專利範圍第6項所述之語音文字轉換方法,其中所 述語音文字轉換方法還包括•按壓所述語音文字轉換裝置 之一操作模組後以另一方式顯示語音資料。 如申請專利範圍第8項所述之語音文字轉換方法,其中所 述另一方式為添加另一顏色之方式。 如申請專利範圍第6項所述之語音文字轉換方法,其中藉 由一麥克風接收外部之語音信號。 099147409 表單編號Α0101 第9頁/共11頁 0992081452-0
TW099147409A 2010-12-31 2010-12-31 Apparatus and method for converting voice to text TW201227716A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW099147409A TW201227716A (en) 2010-12-31 2010-12-31 Apparatus and method for converting voice to text
US13/204,958 US20120173236A1 (en) 2010-12-31 2011-08-08 Speech to text converting device and method
JP2011271264A JP2012141596A (ja) 2010-12-31 2011-12-12 音声をテキストに変換する装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW099147409A TW201227716A (en) 2010-12-31 2010-12-31 Apparatus and method for converting voice to text

Publications (1)

Publication Number Publication Date
TW201227716A true TW201227716A (en) 2012-07-01

Family

ID=46381535

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099147409A TW201227716A (en) 2010-12-31 2010-12-31 Apparatus and method for converting voice to text

Country Status (3)

Country Link
US (1) US20120173236A1 (zh)
JP (1) JP2012141596A (zh)
TW (1) TW201227716A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102023008B1 (ko) * 2012-12-10 2019-09-19 엘지전자 주식회사 음성-텍스트 변환 디스플레이 장치 및 그 방법
CN106886700A (zh) * 2017-02-17 2017-06-23 浙江氢创投资有限公司 一种基于人工智能交互客户端及使用方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6839669B1 (en) * 1998-11-05 2005-01-04 Scansoft, Inc. Performing actions identified in recognized speech
JP2001042996A (ja) * 1999-07-28 2001-02-16 Toshiba Corp 文書作成装置、文書作成方法
WO2010000322A1 (en) * 2008-07-03 2010-01-07 Mobiter Dicta Oy Method and device for converting speech

Also Published As

Publication number Publication date
US20120173236A1 (en) 2012-07-05
JP2012141596A (ja) 2012-07-26

Similar Documents

Publication Publication Date Title
CN107516511B (zh) 意图识别和情绪的文本到语音学习系统
US10643036B2 (en) Language translation device and language translation method
CN110797019B (zh) 多命令单一话语输入方法
US9652678B2 (en) Method and device for reproducing content
JP2020191106A (ja) デジタルアシスタントサービスの遠距離拡張
US20090251338A1 (en) Ink Tags In A Smart Pen Computing System
WO2018187234A1 (en) Hands-free annotations of audio text
US10741172B2 (en) Conference system, conference system control method, and program
KR102193029B1 (ko) 디스플레이 장치 및 그의 화상 통화 수행 방법
JP6841239B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20160065731A1 (en) Electronic device and method for displaying call information thereof
US20110112821A1 (en) Method and apparatus for multimodal content translation
US10699712B2 (en) Processing method and electronic device for determining logic boundaries between speech information using information input in a different collection manner
TW201142686A (en) Electronic apparatus having multi-mode interactive operation method
US20120215521A1 (en) Software Application Method to Translate an Incoming Message, an Outgoing Message, or an User Input Text
JP2018170743A (ja) 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム
TW201227716A (en) Apparatus and method for converting voice to text
CN102541504A (zh) 语音文字转换装置及方法
TW201230008A (en) Apparatus and method for converting voice to text
WO2015156443A1 (ko) 카툰형 모바일 개인 비서 서비스 시스템
JP4808763B2 (ja) 音声情報収集装置、その方法およびそのプログラム
US20170351651A1 (en) Smart bookmark device and bookmark synchronization system
EP3489814A1 (en) Method and device for reproducing content
TWI490825B (zh) Language learning information providing method and mobile device
JP2019179081A (ja) 会議支援装置、会議支援制御方法およびプログラム