TW201227716A - Apparatus and method for converting voice to text - Google Patents
Apparatus and method for converting voice to text Download PDFInfo
- Publication number
- TW201227716A TW201227716A TW099147409A TW99147409A TW201227716A TW 201227716 A TW201227716 A TW 201227716A TW 099147409 A TW099147409 A TW 099147409A TW 99147409 A TW99147409 A TW 99147409A TW 201227716 A TW201227716 A TW 201227716A
- Authority
- TW
- Taiwan
- Prior art keywords
- voice
- text
- module
- data
- text conversion
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Description
201227716 六、發明說明: 【發明所屬之技術領域】 [0001] 本發明涉及一種語音識別領域,尤指一種語音文字轉換 裝置及方法。 【先前技術·】 [0002] 於許多場合,例如會議、培訓中,我們經常對比較重要 之内容進行記錄,而在做筆記時或中途離開而漏聽了其 他内容,業界推出了一種語音文字轉換裝置,該裝置將 語音轉換成之文字進行存儲,用戶針對重要之資訊亦可 〇 輸入一些關鍵字,然而用戶輸入之關鍵字與轉換出之文 字無法對應,用戶需自己去找匹配用戶自己輸入之關鍵 字之文字部分。 【發明内容】 [0003] 鑒於以上内容,有必要提供一種用戶輸入文字與語音轉 換之文字保持同步之裝置及方法。 [0004] 一種語音文字轉換裝置,包括一語音接收模組、一語音 Q 識別模組及一顯示模組,所述語音文字轉換裝置還包括 一文字輸入模組及一控制模組,所述語音接收模組用於 接收外部之語音信號,所述文字識別模組用於在不同之 時間段内轉換每一時間段内之語音信號為文字資料並發 送給所述控制模組,所述文字輸入模組用於將用戶輸入 之文字發送給所述控制模組,所述控制模組用於將同一 時間段内之用戶輸入之文字、語音資料及所述同一時間 段一起藉由所述顯示模組顯示。 [0005] —種語音文字轉換方法,應用於一語音文字轉換裝置中 099147409 表單編號A0101 第3頁/共11頁 0992081452-0 201227716 ’所述語音文字轉換裝置存儲有對應不同語音資料之文 子貝料,所述語音文字轉換方法包括: [0006] [0007] [0008] [0009] [0010] [0011] [0012] [0013] 接收外部之語音信號; 於不同之時間段内轉換每一時間段内之語音信號為文字 資料; 於接收到用戶輸入之文字後顯示同一時間段内之用戶輸 入之文字、文字資料及所述同一時間段。 與習知技術相比,於上述裝置及方法中’同一時間段内 之用戶輪入之文字、語音資料及所述同一時間段一起顯 — 不’從而保證了語音資料與用戶輸入之文字之同步性。 【實施方式】 。月參閱圖1,本發明較佳實施例語音文字轉換裝置包括一 存儲模組10、一語音接收模組20、一語音識別模組3〇、 —操作模組40、一文字輸入模組50、一控制模組6〇、一 顯不杈組70。於本實施例中,所述文字輸入模組5〇為一 手寫屏,所述操作模組4〇為一接鈕,所述語音接收模組 2〇為一麥克風,所述文字輸入模組5〇為一手寫屏。 所述存儲模組10存儲有對應不同語音資料之文字資料。 所述語音接收模組20用於接收外部之語音信號。 所述語音識別模組30用於將一時間段内之語音信號轉換 為語音資料並於所述存儲模組10中尋找與所述語音資料 匹配之文字資料,並發送匹配所述語音資料之文字資料 給所述控制模組60。 099147409 表單編號A0101 第4頁/共11頁 0992081452-0 201227716 14]所述操作模組40用於被按壓後發送一用戶不於場之資訊 給所述控制模組60。 [〇〇15]所述文字輪入模組50用於藉由用戶輸入文字而發送所述 文字給所述控制模組60。 [〇〇16]所述控制模組60用於判斷接收到之轉換成之文字貢料所 處於之時間段内是否接收到用戶輸入之文字,如果有’ 則將文字資料及所述用戶輸入之文字藉由所述顯示模組 7 〇 —起顯示,如果沒有,則將所述文字資料藉由所述顯 Ο 示模組70單獨顯示。例如,以1分鐘將時間分為多個時間 段,〇到1分鐘這個時間段内,用戶沒有輸入文字,語音 轉換成之文字為:年中技術表彰大會開始’則所述顯示 模組70顯示為:00:00:00-00 : 01:00,年t技術表彰大 會開始,如果20-21分鐘這個時間段内,語音轉換成之文 字為:下面張經理為我們帶來的是電路板走線設計報告 ,用戶輸入之文字為:電路板走線,則所述顯示模組7〇 並列顯示為:〇〇: 20 21 : 〇〇, $面張經理為我們 〇 帶來的是電路板走線設計報♦,00:20:00-00:21 :〇〇, 電路板走線設計。如果用戶中途離場,按一下所述操作 模組40 ’則所述控制模組6〇將離場這段時間内轉換成之 文字加上不同之顏色以示區別。 [ΟΟΠ]請參閱圖1及圖2,本發明較佳實施例語音文字轉換方法 包括如下步驟: [0018] S201,所述語音接收模組2〇接收到外部之語音信號並傳 送給所述語音識別模組3〇 ; 099147409 表單編號Α0101 0992081452-0 201227716 [0019] S202,將一時間段内之語音信號轉換為語音資料並於所 述存儲模組10中尋找與所述語音資料匹配之文字資料, 並發送匹配所述語音資料之文字資料給所述控制模組60 y [0020] S203,所述控制模組60判斷該段時間内是否接收到用戶 輸入之文字,若是,轉至步驟S204,若否,轉至步驟 S205 ; [0021] S204,將所述文字資料、所述用戶輸入之文字及對應之 時間段藉由所述顯示模組70進行顯示; [0022] S205,將所述文字資料單獨藉由所述顯示模組70進行顯 示。 [0023] 綜上所述,本創作確已符合發明專利要求,爰依法提出 專利申請。惟,以上所述者僅為本發明之較佳實施方式 ,舉凡熟悉本發明技藝之人士,爰依本發明之精神所作 之等效修飾或變化,皆應涵蓋於以下之申請專利範圍内 〇 【圖式簡單說明】 [0024] 圖1係本發明較佳實施例語音文字轉換裝置之示意圖。 [0025] 圖2係本發明較佳實施例語音文字轉換方法之流程圖。 【主要元件符號說明】 [0026] 存儲模組:10 [0027] 語音接收模組:20 [0028] 語音識別模組:30 099147409 表單編號A0101 第6頁/共11頁 0992081452-0 201227716 [0029] 操作模組:4 0 [0030] 文字輸入模組:5 0 [0031] 控制模組:60 [0032] 顯示模組:7 0 Ο ο 099147409 表單編號Α0101 第7頁/共11頁 0992081452-0
Claims (1)
- 201227716 七、申請專利範圍: 1 . 一種語音文字轉換裝置,包括一語音接收模組、一語音識 別模組及一顯示模組,其改進在於:所述語音文字轉換裝 置還包括一文字輸入模組及一控制模組,所述語音接收模 組用於接收外部之語音信號,所述文字識別模組用於在不 同之時間段内轉換每一時間段内之語音信號為文字資料並 發送給所述控制模組,所述文字輸入模組用於將用戶輸入 之文字發送給所述控制模組,所述控制模組用於將同一時 間段内之用戶輸入之文字、語音資料及所述同一時間段一 起藉由所述顯示模組顯示。 2 .如申請專利範圍第1項所述之語音文字轉換裝置,其中所 述控制模組用於在一時間段内沒有接收到用戶輸入之文字 時,將所述時間段内之文字資料及所述時間段藉由所述顯 示模組顯示。 3 .如申請專利範圍第1項所述之語音文字轉換裝置,其中所 述語音文字轉換裝置還包括一操作模組,所述操作模組用 於被按壓後產生一信號給所述控制模組,所述控制模組用 於根據所述信號將後來之文字資料以另一方式藉由所述顯 示模組顯示以區別於所述控制模組接收所述信號之前之語 音資料。 4 .如申請專利範圍第3項所述之語音文字轉換裝置,其中所 述另一方式為添加另一顏色之方式。 5 .如申請專利範圍第1項所述之語音文字轉換裝置,其中所 述文字輸入模組為一手寫屏。 6 . —種語音文字轉換方法,應用於一語音文字轉換裝置中, 099147409 表單編號A0101 第8頁/共11頁 0992081452-0 201227716 所述語音文字轉換裝置存儲有對應不同語音資料之文字資 料,其改進在於:所述語音文字轉換方法包括: 接收外部之語音信號; 於不同之時間段内轉換每一時間段内之語音信號為文字資 料; 在接收到用戶輸入之文字後顯示同一時間段内之用戶輸入 之文字、文字資料及所述同一時間段。 G 8 . 10 . Ο 如申請專利範圍第6項所述之語音文字轉換方法,其中於 一時間段内未接收到用戶輸入之文字,顯示所述時間段内 之文字資料及所述時間段。 如申請專利範圍第6項所述之語音文字轉換方法,其中所 述語音文字轉換方法還包括•按壓所述語音文字轉換裝置 之一操作模組後以另一方式顯示語音資料。 如申請專利範圍第8項所述之語音文字轉換方法,其中所 述另一方式為添加另一顏色之方式。 如申請專利範圍第6項所述之語音文字轉換方法,其中藉 由一麥克風接收外部之語音信號。 099147409 表單編號Α0101 第9頁/共11頁 0992081452-0
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW099147409A TW201227716A (en) | 2010-12-31 | 2010-12-31 | Apparatus and method for converting voice to text |
US13/204,958 US20120173236A1 (en) | 2010-12-31 | 2011-08-08 | Speech to text converting device and method |
JP2011271264A JP2012141596A (ja) | 2010-12-31 | 2011-12-12 | 音声をテキストに変換する装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW099147409A TW201227716A (en) | 2010-12-31 | 2010-12-31 | Apparatus and method for converting voice to text |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201227716A true TW201227716A (en) | 2012-07-01 |
Family
ID=46381535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW099147409A TW201227716A (en) | 2010-12-31 | 2010-12-31 | Apparatus and method for converting voice to text |
Country Status (3)
Country | Link |
---|---|
US (1) | US20120173236A1 (zh) |
JP (1) | JP2012141596A (zh) |
TW (1) | TW201227716A (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102023008B1 (ko) * | 2012-12-10 | 2019-09-19 | 엘지전자 주식회사 | 음성-텍스트 변환 디스플레이 장치 및 그 방법 |
CN106886700A (zh) * | 2017-02-17 | 2017-06-23 | 浙江氢创投资有限公司 | 一种基于人工智能交互客户端及使用方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6839669B1 (en) * | 1998-11-05 | 2005-01-04 | Scansoft, Inc. | Performing actions identified in recognized speech |
JP2001042996A (ja) * | 1999-07-28 | 2001-02-16 | Toshiba Corp | 文書作成装置、文書作成方法 |
WO2010000322A1 (en) * | 2008-07-03 | 2010-01-07 | Mobiter Dicta Oy | Method and device for converting speech |
-
2010
- 2010-12-31 TW TW099147409A patent/TW201227716A/zh unknown
-
2011
- 2011-08-08 US US13/204,958 patent/US20120173236A1/en not_active Abandoned
- 2011-12-12 JP JP2011271264A patent/JP2012141596A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20120173236A1 (en) | 2012-07-05 |
JP2012141596A (ja) | 2012-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107516511B (zh) | 意图识别和情绪的文本到语音学习系统 | |
US10643036B2 (en) | Language translation device and language translation method | |
CN110797019B (zh) | 多命令单一话语输入方法 | |
US9652678B2 (en) | Method and device for reproducing content | |
JP2020191106A (ja) | デジタルアシスタントサービスの遠距離拡張 | |
US20090251338A1 (en) | Ink Tags In A Smart Pen Computing System | |
WO2018187234A1 (en) | Hands-free annotations of audio text | |
US10741172B2 (en) | Conference system, conference system control method, and program | |
KR102193029B1 (ko) | 디스플레이 장치 및 그의 화상 통화 수행 방법 | |
JP6841239B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20160065731A1 (en) | Electronic device and method for displaying call information thereof | |
US20110112821A1 (en) | Method and apparatus for multimodal content translation | |
US10699712B2 (en) | Processing method and electronic device for determining logic boundaries between speech information using information input in a different collection manner | |
TW201142686A (en) | Electronic apparatus having multi-mode interactive operation method | |
US20120215521A1 (en) | Software Application Method to Translate an Incoming Message, an Outgoing Message, or an User Input Text | |
JP2018170743A (ja) | 会議支援システム、会議支援方法、会議支援装置のプログラム、および端末のプログラム | |
TW201227716A (en) | Apparatus and method for converting voice to text | |
CN102541504A (zh) | 语音文字转换装置及方法 | |
TW201230008A (en) | Apparatus and method for converting voice to text | |
WO2015156443A1 (ko) | 카툰형 모바일 개인 비서 서비스 시스템 | |
JP4808763B2 (ja) | 音声情報収集装置、その方法およびそのプログラム | |
US20170351651A1 (en) | Smart bookmark device and bookmark synchronization system | |
EP3489814A1 (en) | Method and device for reproducing content | |
TWI490825B (zh) | Language learning information providing method and mobile device | |
JP2019179081A (ja) | 会議支援装置、会議支援制御方法およびプログラム |