JP2020514936A - 音声キャリアのテキストを迅速に挿入する方法およびデバイス - Google Patents
音声キャリアのテキストを迅速に挿入する方法およびデバイス Download PDFInfo
- Publication number
- JP2020514936A JP2020514936A JP2020500951A JP2020500951A JP2020514936A JP 2020514936 A JP2020514936 A JP 2020514936A JP 2020500951 A JP2020500951 A JP 2020500951A JP 2020500951 A JP2020500951 A JP 2020500951A JP 2020514936 A JP2020514936 A JP 2020514936A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- document
- text
- audio
- edited
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
編集対象文書を開くステップと、
ユーザから音声取得命令を得るステップと、
音声取得命令に従って関心のある音声を得るステップと、
第1の文書編集ソフトウェアで、関心のある音声に対応するテキストを認識するステップと、
このテキストを編集対象文書に移動させるステップと、を含む方法を開示する。
既存の音声を選択する命令、を含む。
音声取得命令が既存の音声を選択する命令である場合、関心のある音声として既存の音声キャリアを選択するステップ、を含む。
既存の音声を抽出する命令、を含む。
音声取得命令が既存の音声を抽出する命令である場合に、既存の音声キャリアファイルを取得するステップと、
音声キャリアファイル中の音声開始点および音声終了点を取得するステップと、
音声キャリアファイル中の音声開始点と音声終了点との間の音声セグメントを、関心のある音声として抽出するステップと、を含む。
マウスカーソルの位置を用いて決定された音声キャリアファイル中の音声開始点および音声終了点を取得するステップ、または
タッチスクリーンカーソルの位置を用いて決定された音声キャリアファイル中の音声開始点および音声終了点を取得するステップ、を含む。
オーディオ入力デバイスを用いて音声を記録する命令、を含む。
音声取得命令がオーディオ入力デバイスを用いて音声を記録する命令である場合、オーディオ入力デバイスを用いて音声を記録し、記録した音声を関心のある音声として使用するステップ、を含む。
テキストを編集対象文書中の挿入位置に移動させるステップを含み、挿入位置は、マウスカーソルの位置、またはタッチスクリーンカーソルの位置である。
そのテキストのフォーマットを、編集対象文書中のテキストのフォーマットに合わせて修正するステップをさらに含み、フォーマットは、フォント、フォントサイズ、および行間隔のうちの1つまたは複数を含む。
編集対象文書を開く構成とされた開モジュールと、
音声取得命令をユーザから得る構成とされた命令取得モジュールと、
音声取得命令に従って関心のある音声を得る構成とされた音声取得モジュールと、
第1の文書編集ソフトウェアで関心のある音声に対応するテキストを認識する構成とされた認識モジュールと、
そのテキストを編集対象文書に移動させる構成とされたテキスト移動モジュールと、を含む装置を開示する。
既存の音声を選択する命令、である。
音声取得命令が既存の音声を選択する命令である場合、関心のある音声として、既存の音声キャリアファイルを選択する構成とされる。
既存の音声を抽出する命令、を含む。
音声取得命令が既存の音声を抽出する命令である場合、既存の音声キャリアファイルを取得する構成とされたファイル取得サブモジュールと、
音声キャリアファイル中の音声開始点および音声終了点を取得する構成とされた間隔取得サブモジュールと、
音声キャリアファイル中の音声開始点と音声終了点との間の音声セグメントを、関心のある音声として抽出する構成とされた抽出サブモジュールと、を含む。
マウスカーソルの位置を用いて決定された音声キャリアファイル中の音声開始点および音声終了点を取得、または
タッチスクリーンカーソルの位置を用いて決定された音声キャリアファイル中の音声開始点および音声終了点を取得する構成とされる。
オーディオ入力デバイスを用いて音声を記録する命令、を含む。
音声取得命令がオーディオ入力デバイスを用いて音声を記録する命令である場合、オーディオ入力デバイスを用いて音声を記録し、記録した音声を関心のある音声として使用する構成とされる。
テキストを編集対象文書中の挿入位置に移動させる構成とされ、挿入位置は、マウスカーソルの位置、またはタッチスクリーンカーソルの位置である。
テキストを編集対象文書に移動させた後に、そのテキストのフォーマットを、編集対象文書中のテキストのフォーマットに合わせて修正する構成とされたフォーマット修正モジュールをさらに含み、フォーマットは、フォント、フォントサイズ、および行間隔のうちの1つまたは複数を含む。
メモリは、コンピュータプログラムを記憶する構成とされ、
プロセッサは、メモリに記憶されたプログラムを実行した場合、音声キャリアのテキストを迅速に挿入する上記の方法のいずれかを実施する構成とされる、電子デバイスを開示する。
編集対象文書を開く構成とされた開モジュール601と、
ユーザから音声取得命令を得る構成とされた命令取得モジュール602と、
音声取得命令に従って関心のある音声を得る構成とされた音声取得モジュール603と、
第1の文書編集ソフトウェアで関心のある音声に対応するテキストを認識する構成とされた認識モジュール604と、
上記テキストを編集対象文書に移動させる構成とされたテキスト移動モジュール605と、を含む。
具体的には、選択命令に従って、記憶されている音声キャリアファイルから1つまたは複数の音声キャリアファイルを、関心のある音声として選択する構成とされた音声取得モジュール703を含み、本願の本実施形態では、音声取得命令は、選択命令である。
テキストを編集対象文書中の挿入位置に追加する構成とされ、挿入位置は、編集対象文書中のマウスカーソルの位置、または編集対象文書中のタッチスクリーンカーソルの位置である。
テキストを編集対象文書に追加した後に、そのテキストのフォーマットを編集対象文書中のテキストのフォーマットに合わせて修正する構成とされたフォーマット修正モジュール706をさらに含み、フォーマットは、フォント、フォントサイズ、および行間隔のうちの1つまたは複数を含む。
音声取得モジュール803を含み、本願の本実施形態では、音声取得命令は、抽出命令であり、この音声取得モジュール803は、
既存の音声キャリアファイルを取得する構成とされたファイル取得サブモジュール8031と、
音声キャリアファイル中の音声開始点および音声終了点を取得する構成とされた間隔取得サブモジュール8032と、
音声キャリアファイル中の音声開始点と音声終了点との間の音声セグメントを関心のある音声として抽出する構成とされた抽出サブモジュール8033と、を含む。
マウスカーソルの位置に従って音声キャリアファイル中の音声開始点および音声終了点を決定、または
タッチスクリーンカーソルの位置に従って音声キャリアファイル中の音声開始点および音声終了点を決定する構成とされる。
テキストを編集対象文書中の挿入位置に追加する構成とされ、この挿入位置は、編集対象文書中のマウスカーソルの位置、または編集対象文書中のタッチスクリーンカーソルの位置である。
テキストが編集対象文書に追加された後に、そのテキストのフォーマットを編集対象文書中のテキストのフォーマットに合わせて修正する構成とされたフォーマット修正モジュール806をさらに含み、ここで、フォーマットは、フォント、フォントサイズ、および行間隔のうちの1つまたは複数を含む。
音声取得モジュールを含み、本願の本実施形態では、音声取得命令は、記録命令であり、音声取得モジュールは、具体的には、
オーディオ入力デバイスを用いて音声を記録し、記録した音声を関心のある音声として使用する構成とされる。
テキストを編集対象文書中の挿入位置に追加する構成とされ、ここで、挿入位置は、マウスカーソルの位置、またはタッチスクリーンカーソルの位置である。
テキストを編集対象文書に追加した後に、そのテキストのフォーマットを編集対象文書中のテキストのフォーマットに合わせて修正する構成とされたフォーマット修正モジュールをさらに含み、フォーマットは、フォント、フォントサイズ、および行間隔のうちの1つまたは複数を含む。
Claims (17)
- 音声キャリアのテキストを迅速に挿入する方法であって、
音声取得命令をユーザから得るステップと、
前記音声取得命令に従って関心のある音声を得るステップと、
第1の文書編集ソフトウェアで、前記関心のある音声に対応するテキストを認識するステップと、
前記第1の文書編集ソフトウェアで前記テキストを編集対象文書に追加するステップと、を含む、方法。 - 前記音声取得命令が、選択命令であり、
前記音声取得命令に従って関心のある音声を得るステップが、
前記選択命令に従って、前記関心のある音声として、記憶されている音声キャリアファイルから1つまたは複数の音声キャリアファイルを選択するステップ、を含む、
請求項1に記載の方法。 - 前記音声取得命令が、抽出命令であり、
前記音声取得命令に従って関心のある音声を得るステップが、
前記抽出命令に従って、音声キャリアファイル中の音声開始点および音声終了点を取得するステップと、
前記音声キャリアファイル中の前記音声開始点と前記音声終了点との間の音声セグメントを、前記関心のある音声として抽出するステップと、を含む、
請求項1に記載の方法。 - 前記抽出命令に従って、音声キャリアファイル中の音声開始点および音声終了点を取得するステップが、
マウスカーソルの位置を用いて、前記音声キャリアファイル中の前記音声開始点および前記音声終了点を決定するステップ、または
タッチスクリーンカーソルの位置を用いて、前記音声キャリアファイル中の前記音声開始点および前記音声終了点を決定するステップ、
を含む、請求項3に記載の方法。 - 前記音声取得命令が、記録命令であり、
前記音声取得命令に従って関心のある音声を得るステップが、
オーディオ入力デバイスを用いて音声を記録し、前記記録した音声を前記関心のある音声として使用するステップ、を含む、
請求項1に記載の方法。 - 前記第1の文書編集ソフトウェアにおいて前記テキストを編集対象文書に追加するステップが、
前記テキストを前記編集対象文書中の挿入位置に追加するステップを含み、
前記挿入位置が、マウスカーソルの位置、またはタッチスクリーンカーソルの位置である、
請求項1に記載の方法。 - 前記第1の文書編集ソフトウェアで前記テキストを前記編集対象文書に追加した後に、
前記テキストのフォーマットを、前記編集対象文書中のテキストのフォーマットに合わせて修正するステップをさらに含み、前記フォーマットが、フォント、フォントサイズ、および行間隔のうちの1つまたは複数を含む、
請求項6に記載の方法。 - 音声キャリアのテキストを迅速に挿入する装置であって、
音声取得命令をユーザから得る構成とされた命令取得モジュールと、
前記音声取得命令に従って関心のある音声を得る構成とされた音声取得モジュールと、
第1の文書編集ソフトウェアで前記関心のある音声に対応するテキストを認識する構成とされた認識モジュールと、
前記第1の文書編集ソフトウェアで前記テキストを編集対象文書に追加する構成とされたテキスト移動モジュールと、を含む、装置。 - 前記音声取得命令が、選択命令であり、前記音声取得モジュールが、特に、前記選択命令に従って、前記関心のある音声として、記憶されている音声キャリアファイルから1つまたは複数の音声キャリアファイルを選択する構成とされる、
請求項8に記載の装置。 - 前記音声取得命令が、抽出命令であり、前記音声取得モジュールが、
前記抽出命令に従って、音声キャリアファイル中の音声開始点および音声終了点を取得する構成とされた間隔取得サブモジュールと、
前記音声キャリアファイル中の前記音声開始点と前記音声終了点との間の音声セグメントを、前記関心のある音声として抽出する構成とされた抽出サブモジュールと、を含む、
請求項8に記載の装置。 - 前記間隔取得サブモジュールが、特に、
マウスカーソルの位置を用いて、前記音声キャリアファイル中の前記音声開始点および前記音声終了点を決定、または
タッチスクリーンカーソルの位置を用いて、前記音声キャリアファイル中の前記音声開始点および前記音声終了点を決定する構成とされる、
請求項10に記載の装置。 - 前記音声取得命令が、記録命令であり、前記音声取得モジュールが、特に、
オーディオ入力デバイスを用いて音声を記録し、前記記録した音声を前記関心のある音声として使用する構成とされる、
請求項8に記載の装置。 - 前記テキスト移動モジュールが、特に、
前記テキストを前記編集対象文書中の挿入位置に追加する構成とされ、前記挿入位置が、マウスカーソルの位置、またはタッチスクリーンカーソルの位置である、
請求項8に記載の装置。 - 前記デバイスが、
前記テキストを前記編集対象文書に追加した後に、前記テキストのフォーマットを前記編集対象文書中のテキストのフォーマットに合わせて修正する構成とされたフォーマット修正モジュールをさらに含み、前記フォーマットが、フォント、フォントサイズ、および行間隔のうちの1つまたは複数を含む、
請求項13に記載の装置。 - プロセッサと、メモリとを含み、
前記メモリが、コンピュータプログラムを記憶する構成とされ、
前記プロセッサが、前記メモリに記憶された前記プログラムを実行した場合に、請求項1から7のいずれか一項に記載の方法のステップを実施する構成とされる、電子デバイス。 - コンピュータプログラムを記憶し、前記コンピュータプログラムがプロセッサにて実行された場合に、請求項1から7のいずれか一項に記載の方法のステップを実施する、コンピュータ可読ストレージ媒体。
- 実行された場合に、請求項1から7のいずれか一項に記載の方法のステップを実施する構成とされた、実行可能プログラムコード。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710165757.XA CN108628815A (zh) | 2017-03-20 | 2017-03-20 | 一种快速插入语音载体中文字的方法及装置 |
CN201710165757.X | 2017-03-20 | ||
PCT/CN2018/079497 WO2018171561A1 (zh) | 2017-03-20 | 2018-03-19 | 一种快速插入语音载体中文字的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020514936A true JP2020514936A (ja) | 2020-05-21 |
Family
ID=63585046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020500951A Pending JP2020514936A (ja) | 2017-03-20 | 2018-03-19 | 音声キャリアのテキストを迅速に挿入する方法およびデバイス |
Country Status (6)
Country | Link |
---|---|
US (1) | US20200097528A1 (ja) |
EP (1) | EP3605356A4 (ja) |
JP (1) | JP2020514936A (ja) |
CN (1) | CN108628815A (ja) |
SG (1) | SG11201908754YA (ja) |
WO (1) | WO2018171561A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144074B (zh) * | 2018-11-05 | 2022-04-22 | 腾讯科技(深圳)有限公司 | 文档协作方法、装置、计算机可读存储介质和计算机设备 |
CN111222307B (zh) * | 2018-11-23 | 2024-03-12 | 珠海金山办公软件有限公司 | 一种字体编辑的方法、装置、计算机存储介质及终端 |
CN112115686B (zh) * | 2019-06-21 | 2024-05-07 | 珠海金山办公软件有限公司 | 一种文档编辑的方法、装置、计算机存储介质及终端 |
CN112311658A (zh) * | 2020-10-29 | 2021-02-02 | 维沃移动通信有限公司 | 语音信息处理方法、装置及电子设备 |
CN112256459A (zh) * | 2020-11-18 | 2021-01-22 | 四川长虹电器股份有限公司 | 一种可自定义复制粘贴文档中的文字的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01130262A (ja) * | 1987-11-16 | 1989-05-23 | Canon Inc | 音声ワードプロセッサ |
JPH0624084A (ja) * | 1992-07-06 | 1994-02-01 | Brother Ind Ltd | テープ印字装置 |
JP2001060149A (ja) * | 1999-08-20 | 2001-03-06 | Olympus Optical Co Ltd | 文書作成装置及び文書作成処理プログラムを記録した記録媒体 |
JP2007220042A (ja) * | 2006-02-20 | 2007-08-30 | Canon Inc | 情報処理装置及びその制御方法、プログラム |
JP2015056154A (ja) * | 2013-09-13 | 2015-03-23 | 独立行政法人情報通信研究機構 | テキスト編集装置及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN201937687U (zh) * | 2010-12-20 | 2011-08-17 | 上海华勤通讯技术有限公司 | 具有语音输入功能的手机 |
CN102541452B (zh) * | 2011-12-26 | 2015-04-29 | 优视科技有限公司 | 基于移动终端的多媒体输入方法、装置及系统 |
CN106126157B (zh) * | 2016-06-13 | 2019-04-05 | 北京云知声信息技术有限公司 | 基于医院信息系统的语音输入方法及装置 |
CN106126156B (zh) * | 2016-06-13 | 2019-04-05 | 北京云知声信息技术有限公司 | 基于医院信息系统的语音输入方法及装置 |
-
2017
- 2017-03-20 CN CN201710165757.XA patent/CN108628815A/zh active Pending
-
2018
- 2018-03-19 EP EP18771679.0A patent/EP3605356A4/en not_active Withdrawn
- 2018-03-19 SG SG11201908754Y patent/SG11201908754YA/en unknown
- 2018-03-19 JP JP2020500951A patent/JP2020514936A/ja active Pending
- 2018-03-19 WO PCT/CN2018/079497 patent/WO2018171561A1/zh unknown
- 2018-03-19 US US16/496,119 patent/US20200097528A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01130262A (ja) * | 1987-11-16 | 1989-05-23 | Canon Inc | 音声ワードプロセッサ |
JPH0624084A (ja) * | 1992-07-06 | 1994-02-01 | Brother Ind Ltd | テープ印字装置 |
JP2001060149A (ja) * | 1999-08-20 | 2001-03-06 | Olympus Optical Co Ltd | 文書作成装置及び文書作成処理プログラムを記録した記録媒体 |
JP2007220042A (ja) * | 2006-02-20 | 2007-08-30 | Canon Inc | 情報処理装置及びその制御方法、プログラム |
JP2015056154A (ja) * | 2013-09-13 | 2015-03-23 | 独立行政法人情報通信研究機構 | テキスト編集装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP3605356A1 (en) | 2020-02-05 |
US20200097528A1 (en) | 2020-03-26 |
SG11201908754YA (en) | 2019-10-30 |
EP3605356A4 (en) | 2020-04-01 |
CN108628815A (zh) | 2018-10-09 |
WO2018171561A1 (zh) | 2018-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020514936A (ja) | 音声キャリアのテキストを迅速に挿入する方法およびデバイス | |
JP6060989B2 (ja) | 音声録音装置、音声録音方法、及びプログラム | |
JP6242773B2 (ja) | 会議情報蓄積装置、方法およびプログラム | |
JP2017503394A (ja) | 映像処理方法、映像処理装置および表示装置 | |
WO2016119370A1 (zh) | 一种实现录音的方法、装置和移动终端 | |
US20150058007A1 (en) | Method for modifying text data corresponding to voice data and electronic device for the same | |
CN104735468A (zh) | 一种基于语义分析将图像合成新视频的方法及系统 | |
JP2009517976A (ja) | トリガを伴わない双方向テレビ | |
WO2018130173A1 (zh) | 配音方法、终端设备、服务器及存储介质 | |
CN109634501B (zh) | 电子书批注添加方法、电子设备及计算机存储介质 | |
US10560656B2 (en) | Media message creation with automatic titling | |
WO2016197708A1 (zh) | 一种录音方法及终端 | |
WO2020093876A1 (zh) | 视频编辑方法、装置、计算机设备及可读存储介质 | |
CN106067310A (zh) | 录音数据处理方法及装置 | |
CN110943908A (zh) | 语音消息发送方法、电子设备及介质 | |
CN104104900A (zh) | 一种数据播放方法 | |
KR101727587B1 (ko) | 디지털 녹취 파일 녹취록 생성 방법 | |
CN108108143B (zh) | 录音回放的方法、移动终端及具有存储功能的装置 | |
CN108881766B (zh) | 视频处理方法、装置、终端和存储介质 | |
JP6865701B2 (ja) | 音声認識誤り修正支援装置およびそのプログラム | |
CN104104901A (zh) | 一种数据播放方法及装置 | |
CN104932665A (zh) | 一种信息处理方法以及一种电子设备 | |
KR101781353B1 (ko) | 무결성 디지털 녹취 파일 생성 방법 | |
CN109509464B (zh) | 一种把文本朗读录制为音频的方法及装置 | |
CN109739424A (zh) | 应用于触控终端的操作方法和装置及触控终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201215 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210706 |