JP2023102137A - システム、通信端末、及び方法 - Google Patents
システム、通信端末、及び方法 Download PDFInfo
- Publication number
- JP2023102137A JP2023102137A JP2022002529A JP2022002529A JP2023102137A JP 2023102137 A JP2023102137 A JP 2023102137A JP 2022002529 A JP2022002529 A JP 2022002529A JP 2022002529 A JP2022002529 A JP 2022002529A JP 2023102137 A JP2023102137 A JP 2023102137A
- Authority
- JP
- Japan
- Prior art keywords
- result
- transcription
- proofreading
- unit
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000013518 transcription Methods 0.000 claims abstract description 349
- 230000035897 transcription Effects 0.000 claims abstract description 349
- 230000001915 proofreading effect Effects 0.000 claims abstract description 277
- 230000005540 biological transmission Effects 0.000 claims abstract description 19
- 238000010801 machine learning Methods 0.000 claims abstract description 10
- 238000013500 data storage Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 230000007246 mechanism Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 16
- 238000013473 artificial intelligence Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Studio Circuits (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
[先行技術文献]
[特許文献]
[特許文献1]特開2021-93718号公報
Claims (19)
- 文字起こしサーバ及び通信端末
を備え、
前記文字起こしサーバは、
音声データを取得するデータ取得部と、
前記音声データを入力とし、前記音声データを文字化した文字起こし結果を出力とする学習モデルに、前記データ取得部が取得した前記音声データを入力して、前記文字起こし結果を取得する文字起こし部と、
前記文字起こし部が取得した前記文字起こし結果を前記通信端末に送信する文字起こし結果送信部と
を有し、
前記通信端末は、
前記文字起こし結果を表示部に表示させるよう制御する表示制御部と、
前記表示部に表示された前記文字起こし結果に対する校正結果を取得する校正結果取得部と、
前記校正結果を前記文字起こしサーバに送信する校正結果送信部と
を有し、
前記文字起こしサーバは、
前記校正結果に基づいて前記学習モデルを更新するモデル更新部
を有する、システム。 - 前記データ取得部は、動画データに含まれる前記音声データを取得し、
前記文字起こし結果送信部は、前記動画データ及び前記文字起こし結果を前記通信端末に送信し、
前記表示制御部は、前記文字起こし結果を前記動画データとともに前記表示部に表示させるよう制御する、請求項1に記載のシステム。 - 前記表示制御部は、前記文字起こし結果を字幕として前記動画データとともに前記表示部に表示させるよう制御し、
前記校正結果取得部は、前記字幕として表示された前記文字起こし結果に対する前記校正結果を取得する、請求項2に記載のシステム。 - 前記校正結果送信部は、校正後の前記文字起こし結果を含む前記校正結果を前記文字起こしサーバに送信し、
前記文字起こしサーバは、
校正前の前記文字起こし結果と校正後の前記文字起こし結果との差分が予め定められた条件を満たす場合に、前記校正結果を、機械学習に用いる学習用データとして記憶する学習用データ記憶部
を更に有し、
前記モデル更新部は、前記学習用データ記憶部に記憶されている前記校正結果に基づいて前記学習モデルを更新する、請求項1から3のいずれか一項に記載のシステム。 - 前記学習用データ記憶部は、校正前の前記文字起こし結果と校正後の前記文字起こし結果との差分を示す差分値が予め定められた閾値より低い場合に、前記校正結果を、前記機械学習に用いる前記学習用データとして記憶する、請求項4に記載のシステム。
- 前記学習用データ記憶部は、校正前の前記文字起こし結果に対して、内容が追加されていないと判定した場合に、前記校正結果を、機械学習に用いる学習用データとして記憶する、請求項4又は5に記載のシステム。
- 前記校正結果送信部は、校正前の前記文字起こし結果と校正後の前記文字起こし結果との前記差分が予め定められた条件を満たす場合に、前記校正結果を前記文字起こしサーバに送信し、前記条件を満たさない場合、前記校正結果を前記文字起こしサーバに送信しない、請求項4に記載のシステム。
- 前記校正結果取得部は、校正前の前記文字起こし結果と、校正後の前記文字起こし結果との差分を検出し、前記差分を示す前記校正結果を取得する、請求項1から7のいずれか一項に記載のシステム。
- 前記通信端末は、
前記表示部に表示された前記文字起こし結果に対する校正が完了したことを判定する完了判定部
を更に有し、
前記校正結果取得部は、前記完了判定部によって前記校正が完了したと判定されたことに応じて、校正前の前記文字起こし結果と、校正後の前記文字起こし結果との前記差分を検出する、請求項8に記載のシステム。 - 前記データ取得部は、動画データに含まれる前記音声データを取得し、
前記文字起こし結果送信部は、前記動画データ及び前記文字起こし結果を前記通信端末に送信し、
前記表示制御部は、前記文字起こし結果を字幕として前記動画データとともに前記表示部に表示させるよう制御し、
前記完了判定部は、前記通信端末において、校正された前記文字起こし結果を含む前記動画データのエンコードが開始されたことに応じて、前記校正が完了したと判定する、請求項9に記載のシステム。 - 前記完了判定部は、前記表示部に表示された前記文字起こし結果に対する校正が開始されてから予め定められた時間が経過したことに応じて、前記校正が完了したと判定する、請求項9又は10に記載のシステム。
- 前記完了判定部は、前記通信端末において前記文字起こし結果のデータが上書き保存されたことに応じて、前記校正が完了したと判定する、請求項9から11のいずれか一項に記載のシステム。
- 前記文字起こしサーバは、
前記文字起こし部が取得した前記文字起こし結果と、前記学習モデルに入力した前記音声データとを対応付けて記憶する内容記憶部
を有し、
前記モデル更新部は、前記文字起こし結果に対する前記校正結果と、前記文字起こし結果に対応する前記音声データとに基づいて、前記学習モデルを更新する、請求項1から12のいずれか一項に記載のシステム。 - 文字起こしサーバから受信した、音声データを文字化した文字起こし結果を表示部に表示させるよう制御する表示制御部と、
前記表示部に表示された前記文字起こし結果と、校正された前記文字起こし結果との差分を検出し、前記差分を示す校正結果を取得する校正結果取得部と、
前記校正結果を前記文字起こしサーバに送信する校正結果送信部と
を備える通信端末。 - 前記表示制御部は、前記文字起こしサーバから受信した、動画データに含まれる前記音声データを文字化した前記文字起こし結果を字幕として、前記動画データとともに前記表示部に表示させ、
前記校正結果取得部は、字幕として表示された前記文字起こし結果と、校正された前記文字起こし結果との前記差分を示す校正結果を取得する、請求項14に記載の通信端末。 - 前記校正結果送信部は、校正前の前記文字起こし結果と校正後の前記文字起こし結果との前記差分が予め定められた条件を満たす場合に、前記校正結果を前記文字起こしサーバに送信し、前記条件を満たさない場合、前記校正結果を前記文字起こしサーバに送信しない、請求項14又は15に記載の通信端末。
- 前記表示部に表示された前記文字起こし結果に対する校正が完了したことを判定する完了判定部
を更に有し、
前記校正結果取得部は、前記完了判定部によって前記校正が完了したと判定されたことに応じて、校正前の前記文字起こし結果と、校正後の前記文字起こし結果との前記差分を検出する、請求項14から16のいずれか一項に記載の通信端末。 - コンピュータを、請求項14から17のいずれか一項に記載の通信端末として機能させるためのプログラム。
- 通信端末によって実行される方法であって、
文字起こしサーバから、音声データを文字化した文字起こし結果を受信する受信段階と、
前記文字起こし結果を前記通信端末の表示部に表示させるよう制御する表示制御段階と、
前記表示部に表示された前記文字起こし結果と、校正された前記文字起こし結果との差分を検出し、前記差分を示す校正結果を取得する校正結果取得段階と、
前記校正結果を前記文字起こしサーバに送信する校正結果送信段階と
を備える方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022002529A JP7236570B1 (ja) | 2022-01-11 | 2022-01-11 | システム、通信端末、及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022002529A JP7236570B1 (ja) | 2022-01-11 | 2022-01-11 | システム、通信端末、及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7236570B1 JP7236570B1 (ja) | 2023-03-09 |
JP2023102137A true JP2023102137A (ja) | 2023-07-24 |
Family
ID=85476817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022002529A Active JP7236570B1 (ja) | 2022-01-11 | 2022-01-11 | システム、通信端末、及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7236570B1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000284795A (ja) * | 1999-03-08 | 2000-10-13 | Internatl Business Mach Corp <Ibm> | テキストの挿入と置換を区別するための方法およびシステム |
JP2010048890A (ja) * | 2008-08-19 | 2010-03-04 | Ntt Docomo Inc | クライアント装置、認識結果フィードバック方法、認識結果フィードバックプログラム、サーバ装置、音声認識のモデル更新方法、音声認識のモデル更新プログラム、音声認識システム、音声認識方法、音声認識プログラム |
US20140114658A1 (en) * | 2006-04-17 | 2014-04-24 | Vovision, Llc | Methods and systems for correcting transcribed audio files |
JP2014134640A (ja) * | 2013-01-09 | 2014-07-24 | Nippon Hoso Kyokai <Nhk> | 文字起こし装置およびプログラム |
JP6824547B1 (ja) * | 2020-06-22 | 2021-02-03 | 江崎 徹 | アクティブラーニングシステム及びアクティブラーニングプログラム |
-
2022
- 2022-01-11 JP JP2022002529A patent/JP7236570B1/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000284795A (ja) * | 1999-03-08 | 2000-10-13 | Internatl Business Mach Corp <Ibm> | テキストの挿入と置換を区別するための方法およびシステム |
US20140114658A1 (en) * | 2006-04-17 | 2014-04-24 | Vovision, Llc | Methods and systems for correcting transcribed audio files |
JP2010048890A (ja) * | 2008-08-19 | 2010-03-04 | Ntt Docomo Inc | クライアント装置、認識結果フィードバック方法、認識結果フィードバックプログラム、サーバ装置、音声認識のモデル更新方法、音声認識のモデル更新プログラム、音声認識システム、音声認識方法、音声認識プログラム |
JP2014134640A (ja) * | 2013-01-09 | 2014-07-24 | Nippon Hoso Kyokai <Nhk> | 文字起こし装置およびプログラム |
JP6824547B1 (ja) * | 2020-06-22 | 2021-02-03 | 江崎 徹 | アクティブラーニングシステム及びアクティブラーニングプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7236570B1 (ja) | 2023-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4875752B2 (ja) | 編集可能なオーディオストリームにおける音声の認識 | |
CN104246750B (zh) | 抄录语音 | |
US8302010B2 (en) | Transcript editor | |
JP2018077870A (ja) | 音声認識方法 | |
CN109817210B (zh) | 语音写作方法、装置、终端和存储介质 | |
US20190213246A1 (en) | Systems and Methods for Using a Program Schedule to Facilitate Modifying Closed-Captioning Text | |
JP2009047920A (ja) | ユーザと音声により対話する装置および方法 | |
US9645985B2 (en) | Systems and methods for customizing text in media content | |
US20190267007A1 (en) | Text correction apparatus and text correction method | |
JP2014222290A (ja) | 議事録記録装置、議事録記録方法及びプログラム | |
WO2009122779A1 (ja) | テキストデータ処理装置、方法、プログラムが格納された記録媒体 | |
JP2007295218A (ja) | ノンリニア編集装置およびそのプログラム | |
US11967248B2 (en) | Conversation-based foreign language learning method using reciprocal speech transmission through speech recognition function and TTS function of terminal | |
JP2018112681A (ja) | 外国語学習装置 | |
JP5083155B2 (ja) | 辞書機能を備えた電子装置およびプログラム | |
JP7236570B1 (ja) | システム、通信端末、及び方法 | |
JP2007041302A (ja) | 音声再生装置および音声再生処理プログラム | |
US20220059095A1 (en) | Phrase alternatives representation for automatic speech recognition and methods of use | |
JP2018146961A (ja) | 音声再生装置及び音楽再生プログラム | |
KR100383061B1 (ko) | 디지털 오디오와 그의 캡션 데이터를 이용한 학습방법 | |
JP2008009221A (ja) | 音声再生制御装置及び音声再生制御プログラム | |
JP4591481B2 (ja) | 表示制御装置および表示制御処理プログラム | |
US20070067168A1 (en) | Method and device for transcribing an audio signal | |
EP4000703A1 (en) | Apparatus and method for analysis of audio recordings | |
JP7481863B2 (ja) | 音声認識誤り修正支援装置、プログラムおよび方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7236570 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |