JP2021076729A - 書き起こし支援方法及び書き起こし支援装置 - Google Patents
書き起こし支援方法及び書き起こし支援装置 Download PDFInfo
- Publication number
- JP2021076729A JP2021076729A JP2019203694A JP2019203694A JP2021076729A JP 2021076729 A JP2021076729 A JP 2021076729A JP 2019203694 A JP2019203694 A JP 2019203694A JP 2019203694 A JP2019203694 A JP 2019203694A JP 2021076729 A JP2021076729 A JP 2021076729A
- Authority
- JP
- Japan
- Prior art keywords
- word
- text
- transcription support
- voice data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013518 transcription Methods 0.000 title claims abstract description 111
- 230000035897 transcription Effects 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 title claims description 79
- 238000012937 correction Methods 0.000 claims abstract description 68
- 238000012545 processing Methods 0.000 claims abstract description 24
- 230000008569 process Effects 0.000 claims description 45
- 230000033458 reproduction Effects 0.000 claims description 35
- 230000010365 information processing Effects 0.000 claims description 19
- 238000012217 deletion Methods 0.000 claims description 16
- 230000037430 deletion Effects 0.000 claims description 16
- 230000009467 reduction Effects 0.000 claims description 5
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000012550 audit Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 12
- 230000003247 decreasing effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000102542 Kara Species 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
そこで本発明の目的は、音声認識結果の修正作業を、ユーザ視点に合わせて効率化し、当該コストを低減可能とする技術を提供することにある。
データを記憶装置から読み出して予め定めた規定回数でリピート再生する処理とを実行する、ことを特徴とする。
また、集音装置300は、上述の企業内で利用されている装置であり、例えば、会議室にて所定数が配置されているものとする。
−−−ハードウェア構成−−−
このうち記憶装置101は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
また、メモリ103は、RAMなど揮発性記憶素子で構成される。
また、通信装置105は、ネットワーク1と接続して他装置との通信処理を担うネットワークインターフェイスカードである。
制御条件111を保持しているものとする。
こうした監査装置200は、記憶装置201、メモリ203、演算装置204、入力装置205、出力装置206、および通信装置207を備えている。
このうち記憶装置201は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
また、メモリ203は、RAMなど揮発性記憶素子で構成される。
また、入力装置205は、ユーザ(例:上述の担当者等)からのキー入力やマウス操作を受け付ける、キーボードやマウスである。
また、出力装置206は、演算装置104での処理データの表示を行うディスプレイ等の装置である。
また、通信装置207は、ネットワーク1と接続して書き起こし支援装置100などとの通信処理を担うネットワークインターフェイスカードである。
続いて、図4に本実施形態の集音装置300のハードウェア構成例を示す。本実施形態の集音装置300のハードウェア構成は以下の如くとなる。
このうち記憶装置301は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
また、メモリ303は、RAMなど揮発性記憶素子で構成される。
また、入力装置305は、ユーザからのキー入力やマウス操作、ボタン操作などを受け付ける、キーボードやマウス、ボタンなどの適宜な装置である。
また、出力装置306は、演算装置304での処理データの表示を行うディスプレイ等の適宜な装置である。
また、通信装置307は、ネットワーク1と接続して書き起こし支援装置100など他装置との通信処理を担うネットワークインターフェイスカードである。
−−−データ構造例−−−
続いて、本実施形態の書き起こし支援装置100が用いるテーブル類について説明する。図5に、本実施形態における音声データDB125の一例を示す。
<フロー例:メインフロー>
録音して音声データ325を生成しているものとする。また、集音装置300は、その入力装置305により、当該集音装置300の使用者たる発話者の情報を受け付けて、これを音声データ325に紐付けるものとする。
<フロー例:リビジョン管理>
<フロー例:重複削除支援>
この場合、書き起こし支援装置100は、
一方、ユーザ端末400は、上述の削除対象の情報をディスプレイ等で表示し、その削除要否について担当者らによる指示を受け付けることとなる。
て、その真正性の担保や恣意的修正の排除といった点で、ユーザの修正操作に一定の歯止めをかけ、より慎重で公正な修正が行われる状況につながりうる。或いは、ユーザが誤った又は確信無く修正を行ってしまっても、オリジナルの音声認識結果に立ち返って検討を行うことなども可能となる。ひいては、音声認識結果の修正作業を、ユーザ視点に合わせてより効率化し、当該コストを低減可能となる。
び音量増大、の少なくともいずれかの出力制御を行うものである、としてもよい。
10 書き起こし支援システム
100 書き起こし支援装置
101 記憶装置
102 プログラム
103 メモリ
104 演算装置
105 通信装置
110 音声認識エンジン
111 制御条件
125 音声データDB
126 認識結果DB
127 修正履歴DB
200 監査装置
201 記憶装置
202 プログラム
203 メモリ
204 演算装置
205 入力装置
206 出力装置
207 通信装置
225 監査情報DB
300 集音装置
301 記憶装置
302 プログラム
303 メモリ
304 演算装置
305 入力装置
306 出力装置
307 通信装置
308 マイク
310 録音アプリ
325 音声データ
400 ユーザ端末
Claims (16)
- 情報処理装置が、
音声データに対する音声認識処理により得た単語区切りのテキストと、前記音声データにおける前記単語の再生開始時間とを対応付けて記憶装置に格納する処理と、
前記テキストを画面表示させた状態で、ユーザから単語単位での再生指定を受け付けた場合、当該単語から始まる音声データを記憶装置から読み出して予め定めた規定回数でリピート再生する処理とを実行する、
書き起こし支援方法。 - 前記情報処理装置が、
前記リピート再生に際し、ユーザ指定の修正箇所である単語が、低確信度の単語の共起率が所定基準以上の文に含まれていることに応じ、前記音声データの再生回数の増加、再生速度の低減、および音量増大、の少なくともいずれかの出力制御を行う、
ことを特徴とする請求項1に記載の書き起こし支援方法。 - 前記情報処理装置が、
前記修正箇所のユーザ指定を受けた場合、当該修正箇所たる単語の確信度順に候補リストをポップアップ表示し、当該候補リスト中から、ユーザによる単語選択を受け付け、前記修正箇所の単語をユーザ選択の単語に更新する、
ことを特徴とする請求項2に記載の書き起こし支援方法。 - 前記情報処理装置が、
前記リピート再生に際し、前記規定回数のリピート再生の後、当該単語についてさらなるユーザ操作を受けた場合、当該操作の回数の累積程度に応じて、前記音声データの再生速度の低減および音量増大、の少なくともいずれかの出力制御を行う、
ことを特徴とする請求項1に記載の書き起こし支援方法。 - 前記情報処理装置が、
前記ユーザ操作を受け付ける際、未修正版の音声認識結果と、修正操作を反映した修正版の音声認識結果とを並列表示し、前記未修正版については修正操作を受け付け不可とする表示制御を実行する、
ことを特徴とする請求項4に記載の書き起こし支援方法。 - 前記情報処理装置が、
前記未修正版を起点に各修正版を修正履歴として記憶装置にて保持する、
ことを特徴とする請求項5に記載の書き起こし支援方法。 - 前記情報処理装置が、
前記記憶装置において、前記単語区切りのテキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持して、
前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数または総文字数における、当該テキストの間で一致する単語数または文字数の割合が所定の基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち文字列が一番長いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行する、
ことを特徴とする請求項1に記載の書き起こし支援方法。 - 前記情報処理装置が、
前記記憶装置において、前記単語区切りのテキストの確信度の情報と、前記テキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持して、
前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数、及び当該テキストの間で一致する単語数を算定する処理、前記テキストそれぞれの総単語数のうち少ないもので、前記一致する単語数を除算し、当該除算で得た値が予め定めた基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち確信度が一番高いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行する、
ことを特徴とする請求項1に記載の書き起こし支援方法。 - 音声認識対象となる音声データを保持する記憶装置と、
前記音声データに対する音声認識処理により得た単語区切りのテキストと、前記音声データにおける前記単語の再生開始時間とを対応付けて記憶装置に格納する処理、及び前記テキストを画面表示させた状態で、ユーザから単語単位での再生指定を受け付けた場合、当該単語から始まる音声データを記憶部から読み出して予め定めた規定回数でリピート再生する処理、を実行する演算装置と、
を含むことを特徴とする書き起こし支援装置。 - 前記演算装置は、
前記リピート再生に際し、ユーザ指定の修正箇所である単語が、低確信度の単語の共起率が所定基準以上の文に含まれていることに応じ、前記音声データの再生回数の増加、再生速度の低減、および音量増大、の少なくともいずれかの出力制御を行うものである、
ことを特徴とする請求項9に記載の書き起こし支援装置。 - 前記演算装置は、
前記修正箇所のユーザ指定を受けた場合、当該修正箇所たる単語の確信度順に候補リストをポップアップ表示し、当該候補リスト中から、ユーザによる単語選択を受け付け、前記修正箇所の単語をユーザ選択の単語に更新するものである、
ことを特徴とする請求項10に記載の書き起こし支援装置。 - 前記演算装置は、
前記リピート再生に際し、前記規定回数のリピート再生の後、当該単語についてさらなるユーザ操作を受けた場合、当該操作の回数の累積程度に応じて、前記音声データの再生速度の低減および音量増大、の少なくともいずれかの出力制御を行うものである、
ことを特徴とする請求項9に記載の書き起こし支援装置。 - 前記演算装置は、
前記ユーザ操作を受け付ける際、未修正版の音声認識結果と、修正操作を反映した修正版の音声認識結果とを並列表示し、前記未修正版については修正操作を受け付け不可とする表示制御を実行するものである、
ことを特徴とする請求項12に記載の書き起こし支援装置。 - 前記演算装置は、
前記未修正版を起点に各修正版を修正履歴として記憶装置にて保持するものである、
ことを特徴とする請求項13に記載の書き起こし支援装置。 - 前記記憶装置は、
前記単語区切りのテキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持し、
前記演算装置は、
前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数または総文字数における、当該テキストの間で一致する単語数または文字数の割合が所定の基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち文字列が一番長いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行するものである、
ことを特徴とする請求項9に記載の書き起こし支援装置。 - 前記記憶装置は、
前記単語区切りのテキストの確信度の情報と、前記テキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持し、
前記演算装置は、
前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数、及び当該テキストの間で一致する単語数を算定する処理、前記テキストそれぞれの総単語数のうち少ないもので、前記一致する単語数を除算し、当該除算で得た値が予め定めた基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち確信度が一番高いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行するものである、
ことを特徴とする請求項9に記載の書き起こし支援装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019203694A JP7304269B2 (ja) | 2019-11-11 | 2019-11-11 | 書き起こし支援方法及び書き起こし支援装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019203694A JP7304269B2 (ja) | 2019-11-11 | 2019-11-11 | 書き起こし支援方法及び書き起こし支援装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021076729A true JP2021076729A (ja) | 2021-05-20 |
JP7304269B2 JP7304269B2 (ja) | 2023-07-06 |
Family
ID=75900029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019203694A Active JP7304269B2 (ja) | 2019-11-11 | 2019-11-11 | 書き起こし支援方法及び書き起こし支援装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7304269B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001202679A (ja) * | 2000-01-17 | 2001-07-27 | Aiwa Co Ltd | 音声再生装置 |
JP2004212799A (ja) * | 2003-01-07 | 2004-07-29 | Telecommunication Advancement Organization Of Japan | 書起し支援装置 |
JP2005228178A (ja) * | 2004-02-16 | 2005-08-25 | Nec Corp | 書き起こしテキスト作成支援システムおよびプログラム |
JP2019148681A (ja) * | 2018-02-27 | 2019-09-05 | 富士通株式会社 | テキスト修正装置、テキスト修正方法およびテキスト修正プログラム |
-
2019
- 2019-11-11 JP JP2019203694A patent/JP7304269B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001202679A (ja) * | 2000-01-17 | 2001-07-27 | Aiwa Co Ltd | 音声再生装置 |
JP2004212799A (ja) * | 2003-01-07 | 2004-07-29 | Telecommunication Advancement Organization Of Japan | 書起し支援装置 |
JP2005228178A (ja) * | 2004-02-16 | 2005-08-25 | Nec Corp | 書き起こしテキスト作成支援システムおよびプログラム |
JP2019148681A (ja) * | 2018-02-27 | 2019-09-05 | 富士通株式会社 | テキスト修正装置、テキスト修正方法およびテキスト修正プログラム |
Non-Patent Citations (1)
Title |
---|
萩原愛子,外4名: ""番組制作支援のための音声認識を用いた書き起こしシステム"", 情報処理学会研究報告, vol. Vol.2018-SLP-124,No.5, JPN6023002522, 10 October 2018 (2018-10-10), JP, pages 1 - 6, ISSN: 0004977055 * |
Also Published As
Publication number | Publication date |
---|---|
JP7304269B2 (ja) | 2023-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11699456B2 (en) | Automated transcript generation from multi-channel audio | |
US7734996B2 (en) | Documentation browsing method, documentation browsing apparatus, documentation browsing robot, and documentation browsing program | |
US8407049B2 (en) | Systems and methods for conversation enhancement | |
US20040064322A1 (en) | Automatic consolidation of voice enabled multi-user meeting minutes | |
JP6618992B2 (ja) | 発言提示装置、発言提示方法およびプログラム | |
US20080208574A1 (en) | Name synthesis | |
TWI807428B (zh) | 一同管理與語音檔有關的文本轉換記錄和備忘錄的方法、系統及電腦可讀記錄介質 | |
US20230163988A1 (en) | Computer-implemented system and method for providing an artificial intelligence powered digital meeting assistant | |
US20090044105A1 (en) | Information selecting system, method and program | |
US20240176957A1 (en) | Systems and methods for inserting dialogue into a query response | |
JP2009122839A (ja) | 電子会議支援システム | |
US20110113357A1 (en) | Manipulating results of a media archive search | |
JP3896760B2 (ja) | 対話記録編集装置、方法及び記憶媒体 | |
US20030097253A1 (en) | Device to edit a text in predefined windows | |
JP7304269B2 (ja) | 書き起こし支援方法及び書き起こし支援装置 | |
US11086592B1 (en) | Distribution of audio recording for social networks | |
JP2019197210A (ja) | 音声認識誤り修正支援装置およびそのプログラム | |
Walter-Tscharf | Multi-tenant Cloud SaaS Application for a meeting to task transition via deep learning models | |
US20090240734A1 (en) | System and methods for the creation, review and synchronization of digital media to digital audio data | |
KR102291113B1 (ko) | 회의록 작성 장치 및 방법 | |
JP2005025571A (ja) | 業務支援装置、業務支援方法およびそのプログラム | |
KR20220046165A (ko) | 앱과 웹의 연동을 통해 음성 파일에 대한 메모를 작성하는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체 | |
WO2024171284A1 (ja) | 情報提供装置、情報提供方法、および情報受信装置 | |
US20230230588A1 (en) | Extracting filler words and phrases from a communication session | |
CN109997128A (zh) | 知识构建应用系统及程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220302 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230308 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7304269 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |