JP2000123007A

JP2000123007A - 表示一体型タブレットおよび音声認識を利用したテープ起こしシステム

Info

Publication number: JP2000123007A
Application number: JP33186898A
Authority: JP
Inventors: Chie Izawa; 千枝伊澤
Original assignee: Individual
Current assignee: Individual
Priority date: 1998-10-16
Filing date: 1998-10-16
Publication date: 2000-04-28

Abstract

(57)【要約】【課題】人の話をもとにして原稿をかくもの、つま
り対談・座談会・インタービュー・講演会・作家の口述
などは一度録音して、その録音テープを聞きながら人手
で原稿を作成してきた。しかしその状態では手書きの原
稿であり、実際にはそれをコンピュータに人手でキーボ
ードから入力して、やっとテキストデータが作られてい
た。テープ起こしについては全く人手に頼っていたわけ
である。この作業を何とかコンピュータ技術を用いて自
動化を計りたい。【解決手段】この作業に音声認識とその誤認識を手書き
文字で補正し、それをさらに手書き文字認識の技術を用
いて、自動的にテキストファイルを作成することによ
り、テープ起こしの大幅な能率向上を可能にした。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、コンピュータ
（１）にマイク（５）から音声データを入力し、それを
コンピュータ上で動作する音声認識ソフト（３）により
テキストデータに変換させる。しかしながら音声認識自
体まだ完全な認識ができるわけではなく、誤認識するこ
とも少なくない。本発明では、テキストになったデータ
を表示一体型タブレット（２）上に表示していきなが
ら、誤認識部分について作業者が加筆訂正等の編集作業
を行う。ここで編集された結果は手書きのデータであ
り、まだテキストデータにはなっておらず、手書き文字
と音声認識によって変換されたテキストデータが混在し
た状態にある。次にこの手書き文字、テキスト混在のフ
ァイルを、コンピュータ上で動作する文字認識ソフト
（４）の処理によって手書き文字をテキストに変換す
る。最終的には話された内容がすべてテキストデータに
変換される。

【０００２】

【従来の技術】従来、人の話をもとにして原稿をかくも
の、つまり対談・座談会・インタービュー・講演会・作
家の口述などは一度録音して、その録音テープを聞きな
がら人手で原稿を作成してきた。しかしその状態では手
書きの原稿であり、実際にはそれをコンピュータにまた
人手でキーボードから入力して、やっとテキストデータ
が作られていた。テープ起こしについては全く人手に頼
っていたわけである。

【０００３】

【発明が解決しようとする課題】本発明は、テープ起こ
しという神経を高度に集中して行う作業をコンピュータ
システムの活用により、この作業の自動化を実現するこ
とを目指したものである。またテープ起こしに要する時
間を大幅に短縮できるため、取材したものを即座に原稿
にすることが可能になる。

【０００４】

【発明を解決するための手段】コンピュータ（１）にマ
イクから音声データを入力し、それをコンピュータ上で
動作する音声認識ソフト（３）によりテキストデータ
（６）に変換させる。変換されたテキストデータは表示
一体型タブレット（２）上に作られた桝目に１文字ずつ
配置されていく。作業者は音声を聞きながら、これをモ
ニターしていて誤認識部分があったなら削除・加筆等の
編集機能を使って修正していく。ここで作業者が編集し
た部分はこの段階では、テキストデータではなく、手書
き文字のままである。音声データが音声認識により変換
終了した状態では、手書きデータとテキストデータが混
在したファイル（７）が出来ている。本発明では、さら
に後処理として手書きデータとテキストデータが混在し
たファイルから手書き文字部分を文字認識ソフト（４）
よって認識処理を行い、手書き文字もテキストに変換す
る。最終的にすべて話された内容はテキストデータ
（８）に変換される。もちろん文字認識もパーフェクト
で誤認識がないかと言えば、必ずしもそうとは言えない
が、この場合、桝目の中の文字を変換するだけでいいの
で、極めて認識率も認識速度も高いものが実現できる。

【０００５】

【発明の実施の形態】本発明の構成は、ハードウェア的
にはコンピュータ（１）と表示一体型タブレット（２）
それにマイク（５）で構成されるシンプルなものであ
る。またマイクで音声を入力する代りに、オリンパス光
学工業から発売されているデジタルボイスレコーダーを
使用すると録音された音声をＰＣカードスロットから入
力することもできる。いずれの場合も作業者は音声を聞
きながら、それが変換されていくようすをモニターしな
がら、過ちを訂正していく作業が必要である。この作業
は音声が進んでいくスピードで処理していかなかればな
らないが、ここにペン入力ができる表示一体型タブレッ
ト（２）が大きな役割を果たす。システム全体のコスト
を下げようとすれぱ、操作性が多少悪くなり、操作に慣
れが必要になるが、表示一体でない普通のタブレットと
ディスプレイ装置があればその構成でも可能である。

【０００６】

【発明の効果】本発明は以上のような簡単な構成で、テ
ープ起こしという高度に神経を集中させる作業から人間
を解き放ち、しかも従来のやり方に比べ、著しい時間の
短縮が可能になる。しかも情報化時代にふさわしいテキ
ストデータが最終成果物として出来上がるので、ワープ
ロやＤＴＰソフトにそのまま入力できたり、電子メール
で送信することも出来るというメリットは無視できな
い。

【図面の簡単な説明】

【図１】本システムの全体像

【図２】音声入力からテキスト変換された具体例

【図３】誤認識を修正した具体例

【図４】手書き部分を文字認識処理でテキストに変換し
た具体例

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ０６Ｆ 15/20 ５０６Ａ

Claims

【特許請求の範囲】

【請求項１】コンピュータ（１）と表示一体型タブレ
ット（２）を組合わせ、音声認識ソフト（３）、文字認
識ソフト（４）を利用して話された内容を自動的にテキ
ストデータに変換するテープ起こしシステム