JPH0572620B2 - - Google Patents
Info
- Publication number
- JPH0572620B2 JPH0572620B2 JP60107752A JP10775285A JPH0572620B2 JP H0572620 B2 JPH0572620 B2 JP H0572620B2 JP 60107752 A JP60107752 A JP 60107752A JP 10775285 A JP10775285 A JP 10775285A JP H0572620 B2 JPH0572620 B2 JP H0572620B2
- Authority
- JP
- Japan
- Prior art keywords
- cursor
- monosyllabic
- voice
- display
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 6
- 230000002085 persistent effect Effects 0.000 claims description 2
- 230000008685 targeting Effects 0.000 claims 1
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000824311 Daku Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】
イ 産業上の利用分野
本発明は、音声入力を用いて作成された文章等
を表示する音声入力文章作成方法に関する。
を表示する音声入力文章作成方法に関する。
ロ 従来の技術
従来のワードプロセツサに於いては、キーボー
ド等により入力された文字を適時かなΓ漢字変換
処理を行つて文章を作成していたが、人間にとつ
てより自然な情報伝達媒体であるところの音声入
力によつて文章を作成する事を目的として、特開
昭56−114042号公報に開示の如き音声入力ワード
プロセツサ等が開発されている。しかし、入力さ
れた文章を表示するとき、例えば拗音の「きや」
を音声により入力したとすると、表示装置上では
〔き〕と〔や〕とに分割して連続表示され、しか
も入力位置を示すためのカーソルは1文字分の大
きさしかなくてその1文字にしか対応づけられて
いないため、前記の音声により入力された「き
や」をひとつの表音文字として扱うことが実質的
に困難であつた。すなわち、前記の「きや」の表
示〔き〕〔や〕を例えば削除しようとすると、前
記のカーソルを〔き〕の位置に移動させ、該
〔き〕の文字を削除した後、さらに〔や〕の文字
を削除しなければならないと云う煩雑な操作が必
要となる欠点があつた。
ド等により入力された文字を適時かなΓ漢字変換
処理を行つて文章を作成していたが、人間にとつ
てより自然な情報伝達媒体であるところの音声入
力によつて文章を作成する事を目的として、特開
昭56−114042号公報に開示の如き音声入力ワード
プロセツサ等が開発されている。しかし、入力さ
れた文章を表示するとき、例えば拗音の「きや」
を音声により入力したとすると、表示装置上では
〔き〕と〔や〕とに分割して連続表示され、しか
も入力位置を示すためのカーソルは1文字分の大
きさしかなくてその1文字にしか対応づけられて
いないため、前記の音声により入力された「き
や」をひとつの表音文字として扱うことが実質的
に困難であつた。すなわち、前記の「きや」の表
示〔き〕〔や〕を例えば削除しようとすると、前
記のカーソルを〔き〕の位置に移動させ、該
〔き〕の文字を削除した後、さらに〔や〕の文字
を削除しなければならないと云う煩雑な操作が必
要となる欠点があつた。
ハ 発明が解決しようとする問題点
本発明は、上記の事情に鑑みてなされたもの
で、拗音や長音等の単音節音声の入力に対応して
表示されているひと組の文字に対する削除等の編
集処理が一度の操作で行えるようにすることを目
的とする。
で、拗音や長音等の単音節音声の入力に対応して
表示されているひと組の文字に対する削除等の編
集処理が一度の操作で行えるようにすることを目
的とする。
ニ 問題点を解決するための手段
本発明の音声入力文章作成方法は、拗音、長音
等の2文字以上の表記文字列で表わされる単音節
音声を対象とし、入力された単音節音声を音声認
識手段にて認識し、その認識結果を表示手段で表
示しつつ文章を作成する音声入力文章作成方法に
於いて、上記表示手段にて2文字以上の表記文字
列で表わされる単音節音声の認識結果を表示する
場合、該単音節音声の認識結果を特定する為のカ
ーソルがその表記文字列の内の所定文字位置に限
定表示するものである。
等の2文字以上の表記文字列で表わされる単音節
音声を対象とし、入力された単音節音声を音声認
識手段にて認識し、その認識結果を表示手段で表
示しつつ文章を作成する音声入力文章作成方法に
於いて、上記表示手段にて2文字以上の表記文字
列で表わされる単音節音声の認識結果を表示する
場合、該単音節音声の認識結果を特定する為のカ
ーソルがその表記文字列の内の所定文字位置に限
定表示するものである。
ホ 作用
本発明の音声入力文章作成方法によれば、表示
手段に於いて該カーソルに依つて特定された単音
節音声単位の一連の表記文字列に対して、同時に
変更、削除、消去等の編集処理を行なうものであ
る。
手段に於いて該カーソルに依つて特定された単音
節音声単位の一連の表記文字列に対して、同時に
変更、削除、消去等の編集処理を行なうものであ
る。
ヘ 実施例
第1図は本発明の音声入力文章作成方法の実施
例構成図である。同図に於いて、 1は入力された音声を電気信号に変換するため
のマイクロホン、 2はマイクロホン1からの電気信号をアナロ
グ/デジタル変換し、フーリエ変換することによ
り、周波数スペクトルの時系列や、あるいは声韻
性等を抽出する音声分析部、 3は前記音声分析部2からの出力を用いて母音
区間を判定する母音区間切出部、 4は前記音声分析部2からの出力を用いて子音
区間を判定する子音区間切出部、 5は母音標準パターン、 6は前記母音区間切出部3によつて切り出され
た母音区間の周波数時系列と前記母音標準パター
ン5とを用いて入力音声の母音部を判定する母音
判定部、 7は子音標準パターン、 8は前記子音標準パターン7のうち、母音判定
部6での判定結果である母音を後続母音とするパ
ターンと、前記子音区間切出部4によつて切り出
された子音区間の周波数時系列とを用いて入力音
声を識別し、識別結果に応じたコードを出力する
音節識別部であり、以上の構成1〜8にて音声認
識手段Rを構成している。
例構成図である。同図に於いて、 1は入力された音声を電気信号に変換するため
のマイクロホン、 2はマイクロホン1からの電気信号をアナロ
グ/デジタル変換し、フーリエ変換することによ
り、周波数スペクトルの時系列や、あるいは声韻
性等を抽出する音声分析部、 3は前記音声分析部2からの出力を用いて母音
区間を判定する母音区間切出部、 4は前記音声分析部2からの出力を用いて子音
区間を判定する子音区間切出部、 5は母音標準パターン、 6は前記母音区間切出部3によつて切り出され
た母音区間の周波数時系列と前記母音標準パター
ン5とを用いて入力音声の母音部を判定する母音
判定部、 7は子音標準パターン、 8は前記子音標準パターン7のうち、母音判定
部6での判定結果である母音を後続母音とするパ
ターンと、前記子音区間切出部4によつて切り出
された子音区間の周波数時系列とを用いて入力音
声を識別し、識別結果に応じたコードを出力する
音節識別部であり、以上の構成1〜8にて音声認
識手段Rを構成している。
9は前記音節識別部からの出力コードを蓄える
ための文章メモリ、 10は該文章メモリ9内のアドレスを指し示す
文章メモリアドレスポインタで、該文章メモリア
ドレスポインタ10によつて指し示される場所
に、前記音節識別部からの出力コードが格納さ
れ、同時に該文章メモリアドレスポインタ10の
内容が変更され、次に格納すべきアドレスを指し
示すようになる。
ための文章メモリ、 10は該文章メモリ9内のアドレスを指し示す
文章メモリアドレスポインタで、該文章メモリア
ドレスポインタ10によつて指し示される場所
に、前記音節識別部からの出力コードが格納さ
れ、同時に該文章メモリアドレスポインタ10の
内容が変更され、次に格納すべきアドレスを指し
示すようになる。
11は前記文章メモリ9の内容の全部または一
部を表示するための表示装置で、前記文章メモリ
アドレスポインタ10が指し示す文章メモリ9の
内容に対応した位置にカーソルを表示する。
部を表示するための表示装置で、前記文章メモリ
アドレスポインタ10が指し示す文章メモリ9の
内容に対応した位置にカーソルを表示する。
12はプリンタ、
13はフロツピーデイスクメモリ、
14は文章編集等に用いる操作盤で、文章メモ
リ9の内容や文章メモリアドレスポインタ10の
値を変更したり、文章メモリ9の内容をプリンタ
12やフロツピーデイスクメモリ13に出力する
と云う操作が可能である。
リ9の内容や文章メモリアドレスポインタ10の
値を変更したり、文章メモリ9の内容をプリンタ
12やフロツピーデイスクメモリ13に出力する
と云う操作が可能である。
第2図は前記表示装置11の具体的構成を示し
たもので、111は表示部、112は表示部11
1の表示内容記憶用のビデオRAM、113は表
示部111におけるカーソルの位置を記憶するた
めのカーソル位置ポンイタ、114はカーソル位
置ポインタが示す位置のビデオRAM112の内
容にカーソルを書き込むカーソル表示部、115
はカーソルが表示されている位置に対してその内
容を変更したりブロツク転送によりスクロールや
文字の挿入、削除を行つたりする表示操作部で、
前記文章メモリ9からのデータや前記操作盤14
からの指示で、カーソル位置ポインタ113を参
照しつつ、所定の処理を行う。また、該処理を行
つた後、カーソルが移動したり、あるいは前記文
章メモリアドレスポインタが変更された場合には
カーソル位置ポインタ113の内容も変更され
る。
たもので、111は表示部、112は表示部11
1の表示内容記憶用のビデオRAM、113は表
示部111におけるカーソルの位置を記憶するた
めのカーソル位置ポンイタ、114はカーソル位
置ポインタが示す位置のビデオRAM112の内
容にカーソルを書き込むカーソル表示部、115
はカーソルが表示されている位置に対してその内
容を変更したりブロツク転送によりスクロールや
文字の挿入、削除を行つたりする表示操作部で、
前記文章メモリ9からのデータや前記操作盤14
からの指示で、カーソル位置ポインタ113を参
照しつつ、所定の処理を行う。また、該処理を行
つた後、カーソルが移動したり、あるいは前記文
章メモリアドレスポインタが変更された場合には
カーソル位置ポインタ113の内容も変更され
る。
第3図乃至第7図は前記表示部111の表示例
で、各図においてa図は前記表示操作部115の
動作前、b図は表示操作部115が従来例と同様
の動作を行つた後(比較の為の従来例)、及びc
図は本発明による前記後続動作を行つた後を示し
ている。
で、各図においてa図は前記表示操作部115の
動作前、b図は表示操作部115が従来例と同様
の動作を行つた後(比較の為の従来例)、及びc
図は本発明による前記後続動作を行つた後を示し
ている。
第3図は前記操作盤14により、カーソルKを
右に移動させる場合で、第3図aにおいてカーソ
ルKが示している文字は拗音「きや」と音声入力
されたときの表示文字〔き〕の部分を示してい
る。第3図bの従来例ではカーソルKを右へ1文
字移動したとき、カーソルKは〔きや〕の〔や〕
の部分を示してしまう。ここで前記表示操作部1
15はカーソルKが示している部分〔や〕は単音
節音声「きや」の一部分であることを判定してカ
ーソル位置ポインタ113をカーソルKが1文字
右へ移動するように変更させるので、第3図cの
ように、カーソルKは「きや」の右側にある表音
文字「しや」の一部分「し」を示す。
右に移動させる場合で、第3図aにおいてカーソ
ルKが示している文字は拗音「きや」と音声入力
されたときの表示文字〔き〕の部分を示してい
る。第3図bの従来例ではカーソルKを右へ1文
字移動したとき、カーソルKは〔きや〕の〔や〕
の部分を示してしまう。ここで前記表示操作部1
15はカーソルKが示している部分〔や〕は単音
節音声「きや」の一部分であることを判定してカ
ーソル位置ポインタ113をカーソルKが1文字
右へ移動するように変更させるので、第3図cの
ように、カーソルKは「きや」の右側にある表音
文字「しや」の一部分「し」を示す。
第4図は同様に左へカーソルKを移動させる場
合を示したものである。第5図は文字削除の例
で、第5図aでカーソルKが示しているのは〔き
や〕の〔き〕の部分であり、1文字削除すること
により第5図bの従来例では〔きや〕の一部分で
ある〔や〕が残つてしまう。前記表示操作部11
5はカーソルKが示している部分〔や〕は削除の
対象である〔きや〕全体の一部分であることを判
定して再度1文字削除を行い、第5図cに示すよ
うな表示となる。第6図は〔きや〕の部分に再度
音声入力により〔い〕を表示する文字変更の場合
で、第6図bの従来例では〔きや〕の〔き〕の部
分が置き換わつて〔い〕〔や〕と表示され、カー
ソルKはひとつ右へ移動する。前記表示操作部1
15はカーソルKが示す〔や〕が前記〔きや〕の
一部であることを判定してこの〔や〕を削除し、
第6図cに示すような〔いしや〕の表示とする。
第7図は逆に〔いしや〕の〔い〕の部分に再度音
声入力ににより〔きや〕を表示する文字変更の場
合で、第7図bの従来例では〔い〕が〔きや〕の
〔き〕の部分と置き換わつた時点でカーソルを右
へ移動させる。このときカーソルが示す〔し〕は
〔しや〕の一部であり、前記再入力によつて置き
換えられた〔い〕とは別個のものであることを前
記表示操作部115が判定し、カーソル部分に1
文字挿入の処理を行つた上で、再度の音声入力に
よる〔きや〕の一部分である〔や〕を表示し、さ
らにカーソルを右に移動させ、第7図cのような
〔きやしや〕の表示とする。
合を示したものである。第5図は文字削除の例
で、第5図aでカーソルKが示しているのは〔き
や〕の〔き〕の部分であり、1文字削除すること
により第5図bの従来例では〔きや〕の一部分で
ある〔や〕が残つてしまう。前記表示操作部11
5はカーソルKが示している部分〔や〕は削除の
対象である〔きや〕全体の一部分であることを判
定して再度1文字削除を行い、第5図cに示すよ
うな表示となる。第6図は〔きや〕の部分に再度
音声入力により〔い〕を表示する文字変更の場合
で、第6図bの従来例では〔きや〕の〔き〕の部
分が置き換わつて〔い〕〔や〕と表示され、カー
ソルKはひとつ右へ移動する。前記表示操作部1
15はカーソルKが示す〔や〕が前記〔きや〕の
一部であることを判定してこの〔や〕を削除し、
第6図cに示すような〔いしや〕の表示とする。
第7図は逆に〔いしや〕の〔い〕の部分に再度音
声入力ににより〔きや〕を表示する文字変更の場
合で、第7図bの従来例では〔い〕が〔きや〕の
〔き〕の部分と置き換わつた時点でカーソルを右
へ移動させる。このときカーソルが示す〔し〕は
〔しや〕の一部であり、前記再入力によつて置き
換えられた〔い〕とは別個のものであることを前
記表示操作部115が判定し、カーソル部分に1
文字挿入の処理を行つた上で、再度の音声入力に
よる〔きや〕の一部分である〔や〕を表示し、さ
らにカーソルを右に移動させ、第7図cのような
〔きやしや〕の表示とする。
以上の操作の指示は操作盤14によつて行つて
いるが、該指示を音声認識によつて行うことも可
能である。
いるが、該指示を音声認識によつて行うことも可
能である。
また、文章メモリ9への入力は、キー入力を並
用することも可能で、この場合、音声入力とキー
入力を区別するようなコードを採用すれば、キー
入力による表示の部分に対しては前記の後続の処
理動作を行わないようにすることもできる。
用することも可能で、この場合、音声入力とキー
入力を区別するようなコードを採用すれば、キー
入力による表示の部分に対しては前記の後続の処
理動作を行わないようにすることもできる。
以上の説明では音の例を示したが、だく音、半
だく音を取り扱う場合もあり、例えばだく音と拗
音が一体となつた「ぎや」を〔キ〕〔″〕〔ヤ〕の
3つの文字で表わすような場合でも本発明の実施
は可能である。又長音、例えば「トーキヨー」と
発声された場合には単音節音声として「とう」お
よび「きよう」をそれぞれ1組として扱うことに
より、同様の処理が可能となる。もちろん、ロー
マ字表示の場合などにも本発明を用いることが可
能である。
だく音を取り扱う場合もあり、例えばだく音と拗
音が一体となつた「ぎや」を〔キ〕〔″〕〔ヤ〕の
3つの文字で表わすような場合でも本発明の実施
は可能である。又長音、例えば「トーキヨー」と
発声された場合には単音節音声として「とう」お
よび「きよう」をそれぞれ1組として扱うことに
より、同様の処理が可能となる。もちろん、ロー
マ字表示の場合などにも本発明を用いることが可
能である。
ト 発明の効果
本発明は以上に説明したように、だく音、半だ
く音、あるいは拗音、長音等、の単音節音声の発
音を2文字以上で表示するときには、表示された
文字を文字単位ではなく単音節単位即ち発音単位
で扱うことにより、音声により入力された文章の
編集をきわめて能率よく行うことができるように
なる。
く音、あるいは拗音、長音等、の単音節音声の発
音を2文字以上で表示するときには、表示された
文字を文字単位ではなく単音節単位即ち発音単位
で扱うことにより、音声により入力された文章の
編集をきわめて能率よく行うことができるように
なる。
第1図は本発明の音声入力文章作成方法の実施
例構成図、第2図は本発明方法に用いられる表示
装置の実施例構成図、第3図乃至第7図は本発明
方法の表示例を説明する為の模式図である。 1……マイク、11……表示装置、R……音声
認識手段、K……カーソル。
例構成図、第2図は本発明方法に用いられる表示
装置の実施例構成図、第3図乃至第7図は本発明
方法の表示例を説明する為の模式図である。 1……マイク、11……表示装置、R……音声
認識手段、K……カーソル。
Claims (1)
- 1 拗音、長音等の2文字以上の表記文字列で表
わされる単音節音声を対象とし、入力された単音
節音声を音声認識手段にて認識し、その認識結果
を表示手段で表示しつつ文章を作成する音声入力
文章作成方法に於いて、上記表示手段にて2文字
以上の表記文字列で表わされる単音節音声の認識
結果を表示する場合、該単音節音声の認識結果を
特定する為のカーソルがその表記文字列の内の所
定文字位置に限定表示され、該カーソルに依つて
特定された単音節音声単位の一連の表記文字列に
対して、同時に変更、削除、消去等の編集処理を
行なう事を特徴とする音声入力文章作成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60107752A JPS61281360A (ja) | 1985-05-20 | 1985-05-20 | 音声入力文章作成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60107752A JPS61281360A (ja) | 1985-05-20 | 1985-05-20 | 音声入力文章作成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61281360A JPS61281360A (ja) | 1986-12-11 |
JPH0572620B2 true JPH0572620B2 (ja) | 1993-10-12 |
Family
ID=14467072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60107752A Granted JPS61281360A (ja) | 1985-05-20 | 1985-05-20 | 音声入力文章作成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61281360A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57196294A (en) * | 1981-05-28 | 1982-12-02 | Tokyo Shibaura Electric Co | Cursor control system for display unit |
JPS5968792A (ja) * | 1982-10-13 | 1984-04-18 | 電子計算機基本技術研究組合 | 音声認識装置 |
-
1985
- 1985-05-20 JP JP60107752A patent/JPS61281360A/ja active Granted
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57196294A (en) * | 1981-05-28 | 1982-12-02 | Tokyo Shibaura Electric Co | Cursor control system for display unit |
JPS5968792A (ja) * | 1982-10-13 | 1984-04-18 | 電子計算機基本技術研究組合 | 音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JPS61281360A (ja) | 1986-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20060194181A1 (en) | Method and apparatus for electronic books with enhanced educational features | |
JP2007206317A (ja) | オーサリング方法、オーサリング装置およびプログラム | |
JPS61107430A (ja) | 音声情報の編集装置 | |
JPH0572620B2 (ja) | ||
JPH10269204A (ja) | 中国語文書自動校正方法及びその装置 | |
JP2580565B2 (ja) | 音声情報辞書作成装置 | |
Bickner | Directional modification in Thai fiction: the use of" come" and" go" in text building | |
JPS6315294A (ja) | 音声分析装置 | |
JP4036741B2 (ja) | テキスト読み上げシステム及び方法 | |
JPH0570868B2 (ja) | ||
JP2924089B2 (ja) | 日本語発音練習機 | |
JPH03245192A (ja) | 外国語単語の発音決定方法 | |
JPH0116160Y2 (ja) | ||
JPS62212870A (ja) | 文章読み上げ校正装置 | |
JPH06103457B2 (ja) | 音声タイプライタ | |
JPS5991497A (ja) | 音声合成出力装置 | |
JPS6138518B2 (ja) | ||
JPS62262099A (ja) | 発音辞書更新装置 | |
JPH06332934A (ja) | 電子辞書引き装置 | |
JPS58195895A (ja) | 単語音声認識装置 | |
JPH01142927A (ja) | 文章作成装置 | |
JPS6188330A (ja) | 音声タイプライタの編集処理方式 | |
JPS6136796A (ja) | 発音辞書編集装置 | |
JPH0782489B2 (ja) | 中国語文章作成装置 | |
JPH10149355A (ja) | 音声出力付き仮名漢字変換方式 |