JPS6355085B2 - - Google Patents

Info

Publication number
JPS6355085B2
JPS6355085B2 JP15529885A JP15529885A JPS6355085B2 JP S6355085 B2 JPS6355085 B2 JP S6355085B2 JP 15529885 A JP15529885 A JP 15529885A JP 15529885 A JP15529885 A JP 15529885A JP S6355085 B2 JPS6355085 B2 JP S6355085B2
Authority
JP
Japan
Prior art keywords
word
token
character
sentence
cursor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP15529885A
Other languages
English (en)
Other versions
JPS61107430A (ja
Inventor
Jooji Kooru Aran
Harorudo Riikaato Robaato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPS61107430A publication Critical patent/JPS61107430A/ja
Publication of JPS6355085B2 publication Critical patent/JPS6355085B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/086Recognition of spelled words

Description

【発明の詳細な説明】
以下の順でこの発明を説明する。 産業上の利用分野 開示の概要 従来の技術 発明が解決しようとする問題点 問題点を解決するための手段 実施例 システムの原理と構成要素(第1図〜第6図) 情報の記憶(第7図) 編集システムの動作(第8図および第9図) スピーチ編集装置の付加的な特徴 発明の効果 〔産業上の利用分野〕 本発明は総じて言えば文章の認識に係り、より
特定して言えば音声情報の認識に関する。本発明
の良好な実施例は音声情報編集システム、即ちス
ピーチ編集システムに向けられており、その編集
システムでは、発声言語、即ち音声ワードは、認
識された後に表示され、且つ音声入力又はユーザ
が制御しうる手操作入力装置を使つて編集するこ
とが出来る。 〔開示の概要〕 文章編集装置は表示装置のスクリーンを使つて
音声で入力した文章を良好に編集するため、スピ
ーチ認識装置へ接続される。認識出来、且つ辞書
に記憶されている文章ワード(数字を含んで)及
び区切り符号(punctuation mark)のために、
トークン(token)が記憶される。トークンは文
字カウントの情報、大文字化(capitalization)
するための情報、関連する項目の左側連結(left
concatenation)及び右側連結に関する情報、及
び文章の前後関係の状態を表示する領域を与える
ための情報を保持する。音声言語による文章を認
識するセグメント、又はエンテイテイ(entity)
のために、関連した文字ストリング及び関連した
トークンが編集装置中のストレージへ転送され、
必要ならスペースを入れること及び大文字にする
ことを含んで、文章を自動的に様式化し且つ正し
く表示させ、又は印字させる。例えば、文章の始
めにおける修正や連結(concatenation)の際の
修正を反映するため、トークンは編集動作中に更
新される。ワードを認識することが出来ない場合
か、又は綴り、即ちスペル(spell)することが
必要な場合には、単一の綴り文章を入力するため
に、スペルモードへの切り換えが行われる。 〔従来の技術〕 コンピユータで制御された編集システムは公知
である。それ等のシステムは、入力手段として通
常キーボードを有し、そして、編集されるべき情
報又は文章は順次の打鍵操作により入力される。
然し乍ら、タツチ・スクリーン、ジヨイステイツ
ク、所謂、マウス、グラフイツク・タブレツトな
どを含んで、制御情報を入力する他の装置もま
た、知られている。 いつたん、情報が記憶されると、情報は表示す
ることが出来、そして付加的な文字を挿入するこ
とにより、又は文字を置き換えることにより、又
は文字を削除することによつて編集することが出
来る。適当に同定することが出来れば、文章の一
部分全体を除去、即ち削除することも出来る。 デイスプレー上の特定の文字を強調する、即ち
ハイライトするためのカーソルは多くの編集装置
では標準仕様である。カーソルは、挿入、置換又
は削除が行われる位置をマークする。或る部分全
体を削除する場合を除いて、編集は文字単位で行
われるため、カーソルはまた、通常、1個の文字
位置に対して有効であり、そしてその基本的な動
きは右方向又は左方向の1文字分の移動である。 ワード毎に誤つた綴り、即ちスペルをチエツク
することが出来、次に、間違い又は不明であると
されたワードの全体をハイライトする、或る種の
ワードプロセツシング・システムが知られてい
る。然し乍ら、そのような移動及びハイライトの
制御は、オペレータの打鍵により入力されねばな
らないワードの間に、境界標識(スペースなど
の)を必要とする。ワード全体に対する基本的な
編集操作(例えば削除のような)は、或る種のワ
ードプロセツシング・システムで僅かばかり与え
られているが、殆どの編集操作(例えば入力や挿
入など)は文字毎に行われている。 処理システム中へ文章を入力するため文字キー
を打鍵すること、そしてその文章を編集するため
文字キーを打鍵すること以外のテクニツクが要求
されている。換言すれば、すべての人がキーボー
ドの操作に堪能ではなく、そして多くの人達はキ
ーボードの操作を好まない。更にまた、キーボー
ド操作は時間を浪費する。文通を行う通常の方法
では、1人が手紙又は報告書を口述し、他の人、
即ち秘書が録音されたスピーチを聴き、そしてタ
イプライタのキーボードを使つてそれを転記す
る。従つて、スピーチ、即ち音声言語で制御され
た文章(text)入力及び編集を導入することが望
まれる。 例えば下記の文献又は米国特許により幾つかの
スピーチ認識システムが知られている。それら
は、バール(L.Bahl)等の文献、「5000語の語彙
の事務通信からの孤立ワードの文章の認識」
(Recognition of Isolated−Word Sentences
fron a 5000−Word Vocabulary Office
Correspondence Task)と題する音響、スピー
チ及び信号処理に関する1983年の国際会議(1983
年4月ボストンに於いて)の会報1065乃至1067
頁、ジエリネク(F.Jelinek)等の文献、「連続し
たスピーチを認識するための語学的統計デコーダ
の設計」(Design of a Linguistic Statistical
Decorder for the Recognition of Continuous
Speech)と題する、1975年5月の情報理論会報
(Transactious on Information Theory)
Vol.21、No.3の250〜256頁、そして米国特許第
4181821号及び同第4277644号である。 既知のシステムの殆どは区切つて発音するワー
ドのみを認識するものであるけれども、幾つかの
システムは連続したスピーチの入力を判別し、且
つ同定するよう設計されている。スピーチ認識シ
ステムは、例えば音声による命令語の限られたセ
ツトにより機械を直接に制御すること、計算機シ
ステム中に数値を入力すること、供給センターか
ら商品を受注すること、人名簿を検索すること、
発声者が同一人物であるか否かを同定することの
ような或る種の適用業務に対して使用され又は提
案されて来た。然し乍ら、それ等は直ちに表示す
ることと、編集することとを含んでいない。 更にまた、従来のスピーチ認識システムは音声
入力により、或る通常のキーボード入力のような
手操作入力により開始されうる編集を行なつては
いなかつた。 〔発明が解決しようとする問題点〕 本発明は、情報が音声の形で良好に入力するこ
との出来る編集装置を提供することを目的とす
る。 本発明の他の目的は、ワードとワードの間に自
動的にスペースを入れ、且つ文の始めの大文字化
を正しく行う、スピーチ入力編集システムであつ
て、入力された文章を、標準的な様式で直ちに表
示することの出来るスピーチ入力編集システムを
提供することにある。 本発明の他の目的は、音声で認識された文中の
ワードに対して、音声による区切り(spoken
punctuation)符号が正しく連結され、又はスペ
ースを開けられるような態様で、音声により入力
した文章を編集する方法を提供することにある。 本発明の更に他の目的は、通常はワードを基本
として動作するけれども、必要に応じて、単一の
文字をスペルするモードへ容易に切り換えること
の出来るスピーチ入力編集システムを提供するこ
とにある。 〔問題点を解決するための手段〕 本発明はワードや区切り符号のような認識され
る音声エンテイテイに関連するトークンを具えた
スピーチ認識及びスピーチ入力編集システムによ
つて上記の目的を達成する。音声による入力を表
示又はプリントするために、上記のトークンは音
声による文章の入力を正しい文書様式にするのに
必要な情報を含んでいる。これ等のトークンは記
憶されており、そして例えば、2個のワードが併
合される時とか、文の最初のワードが削除される
時とかのように、編集動作の間で文章が変更され
る時、これ等のトークンは更新することが出来
る。 トーンに与えられている連結に関する情報は、
ワード及び区切り符号を明瞭に発音するだけで他
の別の制御情報を入力することなく、ワードとワ
ードの間にスペースを自動的に挿入し、又は正し
い通常の様式で区切り符号をワードに連結する。 本発明に従つた編集システムは、口述録音通信
(dictating correspondence)の代表的な形式で
スピーチ入力を受け取ることが出来、且つ口述者
又は他のユーザにより見ることが出来る(又はス
ピーチ合成器を使えば聞くことが出来る)最終的
に様式化されたフオームの文章を与えることが出
来る。このシステムはまた、明確に認識されなか
つたワード、又は意図されなかつた文章出力のワ
ードの修正を迅速に且つ容易に行う。 本発明はスピーチ入力以外の装置を持つ文章認
識システムへも適用されうることは注意されるべ
きである。例えば、本発明の教示は、相次いで並
んでいるワードの間のスペースを打鍵することな
く文章を入力しうるキーボード入力システムにも
適用することが出来る。本発明はスピーチ入力と
共に、トークンの形で連結情報を与える。つま
り、スピーチなしで連続的にタイプされたワード
は、認識装置で認識され、そして連結標識を含む
トークンを割り当てる検索メモリへ、コード同定
標識として差し向けられる。若し必要なら、スピ
ーチ入力と共に、大文字化の情報、文字カウン
ト、その他の情報をトークン中に含ませうる。ス
ピーチ入力を具えた本発明の場合、音声命令ワー
ド及び区切り符号入力の具備を必要とすることは
言うまでもない。 〔実施例〕 (A) システムの原理と構成要素 (1) システムの全体像 以上の項で説明するシステムは音声で入力
する文章(text)及び音声による命令を認識
し、そしてシステムのルール及び与えられた
命令に従つて、入力文章をスクリーン上に表
示する。キーボード及び他の手操作装置によ
る命令の入力も与えられる。スクリーン(又
はバツフアストレージ)にある文章は付加的
な命令により、或は、付加的な音声ワード又
は音声文字により編集することが出来る。 第1図は本発明が使われている、スピーチ
入力及び編集システム10のブロツク図であ
る。スピーチ認識装置11はその入力点にお
いて、スピーチを表わす信号を受取る。その
スピーチを表わす信号は、区切つて発音され
たワードでもよいし、音声命令でもよいし、
個々の文字(綴り読みの場合)でもよく、ま
た連続したスピーチであつてもよい。与えら
れた語彙中の各ワード、個々の文字又は符号
(文字、数字、区切り符号など−以下文字と
いう)及び与えられた命令リスト中の各命令
ワードはコード同定標識の与えられたセツト
の中のコード同定標識によつて表示される。
文章中の用語、即ち文章ワード、区切りワー
ド(punctuation word)、命令ワードは以
下、「エンテイテイ」(entity)と称する。コ
ード同定標識はnビツト、例えば16ビツトで
構成されてよく、従つて2n、例えば64000個
以上の異なつたエンテイテイを同定する。 音声入力がワードとして認識された時、ス
ピーチ認識装置11はその出力線13上に認
識したコード同定標識を供給する。スピーチ
認識装置11の他の出力線15において、状
態信号が同時に発生され、認識が成効であつ
た(明確に認識した)か、又は認識に疑問が
あつた(認識が多分誤りらしかつたので、最
も可能性が高い出力を選んだ)か、又は全く
認識することが出来なかつたかを表示する。
最後の場合には、夫々の「空白」コードワー
ド(アスタリスク)が出力線13に発生され
る。3つのありうる状態が出力線15上にビ
ツト対により表示されうる。特定のこれ等3
つの場合の個々の信号の代りに、他の信号、
例えば、認識の正確性を表わす確率の値を与
えることも出来る。 音声入力のために、使用可能な命令のリス
トは第1表に示されており、起りうる区切り
符号及びそれ等の区切り機能のリストが第2
表に与えられている。 既に述べたように、スピーチ認識装置11
は本発明の編集装置12の一部分ではない。
然し乍ら、それは、第1図の他のブロツク及
び相互接続により示されている全スクリーン
編集装置12のための良好な入力装置であ
る。装置11としても使いうる単一ワードの
スピーチ認識装置が上述のバール等の文献、
及び上述の米国特許に記載されている。 通常、そのような認識装置は完成したワー
ド即ち、語彙中のワード又は命令の認識を行
い、そしてワードに対応する数字又は標記
(label)のような同定標識によつて各ワード
を表示する。本発明のシステムは音声による
区切り符号及び数字をも認識することが出来
る。個々の綴り文字(spelled charcter)を
認識するための装置を基本的なスピーチ認識
装置へ部分11Aとして付加することによ
り、認識語彙の中には存在しないワードの入
力を許容するようにしてもよい。認識された
文字は、従つて、夫々のコード同定標識によ
り文字コード出力線13A上に表示される。 編集システムは辞書・検索メモリ装置17
を含み、メモリ装置17は関連するワード、
区切り符号又は命令を表わす各コード同定標
識を受取る。文章コードを表わす各コード同
定標識に応答して、メモリ装置17の辞書部
分は出力線19上に、関連する文章ワードの
文字ストリングの形式で認識コードを発生す
る。認識コードはアスキ(ASCII)、エブク
デイツク(EBCDIC)或は他の文字表示コー
ドであつてもよい。与えられた文字、数字又
は区切り符号の各文字ストリングはアスキ・
コードで表示されるのが好ましい。同時に、
文章ワードの文字カウント(character
count)及び文章の他の情報を含む「トーク
ン」が検索メモリ部分により、出力線21上
に発生される。辞書/検索メモリ17は、読
み取り専用メモリも使用しうるけれども、ラ
ンダムアクセスメモリを含むのが好ましい。
トークンのより詳細は後述する。 各々の音声編集命令入力に応答して、辞書
部分は関連するコード化命令ワードを出力線
23上に発生する。命令及び命令ワード表示
についての詳細な説明は後に行う。 付加的な辞書部17Aが単一の文字のため
に与えられている。それはその入力に、認識
された各綴り文字のコード同定標識を受け取
り、そしてそのコード同定標識に応答して、
出力線25に1個の単一のコードワードを発
生すると同時に、出力線27に、個々の文字
に関連した他の制御情報を発生する。この制
御情報に関する詳細な説明は後で行う。 記憶及び様式化部29は出力線19乃至2
7からのすべての情報を受け取り、そしてビ
デオ情報を準備するためそれ等の情報を処理
して、表示スクリーン31上に正しく様式化
された情報を表示する。ビデオ信号発生器3
3はコード化されたビデオ情報を表示装置の
ための実際の電気制御信号に変換するために
備えられている。 記憶及び様式化部29はまた、それが受け
取つた文章コード、区切り符号及び命令に基
づいて、編集される文章の前後関係の状態を
決定する。文章の前後関係の状態とは、例え
ば、「文章の開始」、「スペルモード
(spellmode)」の如きものである。文章の起
りうる前後関係の異なつた状態のリストが第
3表に示されている。この状態のコード表示
は線35により辞書/検索部17へ戻される
ので、辞書/検索部は、現在の状態(例え
ば、次のトークン中の「文章の開始」ビツト
を1にセツトする)に基づいて、それが発生
するトークンを更新する。夫々の更新の手続
は後述する。 他の付加的な入力装置が記憶及び様式化部
29に任意に与えうる。キーボード37が、
既に説明したような編集システム中に命令
(及び文字)を入力し、更にライトペン、図
形タブレツト、「マウス」或は他の同様な装
置の如き手操作選択装置又は手操作指示器も
また編集システムに使用しうる。これ等の既
知の装置は、音声形成ではない命令を与える
ために、そして位置情報を入力するために、
指示機能を与えるために、或は打鍵以外にカ
ーソルを移動するために有用である。 (2) 連結(concatenation)及びクランクの挿
入 本発明の編集システムの重要な特徴は文章
ワードをエンテイテイとして処理すること、
即ちシステムは表示装置にワード全体を供給
し、そしてワードとワードの間にブランクを
自動的に挿入することにある。更にまた、本
システムでは、所望の位置、即ち操作位置を
マークするカーソルは、通常1個のワード全
体に有効であり、若しカーソルを動かすと、
ワード全体を飛び越えることになる。カーソ
ルの幅はワードの長さに対して自動的に調整
されている。スピーチ認識システムはワード
全体を認識し且つ発生するので、このことは
操作を単純化する。 然し乍ら、既に触れ、更に以下に細述され
るように、本発明のシステムは、認識されな
かつたワードを綴り読みする必要がある場
合、単一の文字のみを処理する動作モードを
与える。そのような文字が表示装置に加えら
れると、ワードの最初の文字又はワードの最
後の文字にブランクが添付されている場合を
除いて、そのような文字(ワードとして取り
扱われた)の間には自動的にブランクは加え
られない。また、カーソルは1個の文字だけ
をマークし、そしてこのモードにおいては、
1個の文字の歩進幅だけの前方又は後方に移
動する。 音声化区切り符号は、表示された時、特別
な態様で処理される。例えば、コロンはブラ
ンクなしでワードの後に続くが、それ自身は
ブランクを従える。同じことが、終り括弧
(end parenthesis)にも当嵌るが、始め括弧
はコロンと反対の条件になる。(始め括弧の
前にはブランクがあり、その後にはブランク
を持たない。) 連結又は挿入ブランクのための異なつた条
件が第2図に示される。通常のワードは、第
2A図において、ワードのシンボルの両端の
2個の凸部で示されているように、ワード前
及び後にブランクを必要とする。反対に、ブ
ランクは第2B図に示されるように、ワード
のどちら側にも直接に連結しうるけれども、
図示のように、ブランクのシンボルの両端の
2つの凹部のため、他のブランクとは決して
連結しない。第2C図に示されたように、開
始括弧、即ち左側括弧又は同じようなシンボ
ル(例えば開始引用符)(start quotation)
はそのシンボルの前にブランクを必要とし、
そしてそのシンボルに続くワードへ連結され
る。左側凹部及び右側凸部のシンボルとして
第2D図に示されているように、コロン、ピ
リオド、疑問符などの如き区切り符号及び右
側括弧或はそれと類似のシンボル(終了引用
符)はそれ等のシンボルに先行するワードに
連結するが、然し、その後にブランクを必要
とする。ブランク挿入及び連結は本発明の全
−スクリーン編集装置によつて自動的に行わ
れる。 本明細書中の4つの範疇に使われている記
号は以下の通りである。即ち、LRは左側及
び右側がブランク、LOは左側がブランクで
右側が連結、ORは左側が連結そして右側が
ブランク、OOは両側が連結を表わす記号で
ある。「X」は、ブランク挿入又は連結が文
章の前後関係に従属することを表わし、前も
つて決めることは出来ない。 文章と文章の間に2つのスペースを置くと
いう文書形式は共通な慣習である。この編集
システムは随時、その文書形式に順応するこ
とが出来る。第2図は、各文章が1個のスペ
ースで終了する形式を示している。 (3) トークン 命令及び単一の綴り文字を除く、文章コー
ド、数字又は区切り符号に対応する認識され
たエンテイテイのために、編集装置は「トー
クン」を与える。トークン全体は夫々のエン
テイテイのための文字カウントと、その連結
条件と、表示装置で編集するのに重要な他の
制御情報を表示する。トークンのフオーマツ
トは第3図に示されている。例えば、文字カ
ウントは、ワードの最大長さを32文字と仮定
して5ビツトで構成されている。必要に応じ
て、この領域に任意のビツト数を与えうる。
各数字及び区切り符号に対する文字カウント
は勿論1である。 次の2個の1ビツト領域は、夫々のエンテ
イテイが先行するエンテイテイ又は後続する
エンテイテイに連結されるべきか否かを表示
する。通常のワードに対して通常のワードは
何れの側でも連結されることがないから、両
方のビツトはゼロである。次の領域もまた1
ビツトのみであり、ワードの最初の文字が常
に大文字化されるべきか否かを(Johnや
Englishのように)表示する。 今まで述べた8個のビツト、即ち2本線の
領域線までのビツトは、各エンテイテイ(ワ
ード、区切り符号、数字、等)に対して予め
決められうる制御情報を構成している。然し
乍ら、トークンは様式処理及び編集処理の間
に入力されるその他の制御情報のための領域
を有している。夫々の制御ビツトを以下に説
明する。 最初の可変制御ビツトは、夫々のエンテイ
テイが明瞭に認識されたかどうか、即ちその
選択が疑問であつたか否かを表示する。次の
制御ビツト領域は関連するワードが文章の始
めにあるか否か、従つて最初の文字が大文字
化されねばならないか否かを表示する。3番
目の可変制御ビツトは、夫々のエンテイテイ
が文章の条件付き終了であるか否かを表示す
る。ここで、文章の条件付き終了とは、例え
ば右側引用符号(”)のような区切り符号で
あつて、通常は文章の終りで記されることは
ないが、或る場合は文章の終りで記されるこ
とがありうる符号で文章が終了することを意
味する。次の可変制御ビツトは、関連するワ
ードが文章とは無関係にワードの文字全部を
大文字化(この条件は上段ケース命令即ち
UPRCASE命令で入力する)されねばなら
ないか否かを表示する。残りの4個の可変制
御ビツト(R1、R2、R3、R4)は、特定の
システム中で任意の意味に割り当てることが
出来る予備として備えられている。 既に説明したように、編集処理の間で、与
えられた命令又は与えられた文章に基づい
て、可変制御情報領域中に8個のビツトが決
められた。これ等がどのように用いられるか
については後述する。 ワード/文字ストリング様式を示す第4図
において、辞書中に記憶されるワードの文字
ストリングの形式が示されている。各ワード
はN個の文字C1〜CNから成り、各文字は
8ビツト(1バイト)で表示される。ワード
の長さは最大32個の文字まで可変長である。
17Aの辞書部中の1個の文字(スペルモー
ド動作で)は1バイトのみで構成される。各
ワードの最初の文字は、例えば文字判別のた
めには使われない1ビツトをセツトすること
によつてマークされる。最初の文字が開始マ
ークを有することを第4図のC1に付した星
印で表わしている。 (4) 音声命令の概観 本発明の編集システムは異なつた編集動作
モードを持つている。異なつたモード間に切
換は命令により行われる。更に、次の動作に
対してのみ影響する命令がある。システムの
モード又は動作状態に影響する種々の命令が
第1表に示されており、これについては後述
する。 更にまた、システムは現在のワード又は文
字を示すカーソルを有するものと仮定する。
このシステムでは、カーソルは通常、ワード
全体に有効なので、カーソルは以後「カーソ
ルボツクス」又は「現在ボツクス」、即ち
「カレントボツクス」と称する。ただ1個の
文字、又は区切り符号の場合、ボツクスは1
文字分の長さだけであることは言うまでもな
い。 第1の命令「挿入」が挿入モードを開始
し、そのモードで音声情報はカーソルボツク
スの前に挿入される。現在の入力の間、カー
ソルは常に、存在するテキストの終端にある
ので、新しい入力はその終端に付加される。
編集者が脱落した或る情報を挿入したいとす
ると、編集者は編集システムで通常行われる
ように、関連する位置へカーソルを移動し、
そして存在するテキスト内に挿入される訂正
を発音すると、新しいテキストのための空間
を作る挿入部分を従えたテキストの自動シフ
トが行われる。 第2の命令「置換」は置換モードを開始
し、置換モードにおいて、発音したワード又
は文字は存在するワード又は文字の上で重ね
書きされる。勿論、置換は現在のカーソル位
置で開始する。従つて若し、置換モードで3
個のワードが発音されたとすると、それ等は
3個の相次ぐワードを置換し、且つカーソル
ボツクスは各置換後、次に後続するワードに
移動する。同じことが、編集システムで良く
知られているように、個々の文字にも当て嵌
る。 第3の命令「削除」は現在のカーソル位置
にあるワード全体、又は独立した文字を削除
する(現在のモードに依存して)。 第4の命令「新しいパラグラフ(NEW
PAR)」は現在のカーソルボツクス位置にあ
る新しいパラグラフを開始する。この命令の
実行は新しいライン即ち行を開始させて、新
しいパラグラフを形成する。(後述する。) 第5の命令「新しいライン
(NEWLINE)」は現在のカーソルボツクス
位置で新しい出力ラインを強制する。新しい
ラインが開始され、関連する入力がラインス
トリング・ヘツダにも作られる。(上述した
ように、新しいパラグラフにおいて) 第6の命令「大文字化(CAPITAL)」は
発声された次の文字又は次のワードが大文字
化される(第1文字のみ)ことを表示する。
含まれたトークン中の関連する制御ビツトは
それに従つてセツトされる。 第7の命令「上段ケース(UPRCASE)」
は、発音され又はスペルされた次のワードが
全文字とも上段ケースへ変換されることを表
示する。関連するトークン中の上段ケース制
御は「上段ケース」命令に従つて調整され
る。 第8の命令「スペルモード
(SPELLMODE)」は、個々の文字だけが有
効になるスペルモードを開始する。通常の語
彙ワードはこのモードでは認識されず若しく
は受け付けられない。 第9の命令「スペルモードの終り(END
−SPELLMODE)」はスペルモードを終了
させて、数千の通常の語彙ワード(命令語、
区切り符号及び数字を含めて)のみが認識さ
れ受け付けられる通常のモードへ復帰する。 上述したように、これ等の命令は、以下で
説明する第1図及び第6図に示されたキーボ
ード35の入力キーを介しても与えることが
出来る。システムの動作の結果は音声命令の
それと同じである。 (5) 音声による区切り符号の検査 第2表は音声の様式で入力しうる区切り符
号(数字を含む)のリストを示す。各符号の
右側に示された音声様式は自明である。第2
表はまた、連結の範疇に属する記号が示され
ている。4個の連結範疇が示されている第2
A図乃至第2D図をも参照するとよい。 編集システムの基本様式において、区切り
符号及び数字(及び命令語に使つたワードも
含んで)、間違つた命令又は区切りを避ける
ため、通常の文章ワードとして使つてはなら
ないことは注意を要する。然し乍ら、この問
題を解くための幾つかの方法があるので、区
切りワード及び命令語は通常の音声の文章の
中で使うことが出来る。 (a) スピーチ認識処理に使われる言語モデル
は、文脈を使つて、そのワードが通常の文
章ワードか又は区切りワードかを判別しう
るよう定義することが出来る。 (b) 区切り符号及び数字(及び命令)のため
の音声ワードは接頭辞、例えばパン−コロ
ン(PUN−colon)、パン−疑問符(PUN
−question mark)、デイグ−5(DIG−
five)、デイグ−ゼロ(DIG−zero)等に
よつて、特定して判別しうるようにするこ
とが出来る。 (c) 区切り符号、数字、命令などを表わすワ
ードを発音する前に、スペルモードへ切換
えることも可能である。この場合、「終止
符(period)」又は「5(five)」のような
ワードは、辞書部17及び17Aに違つた
意味で入れられる。 (6) キーボード及び手操作での入力装置のキー キーボード37は任意のタイプライタのよ
うに通常の文字部分を含むが、第5図に示さ
れたような制御キー部分をも有する。それは
第(4)項で音声命令として既に説明したような
9個の命令ワードのキーを含むのが好まし
い。挿入/置換とかスペルモード/スペルモ
ード終了とかの命令ワード対のために、1個
のトグルスイツチがキーボード上に与えられ
ている。加えて、他の3個の命令、即ち、上
段ケース(UPRCASE)から下段ケース
(LWRCASE)へワード全体を変換するため
の下段ケース、ストレージへスクリーンの内
容を転送するためのSTORE(記憶)、印字出
力へスクリーンの内容を転送するためのプリ
ント(PRINT)命令が備えられる。幾つか
のキーF1乃至F4は、必要に応じて付加的
な命令のために使われる。第5図に示された
アスタリスクは音声命令としても使用可能で
あることを示す。 手操作の選択器即ちポインタ装置39が第
6図に示される。それはカーソルを4つの座
標方向に移動するための4個のキーを持つ。
4個のカーソルキーの代りに、ジヨイステイ
ツクを備えてもよい。他の可能性として、底
面で位置感知手段を持たせて、手操作選択装
置を「マウス」として使うことが出来る。更
に3個のキーが設けられ、第1のキーはスペ
ルモードとワードモードとの間を変換する
(スペルモードの終了を意味する)トグルス
イツチW/Sである。第2のキー、EXECキ
ーは動作の実行に使われる。動作の実行とは
音声形式で既に入力された(即ち予備選択さ
れた)命令、又はキーを打鍵することにより
入力された命令を実行することを意味する。
前もつて入力されたすべての命令はスクリー
ンに表示されるので、EXECキーを打鍵する
ことにより命令が実際に遂行される前に、オ
ペレータは命令をチエツクすることが出来
る。「F5」のキーはメニユーを表示される付
加的機能を制御する。 (B) 情報の記憶 (1) 辞書中の配列 既に述べたように、綴り文字を除き、スピ
ーチ認識装置によつて認識しうるエンテイテ
イ(即ち、ワード、単一の数字、区切り符
号)夫々のために、文字ストリング及び関連
するトークンが辞書部17中に記憶されてい
る。トークンのフオーマツトについては既に
(A)(3)項で述べた。コード同定標識が線13を
介して辞書部17へ供給されると、それは関
連するエンテイテイに対する文字ストリング
とトークンを発生する。図示された良好な実
施例では、文字ストリングとトークンは並列
で且つ同時に伝送される。スペルモードであ
る単一の文字に対しては、唯1個のアバトが
辞書部17Aに記憶され、又は辞書部17A
により供給される。辞書はまた、5個のアス
タリスクのストリング(*****)及びト
ークンと、1個のアスタリスク(*)とを記
憶している。これ等は、音声入力がワードモ
ードでもスペルモードでも認識出来ない時に
発生される。 (2) 実行ストレージ中の活動している情報の配
列 編集したフアイルの内容は(フアイルのす
べてか、又は一部がスクリーンに表示されて
いる)実行ストレージに保持される。図示の
実施例では、実行ストレージは記憶及び様式
化部29に含まれている。文字ストリング及
びそれ等に関連したトークンが本システムの
実行ストレージ中に記憶されている特定の態
様を第7図に示す。第7A図はラインストリ
ング・ストレージを、第7B図はトークンリ
スト・ストレージを、第7C図はラインポイ
ンタ・レジスタを、第7D図はラインストリ
ング・バツフアを、第7E図はトークンポイ
ンタ・レジスタを、第7F図はカーソルレジ
スタを夫々示し、第7図は実行ストレージを
示すため上記各図の関係を説明する図であ
る。 現在編集するフアイル、即ち文書の各ライ
ンのために、別個の要素としてラインストリ
ング・ストレージ素子71があり、それは関
連する文字ストリングを保持する。ライン文
字ストリングはワード文字ストリングと連結
する。ラインストリング・ストレージ71中
の各ワードの文字ストリングに対して、トー
クンがあり、それはトークンリスト・ストレ
ージ72中に別個に記憶される。以下に説明
されるように、このトークンは連鎖状のリス
ト構成で配列されている。 特定のラインが編集されており、カーソル
がスクリーン上のそのライン上に置かれた
時、ラインを同定するポインタは活動してい
るラインポインタ・レジスタ(第7C図)に
記憶される。関連するラインの文字ストリン
グはラインストリング・バツフア(第7D
図)へロードされる。 第7D図は目的とする対象のラインのため
のラインストリング・フオーマツトが示され
る。ラインストリングは次の3つの領域を含
むヘツダが先頭を占める。第1の領域はトー
クンリスト・ストレージ72のトークンポイ
ンタであり、それは活動しているラインの最
初のワードに関連するトークンのストレージ
位置を同定する。ヘツダの他の2つの領域は
夫々1個のビツトであつて、新しいライン、
又は新しいパラグラフが対象のラインで開始
するか否かを表示する。ラインストリングの
残りの領域はそのラインを構成するすべての
ワードのワードストリングとブランクとを含
む。例えば、ワードW1はC11,C12,
C13,C14;ブランクC15から成り、
ワードW2はC21,C22;ブランクC2
3から成るなどの如くである。異なるワード
の境界は1個のアスタリスク符号(*)で認
識され、1個のアスタリスクが、ワードが実
行ストレージに転送された時に各ワードの最
初の文字に入れられる。 第7E図は現在活動中のワード、即ちカー
ソルを持つワードのトークンのポインタを有
するトークンポインタ・レジスタを示す。既
に述べたように、ラインストリング・ストレ
ージ中にあるすべてのワードのトークンは連
鎖状のリストの形でトークンリスト・ストレ
ージ72の中に分離して記憶されている。ラ
インストリングに属する一組のトークンの最
初のトークンのアドレスはラインストリング
(第7D図)のヘツダの中に与えられる。こ
の最初のトークンはトークンリスト・ストレ
ージ72のラインストリングに添加されてお
り、第2のトークンのアドレス(即ち、ライ
ンの第2のワードに属するトークン)は同様
にストレージ72のラインストリングに添加
されており、以下のトークンアドレスもまた
同様である。ラインの最後のトークンは関連
する終了表示をラインストリングに添加して
いる。従つて、第7E図に示されたトークン
ポインタ・レジスタは、トークンリスト・ス
トレージ72中に記憶されている(そのフオ
ロワアドレスと一緒に)実際のトークン(第
3図のフオーマツトに対応する)のポインタ
を保持する。 ラインストリング・バツフアが付勢された
時、ラインストリングがラインストリング・
ストレージからラインストリング・バツフア
へ転送されたとすると、最初のトークン(ラ
インストリング・ヘツダ中で同定される)の
ポインタはラインストリング・バツフア(第
7D図)からトークンポインタ・レジスタへ
移動される。ラインの編集動作の間で、カー
ソルがワードからワードへ動いた時、「フオ
ロワ」アドレス(即ち、次のトークンポイン
タ)を用いて、トークンポインタを1個づつ
トークンポインタ・レジスタへ転送する。若
し、編集動作の間で、ワードの状態に何かし
らの変更が生じたならば、(例えばあるワー
ドが文章の最初の位置に移動した場合)、ト
ークンリステ・ストレージ中に更新されたト
ークンを容易にアクセスしうるように、関連
するトークンは実際のトークンポインタを使
つて更新することが出来る。 実行ストレージ中の付加的なレジスタは第
7F図に示したカーソルレジスタである。そ
れは、ラインストリング・バツフア中の現在
活動中のワードの開始位置のアドレス(例え
ば、1ライン中の128文字の1つを同定する
ための7ビツト)と、ワード及びカーソルの
長さ表示とを記憶する。長さ表示はトークン
から取り出され且つ現在活動中のワードの長
さを同定する5ビツトが好ましい。カーソル
が移動されると、システムはライン中の次の
マークされた開始文字を探し、そしてカーソ
ルレジスタ中にそれを入れる。加えて、次の
トークンポインタはフオロワアドレスを使つ
てトークンポインタ・レジスタへ取り出さ
れ、そして長さ表示は新規に活動したトーク
ンからカーソルレジスタの第2の部分へコピ
ーされる。 (C) 編集システムの動作 (1) 実験の例の説明 この編集システムの動作を説明するため、
第8図に1例が示される。第8図は、入力さ
れたばかりの文章が表示されたスクリーンを
示している。所望の文章は「This is a
SAMPLE test(only for the purpose of
demonstration).」である。この文章を入力
する発声の順序は「this is a
UPPERCASE sample test OPEN−
PAREN only for the purpose of
demonstration CLOSE−PAREN
PERIOD」であつた。発声の順序中のアツ
パケース(UPPERCASE)で示されたワー
ドは命令、又は区切り符号である。 第8図から理解されるように、ワード
「sample」は大文字で表示されているので、
アツパケース、即ち上段ケース命令は正しく
実行されていたのが分る。ワード「for」は
「four」と不正確に認識されたが、システム
はこの認識は疑問であつたことを表示し、そ
して、編集者がこの状態に気付き且つ綴りを
チエツクすることが出来るように、このワー
ドは枠を付して注意を喚起している。ワード
「purpose」は全く認識されなかつた。それ
故、システムは5個の並んだアスタリスクを
入れた。この例は更に、システムは文章ワー
ドの間にスペースを正確に与えたが、左側括
弧の後のスペースと、右側括弧及び終止符即
ちピリオドの前のスペースは与えられていな
いことを示している。 すべての文章が入力され、且つカーソルが
最後に入力されたエンテイテイとしての終止
符、即ちピリオドの次に来た後に、ユーザが
「demonstration」を「illustration」に置き
換えたいと望んだとする。これを達成するた
めに、カーソルは3つのエンテイテイだけ後
退されて、ワード「demonstration」をポイ
ントする。命令REPLACE(置換)がスピー
チで発声され(又はキーボード入力で)、結
果として、ワード「demonstration」をマー
クする。最後に与えられた命令REPLACEは
スクリーンの左下隅に表示される。然し乍
ら、それを実際に遂行するために、既に述べ
たように、オペレータはEXECUTEキーを
押さなければならない。右下隅にシステムの
現在の有効状態が示されており、それらは
INSERT(新しい文章を入力すること−命令
REPLACEは未だ有効でない)及びWORD
(綴り文字を必要としなければ通常のモード)
である。 第8図の例を参照して、文章を入れたり編
集を行うための他の動作を以下に述べる。 (2) 編集動作 第1図及び第9A乃至第9C図を参照し
て、この編集システムにおいて遂行される操
作即ち動作の詳細を以下に述べる。 (2a) 基本動作(第1図) 入力されるワード又は命令を遂行する動
作は以下のステツプを含む。 ※認識するエンテイテイのコード同定標識
をスピーチ認識装置11から辞書/検索
メモリ17へ転送する。 ※文字ストリング及び関連するトークンを
読し出し、且つ文章の前後関係情報に従
つてトークンを更新する。 又は 命令コードを読み出す。 ※文字ストリング及びトークンを記憶及び
様式化部(S&F)29へ転送する。 又は 命令ワードコードをS&F部29へ転
送する。 又は 命令をキーボード37又は手操作選択
装置39からS&F部29へ転送する。 ※新しい文章の前後関係情報を評価し、S
&F部29中に記憶されている文章の前
後関係情報を更新し、そして新しい文章
の前後関係情報の一部を辞書/検索メモ
リ17へ返還する。 ※S&F部29のストレージの中へ文字ス
トリング及びトークンを挿入する。 ※カーソルの位置及び長さを更新する。 ※トークン情報を更新する。 ※S&F部29の中の更新された新しい情
報でスクリーン31上の表示を更新す
る。 (2b) 辞書/検索メモリ17中のトークンを更
新するための詳細な動作 辞書/検索メモリ17はトークンを更新
するため、下記の情報を受け取る。 (イ) 状態信号線15を介して、スピーチ認
識装置11から:「ワードは多分正し
い」、(ロ)「ワードは疑問である(多分間
違い)」、又は(ハ)「ワードは認識しえな
い」であつて、最後の(ハ)の項の場合はダ
ミーワードストリング「*****」を
発生する。 (ロ) S&F部29から:「文章の開始、大
文字化されるべき次の文章ワード」−「最
後のエンテイテイは数字であつた、若し
数字が左側連結であれば次のエンテイテ
イ」−「最後の命令はUPPERCASEであ
つた。すべて上段ケースにあるべき次の
文章ワード」(S&F部29から辞書/
検索メモリ17へ転送される、文章の前
後関係状態のリストは−第3表を参照の
こと)を発生する。 辞書/検索メモリ17は、発生されたエ
ンテイテイが文章ワードであるか数字であ
るかを決定し、そして情報を更新する受け
取つたトークンに従つて、S&F部29へ
トークンを転送する前に関連する制御ビツ
ト(疑問−文章の開始−左連結−上段ケー
ス)を“1”にセツトする。 (2c) S&F部29における文字ストリング及
びトークンストレージの詳細な動作 新しい情報を記憶するために、次のステ
ツプが実行される。 ※新しい文字ストリング及びトークンをバ
ツフア中に記憶する。 ※モードを決定する。(挿入/置換) ※若し置換さらば: #ラインストリング・バツフア中の現
在のワードを新しいワードで置き換え
る。 #連鎖状のリスト中の現在のトークン
を新しいトークンで置換し、フオロワア
ドレスを置換されたトークンから新しい
トークンへ挿入する。 #次のトークンポインタ(フオロワア
ドレス)をトークンリスト・ストレージ
からトークンポインタ・レジスタへ転送
する。 ※若し、挿入なら #ラインストリング・バツフア中の現
在のワードの前に新しいワードを挿入す
るか、又はバツフア中のラインストリン
グの終端に新しいワードを挿入する。 #連鎖状リスト中に新しいトークンを
挿入する。連鎖状リスト中の新しいトー
クンのフオロワアドレス及び前のトーク
ンのフオロワアドレスを更新する。 ※編集制御動作を実行する(下記の(2d)
項に記載されたように)。 ※若し現在のラインがオーバフローしたな
らば、リフロー(reflow)の行即ちラ
インへ移行する。(付加的機能) ※カーソルの位置及び長さを更新する。 ※スクリーン上の表示を更新する。 (2d) 編集制御の詳細な動作(第9B図) 編集制御は下記の3つの範疇の情報によ
つて決定される。 (イ) システムの現在のモード(置換/挿入
−ワードモード/スペルモード)。 (ロ) 現在の文章の前後関係(第3表に示さ
れる)。 (ハ) 最後に与えられた命令(ありうる音声
命令は第1表に掲げられており、ありう
る付加的な打ち込み命令は上述の(A)(6)項
に記載されている)。 編集制御を示す第9B図に代表的な範疇
の編集動作のみを示し、すべての編集動作
に関するより詳細なリストは第4表に示し
てある。 以下に述べる項目は、上述の3つの範疇
からの情報のありうる組み合せに対して、
本編集システムにより実行される動作を掲
げたものである。 削除(DELETE):ワードモードにおい
て、編集者がカーソルボツクスで表示され
たワード全体を削除したい場合。スペルモ
ードにおいて、編集者がカーソル位置にあ
る単一の文字のみを削除したい場合。既に
述べたように、浮遊ワードを削除する場
合。 (イ) 若し、削除したワードが最後の区切り
符号であるならば次のワード(若しあれ
ば)は最早や文章の始めではなく、そし
て、下段ケースへ変更される。(“John”
又は“Mary”のように通常大文字で始
まるワードでなければ) (ロ) 若し、削除したワードが文章の最初の
ワードであるならば、次のワードは文章
の新しい始まりになり、大文字化されね
ばならない。 (ハ) 若し削除されたワード又は文字が区切
り符号であれば、残りの項目のスペース
が影響されるかも知れない。例えば、若
し、節「and/or」の中の「/」が削除
されるならば、通常のスペースを有する
2個のワードが残り、「andor」でなく
「and or」として表示されるだろう。 文字逆送(CHARACTER
BACKSPACE):キーボードを有する編
集装置又はワードプロセツサの普通の使用
法において、大文字化はシフトキーを押す
ことにより極めて容易に入力される。然し
乍ら、音声入力の場合、大文字化は通常、
自動的に検出することが出来ない。この問
題は色々と論じられているように、文章の
最初のワードの頭文字を自動的に大文字化
する問題や、大文字の通常の通い方(例え
ば「John」や「USA」に従つてワードの
大文字化が行われない問題や、大文字化の
これ等の不履行を矯正するための大文字化
命令を確立する問題に提言されている。こ
れらの確立された命令は、 (イ) 次の文字を大文字化せよ(Capitalize
next word)。発声された次のワードの
大文字化を行う。例えば、「capital
example(大文字化例)」と発声すると出
力(Example)を発生する。 (ロ) 現在のワードを大文字化せよ
(Capitalizecurrent word)。カーソルで
表示された現在のワード又は文字を大文
字化する。(ワードモード又はスペルモ
ード夫々において) (ハ) 現在のワードを下段ケースへ変更せよ
(Change current word to lower
case)。現在のワード(又はスペルモー
ドにおける現在の文字)を下段ケースへ
変更する。 (ニ) 現在のワードを上段ケースへ変更せよ
(Change current word to upper
case)。現在のワード(スペルモードに
おいては現在の文字)を上段ケースへ変
更する。3個の相次ぐワード「John is
here」についてこの命令を使うと、結果
として、「JoHN IS HERE」を生ずる。 大文字化の不履行の結果又は与えられた
大文字化命令の結果は各ワードのトークン
に影響する。(「最初の大文字」及び「上段
ケース」の2個のビツト中で、−第3図を
参照) 様式化(FORMATTING):「新しいラ
イン」及び「新しいパラグラフ」などの命
令が通常のテキスト処理システムと共通に
使われ、現在のラインが一杯でなくとも新
しいラインへ強制的に移動され、新しいパ
ラグラフがカーソルによつて表示された位
置で開始する。本編集システム内でのこれ
等の命令はまた、次のワードは文章の初め
にあるのか否か、若しそうなら大文字化さ
れるべきか否かを考慮させる付加的な機能
を持つ。 巻き戻し(SCROLLING):他の編集装
置と同様に、文書の始めの部分又は終りの
部分を観察するための命令が与えられる。
加えて、本編集システムは認識に疑問があ
る次のワードへカーソルを迅速に移動する
特別の命令が備えられており、移動したカ
ーソルの位置で、発声者はそのワードを訂
正するか、又は若し正しければそのまま残
す。(勿論、「疑問」である旨の表示は削除
する。)これは誤りを調べるため、文書の
初期のプルーフリード(保証読み)を容易
にする。 モード選択(MODE SELECTION):
多くの編集装置は動作モードを持つてお
り、異なつた動作モードの間で切換えるた
めの命令を有する。ここで記載される編集
装置は特別の可能性、即ちワードモード又
はスペルモードを有することにおいて異な
つている。既に述べたように、ワードモー
ドは、入力装置がすべてワードで構成され
ている場合、音声入力を行うのに適してい
る。スペルモード(又は文字モード)は認
識装置の語彙にないワードを綴りによつて
入力する場合とか、キーボードを使つて入
力する場合に適している。所望のモードを
選択するための命令が与えられており、こ
れは上述したように、他の多くの命令の動
作に影響する。 マイクロフオン制御(MICROPHONE
CONTROL):未だ説明されていなかつた
けれども、時によつて、オペレータの何ら
かの事情によつて、スピーチ認識装置のマ
イクロフオンをオフにしたい場合がある。
これは最も単純にはマイクロフオン自身の
スイツチによつて行うことが出来るが、本
認識システムのように、マイクロフオンを
オン又はオフにするための別個の命令を与
えてもよい。この後者の方法はマイクロフ
オン制御を含んですべての所望の機能を達
成するために、均一な命令インターフエー
スを許容することにより、多くの別個の制
御及びスイツチの必要をなくす。 辞書のパーソナル化(DICTIONARY
PERSONALIZATION):現在のスピー
チ認識システムは最大5000〜20000ワード
の限られた語彙を持つているので、しばし
ば用いるワードがその語彙に含まれていな
い事態に遭遇する。或る認識装置は正規の
語彙に新しいワードを付加することが出来
る(多分、同時に使用頻度の小さいワード
は抹消する)。これを達成するための方法
それ自体は本発明の一部ではなく、スピー
チ認識装置それ自身の一部である。然し乍
ら、本編集システムは、若しスピーチ認識
装置がその語彙の中に新しいワードを加え
る能力を有するなら、所望のワードを辞書
(第1図の17)へ加えるための命令を備
えている。 上述の事項は編集動作の完全な目録では
ない。何故ならば、編集装置の音声入力の
性質に関連しない動作については、ここで
は詳細に述べていないからである。スピー
チ入力に直接関係ない動作は以下の動作を
含む。 −文章の一部分(area)をマークし又は
マークしない。マークした部分を他の場
所へ移動し、コピーする。マークした部
分を削除する。 −表示したワード又は文字の順序を検索す
る。そのような順序の1つを他の順序と
置き換える。 −前方向又は逆方向へ、又は上段から下段
へ文書の内容を巻き戻す。 −挿入モード又は置換モードに選択する。 −存在する文書を訂正し、又は新しい文書
を創作し、文書内容をプリントし、文書
を記憶する。 上記リストの制御動作が実行された時に
のみ、関連する状態に適用して、(C)、(2c)
項で掲げられた3つのステツプが行われる
(即ち補助的なリフロー、カーソルの更新
及び表示装置の更新)。 (2e) 単一の文字の記憶又は挿入のための詳細
な動作(第9C図) 既に述べたように、スペルモードにおい
て、単一の文字はスクリーン上に編集する
文章中に挿入又は置換することが出来る。
単一の文字は、発声された時、スピーチ認
識装置によつて認識され、且つ関連するコ
ード同定標識が発生される。第1図を参照
すると、このコード同定標識はスピーチ認
識部11Aにより線13Aを介して辞書部
17Aへ供給される。辞書部17Aは関連
する文字を表示する単一のバイトを線27
を介して記憶及び様式化部(S&F)29
へ発生する。このモードではトークンは発
生されない。(トークンが各ワードに対し
て発生されるワードモードとは対照的であ
る。) スペルモードにおいて、S&F部29は
また、キーボード37から個々の文字を表
示する単一のバイトを受け取るかもしれな
い。(通常はそうであるように、若しシス
テムが通常のタイプライタのキーを装備し
ているならば) ワードモードからスペルモードへ変化す
ると、カーソルはただ1個の文字幅に調節
され、且つカーソルは、モードが変化した
時、現在のワードであつたワードの最初の
文字に置かれる。その後、カーソルは単一
の文字位置の量で移動する。カーソルレジ
スタ73の内容は第1の領域中の実際のカ
ーソル位置であり、第2領域には“1”が
ある。 単一文字を表示するバイトを受け取つた
後、S&F部29の中で下記のステツプが
取られる。 ※新しいバイトをバツフアに入れる。 ※特別の命令なしでモード(挿入/置換)
を決定する。即ち若しカーソルが文字の
上にあれば置換であり、そして若しカー
ソルがスペースの上にあれば挿入であ
る。 ※若し置換であれば、 #ラインストリング・バツフア中の現
在の文字バイトを新しい文字バイトで置
換する。若し置換される文字がワードの
最初の文字であつたならば、新しい文字
バイトは開始ワードであることを表わす
ようマークされる。 ※若し挿入ならば、 #ラインストリング・バツフア中の現
在の文字バイトの前に新しい文字バイト
を挿入する。(新しい文字の右のライン
部分を1文字分だけ右へシフトする) ※影響されたワードのトークンを再分析す
る。 ※カーソル位置を更新する。(カーソルは
置換及び挿入モードにおいて、1位置だ
け右へ移動する。) ※S&F部29中の更新された新しい情報
をスクリーン31に表示する。 スペルモード終了命令が与えられた時、
カーソルは現在活動している文字を含むワ
ードに留まるが、ワード全体を被う長さで
ある。カーソルの位置及び長さは前に述べ
たように、カーソルレジスタ中に入れられ
る。スペルモードの間で、カーソルがワー
ドの境界を越えて移動した時、トークンポ
インタ・レジスタ中のポインタは、カーソ
ルの移動方向に依存して、次の、又は前の
フオロワアドレスによつて置き換えられる
ことは注意されるべきである。 上掲のステツプ「影響されたワードのト
ークンの再分析」は下記の状態を処置す
る。 −若し付加的な文字が挿入され、又は文字
が削除されたならば、文字カウントを更
新する。 −「文章の条件付終了」ビツトをセツトす
る。(後述する。) −若し新しい文字がj欄でブランクであれ
ば連結を更新する。 #若し位置j+1にブランクでない文
字があるなら、トークンはj+1欄で開
始することが決められる。それは連結タ
イプLRが与えられる。 例:ワード「worth white」中の
「while」の前に若しブランクが挿入さ
れると、その結果は「worth」と
「while」とのための2個のトークンが
生じて、「worth while」と印字される。 #若しトークンがj−1欄で開始する
と、それは連結タイプLRが与えられる。 例:「2」のトークンが連結タイプLO
を持ち、且つ「3」のトークンが連結タ
イプORを持つ場合(文章の前後関係の
ため)、「23カウント」の中の「2」の前
に若しブランクが挿入されると、「2」
及び「3」のトークンは通常のLRタイ
プとして再マークされ、そしてストリン
グは「2 3カウント」となる。 −若しj欄の新しい文字がブランクでなけ
れば、連結を更新する。 #若しj−1即ち前の文字がブランク
であれば、新しいトークンはj欄で始ま
る。 #若しエンテイテイ(例えばワード)
が開始するj−1欄に文字があれば、関
連するトークンは連結タイプLRが与え
られる。 例:連結タイプLOを持つ「(」の後に
若し「)」が挿入されると、連結タイプ
LRを有する1個のトークンで「()」を
生ずる。 #ワードの開始であり、且つアルフア
ベツト又は数字である文字が若しj+1
欄にあるならば、そのワードの古いトー
クンは新しいトークンに“のみ込まれ
る”ので、単一のトークンがj欄で始ま
る。 例:ワード「take」の前に若し「s」
が挿入されると、結果のステーキ即ち
「stake」は単一のワードとして取り扱わ
れる。然し乍ら、若し「s」が「:」の
ような区切り符号の前に挿入されると、
結果の「s:」は2個のトークンを有す
る2個の別個のエンテイテイとして取り
扱われる。 (2f) 第8図の見本文に挿入を行い、且つ編集
するのに必要な動作の簡単な考察 先ず最初は、左上隅にあるカーソルを除
き、スクリーンは何も映つていない。命令
なしで、システムは挿入モード及びワード
モードにある。ラインストリング・ストレ
ージ、トークンリスト・ストレージ、ライ
ンストリング・バツフア及びトークンポイ
ンタ・レジスタは空である。ラインポイン
タ・レジスタ(第7C図)は最初のライン
のためのラインストリング・ストレージ中
の利用可能なスペースのアドレスを含む。
利用可能な最初のトークンの位置のアドレ
スがラインストリング・バツフアの「トー
クンポインタ」中に挿入され、そして「新
しいライン」ビツト及び「新しいパラグラ
フ」ビツトは“1”にセツトされる。ライ
ンストリング・バツフアC11(第7図)
中の最初の利用可能な領域の始めの位置ア
ドレスがカーソルレジスタ中に挿入され、
そして長さ表示“1”が与えられる。トー
クンリスト・ストレージ中の次の位置のア
ドレス(フオロワアドレス)は最初の利用
可能のトークン位置に関連する領域に挿入
される。 最初のワード「this」が発声された時、
文字ストリング及びトークンが辞書部から
発生され、トークンの「文章の開始」ビツ
トをセツトする。(S&F部29からの関
連するフイードバツク情報によつて)文字
ストリングはラインバツフアC11乃至C
14(第7D図)に入れられて、「ワード
開始」として第1のバイトをマークする。
トークンは、フオロワアドレスと共に、ト
ークンバツフア中の利用可能であつたトー
クンリスト・ストレージ中に入れられる。 カーソルの位置は新しいワードの後に位
置にある文字位置C15のアドレスへ変更
され、その長さを“1”にする。表示装置
は更新され、第1のワードが「文章の開
始」とマークされているので、大文字
「T」で最初のワードを表示し、そしてカ
ーソルはワードの直後の位置に現われる。 次のワード「is」を発声すると、その文
字ストリング及びトークンが(「文章の開
始」ビツトをセツトすることなく)辞書/
検索部17の辞書部分から発生される。S
&F部29はラインストリング・バツフア
の位置C15にスペースを自動的に挿入
し、且つ新しい文字ストリングを後続する
位置C21及びC22に自動的に挿入す
る。C21はワードの始めなので、マーク
を入れる。トークンは古いトークンに利用
可能であつたフオロワアドレスのトークン
リスト・ストレージに挿入される。新しい
フオロワアドレスはトークンリスト・スト
レージ中の新しいトークンへ添加される。
カーソルは位置C23をポイントするため
に更新され、そして表示は第2のワード
と、第2のワードの次に1文字の長さのカ
ーソルとを表示するため更新される。 以下に述べる修正動作を除いて、同様な
手続が後続する音声ワードの夫々に行われ
る。 音声の上段ケース命令はワード
「sample」のために、トークンに「上段ケ
ースのセツト」ビツトを発生させて、その
ワードをすべて大文字により表示する。ワ
ード「only」がラインストリング・バツフ
アに入力された時、「(」のトークンは
“右”連結を表示するから、スペースは
「(」の文字バイトの後に自動的に挿入され
ない。文字ストリング「four」が発生され
た時、そのトークンは、スピーチ認識装置
11からの関連する信号のため、「疑問」
ビツトのセツトを持つ。これはワード
「four」をハイライト(枠で囲む)するこ
とになる。ワード「purpose」が発声され
た後、5個のアスタリスクを表示する文字
ストリングがラインストリング・バツフア
に入力されると同時に、文字カウント5を
有する通常のワードのトークンがその中に
記憶される。勿論、スペースは、アスタリ
スクの順序が通常のワードのトークンを持
つているので、先行する「the」の後に挿
入される。ワード「demonstration」の後
の右側括弧の入力は、そのトークン表示が
「左側連結」だからスペースの自動挿入は
起らない。ピリオドがラインストリングへ
入力される時にも同じことがピリオドにも
当て嵌る。 文章及び区切り符号がすべて発声された
後、それ等は表示装置31上に現われ、且
つカーソルはピリオドの後に現われる。カ
ーソルが手操作選択装置39により後退さ
れた時、カーソルは先ずピリオドの下に現
われ、次に右側括弧の下に現われ、そして
次にワード「demonstration」全体がカー
ソルによりアンダラインされる。カーソル
レジスタは文字「d」のアドレスと長さ表
示“13”とを含む。トークンレジスタは、
正しいトークンのポインタ、即ちアンダラ
インされたワードに属するトークンのポイ
ンタを含む。ワード「demonstration」を
ワード「illustration」に置き換えるのに
2つの可能性がある。 第1の方法は置換命令を与え、実行
(EXEC)のボタンを押して、置換動作を
付勢し、それからワード「illustration」
全体を発声する。これは、
「demonstration」の文字ストリング及び
トークン全体を置換するため、辞書部17
からS&F29へ関連する文字ストリング
及びトークンを供給することになる。右側
括弧及びピリオドは1段左へ移動し、そし
てカーソルは右側括弧にシフトする。 第2の方法は新しいワードの綴りを発声
することによつて古いワードと置き換える
ことである。然し乍らこれは、ワード
「illustration」が認識語彙(これは辞書部
に記憶されている)に含まれていない場合
にのみ行われる。命令スペルモードが与え
られるが、置換命令は特には与えられな
い。何故ならば若しカーソルが実際の文字
上にあれば、システムは自動的に置換モー
ドに入るからである。カーソルは従つて、
文字「d」のみにアンダラインを置く。ワ
ード「illustration」は1文字毎に発声さ
れ、新しい各文字(辞書部から供給された
時)が古いワードの文字の1つと置き換え
られ、カーソルは右へ1位置移動する。然
し乍ら、トークンは変更されない。置換操
作の終りで、カーソルは古いワードの
“n”に置かれている。ここで、新しいワ
ードは古いワードに比べて1文字だけ短い
ので、古いワードのこの文字を除去しなけ
ればならない。消去命令が与えられた時、
ただ1個の文字が消去される。右側括弧及
びピリオドは1位置だけ左へ移動し、そし
てカーソルは括弧上に留まる。(これはま
た、括孤がワード開始マークを持つので、
括弧のトークンのポインタはトークンポイ
ンタ・レジスタ中にあることを意味する。)
若し、スペルモード終了命令が与えられれ
ば、システムは、トークンの文字カウンタ
を13から12へ変更することによつて、前の
ワード(それは今では「illustration」で
ある。)のトークンを更新する。 誤つたワード「four」を正しくワード
「for」に置き換えるため、そしてアスタリ
スクのストリングを正しいワード
(purpose」に置き換えるため同じ手段を
使うことが出来る。 第8図に示した例は幾つかのラインを占
めているけれども、編集動作の間でライン
を変更することについては説明しなかつ
た。ラインの変更は、カーソルが1つのラ
インから他のラインへ移動された時、或
は、文章の入力動作の間でラインの終了マ
ージンに到達した時、或は、「新しいライ
ン」命令又は「新しいパラグラフ」命令が
与えられた時に起る。 ラインが変更されるたび毎に、ラインス
トリング・バツフアの現在の内容はライン
ストリング・バツフア71へ移転され、そ
して所望の新しいライン(又は次の空白ラ
イン)のストリングアドレスはラインポイ
ンタ・レジスタ(第7C図)へ入力され、
ラインストリング・バツハア(第7D図)
から新しいラインが取り出され、そして最
初のトークンのポインタはトークンポイン
タ・レジスタ(第7E図)に挿入される。
空のヘツダを有する空白ラインの場合、ト
ークンリスト・バツフア中の次の利用しう
るトークンのアドレスはラインストリン
グ・バツフアのトークンポインタ領域と、
トークンポインタ・レジスタへ挿入され
る。このように、ラインの変更があれば必
ずラインバツフア中の文字ストリングが変
更されるばかりでなく、他のトークンチエ
インも付勢される。 (2g) 文章の終りでの特別の条件 与えられた例においては、文章が条件付
きで終了することは生じなかつた。従つ
て、これを簡単に述べることとする。通
常、ピリオドやコロンは文の終りを定義す
る。(その結果は次のワードを大文字化す
る。)然し乍ら、時折、文が完了する前に、
或る文字がピリオドに続くことがある。1
例として、文章全体が引用符、即ちクオー
テーシヨンマークで与えられている場合
(“He said:Yes.”)の如きものがある。
このような状況は編集システムにより文脈
−分析され、そして右側の引用符が現われ
た後に、ピリオドに最初に割り当てられた
条件付きの「文章の終了」がピリオドを取
り去つて、その代りに引用符を割り当て
る。(夫々対応する制御ビツトに“1”を
セツトすることによつて行う。)これを
「条件付きの文章の終了」と言う。 (D) スピーチ編集装置の付加的な特徴 (1) 他の編集機能 上述の記載においては、本発明に関連する
特徴のみについて詳細に説明した。勿論、編
集システムについての他の多くの機能を本発
明に組み合せることが出来る。そのような機
能は文章のいくつかの部分をコピーしたり、
移動したりすることを含む。(第4表で示し、
(C)(2)項で説明したように) (2) メニユー駆動部 編集システムの他の既知の要素もまた、上
述の編集装置に組み入れることが出来る。1
個又は数個のメニユーを音声命令により、又
は関連するキーを押すことにより呼び出すこ
とが出来る。手操作選択器を使つて、所望の
動作を同定するメニユー位置へカーソルを動
かすことによつて、他の命令又は条件を選択
することが出来る。(実行キー、即ちEXEC
キーを押すことによつて実行する。)このよ
うなメニユー駆動動作の細部の説明は不必要
である。然し、メニユー(及び他の既知の編
集機能)で使われた時、本発明のすべての利
点、即ちワード全体のベースで、編集するこ
と、文脈を評価すること、個別のエンテイテ
イのためにトークンを使うことが出来るのは
注意する必要がある。 (3) 新しいワードを辞書部中に入力すること 既に述べたように、辞書17は一定数のワ
ード(及び区切り符号及び数字)、即ちスピ
ーチ認識装置で同定しうるものを記憶してい
る。辞書部にないワードをスピーチ認識装置
は知らないから、それ等のワードは同定しえ
ない。それ等のワードが発声された時、それ
等はダミー文字ストリングを挿入させて、同
定されたワードを綴り読みすることによつて
容易に置換することが出来る。スピーチ認識
装置は付加的ワードを認識するよう教育する
ことが出来る。辞書部にないワードがひとた
び同定されると、関連するコード同定標識は
辞書部に割り当てられる。各新しいワードに
関連する文字ストリング及びトークンが発生
され、そしていちどきに行われる更新動作に
おいてそれらは辞書部17へ入力される。全
スクリーン編集装置はその他の変更を必要と
しない。 本明細書で開示した装置に対して説明した変
更、修正に加えて、幾多の変更、修正はこの道の
専門家には自明であるから、本発明は説明した実
施例に限定されるものではない。 例えば、文字ストリングは関連するトークンと
並列であるよう示されているが、与えられたスト
リングに続く、関連するトークン部分を直列に持
つ2つの情報区分(2つの区分は後に分離され
る)を与えることもまた本発明の範囲にある。 以下の付表は種々のトークン関連機能を遂行す
るプログラムリストのサンプルを含んでいる。
【表】
【表】
〔発明の効果〕
以上説明してきたように、本発明はワードをエ
ンテイテイとして処理し、トークンを使用するこ
とにより、音声による文章の入力を容易にし、そ
れを正しい文書様式に変換して直ちに表示した
り、プリントすることを極めて容易にするばかり
でなく、ワード間のスペースとか、区切り符号を
自動的に当て嵌めることが出来、更に、音声によ
る入力、キーボード等による入力との両立を達成
し、打鍵操作を軽減することが出来、従来のワー
ドプロセツサに比べ、顕著な作用効果を奏する。
【図面の簡単な説明】
第1図は本発明に従つたスピーチ入力編集シス
テムをブロツク線図で説明する図、第2A図、第
2B図、第2C図および第2D図はトークンで表
示される、文章編集動作中で生ずる連結の種々の
タイプを示す模式図、第3図は文字カウント、連
結表示及び他の制御情報を表示するトークンのオ
フマツトを示す図、第4図はワードの文字ストリ
ングを説明する図、第5図は音声形式でも入力し
うる、命令を入力するキーボードの制御部を示す
図(図中の英語表示はキーボードの外観の一部、
すなわち模様であり、日本語への翻訳は不可能で
ある)、第6図はカーソル位置及び他の基本的な
命令を入力するための手操作選択装置のキー配列
を示す図、第7図は第7A図〜第7F図の組み合
わせ図、第7A図〜第7F図は第1図の記憶及び
様式化部の動作ストレージの主要部を示す線図、
第8図はスピーチ編集装置の幾つかの機能を説明
するための見本の文章を表示する表示スクリーン
の図(英語仕様の見本のため日本語への翻訳は不
可能である)、第9図は第9A図〜第9C図の組
み合わせ図、第9A図、第9C図は本発明のスピ
ーチ入力文章編集装置で遂行される様式化及び編
集動作のブロツク線図である。 11……スピーチ認識装置、17……辞書/検
索メモリ装置、29……記憶及び様式化部(S&
F部)、31……表示装置、37……キーボード、
39……手操作選択装置。

Claims (1)

  1. 【特許請求の範囲】 1 文章を構成する文章ワードを表わすスピーチ
    セグメント及びピリオド、カンマ等の区切り符号
    を指示するワードを表わすスピーチセグメントを
    連続的に受け取つて認識するとともに、上記スピ
    ーチセグメントが上記文章ワードを表わすのか上
    記区切り符号ワードを表わすのかを判別し、上記
    文章ワードが認識されたときには当該文章ワード
    に対応するコード識別標識を生成し、上記区切り
    符号ワードが認識されたときには当該区切り符号
    に対応するコード識別標識を生成するスピーチ認
    識装置を有し、このスピーチ認識装置からの情報
    を編集するためのシステムにおいて、 上記コード同定標識に応答して、関連する文字
    ストリングと、文字カウント及び連結標識を含む
    関連した制御情報を供給する辞書/検索装置と、 上記辞書/検索装置により供給された文字スト
    リング及び制御情報の流れに応答して、正しいス
    ペース及び大文字化を含む様式化されたデータを
    発生する編集装置と、 上記様式化されたデータに応答して、標準的な
    文章様式を持つた音声情報を表示するための表示
    装置とから成る音声情報の編集装置。
JP60155298A 1984-10-30 1985-07-16 音声情報の編集装置 Granted JPS61107430A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US666212 1984-10-30
US06/666,212 US4914704A (en) 1984-10-30 1984-10-30 Text editor for speech input

Publications (2)

Publication Number Publication Date
JPS61107430A JPS61107430A (ja) 1986-05-26
JPS6355085B2 true JPS6355085B2 (ja) 1988-11-01

Family

ID=24673276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60155298A Granted JPS61107430A (ja) 1984-10-30 1985-07-16 音声情報の編集装置

Country Status (5)

Country Link
US (1) US4914704A (ja)
EP (1) EP0180047B1 (ja)
JP (1) JPS61107430A (ja)
CA (1) CA1222321A (ja)
DE (1) DE3585384D1 (ja)

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5101375A (en) * 1989-03-31 1992-03-31 Kurzweil Applied Intelligence, Inc. Method and apparatus for providing binding and capitalization in structured report generation
JPH03163623A (ja) * 1989-06-23 1991-07-15 Articulate Syst Inc 音声制御コンピュータ・インターフェース
US5196943A (en) * 1989-08-25 1993-03-23 Copia International, Ltd. Facsimile information distribution apparatus
WO1991011776A2 (en) * 1990-01-12 1991-08-08 The Trustees Of Boston University Hierarchical pattern recognition system with variable selection weights
US5479498A (en) * 1990-12-11 1995-12-26 Octel Communications Corporation Digital line card having universal port for upgrading electronic messaging system
JP3414735B2 (ja) * 1992-03-06 2003-06-09 ドラゴン システムズ インコーポレイテッド 複合ワードを有する言語のための音声認識装置
CA2081188A1 (en) * 1992-10-22 1994-04-23 Hanavi M. Hirsh Apparatus and method for continuous speech recognition
US8073695B1 (en) * 1992-12-09 2011-12-06 Adrea, LLC Electronic book with voice emulation features
SE9400768L (sv) * 1994-03-08 1995-07-17 Hassan Toosi Talstyrd inmatningsanordning med logiskt standardgränssnitt
WO1995025326A1 (en) * 1994-03-17 1995-09-21 Voice Powered Technology International, Inc. Voice/pointer operated system
JPH08328590A (ja) * 1995-05-29 1996-12-13 Sanyo Electric Co Ltd 音声合成装置
US5778402A (en) * 1995-06-07 1998-07-07 Microsoft Corporation Method and system for auto-formatting a document using an event-based rule engine to format a document as the user types
JPH0981364A (ja) * 1995-09-08 1997-03-28 Nippon Telegr & Teleph Corp <Ntt> マルチモーダル情報入力方法及び装置
US5855000A (en) * 1995-09-08 1998-12-29 Carnegie Mellon University Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input
US5852801A (en) * 1995-10-04 1998-12-22 Apple Computer, Inc. Method and apparatus for automatically invoking a new word module for unrecognized user input
US6064959A (en) * 1997-03-28 2000-05-16 Dragon Systems, Inc. Error correction in speech recognition
US6601027B1 (en) 1995-11-13 2003-07-29 Scansoft, Inc. Position manipulation in speech recognition
US5794189A (en) * 1995-11-13 1998-08-11 Dragon Systems, Inc. Continuous speech recognition
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
US5799279A (en) * 1995-11-13 1998-08-25 Dragon Systems, Inc. Continuous speech recognition of text and commands
US6961700B2 (en) * 1996-09-24 2005-11-01 Allvoice Computing Plc Method and apparatus for processing the output of a speech recognition engine
US5950160A (en) * 1996-10-31 1999-09-07 Microsoft Corporation Method and system for displaying a variable number of alternative words during speech recognition
US5899976A (en) * 1996-10-31 1999-05-04 Microsoft Corporation Method and system for buffering recognized words during speech recognition
US5884258A (en) * 1996-10-31 1999-03-16 Microsoft Corporation Method and system for editing phrases during continuous speech recognition
US5829000A (en) * 1996-10-31 1998-10-27 Microsoft Corporation Method and system for correcting misrecognized spoken words or phrases
US5909667A (en) * 1997-03-05 1999-06-01 International Business Machines Corporation Method and apparatus for fast voice selection of error words in dictated text
US5970449A (en) * 1997-04-03 1999-10-19 Microsoft Corporation Text normalization using a context-free grammar
US6182177B1 (en) * 1997-06-13 2001-01-30 Intel Corporation Method and apparatus for maintaining one or more queues of elements such as commands using one or more token queues
JP4279909B2 (ja) * 1997-08-08 2009-06-17 ドーサ アドバンスズ エルエルシー 音声認識装置における認識対象表示方式
US6629074B1 (en) 1997-08-14 2003-09-30 International Business Machines Corporation Resource utilization indication and commit mechanism in a data processing system and method therefor
US5960384A (en) * 1997-09-03 1999-09-28 Brash; Douglas E. Method and device for parsing natural language sentences and other sequential symbolic expressions
US5995918A (en) * 1997-09-17 1999-11-30 Unisys Corporation System and method for creating a language grammar using a spreadsheet or table interface
US5970460A (en) * 1997-12-05 1999-10-19 Lernout & Hauspie Speech Products N.V. Speech recognition and editing system
JP2000163418A (ja) * 1997-12-26 2000-06-16 Canon Inc 自然言語処理装置及びその方法、及びそのプログラムを格納した記憶媒体
WO1999045475A2 (en) * 1998-03-03 1999-09-10 Koninklijke Philips Electronics N.V. Text processing system including a speech recognition device and text change means for changing a text-block data
DE19809563A1 (de) * 1998-03-05 1999-09-09 Siemens Ag Medizinischer Arbeitsplatz
US6081772A (en) * 1998-03-26 2000-06-27 International Business Machines Corporation Proofreading aid based on closed-class vocabulary
US6163768A (en) 1998-06-15 2000-12-19 Dragon Systems, Inc. Non-interactive enrollment in speech recognition
US6067514A (en) * 1998-06-23 2000-05-23 International Business Machines Corporation Method for automatically punctuating a speech utterance in a continuous speech recognition system
US6195635B1 (en) 1998-08-13 2001-02-27 Dragon Systems, Inc. User-cued speech recognition
US6490563B2 (en) 1998-08-17 2002-12-03 Microsoft Corporation Proofreading with text to speech feedback
FR2783334B1 (fr) * 1998-09-11 2001-07-27 Denis Moura Dispositif d'enregistrement de messages vocaux pour logiciels de dictee vocale
JP3543931B2 (ja) * 1998-12-17 2004-07-21 日本電気株式会社 音声認識による文字編集手段を有する移動通信端末装置
US6314397B1 (en) * 1999-04-13 2001-11-06 International Business Machines Corp. Method and apparatus for propagating corrections in speech recognition software
US7181399B1 (en) * 1999-05-19 2007-02-20 At&T Corp. Recognizing the numeric language in natural spoken dialogue
US6611802B2 (en) * 1999-06-11 2003-08-26 International Business Machines Corporation Method and system for proofreading and correcting dictated text
EP1509902A4 (en) * 1999-07-28 2005-08-17 Custom Speech Usa Inc SYSTEM AND METHOD FOR IMPROVING THE PRECISION OF A VOICE RECOGNITION PROGRAM
JP3232289B2 (ja) * 1999-08-30 2001-11-26 インターナショナル・ビジネス・マシーンズ・コーポレーション 記号挿入装置およびその方法
JP3476008B2 (ja) * 1999-09-10 2003-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声情報の登録方法、認識文字列の特定方法、音声認識装置、音声情報の登録のためのソフトウエア・プロダクトを格納した記憶媒体、及び認識文字列の特定のためのソフトウエア・プロダクトを格納した記憶媒体
JP3476007B2 (ja) * 1999-09-10 2003-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
DE60037870T2 (de) * 1999-09-29 2009-01-22 Koninklijke Philips Electronics N.V. Buchstabiermodus in einem spracherkenner
US6434547B1 (en) 1999-10-28 2002-08-13 Qenm.Com Data capture and verification system
AU1238601A (en) * 1999-10-28 2001-05-08 Qenm.Com, Incorporated Proofreading system and method
US20030182113A1 (en) * 1999-11-22 2003-09-25 Xuedong Huang Distributed speech recognition for mobile communication devices
US6697777B1 (en) * 2000-06-28 2004-02-24 Microsoft Corporation Speech recognition user interface
GB2365188B (en) * 2000-07-20 2004-10-20 Canon Kk Method for entering characters
WO2002021510A1 (en) * 2000-09-08 2002-03-14 Koninklijke Philips Electronics N.V. Speech recognition method with a replace command
US6963840B2 (en) * 2001-01-12 2005-11-08 International Business Machines Corporation Method for incorporating multiple cursors in a speech recognition system
US6847349B2 (en) * 2001-11-21 2005-01-25 Tektronix, Inc. Serial data cursor
US20030101054A1 (en) * 2001-11-27 2003-05-29 Ncc, Llc Integrated system and method for electronic speech recognition and transcription
US8498871B2 (en) 2001-11-27 2013-07-30 Advanced Voice Recognition Systems, Inc. Dynamic speech recognition and transcription among users having heterogeneous protocols
US6910911B2 (en) 2002-06-27 2005-06-28 Vocollect, Inc. Break-away electrical connector
US7260534B2 (en) * 2002-07-16 2007-08-21 International Business Machines Corporation Graphical user interface for determining speech recognition accuracy
US7412392B1 (en) 2003-04-14 2008-08-12 Sprint Communications Company L.P. Conference multi-tasking system and method
EP1743325A4 (en) * 2004-03-25 2008-05-14 Ashwin Rao SYSTEM AND METHOD FOR CONVERTING TEXT WORDS BY CONSTRAINED DICTATION IN A SPEECHED SOUNDING MODE
US20050216256A1 (en) * 2004-03-29 2005-09-29 Mitra Imaging Inc. Configurable formatting system and method
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070080930A1 (en) * 2005-10-11 2007-04-12 Logan James R Terminal device for voice-directed work and information exchange
WO2007052281A1 (en) * 2005-10-31 2007-05-10 Hewlett-Packard Development Company, L.P. Method and system for selection of text for editing
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US9830912B2 (en) 2006-11-30 2017-11-28 Ashwin P Rao Speak and touch auto correction interface
US8059806B2 (en) * 2006-12-18 2011-11-15 Motorola Mobility, Inc. Method and system for managing a communication session
US8631005B2 (en) 2006-12-28 2014-01-14 Ebay Inc. Header-token driven automatic text segmentation
KR20090020265A (ko) * 2007-08-23 2009-02-26 삼성전자주식회사 휴대 단말기 및 그 메시지 작성 방법
US20090148073A1 (en) * 2007-12-07 2009-06-11 International Business Machines Corporation Allowing users to automatically change typographical letter case using application independent functionality
USD626949S1 (en) 2008-02-20 2010-11-09 Vocollect Healthcare Systems, Inc. Body-worn mobile device
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US9081590B2 (en) * 2008-06-24 2015-07-14 Microsoft Technology Licensing, Llc Multimodal input using scratchpad graphical user interface to edit speech text input with keyboard input
ATE547785T1 (de) * 2008-07-03 2012-03-15 Mobiter Dicta Oy Verfahren und einrichtung zum umsetzen von sprache
US9460708B2 (en) 2008-09-19 2016-10-04 Microsoft Technology Licensing, Llc Automated data cleanup by substitution of words of the same pronunciation and different spelling in speech recognition
US9922640B2 (en) 2008-10-17 2018-03-20 Ashwin P Rao System and method for multimodal utterance detection
US8364487B2 (en) * 2008-10-21 2013-01-29 Microsoft Corporation Speech recognition system with display information
US8386261B2 (en) 2008-11-14 2013-02-26 Vocollect Healthcare Systems, Inc. Training/coaching system for a voice-enabled work environment
US8972269B2 (en) * 2008-12-01 2015-03-03 Adobe Systems Incorporated Methods and systems for interfaces allowing limited edits to transcripts
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
JP5508953B2 (ja) * 2010-06-28 2014-06-04 株式会社日立ソリューションズ 文書処理装置及びプログラム
US8659397B2 (en) 2010-07-22 2014-02-25 Vocollect, Inc. Method and system for correctly identifying specific RFID tags
USD643400S1 (en) 2010-08-19 2011-08-16 Vocollect Healthcare Systems, Inc. Body-worn mobile device
USD643013S1 (en) 2010-08-20 2011-08-09 Vocollect Healthcare Systems, Inc. Body-worn mobile device
US9575946B2 (en) 2011-05-23 2017-02-21 Nuance Communications, Inc. Text browsing, editing and correction methods for automotive applications
US9471772B2 (en) 2011-06-01 2016-10-18 Paypal, Inc. Password check by decomposing password
US9055509B2 (en) 2011-12-21 2015-06-09 Nuance Communications, Inc. Situation-aware message presentation for automotive messaging
US8903714B2 (en) 2011-12-21 2014-12-02 Nuance Communications, Inc. Concept search and semantic annotation for mobile messaging
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
JP5958326B2 (ja) 2012-12-21 2016-07-27 カシオ計算機株式会社 辞書検索装置、辞書検索方法、辞書検索プログラム、辞書検索システム、サーバ装置、端末装置
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
EP3062237A4 (en) * 2013-10-24 2017-06-28 Sony Corporation Information processing device, information processing method, and program
US9460067B2 (en) * 2013-10-30 2016-10-04 Lenovo (Singapore) Pte. Ltd. Automatic sentence punctuation
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
CN105869632A (zh) * 2015-01-22 2016-08-17 北京三星通信技术研究有限公司 基于语音识别的文本修订方法和装置
JP2016181018A (ja) * 2015-03-23 2016-10-13 ソニー株式会社 情報処理システムおよび情報処理方法
US9678954B1 (en) 2015-10-29 2017-06-13 Google Inc. Techniques for providing lexicon data for translation of a single word speech input
KR102190856B1 (ko) * 2016-03-14 2020-12-14 애플 인크. 크리덴셜을 제공하는 음성 입력의 식별
DK201670539A1 (en) * 2016-03-14 2017-10-02 Apple Inc Dictation that allows editing
US10446143B2 (en) * 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
CN106484134A (zh) * 2016-09-20 2017-03-08 深圳Tcl数字技术有限公司 基于安卓系统的语音输入标点符号的方法及装置
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
KR20200072026A (ko) * 2018-12-12 2020-06-22 현대자동차주식회사 음성 인식 처리 장치 및 방법
KR20210080788A (ko) * 2019-12-23 2021-07-01 삼성전자주식회사 전자장치 및 그 제어방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS557758A (en) * 1978-07-04 1980-01-19 Tokyo Shibaura Electric Co Sound input and voice process device
JPS56124947A (en) * 1980-03-05 1981-09-30 Yokogawa Hokushin Electric Corp Word processor
JPS57189241A (en) * 1981-05-15 1982-11-20 Nippon Telegr & Teleph Corp <Ntt> Input system of foreign language text
JPS57191782A (en) * 1981-05-22 1982-11-25 Hitachi Ltd Word processor

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB208282A (en) * 1922-10-06 1923-12-20 Leslie John Hancock Improvements in or relating to electric furnaces
US3647978A (en) * 1969-04-30 1972-03-07 Int Standard Electric Corp Speech recognition apparatus
GB1479584A (en) * 1973-07-14 1977-07-13 Solartron Electronic Group Data terminals and data processing apparatus incorporating such terminals
US4107460A (en) * 1976-12-06 1978-08-15 Threshold Technology, Inc. Apparatus for recognizing words from among continuous speech
JPS56114041A (en) * 1980-02-12 1981-09-08 Toshiba Corp Producing device of voice input document
CA1169969A (en) * 1980-08-20 1984-06-26 Gregor N. Neff Dictation system and method
US4355302A (en) * 1980-09-12 1982-10-19 Bell Telephone Laboratories, Incorporated Spelled word recognizer
US4435617A (en) * 1981-08-13 1984-03-06 Griggs David T Speech-controlled phonetic typewriter or display device using two-tier approach
JPS593629A (ja) * 1982-06-30 1984-01-10 Fujitsu Ltd 音声入力文書作成装置
US4627001A (en) * 1982-11-03 1986-12-02 Wang Laboratories, Inc. Editing voice data
JPS59121098A (ja) * 1982-12-28 1984-07-12 株式会社東芝 連続音声認識装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS557758A (en) * 1978-07-04 1980-01-19 Tokyo Shibaura Electric Co Sound input and voice process device
JPS56124947A (en) * 1980-03-05 1981-09-30 Yokogawa Hokushin Electric Corp Word processor
JPS57189241A (en) * 1981-05-15 1982-11-20 Nippon Telegr & Teleph Corp <Ntt> Input system of foreign language text
JPS57191782A (en) * 1981-05-22 1982-11-25 Hitachi Ltd Word processor

Also Published As

Publication number Publication date
CA1222321A (en) 1987-05-26
DE3585384D1 (de) 1992-03-26
EP0180047B1 (en) 1992-02-12
US4914704A (en) 1990-04-03
EP0180047A2 (en) 1986-05-07
JPS61107430A (ja) 1986-05-26
EP0180047A3 (en) 1987-12-02

Similar Documents

Publication Publication Date Title
JPS6355085B2 (ja)
US4566065A (en) Computer aided stenographic system
US4456973A (en) Automatic text grade level analyzer for a text processing system
KR19990078364A (ko) 문서처리장치 및 그의 방법
JPH0142416B2 (ja)
JP4050745B2 (ja) 文章入力システム
JPH10143503A (ja) 音声ワードプロセッサ
JP3069532B2 (ja) かな漢字変換方法およびその装置並びにかな漢字変換方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPS62154022A (ja) 音声タイプライタ
JP3073226B2 (ja) 文書処理装置
JPH0944476A (ja) 中国語文書処理装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPS60251460A (ja) 文字列処理装置
JPH0562008A (ja) 文字認識方法
JPS60245075A (ja) 自動ルビ表示方式
KR880000990B1 (ko) 한글의 모아쓰기 자동처리방법
JPS6029823A (ja) 適応型記号列変換方式
JPS63115263A (ja) 日本語文章校正装置
JPH07111716B2 (ja) 電訳機
JPH0385670A (ja) 二段階表示方式文書処理装置
JPH0731679B2 (ja) 文字処理装置
JPS6188330A (ja) 音声タイプライタの編集処理方式
JPH06119323A (ja) 文書作成装置
JPS5856132A (ja) タイプ入力装置
JPH0122944B2 (ja)