JP7109498B2

JP7109498B2 - 音声入力装置

Info

Publication number: JP7109498B2
Application number: JP2020070652A
Authority: JP
Inventors: 励至鈴木
Original assignee: 励至鈴木
Priority date: 2020-04-09
Filing date: 2020-04-09
Publication date: 2022-07-29
Anticipated expiration: 2040-04-09
Also published as: JP2021168020A

Description

本発明は音声入力装置に関し、特にコンピュータ、スマートフォン及び腕時計サイズの携帯端末等の様々なデバイスによって実施可能な音声入力装置に関する。

コンピュータ、スマートフォン及び腕時計サイズの携帯端末等の情報機器デバイスでは、文字情報を入力する為の手法として、音声入力が採用されている。
かかる音声入力では、人間の声などをコンピュータに認識させて、これを文字列に変換する音声認識機能が利用されている。
特に近年では、この音声認識機能の精度が向上し、誤認識の確率も大幅に低減している。

しかしながら、音声で入力された言語をそのまま文書化しようとすると、文節の区切りに例えば句読点を挿入しなければならない。
そこで音声認識された結果をひとまずディスプレイ等に表示し、これを見ながらキーボードの操作により文節の区切りに適当に句読点を挿入し文書を作成することも考えられるが、これでは文書化するまでに多大な手間と時間がかかり実用化する上で好ましくない。
そこで従前においては、当該句点や読点などの入力について、以下の技術が提案されている。

例えば特許文献１（特公平６－９３２２１号公報）では、音声によって文章を入力する場合に、読点に対して「テン」、句点に対して「マル」と発声して入力する方法は、言葉の自然な流れを阻害し、口述によって文章を創造する場合には思考の流れをも阻害しかねないことから、発声の間、声調、前後の構文・意味などの情報を利用して、自動的に句読点を入力する方式を提案している。
具体的には、この文献で提案している音声入力装置は、入力音声を認識する手段と、認識された音声が表す文字列を複数の形態素に分割する手段と、該複数の形態素の属性を利用して、文章の末尾に位置する形態素（文末形態素）を検出する手段と、検出された文末形態素の後に句点を挿入する手段とを備えて構成されている。

また特許文献２（特開２０００－４７６８８号公報）では、自然な流れの口述によっても自動的に句読点を挿入することができる音声入力方法、および音声入力方法の実施プログラムを記録した記録媒体として、入力された音声に基づいて認識された文字列から句読点付加候補の文字列を識別するとともに、句読点付加予定位置に対応する音声入力のあとに所定時間を超える音声入力の空白時間があるか否かを識別し、句読点の一つを自動的に付加する音声入力方法を提案している。

更に特許文献３（特開２０１３－１６１３８号公報）では、表示部と入力部とを大きくして情報入力の操作性を良くして情報入力を容易にした携帯電話機の表示入力方法として、携帯電話機が、表示部と、この表示部の表示面上に配置されて操作者による接触があるとその接触位置を出力するタッチパネルとを含む表示一体型タッチパネル装置が設けられている筺体とを有し、かな入力モードの際、前記表示一体型タッチパネル装置に、前記操作者の指の大きさに適応した大きさで「あ、い、う、え、お、か、き、く、け、こ、さ、し、す、せ、そ、た、ち、つ、て、と、な、に、ぬ、ね、の、は、ひ、ふ、へ、ほ、ま、み、む、め、も、や、ゆ、よ、ら、り、る、れ、ろ、わ、を、ん」の各ひらがな文字キーと、濁点キーと、半濁点キーと、読点キーと、句点キーとが全て表示され、当該キーを用いて文字が入力される携帯電話機の表示入力方法が提案されている。

特公平６－９３２２１号公報特開２０００－４７６８８号公報特開２０１３－１６１３８号公報

上記の通り、従前においても音声入力時における句点や読点の入力について種々検討されている。
しかしながら、前記特許文献１で提案されている音声入力装置は、認識された音声が表す文字列を複数の形態素に分割し、その属性を利用して、文章の末尾に位置する形態素（文末形態素）を検出し、その後に句点を挿入することから、句点の挿入処理に時間を要し、迅速な音声入力が困難であった。

また前記特許文献２で提案されている音声入力方法は、句読点付加予定位置に対応する音声入力のあとに所定時間を超える音声入力の空白時間があるか否かを識別して、句読点の一つを自動的に付加するものとなっていたことから、所定時間の空白時間が必要であり、やはり迅速な音声入力が困難であった。

更に前記特許文献３で提案している携帯電話機の表示入力方法では、かな入力モードの際に、表示一体型タッチパネル装置に、前記操作者の指の大きさに適応した大きさで各ひらがな文字キーと、濁点キーと、半濁点キーと、読点キーと、句点キーとが全て表示され、当該キーを用いて文字を入力することが開示されているが、音声入力を行うものではない。

そこで本発明は音声入力に際して、特に各種デバイスで実施可能であって、音声入力の速度及び正確性を向上させた音声入力機能を有する装置を提供することを課題とする。

本発明は、公知技術である「音声入力のテキスト化」に関し、長文・一文節のみなどの必要状況に応じて「音声入力のオン・オフ」を断続できること、誤認識された物や同音異義語に誤変換などが生じた際に訂正・再変換が可能であり、主文だけを音声入力しながら、モニター画面を触れることで句読点・カッコ付け・改行などを、画面を区分わけした領域の画面タッチで音声入力と併用で時間のロスなく入力することができ、更にテキストの一部削除・移動も可能とすることを実現するものであり、これを以ってキーボードの有無に関わらず、音声入力において、正確かつ入力速度の最速化を実現することを目的とする。

本発明では前記課題を解決する為に、音声を認識してこれを文字情報に変換する音声入力装置であって、入力した音声を認識する音声認識部と、当該音声認識部で認識した音声を文字列に変換する文字変換部と、当該文字変換部で変換した文字列を表示する文字列表示部と、当該文字列表示部に、句点、読点、括弧及び関数の少なくとも何れからなる図形文字、及び／又は制御文字を表示させる補助入力表示部と、当該補助入力表示部に表示された図形文字及び／又は制御文字の選択により、前記文字変換部で変換した文字列に挿入する記号挿入部とからなる音声入力装置を提供する。

かかる本発明の音声入力装置は、更に前記文字列表示部に表示された文字列の範囲を指定する範囲指定部と、当該範囲指定部で指定した範囲の文字列を再変換する再変換部を備えて構成することもできる。

上記本発明に係る音声入力装置は、一般的にキーボードやマウスなどの入力機器が用いられるパーソナルコンピュータ（以下「コンピュータ」とする）や、キーボードやマウスなどの入力機器を伴わない、タブレット型コンピュータ、スマートフォン又は携帯翻訳機などの携帯型機器（以下「携帯端末」とする）、或いは携帯性を最優先して一層小型化した腕時計サイズの携帯端末（以下「スマートウォッチ」とする）、において具体化することができる。
但しこれらの機器は、入力装置などの付随機器や画面のサイズにより操作法が一部異なる状況が生じる。

尚、タブレット端末やスマートフォンなど、サイズや価格帯によってキーボードやマウスの性質・機能が付与される物とされない物があるため、本明細書内での説明においては、キーボード・マウス機能の有無で、どちらの操作法により近い実施形態になるかを判断している。
また本発明の音声入力装置において、前記補助入力表示部は、文章の最初に入力される文字及び記号を含む認識前画面と、文章の最初に入力される文字及び記号を除いた認識中画面とを選択表示可能であり、音声の認識と同時に、認識前画面を認識中画面に変化させる画面変更手段を備えることができる。また更に入力した文字列を編集または修正する編集修正部を備えており、当該編集修正部は、入力された文字の指定範囲に対して、音声入力によって他の文字を挿入することができる。そして更に、範囲指定した文字列を音声出力する音声出力部と、表示装置に表示されている任意の領域を拡大表示する拡大表示部とを備えることができる。

本発明の音声入力装置によれば、音声入力に際して、特に各種デバイスで実施可能であって、音声入力の速度及び正確性を向上させた音声入力機能を有する装置とすることができる。

コンピュータの操作画面（認識前画面）コンピュータの操作画面（認識中画面）音声入力設定画面への移行アイコンコンピュータの操作画面（記号等表示設定画面）多機能マウス概略図コンピュータの操作画面（多機能マウス設定画面）コンピュータの操作画面（編集・修正画面）音声入力フローチャート表計算ソフト入力時の概略図多機能マウスによるテキスト入力時の概略図文書入力ソフト使用時の概略図コンピュータの操作画面（コンピュータプログラム入力設定画面）足踏みタッチパッドの概略図携帯翻訳機の外観説明及び操作画面（初期画面）携帯翻訳機の操作画面（認識前画面）携帯翻訳機の操作画面（記号等表示設定画面１）携帯翻訳機の操作画面（記号等表示設定画面２）携帯翻訳機の操作画面（記号等表示設定画面３）携帯翻訳機の操作画面（認識中画面）携帯翻訳機の操作画面（編集・修正画面）携帯翻訳機の操作画面（言い直し・再変換手順）携帯翻訳機の操作画面（挿入手順）携帯翻訳機の操作画面（移動・削除手順）携帯翻訳機の操作画面（認識前句読点への移行手順）英語及び中国語での句読点説明（認識前画面、認識中画面、編集・修正画面）携帯翻訳機の操作画面（句読点タッチ操作省力手法）企業Ｗｅｂ「お問い合わせページ」への入力例携帯翻訳機の操作画面（特殊書体入力１）携帯翻訳機の操作画面（特殊書体入力２）携帯翻訳機の操作画面（特殊書体入力３）スマートウォッチの操作画面（認識前画面、認識中画面、編集・修正画面）スマートウォッチの操作画面（記号等表示設定画面）スマートウォッチの操作画面（ＳＮＳ及び電話番号入力）スマートウォッチの操作画面(インターネット検索) スマートウォッチの操作画面(編集・修正画面での内容確認) スマートウォッチにてＷｅｂ内の目的ページに到達した概略図スマートウォッチの操作画面（ルーペモード）スマートウォッチの操作画面（ＯＣＲ読み上げ機能及び位置設定）

以下、本発明に係る音声入力装置を具体的に説明する。
本明細書における括弧〔〕内の数字は、本明細書における段落番号を示している。
特に本実施形態では、コンピュータ、携帯端末、スマートウォッチにおいて具体化した音声入力装置について説明する。
但しこれらの機器は、入力装置などの付随機器や画面のサイズにより操作法が一部異なる状況が生じる。
そこで以下では、同一機能については併用して説明し、それぞれの機器で異なる部分は「コンピュータについては」「携帯端末については」「スマートウォッチについては」と但し書きで分けて説明する。

本明細書において、「コンピュータ」とは、外部入力機器としてのキーボードやマウスを用いる装置であって、マウス機能の付随するタブレット端末を含む。
コンピュータにおいては主に主文入力時間の最短化を主目的とするため、例えば、右手でマウスを操作して位置指定、左手でタッチパネルとして構成された画面をタッチすることで句読点入力や書体を整え、主文は音声入力する３つの処理を同時進行する装置とすることができ、更に音声入力のオン・オフを断続的に行える機能を備えることも音声入力処理の最速化の観点で望ましい。

また「携帯端末」は、スマートフォンサイズの機器であって、本実施の形態では携帯翻訳機を例に説明する。
当該携帯端末は、キーボードなどの外部入力機器が無くても正確に入力できることを主目的とし、これによりインターネットなどで高精度な検索が出来る。
また翻訳機では正確な母国語を翻訳用ＡＩ（即ち「人工知能」以下同じ）に送信できるため、結果的に得られる翻訳精度が向上する。

そして「スマートウォッチ」は、携帯性と簡易入力を目的とした機器であり、優れた携帯性からレスポンスを重視する機器が該当する。
携帯端末同様にキーボード等の外部入力機器が無くても正確に入力できることを主目的とし、簡易なＳＮＳ（即ち、「ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇＳｅｒｖｉｃｅ」以下同じ）の発信機として、又、インターネット内の正確に検索した情報を小画面の文字表示に依存せず、音声で操作者に伝える機能を本実施形態では更に付与する。

先ず、本実施の形態において、音声入力それ自体は「音声入力の認識ボタン」（以下、「音声入力ボタン」とする）を押すことでコンピュータ、携帯端末、スマートウォッチにおける音声入力機能は起動し、音声受付状態となる。
そして入力者は話しかけることにより音声入力が開始される。

かかる開始処理において、コンピュータについては本体やキーボードにボタンを押している間だけ、音声入力がテキスト化されるように設定することが廉価な実用法である。
但し、操作時間を短縮するという目的を達成する場合には、コンピュータのマウス等の入力装置に、押している間のみ音声認識が起動するボタンと、受音マイクの双方を設けることが望ましい。
これは、持ち替えのタイムロスを減らすことと、周囲環境例えば雑音や他者へのエチケットなどを配慮することにより、使用者が自分の口にマウスを近づけて話せるという優位性も得られる。

また携帯端末及びスマートウォッチについては、キーボードやマウスなどの外部入力装置は存在せず、本体そのものしか存在しない。
よって、その操作ボタン自体も当然本体に設けられており、使用環境によっては本体自体を口元に近づけて使用することになる。
音声入力（基本的には一文節）が終了したら、音声入力ボタンを「離す」行為が、テキストの固定化（コンピュータであればエンターキー若しくは「実行」と同義）することにより、入力操作の迅速化を実現することができる。
次に各機器において、音声入力装置を実現した際の実施形態について、具体的に説明する。

『第１の実施の形態：コンピュータ』
第１の実施の形態は、コンピュータを用いて形成した音声入力装置である。
特にコンピュータを用いて音声入力装置を構成する際、当該音声入力処理は特定のソフトウェアを別途起動することにより開始されるものでは無く、オペレーティングシステム、デバイスドライバ或いはＢＩＯＳ（ＢａｓｉｃＩｎｐｕｔ／ＯｕｔｐｕｔＳｙｓｔｅｍ）などのコンピュータの基本プログラムの機能とし、それによって元々起動させていたソフトウェアを遮断・阻害しないように構成するのが望ましい。
特に、本実施の形態に係る音声入力装置を実現する為のプログラム（即ち、音声入力プログラム）は、オペレーティングシステム等として、ハードウエアに組み込まれることが、より最速化の目的に合致する。

本実施の形態に係る音声入力装置は、音声入力ボタンを押すことにより、図１に示す音声入力時における認識前画面１０をコンピュータのディスプレイに表示させる。
図１では、コンピュータでメール本文を入力する際に、本発明を用いて音声入力を行っている例として説明する。
なお、タッチ句読点等の配置は後述〔００４６〕欄の通り、操作者がカスタマイズできるので、図内の項目についてはあくまで一例である。
当該音声入力ボタンは、コンピュータに接続されている機器（マウス等）やコンピュータ自体に設けられるか、或いは画面上にも表示することができる。
また認識前画面１０は前記ディスプレイの最も前面側に表示するものとし、更に音声入力対象となるメールソフトウェア画面を透過表示させるように表示させる。
この「透過表示」により、入力目的のソフトウェアを全画面表示状態で見ながら音声入力作業も併用可能となり、入力対象物に対して表示サイズとしては何の制約も及ぼさない。
図１の状況としては、本実施の形態で、既に「本発明は音声入力装置に関し、」のテキストの音声入力を完了し、その後で次の文章を音声入力する前の認識前画面１０を示している。
即ち、この認識前画面１０は、次の文節については、一音声も認識する前の状態の待ち受け画面を現しているものである。

本実施の形態において、当該認識前画面１０には、「数字優先」「英字優先」「カタカナ優先」「無変換」「（」『「』「＠」「計算式優先」「記号及び設定画面」（この２項目は同一タッチ領域の中で交互に明滅している）「ＣａｐｓＬｏｃｋ」「※」「音声入力Ｌｏｃｋ」「単語」「クイックカラーチェンジ」「太字」「一つ戻る」の項目を表示しており、各項目間には、点線の仕切りを設けている。
但し、当該仕切りは必須ではなく、少なくとも当該項目に対応した指定領域を特定できれば良い。また当該領域をタッチするタイミングや結果については〔００５８〕欄にて後述する。

また、音声入力で長文を入力する際は、結果的に文体を整えることや、誤認識を修正する可能性が高い。
よって、この認識前画面１０には、音声入力ロック状態（音声入力ボタンを押したままの状態であると機器が認識した状態）を実行する為の画面タッチ領域（指定領域）としての「音声入力Ｌｏｃｋ」領域１１を存在させる。
これは音声入力ボタンの「押したままの保持」をコンピュータに認識させるものであり、操作者の負担を軽減する為である。
音声入力Ｌｏｃｋタッチ後はマウス等の音声入力ボタンから指を離しても、「押され続けているもの」としての機器側の認識が継続される。
再度音声入力タッチ部を押すと「タッチ操作認識」が優先され、その指を画面から離した瞬間に音声入力ボタンも離した物と同義に認識される。
音声入力ボタンを離す、若しくは一回音声入力Ｌｏｃｋ領域の画面タッチを行った後で、それを解除することは、キーボードでテキストを入力した後のエンターキーと同じく、入力したテキストの確定となる。

但し、音声入力Ｌｏｃｋ解除の画面タッチは、タッチした瞬間では無く、タッチ後に指を画面から離した瞬間に、機器側はコマンドとして認識する。
音声入力Ｌｏｃｋ解除の画面領域に触れたまま、更にマウス側の音声入力ボタンを再度押したままにしてから、Ｌｏｃｋ解除しても、音声入力終了、即ちエンターキーと同義の「確定」には移行せず、マウスの音声入力ボタンを再度押した後で、Ｌｏｃｋ解除の操作をすることで、保留状態をマウス側の操作に取り戻せる選択ができるからである。
また、複数行に渡る長文を音声入力したあと、点検・校正する場合、点検作業が終了に近付いて来た時には、操作者側はテキスト確定操作に掛かるＬｏｃｋ解除の予備動作として、事前に画面に触れておける状況を作れる為、僅かながら確定操作に移行する際の時間短縮が図れる。

またこの認識前画面１０には、文法上文頭には付かない性質のタッチ項目は現れないように構成する。
「。」や「、」などの句読点は文頭には付かず、また括弧や鉤ぎ括弧の「閉じ」側も文頭には付かない。
その空白領域を「数字優先」「英字優先」「カタカナ優先」などに割り振る。
優先認識の定義は、指定のタッチ認識後に音声入力を感知した機器側ＡＩが、認識した音声をテキスト化する際に、数字の羅列・英字（アルファベット）・全てカタカナの固有名詞などに変換候補を判断する際の方向性の指定を掛けるプログラムが実行されるものである。

例えば、「Ａ５の用紙の縦書きで提出すること。」との音声入力を行う場合、現状の各種音声認識機器では、文頭の「Ａ５」は「英語」に誤認識される可能性が非常に高い。
そこで操作者は「英字優先」の指定領域１２を画面タッチした後で「えー」を発音し、「Ａ」（※ａと出力された場合は変換キー）を確認してから音声入力ボタンを離してＡのテキストを固定化してから、再度音声入力ボタンを押して「数字優先」の指定領域１３を画面タッチ（選択）した後で「ご」を発音し「５」のテキストを得る。
その後は、そのまま音声入力を続行することができる。
但し当該優先認識は、タッチ操作後の音声入力での一文節に限定された認識である。
優先認識が適用され続けると操作者が意図しない音声入力（機器側の誤認識）になり自然な音声入力の妨げになるからである。
これらは、外部入力装置としてのキーボードが存在するコンピュータでの使用頻度は低いが、外部入力装置としてのキーボードが無い携帯端末サイズ以下の機器では必須の選択方法になる。

また「計算式優先」の指定領域１４を画面タッチ（選択）した後に、操作者は「さぶとーたる」と発音するだけで、エクセル（登録商標）に代表される表計算ソフトにおける計算式「＝ＳＵＢＴＯＴＡＬ」との認識が自動選択されるような処理・機能を当該項目に設定する。
表計算ソフトの計算式入力が省力化できるからである。

そして認識前画面１０における「一つ戻る」の指定領域１５は、これを画面タッチ（選択）することにより、句読点の選択内容を誤ったり、優先認識を誤って押してしまい、それを解除したい場合に使用する。

自身のコンピュータの壁紙色の選択によって、またはインターネット内の企業のお客様お問い合わせページに入力する時など、背景色と半透明句読点などの色が偶然似通ってしまい、半透明句読点等の視認が困難になってしまう状況も発生する。
そのように、咄嗟に変えたい状況もあり得る為、色調だけを簡易に変更可能とする為の「クイックカラーチェンジ」タッチの領域１６も選択できるように構成するのが望ましい。
本実施の形態では、当該クイックチェンジとして、半透明句読点などのタッチ部の色調を「桃色」「水色」「緑色」「橙色」等に変更できるように構成する。
当該の色を直接タッチすればその色にジャンプし、「領域」をタッチすれば「桃色」→「水色」→「緑色」→「橙色」→「桃色」に戻る、このようにローテーションする。

更に「太字」のタッチ領域１７は、音声入力で生成されるテキストの書体を変化させるタッチであり、例えば太字にしたい文節の音声入力を開始する前に画面をタッチして、「離さないまま音声入力を続行して、太字を終了したい箇所でタッチを離す」このような操作で書体指定を掛けるものである。
例においては認識前画面１０に配置しているが、当然音声入力の中間で太字が得たい場合も有り得る為、以下の〔００４６〕欄に記載する設定画面などにより後述の認識中画面のタッチ領域の一つに配置することもできる。
また同様に、太字の代わりに斜体文字・下線文字などの後述〔００３８〕欄などのタッチ領域を設定画面において配置できる。
通常のキーボードでのテキスト入力の際に書体指定のアイコンをクリックするものと同様の操作で、更に書体変更を終了するコマンドも「タッチを離す」行為だけで良いため、キーボード入力での「再度同アイコンクリックで解除」よりも手間が少ない。
もしも、長い範囲に書体指定を掛ける場合は、通常通りマウスでアイコンをクリックする事前操作を掛ければ良い。

前述のとおり、この音声入力装置では、音声入力ボタンを押して話している間に機器側に認識されたテキスト（入力文字）が積み上がり、音声入力ボタンを離すと、キーボードのエンターキーと同様に入力したテキストを固定又は確定することができる。
この音声入力ボタンでの入力は、音声入力処理の開始、及び入力した文字の確定を実行する処理を繰り返し行なうことができる。
このように必要最低限の操作により、ソフトウェア内でテキスト化させたい部分だけ音声入力を断続的に機能させることができ、例えば表計算ソフトの、摘要欄・備考等のセルに対する入力の時だけ音声入力のボタンを押して音声入力し、数値データを入力する際には今まで通りテンキーを用いることで、より入力速度を高かめることができる。
再掲になるが、これを実現する為に、当該音声入力処理のプログラムは、オペレーティングシステムなどの基本ソフトウェアとしてコンピュータに実装することが望ましい。

そして一音声でも音声認識を開始すると、半透明句読点タッチ領域の説明（即ち、補助入力表示部）は、図２に示す認識中画面２０に変化する。
これは、各言語の文法の都合上、句読点（日本語であれば「、」や「。」など）の画面タッチ領域が必要となるため、前記〔００２７〕欄の認識前画面１０内の（「数字優先」１３、「英字優先」１２、「カタカナ優先」）等の部分の領域を、句点「。」２１、読点「、」２２などに明け渡すことで、タッチ領域を可変させて同じ画面サイズ内の分割数を有効に使うものである。
つまり、本実施の形態に係る音声入力装置は、音声の認識と同時に、認識前画面１０を認識中画面２０に変化させる画面変更手段を備え、これにより音声認識前と音声入力中の
タッチ領域を、同一画面サイズ内で効率良く利用できる。

図２に示す認識中画面においても、音声入力の補助として選択可能な記号や句読点などからなる項目の選択領域を、入力対象の表示領域に重ねて、背景側の入力対象の表示画面を透過させるように（半透明で）表示させた画面として構成する。
当該認識前画面の配置例としては「。」「、」「記号」「変換」「（」『「』「空白」「改行」「）」『」』「ＢＳ」「音声入力Ｌｏｃｋ」「単語」「句読点タッチ一時消去」「／（スラッシュ）」「一つ戻る」の項目を表示しているものである。

入力対象の画面の一部と半透明句読点のタッチ領域の色調が重なる部分で、偶然視認性が妨げられる場合がある。
音声入力の途中でその重なった部分を視認したい時に、「句読点タッチ一時消去」の画面タッチ領域に触れている間、半透明句読点は画面から消えた状態で音声入力を続行できる。
このタッチ領域の存在により、一旦音声入力ボタンを離す、つまり音声入力自体を中断して、そこまで生成されたテキストの確定をせずとも、半透明句読点を画面上から消すことが可能になる。
殆どの場合、重なっている視認したい部分を確認したら、すぐ当該タッチを離して音声入力自体は続行する使用法が主となる。

なお、音声入力ボタンを離さないまま（音声入力ボタンの選択状態。以下同じ）、フレーズとフレーズとの間にキーボードで句読点や括弧等を直接入力することも可能であるなど、画面タッチ操作だけには依存しないように構成することで、入力速度や正確性をより一層向上させることができる。
状況としては、一単語だけで、句読点も無く、頻繁に改行を要する場合（例えば、電話の相手の話の要点だけを、思い出しながら紙のメモの代わりに音声入力をする時）など、そうした文章形態や内容によっては、画面タッチや音声入力ボタンを都度入／切操作するよりもエンターキー連打の方が素早く入力できるからである。

また、音声入力ボタンを離さないまま、音声入力の間違い箇所をキーボードのバックスペースキーで消して、更に音声入力を続行できるように構成する。
更に一旦音声入力ボタンを離して、音声入力でのテキストを固定化すれば、キーボードで入力したテキストと同じであり、これをマウス・キーボード側で修正できるようにする。
或いは、キーボードから入力したテキストの末尾をマウスで位置指定して、音声入力ボタンを押して発声をすれば、元のテキストに音声入力の文章を付け加えることも可能である。
もしも音声入力で認識しにくいフレーズが出現したら、そこまでで一度音声入力のボタンを離し（音声入力を終了し）、途中までのテキストを固定化し、認識しにくい部分だけをキーボードから入力して、その後で音声入力を再開すれば最も効率的な入力処理を行なうことができる。

タッチ項目の配置や内容を変えたい際に、コンピュータの場合は画面レイアウトに余裕があるので、本実施の形態による音声入力が普及した後には、図３に示す様に、一般的な表計算ソフトウェアやテキスト入力ソフトウェアのレイアウト内に、音声入力のシステム設定画面を呼び出すアイコンなどが配置されることも望ましい。
当該アイコンクリック後の設定画面等のイメージ図は〔００４５〕欄にて後述する。
また、単語と画面設定の２つのタッチ領域が、同一箇所に混在している説明については、この機能を多用する携帯翻訳機以下のサイズの機器に関する〔００８２〕欄において後述する。

なお、コンピュータにおいてデフォルト（初期設定）は１６分割でモニター画面のタッチ領域を区分けしているが、分割数そのものを最低４領域程度まで減らすことができる。
これは後述のスマートウォッチなど、画面の小さい機器とタッチ領域の種類や配置位置を合致させることで、同一の操作者が両方の機器を使用する際に混乱が少なくなることと、配置を記憶してしまい、句読点タッチの透明度の濃さを前項・次項で説明する設定画面内で下げて、視認に因らず「ブラインドタッチ」での操作を行える優位性も考慮している。

〔００４３〕欄にて説明した「設定画面」アイコン選択の後、図４（Ａ）から（Ｆ）に示す設定画面への移行後は、一時的に画面表示されていたソフトウェアやインターネットの企業のお問い合わせページなどの入力対象の画面は、背景化し一時入力等は中断される（ソフトウェア自体の終了やインターネットのシャットダウンはしない）。
図４（Ａ）は、認識前画面の表示中に、設定画面に移行した状態を示しており、半透明句読点タッチ（即ち補助入力部）が、音声入力使用時の「全画面サイズ表示」と比較し、左下に向かって８０％程度に縮小表示され、画面上端と右端に空白域を設ける状態を表している。
図４（Ｂ）は、図４（Ａ）で確保された空白域に、「各種設定専用のタッチ領域」を出現させた状態を表している。
なお説明用に図４（Ａ）と図４（Ｂ）は別々の図としているが、実際には同時に画面遷移・展開がなされる。
設定画面内においては、認識前画面のほか、今後説明していく認識中画面及び編集・修正画面の、どの句読点タッチ画面をカスタマイズするのかの選択箇所が上列に常時存在し、すぐ目的の画面設定にジャンプすることができる。
変更できる内容としては、色調選択・色調濃淡・フォントサイズ・分割数などが選択できる。
仮に認識前画面で色調や濃淡を変化させると、認識中画面や編集・修正画面も同様にリンクして変化し、３つの句読点タッチの色調等に違いが生じることにはならない。
単語登録については、コンピュータにおいては基本的にＩＭＥオプション（登録商標）の辞書ツールや登録単語にリンクしており、コンピュータにおいては本画面内で単語登録は行わない。

タッチ句読点の配置や種類も〔００４３〕欄にて説明した「設定画面」において変更（即ちカスタマイズ）が行える。
使用者のニーズ（専門業など）によって特定の記号（例「ｍ^２」や「Σ」など）を頻繁に使うケースがあるからである。
このような記号を使用する場合には、丸括弧「（」「）」を使用することがあっても、口語調で使用するカギ括弧『「』『」』はあまり使用しないと考えられることから、カギ括弧『「』『」』の部分に記号（例「ｍ^２」や「Σ」など）を充てるなどの選択ができる。
タッチ内容を変えたい場合、縮小表示された既存タッチ領域の一箇所を一定時間長押し（約２秒程度、以下同じ）すると、色調が反転するので、その後キーボードで例えば「ｍ^２」と入力すると、「ｍ^２と入れ替えますか？Ｙ／Ｎ」と確認メッセージがコンピュータ側から確認され、「Ｙ」にて選択・決定される。
タッチ句読点の位置変更は、当該句読点タッチを前述の長押し色調反転の後、マウスでのドラッグ＆ドロップ操作同様にモニター上にて指で引っ張り移動の後に指を離すことで、タッチ位置の交換ができる。
なお、画面外に素早く大きく右フリックを行うと、当該句読点タッチ項目の削除も可能である。
なお、タッチ領域に設定できるものは、特に形式に制限は無く、「￥や＊など一文字の
記号」などと限定はしない。
登録する際に「音声太郎」と直接キーボード入力して、名前程度の字数であれば一つのタッチ項目として登録できる。
但し、全てのタッチ画面で「一つ戻る」タッチ領域は位置を変えることはできても消すことはできない。
後述の編集・修正画面における「変換」タッチ領域も位置を変えることができても消すことはできない。
これは今後説明する操作上の矛盾になるため、そうしたカスタマイズは「論理エラー」として受けつけないようプログラムされる。
図４（Ｃ）は、『「』（鉤ぎ括弧起点）をｍ^２（平方メートル）に変更中での「決定前状態」を表している。
図４（Ｄ）は、「※」（コメ印）を「音声太郎」に変更中での「決定前状態」を表している。
図４（Ｅ）は、「計算式優先」の領域を「モニター画面を指で触れてドラッグ操作中の状態」を表しており、ドロップ操作と同時に「太字」と位置関係は入れ替わる。
また、「記号と設定画面移行タッチ箇所を混在」させていた領域から、「記号の項目」だけを排除した状態も示している。
図４（Ｆ）は、図４（Ｂ）にて外周に新規出現させた、「長押し時間」の操作イメージ画面を示している。

なお、稀なケースではあるが、キーボードへの依存度を下げて、画面タッチによる入力頻度を高めるケースもあると思われ、その際には、カーソルキーの代わりに矢印記号「←」「↑」「→」「↓」や、「ＢＳ（バックスペース）」の選択表示領域も設定画面において選択することができる。

また、コンピュータについては、画面タッチでの句読点認識の選択を行う際には高価なディスプレイ（画面タッチ認識機能が付属するモニター装置）が必要となる為、当該画面タッチは必須では無い。
公知技術として、多くのボタンを備えた多機能マウスも提供されているため、これを画面タッチ領域の一部代用として利用することもできる。
例えば当該多機能マウスの設定画面或いは前記設定画面で、音声入力時のみ適用される仕様として、多機能マウス５０の各ボタンを特定の項目機能（例えば、句読点や鉤ぎ括弧等）に割り当てる機能割当画面（後述の図６（Ｂ）～（Ｄ））を設けることもできる。
例えば図５に示すように、多機能マウス５０のボタン５１には句点「。」、ボタン５２には「改行」、ボタン５３には読点「、」、ボタン５４には「音声入力ボタン」を設定し、更に当該マウス５０には、音声マイク５５を設けている。
操作の例は、コンピュータでの音声入力の基本的項目が終了したあと〔００５９〕欄にて後述する。

また前記〔００４５〕欄に示した句読点等の設定画面内で、「句読点タッチを表示しない」を選択することで、画面に半透明句読点領域は出現させず、画面タッチ句読点に依存しない入力方法、つまりマウスボタンの右手操作だけでの種類を限定した句読点の入力法も併用できる。
具体的設定方法は、図４に示した設定画面における「濃度」のタッチ領域を選択し、図６（Ａ）に示す「半透明句読点タッチの濃度設定部分」の選択領域６１をタッチした状態の選択バーで「表示しない」濃度を選択した場合、「モニター句読点タッチを利用しない」を指定するチェックボックス６２の追加選択肢を出現させることから開始される。
単純に句読点タッチの表示濃度が薄いだけであれば、〔００４４〕欄で説明した「ブラインドタッチ」の状態であり、モニター画面の所定の場所に触れれば句読点や括弧等はテキスト化される。
しかし「画面タッチを使用しない」チェックボックス６２をクリックすると、以後モニター画面のタッチ入力はコンピュータ側からは全て無効と判断され受け付けられなくなる。
但し当該チェックボックス６２のクリック後は、設定画面内に更なる追加選択肢「多機能マウス設定」を選択するチェックボックス６３が出現する。
更に当該「多機能マウス設定」を選択するチェックボックス６３をクリックすると、図６（Ｂ）に示す多機能マウスの各ボタンに「どの句読点や括弧等を割り振るかの」設定画面に遷移する。

以降、図６（Ｂ）は多機能マウスボタンの機能割り当て操作画面の説明となり、各ボタンの配置は〔００４８〕欄で説明した内容に合致させており、後述の〔００５９〕欄で説明する図９の例は、この配置のまま最も単純な使用法を前提に表記している。
設定操作としては図６（Ｂ）の左横上ボタン５１の領域を一定時間画面の長押し（若しくはマウスでの右クリック）をすると、領域とマウスイメージ図のボタン５１の色調が同時に反転し、この時点でキーボードの「。」を押した後、機器側からの「Ｙ／Ｎ」選択が示されＹで決定する。
同様に図６（Ｂ）に示した画面内の左横下ボタン５２及び右横上ボタン５３など目的の設定作業が終了した上で、設定画面右下の「決定」をクリックし設定の上書きは完了となる。
但しボタン割り振り設定画面（図６（Ｂ））の上列に「認識前画面」「認識中画面」「編集・修正画面」と表記があるように、マウスの各ボタンは各画面（即ち「音声入力中の状況ごと」）に異なる役割を設定できる。
操作者が使用法を習熟して行く過程で、文法に合わせて「認識前画面」においては「英字や数字の各優先認識タッチ」などを、また「認識中画面」においてはテキストの途中に入る鉤括弧等などに割り振ることで、限られた多機能マウスボタン数を効率良く利用することが可能になる。
また、現存する多機能マウスのボタン数は一定では無い。
よってマウスのボタン数に合わせて当該設定画面の分割数自体も変化させる必要がある。
例示した図６（Ｃ）（句読点タッチ領域に代わるボタン数３、設定画面内分割数９）と図６（Ｄ）（句読点タッチ領域に代わるボタン数５、設定画面内分割数１１）において、画面配置の割り振り数そのものが異なるのは、そのイメージを説明している。
原則として、マウスの基本機能である「左右上面のクリックボタン」には句読点タッチ等の設定は不可とするよう制限を設ける、これは一般的な操作上の混乱を避ける為である。
但し、音声入力ボタンそのものを無くすことはできないものの、位置を変える（選択するボタンを異なるものにする）ことは妨げない。
後述する編集・修正画面のマウスボタンの配置設定も図内に含まれるが、コンピュータにおいては携帯翻訳機の〔００９１〕欄で説明するような「指で画面をタッチ操作する編集・修正」は殆ど行わないため、作成済のテキストに対して後付け句読点を入力する形態となる。
例文：本項の説明内容は多機能マウスの設定方法です。
なお、図６（Ｄ）は認識中画面であるが、編集・修正画面においても同様の各ボタン配置を設定しているものと仮定する。
通常のマウス操作で、「は」と「多」の間の位置を指定し、図６（Ｄ）におけるボタン５６をクリックし『「』を入力し、同様に「ス」と「の」の間の位置で図６（Ｄ）におけるボタン５７をクリックし『」』を入力する。
結果：本項の説明内容は「多機能マウス」の設定方法です。
このような「後付け句読点」の使用法となる。
マウス側の操作依存度を上げることで、画面タッチ認識機能の無いディスプレイを使用
した場合でも、音声入力時における句読点等の入力を多機能マウス側からある程度は可能になる為、コンピュータ装置一式の全体価格を下げる優位性もある。
また、操作者が片上肢に障害を持つ人の場合、画面タッチ（若しくはキーボード入力）を行わずに、多機能マウス５０だけで音声入力が完結できる方が有利だからである。

タッチ認識機能を持つモニター画面は、前記の通りコンピュータ装置一式の価格の上昇に繋がる。
また執筆業など長文を作成する専門職などは、半透明句読点タッチ領域と入力対象画面そのものとの重複表示は目の疲れの原因となり、〔００２０〕欄に記載の通りの両手配置であれば、画面タッチの都度左手を挙上する行為も疲労の原因となる。
よってスマートフォンや小型のタブレット端末などの付属機器に、句読点タッチ等の役割だけを独立させるよう構成するのも望ましい。
右手は音声入力ボタンが追加されるだけのマウスでの座標指定操作は変わらず、左手は卓上に付いたままスマートフォン等で句読点や改行などの書体編集操作を行い、キーボードの代わりに音声入力を行うと言うことである。
また、操作者の心情的に画面モニターに触りたくない（指紋などを付けたくない）場合にも、スマートフォン等の付属機器での句読点タッチ等の手法は有効になる。

仮に音声入力に際して、画面タッチで句読点の挿入や字体を整えながら、テキスト文字を入力していく最中に、操作者の言い間違いであれ、機器の認識側の誤りであれ、誤っている箇所を発見したとする。
その際、コンピュータの場合は、一度音声入力のボタンを離して、テキストを固定化してから〔００４２〕欄に記載の手法のとおりマウス・キーボードで修正することが容易にできるので、音声入力を中断する必要性が無い。
また、桁の多い金額などを入力する場合、キーボード入力にて後で訂正することを前提にして、音声入力を行うことも考えられる。
例文「この自動車は税込みで２，１５９，７８４円です。」と入力したい場合に、操作者は「この自動車は税込みで１万円です。」と一旦音声入力する。
その後通常のマウス操作で「１万」部分をなぞって色調反転させて、キーボードにおけるテンキーからの入力で、一度前記で音声入力した「１万」を「２，１５９，７８４」に変更する。
たとえ〔００３２〕欄における「数字認識」があったとしても、単純な数字の羅列はテンキーで直接入力した方が、同じ結果を得るうえでは早いからである。

このように、音声入力ボタンを併用搭載したコンピュータにおいて、キーボードによる入力手法を全く妨げず、今まで通りのキーボードだけでの入力手法も全て可能である。
つまり本発明による音声入力を必ず行わなければならない状況は無い為、操作上のデメリットは存在せず、購入者は少しずつ音声入力を用いたテキスト入力手法を習得して行くことができる。

音声入力において、操作者が意図した内容（ひらかな）と異なる認識を機器側がしてしまった場合（以下「誤認識」とする）及び、操作者の音声について機器側は正確に認識したが、ＡＩが前後のテキスト内容から判断した変換候補が誤っていて、操作者側の意図と異なる単語が選択された場合（以下「同音異義語」とする）は、機器やＡＩの進化により減って行く物ではあるが、音声入力の特性上避けがたい性質のものである。

新規のテキストを〔００３８〕欄の記載以降の手法で音声入力をしている最中は、文書入力ソフトや表計算ソフトまたは企業のホームページの問い合わせ欄など、ソフトウェアやホームページの様式に合わせて音声入力を行っていたが、その中に誤認識や同音異義語を発見した場合、音声入力ボタンを押したままの状態で０．５～１秒程度の無音時間（設
定画面にて調整できる、以下「一定時間」とする）を経過すると、図７に示す編集・修正画面に遷移する。
これにより、音声入力対象である文書入力ソフトや表計算ソフト及びＷｅｂページの画面などの元々のソフトウェアは、閉じられることは無いが、コンピュータ本体側（オペレーティングシステム側等）が、一時入力操作の処理を遮断して、モニター上は極端に色調を薄くし「背景化」させる。
図７の編集・修正画面７０では、今現在入力中のテキストが句読点タッチと同色の半透明文字（※透過度はより濃い色調に変化する）で大フォント・広い字間でモニター一杯に出力される。
なお、図７の編集・修正画面７０では、〔００２７〕欄における音声入力によるテキスト作成を進めて、その後に誤って認識された部分の修正入力をこれから行う具体例である。
表示する句読点タッチの例としては、左上から右下にかけて『「』『」』「（」「）」「改行」「。」「一つ戻る」「、」「変換」「空白」「ＢＳ」「記号」などを設けるものである。
一時的に背景化されたソフトウェア側よりも、音声入力最中のテキストのみの拡大フォント画面が「視認の主たる部分」になると言うことである。
フォント・字間の拡大からテキストが画面内に収まりきらない場合は、位置調整の縦バー７１が出現するように構成する。
なお、誤変換や同音異議語の修正など、修正する範囲が短い場合、コンピュータにおいては〔００４２〕欄に記載の通り一旦テキストを固定化してから、通常のマウス及びキーボードでの入力し直しが早いため、ここで編集・修正画面内における編集手法説明は行わず、マウス・キーボードが存在しない携帯機以下のサイズの機器に関する〔００９１〕から〔０１０８〕欄にて詳細説明を行う。

一旦固定化した（音声入力ボタンを離した後）テキストの移動・削除などは、後述する携帯端末機等のサイズの機器の手法とは異なり、マウスでの直接操作の方が修正操作としては早いため、画面タッチでの修正操作は前提としない。

以上の処理を、図８に示すフローチャートに基づいて、音声入力処理の全体の流れとして再説明する。
即ち、音声入力の開始に際しては、コンピュータやその周辺機器（マウスなど）に設けられた音声入力ボタンをオンにする。
これにより、音声認識を開始する前の画面である、「認識前画面」をディスプレイに出力する。
この認識前画面は、音声入力を行うプログラムの入力画面上に、当該入力画面を透過させるように表示する。
そしてこの認識前画面に設定された項目の指定により、当該領域に設定されている処理を行う。
例えば括弧（起点側）などの項目の指定領域が選択された場合には、当該選択（タッチ）された内容を音声入力を行うプログラムの入力画面に入力し、また英字優先、数字優先、カタカナ優先、計算式優先、音声入力Ｌｏｃｋ等の項目が選択された場合には、当該項目に設定されている処理を実行する。

そして使用者の音声が発せられて音声認識が開始されると、音声入力している文章中に、句読点、括弧（終点側の追加）或いは改行などの記号や制御文字を挿入する為の認識中画面出力を、前記認識前画面に代えて出力する。
この認識中画面がディスプレイに表示されている状態において利用者が音声を発することにより、当該音声認識装置は発音された音声を認識して、音声入力を行うべき画面にテキストで入力していく。
そしてこの音声入力中に、前記記号や制御文字を入力する際には、前記認識中画面における該当項目を選択・指定し、音声入力したテキストに追加する。
以上の処理によって、音声入力と同時に、記号や制御文字及び改行など書体を整えることをタッチパネル、キーボード又はマウスなどの入力デバイスを用いて併用入力することが可能となり、これにより音声入力自体はテキスト部分しか話さない自然な流れのまま、迅速かつ正確なテキスト入力を行うことができる。

具体的な簡易操作イメージ図を以下に示す。
図９は表計算ソフトにおける入力画面であり、数値部分と摘要部分（音声入力箇所）の断続性を説明したものである。
Ｂ列３行やＢ列４行などの摘要欄は音声入力を用い、Ｃ列３行以降の数値データはテンキーを用いるなど、音声入力の断続性から常に最速の入力方法を選択可能と言うことである。
また、「実績値」と入力したい時に「実績地」と同音異義語で認識された場合、マウスで「地」をなぞり色調を反転させてから「あたい」とキーボードで入力し、変換キーを押せば修正操作は容易である。
図１０の多機能マウス入力画面は多機能マウスに一部の句読点タッチを割り振り、画面で句読点タッチをせずに、テキストを作成する手法の説明である。
マウスには通常の機能のほか、句点「。」を設定したボタン５１、「改行」を設定したボタン５２、読点「、」を設定したボタン５３、「音声入力ボタン」を設定したボタン５４、音声マイク５５を割り振っており、テキストの下線部は音声入力ボタンの押したままの状態を示している。
よって下線の引かれていないテキストはキーボードを使用し通常通り入力している。
この例文内では、「」（鉤括弧）と、ＰＤＦ及び＠（アッドマーク）がそれにあたる。
なお、説明を単純化するため、本項内では誤認識等は生じなかった前提で説明している。
図１１の文章入力画面はワードプロセッサーに代表される、文書入力ソフトでの基本的な操作手順である、主だったテキストは全て音声入力であり下線は省略している。
図１１内のエンターキーマーク１１１は文字通りキーボードのエンターキー若しくは句読点タッチの改行のどちらでも同じ結果となる。
図内の□（ブランク）１１２は空白を示している、キーボードのスペースキー若しくは句読点タッチの空白のどちらでも同じ結果となる。
なお、改行や空白の「当該タッチの押したままでの自動連打判定」が、キーボードの当該キーの押したままでの自動連打状態と同様に実行される。
この定義の為、後述〔０１３２〕の携帯機以下のサイズの機器にて説明する「押したままの状態で音声入力を行った場合の特殊書体入力は」改行や空白タッチ部分には論理エラーとして設定できない。
「、」や「。」「（）カッコ」などの句読点は、全て音声入力中のタイミングに合わせた句読点タッチで構成可能である。
「：（コロン）」１１３や「＿（アンダーバー）」１１４はキーボードで直接入力するか、「記号」タッチ後に「ころん」「あんだーばー」の音声入力で得ることも可能である。
特殊文字１１５も、テンキーで「１」「２」を入力後に変換キーを押すことも、音声入力で機器が認識する能力があるのであれば「いちまる」「にまる」と音声入力だけで得ることもできる。

＜電子カルテの入力における実施形態＞
本実施の形態の一つとして、電子カルテの入力方法について実施した場合を説明する。

従来、入力速度が重視される業種として、単純な速記業のほか、ジャーナリスト、新聞業、作家などがある。
これらの特殊な業種と異なり、一般的な業種では医療業の「電子カルテの入力」において、スピードが求められるものである。
特に大病院勤務医の長時間労働などは社会問題化しており、カルテの入力にとどまらず、診断書・紹介状及び各サマリーの記載作業が早くなることは、医療従事者の負担軽減に寄与するものである。

机上環境で他の作業（医療処置等）と重複しないのであれば、コンピュータを用いて実現した音声入力装置において、本実施手法は最速の入力能力を有している。
強いて挙げるのであれば、図１に示す認識前画面で「病名優先」「医療英略字優先」の選択項目や、ＡＩの能力次第では、それらを一つにまとめた「医療用語優先」の選択タッチ領域などがあれば更に良く、また診療科毎に異なる専門用語に対応する為、単語の登録可能数を一般モデルより増やすといった細かな調整で、充分医療用専用機として対応可能である。

前述の医療用語優先等における、単語発声（機器側の認識）からの再変換キー若しくは、画面の変換領域タッチにおける変換候補の遷移は以下のように行われる。
例１：音声入力「でぃーえむ」ＤＭ（糖尿病の英略字） →（矢印は都度の変換タッチを表わす） I型糖尿病（主に先天性） → II型糖尿病（主に生活習慣） → Ｄｉａｂｅｔｅｓ（英） → ＤＭに変換が戻る。
例２：音声入力「えるしー」ＬＣ（肺癌の英略字） → Ｌｕｎｇｃａｎｃｅｒ（英） → 小細胞肺癌 → 非小細胞肺癌 → ＬＣに変換が戻る。
例３：音声入力「えりてまとーです」 → エリテマトーデス → 全身性エリテマトーデス → 全身性紅斑性狼瘡 → ＳＬＥ → Ｓｙｓｔｅｍｉｃｌｕｐｕｓｅｒｙｔｈｅｍａｔｏｓｕｓ（英） → Ｌｕｐｕｓｅｒｙｔｈｅｍａｔｏｄｅｓ（独） → エリテマトーデスに変換が戻る、などである。
この医療用語優先の変換パターンは電子カルテシステムにおいて公知技術であるが、現状のシステムでは操作者が意図せずに、機器側が医療用語に誤認識してしまう場合がある。
本実施における優先認識タッチは原則〔００３２〕欄に記載の通り「タッチ認識後の次の音声入力の１フレーズ」に限定されるため、全体を通して誤りが生じにくい優位性がある。

また、電子カルテは病院内等において、様々な状況で複数の者が利用する。
各利用者に応じた、例えば〔００６２〕欄に記載のとおり机上で医師等がカルテや診断書等を作成する場合を「ノーマルモード」とし、看護師等が何らかの処置中に並行してカルテに入力する場合は「ノータッチモード」等として設定することもできる。
これは、医療（又は介護においても）の現場においては、医療処置中（又は介護中）で手を離せない状況や、手指衛生上の都合（消毒済の手や、オムツ交換の実施中など）によっては、マウスやタッチ画面に触れられない場面も想定されるからである。
そこでこのような場面をフォローする為に、音声入力する際の状況に合わせて、原則として手の「表側」を使用しないで機器を操作する手法である。

このノータッチモードにおいて、電子カルテへの入力に際しても、〔００２７〕から〔００２９〕欄に記載の通り音声入力ボタンを押している間は音声認識し、これを離すとキーボードにおけるエンターキーと同様の処理の原則は同じである。
但し、このような音声入力ボタンの操作は、同時に行いたい処置や介護の手を拘束するので、初めに２回連続押しで音声入力状態を維持できる状態（モニター上の音声入力Ｌｏｃｋタッチと同義）とし、もう一回音声認識ボタンを押すとＬｏｃｋ状態を解除し、同時にエンターキー操作とすることで解決できる。

また、先の手指衛生の都合上、本実施の形態に係る音声入力装置は、「医療（介護）専用ノート型コンピュータの角に手首の裏面から手の甲などで押しやすいボタンを配置する」、「腰ベルトに肘で押せるタッチボタンを設ける」、又は「スマートウォッチサイズ程度の携帯端末を付ける反対側の手の手首（甲側）にスイッチを配置して両手首の甲部分をクロスタッチする」などの手法で音声入力スイッチを操作できるように構成するのも望ましい。
前項のＬｏｃｋ解除操作でも、指（手の表側）を使用しないと言うことである。

また、そうした医療処理中の状況での電子カルテに対する入力では、長文を入力する必要性は乏しく、画面タッチで句読点を入力したり、改行・空白などを入力して書体を整える回数も少ないものになる。
よって、ノータッチモードでの電子カルテへの音声入力に際しては、公知技術における音声入力処理、例えば記録したい本文内容から一拍インターバルを開けた上で「てん」「まる」「かいぎょう」など単語を口頭で話すことで、句読点や書体編集を入力する処理を伴うこともできるように機器側の音声認識のプログラムが変化する。
つまり、ゆっくり・はっきりと単独で発声された「、」「。」「改行」などをテキスト化せず、機器側は書体や記号コマンドとして認識するということである。

また、電子カルテに対する音声入力処理では、確定処理（エンターキー入力）や音声入力終了にあたる操作も、ワンフレーズの音声入力後、一定時間無音を検知することで実行されることが望ましい。
日中の介護・夜間の介護など状況も異なるため、この無音時間検知は事前に任意設定できるように構成する。
これにより、処置や介護の手を、〔００６５〕欄の記載における実行（エンターキー）及び音声入力の解除操作の為に拘束しないで済ませることができる。
また、操作者が音声入力の終了処理を忘れたり、意図せず手が離せなくなった時に、患者との会話が無意味に延々と記録され続けるのを防止する上でも有効である。

電子カルテは患者毎に１つの完結したデータベースであり、同一の医療機関で、入力方法が異なる毎に別のソフトウェアやファイルにはできないため、音声入力手法（例えばノーマルモードとノータッチモード）の選択は瞬時に行われることが望ましい。
よってマウス側の音声入力ボタンを押した場合は、自動的にノーマルモードになるように設定し、ノート型コンピュータの角押しや、ベルト・手首甲のスイッチが押された場合には、自動的にノータッチモードとなるように、ハードウエア（オペレーティングシステムを含む）側で定義した方が効率的である。
また、医療専用のノート型コンピュータを新規開発する場合は、指の反対側の関節部で位置指定のマウス操作ができると手指衛生上有利なので、「タッチパッド」のサイズ等を拡大する事が望ましい。

＜コンピュータプログラム入力における実施形態＞
電子カルテ同様に、特定ワードの優先認識やタッチ句読点のカスタマイズで、専用機以上の能力を発揮できる例として、音声入力によるコンピュータプログラミング（ボイスコーディング：Ｖｏｉｃｅｃｏｄｉｎｇ）がある。
このボイスコーディング自体は公知技術であるが、本実施による手法は、半透明句読点タッチ領域をプログラム入力において多用するものに切り替えることで実現する。

日本語入力におけるにおけるテキスト入力において、〔００２７〕の認識前画面における図１を例にすれば「カタカナ優先」が存在するが、コンピュータのプログラムでは使用しない文字である。
よってそれらの領域を例ｆｕｎｃｔｉｏｎ（ファンクション：関数）例２ａｒｒｙ（アレイ：連想配列）などに割り振る。
また同様に一部の句読点（鉤ぎカッコ起点や太字）などもプログラムでは使用しないので、｛｝（中カッコ）や；（セミコロン）などプログラムで多用する物に割り振る。

また、音声認識の「プログラム優先」認識を設定し、前述の「ふぁんくしょん」「あれい」なども、機器側の音声認識率を上げて対応する。
専門的なプログラム用語に限らず、エクセルマクロ（登録商標）における、ＴＲＵＥ（トゥルー：正常値）ＦＡＬＳＥ（フォルス：不正値）なども認識率が上がるが、〔００３３〕欄の記載における計算式優先と異なり、自動で計算式の書式には移行しない。

音声入力でプログラム作業を開始した場合、当面の間は前記「プログラム優先」を継続し続けることになる。
そうした際に発声前の都度、プログラム優先のタッチ領域を押すことは操作者の負担になり、最速化の目的にも合致しないため、プログラム優先タッチ領域と音声入力Ｌｏｃｋタッチ領域を同時にタッチすると、「プログラム優先」にもＬｏｃｋがかかり、常に優先識別が適用され続けることで解決できる。
これを解除する場合は、〔００３０〕欄の記載と同様に音声入力Ｌｏｃｋ領域を再度タッチしすぐ離す入力方法で解除を行う。
またプログラムの件とは別であり、用途も稀な例であるが、カタカナ優先や英字優先などでも同様の同時押しタッチで特定認識のＬｏｃｋをし続けることができる。
洋食のメニュー原稿を作成するときなど、カルボナーラペスカトーレジェノベーゼアラビアータ… （Ｃａｒｂｏｎａｒａ）（Ｐｅｓｃａｔｏｒａ）（ｇｅｎｏｖｅｓｅ）（Ａｒｒａｂｂｉａｔａ）…など、カタカナ・英文などを連続して単語のみで入力する状況も有り得るからである。
この特定認識Ｌｏｃｋ継続は、後述〔０１３２〕欄に記載の携帯機以下のサイズの機器における、各優先認識タッチ領域の押したままによる、太字やアンダーバーなど書体を整える特殊操作とは別個の処理である。

また、プログラミングにおいては、日本語のテキスト入力で使用する鉤ぎ括弧『「』及び『」』は使用しない句読点タッチ領域になる。
更に〔００４６〕欄に記載のとおり短文も句読点タッチとして登録できることを応用して、ほぼ全ての半透明句読点タッチ領域に「プログラミング言語やプログラムで多用する記号」に充てる方法が有効になる。
ただ句読点タッチ領域にランダムに割り振る訳ではなく、図１２（Ａ）に示す認識前画面の半透明句読点タッチ領域１２１には「プログラムの行のはじめ」に使用されやすいプログラミング言語や記号を、図１２（Ｂ）に示す認識中画面の半透明句読点タッチ領域１２２には「プログラムの行の中間点」に使用されやすいプログラミング言語や記号を、図１２（Ｃ）に示す編集・修正画面の半透明句読点タッチ領域１２３には「プログラムの行の末尾」に使用されやすいプログラミング言語や記号を重視して配分する。
認識前画面と認識中画面及び編集・修正画面のプログラミング用語では、プログラム内容によっては前後する場合もありえるため、「認識前画面にジャンプ」「編集・修正画面にジャンプ」と言った句読点タッチ領域を設定することで対応する。
なお各画面の空白領域は、全て操作者が任意にカスタマイズした、プログラム用語とプログラム句読点の領域である。

コンピュータプログラミングを汎用コンピュータで一般の者が行う場合と異なり、より専門性の高いプログラマーやデーターエントリー業（パンチ入力の専門業）などにおいては、究極の入力スピードを要求するため、入力機器の持ち替えも行わないようマウス操作にも依存しないのが一般的である。
それらの業種はテンキーを中央配置し、ファンクションキーを多数追加した専用キーボードを使用している。
また、プログラム言語は桃色・水色・黄色など複数の文字色が同時にモニター内に表示される。
〔００３５〕欄の記載においてクイックカラーチェンジ機能があったとしても、より専門度が高まるほど画面タッチ句読点は色調が重なることも含めて視認の障害になり、前述のとおり〔００５０〕欄に記載の多機能マウスに持ち替えることも無いため、当然画面タッチで手をキーボードから離す行為自体専門職の最速化目的には合致しない。
そうした場合は、プログラム（パンチャー）専用キーボードに「音声入力ボタン」が追加されるだけで良く、多数配置されたファンクションキーで足りないプログラム言語を音声入力する機能だけで、画面表示を妨げず且つ持ち替えも無く、プログラミング作業の最速化に寄与できる。
このように、汎用機（個人）から専用機（専門業）まで、画面タッチの有無や多機能マウスの有無などと組み合わせ、操作者の用途に適合した音声入力機能を付与したコンピュータプログラムの環境を提供できる。
なお、２０２０年からプログラミングは日本の義務教育に導入されるため、社会的貢献も期待できる実施手法である。

＜身体障碍者の入力における実施形態＞
特殊な例となるが、両上肢に障害を持つ者が使用する場合には、図１３（Ａ）に示すような、足踏みで操作できるタッチパッド１３０を使用することができる。
足踏みタッチで句読点を選択可能であり、足でポインタの移動を指示する位置指定領域１３１を備えたマウスの併用で、入力の支援を行うツールと成り得る。
かかる図１３（Ａ）に示す足踏みタッチパッド１３０においては、足の動きによる操作であることから、ダブルクリック処理の受付時間は比較的長く設定することが望ましい。
図１３（Ａ）に示す様に、左ボタン領域１３２及び右ボタン領域１３４は、通常のマウスの左ボタン及び右ボタンに該当する。
なお、片足だけが健常な場合を考慮し、左ボタン領域１３２の左端領域１３３、及び右ボタン領域１３４の右端領域１３５を指定すると、当該領域の指定状態が維持され、再度指定することにより、当該指定状態を解除するように構成することもできる。
また、足元スペースの制限やコスト観点から、一枚のマットを、句読点などの記号を指定する為の「句読点タッチ処理用のパッドと、通常のマウスとしての処理を行うパッドマウス操作」とで切り替えて使用する「句読点モード切替」指定領域１３６を設けることもできる。
当該指定領域１３６のタッチ後は、図１３（Ｂ）に示す句読点モードの足踏みタッチパッドに移行し、テキストの音声入力において、句読点等の入力補助が行える。
但し、コンピュータに関する〔００２７〕欄における認識前画面とは異なり、図１３（Ｂ）に示す位置指定領域モードの足踏みタッチパッドに移行する指定領域１３７として「マウス操作に戻る」を設ける。
また、かかる足踏みタッチのパッド１３０は、脳卒中などで右半身／左半身麻痺が発症した場合も有効に使用できる。
この場合、前述〔００５０〕欄で示した多機能マウスと、足踏み句読点パッドを組み合わせることで、健常者に近い速度で、コンピュータの入力や執筆作業が可能になる。
現代社会において、コンピュータを健常者同様に扱えるようになることは、身体障碍者の社会進出や労働力不足の解消にとても有効である。

『第２の実施の形態：スマートフォンサイズの携帯端末』
携帯端末、特にスマートフォンサイズの携帯端末については、より複雑となる携帯翻訳機で形成した音声入力装置の実施の形態に基づいて説明する。
よって、図１４の携帯翻訳機の初期画面に示すように、本実施の形態に係る音声入力装置は、母国語入力ボタン１４３と、相手方の外国語入力ボタン１４１の両方が存在する。
また両ボタンの中間に位置するＣボタン１４２については、画面内タッチ領域「一つ戻る」の機能に近い、クリア及びキャンセルを意味する「Ｃ」と、変換つまりチェンジ及びコンバージョンを意味する「Ｃ」を兼用しており、その使用法については後述する。
オンライン・オフライン状態を問わず、音声で入力可能な携帯翻訳機自体は既存商品が多数存在するが、母国語側を入力する際に、キーボードやマウスを接続せずに編集・修正等を可能とすることが、本実施の形態に係る音声入力装置の最大の特徴である。
母国語入力側の認識がそもそも間違っていれば、翻訳結果は当然間違った意味、つまり相手側の外国人に致命的な誤解を与えることから、携帯翻訳機において最も必要とされる能力になる。

図１４は、音声入力の言語が選択される前の画面である（以下「初期画面」とする）。
この音声入力携帯翻訳機では、国旗が各ボタン上に並列に表示されており、「何語と何語の翻訳機器」の意味を表した状態を示している。
外国語の種類設定を変更した場合や、電源を入れた直後状態の画面でもある。
この状態の国旗部分１４５を画面タッチすると、翻訳言語の選択設定画面に移行することができる。
なお、国旗自体は母国語と外国語ボタンの「ボタン色」と一致した色で囲われた状態で表示され、ボタンとの共通性を操作者や相手方の外国人に判りやすくしている。
当該のボタンと同色の囲みや、国旗の表示自体も半透明色で表示し、認識前画面内における句読点タッチ領域の説明が全く視認できない状態にならないように構成する。
また、国旗以外の空白部分を左フリック操作１４６することで機器のシステム設定の画面にジャンプし、右フリック操作１４７の場合は後述〔０１１７〕欄に記載のプレゼンテーション画面へジャンプする。

この初期画面において、仮に日本語から英語への翻訳を行う際には、音声入力ボタンの母国語入力ボタン１４３を押すと、画面１４４に並列表示している国旗に上下関係が発生し、図１５に示す画面例の通りであれば、日本語から英語へ翻訳する状況が視覚的に判る。
これは相手方の外国人に変化状態を伝え易くさせる為である。

この図１５は、一音声も機器が感知しない状態の句読点等の表示を示す。
配置の例としては、「数字優先」「英字優先」「カタカナ優先」「無変換」「（」『「』「記号及び設定画面」（この２項目は同一タッチ領域の中で交互に明滅している）「＠」「音声入力Ｌｏｃｋ」「単語」「※」「一つ戻る」などである。
この状態がコンピュータにおける認識前画面と同義の状態となる。
記号については、音声入力であっどまーく「＠」、くえすちょんまーく「？」と単発で指定する方法である。
単語については、事前登録を行い、操作の際は「単語」の指定領域を画面タッチで選択した後で、該当単語音声入力の出だしから予測変換され、この表示単語で正しいか否かの「Ｙ／Ｎ」表示部を画面に出現させ、例えば「Ｙ」の画面タッチで選択して当該単語を選択する。
頻繁に使う記号等を設定画面で自由配置できるのはコンピュータにおける〔００４６〕欄の場合と同様である。
また後述〔０１０８〕欄で示す修正・編集画面内でも、一部の句読点や記号はテキストの積み上がり後であっても後付け入力できる。

携帯翻訳機は専用機であり、背景色が一定で変化しないため、コンピュータの〔００３５〕欄で説明したような、クイックカラーチェンジは必要としない。
しかしながら「半透明句読点タッチ」であることは共通であり、視覚障がいの中の「色弱障がい」の場合、句読点が一色のみの場合視認出来ない可能性がある。
よって「桃色」「水色」「緑色」「橙色」の色調選択や、句読点タッチのカスタマイズはコンピュータ同様に行える。
携帯翻訳機（スマートフォンを含む）、以下のサイズの機器は、画面のタッチ領域の一つ一つの面積が小さく、コンピュータにおける「タッチ領域とは別個に設定画面に移行するアイコンをクリックする」手法が困難であるため、音声入力自体が機器本体へのコマンドを兼ねることができる。
これは後述の〔０１２３〕欄におけるタイプライターモードにおいて、その手法を説明する。

コンピュータの〔００４３〕欄にて説明した専用アイコンクリックと異なり、タッチ領域の一箇所に特殊な処理を掛けて、音声入力を用いずに設定画面に移行することもできる。
携帯翻訳機における設定画面へのジャンプと、その詳細について図１６及び１７を参照して説明する。
図１６（Ａ）は「記号及び設定画面」のタッチ領域１６１を長押し（２秒程度、以下同じ）し、「設定画面」へのジャンプ（遷移）を実行した状態を示している。
同一のタッチ領域に別々のコマンドを指定する手法と目的は次項にて説明する。
図１６（Ｂ）は、コンピュータ〔００４５〕欄の記載同様に、句読点タッチ領域の８０％程度への縮小と、それに伴い生じたスペースに「設定画面専用のタッチアイコン」１６２を表示した状態を示している。
更に当該設定画面専用のタッチアイコン１６２における上列専用タッチアイコンのうち「認識中画面」を選択し、音声認識中のタッチ領域区分けの画面を呼び出した状態を示している。
図１６（Ｃ）は「変換」のタッチ領域１６３を「記号」のタッチ領域の場所へ、ドラック＆ドロップ操作で移動している状態であり、手順や結果はコンピュータの例と同様である。
図１６（Ｄ）は「色調変更」のタッチ領域１６４を選択した場合の画面遷移を示している。
図１７（Ａ）は、後述〔０１２３〕欄に記載する、「タイプライターモード」での音声入力による機器への指示で、設定画面を呼び出す状況を示している。この例では、母国語入力ボタン１４３と、相手方の外国語入力ボタン１４１の両方の選択により、当該処理を実行している。
図１７（Ｂ）は「※」のタッチ領域１７１を長押しし、タッチ領域の移動や内容変更を受け付けている状態を示している。
図１７（Ｃ）は、音声入力を再度開始し、「音声太郎」と自身の名前をタッチ領域として設定する状況を示している。
その範囲指定や画面の遷移は、後述の〔００９１〕欄において説明する。
図１７（Ｄ）は、句読点タッチ領域の「決定」を確認している状態を示しており、「Ｙ」をタッチすることで決定され、「Ｎ」のタッチで「一つ戻る」が選択されたものと同義となる。

句読点等タッチ領域のカスタマイズの各種の移行方法と設定（句読点のカスタマイズ）画面のレイアウト、設定できる項目（色調・フォント・分割数及び配置など）については、図１８にて説明する。
この図１８において、カギ括弧『「」』、句点「。」、読点「、」、丸括弧「（）」等は、相互にドラッグアンドドロップで表示位置の交換が可能であり、エクスクラメーションマーク「！」の表示領域を長押し後、音声入力「アットマーク」で「＠」を入力できる。
また「単語登録」の表示領域を長押し後、「新規／変更？」の確認から音声入力で、漢字と読みかなをそれぞれ入力し単語の登録をする。
図１７内の記号と設定画面は前項の通り交互に明滅しており、タッチしてすぐ離せば「次の一フレーズ音声入力は記号選択のコマンド」に機器側の認識が変化することになるが、一定時間以上同箇所のタッチ領域を押したままの場合は、設定画面へのジャンプコマンドとして機器側が認識するものである。
このように限られたタッチ領域に「兼用」を掛けるものである。
なお、兼用は必須ではなく、設定画面内で記号を削除（色調反転後の右フリック操作）で「設定画面へのジャンプ」の単独タッチにもカスタマイズできる。
ほか、タッチ領域の入れ替えや変更はコンピュータの〔００４６〕欄に記載した手法に準じるが、キーボードは存在しないため、新しい句読点や単語の登録方法は、既存のタッチ領域の一定時間長押し色調反転後に音声入力にて行う。
手法自体は後述〔００９１〕欄に記載の誤認識時の言い直し操作と同様である。

また操作者が音声入力の実施中に、操作や音声入力する内容・構成を大きく失敗したり、操作に混乱した場合には、後述の「一つ戻る」（若しくはＣボタン）指定領域の画面タッチを長押しすることで、音声入力ボタン前の初期画面（国旗並列状態で句読点タッチの無い画面）に戻る。
全て一からやり直す「リセット操作」の意味合いを持つ。

コンピュータにおける〔００３８〕欄の記載と同様に一音声でも機器が認識すると、上下関係が生じていた国旗表示は消えて、音声認識されたテキストが積みあがるのと同時に、図１９の認識中画面に示すように、音声入力時に使用する次の句読点候補表示の画面に自動遷移する。
配置の例としては、「。」「、」「変換」「（」『「』「改行」「）」『」』「音声入力Ｌｏｃｋ」「単語」「記号」「一つ戻る」などである。
仮に音声入力したまま、機器本体のＡＩによる自動変換で、入力したい母国語テキストが初めから正確に完成されていたら、音声入力ボタンを離すことで、インターネット等を介して翻訳用ＡＩに送信され、翻訳結果を待つことになる。
つまり、以降説明する各種の修正や編集の手法は「もし間違いの発見や修正したい箇所があった場合」の説明であり、現行の修正・編集のできない音声入力の携帯機器に対して、本発明はレスポンスの面で全くデメリットが存在しない。
なお、図１９内のテキストにおいては、コンピュータの〔００５５〕欄と同様の認識誤りが発生している状況と仮定して表示させている。
また、修正が可能になる性質上、長文の入力ケースが増えることが予想され、画面内に音声入力で積み上がったテキストが入りきらない場合、後述〔００８９〕欄に記載の編集・修正画面で多用するスクロールバー同様の「画面位置選択縦バー」が自動出現する。

文章の構成全体に失敗したと操作者が判断した場合、音声入力ボタンを離さないまま、Ｃボタン１４２を押してすぐ離すと「クリア」の処理が実行されて、全文が消去され、前記図１５に示した認識前画面に戻る。
つまり、国旗の上下関係と句読点タッチ表示は維持されるが、今まで音声入力したテキストだけは全て消えて、やり直しの状態になる意味である。
これはリセット操作の〔００８４〕欄の記載と異なり、音声認識を継続したまま「冒頭から言い直す」状況へ操作できる方が、携帯翻訳機のインターネット環境への接続の繰り返しが起きないため、機器への負荷（接続エラー）やレスポンスの面で有利になるからである。
もしもその後で音声入力ボタンを離せば、〔００７８〕欄の記載と同様に国旗並列の初期画面に戻ったり、外国語ボタン１４１を押せば、すぐ英語から日本語に翻訳する認識前画面になる。
この場合は翻訳ＡＩとの接続カットや、選択する外国語によってはインターネット内に存在する別の翻訳ＡＩの選択し直し（再接続）が発生する。
また、外国語ボタン１４１を押した場合、設定によっては後述〔０１２０〕欄に記載の通り画面の天地表示は逆になる。

音声入力ボタンから指を離さず、若しくは「音声入力Ｌｏｃｋ」の選択領域を画面タッチ後に音声入力ボタンを離しても、コンピュータにおける〔００２９〕欄の記載と同様に、音声入力ボタンは押され続けている物と定義される。
これは長文を入力する際に、コンピュータ同様に操作者の負担を軽減する為であり、解除の手法も〔００３０〕欄の記載と同様にＬｏｃｋを再度タッチして離した瞬間に実行される。

本実施の形態に係る携帯翻訳装置は、コンピュータにおける〔００５５〕欄の記載と同様、ある程度テキストが積み上がった状態で、一定時間音声入力無音状態を機器が感知すると図２０に示す様に、編集・修正画面に自動遷移する。
句読点タッチ項目等の配置の例としては、左上から右下にかけて『「』『」』「。」「、」「一つ戻る」「変換」「？」「！」「初期句読点に戻る」などを設けるものである。
操作者が話す内容に迷ったり、言い淀んで意図せずこの画面に遷移しても、追加で音声入力を続ければ、図１９に示す認識中画面に戻り、末尾に音声入力でのテキストが積み上がることは変わらない。

本実施の形態に係る携帯翻訳装置は、コンピュータと異なり、キーボードだけではなく、マウスに相当する機能も存在しないため、編集・修正画面において、修正したい個所の指定は機器本体画面（タッチパネル）に指で画面タッチをすることになる。
よって図２０に示す編集・修正画面に遷移すると、それまで入力したテキストは自動的にフォントが拡大され、字間も空白の広いレイアウトに変化する。
そのため、図１９に示した認識中画面の状態では、画面内に全テキストが収まっていても、図２０に示す編集・修正画面に遷移した瞬間に、フォントと字間の拡大及び補助入力表示部２０３の出現により、修正テキスト入力画面２０１内に収まらなくなるケースは多く、縦スクロールバー２０２による表示画面位置の移動機能は必須の物となる。

コンピュータに比べて画面サイズがより小型化する携帯機器などについては、編集・修正画面のタッチ領域分割数をデフォルト（初期値）では９分割としており、コンピュータよりも領域数が減少するため音声入力Ｌｏｃｋタッチを配置していない。
よって当該ロックの解除（携帯翻訳機においては、編集・修正作業が完了し翻訳ＡＩに送信する行為）を行いたい場合、コンピュータでの、段落番号〔００２９〕欄に記載のマウス側に音声入力ボタンの解除権を取り戻す操作を応用し、「音声入力ボタン（母国語ボタン）を押してすぐ離す操作」だけでＬｏｃｋ解除を可能とする。
勿論、認識前画面等で音声入力Ｌｏｃｋタッチを行わず、終始音声入力ボタンを押したまま編集・修正画面に遷移している場合、翻訳ＡＩへの送信は当該音声入力ボタンを「離すだけ」となる。
このようにタッチ領域数が減少する状況を、元々存在する物理ボタンで同様操作の代用とするものである。
これは更に画面サイズが限定される、後述のスマートウォッチにおいても同様である。

ここで図２１の画面遷移図を参照しながら、編集・修正の具体的方法を説明する。
例文については、コンピュータに関する〔００５５〕欄に記載の物と同様であり、以下コンピュータにおいても、音声入力ボタンを離さないまま、キーボードを使用せずに画面タッチだけで、今後説明する同様の操作は全て可能である。
本実施形態で音声入力した例文『音声入浴でも「修正」や「言い直し」などの編集が可能です』における「入浴」を「入力」に修正する場合を例に説明する。
図２１に示す様に、先ず、「入浴」を「入力」に変更する場合（即ち、誤認識の修正）には、図２１（Ａ）の認識中画面において、音声入力無音状態とすることにより、図２１（Ｂ）に示す編集・修正画面を表示させる。
そして操作者は、この編集・修正画面において、まず修正したい誤フレーズの起点２１１と終点２１２の字間を指で画面タッチして選択する。
これにより機器側は当該起点と終点のテキストを入れ替えたいフレーズの「目的位置」として一時記憶する。
この瞬間、表音文字が明確な言語（日本語など）は、指定範囲全てがひらかなに戻る。
操作者が誤認識なのか、同音異義語だったのかの視認を改めて行えるようにする為である。
「一つ戻る」の選択領域の画面タッチは誤った句読点等を消すほか、始点・終点の位置の画面タッチの操作を誤った場合にも使用する。
そして、そのまま新たな音声入力を加えると、機器側は「上書きしたいフレーズ」として一時記憶する。
この新たな音声入力のテキストが画面内に積み上がる際は、図２１（Ｃ）の修正テキスト入力画面２０１を表示させ、今まで入力した全文が一時的に画面から消え、言い直している部分のテキストしか画面に出ない処理を実行する。
しかしながら単独フレーズで「にゅうりょく」とだけ話しても、機器側におけるＡＩでの認識は文章の前後から単語を推測するため、変換精度が低下してしまう。
よって、操作者は、例えば「こんぴゅーたににゅうりょくする」のように、目的である「入力」のテキストが出やすい内容を予測して、音声を発する。
その後、入力テキスト部分の字間の起点２１１・終点２１２を画面タッチして選択することで、「上書きしたいフレーズの内容指定」が確定し、図２１（Ｄ）に示す様に、当初の「入れ替えたい目的位置のフレーズ部分」に入れ替わることで修正結果を得ることができる。
目的単語を得るために、連想して音声入力を行ったとしても、同音異義語が選択されてしまったり、指タッチでの位置指定を誤る可能性はあるため、「変換」と「一つ戻る」タッチ領域は言い直しテキスト視認の障害になり難い、右下の空白部に設定される。
なお、追加言い直しの音声入力のうち範囲指定外の「こんぴゅーたに」及び「する」の部分テキストは「入力」を得る為の一時的な物であり結果的には無視しデータは廃棄するものである。

なお、英語入力での言い直しの具体例は以下の通りである。
例文「Ｐｌｅａｓｅｔｅｌｌｍｅｈｏｗｔｏｏｐｅｒａｔｅｔｈｉｓｍａｃｈｉｎｅ．（この機械の操作方法を教えてください、の意味）」について、機器側は「Ｐｌｅａｓｅｔｅｌｌｍｅｈｏｗｔｏｏｐｅｎｉｔｗｉｔｈｔｈｉｓｍａｃｈｉｎｅ．」（この機械で開く方法を教えてください、の意味）と、一部分だけ誤認識されてしまったとする。

この場合には「ｏｐｅｎｉｔｗｉｔｈ」部を範囲指定したうえで、「Ｈｏｗｔｏｏｐｅｒａｔｅｔｈｅｍａｃｈｉｎｅ．」（機械の操作方法）と略して操作者は再度音声入力を行い、得たい認識結果が画面に表示された時に、「ｏｐｅｒａｔｅ」部の起点と終点部の画面をタッチして選択する。
これによって、最初に位置指定された「誤ったフレーズ」と２回目の音声入力の「得たいフレーズ」が入れ替わり目的を達する処理がなされる。

また、次に図２１（Ｅ）を参照しながら、「など」を「等」に変更する場合（同音異議語の再変換など）の操作・処理を説明する。
その際「など」の起点２１１・終点２１２の指定は前述〔００９１〕欄に記載の修正したい目的位置の通りである。
そして変更対象を指定した後に、「Ｃボタン１４２」（画面内に変換タッチを設定している場合は「変換」タッチ）を押して選択すると、「チェンジ：ｃｈａｎｇｅ若しくはコンバージョン：ｃｏｎｖｅｒｓｉｏｎ」（変換の意味）の処理を実行する。
編集・修正画面において、修正範囲指定後のＣボタン１４２等の選択は、前記音声入力処理時等におけるクリアやキャンセルの処理ではなく、「変換」の処理を実行するようにプログラムで設定する。
これらは、例えば、コンピュータでの文章入力において、入力済のテキストをマウスで範囲指定し色調を反転させてから、変換キーを押したのと同じ処理である。
「Ｃボタン１４２」を独立設定するのは、使用頻度が高い携帯翻訳専用機ならではの機能であり、コンピュータやスマートフォンの場合は「変換」はキーボードや画面のタッチ領域の一つとなる。

変換候補のパターンについて説明する。
再掲になるが、基本的に変換は起点・終点の位置指定後に、まず選択領域のテキストが「全てひらかな化」される。
次の変換タッチ（若しくはＣボタンの選択）で「最初にＡＩが選択した以外の次の漢字候補を数例」→「全カタカナ」などが変換されて行く。
例えば、（目的文）「この件について誤って○○○を変換した。」と入力したい場合に、機器側から「この件について謝って○○○を返還した。」と同音異義語に認識された場合、起点・終点の選択で「謝って」を起点・終点操作で選択すると、「あやまって」の平仮名に変換される。
そしてこれを操作者は確認し、変換タッチ（若しくはＣボタン）を複数回押して、「あやまって」を「過って」→「誤まって」→「誤って」と変換し、目的とするフレーズが出たら変換タッチ（若しくはＣボタン）を離さず一定時間長押しすることで確定する。
そして次の「返還」の誤認識部の再変換の為の起点タッチへと、前記同様の操作を続ける。
なお、変換決定コマンドとしてのＣボタンの長押しは〔００８４〕欄の記載における「リセットして初期画面に戻る」とは別のプログラムであり、変換候補選択中は適用されない。
仮に変換タッチを押しているうちに、目的とする変換候補が行き過ぎてしまった場合には、「一つ戻る」領域を画面タッチすることで、一つ前の候補に戻ることができる。
その際は「一つ戻る」タッチ直後、戻った目的の変換候補が表示されたあと、機器側が（Ｙ／Ｎ）の選択肢を表示しＹＥＳで決定する。
Ｎｏの場合は同音異義語の変換タッチ（若しくはＣボタン）を再継続できる。

現状のコンピュータの一般的な変換は候補が非常に多く、次々と変換候補が出続けることがあるが、携帯端末の場合は操作上のストレスになるので、候補打ち切りはコンピュータより早くするのが望ましい。
後述〔０１０２〕から〔０１０７〕欄に記載する「後から別の言い方で、付け加えてから移動・削除」の処理を実行した方が効率的だからである。

携帯翻訳専用機（若しくは翻訳アプリケーションをインストールしたスマートフォン等）に限定する機能であるが、変換候補内に「ダブルクォーテーション内のローマ字」が設定される。
現在のオンラインＡＩ翻訳において、翻訳対象から外して「母国語の原音表現」を外国人側に伝達する場合、この変換候補は必要になる。
なおＡＩは日々進化しており、将来的には翻訳のルールが変わる可能性はある。
例文を示すと「この曲名は日本語ではさくらんぼと発音します。意味は果物のさくらんぼです。」を、現状のＡＩ翻訳を使用して英語に翻訳した場合には、「ＴｈｉｓｓｏｎｇｎａｍｅｉｓｐｒｏｎｏｕｎｃｅｄｃｈｅｒｒｙｉｎＪａｐａｎｅｓｅ．Ｔｈｅｍｅａｎｉｎｇｉｓｆｒｕｉｔｃｈｅｒｒｉｅｓ．」となり、また中国語に翻訳した場合には、「▲這▼个曲名用日▲語友▼音▲為▼櫻桃。意思是水果的櫻桃。」となり、意図を伝達できない。
そこで、入力側の日本文に工夫を加え、一回目のさくらんぼの入力時に変換タッチを繰り返し、ダブルクォーテーション内のローマ字の"Ｓａｋｕｒａｎｂｏ"を選択して「この曲名は日本語では"Ｓａｋｕｒａｎｂｏ"と発音します。意味は果物のさくらんぼです。」と入力して、ＡＩ翻訳に送信する。
これにより英語では「Ｔｈｉｓｓｏｎｇｉｓｐｒｏｎｏｕｎｃｅｄ "Ｓａｋｕｒａｎｂｏ" ｉｎＪａｐａｎｅｓｅ．Ｔｈｅｍｅａｎｉｎｇｉｓｆｒｕｉｔｃｈｅｒｒｉｅｓ．」となり、また中国語では「▲這▼个曲名用日▲語友▼音▲為▼"Ｓａｋｕｒａｎｂｏ"。意思是水果的櫻桃。」となり、正確な翻訳結果を得ることができる。
そしてその後に、現状のインターネット内の一般的翻訳ソフトの音声出力マイクアイコン等をクリックしても、日本語の発音に近い「さくらんぼ」は聞き取ることができ、目的を達する。
これは、自分の名前を紹介する場合にも、ＡＩ側に勝手に翻訳されてしまうことを防ぐ変換手法となる。

同音異義語の特殊変換操作について説明する。
これは日常的にあまり使わない、変換候補の下位の同音異義語からなる文章内容を作成したい時に使用する手法である。
例文「教会からの宣託を受けました。」これが目的文である。
誤認識「教会からの選抜を受けました」「宣託」が周囲環境や機器側の誤認識で「選抜」と認識されてしまったものと仮定する。
前記〔００９１〕欄に記載の手法により、「選抜」→「宣託」に言い直し操作を掛けたとする。
様々な手法（表現）で言い直しても日常使用される機会が少ない「宣託」が得られない、次々と「選択」「洗濯」「洗たく」「せんたく」「センタク」「"Ｓｅｎｔａｋｕ"」などしか候補が出現しない場合は手詰まりが発生してしまう。
よって、変換タッチ（若しくはＣボタン）を押したままの状態で「ゆっくり・はっきり一単語だけ」の発声で「せ・ん・た・く」と音声入力を開始し、「く」の字の発声と同時に変換タッチ（若しくはＣボタン）を離すと、「せんたく」のひらかなが色調反転して、変換待ちの状態でテキスト化される。
通常のキーボード入力で日本語を入力した状態と同様に、テキスト入力直後に最初から変換キーが押される状況を待っている状態（色調反転若しくは波下線の状態のテキスト）と同じである。
この場合、携帯翻訳機などであっても通常のコンピュータキーボード入力同様に変換候補の下位まで延々と候補が出現し、これで目的の「宣託」を得ることができる。
なお、通常の再変換操作は編集・修正画面内において行われるが、この「ゆっくり・はっきり一単語だけ」の入力時については、音声認識画面中において行う操作なので、変換タッチ（若しくはＣボタン１４２）も、この画面内のままで直接受け付ける。
もし「ひらかなに戻すだけの」操作目的だった場合、編集・修正画面でひらかなに戻したあと、別の修正箇所移行や追加音声入力をした時と同様に、「ひらかなのまま」当該テキストは残されて、別の操作（タッチ）や追加音声入力のテキスト表示に移行するだけであり、全ひらかな化への応用、つまり初期設定では認識中画面には存在しない「無変換タッチ」の代用も兼ねる操作法となる。

もしも、こうした操作を頻繁に用いたいと操作者が考えた場合は、Ｃボタンが元々存在する携帯翻訳機であっても、コンピュータに関する〔００４６〕欄の記載の手法と同様にカスタマイズを掛け、認識中画面内にも「変換」のタッチ領域を追加することができる。
但し、Ｃボタンと変換タッチが同時に押されることは矛盾操作にも繋がるため、Ｃボタンが別途存在する機器について、変換タッチが認識中画面側に追加設定で存在する場合は、Ｃボタンに「変換」のコマンド権は与えられず、クリア・キャンセル専用のコマンドボタンとなるようプログラムする。

前項のように変換タッチをカスタマイズで設定せず、Ｃボタンと兼用している場合、通常は、〔００８４〕欄の説明の通りＣボタンの長押しは全クリア操作となってしまう。
しかし「長押し全クリア」が実行されるまでの約２秒の間に新たな音声入力を機器側が感知した場合は、全クリアのコマンド認識はキャンセルされ、「ゆっくり・はっきり一単語」のひらかなテキスト化の認識側が優先される。

また、マウスを伴っていない携帯端末以下のサイズの機器においても、本発明では音声入力した文章に対しての挿入は以下の要領で行える。
図２０に示した編集・修正画面において、表示領域２０１に表示されたテキストの一点だけ字間を画面タッチにより指定して音声入力を追加で開始すると「フレーズの挿入」処理を実行するように構成する。
図２２（Ａ）に示す様に、例えば「この新型機の特徴は言い直しや再変換ができる所です。」と一旦音声入力したテキストに、後から「及び各種の編集」のテキストを、入力済みである「再変換」の後の位置に追加したい場合には、音声入力ボタンをオンにした状態で一定時間の無音状態を維持して、図２２（Ｂ）に示したような編集・修正画面を表示させる。
そして表示領域２０１に表示されたテキストにおいて、「再変換」と「ができる」の字間２２１を、指での一点タッチによって指定した後に、図２２（Ｃ）に示す様に、追加するテキスト「及び各種の編集」を発音して音声入力し、この修正テキスト入力画面において、音声入力でテキスト化された「及び各種の編集」における入力始点２１１と終点２１２を指定する。
これにより、図２２（Ｄ）に示す様に、当該「及び各種の編集」のテキストが、前記画面タッチによって指定した位置（「再変換」と「ができる」の字間）に挿入され、「この新型機の特徴は言い直しや再変換及び各種の編集ができる所です。」となり目的文を得ることができる。

挿入操作は、別の手法でも行える、これは追加音声入力や移動・削除を伴った挿入操作である。
例文（目的文）「こんにちは、商品棚の果物はとても美味しそうです。飾ってあるりんごとバナナを、各一個ずつ買いたいです。私の所持金は見ての通りですが、足りるでしょうか？」
機器の認識テキスト「今日は、商品棚の果物はとても美味しそうです。飾ってあるりんごとバナナを、各一個ずつ買いたいです。私の所持金は見ての通りですが、タイルでしょうか」と２箇所誤っている箇所が生じたと仮定する。
１箇所目「こんにちは」が→「今日は」に変換されている、翻訳結果は「Ｈｅｌｌｏ」→「Ｔｏｄａｙ」になってしまう。
２箇所目「足りる」が→「タイル」に誤認識。
※これらは実際に現行の音声入力携帯翻訳機での誤認例を参考にしている。
また、更に操作者は当初の音声入力の最中に「レモンも一緒に購入したい」と考えたものと仮定する。

操作者は誤認識を把握しつつも、まず「レモンも購入の意思があること」を続けて入力する手法を実施する。
但し「レモン」と単独で発声しても、りんご"と"バナナのように、間に繋ぐ"と"が得れない、完成目的文である「りんごとバナナとレモン」を得るためには、追加の音声入力で得たい目的テキストは「とレモン」になる。
こうした送りかなや助動詞と融合した名詞は、単独の音声入力ではＡＩは生成できない。
例えば「オレンジとレモンジュース」のように、ＡＩ側が推測できる追加発声から「とレモン」を切り取り・貼り付けする必要があると言うことである。
この場合、操作者は「こんにちは（誤今日は）、商品棚の果物はとても美味しそうです。飾ってあるりんごとバナナを、各一個ずつ買いたいです私の所持金は見ての通りですが、足りる（誤タイル）でしょうか」の後に続けて「オレンジとレモンジュース」との音声入力を続行する。

その後音声入力ボタンを一定時間の無音状態から、図２０に示したような編集・修正画面に遷移する。
以後通常の再変換・言い直しのほか、移動・削除を伴う編集・修正の手順を説明する。
誤りの１箇所目は２点（〔００９１〕欄の記載における始点・終点）指定で全ひらかな化で「こんにちは」に戻し目的を達する、再変換や言い直しの待機状態で「こんにちは」は反転色調になっているが、誤り２箇所目の「タイル」の起点をタッチした時点で〔００９１〕欄の記載内の定義の通りそれは解除される。
誤り２箇所目は２点指定後の追加音声入力で、「足りる」の単語発声では同じ機器なので再度「タイル」と再誤認識される可能性が高いため、「じゅうぶんにたりる」と連想入力し〔００９１〕欄に記載の通り「足りる」部分だけを起点・終点指定で決定して、ここまでは目的を達する。

図２０に示したような編集・修正画面において、修正テキスト入力画面２０１に表示されているテキストの起点２１１・終点２１２を画面タッチで選択後する際に、終点における画面タッチを一定時間以上離さないと「指定フレーズの移動・削除」の受付状態と認識させる。
この状態になると、色調が反転し操作者は移動・削除が可能になった文字列と判別できる。
なお、たまたま一単語だけの移動目的での終点タッチの後に〔００９１〕欄記載の定義により、全てひらかなに一旦変化しても終点タッチを離さず一定時間を経過し「移動・削除可能状態」になると、最初にＡＩが選択していた変換候補に戻る。
また、例文とは異なるケースだが、長文（段落全てなど）を起点・終点の位置指定の対象にした場合、操作当初から移動・削除の範囲指定と認識され、一定時間を待たず指定範囲内の全テキストの色調は反転する。
移動・削除目的だけの範囲認識であり、その後の変換タッチには反応しない。
これはコンピュータおいても、広範囲（一行程度以上）を範囲指定してから変換キーを押しても反応しないのと同義で、ＡＩが変換候補を生成できないからである。

例文の「とレモン」を移動する操作手順の場合、編集・修正画面に移行させた後において、縦バーを操作し、末尾部まで画面を移動させ、表示領域内において、「（前文略）…オレンジとレモンジュース」の部分における「とレモン」の始点を選択し、終点を指定した状態を維持して、色調を反転させてから、当該「とレモン」の文字列を「バナナ」と「を」の字間に移動させ、指を画面から離すことで指定位置に「とレモン」が挿入される。
コンピュータにおける、マウスで範囲指定後にその部分を移動して置くのと同様の操作になる。
または、現状のタブレット端末などにおける「スワイプ操作」と同様の操作イメージになる。

結果的に「とレモン」を得るために行った追加音声入力の「オレンジジュース」が残されることになり「削除」が必要となる。
削除についての操作法は〔０１０５〕欄に記載の通り、終点の位置指定をして指を離さず、移動・削除の受付を示す色調反転表示に遷移させるまでは同様である。
その後、当該部分を素早く大きく「右フリック操作」を行うことにより、選択フレーズを放り投げるイメージ通りに、選択したテキストの「削除」となり、そのテキストの空白部は詰める処理を行う。

また、当該編集・修正画面の外周の補助入力表示部１５３に存在する「！」「？」等のキャラクターも、選択後にマークを段落番号〔０１０５〕欄に記載した移動手法（この場合長押しの時間経過は不要である）により、当該選択したキャラクターを引っ張って置く操作の「後付け句読点等」とすることができる。

勿論〔０１０１〕欄に記載の手法の通りバナナの「ナ」と「を」の字間の一点だけをタッチして指定し「オレンジとレモンジュース」を音声入力で追加し、「とレモン」だけを選択すれば同じ結果を得ることはできる。
しかしながら、この手法の場合、編集・修正画面に２回の画面遷移が生じることになる。
また、音声入力それ自体も、主文入力と追加入力の「オレンジとレモンジュース」について、編集・修正画面へ遷移してから２回に分けて発声することになる。
前記〔０１０３〕欄での説明の通り続行して音声入力することで、画面遷移も発声も一まとめにできる為、結果的には〔０１０３〕欄以降に記載の手法の方が省力化できる。
また、現在市販されている音声入力携帯翻訳機は全て、言い直し・再変換・編集・修正及び加除移動は不可能であり、間違いを発見したら、音声入力を最初から行わなければならない。
本発明における各手法で入力最中に誤認識や同音異議語を操作者が発見しても、「後から幾らでも修正できること」は操作者の精神的負担も軽減できるもので、一気に最後まで言い切ってしまう方が、都度言い直しや編集・修正画面への遷移を掛けるより、結果的に早いものとなる。

以上の移動・削除のイメージを説明するため、図２３を参照しながら、手順（Ａ）～（Ｆ）を別途説明する。
手順（Ａ）：「今日は」を起点・終点位置指定し、全ひらかな化（変換タッチは押さない）。
手順（Ｂ）：「タイル」を起点・終点位置指定し、更に音声入力追加「じゅうぶんにたりる」、から得られた「足りる」部分だけを起点・終点指定。
「る」の終点タッチと同時にタイルとの入れ替わりが起こる、なお起点・終点の位置指定を誤った場合は「一つ戻る」タッチで操作履歴が一つ戻る。
手順（Ｃ）：「とレモン」の起点・終点を位置指定し、終点位置指定の指を離さず、移動可能状態（色調反転）を待つ。
手順（Ｄ）：バナナの「ナ」と次の「を」の間に、手順（Ｃ）の指を離さないまま移動する。
手順（Ｅ）：追加音声入力で残された「オレンジジュース」を起点・終点指定し、終点の指を離さず色調反転を待ち、反転後は右フリック操作で削除する。
手順（Ｆ）：外枠アイコン部から「？」を引っ張り、文末に移動させる。

ここまでの正確な音声入力文章を作成した結果において、これを英語に翻訳した場合（但し、以下の例はＡＩ翻訳なので必ず同じ翻訳結果になるとは限らない）には「Ｈｅｌｌｏ，ｆｒｕｉｔｏｆｔｈｅｓｈｅｌｖｅｓｉｓｖｅｒｙｄｅｌｉｃｉｏｕｓ．Ｉｗｏｕｌｄｌｉｋｅｔｏｂｕｙｏｎｅｄｅｃｏｒａｔｅｄａｐｐｌｅ，ｏｎｅｂａｎａｎａａｎｄｏｎｅｌｅｍｏｎ．Ｍｙｍｏｎｅｙｉｓａｓｙｏｕｓｅｅ，ｉｓｉｔｅｎｏｕｇｈ？」となる。
これを現状のインターネット内のＡＩ翻訳で逆転翻訳（〔０１１８〕欄参照）をかけた場合には、「こんにちは、棚の果物はとても美味しいです。飾られたリンゴ１個、バナナ１個、レモン１個を買いたいです。私のお金はあなたが見るとおりです、それで十分ですか？」との正確な翻訳結果が得られる。

携帯翻訳機は、その特性上完成文を得るまでに音声入力ボタンを離すこと（又はＬｏｃｋを解除すること）はできない。
インターネット内の翻訳ＡＩに送信されてしまった後では、操作者の手を離れた「外国語テキスト」に変化するからである。
よって、本文の冒頭ではなく中間位置に「英字・数字等が組み合わさった特殊な固有名詞」が必要になった場合の対応手法を説明する。
例えばコンピュータの英字優先・数字優先について〔００３２〕欄で説明した、「Ａ５版」と言う固有名詞を全文の「中間部」に入れる場合などである。
例文（目的文）「現場で使用するので、Ａ５版の縦書きで提出すること。」
このような場合、コンピュータなどであれば、前記の「離すことができない」制約が無いので「現場で使用するので、」の音声入力後に一旦ボタンを離して、そこまでのテキストを固定してから音声入力を再開すれば、「Ａ」と「５」を冒頭にできるので、入力操作上問題が無い。
しかし翻訳機だけは先の制約の都合上それはできない為、「初期句読点に戻る」との特殊なタッチ領域を設定することで課題を解決する。
音声入力が「現場で使用するので、」まで進んだ時点で、図２０の編集・修正画面内の「初期句読点に戻る」の領域をタッチして図２４の初期句読点画面に遷移させる。
これにより本文の音声入力の途中であっても、通常は認識前画面に存在する「本文冒頭の優先認識」を呼び出せるようになり、特殊な固有名詞（英字・数字の組み合わされた施設名やアーチスト名）などに対応ができるようになる。
なお、これは頻繁に使う機能では無いので、初期値（デフォルト）の句読点タッチ領域には割り振られず、〔００４６〕欄等に記載の手法によりカスタマイズで認識中画面や編集・修正画面内に選択できるものとする。
配置の例としては、「冒頭英字／ＣａｐｓＬｏｃｋ２４１」「冒頭数字／全角・半角２４２」「冒頭無変換／全ひらかな２４３」「一つ戻る」「冒頭カタカナ／全角・半角２４４」「句読点通常に戻る２４５」「単語登録」などである。

また、外国語ボタンで入力する場合、補助入力表示部２０３に表示させる制御文字文法や句読点などの記号は、その言語のルールに従って変化させる。
英語で音声入力する場合、当然英字優先やカタカナ優先の認識タッチ領域は必要が無い。
その代わりに「ＣａｐｓＬｏｃｋ」で大文字・小文字などの指定領域が文法上必要になる場合がある。
また、中国語の句読点は「。」「、」と「，（カンマ）」の３種が存在する。
そうした外国語の各種パターンの例について、英語での音声入力の場合における認識前画面は、図２５（Ａ）に示す様に「Ｎｕｍｂｅｒｐｒｉｏｒｉｔｙ（数字優先）」「Ｅｎｇｌｉｓｈａｂｂｒｅｖｉａｔｉｏｎｐｒｉｏｒｉｔｙ（英略字優先）」「ＣａｐｓＬｏｃｋ」「＄」「（」「"」「ｓｙｍｂｏｌ（記号）」「Ｓｅｔｔｉｎｇｓｓｃｒｅｅｎ（設定画面）」（この２つは同一領域に混在）「＠」「ＶｏｉｃｅｉｎｐｕｔＬｏｃｋ」「Ｒｅｇｉｓｔｅｒｅｄｗｏｒｄｓ（登録単語）」「※」「Ｇｏｂａｃｋｏｎｅｓｔｅｐ（一作業戻る）」からなる補助入力表示部とすることができ、また認識中画面は、図２５（Ｂ）に示す様に「．」「，」「：（コロン）」「（」「"」「ｎｅｗｌｉｎｅ（改行）」「）」「"」「ＶｏｉｃｅｉｎｐｕｔＬｏｃｋ」「Ｒｅｇｉｓｔｅｒｅｄｗｏｒｄｓ」「ｓｙｍｂｏｌ」「Ｇｏｂａｃｋｏｎｅｓｔｅｐ」からなる補助入力表示部とすることができ、更に編集・修正画面においては図２５（Ｃ）に示す様に「"」「"」「．」「，」「Ｇｏｂａｃｋｏｎｅｓｔｅｐ」「ｃｈａｎｇｅ若しくはｃｏｎｖｅｒｓｉｏｎ」「？」「！」「－（ハイフン）」からなる補助入力表示部とすることができる。
なお、英略字優先の定義は当該タッチの後に、例えば「ＵｎｉｔｅｄＮａｔｉｏｎｓ」（国際連合の意味）と音声入力した場合、自動的にダブルクォーテーションで囲まれた「"ＵＮ"」と言う英字の頭文字に略された固有名詞として認識される確率を上げるプログラムである。
同様に中国語での音声入力の場合における認識前画面は、図２５（Ｄ）に示す様に「号▲碼優▼先（数字優先）」「字母▲優▼先（英字優先）」「＃」「"」「（」「《」「▲簽▼收（記号）」「▲設▼定画面」（この２つは同一領域に混在）「＠」「▲語▼音▲輸▼入固定（音声入力Ｌｏｃｋ）」「注册▲詞▼（登録単語）」「※」「返回一▲項▼任▲務▼（一作業戻る）」からなる補助入力表示部とすることができ、また認識中画面は、図２５（Ｅ）に示す様に「。」「，」「、」「"」「（」「《」「"」「）」「》」「注册▲詞▼（登録単語）」「※」「▲語▼音▲輸▼入固定（音声入力Ｌｏｃｋ）」からなる補助入力表示部とすることができ、更に編集・修正画面においては図２５（Ｆ）に示す様に「。」「，」「、」「（」「返回一▲項▼任▲務▼」「）」「？」「▲轉換▼次数（変換）」「：」からなる補助入力表示部とすることができる。
なお外国語による音声入力の事例は、英語と中国語のほかにも、選択言語に応じて表示される句読点や説明文は変えることができる。
例えばアラビア語の場合には、「？」マークは左右逆、「、」は上下逆などとなり、フランス語の一操作戻るは「Ｒｅｃｕｌｅｒｄ'ｕｎｅｏｐeｒａｔｉｏｎ」、冒頭数字は「Ｐｒｉｏｒｉｔe ａｕｘｎｕｍeｒｏｓ」などが初期設定される。
なお全て、コンピュータに関する〔００４６〕欄の記載と同様に、各半透明句読点タッチはカスタマイズが可能である為、あくまで一例である。

そして上記の様に英語等で音声入力する場合であっても、再変換の処理を指示する変換タッチ（若しくはＣボタン１４２）を設けるのが望ましい。
何故ならば、日本語などの漢字圏より必要性は乏しいものの、英語でも「Ｈｏｍｏｎｙｍｓ：ホモニム」と呼ばれる同音異議語が存在するからである。
例えば、「ａｄ（広告）」と「ａｄｄ（加える）」や、「ｂａｌｌ（玉）」と「ｂａｗｌ（怒鳴る）」などである。
現在のＡＩでは、文章の前後から何れの語句かを自動選択しているが、一旦誤ってＡＩ側に選ばれてしまうと、短いフレーズの言い直しでは無意味なので再変換指示機能は携帯翻訳機では必須となる。

なお、現在のＡＩ認識は長文文節の区切り位置判定をやや苦手にしている。
特に日本語と他言語の間の翻訳で、主語と目的語の順番が違う為、翻訳においてはその影響が大きくなる。
本発明における手法では任意に句読点、特に「。」や「．（ピリオド）」が入力できると言うことであり、文節の境目が確定するので従来の携帯翻訳機と比較して、長文の翻訳結果が正確になる優位性を持っている。

翻訳専用携帯端末にはその特殊性から、以下の機能や処理能力も搭載されることが望ましい。

第１の機能は、翻訳結果の履歴を機器のメモリー等に設けた保存ＢＯＸに記録し、順番を付与して、整列させて呼び出せる処理である。
アドリブでの直接対応の翻訳を主目的とせず、プレゼンテーションの内容を事前に作り溜めしておくのが主目的となる。
またプレゼンテーションの途中で、相手からの質疑応答などのアドリブ翻訳を行っても、保存ＢＯＸを再度呼び出し、プレゼンテーション再開の場合、アドリブ翻訳前の途中経過の位置が表示されるようにプログラムし、全体の流れが遮断されず、外国人向けの商品のＰＲや、スポーツインストラクターの外国人向けレッスンなどに有効である。
この為、順序付けたテキストの保存と、当該保存したテキストの出力処理を実行すると共に、当該実行中における音声入力翻訳も実行する処理を行うように構成する。
機器への操作法としては、〔００７８〕欄に記載の初期画面において、国旗外の空白部を右フリックすると、翻訳履歴の修正画面（プレゼンテーションのグループや順番付与の作業画面）に移行する。

第２の機能は、事前に作成した翻訳文の正確性を向上させる為に、翻訳履歴の再生中に母国語ボタンを選択すると、翻訳結果の外国語テキストを翻訳ＡＩに送り返して再翻訳を行うものである。
例えば日本語から英語に翻訳した結果テキストを逆利用して、日本語に再翻訳させ検証を行う処理（以下「逆転翻訳」とする）を実行する。
これらより誤翻訳が生じていないか確認した上で、それを前項のプレゼンテーションの内容として記録出来るので、完成品（即ち翻訳文）の精度が向上する。
機器の操作法としては、翻訳結果を再再生（マイクアイコンをタッチし、外国語を機器側に再発声させる）の最中に母国語ボタンを押すと、翻訳ＡＩに外国語テキストを送り返すコマンドとする。

第３の機能は、プレゼンテーション作成を省力化するため、ＡＩ翻訳経由後も母国語の「入力原文」を取り戻し、再編集を掛け直せるように設定するものである。
本実施手法で相手方（外国人）への直接翻訳においては、編集・修正作業を完了し「間違いの無い母国語」をＡＩ翻訳に送信することが主目的であり、それ以降再編集をする状況はない。
しかしながら〔０１１７〕欄に記載したプレゼンテーションの作成作業の場合は、前項における翻訳結果の検証作業により、翻訳ＡＩを経由したうえで、より精度を高めた完成品を作成する余地も機能的に追加されることになる。
また、現在の翻訳ＡＩの精度は向上しており、長文でない限りは不適切な部分が複数存在することは稀であり、「気になる一か所」だけを修正したい状況が大半になると推測される。
プレゼンテーションを再作成する場合は、操作者は修正したい部分について「同じ意味の別の言い方」を思い浮かべて、「初めから音声入力をやり直す」ことが一般的である。
この作業を省力化する為、前項の逆転翻訳にて日本語テキストに再翻訳し直されたテキストを表示している画面には、「再編集」のタッチ領域を設定する。
「再編集」のタッチ領域を選択した場合、ＡＩ翻訳に送信前の当初に音声入力した母国語テキスト内容の編集・修正画面が、音声入力Ｌｏｃｋ状態で再現される。
これにより修正したい箇所のみ、再編集作業にすぐ取り掛かれるため、特に連続でプレゼンテーション内容を作成する際に大幅な省力化が図れる。

第４の機能は、相手（例えば外国人）が対面に位置していることを想定して画面の上下を反転して表示させる天地逆転表示である。
翻訳機は一対一の応対が主となるため、実使用の場面においては並列で並ぶ状況よりも対面で並ぶ状況の方が圧倒的に多い。
これは、公共機関の窓口や国際線の空港カウンターなどにおいても同様である。
外国人側が翻訳結果のテキストを見たい時や、自分で句読点タッチ操作をしたい時は、都度機器をひっくり返すのは手間であり、最初から翻訳結果の表示や外国語入力ボタンを押している最中などでは、画面表示が天地逆に設定できる仕様が選択できると、相手側への視認性に利するものである。
よって、設定画面において表示内容を天地逆転させる処理を実行する指示部分と、これを実行するプログラムを実装することが望ましい。
なお天地逆転の最中は、操作者（所有者側）が内容（翻訳結果）を再確認したい場合もあり得るため、一時的に天地逆転をキャンセルし、正位置に戻すタッチアイコンが画面内に出現するようにする。

第５の機能は、機器を翻訳機として使用せず、外国人向けのＳＮＳ発信機能の本文作成に転用利用するものである。
公知技術としてカメラ付き携帯翻訳機は既に存在するが、母国語と外国語がセットでテキスト化される結果を、目の前に居る外国人へのアドリブ翻訳として使用せず、不特定多数へのＳＮＳ発信用に、例えば英語や中国語の翻訳結果も日本語本文に自動でセット出力されるため、インバウンド向けの店舗のＰＲ広告用ＳＮＳ等の原文作成の手段として利用することである。
特にカメラ付き当該機であれば直接ＳＮＳの発信も可能で、カメラの搭載機能が存在しない翻訳機でも、本文のみ自宅のコンピュータやスマートフォンに転送すれば、既存ＳＮＳ発信機器に母国語と翻訳した外国語がセットになった文章を添付することが、翻訳機側に特段の機能を搭載しなくても可能になる。

第６の機能は、難解なワードをコンピュータから取り込む処理である。
前項の通り、コンピュータ等と当該携帯翻訳機を接続することにより、音声入力で結果を得ることが難しいテキストの課題解決ができる。
例えば架空の病名であるが「先天性鬱滞性脂肪織炎性II型」との病名があったとすると、修正・編集・移動等を繰り返しても、キーボード無しで音声入力だけにより、この結果を得るのは不可能では無いものの非常に手間が掛かる。
そこで、先にキーボードで入力した難解な単語を逆にコンピュータ側から携帯翻訳専用機側の単語辞書（保存ＢＯＸ等）に送信、保存しておけば、翻訳機句読点「単語」を画面タッチし、音声入力において、「先天性…」からの入力だけで予測候補を出力できる為に、超難解ワードの音声入力機器でのテキスト出力目的を達成することができる。

第７の機能は、母国語・外国語の音声入力ボタンを同時押しすると、翻訳を掛けない「音声入力でのテキスト化専用マイク」に機器の性質を変化させる「タイプライターモード」を設定するものである。
これは翻訳機として運用せず、携帯翻訳機やスマートフォンの「音声認識機能」だけを取り出して、音声入力に対応した機能が無いコンピュータに後付け音声入力マイクとしての能力を付与させる意味である。
機器の操作法としては、母国語と外国語ボタンを同時に長押しすることで、当該モードの開始として自動的に機器側に判別される。
その場合、タッチ句読点は母国語ベースで表示される。
基本的に連続した認識となり、次項など一部の例外を除き、Ｃボタンの長押しでリセットしない限り、当該モードは継続される。
スマートフォンを音声入力機器に代用する方法として、公知技術のリモートマウス（登録商標）が存在するが、これは基本的に「言いっ放し」であり、修正・編集はコンピュータ画面とキーボードで行うことを大前提にしている。
本発明では、音声入力の作業時点で、誤認識及び同音異義語の修正、書体の編集などが事前に可能であり、ある程度整った「完成したテキスト」をコンピュータに送信することが可能であり、特に出先で作業を行う場合（コンピュータと接続していない状況）で優位性がある。
作成したテキストは、有線又は無線、或いはインターネットなどのネットワークを介して、自宅のコンピュータにデータを送信し更に校正（頭出しの位置調整やフォントサイズ変更など）を掛けた上で、プリントアウトなどをして完成品を得られる。
なお、タイプライターモードでは、〔０１１２〕欄で説明した音声入力ボタンを離すこと（若しくはＬｏｃｋタッチを解除すること）による、「翻訳ＡＩへの送信」に伴う制約が存在しなくなる。
よって、一旦音声入力ボタンを離して、テキストの固定後に再度音声入力を掛けることが可能になるので〔０１１２〕欄で説明した「句読点初期に戻る」の手法や〔０１０２〕欄で説明した「とレモン」を得る方法などにおいても、一度音声入力を中断しテキスト固定後に、各優先タッチ後音声入力を再開するコンピュータ同様の省力化の手法を用いることが一般的と思われる。

第８の機能は、このタイプライターモード中に、特定の音声入力（例えば「認識中画面」や「プレゼンテーション、Ａの３」などと入力）をすると、各設定画面やプレゼンテーションの特定個所にジャンプする「本体への指示」としての認識機能も持たせることである。
長文の音声入力の場合には、「比較的ゆっくりはっきり単語で話す指示キーワード」と長文内容が重なることは稀なので、機器側は無視して単純に長文はテキスト化される。
もし本体機器側に指示を出すつもりで音声を発し、それが誤認識されてしまった場合は、母国語・外国語ボタン同時押しを再度行ったまま、一定時間無音状態を関知すると、修正・編集画面に移行するのは通常の片方のボタンを押したままにする〔００９１〕欄に記載した編集・修正の一定時間無音による遷移と同じである。
このプレゼンテーションの指定位置へのジャンプ機能があると、外国人側の質問内容やタイプ（スポーツの場合は癖など）によって、プレゼンテーションの内容を分派させることが可能になる。
なお、この設定画面へのジャンプ認識や、プレゼンテーションの位置指定ジャンプのコマンド認識後は、当該のプレゼンテーションの再再生待ちの画面に移行し目的を達すると共に、タイプライターモード自体も自動解除される。

第９の機能は、タイプライターモードの応用で、筆談の支援ツールとしての利用法である。
ある程度の年齢に達してから、途中で聾話（耳が聞こえない障がい、事故・脳卒中・薬害などで生じる）になった場合、後から手話を習得するのは困難なため、現在は筆談を仲介する要約筆記ボランティアに依存することになる。
しかし本「タイプライターモード」を使用すれば、二人同時に話さないルールだけを守れば、延々と会話が文字化されるため、この障がいを持つ方々への支援ツールとしても有効である。

なお、（〔００７７〕欄以降）説明を行ってきた携帯音声翻訳機については、必ずしも専用機である必要はなく、スマートフォンに翻訳アプリケーションを導入することによって構築されたものであっても良い。
かかる翻訳機においては、基本的な画面分割数及び句読点タッチ等の配列など、全て携帯翻訳機の認識前画面（〔００８０〕欄参照）や認識中画面（〔００８５〕欄参照）、及び編集・修正画面（〔００８８〕欄参照）の各図とデフォルト（初期値）は同一である。
句読点タッチの内容を、前記〔００４６〕欄に記載の手法でカスタマイズしたり、その結果として〔０１１２〕欄に記載の通り「句読点初期に戻る」追加画面が発生することも同様である。
しかしながら、スマートフォンには専用機と異なり「３つの物理的ボタン」が存在しない為、句読点タッチ領域の下段に各ボタンに相当するタッチ領域を追加し、結果的には「初期値は１５分割」になる。
音声入力の最中に編集・修正画面等に遷移しても、ボタン相当の３箇所のタッチ領域は全く変化しない。
つまり、常時母国語ボタン・外国語ボタン・その中間にＣボタンが存在する仮想状態が維持され、操作法に違いが無いようにすることで、両方の機器を所有したり、専用機からスマートフォンのダウンロード版に翻訳機器を切り替えた時にも、操作法を覚え直す必要がないようにする為でもある。

変換タッチ（若しくはＣボタン１４２）を押しながら、「ゆっくり・はっきり・一単語」を話すことで「全ひらかな」を得る、前記〔００９８〕欄に記載の手法を応用して、句読点タッチを省力化する手法を説明する。
変換タッチ（若しくはＣボタン）に限らず、言い始める前に、句読点のカッコ類の起点タッチ"（"や"「"を押ししたままにして音声入力を行うと、カッコの起点タッチを離した瞬間にカッコの終点（閉じ側）が自動的に付与されるものである。
これによりタッチ数全体を減らす省力化が可能になる。
また、そのようなカッコ閉じと、変換をタッチしながら音声入力などの機器側のひらかな化判定は重複して行うこともできる。
以下、例文及び操作説明を示す。
前提条件として、「さくらんぼ」を無指定で音声入力した場合、当該機器側はカタカナの「サクランボ」を選択してしまう状況と仮定する。
以下、図２６について説明する。
なお、図２６におけるＡ行の項目は「画面のタッチ」を説明している。
Ｂ行の項目は音声入力（操作者の発声）そのものを示している。
Ｃ行の項目は生成される（目的の）テキストを示している。
そしてこの図２６における横軸は時系列（タイミング）を示している。
よって、この図２６では、Ａ行の操作とＢ行の発音を図面の左から右に時系列で行う事により、Ｃ行のテキストを作成することができる。

コンピュータに関する〔００５５〕欄の記載において、説明を保留していたコンピュータにおいての編集・修正の詳細について説明する。
本発明におけるキーボードに依存しない各種の編集・修正は、携帯翻訳機に限定するものではなく、コンピュータにおいても全て可能である。
但し、コンピュータでは携帯翻訳機における〔０１１２〕欄にて説明した制約が無いことは、前記〔０１２３〕欄に記載のタイプライターモードと同様であり、小フォント且つ字間が狭いままでも位置指定ができるマウスが存在するので、特殊な操作法を実施せず、殆どの場合一旦音声入力を中断し、キーボードで修正操作を行うのが最も現実的であり手間も掛からない。
但し、「長文を挿入したい」場合には、音声入力での追加処理に優位性がある。

また、長文作成の場合順序良く音声入力でテキスト全文を校正しながら完成まで至るとは限らず、後から全部を冒頭から見返して校正することは普通の行為である。
更に、作成中のメール等を一時保存すれば、当然様式は、メールのアプリケーションの様式（小フォント・字間も狭い物）で記録される。
そうした小フォントの様式に、後から音声入力にて上書きする場合、コンピュータの場合、マウスで範囲指定（色調反転）させた物に音声入力を掛けた場合は「上書き」、マウスで一点指定の後で音声入力を掛けた場合は「挿入」であり、前記〔００４２〕欄や〔００５２〕欄に記載の定義のとおりキーボードでの修正や挿入操作と何ら違いはない。

前記〔０１２３〕欄に記載したタイプライターモードの音声入力手法は、スマートフォンにおけるインターネットの検索や、企業ホームページのお問い合わせ欄へのテキスト入力などにそのまま用いることができる。
但し、前項のコンピュータの場合と異なり、メールのアプリケーションや企業のお問い合わせページに一旦固定したり、メールを一時保存して様式が変化したテキストへの修正は、当該機にはマウスは存在しない為、スマートフォンの基本操作である、ピンチイン／ピンチアウトの操作で相当拡大しないと、指での範囲指定タッチは、視認性や機器側での位置特定の認識上できない。
具体的な操作法として、インターネット内の企業ホームページの「お問い合わせ欄」にスマートフォンで入力して行く例として説明する。
翻訳の必要は無いので、〔０１２３〕欄に記載のタイプライターモードで入力を開始していく。

なお、説明図のサイズの都合上、〔０１２６〕欄の記載における、仮想の母国語ボタンと外国語ボタン及びＣボタンの固定タッチ領域はその表示を割愛している。
図２７（Ａ）のとおり、＠（アッドマーク）などは当該タッチ句読点や「記号」タッチ後に、音声入力で「あっどまーく」と入力することでも得られる。
図２７（Ｂ）のとおり、メールアドレスは英字優先やＣａｐｓＬｏｃｋを使用し大文字・小文字に対応するが、都度の入力は煩雑なので、〔０１２２〕欄に記載の手法で保存Ｂｏｘに登録しておいたり、「単語登録」へ事前に入れておくと省力化できる。
図２７（Ｃ）のとおり、上述の手法を駆使して、可能な限り編集・修正画面の内に一時的な校正を終えて、入力したい内容を積み上げていく。
図２７（Ｄ）のとおり、一旦入力対象のホームページ側のレイアウトになったテキストは、ピンチイン／アウトの操作にてスマートフォン画面内で相当拡大し、指で位置指定のタッチを行う。
図２７（Ｅ）のとおり、音声入力ボタンを押していない状態（音声入力待ちでは無く、タッチ句読点も出現しない状態）での指でのタッチは、マウスの操作と同義であり、範囲指定（色調反転し再入力や再変換待ち）であり、例においては「始めまして」を範囲指定する。
この場合〔００９１〕欄に記載の起点・終点指定後に「一旦ひらがなに戻る」定義は適用されない。
一度音声入力を完了し固定化され、既に企業ホームページ側の様式（ソフトウェア側など）に変化しているからであり、もう一度音声入力をやり直し再度機器側に誤認識されてしまう「始めまして」を、固定化する前に仮想Ｃボタンや変換タッチで「はじめまして」に変化させてから再固定することになる。
図２７（Ｆ）のとおり、一点指定（挿入位置指定）後に、音声入力で新しいフレーズを挿入する。
仮の例であるが、「対処法」と「をご教示」の間に、「若しくは予防方法」などのテキストを新規に音声入力したいとする。
この場合は「新規音声入力」なので、図２７（Ｅ）とは異なり〔００９１〕欄に記載のとおり、「若しくは予防方法」部分は編集・修正画面に遷移する余地を持っている。
このように、キーボードが存在しない機器でも、長文入力の際は「仮完成後、全文を通して校正作業」のうえで完成文を作成していくことができる。

またタイプライターモードにおいて、太字・斜体文字や下線（アンダーバー）などの特殊書体を音声入力で行う手法を説明する。
Ｃボタン（若しくは変換タッチ）押したままで、音声入力を一文節のみ、ゆっくり・はっきり話し、Ｃボタン（若しくは変換タッチ）を離して、「再変換前提の全ひらかな表記」は〔００９８〕欄にて説明したところであるが、設定画面における英字・数字・カタカナなどの各優先認識タッチ領域に、「長押し中の音声認識は書体を整える役割のタッチ」を別途設定するものである。
例えば、コンピュータにおいて太字や下線のアイコンをマウスでクリックしてから、キーボードでテキスト入力を開始する状況と同義である。
さらにタッチを離す行為が書式変更の解除操作も兼ねる為、マウスが存在するコンピュータ以上に素早く断続が可能である。
なお、もしこの特殊書体の入力中に誤認識等が発生した場合、一旦音声入力ボタンを離して固定した誤ったテキストに対し、言い直しや再変換操作しても特殊書体は維持される。
書体修正したい位置指定操作終了の時点で、機器側がその書体を一時記録していると言うことであり、これも現状のコンピュータでのキーボード入力時と同様である。
以下、例文及び操作説明を示す。
事前に図２８（Ａ）～（Ｄ）に示す様に、数字優先（押したままの音声認識）にアンダーバー（下線）を数種類、例：「全て（後で選択）」「一本下線」「二重下線」「点下線」「波下線」「見え消し線」を設定する。
同様に、図２９（Ａ）～（Ｃ）に示す様に、英字優先（押したままの音声認識）に書体を数種類、例：「全て（後で選択）」「太字」「斜体文字」「中抜文字」「ルビ」などを設定する。
例文（目的書式）「音声入力装置でも書体(※太字) が変えられます。」において「音声入力装置」にアンダーライン、「書体」を太字にする場合は、以下の様に操作する（図３０（Ａ）参照）。
操作法、「おんせいにゅうりょくそうち」の発声中は、数字優先タッチを押したままにする。
「装置」の発音における「ち」の発声と同時に数字優先タッチを離した瞬間の書体の選択画面への一時ジャンプした時の画面は図２８（Ｄ）に示す。
次に、「しょたい」の発声中は、英字優先タッチを押したままにする。
「体の：い」の発声と同時に数字優先タッチを離した瞬間の書体の選択画面への一時ジャンプした時の画面は図２９（Ｃ）に示す。

タイプライターモードにおける、書式変更の設定画面を図２８にて説明する。
図２８（Ａ）は「書体」のタッチ領域を選択した状態を示している。
図２８（Ｂ）は、これから書体を設定する「優先認識」のタッチ領域を事前設定している状況を示している。
図２８（Ｃ）は、選択できる書体等の選択肢を示している。
なお、タッチを誤る状況も有り得るため、「一つ戻る」タッチ領域が画面上に無い場合でも、Ｃボタンを（一つ戻る）として代用できる。
図２８（Ｄ）は、選択できる下線等の選択肢を示している。
初期値は「全て」が選択されており、〔０１３２〕欄に記載した「音声入力と同時に書体変更の優先タッチ領域を離した」（書体変更の範囲指定を終了した）際のジャンプする画面は、当該画面から「全て」を除いた画面になる。
図２９（Ａ）は「英字優先」のタッチ領域に別の書体変更のコマンドを設定する状況を示している。
図２９（Ｂ）は「飾り文字」の選択をした状態を示している。
図２９（Ｃ）は「飾り文字」の選択肢を示しており、図２８（Ｄ）同様に初期値は「全て」であり、範囲指定後に「後から選択」する形態となる。
図２９（Ｄ）は、２つの優先認識に（下線）と（飾り文字）書式設定のコマンドとして適用されている状態を示している。
説明用に着色しているが、設定後に色調に変化が生じることはない。

更に各優先認識タッチに特殊書体を一種類のみ登録した場合は、前項の図２８（Ｄ）や図２９（Ｃ）における選択肢は出現せず、優先認識タッチを離した瞬間に特殊書体は実行される。
応用例として、一種類のみの書体指定タッチの場合、複数の書体指定のタッチを同時押ししたまま音声入力を行い、同時に両タッチを離すと、特殊書体が重複して適用される。
前記〔０１２７〕欄に記載の全ひらかな化と『」』（鉤ぎカッコ閉じ）を同時に掛けるコマンドと同様である。
以下、図３０（Ａ）を参照しながら、例文及び操作説明を示す。
数字優先（押したまま判定中音声入力）に「二重下線」の一種類のみを設定する。
英字優先（押したまま判定中音声入力）に「斜体文字」の一種類のみを設定する。
このような単独設定の場合、前項のように優先認識を離した瞬間に「どの書式を選択するか？」の画面遷移は発生せず、離した瞬間に書式変更は適用される。
更に書体の縦書きと飾り文字の毛筆体を数字優先及び英字優先の領域に特殊書体を設定した場合、図３０（Ｂ）のような極端な例(封筒に縦書きで「御祝い職員一同」など)も理論上は可能である。
なお図３０中のＡ・Ｂ・Ｃ行の定義については、〔０１２７〕欄の記載と同様である。
なお、こうした書式変更の設定は原則〔０１２３〕欄の記載におけるタイプライターモード専用である、翻訳ＡＩに特殊書体を送信するとエラー原因になる可能性がある為である。

公知技術の一つとしてスキャンニングした様式（例えば履歴書など）をＯＣＲ（光学的文字認識：ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ、以下同じ）読み取りした記載欄を「枠」として機器側が認識して、キーボードでその枠内にテキストを入力する手法が存在する。
結果的に「本来は手書き部分」に活字テキストで完成品を作成できると言うことである。
本発明においてコンピュータに関する〔００４２〕欄に記載の通り、キーボードでテキスト入力を行っているものと音声入力を行っているものに違いは無く、入力対象ソフトウェア側からの認識は同一である。
よって〔０１２１〕欄から〔０１２３〕欄に記載した、コンピュータとの接続とタイプライターモードを応用することで、前記の「履歴書などの様式の枠内」に音声入力でのテキスト入力も可能になる。

以上により、キーボードとマウスが存在せず尚且つテキスト入力は本文のみ発声するだけで、小画面タッチでの句読点付与・改行・空白・訂正（言い直し）・再変換・移動・削除・書式変更及び所定様式への入力などの「修正・編集・書体変更等」のおよそ全てが可能になる。
本発明の普及において、操作者の音声入力による編集・修正の習熟度や、元々のタイピング能力にも因るが、簡易なキーボードやタッチパッドが存在するタブレット端末はおろか、フルサイズのキーボードやマウスが存在するコンピュータ以上の速度でテキスト作成ができるようになり、言い換えれば出先でスマートフォン一つだけで、長編小説の原稿を問題なく作成することが実現可能になる。
２０２０年現在、特に外国人において、スマートフォンは必要性から所持しているが、パーソナルコンピュータは所持していない、いわゆるモバイル機器のみしか所持していない人口は２億人以上であり、そのような状況の人々が、執筆活動での自己表現の機会を得られることになる。
また、例え紙ではなくメール内の添付データであったとしても、書式を整えた履歴書を企業に提示できるようになることは、世界的に格差の固定化が社会問題化している状況において、雇用条件改善への貢献も期待できるものである。

ここまで携帯翻訳機ほか、スマートフォンなど「マウス及びキーボードが無い携帯機器」における画面タッチだけでの編集・修正の各手法を説明した。
コンピュータについては〔００４２〕欄に記載のとおり、基本的に修正箇所はマウスで当該座標を指定し、キーボードの入力で上書きを掛けることが一般的と思われる。
しかしながらコンピュータでの使用環境においても、外国語の翻訳ＡＩを仲介させて、外国人とコミュニケーションを取る状況は、グローバル化の流れに従い今後益々増加していく。
例を挙げれば、海外事務所とのテレビ会議や、映像が不要であれば個人的な商品取引や海外旅行で知り合った友人などに、直接メールでのリアルタイムの応対をする状況などである。
特に、個人レベルで通訳を頼める状況は現実的では無く、当然一般的なインターネット内の翻訳ＡＩに依存することになる。
この場合〔０１１２〕欄で説明した「音声入力ボタンを離すことができず、編集・修正画面内で完結させる」制約がコンピュータにおいても発生する。
よって音声入力からの一時無音状態による編集・修正画面内（〔００５５〕欄参照）でも、コンピュータのモニターをタッチしながら誤認識や同音異義語などを修正し、外国人側に送信し、相手側はＡＩ翻訳を経由した文字データとして外国語のテキストを得て、必要があれば自身のコンピュータから自身の言語の音声情報も得ることになる。
こうしたアドリブでのやり取りのほか、商品取引など何度も同じ説明を繰り返す場合は「定形文」も都度引き出せると利便性が高まるため、〔０１１７〕欄の記載における、プレゼンテーションの登録や整列機能もコンピュータ側に追加機能として付与できることが望ましい。
このように、本発明は直接応対の為の携帯翻訳機とは別に「インターネットを介した、遠く離れた外国人との直接コミュニケーション」にも寄与できる応用性を持っている。

『第３の実施の形態：スマートウォッチなど腕時計サイズの携帯端末』
携帯端末、特にスマートウォッチなどの腕時計サイズ携帯端末は、自身の健康状態（バイタルなどの監視）のほか、特定のキーワードを音声入力することで、「天気予報」や「１５分後にアラーム」などの情報処理を行うものが現状でも提供されている。
そこで先ず、本発明におけるスマートウォッチで音声入力装置を構成することの優位性を説明する。
なお、現在のスマートウォッチにおいては、スマートフォン等の情報処理装置との同期によるリモート設定が可能であり、本実施の形態では、当該同期設定以外の構成を中心に説明する。
公知技術としてスマートウォッチの小画面（以下：「盤面」とする）にて目的のアイコンをタッチしたり、音声入力で各種機能を呼び出すことは、前述の通り存在する。
しかし本発明での「正確性の付与」はメリットだけであり、操作法上現行のスマートウォッチの基本機能を阻害しないため、デメリットは存在しない。

スマートウォッチは、そのサイズとバンドでの固定方法から究極の携帯性を有するが、盤面は極端に小さく、視覚からの情報は得にくい。
例えばインターネットにおける商品の購入の操作程度は可能であるが、動画などの視聴には特に向かない。
そのため本発明においては前項の通り、短いキーワードでも「修正しながら正確に入力できる」ことに優位性を見い出す。
例えばインターネット上で提供されている情報検索サイトや、インターネット上におけるニュースの検索等に有効である。
但し狙った検索キーワードで目的のＷｅｂページを表示させても、やはり前項の通り盤面が小さいことから表示テキストを読むのは困難である。
そこで公知技術であるＯＣＲ認識とそれに伴う音声出力を利用し、インターネット内の辞書・論文やネットニュースの本文を、音声出力ボタンを押すことで、スマートウォッチ側に「テキストの読み上げ」をさせるものである。
即ち、音声入力に基づいてインターネット検索を行い、機器側の音声出力で、操作者はピンポイントに必要な情報を得ることができる。
具体的手法は後述〔０１５２〕欄にて説明する。

また、本実施の形態に係る音声入力装置としての使用方法としては、ショートメッセージでの情報交換を主とするＳＮＳにおいて有効に活用できる。
スマートウォッチでは、利用者が身に着けていることから受信に気付かないことは無く、返信の書体も余り気にする必要が無い。
音声入力に際して使用する句読点を、特有のＳＮＳのスタンプに設定画面にて変更し、「いいね」の意思表示等も盤面上のワンタッチ操作で素早く済ませることができる。

また、スマートフォンやそれに付随するスマートウォッチなどのモバイル機器によるクレジット決済については公知技術であるが、ソフトウェアをダウンロード後に契約する形態であり、特定の決済サービスに限定される。
本実施の形態に係る音声入力装置は、コンサートや有料のスポーツ観戦及び改札などにおいて、支払い済のＱＲコード（登録商標）を正確な音声入力によって、都度的確に使い分けて呼び出し盤面に表示させ、多種類のゲート通過認証等に利用できる。
また仕事上の環境からスマートフォンを取り出しにくい時に利用したり、片手がふさがっている時などは荷物を持ち替えた上で電話に出ることができる。
このように、突然の電話や、音声入力によって機器操作を咄嗟に行ったり、正確な検索や比較的正確なショートメールの作成などに有効である。

むしろ長文を正確に作成することは、手間を掛ければ携帯翻訳機と基本操作や処理は同じではあるが、〔０１３９〕欄に記載の通り視認性の観点で困難さがある。
長文については、出先で作成した下書きとして一時記録に溜め、コンピュータやスマートフォン等にネットワーク等を経由して送信し、編集・修正及び最終的な校正は、後からコンピュータや最低でもスマートフォンサイズ以上の画面を持つ機器で行った方が効率的である。

図３１は腕時計サイズの携帯端末を用いた音声入力装置を示す略図であり（特に自然なデザイン性を重視した丸ベゼルタイプの腕時計における実施形態）、本実施の形態に係るスマートウォッチを示す略図である。
この実施の形態に係る携帯端末では、音声入力ボタンを押し、一音も発生しない状況では、図３１（Ａ）に示す認識前画面の状態となる。
特に丸ベゼルタイプの腕時計の場合、テキストの活字視認部分を可能な限り確保するため、文字盤中心部に仮想の正方形又は長方形等の空白部を設けるレイアウトとするのが望ましい。
但し、この図３１（Ａ）に示している文字盤の領域を仕切っている実線は、領域の分担を説明する為のものであり、実際の製品において境界線は色分けなどで行う。

本実施の形態に示す丸ベゼル型の時計は、その構成上４隅にボタンが存在する物が多く、本実施の形態でも４隅にボタンが存在する腕時計（現行の一般的四角形型スマートウォッチにもボタンのあるモデルは存在する）を前提にしている。
前記したスマートフォンサイズの携帯端末における操作・処理手法と異なり、タッチ領域を一箇所でも多く確保するために画面タッチとボタンで、実行させる処理や役割を分担している。
ボタンを押してコマンドを実行させる処理も、認識前画面、認識中画面、編集・修正画面で異なるため、盤面内には、小さいながらも「ボタン操作の説明」の表示領域３１１を設ける。
「一つ戻る」の操作・処理を実行する為に、中央に透過色でバッテン「×」３１２を表示させている。
句読点の打ち間違いなど、初めから入力し直したい場合は、バッテン「×」３１２の画面タッチをしたまま長押しすると「リセット全クリアし初期画面（スマートウォッチの場合時計状態）に戻る」のは、携帯翻訳機に関する〔００８４〕欄の定義と同様である。
ボタン及びタッチのレイアウト説明としては、ボタン左上→右上→左下→右下の説明順とし、次に画面タッチ上→左→右→下の順で記載する。
以下、認識中画面及び編集・修正画面の説明においても同様である。
初期配置の例としては「画面拡大」「音声入力Ｌｏｃｋ」「画面縮小」「音声入力」「
数字優先」「英字優先」「記号」「クイックカラーチェンジ」を設定している。

句読点タッチ領域のカスタマイズ方法の画面遷移について説明する。
音声入力で「おんせいにゅうりょくせってい」と発声してもコマンドとして受け付けるほか、携帯翻訳機における〔００８２〕欄の記載と同様にタッチ箇所の一つに長押し判定で設定画面へのジャンプのタッチ領域を同一領域に配置させることもできる。
最も多用される操作法は音声入力ボタンを押しながら一音声も発せず、画面を上下左右にフリック操作すると、特定の設定画面へジャンプする「ショートカット入力法」である。
図３２（Ａ）のとおり、左にフリック３２１すると「システム設定画面」、右にフリック３２２すると「色調設定画面」にジャンプする。
図３２（Ｂ）のとおり、上に２回フリック３２３すると「認識前画面３２５ａ」の配置変更、上に１回フリック３２３すると「認識中画面３２５ｂ」の配置変更、下に１回フリック３２４すると「編集・修正画面３２５ｃ」の配置変更、下に２回フリック３２４すると後述の「ルーペ３２５ｄ」の設定画面へジャンプする。
図３２（Ｃ）は色調変更画面のレイアウトを例にしている。各ボタンの近くには、当該ボタンの説明を表示させることができる。

音声認識が１文字以上始まると、図３１（Ｂ）に示す認識中画面に自動遷移するのは、スマートフォンサイズの携帯端末に関する〔００８５〕欄の記載と同様であるが、句読点等の選択肢は少ない。
図３１（Ｂ）に示した補助入力表示部の項目は、あくまで初期値の例であり、設定画面で補助入力表示部の項目句読点をカスタマイズすることができ、タッチ選択肢の少なさから、スマートフォンサイズよりもカスタマイズの必要性が重視されるものとなる。
初期配置の例としては「画面上へスライド」「記号（スタンプ含む）」「画面下へスライド」「音声入力」「。」「、」「空白」「改行」及び中央の×（一つ戻る）を設定している。
画面位置のスライド機能は、スマートフォンサイズ程度の画面サイズがあれば、長文以外「編集・修正画面」に遷移してテキストが画面内に収まり切らなくならない限り出現しないものであるが、スマートウォッチは盤面の小ささから、１文字以上の認識開始時点で「画面表示位置のスライド縦バー３１３」を初めから存在させている。

そして操作者が音声入力の間違いを発見した場合には、無音状態を一定時間維持することにより、スマートフォンサイズの携帯端末に関する〔００８８〕欄の記載と同様に、図３１（Ｃ）に示す修正・編集画面に遷移させる。
入力したテキストの始点・終点などの位置指定をする画面タッチ操作を妨害しないように、「一つ戻る」の処理を指定する領域又はボタンは、盤面の中心から４隅の何れかのタッチ領域又はボタンに移動する。
また盤面には、表示領域をスライド移動させる「画面表示位置のスライド縦バー３１３」を設けている。
盤面自体の小ささから多用することになるが、当該「画面表示位置のスライド縦バー３１３」は、盤面表示領域を可能な限り確保するためにテキストと半透明色で重ねて表示する。
この「縦バー３１３」自体の操作は、スマートフォンサイズの携帯端末に関する〔００８９〕欄の記載と異なり、ウォッチ本体のボタン側３１４，３１５で前進・後退を操作する。
これは、縦バー移動を画面内のタッチで操作すると、盤面が小さいためテキストの起点・終点の位置指定タッチと誤認しやすいからである。
初期配置の例としては「画面上へスライド」「一つ戻る」「画面下へスライド」「音声入力」「。」「、」「変換」「？」を設定している。

頻繁に使用される機能や処理は、図３３に示したレイアウト例を参照しながら説明する。
かかる音声入力画面の呼び出し操作は、音声入力にて「えすえぬえす」や「でんわ」などの単語入力による音声起動で行うことができる。
図３３（Ａ）に示す様に、ショートメッセージを送受信するＳＮＳでは、句読点の代わりに「スタンプ」などを配置しても良い。
これにより絵文字やマーク等を入力する手間を大幅に簡略化できる。
またスマートウォッチで電話することは一般的な公知技術であるが、画面タッチにおけるダイヤル表示の例は図３３（Ｂ）にて説明する。
基本的には事前登録した電話帳データ内でやり取りをすることが一般的と思われるが、画面分割のタッチ箇所を応用して音声入力以外でも電話番号を直接タッチで入力できるようにするものである。
一つのボタンやタッチ領域に複数の数字があてがわれているが、例えば右上のボタンを一回押してすぐ離せば「４」、２回連続してボタンを押した場合「５」が選択される。
最小となる丸ベゼルの腕時計サイズにあっては、盤面（文字盤であるタッチパネル）は４分割程度で使用することとなる。
スマートウォッチの形状や画面サイズ（四角形のスマートウォッチ等）によっては、タッチパネルを６～９分割等にしたタッチ領域で構成することも可能である。

インターネットの検索キーの入力方法について説明する。
現在、各種の大手サーチエンジン（検索サイト）においては、起動時のトップページの検索キー入力部分に、最初からカーソル位置が充てられているのが基本設定であることから、当該サーチエンジンの表示に続けて音声入力にて検索したい内容を話すのが最短の音声入力および検索手法である。
インターネット検索においては、Ｗｅｂブラウザーの起動時に、トップページにおける検索バー（検索キーの入力領域）内でカーソルカーソルが点滅しているので、そのまま検索キーを音声入力すると言うことである。
例えば「おーしーあーるよみあげ」などの目的だけ音声入力をして直接検索に移行できる。
しかしながら盤面が小さいため、目的の検索キー箇所に音声入力を行っても図３４（Ａ）の検索キー画面全体のサイズでは、検索キーの内容（音声入力の機器側の認識結果）に誤りが生じていないかチェックできない。
これは、目的のＷｅｂページ等は検索キーを含んだページ全体の前半部を、横長長方形のコンピュータのモニターで見られている前提で画面レイアウトが構成されているからである。
よって通常は図３４（Ｂ）に示す表示サイズまで、機器側を操作して検索キーの内容を拡大表示しないと、誤りが生じていないか確認することができない。
ここで、本発明における〔００５５〕欄に記載の手法を応用して、音声入力ボタンを離さずに意図的に無音状態を作ると、Ｗｅｂページ（例においては架空検索エンジン）側が薄色・背景化して、図３５の通り入力中のテキスト側が拡大され視認の中心となるので、音声入力した検索キーの内容を余分な操作は一切無くチェック可能となる。
内容に問題が無ければ音声入力ボタンを離すだけで検索キーが入力され、検索結果として目的Ｗｅｂページの全体像（図３６に相当する、例として「ネット架空大辞典」の当該ページ）画面が得られることになる。

しかしながら、基本的にスマートウォッチは画面サイズが小さく、優れた携帯性と引き換えに視認性に劣る。
そこで、視認性が低いデメリットを解消する為に、ＯＣＲ認識による音声出力機能を付与する。
但し、音声では情報伝達ができない内容、例えば天気予報をインターネットから呼び出しても「晴れ」や「雨」はテキストでは無く、殆どの場合「晴マーク／雨マーク」で示されており、この音声出力は得られないので、一時的にでも視覚情報に頼らなければならない状況が生じる。
よって、スマートウォッチ用の音声入力によって起動する機能として、「ルーペモード」を設定する。

即ち、音声入力ボタンを選択後に、起動させる機能を特定する音声を入力することにより、携帯端末は、認識した音声に対応する機能を起動させるように関連付けておく。
例えば、起動させる機能として、（ここでは特に「ルーペ（拡大鏡や虫眼鏡の意味）モード」）である場合には、音声入力ボタンの選択後に、「るーぺもーど」の音声を発する。
スマートウォッチ等の携帯端末では、この発声を認識すると、画面は、図３７に示すルーペモードの表示画面に示すものが出現する。
このルーペモードの表示画面内では、インターネット等における情報表示画面内の任意の領域の画面を拡大表示する。
表示領域の移動操作は、全てスマートウォッチの盤面内に半透明色で擬似表現されたルーペ（虫眼鏡）部３７１を盤面タッチすることにより行う。
例えばルーペ表示領域３７２の外側の領域（即ち、背景）をスライド操作することで、ルーペ内の表示領域を早く動かし、ルーペの枠３７１を選択して、選択したルーペの外枠を上下左右・斜めに押して傾けるような操作を行った場合には、ゆっくり移動する微調整と、２つの画面移動方法を組み合わせて位置決めするように構成する。
仮想状態的ではあるが、紙の上に実際に拡大鏡等を置いた場合の自然な動きに似せることで操作者に判り易くさせる。
図３７で二重表示にしているのは、ルーペの外側がＷｅｂページ画面の大部分ではあるが、その字は細かくて読み取れなくても、画面のどの部分にルーペが来ているか、感覚的に操作者に判らせる為である。

また、本実施の形態でのスマートウォッチは、前記〔０１３９〕欄に記載の音声出力処理を行うことが望ましい。
しかし、従前における前記音声出力に関して、仮に範囲指定せずにＷｅｂページの冒頭から音声出力を行った場合には、本文に至るまで非常に無駄が多い。
図３８の×印で囲った範囲３８１、つまりタイトルや注意書き、現実的なインターネットの環境では広告などである。
よって、表示している画面内において、音声出力の始点を指定することにより、指定した個所からの音声出力を行うように構成する。
即ち、ルーペ内において起点位置を長押し（指を静止）させた位置を起点とし、その起点操作後は、今までは「音声入力」であったボタンの説明が「音声出力ボタン」に変化する。
そして当該「音声出力」のボタンを押すと、表示されている画面からＯＣＲ認識を行い、認識したテキストに基づいて、機器ＡＩがテキスト化し音声出力する。
つまり、図３８の「趣旨」の直前の空白部３８２を長押しし、ルーペ内の起点ポイントが確定した瞬間、もうそれ以上は音声入力で検索する必要は無く目的情報に到達したものと同義であり、４隅ボタン右下の「音声入力ボタン」は「当該箇所から読み上げる音声出力の開始ボタン」に性質が変化しても問題が無いと言うことである。
必要な情報部分の聞き取りが終わったら、「一つ戻る」ボタンを選択して、音声出力は中断する（「一つ戻る」ボタンを長押しすると、時計表示等の初期画面まで戻る）。
また起点を指定後、ルーペモード内で更に移動し、位置３８３を再度位置指定すると「終点指定となり」、音声出力を開始した場合の「範囲指定」が事前にできる。
なお、範囲指定を掛けた場合、一度聞き終えた内容も、再度音声出力ボタンを押すことでリピート再生される。
ＯＣＲ認識で機器側が判別できない記号など（例えば天気予報のマークなど）は、音声出力をスキップし、次の文字テキストの音声出力を続行する。

画面表示の対象がインターネット内のＷｅｂサイトであるため、携帯翻訳機における編集・修正画面のテキスト（〔００８８〕欄参照）のように、フォントと字間の拡大はできない為、始点・終点の位置の盤面タッチによる指定には正確性を欠くが、読み上げられる部分が数字、最大でも一行ズレるだけであり、翻訳のような正確性を必要としない「読み取り結果の音声出力」だけであるため、問題になるケースが少ない。
また、こうした「任意の領域を拡大表示させた上でルーペをゆっくり動かせる」ことで、音声出力を得られなくても、〔０１５０〕欄に記載のような週間天気予報マークなどの内容把握自体には問題が無いと考えられる。

以上のようにインターネットのＷｅｂページを音声入力で呼び出した場合、運用上は結果的にルーペモードを起動することが多いので都度「るーぺもーど」と音声入力しなくても、一定時間でルーペモードが自動起動するように構成することが望ましい。
前記〔０１４５〕欄に記載の設定画面で自動起動する時間や、自動起動不可などの設定を行うことができる。
自動起動が実行されるまでの設定時間が長いほど、呼び出したインターネット画面全体のレイアウトを、操作者が「全体的に把握する」時間を長くすることができる。
見慣れたＷｅｂページしか呼び出さないケースでは「最初からルーペモードを起動、即ち待ち時間０秒」などを設定することが一般的と思われる。
ルーペが自動出現すると視認の妨げになる場合もあるため（例えば、小画面であっても画像や写真の全体像だけ確認したい場合など）、出現したルーペシルエットにおけるの「ルーペのグリップと仮定した左下に突き出している棒状部分」をタッチし、大きく右フリックする操作で、「イメージ的にルーペを紙上から除く操作」として、当該表示している「ルーペの削除操作」とする。
なお、全体像を把握した後で改めて細部を確認したい状況が生じたのであれば、再度「るーぺもーど」と音声入力すればルーペは再出現する。

また、インターネットのＷｅｂページなどは大手検索エンジンの種類や、企業のホームページの場合イメージカラーなどで背景色が変化するものである。
よってルーペそのものの色調と偶然似通ってしまった場合の対策として、コンピュータに関する〔００３５〕欄に記載したクイックカラーチェンジ同様に、半透明ルーペの色調にもクイックカラーチェンジを設定する。
但し、盤面の狭さから専用のタッチアイコンを設定することは難しいため、ルーペ左下に突き出した「仮想のルーペのグリップ」を指で連打することで「色調変更」のコマンド操作とする。
他の例と同様に、桃色→水色→緑色→橙色→桃色系に戻る、こうしたローテーションにより対応する。

スマートウォッチで正確な検索キーを入力できるとしても、もし音声入力にて修正を要する認識がされてしまった場合、操作自体はキーボードの有るコンピュータや、比較的画面サイズに余裕があるスマートフォンと比較し、操作部の大きさや視認性の面ではスマートウォッチは最も劣る物である。
よって、同じＷｅｂページの再検索などの操作量自体を減らす為に、前回使った最後のアプリケーションや頻繁に使用するソフトウェアは、その固有名詞を音声入力することで、直接呼び出すことができる、これは公知技術である。
他の既存例としては、時計自体としてのデザインを無視して、検索エンジンや頻繁に使用するアプリケーションのアイコンを盤面に散りばめる手法なども多数存在する。
本発明における正確な検索キー入力により、デザイン性を損ねず、また小画面のままでありながら的確なＷｅｂページ等を呼び出すことができるとしても、電波状態が良好で無い時は、当然目的のＷｅｂページを呼び出すことはできない。
また、インターネット内の地図情報などや長い論文を見る時など、自身が目的地に近付く都度または読み進める都度など、何度も同じＷｅｂページを検索しなければならなくなる。
本項冒頭の通り、大型の機器と比較すれば操作自体が困難であることと、携帯性に優れる反面電波が悪い状況での使用頻度が上がる性質の機器の為、何度も同じＷｅｂページにアクセスする必要が生じないよう、Ｗｅｂページ画面の全体像（論文等であれば１ページ）をトリミングする機能がスマートウォッチ本体側にあることが望ましい。
その操作は、Ｗｅｂ内の地図情報（仮に最終駅から目的地までの徒歩経路）の画面や長い論文の丸１ページなどを、盤面内に位置調整後「さつえい」や「とりみんぐ」と音声入力されることで実行される。
機器のメモリーの能力にも因るが、地図情報は自宅から最初に乗る駅までの１枚、次に駅から目的駅まで１枚、最後に到着駅から目的地まで１枚と次々と内容を保存したり、論文も２ページ目以降次々作業を繰り返せば目的情報全ての「最初から最後まで」記録自体はできる。
使用する際は、音声入力で「保存ＢＯＸ」を呼び出すことで、見たい内容が電波状態に左右されず、検索用の入力操作の手間も無く得ることができる。
１ページの定義は、閲覧中のＷｅｂページを、コンピュータにおいて「印刷指示を行った場合の１ページ目」と同義の範囲であり、仮に図３８であれば「図全体」の範囲である。
なお、当該ページ内で一部だけの範囲指定を掛けて機器に記録させたい場合は、一旦ルーペを出現させてから記録したい範囲全体をルーペに収めた状態で「さつえい」や「とりみんぐ」の音声コマンド操作を行うと、ルーペ内の内容だけがトリミング（記録）される。

前項の保存されたデータを呼び出して、後にルーペモードで再確認する場合、更に機能面で有効となる「コンティニュー機能」を説明する。
地図情報では自身は目的地に近付いて行くことになり、長い論文等であれば読み込み（若しくは聞き込み）が進行していく。
当然起動状態を続ければスマートウォッチのバッテリーは消耗するので、地図を再確認するのは要所ごとであり、論文を読む（聞く）ことでも、一例であるが休み時間の終了や周囲に音を出せない状況に変わってしまう（近くに無関係の人が来る）など中断を余儀なくされることはある。
前項の説明の通り、簡単な音声入力コマンドで再度保存ＢＯＸから呼び出しても、もしルーペの位置が都度起点位置になっていると、地図であれば現在位置まで、論文等なら読み進めた位置までルーペを進める余分な操作が必須になってしまう。
よって保存している画像データにルーペモードを掛けた場合、その画面を閉じる（一つ戻るタッチ）操作をした時に「その瞬間のルーペの位置と拡大率」も一緒に上書き保存される設定とする。
これにより「操作者にとっては途中経過」が自動的に記録される為、再度呼び出した際の利便性が向上する。
論文等をＯＣＲ認識で読み上げさせる場合も、次項のルーペの自動スライドの途中位置から音声出力のボタンワンタッチで再開できるため、操作量が少なくすぐに続きを聞くことが可能になる。

インターネットの論文等のページから、ＯＲＣ認識での音声出力例を説明する。
仮想の論文ページであるが、殆どの場合は〔０１５２〕欄の説明のとおり、広告欄や注意書きが冒頭に掲載されており、本文読み上げの妨げとなる。
ルーペモードの呼び出し若しくは一定時間経過での自動出現の後、拡大や位置調整で「情報を得たい本文の冒頭」（図３８の位置３８２）に位置指定するのが一般的と思われる。
本文文頭を長押して始点指定し、音声入力ボタンを押した時に、目的であるＯＣＲ認識での「音声出力」が得られるが、ルーペ内の視覚情報も無為にはしない。
ＯＣＲ認識の読み上げに合わせて、ルーペ自体も読み上げ中の文節を中心位置にして自動スライドする。
但し、位置指定の為に相当ルーペを拡大していた場合、ルーペ内の文字の流れが早すぎて内容は視認できなくなると思われる。
よって音声出力及びルーペ自動スライドの最中であっても、スマートウォッチ本体の拡大と縮小のボタンはその操作を受け付ける。
適度にルーペの拡大率を落とすと、音声と同調した文字情報を視認しながら、より理解が得られたりレイアウト全体の読み上げ部分の位置関係が把握できるからである。
図３８の読み上げ領域の途中の位置３８４で一度音声出力をキャンセル（一つ戻る）を押して読み上げの一時中止後に、次回同じ保存ＢＯＸから再度データを呼び出せば図３８の拡大率と位置でルーペが存在すると言うことであり、その状態で音声入力ボタン（つまり音声出力の再開）をすれば、図３８の読み上げ途中の位置３８５からルーペが音声出力と同調してスライドしていくものである。

本発明の音声入力装置は、各種電子機器を使用した音声入力装置として利用することができ、特に液晶画面、望ましくはタッチパネルを有する電子機器において実行することのできる音声入力装置として利用することができる。

１０認識前画面
１２指定領域
１７タッチ領域
２０認識中画面
５０多機能マウス
６１選択領域
７０編集・修正画面
７１縦バー
１３０足踏みタッチパッド
１３０パッド
１４１外国語入力ボタン
１４２Ｃボタン
１４３母国語入力ボタン
１５３補助入力表示部
２０１修正テキスト入力画面
２１１起点
２１２終点
３２５ａ認識前画面
３２５ｂ認識中画面
３２５ｃ編集・修正画面
３７１ルーペ（虫眼鏡）部
３７２ルーペ表示領域

Claims

音声を認識してこれを文字情報に変換する音声入力装置であって、
入力した音声を認識する音声認識部と、
当該音声認識部で認識した音声を文字列に変換する文字変換部と、
当該文字変換部で変換した文字列を表示する文字列表示部と、
当該文字列表示部に、句点、読点、括弧及び関数の少なくとも何れからなる図形文字、及び／又は制御文字を表示させる補助入力表示部と、
補助入力表示部に表示された図形文字及び／又は制御文字の選択により、前記文字変換部で変換した文字列に挿入する記号挿入部と、
入力した文字列を編集または修正する編集修正部を備えており、
当該編集修正部は、音声認識部における音声認識での誤認識を修正する為の編集・修正画面を、音声認識中の認識中画面から切り替えて表示させ、
当該編集・修正画面で指定した指定範囲または指定位置の文字列を一時記憶すると共に、当該指定範囲または指定位置の文字列を、音声入力によって文字列表示部に表示した文字列から選択した上書きしたい文字列で置き換える、音声入力装置。
前記文字列表示部に表示された文字列の範囲を指定する範囲指定部と、
当該範囲指定部で指定した範囲の文字列を再変換する再変換部を有し、
範囲指定部により指定した範囲の文字列を平仮名に変換する、請求項１に記載の音声入力装置。
前記補助入力表示部は、入力対象の表示領域に重ねて、当該入力対象の表示画面を透過させて表示され、文章の最初に入力される記号を含む認識前画面と、文章の最初に入力される記号を除き、文章の途中に入力される鉤括弧等の記号及び句読点を含む認識中画面とを選択表示可能であり、
音声の認識と同時に、認識前画面を認識中画面に変化させる画面変更手段を備える、請求項１又は２に記載の音声入力装置。
更に、表示装置に表示されている任意の領域を拡大表示する拡大表示部を備えており、
当該拡大表示部内において、起点位置指定、終点位置指定、または範囲指定が可能である、請求項１～３の何れか一項に記載の音声入力装置。
更に、範囲指定した文字列を音声出力する音声出力部を備え、
音声出力における読み上げの一時中止後に音声出力を再開した時は、読み上げ途中の位置から音声出力を行う、請求項１～４の何れか一項に記載の音声入力装置。