JP6416309B1 - 端末装置及びプログラム - Google Patents

端末装置及びプログラム Download PDF

Info

Publication number
JP6416309B1
JP6416309B1 JP2017078975A JP2017078975A JP6416309B1 JP 6416309 B1 JP6416309 B1 JP 6416309B1 JP 2017078975 A JP2017078975 A JP 2017078975A JP 2017078975 A JP2017078975 A JP 2017078975A JP 6416309 B1 JP6416309 B1 JP 6416309B1
Authority
JP
Japan
Prior art keywords
display area
word
display
text
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017078975A
Other languages
English (en)
Other versions
JP2018180883A (ja
Inventor
滋 村田
滋 村田
雄一 大坪
雄一 大坪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced Media Inc
Original Assignee
Advanced Media Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Media Inc filed Critical Advanced Media Inc
Priority to JP2017078975A priority Critical patent/JP6416309B1/ja
Application granted granted Critical
Publication of JP6416309B1 publication Critical patent/JP6416309B1/ja
Publication of JP2018180883A publication Critical patent/JP2018180883A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

【課題】より使い勝手の良い端末装置およびプログラムを提供すること。【解決手段】本開示の第一形態は、入力音声の認識結果の確定前に、前記入力音声の認識結果を、テキストとして第一表示エリアに表示する共に、音声認識用の単語辞書を構成する単語単位で区切って第二表示エリアに表示する表示部と、ユーザ操作に応答して、前記第二表示エリア内の複数の単語から少なくとも一つを指定する第一入力部と、前記第一入力部により指定された単語の編集結果に従って、前記第一表示エリア内のテキストと、前記第二表示エリア内の単語との表示を変更する制御部と、を備えた端末装置に向けられる。【選択図】図1

Description

本開示は、入力音声の認識結果を処理するための端末装置及びプログラムに関する。
従来、ユーザが認識誤りを選択操作により効率的に訂正することが可能な「音声訂正」という音声入力インタフェース機能が提案されている。音声訂正では、ユーザが音声入力を開始すると、認識結果を単語ごとに区切った表示と、区切られた各区間に対する他候補が発話の最中から次々と画面に描画される。
緒方他、「音声訂正:選択操作による効率的な誤り訂正が可能な音声入力インタフェース」、情報処理学会論文誌、Jan.2007、Vol.48 No.1
本開示の目的は、より使い勝手の良い端末装置およびプログラムを提供することである。
本開示の第一形態は、入力音声の認識結果の確定前に、前記入力音声の認識結果を、音声認識用の単語辞書を構成する単語単位で区切らずにテキストとして第一表示エリアに表示する共に、前記単語単位で区切って、前記第一表示エリアと同一画面に設けられる第二表示エリアに表示する表示部と、ユーザ操作に応答して、前記第二表示エリア内の複数の単語から少なくとも一つを指定する第一入力部と、前記第一入力部により指定された単語の編集結果に従って、前記第一表示エリア内のテキストと、前記第二表示エリア内の単語との表示を変更する制御部と、を備えた端末装置に向けられる。
本開示の第二形態は、コンピュータに、入力音声の認識結果の確定前に、前記入力音声の認識結果を、音声認識用の単語辞書を構成する単語単位で区切らずにテキストとして第一表示エリアに表示する共に、前記単語単位で区切って、前記第一表示エリアと同一画面に設けられる第二表示エリアに表示するよう処理する第一ステップと、ユーザ操作に応答して、前記第二表示エリア内の複数の単語から少なくとも一つを指定するよう処理する第二ステップと、前記第二ステップにより指定された単語の編集結果に従って、前記第一表示エリア内のテキストと、前記第二表示エリア内の単語との表示を変更するよう処理する第三ステップと、を実行させるプログラムに向けられる。
本開示によれば、より使い勝手の良い端末装置およびプログラムを提供することが出来る。
本開示の一実施形態に係る端末装置を備えた音声認識システムの構成を示す図 図1の端末装置の詳細な構成を示す図 メイン画面の初期状態と、音声認識中のメイン画面を示す模式図 編集処理用のメイン画面の構成を示す模式図 図2の端末装置における編集処理の最初の部分を示すフロー図 図2の端末装置における編集処理の二番目の部分を示すフロー図 図5AのステップS009後のメイン画面を示す模式図 図5AのステップS011→S015→S019によるメイン画面の遷移を示す模式図 図5A,図5BのステップS011→S021→S023の一連の処理によるメイン画面の遷移を示す模式図 図5A,図5BのステップS013→S027の一連の処理によるメイン画面の遷移を示す模式図 図5A,図5BのステップS011→S031→S033の一連の処理によるメイン画面の遷移を示す模式図
以下、上記図面を参照して、本開示の一実施形態に係る端末装置11およびプログラムを詳説する。
<1.定義>
いくつかの図面にはx軸、y軸が示される。x軸は、本開示では、タッチスクリーン117の横方向(左右方向)を示すとする。y軸は、タッチスクリーン117の縦方向(上下)を示すとする。
下表1は、以下の説明で使用される頭字語や略語の意味を示す。
Figure 0006416309
<2.音声認識システム1の全体構成>
図1は、音声認識システム1の全体構成を示すブロック図である。
音声認識システム1は、端末装置11を備えている。
端末装置11は、例えばスマートフォン又は携帯電話であって、音声認識サーバ13とネットワーク15を介して双方向データ通信可能に接続される。
より具体的には、端末装置11は、ユーザによる入力音声の時間波形を表す音声データを、ネットワーク15に送出する。なお、音声データは、音声の時間波形以外にも、入力音声の特徴量を表すデータであっても良い。
ネットワーク15は、例えばインターネット回線であって、端末装置11から送出された音声データを音声認識サーバ13に伝送する。
音声認識サーバ13は、例えばサーバ装置であって、ネットワーク15を介して端末装置11の音声データを受信して、受信音声データに周知の音声認識を行う。その結果、音声認識サーバ13は、端末装置11側での表示等のために、音声認識の結果を文字で表すテキストデータを生成する。なお、テキストデータが表す文字には、一部の記述記号(句点等)が付加される場合もある。
また、本開示で、テキストデータとは、キーボード入力されたものでは無く、音声認識の結果を文字で表すものとする。
音声認識サーバ13は、自身が生成したテキストデータを、ネットワーク15を介して端末装置11に送信する。
なお、音声認識サーバ13は本開示の要部ではないため、音声認識サーバ13に関しては、これ以上の説明を控える。
端末装置11は、ネットワーク15を介して音声認識サーバ13からのテキストデータを受信する。端末装置11は、受信テキストデータを表示する共に、必要に応じて、ユーザ操作に応答して、表示中のテキストデータを編集する。その後、端末装置11は、ユーザ操作に応答して、表示中のテキストデータを確定する。
以下、端末装置11におけるテキストデータの表示から確定までの間の一部または全ての処理を編集処理という。
<3.端末装置11の詳細な構成>
端末装置11は、図2に示すように、音声入力部111と、制御部113と、送受信部115と、タッチスクリーン117と、を備えている。
音声入力部111は、例えばマイクおよびADCの組み合わせであって、ユーザの入力音声をAD変換してデジタル信号を生成し、制御部113に送信する。
制御部113は、例えば、基板上に実装されたマイコン、プログラムメモリ、メインメモリおよびストレージを含む。
ストレージには、本開示では、音声認識用の言語モデルを構成する単語辞書(即ち、音声認識用の単語辞書)が格納される。この単語辞書は、端末装置11に文字をキーボード入力するためのソフトウェア(IMやIMEと呼ばれることがある)が使用する辞書とは異なる。なお、音声認識結果の他候補(詳細は後述)の表示のために、IMやIMEの辞書の一部が使用されることもある。
制御部113において、マイコンは、プログラムメモリに格納されたプログラムを、メインメモリを用いて実行する。これにより、マイコンは、単語辞書を用いたテキストデータの編集処理等を行う。
送受信部115は、通信IFと呼ばれてもよく、本開示では、制御部113で生成された音声データをネットワーク15に送出すると共に、ネットワーク15上を伝送されてきたテキストデータを制御部113に転送する。
タッチスクリーン117は、タッチパネルがディスプレイに備わったもので、ディスプレイの表示画面をユーザが直接触れることで操作できるディスプレイである。タッチスクリーン117は、制御部113で生成された画面データに従って画面表示を行う。また、タッチスクリーン117は、ユーザ操作に応答して、ユーザの操作位置等を示す情報を生成し制御部113に送信する。
<4.端末装置11における処理>
次に、図3,図4をさらに参照して、端末装置11における処理を説明する。
ユーザは、端末装置11を操作してプログラムを起動しログインをする。ログイン完了後、制御部113は、タッチスクリーン117におけるメイン画面Smainの表示内容を初期状態にする(図3左側を参照)。
ユーザが音声認識を行いたい場合、メイン画面Smainに含まれる録音ボタンBrec をタッチ操作する。これに応じて、タッチスクリーン117は、録音ボタンBrec がタッチ操作されたことを表す情報を制御部113に送信する。受信情報に基づき、制御部113は、メイン画面Smainの下部の表示エリアAlow (点線枠内を参照)に、音声認識の実行中であることを表示させる(図3右側を参照)。
ユーザは、録音ボタンBrec をタッチ操作後、音声入力部111(図2を参照)向けて話し出す。本開示では、ユーザの入力音声として”けいぶにたいじょう…”が例示される(図3右側の吹き出しObal1内を参照)。音声入力部111は、自身に入力された音声を表す電気信号を生成して制御部113に送信する。
制御部113は、話し終わりか、録音ボタンBrec の再操作を検知すると、話し始めから話し終わりまで(換言すると、録音ボタンBrec のタッチ操作間)の音声データを生成し、送受信部115を介してネットワーク15に送出する(図1等を参照)。
その後、制御部113は、直前に送った音声データの音声認識の結果を文字で表すテキストデータを、音声認識サーバ13から、ネットワーク15および送受信部115を介して受信する。
制御部113は、テキストデータを受け取ると、メイン画面Smainの表示内容を、編集処理用に切り替える。以下、図4を参照して、編集処理用のメイン画面Smainの構成を説明する。
まず、図4左側に示すように、メイン画面Smainの上半分のほぼ全域に、テキスト表示エリアAtextが設けられる。テキスト表示エリアAtextは、第一表示エリアと呼んでも良い。このテキスト表示エリアAtextには、編集対象のテキストデータ(換言すると、確定前のテキストデータ)が表す文字列がそのまま表示される。
本開示では、後述の完了ボタンBcompのタッチ操作により、編集対象のテキストデータが確定される。未確定の文字列と、確定済の文字列とは、互いに異なる態様で表示されることが好ましい。本開示では、未確定の文字列は、予め定められた色(例えば黄色)で強調されるとする。なお、色は、ユーザ設定により変更可能であっても良い。
テキスト表示エリアAtextの真下には、好ましい形態として、複数のページボタンBpage(点線枠内を参照)が横並びで配置される。本開示では、ページという概念が導入されている。テキスト表示エリアAtext内の文字列のひとまとまりが一ページ分となる。各ページボタンBpageは、単一のテキスト表示エリアAtextに表示される文字列に割り当てられる。
あるページボタンBpageがタッチ操作されると、タッチ操作されたものに割り当てられた文字列をテキスト表示エリアAtextに表示させる。なお、ページボタンBpageは本開示の要部では無いため、これ以上の説明は控える。
ページボタンBpageの真下には単語編集エリアAeditが設けられる。この単語編集エリアAeditは、第五表示エリアと呼ばれても良い。この単語編集エリアAeditには、後述の単語選択エリアAselw内で選択された単語が編集可能に表示される。単語編集エリアAeditにおける単語編集の詳細に関しては、第5欄にて詳説する。
単語編集エリアAeditの例えば右側には、編集ボタンBeditが配置される。編集ボタンBeditにはソフトウェアキーボードKBを表示させる機能が割り当てられる。
編集ボタンBeditがタッチ操作されると、メイン画面Smainにおいて単語編集エリアAeditより下方に、周知のソフトウェアキーボードKBを表示させる(図4右側を参照)。
単語編集エリアAeditの真下には、候補選択エリアAselc(図4左側の一点鎖線枠内を参照)が設けられる。
候補選択エリアAselcは、第三表示エリアと呼ばれても良い。候補選択エリアAselcには、後述の単語選択エリアAselw内で選択された単語の他候補(競合候補とも呼ばれる)がユーザのタッチ操作により選択可能に表示される。
ここで、他候補がタッチ操作されると、選択された他候補の表示場所が予め定められた場所(候補選択エリアAselcの左端等)に変更される。これに加えて、テキスト表示エリアAtext内および単語編集エリアAedit内において単語選択エリアAselw内に表示された単語が、選択された他候補に置換される。
候補選択エリアAselcの左側には、削除ボタンBdel が配置される。削除ボタンBdel には、テキスト表示エリアAtext内および単語選択エリアAselw内から、単語編集エリアAeditに表示された単語を削除するという機能が割り当てられる。この時、単語編集エリアAedit内の単語も削除される。
候補選択エリアAselcの真下には、単語選択エリアAselwが設けられる。
単語選択エリアAselwは、第二表示エリアと呼んでも良い。単語選択エリアAselwには、編集対象のテキストデータが表す文字列が、音声認識用の単語辞書に登録された単語単位で区切られた状態で表示される。本開示では、単語間にはスペースが挿入され、これによって各単語は隣りの単語と区切られる。また、各単語は、ユーザのタッチ操作により選択可能になっている。
単語選択エリアAselwの右側には、複数の候補追加ボタンBaddcが設けられる。各候補追加ボタンBaddcは、第四表示エリアと呼ばれても良い。
各候補追加ボタンBaddcには、単語選択エリアAselw内で選択された単語の隣りに追加することが可能な記述記号(括弧、句読点、疑問符、感嘆符等)の一つが割り当てられると共に表示される。
なお、例えば始め括弧や終わり括弧のように、単語に対する位置が定められている記述記号があるため、記述記号毎に追加すべき位置が定義される。
なお、候補追加ボタンBaddcの個数によっては、単語選択エリアAselwの右側のエリアに全ての候補選択ボタンBaddcが収まらない場合がある。このような場合、タッチスクリーン117のスライド操作により、全ての候補選択ボタンBaddcを表示・選択可能にすることが好ましい。
また、メイン画面Smainの左下隅にはキャンセルボタンBcancが、その右下隅には完了ボタンBcompが設けられる。
キャンセルボタンBcancには、テキスト表示エリアAtextにおける確定前の文字列をクリアする機能が割り当てられている。
キャンセルボタンBcancがタッチ操作されると、テキスト表示エリアAtextにおける確定前の文字列をクリアされるだけでなく、単語編集エリアAeditに表示されている単語や、単語選択エリアAselwにおける単語もクリアされる。その結果、メイン画面Smainが初期状態(図6を参照)に戻る。
完了ボタンBcompには、テキスト表示エリアAtext内の文字列を確定させる機能が割り当てられている。
完了ボタンBcompがタッチ操作されると、テキスト表示エリアAtext内の文字列が確定されると共に、強調表示が解除される。
<5.端末装置11における単語編集の詳細>
次に、図1〜図4に加え、図5A〜図10を参照して、端末装置11における単語編集の詳細について説明する。
図5Aにおいて、制御部113は、メイン画面Smainの表示内容を初期状態にし、前述した方法でユーザが入力した音声データを音声認識サーバ13に送信した後、編集対象のテキストデータを受け取ったか否かを判断する(ステップS001)。
ステップS001でNOと判断されると、ステップS001が再度実行される。
それに対し、ステップS001でYESと判断すると、制御部113は、編集対象のテキストデータが表す文字列を、内部に保持する音声認識用の単語辞書に定義された単語単位に区切る(ステップS003)。本開示では、例えば、単語間にスペースを挿入することで、各単語は隣りの単語と区切られる。なお、本開示では、制御部113が単語単位に区切るとして説明するが、受信テキストデータが表す文字列自体が音声認識サーバ13により単語単位で区切られていても良い。この場合、制御部113におけるストレージには、音声認識用の単語辞書は格納されていなくとも良い。
次に、制御部113は、タッチスクリーン117におけるメイン画面Smainの表示内容を編集処理用に切り替えると共に、編集対象のテキストデータが表す文字列をテキスト表示エリア(第一表示エリア)Atextに表示する。これと実質上同じタイミングで、制御部113は、ステップS003で生成した単語群であって、単語同士がスペースで区切られた単語群を、単語選択エリア(第二表示エリア)Aselwに表示する(ステップS005)。
ここで、単語選択エリアAselwにおいて、一つまたは複数の単語は、ユーザのタッチ操作により選択可能になっている。また、テキスト表示エリアAtextにおいて、未確定の文字列は強調表示される。
次に、制御部113は、完了ボタンBcompがタッチ操作されたか否かを判断する(ステップS007)。タッチスクリーン117は、ユーザが完了ボタンBcompをタッチ操作すると、そのことを示す情報を制御部113に送信する。受信情報に基づき、制御部113は、ステップS007の判断を行う。
ステップS007でYESと判断すると、制御部113は、テキスト表示エリアAtext内の文字列を確定させると共に、メイン画面Smainの表示内容を初期状態(図6を参照)に復帰させる(ステップS009)。その後、図5A他の処理は終了する。なお、確定された文字列(即ち、テキストデータ)は、端末装置11のOS等の機能により、電子メールアプリケーション等の他のアプリケーションにて、別のPC17等に送信される(図1を参照)。なお、確定済のテキストデータのメール送信に関しては、周知であると共に本開示の要部では無いので、これ以上の説明を控える。
なお、図6において、メイン画面Smainの初期状態は、基本的に、図3左側に示すものと同様である。メイン画面Smainのテキスト表示エリアAtextには、確定後の文字列として”頸部に「帯状疱疹」が確認されました。”が強調無しの状態で表示される。
再度図5Aを参照する。ステップS007でNOと判断すると、制御部113は、単語選択エリアAselwにおいて、一つまたは複数の単語が選択されたか否かを判断する(ステップS011)。タッチスクリーン117は、単語選択エリアAselwにおいてユーザによりタッチ操作された単語を示す情報を制御部113に送信する。受信情報に基づき、制御部113は、ステップS011の判断を行う。
ステップS011でYESと判断すると、制御部113は、選択されているのは一つの単語か否かを判断する(ステップS013)。
ステップS013でYESと判断されると、ステップS015が実行される。まず、制御部113は、タッチ操作された単語と競合する一つまたは複数の他候補(競合候補)を単語辞書から抽出して、メイン画面Smainの候補選択エリアAselcに表示させる。制御部113はさらに、タッチ操作された単語を、単語編集エリアAeditに表示させると共に、単語選択エリアAselwにおいてタッチ操作された単語を強調表示する。以上がステップS015の処理である。
ステップS011,S013でNOと判断するか、ステップS015の実行後、制御部113は、候補選択エリアAselcにおいて、一つの他候補(競合候補)が選択されたか否かを判断する(ステップS017)。この時、タッチスクリーン117は、候補選択エリアAselcにおいてユーザにより一つの他候補がタッチ操作されると、第一入力部として機能し、それを指定する情報を制御部113に送信する。受信情報に基づき、制御部113は、ステップS017の判断を行う。
ステップS017でYESと判断すると、制御部113は、テキスト表示エリアAtextに表示された文字列と、単語選択エリアAselwに表示された単語群とにおいて、今回ユーザにより選択された単語を、ステップS017で選択された他候補に置換する(ステップS019)。これが編集処理の一具体例である。また、単語編集エリアAeditにおいて、選択された競合候補は左端に表示される。
ここで、図7には、ステップS011→S015→S019の一連の処理によるメイン画面Smainの表示内容の遷移が示される。より具体的には、図7左側にはステップS011での表示内容が、図7真ん中にはステップS015での表示内容が、図7右側にはステップS019での表示内容が示される。
図7左側の例では、テキスト表示エリアAtextに、”頚部に帯状疱疹が発生しました。”という文字列が表示されている。また、単語選択エリアAselwには、”頚部 に 帯状疱疹 が 発生 し まし た 。”と、上記文字列が単語単位で区切られて表示されている。
図7真ん中に示すように、テキスト表示エリアAtextの表示内容は、図7左側と変わらない。それに対し、単語選択エリアAselwにおいて”頚部”は、タップ操作され、その結果、強調表示されている。これに伴い、候補選択エリアAselcには”頚部”の他候補が、単語編集エリアAeditには”頚部”という単語が表示される。
また、図7右側に示すように、候補選択エリアAselcにおいて、”頚部”の他候補の一つである”頸部”がタップ操作され、その結果、テキスト表示エリアAtextおよび単語編集エリアAeditの表示内容は”頚部”から”頸部”に置換される。これに加え、単語編集エリアAeditには”頸部”が左端に表示される。
再度図5Aを参照する。ステップS017でNOと判断するか、ステップS019の後に、制御部113は、複数の候補追加ボタンBaddcのいずれか一つが選択されたか否かを判断する(図5BのステップS021)。この時、タッチスクリーン117は、ユーザにより一つの候補追加ボタンBaddcがタッチ操作されると、第一入力部として機能し、それを指定する情報を制御部113に送信する。受信情報に基づき、制御部113は、ステップS017の判断を行う。
ステップS021でYESと判断すると、判断部113は、タッチ操作によりユーザが選択した候補追加ボタンBaddcに割り当てられた記述記号を、テキスト表示エリアAtext内に表示された文字列と、単語選択エリアAselw内に表示された単語群とにおいて、ユーザがステップS011で選択した単語の隣りに追加する(ステップS023)。これが編集処理の別の具体例である。なお、ステップS013で選択された単語が一つで無い場合には、複数の単語を一つの単語とみなして、制御部113はステップS023の処理を行えばよい。
ここで、図8には、ステップS011→S021→S023の一連の処理によるメイン画面Smainの表示内容の遷移が示される。より具体的には、図8左側にはステップS011での表示内容が、図8真ん中にはステップS021→S023(第一回目のループ)での表示内容が、図8右側にはステップS021→S023(第二回目のループ)での表示内容が示される。
図8左側の例では、テキスト表示エリアAtextに、”頚部に帯状疱疹が発生しました。”という文字列が表示されている。また、単語選択エリアAselwには、”頚部 に 帯状疱疹 が 発生 し まし た 。”と、上記文字列が単語単位で区切られて表示されている。このうち、ステップS011では、帯状疱疹という単語が選択されて、単語選択エリアAselwにおいて強調表示されている。
図8真ん中に示すように、第一回目のループのステップS021→S023において、スクロール操作等を経て、始め括弧(具体的には「)が割り当てられた候補追加ボタンBaddcが選択されたとする。その結果、テキスト表示エリアAtextおよび単語選択エリアAselwにおいて帯状疱疹の左隣りには始め括弧が挿入される(点線の楕円内を参照)。
図8右側に示すように、第二回目のループのステップS021→S023において、スクロール操作等を経て、終わり括弧(具体的には」)が割り当てられた候補追加ボタンBaddcが選択されたとする。その結果、テキスト表示エリアAtextおよび単語選択エリアAselwにおいて帯状疱疹の右隣りには終わり括弧が挿入される(点線の楕円内を参照)。
再度図5Bを参照する。ステップS021でNOと判断するか、ステップS023の後に、制御部113は、削除ボタンBdel が操作されたか否かを判断する(ステップS025)。この時、タッチスクリーン117は、第一入力部として機能し、ユーザにより削除ボタンBdel がタッチ操作されると、それを指定する情報を制御部113に送信する。受信情報に基づき、制御部113は、ステップS025の判断を行う。
ステップS025でYESと判断すると、判断部113は、テキスト表示エリアAtext内に表示された文字列と、単語選択エリアAselw内に表示された単語群とにおいて、ユーザがステップS011で選択した単語を削除する。これに加えて、制御部113は、単語編集エリアAeditに表示された単語を消去する(ステップS027)。これが編集処理のさらに別の具体例である。なお、ステップS013でNOと判断された場合には、複数の単語を一つの単語とみなして、ステップS027が行われれば良い。
ここで、図9には、ステップS013→S027の一連の処理によるメイン画面Smainの表示内容の遷移が示される。より具体的には、図8左側にはステップS013での表示内容が、図8右側にはステップS027での表示内容が示される。
図9左側の例では、テキスト表示エリアAtextに、”頚部に帯状疱疹が発生しました。”という文字列が表示されている。また、単語選択エリアAselwには、”頚部 に 帯状疱疹 が 発生 し まし た 。”と、上記文字列が単語単位で区切られて表示されている。このうち、ステップS013でNOと判断され、”し まし た 。”という四つの単語が選択されて、単語選択エリアAselwにおいて個々に強調表示されている。
図9右側に示すように、ステップS027において、タッチ操作を経て、削除ボタンBdelが選択されたとする。その結果、テキスト表示エリアAtextにおける”しました。”の部分および単語選択エリアAselwにおける”し まし た 。”という四つの単語が削除される(点線の楕円内を参照)。また、単語編集エリアAeditにおける”しました。”も消去される。
再度、図5Bを参照する。ステップS025でNOと判断するか、ステップS027の後に、制御部113は、編集ボタンBeditが操作されたか否かを判断する(ステップS029)。この時、タッチスクリーン117は、第一入力部として機能し、ユーザにより編集ボタンBeditがタッチ操作されると、それを指定する情報を制御部113に送信する。受信情報に基づき、制御部113は、ステップS029の判断を行う。
ステップS029でYESと判断すると、判断部113は、前述の通り、メイン画面SmainにソフトウェアキーボードKB(図4右側を参照)を表示すると共に、ソフトウェアキーボードKBによる単語編集を行う(ステップS031)。これは編集処理のさらに別の具体例である。
具体的には、第二入力部としてのソフトウェアキーボードKBをユーザが操作するたびに、制御部113は、ユーザによる操作内容を単語編集エリアAeditに表示させる。これに加えて、制御部113は、テキスト表示エリアAtextに表示された文字列と、単語選択エリアAselw内に表示された単語群とにおいて、ステップS011で選択した単語を、ユーザによる操作内容に変更する。
ステップS031の単語編集は、ソフトウェアキーボードKB内の完了ボタンが操作されるまで繰り返される(ステップS033)。そして、ステップS033でYESと判断されると、処理はステップS009に戻る。
ここで、図10には、ステップS011→S031→S033の一連の処理によるメイン画面Smainの表示内容の遷移が示される。より具体的には、図10左側にはステップS011での表示内容が、図10真ん中にはステップS031での表示内容が、図10右側にはステップS033での表示内容が例示される。
図10左側には、テキスト表示エリアAtextに、”頚部に「帯状疱疹」が発生”という文字列が表示されている。また、単語選択エリアAselwには、”頚部 に 「 帯状疱疹 」 が 発生”と、上記文字列が単語単位で区切られて表示されている。このうち、”発生”という単語が選択されて単語編集エリアAeditに表示されると共に、単語選択エリアAselwにおいて強調表示されている。
図10真ん中には、編集ボタンBeditの操作後、ユーザがソフトウェアキーボードKBを操作して、”確認されました”と入力した時のメイン画面Smainが示されている。この場合、単語編集エリアAeditの表示は、”発生”から”確認されました”に変更される。
図10右側には、ユーザがソフトウェアキーボードKBの完了ボタンを操作した後のメイン画面Smainが示されている。この場合、ソフトウェアキーボードKBの表示が終了し、テキスト表示エリアAtext内に表示された文字列と、単語選択エリアAselw内に表示された単語群とにおいて、ユーザがステップS011で選択した”発生”が、”確認されました”に置換される。
<6.端末装置11の作用・効果>
上記の通り、本端末装置11によれば、従来よりも使い勝手の良いユーザインタフェイスを提供することが可能となる。
より具体的には、本端末装置11では、図5A,図5Bに示すように、テキストデータの確定前に、単語選択エリアAselwには、音声認識結果が表す文字列が単語単位に区切られ、ユーザが選択可能に表示される。ユーザは、この中から単語を選択した後に様々な編集を加えることが出来る。これにより、音声認識結果が表す文字列を効率的に編集可能な端末装置11を提供することが可能となる。さらに、スマートフォン等のように、端末装置11が相対的に小さなディスプレイを備える場合には、選択した単語単位で編集できることはユーザにとっては非常に使い勝手が良い。
また、本端末装置11では、様々な手法で、音声認識結果が表す文字列の様々な部分に記述記号を単語単位として挿入することが出来る(図8等を参照)。さらに、本端末装置11では、挿入された記述記号は、一単語としてさらに編集可能となっている。さらに言えば、複数の単語をひとまとめとして編集可能となっている(図9等を参照)。従って、上述の通り、非常に使い勝手の良いユーザインタフェイスを提供することが可能となる。
<7.付記>
なお、上記では、候補追加ボタンBaddcには記述記号が割り当てられていた。しかし、これに限らず、候補追加ボタンBaddcには、特定の機能(単語の削除等)が割り当てられても良い。
上記では、制御部113にプログラムが格納されるとして説明した。しかし、これに限らず、プログラムは、コンピュータにより読み取り可能な記録媒体(例えばDVD等)に格納されて提供されても構わない。他にも、各種端末装置がダウンロードできるように、プログラムはサーバ装置に格納されていても良い。
上記では、端末装置11は、音声認識サーバ13からテキストデータの提供を受けるとして説明した。しかし、これに限らず、端末装置11が入力音声に対し音声認識を行ってテキストデータを生成し、自身が生成したテキストデータに対し図5A,図5Bの処理を行っても構わない。
本開示の端末装置およびプログラムは、使い勝手の良いユーザインタフェイスを提供することが可能であり、医療・介護向けのクラウド型音声認識サービス等に好適である。
11 端末装置
111 音声入力部
113 制御部
115 送受信部
117 タッチスクリーン

Claims (6)

  1. 入力音声の認識結果の確定前に、前記入力音声の認識結果を、音声認識用の単語辞書を構成する単語単位で区切らずにテキストとして第一表示エリアに表示する共に、前記単語単位で区切って、前記第一表示エリアと同一画面に設けられる第二表示エリアに表示する表示部と、
    ユーザ操作に応答して、前記第二表示エリア内の複数の単語から少なくとも一つを指定する第一入力部と、
    前記第一入力部により指定された単語の編集結果に従って、前記第一表示エリア内のテキストと、前記第二表示エリア内の単語との表示を変更する制御部と、
    を備えた端末装置。
  2. 前記表示部はさらに、前記第一入力部により指定された単語の他候補を第三表示エリアに表示し、
    前記第一入力部はさらに、ユーザ操作に応答して、前記第三表示エリア内の他候補の一つを指定し、
    前記制御部は、前記第一表示エリア内のテキストの表示と、前記第二表示エリア内で指定された単語の表示とを、前記第一入力部により指定された他候補に置換する、
    請求項1に記載の端末装置。
  3. 前記表示部はさらに、前記第一入力部により指定された単語の隣りに追加可能な文字・記号の候補を第四表示エリアに表示し、
    前記第一入力部はさらに、ユーザ操作に応答して、前記第四表示エリア内の文字・記号の一つを指定し、
    前記制御部は、前記第一入力部により指定された文字・記号を、前記第一表示エリア内のテキストに追加する共に、前記第二表示エリア内で指定された単語の隣りに、前記第一入力部により指定された文字・記号を挿入する、
    請求項1に記載の端末装置。
  4. 前記第一入力部は、前記第二表示エリア内の複数の単語を指定し、
    前記制御部は、前記第一入力部により指定された複数の単語を、前記第一表示エリア内のテキストと、前記第二表示エリア内で指定された単語とから削除する、
    請求項1に記載の端末装置。
  5. キーボード上でのユーザ操作に応答して、少なくとも文字を指定する第二入力部を、さらに備え、
    前記表示部はさらに、前記第一入力部により指定された単語を第五表示エリアに表示し、
    前記制御部は、前記第五表示エリアに表示された単語を、前記第二入力部により指定された文字に従って編集し、その編集結果に従って、前記第一表示エリア内のテキストの表示と、前記第二表示エリア内で指定された単語との表示を変更する、
    請求項1に記載の端末装置。
  6. コンピュータに、
    入力音声の認識結果の確定前に、前記入力音声の認識結果を、音声認識用の単語辞書を構成する単語単位で区切らずにテキストとして第一表示エリアに表示する共に、前記単語単位で区切って、前記第一表示エリアと同一画面に設けられる第二表示エリアに表示するよう処理する第一ステップと、
    ユーザ操作に応答して、前記第二表示エリア内の複数の単語から少なくとも一つを指定するよう処理する第二ステップと、
    前記第二ステップにより指定された単語の編集結果に従って、前記第一表示エリア内のテキストと、前記第二表示エリア内の単語との表示を変更するよう処理する第三ステップと、
    を実行させるプログラム。
JP2017078975A 2017-04-12 2017-04-12 端末装置及びプログラム Active JP6416309B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017078975A JP6416309B1 (ja) 2017-04-12 2017-04-12 端末装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017078975A JP6416309B1 (ja) 2017-04-12 2017-04-12 端末装置及びプログラム

Publications (2)

Publication Number Publication Date
JP6416309B1 true JP6416309B1 (ja) 2018-10-31
JP2018180883A JP2018180883A (ja) 2018-11-15

Family

ID=64017206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017078975A Active JP6416309B1 (ja) 2017-04-12 2017-04-12 端末装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6416309B1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7109498B2 (ja) * 2020-04-09 2022-07-29 励至 鈴木 音声入力装置
CN111540356B (zh) 2020-04-20 2022-05-17 思必驰科技股份有限公司 用于语音对话的纠正方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143503A (ja) * 1996-11-08 1998-05-29 Nec Corp 音声ワードプロセッサ
JP3986009B2 (ja) * 2002-11-01 2007-10-03 日本放送協会 文字データ修正装置、その方法及びそのプログラム、並びに、字幕の生成方法
US6989822B2 (en) * 2003-11-10 2006-01-24 Microsoft Corporation Ink correction pad

Also Published As

Publication number Publication date
JP2018180883A (ja) 2018-11-15

Similar Documents

Publication Publication Date Title
US10698604B2 (en) Typing assistance for editing
JP5097198B2 (ja) テキスト文書に画像アーティファクトを挿入する装置および方法
JP2021510881A (ja) 改良したインタラクティブなアニメ動画の会話型インターフェイスシステムを有するコンピューティングデバイス
KR101372369B1 (ko) 정보입력장치 및 정보입력방법
TW200842613A (en) Spell-check for a keyboard system with automatic correction
CN109886180A (zh) 用于交叠手写文本输入的用户界面
CN103777774B (zh) 终端装置及输入法的文字纠错方法
CN103533448B (zh) 智能电视的光标控制方法和光标控制装置
KR20130111453A (ko) 정보를 송신하기 위한 터치 기반 방법 및 장치
JP2015095002A (ja) 表示制御装置、表示制御方法、プログラム及び情報記憶媒体
JP6416309B1 (ja) 端末装置及びプログラム
CN103034407B (zh) 终端和快速输入常用短语的方法
CN102141886B (zh) 文本编辑方法和设备
KR20150083173A (ko) 휴대 단말의 텍스트 편집 장치 및 그 방법
CN108965968A (zh) 智能电视操作提示的展示方法、装置及计算机存储介质
JP6204894B2 (ja) バックスペースキーに基づいて入力ミスを自動的に修正する日本語入力方法、入力システム、コンピュータプログラム及び記録媒体
CN107688397A (zh) 一种输入方法、系统和用于输入的装置
US9465517B2 (en) Character input device and car navigation device equipped with character input device
KR102305181B1 (ko) 챗봇을 통한 전자문서 제공 방법, 챗봇을 통한 전자문서 작성 방법 및 장치
JP2007219940A (ja) メニュー制御装置、携帯電話、およびメニュー制御装置用プログラム
CN106886297A (zh) 输入法优化方法、装置和移动终端
JP5674140B2 (ja) テキスト入力装置、テキスト入力受付方法及びプログラム
KR20090020265A (ko) 휴대 단말기 및 그 메시지 작성 방법
JP3324830B2 (ja) 機械翻訳装置
JP6367733B2 (ja) 画面制御装置、画面制御方法及び画面制御プログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180925

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181003

R150 Certificate of patent or registration of utility model

Ref document number: 6416309

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250