JP2022030754A

JP2022030754A - 入力支援システム、入力支援方法およびプログラム

Info

Publication number: JP2022030754A
Application number: JP2020134972A
Authority: JP
Inventors: 遼馬浅見; Ryoma Asami
Original assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Current assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Priority date: 2020-08-07
Filing date: 2020-08-07
Publication date: 2022-02-18
Also published as: US20230185525A1; WO2022030595A1

Abstract

【課題】入力操作の簡易性を向上させる。
【解決手段】端末装置を備える入力支援システムは、取得部と認識部と入力項目表示部と認識結果表示部と受け付け部とを備える。取得部は利用者の発話音声を示す発話音声データを取得する。認識部は発話音声データを音声認識してテキストデータを生成する。入力項目表示部は、テキストデータと対応付けられる入力項目を含む複数の入力項目を表示する。認識結果表示部は、テキストデータを表示する。受け付け部は、入力項目表示部によって表示された複数の入力項目から、認識結果表示部によって表示されたテキストデータと対応付けられる入力項目を選択する操作を受け付ける。受け付け部は、複数の入力項目が端末装置の表示画面の一部に表示されかつテキストデータが端末装置の表示画面の他の一部に表示されている状態で、テキストデータと対応付けられる入力項目を選択する操作を受け付ける。
【選択図】図１

Description

本発明の実施形態は、入力支援システム、入力支援方法およびプログラムに関する。

従来から、ユーザによる情報の入力を支援することが行われている。例えば、ユーザが発話した内容に対応する音声デジタルデータに対する音声認識処理が行われ、音声デジタルデータから変換されたテキストデータが生成される。
ところで、ユーザは、情報処理装置によって生成されたテキストデータを、複数の項目のうちのいずれかの項目に対応付けて入力（保存）しなければならない。
ところが、この従来技術では、情報処理装置によって生成されたテキストデータを、複数の項目のうちのいずれかの項目に対応付けて入力（保存）するための支援が行われない。
そのため、この従来技術では、ユーザが、情報処理装置によって生成されたテキストデータをどの項目に対応付けて入力（保存）すべきか迷ってしまうおそれがある。つまり、ユーザが入力操作を簡易に行うことができないおそれがある。

また、従来から、救急搬送時における情報伝達を支援することが行われている。例えば、救急搬送時になされた会話音声が音声認識されてテキストデータに変換される。
ところで、この従来技術では、情報処理装置によって生成されたテキストデータを複数の項目のうちのいずれかの項目に対応付ける処理が、例えば救急隊員、患者自身、患者の家族等の関係者などのような救急受入の要求者（つまり、人間）によって行われるのではなく、情報処理装置によって行われる。
そのため、情報処理装置によって生成されたテキストデータが、救急受入の要求者が意図しない項目に対応付けられてしまうおそれがある。
つまり、この従来技術では、テキストデータを複数の項目のうちのいずれかの項目に対応付ける処理が人間によって行われないため、当然のことながら、テキストデータを複数の項目のうちのいずれかの項目に対応付ける人間の操作の簡易性を向上させることはできない。

特許第６５９４９８１号公報特許第６６２１１５１号公報

本発明が解決しようとする課題は、入力操作の簡易性を向上させることができる入力支援システム、入力支援方法およびプログラムを提供することである。

実施形態の入力支援システムは、端末装置を備える入力支援システムであって、発話音声データ取得部と音声認識部と入力項目表示部と認識結果表示部と入力項目選択操作受け付け部とを備える。発話音声データ取得部は利用者の発話音声を示す発話音声データを取得する。音声認識部は発話音声データ取得部によって取得された発話音声データを音声認識してテキストデータを生成する。入力項目表示部は音声認識部によって生成されたテキストデータと対応付けられる入力項目を含む複数の入力項目を表示する。認識結果表示部は音声認識部によって生成されたテキストデータを音声認識部による認識結果として表示する。入力項目選択操作受け付け部は入力項目表示部によって表示された複数の入力項目から、認識結果表示部によって表示されたテキストデータと対応付けられる入力項目を選択する操作を受け付ける。入力項目表示部は、複数の入力項目を端末装置の表示画面の一部に表示し、認識結果表示部は、テキストデータを端末装置の表示画面の他の一部に表示する。入力項目選択操作受け付け部は、入力項目表示部が複数の入力項目を表示しており、かつ、認識結果表示部がテキストデータを表示している状態で、テキストデータと対応付けられる入力項目を選択する操作を受け付ける。

第１実施形態の入力支援システムの構成の一例を示す図である。第１実施形態の入力支援システムの端末装置の表示画面の一例を示す図である。第１実施形態の入力支援システムの端末装置の表示画面の他の例を示す図である。図３に示す例において第１実施形態の入力支援システムによって実行される処理の一例を説明するためのシーケンス図である。

以下、実施形態の入力支援システム、入力支援方法およびプログラムを、図面を参照して説明する。

＜第１実施形態＞
図１は第１実施形態の入力支援システム１の構成の一例を示す図である。
図１に示す例では、入力支援システム１が、端末装置１１と処理サーバ１２とを備えている。端末装置１１と処理サーバ１２とは、例えばネットワーク（図示せず）などを介して通信可能に構成されている。
端末装置１１は、入力項目情報取得部１１Ａと、入力項目表示部１１Ｂと、発話音声データ取得部１１Ｃと、認識結果表示部１１Ｄと、認識結果選択操作受け付け部１１Ｅと、入力可能項目活性化部１１Ｆと、入力項目選択操作受け付け部１１Ｇと、自動入力部１１Ｈとを備えている。
入力項目情報取得部１１Ａは、入力支援システム１を利用して入力（保存）される情報（テキストデータ）に対応付けられる項目（入力項目）に関する情報である入力項目情報を、例えば入力支援システム１の外部から取得する。入力項目情報には、項目名に関する情報、入力形式に関する情報などが含まれる。
入力項目表示部１１Ｂは、入力支援システム１を利用して入力（保存）されるテキストデータと対応付けられる入力項目を含む複数の入力項目を端末装置１１の表示画面に表示する。
発話音声データ取得部１１Ｃは、入力支援システム１の利用者の発話音声を示す発話音声データを取得する。

ここで、図１に示す例では、入力支援システム１の利用者の発話音声を発話音声データ（例えばデジタルデータ）にデータ化する機能が端末装置１１に備えられているが、例えば端末装置１１の他にＩＣレコーダが用いられる例などのような他の例では、入力支援システム１の利用者の発話音声を発話音声データにデータ化する機能が端末装置１１に備えられていなくてもよい。この例では、端末装置１１の外部において、入力支援システム１の利用者の発話音声が発話音声データにデータ化され、発話音声データ取得部１１Ｃが、端末装置１１の外部から、その発話音声データを取得する。

図１に示す例では、処理サーバ１２が、音声認識部１２Ａと、フィラー除去部１２Ｂとを備えている。音声認識部１２Ａは、発話音声データ取得部１１Ｃによって取得された発話音声データを音声認識してテキストデータを生成する。つまり、音声認識部１２Ａは、発話音声データ取得部１１Ｃによって取得された発話音声データをテキストデータに変換する。
フィラー除去部１２Ｂは、発話音声データ取得部１１Ｃによって取得された発話音声データが示す利用者の発話音声に含まれる例えば「えーと」、「えー」、「あー」、「あのー」、「そのー」等のフィラー（言い淀みを含む）を検出する。また、フィラー除去部１２Ｂは、フィラーを検出した場合に、フィラーに対応するテキストデータを、音声認識部１２Ａによって生成されるテキストデータから除去する。

ここで、図１に示す例では、音声認識部１２Ａおよびフィラー除去部１２Ｂが、端末装置１１とは別個に設けられた処理サーバ１２に備えられているが、他の例では、処理サーバ１２が設けられず、音声認識部１２Ａおよびフィラー除去部１２Ｂが端末装置１１に備えられていてもよい。さらに他の例では、音声認識部１２Ａとフィラー除去部１２Ｂとが、異なる複数のサーバに備えられていてもよい。

図１に示す例では、認識結果表示部１１Ｄが、音声認識部１２Ａによって生成されたテキストデータを音声認識部１２Ａによる認識結果として端末装置１１の表示画面に表示する。
入力項目選択操作受け付け部１１Ｇは、入力項目表示部１１Ｂによって表示された複数の入力項目から、認識結果表示部１１Ｄによって表示されたテキストデータ（詳細には、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータ）と対応付けられる入力項目を選択する操作を受け付ける。
さらに上述した入力項目表示部１１Ｂは、複数の入力項目を端末装置１１の表示画面の一部に表示する。また、上述した認識結果表示部１１Ｄは、音声認識部１２Ａによって生成されたテキストデータを端末装置１１の表示画面の他の一部に表示する。入力項目選択操作受け付け部１１Ｇは、入力項目表示部１１Ｂが複数の入力項目を端末装置１１の表示画面に表示しており、かつ、認識結果表示部１１Ｄが音声認識部１２Ａによって生成されたテキストデータを端末装置１１の表示画面に表示している状態で、音声認識部１２Ａによって生成されたテキストデータと対応付けられる入力項目を選択する操作を受け付ける。
そのため、図１に示す例では、入力支援システム１の利用者は、端末装置１１の表示画面に表示されている複数の入力項目とテキストデータとを確認しながら、テキストデータと対応付けられる入力項目を複数の入力項目から選択する操作を容易に行うことができる。

また、利用者の発話音声には、無音区間が含まれる場合がある。
そこで、図１に示す例では、発話音声データ取得部１１Ｃによって取得された発話音声データが示す利用者の発話音声に、無音区間が含まれる場合に、音声認識部１２Ａは、発話音声データ取得部１１Ｃによって取得された発話音声データのうちの無音区間よりも前の部分に対応するテキストデータである無音区間前テキストデータと、発話音声データ取得部１１Ｃによって取得された発話音声データのうちの無音区間よりも後の部分に対応するテキストデータである無音区間後テキストデータとを生成する。
また、認識結果表示部１１Ｄは、音声認識部１２Ａによって生成された無音区間前テキストデータと無音区間後テキストデータとを表示する。
認識結果選択操作受け付け部１１Ｅは、認識結果表示部１１Ｄによって表示されている無音区間前テキストデータおよび無音区間後テキストデータから、入力項目選択操作受け付け部１１Ｇが受け付ける操作によって選択される入力項目と対応付けられるテキストデータを選択する操作を受け付ける。
そのため、図１に示す例では、入力支援システム１の利用者は、認識結果選択操作受け付け部１１Ｅに対する操作を複数回実行することによって、無音区間によって区切られた複数のテキストデータのそれぞれを複数の入力項目のそれぞれに対応付ける操作を容易に行うことができる。
例えば、無音区間は、音声入力ボタン（マイクのボタン）をオフにすることによって、発話音声データに含められる。つまり、この例では、発話音声データが、利用者によって手動で、無音区間前テキストデータと無音区間後テキストデータとに区切られる。
他の例では、例えば入力支援システム１の管理者などによって、発話音声データが無音区間前テキストデータと無音区間後テキストデータとに手動で区切られてもよい。
さらに他の例では、入力支援システム１が、文脈で発話音声データの区切りを判断する機能を有し、発話音声データを無音区間前テキストデータと無音区間後テキストデータとに自動で区切ってもよい。

図１に示す例では、入力可能項目活性化部１１Ｆが、入力項目表示部１１Ｂによって表示された複数の入力項目のうち、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータと対応付け可能な入力項目である候補入力項目の表示を活性化する。
そのため、図１に示す例では、入力支援システム１の利用者は、活性化させられた端末装置１１の表示画面に表示された候補入力項目を確認することによって、認識結果表示部１１Ｄによって表示されたテキストデータと対応付け可能な入力項目を容易に理解することができる。

図１に示す例において、自動入力部１１Ｈは、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータと入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目との対応付けを実行する。また、自動入力部１１Ｈは、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータを、入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目の表示欄（つまり、端末装置１１の表示画面上の選択された入力項目の表示欄）に含める処理を実行する。
詳細には、発話音声データ取得部１１Ｃによって取得された発話音声データが示す利用者の発話音声にフィラーが含まれる場合に、自動入力部１１Ｈは、フィラーに対応するテキストデータがフィラー除去部１２Ｂによって除去された後のテキストデータであるフィラー除去後テキストデータを、入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目の表示欄に含める処理を実行する。
一方、認識結果表示部１１Ｄは、発話音声データ取得部１１Ｃによって取得された発話音声データが示す利用者の発話音声にフィラーが含まれる場合に、フィラーに対応するテキストデータがフィラー除去部１２Ｂによって除去される前のテキストデータであるフィラー除去前テキストデータを端末装置１１の表示画面に表示する。
そのため、図１に示す例では、入力支援システム１の利用者は、認識結果表示部１１Ｄによって表示されたフィラー除去前テキストデータを確認することによって、自分の発話音声にフィラーが含まれるか否かを容易に把握することができる。
また、入力支援システム１の利用者は、認識結果表示部１１Ｄによって表示されたフィラー除去前テキストデータと、自動入力部１１Ｈによって入力項目の表示欄に含められたフィラー除去後テキストデータとを確認することによって、自分の発話音声に含まれるフィラーに対応するテキストデータが除去されたことを容易に把握することができる。

図２は第１実施形態の入力支援システム１の端末装置１１の表示画面の一例を示す図である。
図２に示す例では、第１実施形態の入力支援システム１の端末装置１１が商談記録の入力に用いられている。
図２（Ａ）に示す段階では、端末装置１１の発話音声データ取得部１１Ｃ（図１参照）が、入力支援システム１の利用者の発話音声「○○○○○○○の紹介です。次回は社長さんに紹介することになりました。」を示す発話音声データを取得する。
処理サーバ１２（図１参照）の音声認識部１２Ａ（図１参照）は、発話音声データ取得部１１Ｃによって取得された発話音声データを音声認識してテキストデータを生成する。
詳細には、図２（Ａ）に示す例では、入力支援システム１の利用者の発話音声に無音区間が含まれる。そこで、音声認識部１２Ａは、発話音声データ取得部１１Ｃによって取得された発話音声データのうちの無音区間よりも前の部分に対応するテキストデータである無音区間前テキストデータ「○○○○○○○の紹介です。」と、発話音声データ取得部１１Ｃによって取得された発話音声データのうちの無音区間よりも後の部分に対応するテキストデータである無音区間後テキストデータ「次回は社長さんに紹介することになりました。」とを生成する。
端末装置１１の認識結果表示部１１Ｄ（図１参照）は、音声認識部１２Ａによって生成された無音区間前テキストデータ「○○○○○○○の紹介です。」と無音区間後テキストデータ「次回は社長さんに紹介することになりました。」とを端末装置１１の表示画面の右側部分（図２（Ａ）に「音声メモ画面」と示す部分）に表示する。詳細には、認識結果表示部１１Ｄは、タイムスタンプ「２０２０／０６／１１（木）１０：２３：４０」を含めて無音区間前テキストデータ「○○○○○○○の紹介です。」を端末装置１１の表示画面の右側部分に表示すると共に、タイムスタンプ「２０２０／０６／１１（木）１０：２３：５４」を含めて無音区間後テキストデータ「次回は社長さんに紹介することになりました。」を端末装置１１の表示画面の右側部分に表示する。

また、図２（Ａ）に示す段階では、端末装置１１の認識結果選択操作受け付け部１１Ｅ（図１参照）が、認識結果表示部１１Ｄによって端末装置１１の表示画面の右側部分に表示されている無音区間前テキストデータ「○○○○○○○の紹介です。」および無音区間後テキストデータ「次回は社長さんに紹介することになりました。」から、入力項目選択操作受け付け部１１Ｇ（図１参照）が受け付ける操作によって選択される入力項目「件名」と対応付けられるテキストデータ「○○○○○○○の紹介です。」を選択する操作を受け付ける。
端末装置１１の入力項目表示部１１Ｂ（図１参照）は、入力支援システム１を利用して入力（保存）されるテキストデータ「○○○○○○○の紹介です。」と対応付けられる入力項目「件名」を含む複数の入力項目「件名」、「期日のみ」、「状況」、「説明」を端末装置１１の表示画面の左側部分に表示している。
端末装置１１の入力項目選択操作受け付け部１１Ｇは、入力項目表示部１１Ｂによって端末装置１１の表示画面の左側部分に表示されている複数の入力項目「件名」、「期日のみ」、「状況」、「説明」から、認識結果表示部１１Ｄによって端末装置１１の表示画面の右側部分に表示されたテキストデータ「○○○○○○○の紹介です。」と対応付けられる入力項目「件名」を選択する入力支援システム１の利用者の操作を受け付ける。
その結果、端末装置１１の自動入力部１１Ｈ（図１参照）は、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータ「○○○○○○○の紹介です。」と入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目「件名」との対応付けを実行する。また、自動入力部１１Ｈは、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータ「○○○○○○○の紹介です。」を、入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目「件名」の表示欄に含める処理を実行する。

更に、図２（Ａ）に示す段階では、端末装置１１の認識結果選択操作受け付け部１１Ｅが、認識結果表示部１１Ｄによって端末装置１１の表示画面の右側部分に表示されている無音区間前テキストデータ「○○○○○○○の紹介です。」および無音区間後テキストデータ「次回は社長さんに紹介することになりました。」から、入力項目選択操作受け付け部１１Ｇが受け付ける操作によって選択される入力項目「説明」と対応付けられるテキストデータ「次回は社長さんに紹介することになりました。」を選択する操作を受け付ける。
端末装置１１の入力項目表示部１１Ｂは、入力支援システム１を利用して入力（保存）されるテキストデータ「次回は社長さんに紹介することになりました。」と対応付けられる入力項目「説明」を含む複数の入力項目「件名」、「期日のみ」、「状況」、「説明」を端末装置１１の表示画面の左側部分に表示している。
端末装置１１の入力項目選択操作受け付け部１１Ｇは、入力項目表示部１１Ｂによって端末装置１１の表示画面の左側部分に表示されている複数の入力項目「件名」、「期日のみ」、「状況」、「説明」から、認識結果表示部１１Ｄによって端末装置１１の表示画面の右側部分に表示されたテキストデータ「次回は社長さんに紹介することになりました。」と対応付けられる入力項目「説明」を選択する入力支援システム１の利用者の操作を受け付ける。
そのため、端末装置１１の自動入力部１１Ｈは、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータ「次回は社長さんに紹介することになりました。」と入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目「説明」との対応付けを実行する。また、自動入力部１１Ｈは、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータ「次回は社長さんに紹介することになりました。」を、入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目「説明」の表示欄に含める処理を実行する。
その結果、端末装置１１の表示画面が、図２（Ａ）に示す状態になる。

次いで、図２（Ｂ）に示す段階では、端末装置１１の発話音声データ取得部１１Ｃが、入力支援システム１の利用者の発話音声「事例の資料が必要です。メールで日程をアレンジします。」を示す発話音声データを取得する。
処理サーバ１２の音声認識部１２Ａは、発話音声データ取得部１１Ｃによって取得された発話音声データを音声認識してテキストデータを生成する。
詳細には、図２（Ｂ）に示す例では、入力支援システム１の利用者の発話音声に無音区間が含まれる。そこで、音声認識部１２Ａは、発話音声データ取得部１１Ｃによって取得された発話音声データのうちの無音区間よりも前の部分に対応するテキストデータである無音区間前テキストデータ「事例の資料が必要です。」と、発話音声データ取得部１１Ｃによって取得された発話音声データのうちの無音区間よりも後の部分に対応するテキストデータである無音区間後テキストデータ「メールで日程をアレンジします。」とを生成する。
端末装置１１の認識結果表示部１１Ｄは、音声認識部１２Ａによって生成された無音区間前テキストデータ「事例の資料が必要です。」と無音区間後テキストデータ「メールで日程をアレンジします。」とを端末装置１１の表示画面の右側部分に表示する。詳細には、認識結果表示部１１Ｄは、タイムスタンプ「２０２０／０６／１１（木）１０：２４：１０」を含めて無音区間前テキストデータ「事例の資料が必要です。」および無音区間後テキストデータ「メールで日程をアレンジします。」を端末装置１１の表示画面の右側部分に表示する。
図２（Ｂ）に示す例では、テキストデータが、無音区間によって２つのテキストデータ（無音区間前テキストデータ「事例の資料が必要です。」、無音区間後テキストデータ「メールで日程をアレンジします。」）に区切られ、２つのテキストデータが端末装置１１の表示画面の右側部分に表示されるが、他の例では、テキストデータが、ｎ個の無音区間によって（ｎ＋１）個のテキストデータ（ｎ＝２の例では、３個のテキストデータ「事例の資料が必要です。」、「詳しい資料を持っている△△さんに相談が必要です。」、「メールで日程をアレンジします。」）に区切られ、（ｎ＋１）個のテキストデータが端末装置１１の表示画面の右側部分に表示されてもよい。

また、図２（Ｂ）に示す段階では、「（１）追記内容を選択（複数選択可）」で示すように、端末装置１１の認識結果選択操作受け付け部１１Ｅが、認識結果表示部１１Ｄによって端末装置１１の表示画面の右側部分に表示されている無音区間前テキストデータ「事例の資料が必要です。」および無音区間後テキストデータ「メールで日程をアレンジします。」から、入力項目選択操作受け付け部１１Ｇが受け付ける操作によって選択される入力項目「説明」と対応付けられるテキストデータ「事例の資料が必要です。」およびテキストデータ「メールで日程をアレンジします。」を選択する操作を受け付ける。
つまり、図２（Ｂ）に示す例では、追記内容として、２つの追記内容（テキストデータ「事例の資料が必要です。」およびテキストデータ「メールで日程をアレンジします。」）を選択する操作が、認識結果選択操作受け付け部１１Ｅによって受け付けられる。
また、図２（Ｂ）に示す段階では、端末装置１１の入力項目表示部１１Ｂが、入力支援システム１を利用して入力（保存）されるテキストデータ「事例の資料が必要です。」およびテキストデータ「メールで日程をアレンジします。」と対応付けられる入力項目「説明」を含む複数の入力項目「件名」、「期日のみ」、「状況」、「説明」を端末装置１１の表示画面の左側部分に表示している。
図２（Ｂ）に「（２）追記項目を選択」で示すように、端末装置１１の入力項目選択操作受け付け部１１Ｇは、入力項目表示部１１Ｂによって端末装置１１の表示画面の左側部分に表示されている複数の入力項目「件名」、「期日のみ」、「状況」、「説明」から、認識結果表示部１１Ｄによって端末装置１１の表示画面の右側部分に表示されたテキストデータ「事例の資料が必要です。」およびテキストデータ「メールで日程をアレンジします。」と対応付けられる入力項目「説明」を選択する入力支援システム１の利用者の操作を受け付ける。
すなわち、入力項目選択操作受け付け部１１Ｇは、入力項目表示部１１Ｂによって複数の入力項目「件名」、「期日のみ」、「状況」、「説明」が端末装置１１の表示画面の左側部分に表示されており、かつ、認識結果表示部１１Ｄによってテキストデータ「事例の資料が必要です。」およびテキストデータ「メールで日程をアレンジします。」が端末装置１１の表示画面の右側部分に表示されている状態で、テキストデータ「事例の資料が必要です。」およびテキストデータ「メールで日程をアレンジします。」と対応付けられる入力項目「説明」を選択する入力支援システム１の利用者の操作を受け付ける。

詳細には、図２（Ｂ）に示す段階では、入力可能項目活性化部１１Ｆが、入力項目表示部１１Ｂによって端末装置１１の表示画面の左側部分に表示された複数の入力項目「件名」、「期日のみ」、「状況」、「説明」のうち、認識結果表示部１１Ｄによって端末装置１１の表示画面の右側部分に表示されたテキストデータ「事例の資料が必要です。」およびテキストデータ「メールで日程をアレンジします。」と対応付け可能な入力項目である候補入力項目「件名」、「説明」の表示を活性化する。
図２（Ｂ）に示す例では、入力項目選択操作受け付け部１１Ｇが、候補入力項目「件名」、「説明」から、入力項目「説明」を選択する入力支援システム１の利用者の操作を受け付ける。
その結果、図２（Ｃ）に示すように、端末装置１１の自動入力部１１Ｈは、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータ「事例の資料が必要です。」およびテキストデータ「メールで日程をアレンジします。」と入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目「説明」との対応付けを実行する。また、図２（Ｃ）に「（３）追記完了」で示すように、自動入力部１１Ｈは、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータ「事例の資料が必要です。」およびテキストデータ「メールで日程をアレンジします。」を、入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目「説明」の表示欄に含める（詳細には、追記する）処理を実行する。
図２に示す例では、入力項目「説明」の表示欄が、任意のテキストデータを含めることができる自由記述型である。一方、入力項目「状況」の表示欄は、利用者がマーク「∨」をタップすることによって表示される複数の選択肢のうちの１つ「ＩｎＰｒｏｇｒｅｓｓ」が選択される選択肢型である。
このように、テキストデータが選択されると、対応付け可能な入力項目として、入力項目に対応つけられた型（テキスト型、数値型など）に基づいて、選択したテキストデータを入力可能な項目が選定され、候補入力項目として活性化する。尚、上述では入力項目に対応付けられた型に基づく活性化を示しているが、これに限らず、選択したテキストデータに含まれる文字列の読みを、入力項目名や、項目に入力されるべく予め対応付けられた文字列と一致または類似する場合に、候補入力項目として活性化するようにしても良い。

端末装置１１を利用して商談報告を行う利用者は、業務の合間に必要な情報を音声で入力しておき、後に入力しておいた情報を利用して報告データを作成する場合が多い。
そこで、図２に示す例では、上述したように音声認識結果を一時保存する機能が追加されている。そのため、入力支援システム１の利用者は、保存された音声メモを選択することによって（つまり、端末装置１１の表示画面の右側部分に表示されているテキストデータを選択することによって）、そのテキストデータを、端末装置１１の表示画面の左側部分に表示されている入力項目に追記することができる。

図３は第１実施形態の入力支援システム１の端末装置１１の表示画面の他の例を示す図である。
図３に示す例では、第１実施形態の入力支援システム１の端末装置１１が新規商談の入力に用いられている。
図３（Ａ）に示す段階では、端末装置１１の発話音声データ取得部１１Ｃが、入力支援システム１の利用者の発話音声「えーと、○○○○○○○の紹介です。」を示す発話音声データを取得する。
処理サーバ１２の音声認識部１２Ａは、発話音声データ取得部１１Ｃによって取得された発話音声データを音声認識してテキストデータを生成する。
詳細には、図３（Ａ）に示す例では、発話音声データ取得部１１Ｃによって取得された発話音声データが示す利用者の発話音声「えーと、○○○○○○○の紹介です。」にフィラーが含まれている。そのため、処理サーバ１２のフィラー除去部１２Ｂ（図１参照）は、発話音声データ取得部１１Ｃによって取得された発話音声データが示す利用者の発話音声「えーと、○○○○○○○の紹介です。」に含まれるフィラーを検出する。また、フィラー除去部１２Ｂは、フィラーに対応するテキストデータ「えーと」を、音声認識部１２Ａによって生成されるテキストデータ「えーと、○○○○○○○の紹介です。」から除去する。
端末装置１１の認識結果表示部１１Ｄは、音声認識部１２Ａによって生成されたテキストデータ「えーと、○○○○○○○の紹介です。」を端末装置１１の表示画面の右側部分に表示する。
すなわち、認識結果表示部１１Ｄは、発話音声データ取得部１１Ｃによって取得された発話音声データが示す利用者の発話音声「えーと、○○○○○○○の紹介です。」に含まれるフィラーに対応するテキストデータ「えーと」がフィラー除去部１２Ｂによって除去される前のテキストデータであるフィラー除去前テキストデータ「えーと、○○○○○○○の紹介です。」を端末装置１１の表示画面の右側部分に表示する。

次いで、図３（Ｂ）に示す段階では、端末装置１１の認識結果選択操作受け付け部１１Ｅが、認識結果表示部１１Ｄによって端末装置１１の表示画面の右側部分に表示されているテキストデータ「えーと、○○○○○○○の紹介です。」を、入力項目選択操作受け付け部１１Ｇが受け付ける操作によって選択される入力項目「商談名」と対応付けられるテキストデータとして選択する操作を受け付ける。
端末装置１１の入力項目表示部１１Ｂは、入力支援システム１を利用して入力（保存）されるテキストデータ「○○○○○○○の紹介です。」と対応付けられる入力項目「商談名」を含む複数の入力項目「取引先」、「商談名」、「商談種別」、「リードソース」、「フェーズ」、「金額」、「完了予定日」、「次のステップ」、「説明」を端末装置１１の表示画面の左側部分に表示している。
端末装置１１の入力項目選択操作受け付け部１１Ｇは、入力項目表示部１１Ｂによって端末装置１１の表示画面の左側部分に表示されている複数の入力項目「取引先」、「商談名」、「商談種別」、「リードソース」、「フェーズ」、「金額」、「完了予定日」、「次のステップ」、「説明」から、認識結果表示部１１Ｄによって端末装置１１の表示画面の右側部分に表示されたテキストデータ「えーと、○○○○○○○の紹介です。」と対応付けられる入力項目「商談名」を選択する入力支援システム１の利用者の操作を受け付ける。
その結果、端末装置１１の自動入力部１１Ｈは、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータ「えーと、○○○○○○○の紹介です。」と入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目「商談名」との対応付けを実行する。
また、自動入力部１１Ｈは、認識結果選択操作受け付け部１１Ｅが受け付けた操作によって選択されたテキストデータ「えーと、○○○○○○○の紹介です。」を、入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目「件名」の表示欄に含める処理を実行する。
詳細には、発話音声データ取得部１１Ｃによって取得された発話音声データが示す利用者の発話音声「えーと、○○○○○○○の紹介です。」にフィラーが含まれるため、自動入力部１１Ｈは、フィラー除去部１２Ｂによってフィラーに対応するテキストデータ「えーと」が除去された後のテキストデータであるフィラー除去後テキストデータ「○○○○○○○の紹介です。」を、入力項目選択操作受け付け部１１Ｇが受け付けた操作によって選択された入力項目「商談名」の表示欄に含める処理を実行する。

すなわち、図３に示す例では、音声認識結果に含まれるフィラーを除去し、入力項目に反映する機能が追加されている。そのため、入力支援システム１の利用者は、自分の発話音声にフィラーが含まれてもよいという安心感を持ちながら入力支援システム１を利用することができる。

図４は図３に示す例において第１実施形態の入力支援システム１によって実行される処理の一例を説明するためのシーケンス図である。
図４に示す例では、ステップＳ１において、端末装置１１の入力項目情報取得部１１Ａが、入力支援システム１を利用して入力（保存）される情報（テキストデータ）に対応付けられる項目（入力項目）に関する情報である入力項目情報を、例えば入力支援システム１の外部のＣＲＭ（Customer Relationship Management）システムから取得する。
例えば、複数種類の報告書のテンプレートがＣＲＭシステムにあらかじめ用意され、顧客（入力支援システム１の利用者）の業種に応じて選択された報告書のテンプレート（入力項目情報）が、入力項目情報取得部１１Ａによって取得される。他の例では、入力項目情報取得部１１Ａが、音声認識されたテキストデータに基づいて、対応しうる入力項目情報（テンプレート）を自動で呼び出してもよい。この例では、入力項目情報取得部１１Ａによる入力項目情報の取得が、音声認識よりも後に実行される。また、この例では、音声認識される内容（つまり、利用者の発言内容）が多いほど、入力項目情報取得部１１Ａによって取得される入力項目情報（テンプレート）に含まれる項目の数が多くなる。
次いで、ステップＳ２では、端末装置１１の入力項目表示部１１Ｂが、入力支援システム１を利用して入力（保存）されるテキストデータと対応付けられる入力項目を含む複数の入力項目を端末装置１１の表示画面の左側部分に表示する。
次いで、ステップＳ３では、端末装置１１の発話音声データ取得部１１Ｃが、入力支援システム１の利用者の発話音声を示す発話音声データを取得し、処理サーバ１２にアップロードする。
次いで、ステップＳ４では、処理サーバ１２の音声認識部１２Ａが、ステップＳ３において取得された発話音声データを音声認識してテキストデータを生成する。
次いで、ステップＳ５では、処理サーバ１２のフィラー除去部１２Ｂが、ステップＳ３において取得された発話音声データが示す利用者の発話音声に含まれるフィラーを検出し、フィラーに対応するテキストデータを、ステップＳ４において生成されたテキストデータから除去する。

次いで、ステップＳ６では、端末装置１１の認識結果表示部１１Ｄが、ステップＳ４において生成されたテキストデータを音声認識部１２Ａによる認識結果として端末装置１１の表示画面の右側部分に表示する。
次いで、ステップＳ７では、端末装置１１の認識結果選択操作受け付け部１１Ｅが、ステップＳ６において表示されたテキストデータから、端末装置１１の入力項目選択操作受け付け部１１Ｇが受け付ける操作によって選択される入力項目と対応付けられるテキストデータを選択する操作を受け付ける。
次いで、ステップＳ８では、端末装置１１の入力可能項目活性化部１１Ｆが、ステップＳ２において表示された複数の入力項目のうち、ステップＳ７において受け付けられた操作によって選択されたテキストデータと対応付け可能な入力項目である候補入力項目の表示を活性化する。
次いで、ステップＳ９では、端末装置１１の入力項目選択操作受け付け部１１Ｇが、ステップＳ２において表示された複数の入力項目から、ステップＳ７において受け付けられた操作によって選択されたテキストデータと対応付けられる入力項目を選択する操作を受け付ける。
すなわち、ステップＳ９において、入力項目選択操作受け付け部１１Ｇは、複数の入力項目が表示されており、かつ、ステップＳ４において生成されたテキストデータが表示されている状態で、ステップＳ４において生成されたテキストデータと対応付けられる入力項目を選択する操作を受け付ける。

次いで、ステップＳ１０では、端末装置１１の自動入力部１１Ｈが、ステップＳ７において受け付けられた操作によって選択されたテキストデータとステップＳ９において受け付けられた操作によって選択された入力項目との対応付けを実行する。
また、ステップＳ１０では、自動入力部１１Ｈが、ステップＳ７において受け付けられた操作によって選択されたテキストデータを、ステップＳ９において受け付けられた操作によって選択された入力項目の表示欄（つまり、端末装置１１の表示画面上の選択された入力項目の表示欄）に含める処理を実行する。
次いで、ステップＳ１１では、端末装置１１が、端末装置１１に入力された内容（端末装置１１の表示画面に表示されている内容）を保存する（ＣＲＭシステムに登録する）処理を実行する。
図３および図４に示す例では、発話音声データ取得部１１Ｃが発話音声データを取得し、音声認識部１２Ａがテキストデータを生成した後に、フィラー除去部１２Ｂが、発話音声に含まれるフィラーに対応するテキストデータを除去する。他の例では、入力項目へ入力する際に処理サーバ１２と通信を行い、フィラー除去部１２Ｂがフィラーを除去してもよい。例えば、入力項目への入力を行う際に、該当のテキストデータのフィラーの判定となった個所はどこなのか表示し、そのフィラー除去をするかしないか、利用者に選択させてもよい。

多くの企業で顧客との関係維持を目的に、自社営業担当者の訪問記録等のやりとりを専用のＣＲＭシステムに登録することを推進している。
しかし、日常業務である顧客とのやりとりを全て登録することは、入力を行う営業担当者にとって負担に感じられることも多く、十分なデータが集まりづらい。
昨今、こうしたシステムへの入力の簡易化に音声認識技術の活用が進んでいるが、ＣＲＭシステムは顧客管理を円滑に行うことを目的に入力項目の種類を選択型や数値型等に分けていることが多く、発話を音声認識技術でテキスト化したものの、この項目型に合わせて必要情報のみを入力するのに手間がかかる課題がある。またモバイルによる音声入力にあった使い方として、外出中の隙間時間に発話したいというニーズがある。

第１実施形態の入力支援システム１では、上記の課題とニーズを解決することができ、自社営業担当者の音声からＣＲＭシステムへの入力を簡易に行うことが可能となる。
上述したように、第１実施形態の入力支援システム１は、ＣＲＭシステムの入力項目の情報と、自社営業担当者の声を音声認識した結果を取り込み、ＣＲＭシステムへのデータ登録を想定した項目選択や言い淀み等のフィラー除去を行う。音声認識結果は端末装置１１の表示画面に表示され、利用者の操作により、項目入力を可能とする。
第１実施形態の入力支援システム１を用いることによって、営業担当者は、外出中の隙間時間にＣＲＭシステムへの入力を音声で簡易に行うことができる。

［適用例］
第１実施形態の入力支援システム１が適用される一例では、端末装置１１として機能するスマートフォンから、音声認識部１２Ａとして機能するエージェントＡＩ（人工知能）に音声で営業報告が行われる。
第１実施形態の入力支援システム１を用いることによって、営業や保守業務等の報告にかかる負荷を軽減し、働き方改革を促進することができる。
スマートフォンから音声入力で報告内容をＣＲＭシステムに登録することができる。
第１実施形態の入力支援システム１を用いることによって、複数ある入力内容を音声で一括登録できるクラウドサービスを提供することができ、移動時間を活用した営業報告や業務報告が可能になり、タイムリーな報告で報告数の向上を実現することができる。
第１実施形態の入力支援システム１はフィラー除去機能を有するため、自然な言葉遣い（話し方）での音声入力が可能になり、入力を簡単に行うことができる。
第１実施形態の入力支援システム１の利用者の移動中の時間を活用することができ、タイムリーに報告を行うことができる。

＜第２実施形態＞
以下、本発明の入力支援システム、入力支援方法およびプログラムの第２実施形態について説明する。
第２実施形態の入力支援システム１は、後述する点を除き、上述した第１実施形態の入力支援システム１と同様に構成されている。従って、第２実施形態の入力支援システム１によれば、後述する点を除き、上述した第１実施形態の入力支援システム１と同様の効果を奏することができる。

第１実施形態の入力支援システム１では、入力項目情報取得部１１Ａが、入力項目情報をＣＲＭシステム（図４参照）から取得するが、第２実施形態の入力支援システム１では、入力項目情報取得部１１Ａが、入力項目情報をＣＲＭシステム以外のものから取得する。
つまり、第２実施形態の入力支援システム１は、顧客との関係維持以外のこと（介護記録の入力、救急搬送時の情報伝達など）を目的として用いられる。

＜変形例＞
区切られたテキストデータ（図２、図３における吹き出し）のうち、１つあるいは複数のものを指定すると、端末装置１１の入力可能項目活性化部１１Ｆは、インプット可能な入力項目をアクティブに（活性化）するが、指定されたテキストデータと入力項目の対応付けは、例えば入力型だけではなく、キーワードや指定されたテキストデータの内容等としてもよい。例えば、指定されたテキストデータの中に、「特定の会社名」「地名」等、場所に関するキーワードが含まれている場合は入力項目「訪問場所」が活性化される。また、AI等、文脈を理解する機能を持った構成を設けることにより、指定されたテキストデータの文脈に合った入力項目を活性化したり、入力項目に既に入力されている内容と指定されたテキストデータの内容を比較することで、該当する入力項目を活性化したりしても良い。

入力支援システム１において、テキストデータをインプットするための入力項目が複数組み合わされた、報告書のテンプレート（入力項目情報）が、予め用意されており、テキストデータの内容に基づいて、該当するテンプレートを呼び出してもよい。
複数の報告書を作成したい場合に、報告書を１つずつ作成可能であってもつまり、１つの報告書に対して入力を完了し保存すると、次の報告書がインプット可能となってもよい。
あるいは、複数の報告書を同時進行で作成可能であってもよい。つまり、保存をしなくても区切られたテキストデータ（吹き出し）を指定すると、テキストデータの内容に基づいて該当の報告書が読み出され、インプット可能となってもよい。
該当の報告書を読み出す仕組みとして、例えば指定したテキストデータ（吹き出し）のキーワードや文脈等から、報告書に必要な入力項目が追加されていく、あるいは、適切な報告書のテンプレートが呼び出される、指定したテキストデータのキーワードや文脈等から、複数作成途中の報告書が存在する場合に、該当する報告書が特定される等が可能である。

以上説明した少なくともひとつの実施形態によれば、入力支援システム１は、端末装置１１を備える入力支援システム１であって、発話音声データ取得部１１Ｃと音声認識部１２Ａと入力項目表示部１１Ｂと認識結果表示部１１Ｄと入力項目選択操作受け付け部１１Ｇとを備える。発話音声データ取得部１１Ｃは利用者の発話音声を示す発話音声データを取得する。音声認識部１２Ａは発話音声データ取得部１１Ｃによって取得された発話音声データを音声認識してテキストデータを生成する。入力項目表示部１１Ｂは音声認識部１２Ａによって生成されたテキストデータと対応付けられる入力項目を含む複数の入力項目を表示する。認識結果表示部１１Ｄは音声認識部１２Ａによって生成されたテキストデータを音声認識部１２Ａによる認識結果として表示する。入力項目選択操作受け付け部１１Ｇは入力項目表示部１１Ｂによって表示された複数の入力項目から、認識結果表示部１１Ｄによって表示されたテキストデータと対応付けられる入力項目を選択する操作を受け付ける。入力項目表示部１１Ｂは、複数の入力項目を端末装置１１の表示画面の一部に表示し、認識結果表示部１１Ｄは、テキストデータを端末装置１１の表示画面の他の一部に表示する。入力項目選択操作受け付け部１１Ｇは、入力項目表示部１１Ｂが複数の入力項目を表示しており、かつ、認識結果表示部１１Ｄがテキストデータを表示している状態で、テキストデータと対応付けられる入力項目を選択する操作を受け付ける。それにより、入力操作の簡易性を向上させることができる。

なお、上述した実施形態（変形例を含む）における入力支援システム１の少なくとも一部の機能をコンピュータで実現するようにしても良い。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ＵＳＢメモリ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

１…入力支援システム、１１…端末装置、１１Ａ…入力項目情報取得部、１１Ｂ…入力項目表示部、１１Ｃ…発話音声データ取得部、１１Ｄ…認識結果表示部、１１Ｅ…認識結果選択操作受け付け部、１１Ｆ…入力可能項目活性化部、１１Ｇ…入力項目選択操作受け付け部、１１Ｈ…自動入力部、１２…処理サーバ、１２Ａ…音声認識部、１２Ｂ…フィラー除去部

Claims

端末装置を備える入力支援システムであって、
利用者の発話音声を示す発話音声データを取得する発話音声データ取得部と、
前記発話音声データ取得部によって取得された発話音声データを音声認識してテキストデータを生成する音声認識部と、
前記音声認識部によって生成されたテキストデータと対応付けられる入力項目を含む複数の入力項目を表示する入力項目表示部と、
前記音声認識部によって生成されたテキストデータを前記音声認識部による認識結果として表示する認識結果表示部と、
前記入力項目表示部によって表示された複数の入力項目から、前記認識結果表示部によって表示されたテキストデータと対応付けられる入力項目を選択する操作を受け付ける入力項目選択操作受け付け部とを備え、
前記入力項目表示部は、複数の入力項目を前記端末装置の表示画面の一部に表示し、
前記認識結果表示部は、前記音声認識部によって生成されたテキストデータを前記端末装置の表示画面の他の一部に表示し、
前記入力項目選択操作受け付け部は、前記入力項目表示部が複数の入力項目を表示しており、かつ、前記認識結果表示部が前記音声認識部によって生成されたテキストデータを表示している状態で、前記音声認識部によって生成されたテキストデータと対応付けられる入力項目を選択する操作を受け付ける、
入力支援システム。
前記発話音声データ取得部によって取得された発話音声データが示す利用者の発話音声に、無音区間が含まれる場合に、
前記音声認識部は、前記発話音声データ取得部によって取得された発話音声データのうちの無音区間よりも前の部分に対応するテキストデータである無音区間前テキストデータと、前記発話音声データ取得部によって取得された発話音声データのうちの無音区間よりも後の部分に対応するテキストデータである無音区間後テキストデータとを生成し、
前記認識結果表示部は、前記音声認識部によって生成された無音区間前テキストデータと無音区間後テキストデータとを表示し、
前記認識結果表示部によって表示されている無音区間前テキストデータおよび無音区間後テキストデータから、前記入力項目選択操作受け付け部が受け付ける操作によって選択される入力項目と対応付けられるテキストデータを選択する操作を受け付ける認識結果選択操作受け付け部を備える、
請求項１に記載の入力支援システム。
前記入力項目表示部によって表示された複数の入力項目のうち、前記認識結果選択操作受け付け部が受け付けた操作によって選択されたテキストデータと対応付け可能な入力項目である候補入力項目の表示を活性化する入力可能項目活性化部を備える、
請求項２に記載の入力支援システム。
前記認識結果選択操作受け付け部が受け付けた操作によって選択されたテキストデータと前記入力項目選択操作受け付け部が受け付けた操作によって選択された入力項目との対応付けを実行し、前記認識結果選択操作受け付け部が受け付けた操作によって選択されたテキストデータを、前記入力項目選択操作受け付け部が受け付けた操作によって選択された入力項目の表示欄に含める処理を実行する自動入力部を備える、
請求項２に記載の入力支援システム。
前記発話音声データ取得部によって取得された発話音声データが示す利用者の発話音声に含まれるフィラーに対応するテキストデータを、前記音声認識部によって生成されるテキストデータから除去するフィラー除去部を備え、
前記認識結果表示部は、前記フィラー除去部によってフィラーに対応するテキストデータが除去される前のテキストデータであるフィラー除去前テキストデータを表示し、
前記自動入力部は、前記フィラー除去部によってフィラーに対応するテキストデータが除去された後のテキストデータであるフィラー除去後テキストデータを、前記入力項目選択操作受け付け部が受け付けた操作によって選択された入力項目の表示欄に含める処理を実行する、
請求項４に記載の入力支援システム。
少なくとも端末装置を用いる入力支援方法であって、
利用者の発話音声を示す発話音声データを取得する発話音声データ取得ステップと、
前記発話音声データ取得ステップにおいて取得された発話音声データを音声認識してテキストデータを生成する音声認識ステップと、
前記音声認識ステップにおいて生成されたテキストデータと対応付けられる入力項目を含む複数の入力項目を表示する入力項目表示ステップと、
前記音声認識ステップにおいて生成されたテキストデータを前記音声認識ステップにおける認識結果として表示する認識結果表示ステップと、
前記入力項目表示ステップにおいて表示された複数の入力項目から、前記認識結果表示ステップにおいて表示されたテキストデータと対応付けられる入力項目を選択する操作を受け付ける入力項目選択操作受け付けステップとを備え、
前記入力項目表示ステップでは、複数の入力項目が前記端末装置の表示画面の一部に表示され、
前記認識結果表示ステップでは、前記音声認識ステップにおいて生成されたテキストデータが前記端末装置の表示画面の他の一部に表示され、
前記入力項目選択操作受け付けステップでは、複数の入力項目が表示されており、かつ、前記音声認識ステップにおいて生成されたテキストデータが表示されている状態で、前記音声認識ステップにおいて生成されたテキストデータと対応付けられる入力項目を選択する操作が受け付けられる、
入力支援方法。
少なくとも端末装置に搭載されたコンピュータに、
利用者の発話音声を示す発話音声データを取得する発話音声データ取得ステップと、
前記発話音声データ取得ステップにおいて取得された発話音声データを音声認識してテキストデータを生成する音声認識ステップと、
前記音声認識ステップにおいて生成されたテキストデータと対応付けられる入力項目を含む複数の入力項目を表示する入力項目表示ステップと、
前記音声認識ステップにおいて生成されたテキストデータを前記音声認識ステップにおける認識結果として表示する認識結果表示ステップと、
前記入力項目表示ステップにおいて表示された複数の入力項目から、前記認識結果表示ステップにおいて表示されたテキストデータと対応付けられる入力項目を選択する操作を受け付ける入力項目選択操作受け付けステップとを実行させるためのプログラムであって、
前記入力項目表示ステップでは、複数の入力項目が前記端末装置の表示画面の一部に表示され、
前記認識結果表示ステップでは、前記音声認識ステップにおいて生成されたテキストデータが前記端末装置の表示画面の他の一部に表示され、
前記入力項目選択操作受け付けステップでは、複数の入力項目が表示されており、かつ、前記音声認識ステップにおいて生成されたテキストデータが表示されている状態で、前記音声認識ステップにおいて生成されたテキストデータと対応付けられる入力項目を選択する操作が受け付けられる、
プログラム。