JP7344649B2 - 情報端末装置およびプログラム - Google Patents

情報端末装置およびプログラム Download PDF

Info

Publication number
JP7344649B2
JP7344649B2 JP2019031667A JP2019031667A JP7344649B2 JP 7344649 B2 JP7344649 B2 JP 7344649B2 JP 2019031667 A JP2019031667 A JP 2019031667A JP 2019031667 A JP2019031667 A JP 2019031667A JP 7344649 B2 JP7344649 B2 JP 7344649B2
Authority
JP
Japan
Prior art keywords
audio
voice
input unit
audio input
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019031667A
Other languages
English (en)
Other versions
JP2020135725A (ja
Inventor
慎二 宅野
剛毅 本村
一平 久冨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Benesse Corp
Original Assignee
Benesse Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Benesse Corp filed Critical Benesse Corp
Priority to JP2019031667A priority Critical patent/JP7344649B2/ja
Publication of JP2020135725A publication Critical patent/JP2020135725A/ja
Application granted granted Critical
Publication of JP7344649B2 publication Critical patent/JP7344649B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Description

本発明は、音声入力部を備えた情報端末装置およびプログラムに関する。
音声を録音する録音再生装置において、生成した音声データをバックアップする方法が知られている。特許文献1には、入力されたオーディオ信号を記録媒体に記録して録音するとともに、これと並行して、記録媒体に記録されたオーディオ信号をストリーミング再生し、Wi-Fi接続を介してスマートフォンに送信する録音再生装置が記載されている。スマートフォンでの録音は、録音再生装置における録音のバックアップ録音として位置付けられる。
特開2016-114838号公報
上記のような録音再生装置では、音声を録音するためのマイクに不具合が生じた場合、録音再生装置における録音とバックアップ録音の両方において、音声が録音されないとの問題が生じる。たとえば、このような装置が外国語の模擬試験などで用いられ、受験者の発声したスピーキングの音声が解答として録音されるような場合、音声が録音されていない事態は致命的な問題となる。
かかる課題に鑑み、本発明は、音声が録音されていない事態を回避できる情報端末装置およびプログラムを提供することを目的とする。
本発明の第1の態様は、情報端末装置に関する。第1の態様に係る情報端末装置は、複数の音声入力部と、記憶部と、前記複数の音声入力部を介して音声の入力を並行して受け付け、受け付けた前記音声に基づいて前記複数の音声入力部ごとに音声データを生成し、生成した前記音声データを前記記憶部に記憶させる制御部と、を備える。前記複数の音声入力部は、第1音声入力部および第2音声入力部により構成される。前記制御部は、前記記憶部に記憶させる前記音声データに、前記第1音声入力部および前記第2音声入力部のいずれに基づいて生成された前記音声データであるかを識別可能な識別子を付与する。前記識別子は、前記複数の音声入力部のいずれにより取得された前記音声データであるかを示す音声である。
第1の態様に係る情報端末装置によれば、受け付けられた音声に基づいて複数の音声入力部ごとに音声データが生成され、生成された音声データが記憶部に記憶される。これにより、一の音声入力部に不具合が生じたとしても、他の音声入力部により受け付けられた音声に基づいて音声データが生成されているため、音声が録音されていない事態を回避できる。たとえば、情報端末装置が外国語の模擬試験において用いられ、音声入力部がスピーキングの音声の入力を受け付ける場合、受験者が発した音声に基づく音声データが複数の音声入力部ごとに記憶される。これにより、一の音声入力部に不具合が生じた場合でも、音声データを一切取得できないといった最悪の事態を回避できる。音声データが少なくとも1つ取得されれば、取得できた音声データを用いて採点処理を行うことができる。
また、前記制御部は、前記記憶部に記憶させる前記音声データに、前記第1音声入力部および前記第2音声入力部のいずれに基づいて生成された前記音声データであるかを識別可能な識別子を付与するため、いずれの音声入力部に基づく音声データかを円滑に把握して、音声データを用いた採点等のその後の処理を行うことができる。
さらに、前記識別子は、前記複数の音声入力部のいずれにより取得された前記音声データであるかを示す音声であるため、音声データを再生することにより、いずれの音声入力部に基づく音声データかを円滑に把握して、音声データを用いた採点等のその後の処理を行うことができる。
本発明の第2の態様は、情報端末装置に関する。第2の態様に係る情報端末装置は、第1音声入力部と、第2音声入力部と、記憶部と、前記第1音声入力部および前記第2音声入力部を介して音声の入力を並行して受け付け、前記第1音声入力部を介した前記音声の受け付けに異常が生じていない場合、前記第1音声入力部を介して受け付けた前記音声に基づいて音声データを生成し、前記第1音声入力部を介した前記音声の受け付けに異常が生じている場合、前記第2音声入力部を介して受け付けた前記音声に基づいて音声データを生成し、生成した前記音声データを前記記憶部に記憶させる制御部と、を備える。前記制御部は、前記記憶部に記憶させる前記音声データに、前記第1音声入力部および前記第2音声入力部のいずれに基づいて生成された前記音声データであるかを識別可能な識別子を付与する。前記識別子は、前記複数の音声入力部のいずれにより取得された前記音声データであるかを示す音声である。
第2の態様に係る情報端末装置によれば、第1音声入力部を介した音声の受け付けに異常が生じた場合、第2音声入力を介して受け付けた音声に基づいて音声データが生成され記憶される。これにより、音声が録音されていない事態を回避できる。また、第2の態様に係る情報端末装置によれば、第1音声入力部と第2音声入力部のいずれか一方に基づいて音声データが生成される。これにより、第1音声入力部に基づく音声データと、第2音声入力部に基づく音声データのいずれを使うべきかを判断する必要がなく、生成された音声データを用いて、その後の処理を円滑に進めることができる。また、第1音声入力部に基づく音声データと第2音声入力部に基づく音声データのいずれか一方が記憶されるため、記憶部に記憶されるデータ容量を小さくできる。これにより、制御部や記憶部への処理負荷を小さくできるため、情報端末装置のハードウェア構成にかかる制約と、情報端末装置にかかるコストとを抑制できる。
また、前記制御部は、前記記憶部に記憶させる前記音声データに、前記第1音声入力部および前記第2音声入力部のいずれに基づいて生成された前記音声データであるかを識別可能な識別子を付与するため、いずれの音声入力部に基づく音声データかを円滑に把握して、音声データを用いた採点等のその後の処理を行うことができる。
さらに、前記識別子は、前記複数の音声入力部のいずれにより取得された前記音声データであるかを示す音声であるため、音声データを再生することにより、いずれの音声入力部に基づく音声データかを円滑に把握して、音声データを用いた採点等のその後の処理を行うことができる。
第1および第2の態様に係る情報端末装置において、前記第1音声入力部は、前記情報端末装置の本体に接続された外部マイクであり、前記第2音声入力部は、前記情報端末装置の本体の内蔵マイクであるよう構成され得る。
外部マイクが用いられる場合、外部マイクを音声の発生源、たとえば口元に近付けることにより、内蔵マイクに比べて高音質な音声データを生成できる。その一方で、外部マイクが情報端末装置の本体から意図せず外れるといった事態や、外部マイクのケーブルが意図せず断線するといった事態が起こり得る。これに対し、第1の態様に係る情報端末装置によれば、外部マイクと内蔵マイクのそれぞれにより生成された音声データが記憶部に記憶され、第2の態様に係る情報端末装置によれば、外部マイクに異常が生じている場合、内蔵マイクにより生成された音声データが記憶部に記憶される。これにより、外部マイクに上記のようなトラブルが生じたとしても、内蔵マイクにより取得された音声データを用いてその後の処理を行うことができる。
本発明の第3の態様に係る情報端末装置は、複数の音声入力部と、記憶部と、前記複数の音声入力部を介して音声の入力を並行して受け付け、受け付けた前記音声に基づいて前記複数の音声入力部ごとに音声データを生成し、生成した前記音声データを前記記憶部に記憶させる制御部と、表示部を備える。前記複数の音声入力部は、第1音声入力部および第2音声入力部により構成される。前記制御部は、前記第1音声入力部を介した前記音声の受け付けに異常が生じていない場合、前記第1音声入力部を介して受け付けた前記音声の音量を示す第1インジケータを前記表示部に表示させ、前記第1音声入力部を介した前記音声の受け付けに異常が生じている場合、前記第2音声入力部を介して受け付けた前記音声の音量を示す第2インジケータを前記第1インジケータに代えて前記表示部に表示させる。
たとえば、第1インジケータのみが表示される場合、ヘッドセットマイクを介した音声の受け付けに異常が生じると、第1インジケータの目盛が極端に小さい値、極端に大きな値、または変則的な値を示すようになる。このように第1インジケータの目盛が不自然になると、ユーザーは正しく音声が録音されているか不安を感じてしまう。これに対し、第3の態様に係る情報端末装置によれば、ヘッドセットマイクを介した音声の受け付けに異常が生じると、第1インジケータに代えて第2インジケータが表示されるため、ユーザーの心理的な不安を抑制できる。
この場合に、前記第1インジケータと前記第2インジケータの表示形態は、互いに異なるよう構成され得る。たとえば、目盛の色、アイコン、文字列などの表示形態が互いに異なるよう第1インジケータと第2インジケータが構成される。これにより、受験者は、ヘッドセットマイクを介した音声の受け付けに異常が生じていることを把握できる。
第1ないしの態様に係る情報端末装置において、前記制御部は、前記第1音声入力部および前記第2音声入力部を介して受け付けた前記音声をリアルタイムで解析して、前記第1音声入力部を介した前記音声の受け付けに異常が生じているか否かを判定し、前記第1音声入力部を介した前記音声の受け付けに異常が生じていると判定した場合に、前記第1音声入力部を介した前記音声の受け付けに異常が生じていることを報知するよう構成され得る。こうすると、情報端末装置のユーザーは、第1音声入力部を介した音声の受け付けの異常により、第1音声入力部に基づく録音が行われないことを把握できる。たとえば、情報端末装置が模擬試験において用いられる場合、情報端末装置を使用する受験者は、異常があることを迅速に把握できるため、試験会場において情報端末装置の交換等の措置を迅速に進めることができる。
の態様に係る情報端末装置は、複数の音声入力部と、記憶部と、前記複数の音声入力部を介して音声の入力を並行して受け付け、受け付けた前記音声に基づいて前記複数の音声入力部ごとに音声データを生成し、生成した前記音声データを前記記憶部に記憶させる制御部と、撮像部を備える。前記複数の音声入力部は、第1音声入力部および第2音声入力部により構成される。前記制御部は、前記撮像部により撮像された映像および第1音声入力部を介して受け付けた前記音声をリアルタイムで解析して、前記第1音声入力部を介した前記音声の受け付けに異常が生じているか否かを判定し、前記第1音声入力部を介した前記音声の受け付けに異常が生じていると判定した場合に、前記第1音声入力部を介した前記音声の受け付けに異常が生じていることを報知する。
本態様に係る情報端末装置によれば、情報端末装置のユーザーは、第1音声入力部を介した音声の受け付けの異常により、第1音声入力部に基づく録音が行われないことを把握できる。たとえば、情報端末装置が模擬試験において用いられる場合、情報端末装置を使用する受験者は、異常があることを迅速に把握できるため、試験会場において情報端末装置の交換等の措置を迅速に進めることができる。
本発明の第の態様は、情報端末装置に関する。第の態様に係る情報端末装置は、第1音声入力部と、第2音声入力部と、撮像部と、制御部と、を備える。前記制御部は、前記撮像部により撮像された映像および前記第1音声入力部を介して受け付けた音声をリアルタイムで解析して、前記第1音声入力部を介した前記音声の受け付けに異常が生じているか否かを判定し、前記第1音声入力部を介した前記音声の受け付けに異常が生じていると判定した場合に、前記第1音声入力部を介した前記音声の受け付けに異常が生じていることを報知する。
の態様に係る情報端末装置によれば、情報端末装置のユーザーは、第1音声入力部を介した音声の受け付けに異常が生じている場合、第1音声入力部に基づく録音が行われないことを把握できる。たとえば、情報端末装置が模擬試験において用いられる場合、情報端末装置を使用する受験者は、ヘッドセット等が備える第1音声入力部に異常があることを迅速に把握できるため、試験会場において情報端末装置の交換等の措置を迅速に進めることができる。
本発明の第6の態様は、プログラムに関する。第6の態様に係るプログラムは、第1音声入力部と第2音声入力部とを備える情報端末装置の制御部に、前記第1音声入力部および前記第2音声入力部を介して並行して受け付けた音声に基づいて前記第1音声入力部および前記第2音声入力部ごとに音声データを生成する機能と、生成した前記音声データを記憶部に記憶させる機能と、前記記憶部に記憶させる前記音声データに、前記第1音声入力部および前記第2音声入力部のいずれに基づいて生成された前記音声データであるかを識別可能な識別子として、前記第1音声入力部および前記第2音声入力のいずれにより取得された前記音声データであるかを示す音声を付与機能と、を実行させる。
の態様に係るプログラムによれば、第の態様に係る情報端末装置と同様の効果が奏される。
本発明の第の態様は、プログラムに関する。第の態様に係るプログラムは、第1音声入力部第2音声入力部および撮像部を備える情報端末装置の制御部に、前記撮像部により撮像された映像および前記第1音声入力部を介して受け付けた音声をリアルタイムで解析して、前記第1音声入力部を介した前記音声の受け付けに異常が生じているか否かを判定する機能と、前記第1音声入力部を介した前記音声の受け付けに異常が生じていると判定した場合に、前記第1音声入力部を介した前記音声の受け付けに異常が生じていることを報知する機能と、を実行させる。
の態様に係るプログラムによれば、第の態様に係る情報端末装置と同様の効果が奏される。
以上のとおり、本発明によれば、音声が録音されていない事態を回避できる。
本発明の効果ないし意義は、以下に示す実施形態の説明により更に明らかとなろう。ただし、以下に示す実施形態は、あくまでも、本発明を実施化する際の一つの例示であって、本発明は、以下の実施形態に記載されたものに何ら制限されるものではない。
図1は、実施形態1に係る情報端末装置の構成を示す模式図である。 図2は、実施形態1に係る情報端末装置の構成を示すブロック図である。 図3は、実施形態1に係る受験者が発した音声が音声データとして記憶部に記憶されるまでの流れを示す模式図である。 図4(a)は、実施形態1に係る設問ごとに保存された2つのモノラル音声データを示す模式図である。図4(b)は、実施形態1に係る採点者が音声データのファイルを再生するための画面を示す模式図である。 図5は、実施形態2に係る受験者が発した音声が音声データとして記憶部に記憶されるまでの流れを示す模式図である。 図6(a)は、実施形態2に係る設問ごとに保存された1つのモノラル音声データを示す模式図である。図6(b)は、実施形態2に係る採点者が音声データのファイルを再生するための画面を示す模式図である。 図7(a)は、実施形態2に係るヘッドセットマイクの異常検知に関する処理を示すフローチャートである。図7(b)は、実施形態2に係るヘッドセットマイクを介した音声の受け付けに異常が生じていることを報知するための画面を示す模式図である。 図8は、実施形態2に係るヘッドセットマイクの異常検知に関する処理を示すフローチャートである。 図9(a)は、実施形態2に係る第1解析を示すフローチャートである。図9(b)は、実施形態2に係る第2解析を示すフローチャートである。 図10は、実施形態2に係る第1フラグおよび第2フラグに基づいてヘッドセットマイクと内蔵マイクのいずれか一方に基づく音声を録音する処理を示すフローチャートである。 図11(a)は、実施形態2に係る表示入力部の表示領域に第1インジケータが表示された状態を示す模式図である。図11(b)は、実施形態2に係る表示入力部の表示領域に第2インジケータが表示された状態を示す模式図である。 図12(a)、(b)は、変更例に係る内蔵マイクに基づく人間の音声の有無およびヘッドセットマイクに基づく人間の音声の有無を模式的に示すグラフである。
以下の実施形態は、情報端末装置の一種であるタブレット端末に本発明を適用したものである。なお、本発明は、タブレット端末に限らず、携帯電話機、携帯用ゲーム機、ノートパソコン等、他の種類の情報端末装置に適用されてもよい。
<実施形態1>
図1は、情報端末装置1の構成を示す模式図である。情報端末装置1は、本体10とヘッドセット20を備える。図1には、本体10を正面から見た状態が示されている。
本体10は、筐体10aと、内蔵マイク11と、内蔵スピーカー12と、撮像部13と、表示入力部14と、接続端子15と、を備える。
内蔵マイク11は、本体10の近傍の音声を録音するためのマイクである。内蔵スピーカー12は、本体10から音声を出力するためのスピーカーである。撮像部13は、筐体10aの正面に位置する被写体を撮影し、撮像画像および撮像映像を取得するためのカメラである。表示入力部14は、画像を表示するとともに、ユーザーからの入力を受付可能に構成されている。具体的には、表示入力部14は、タッチパネルである。表示入力部14は、筐体10aの前面に設けられている。表示入力部14の表示領域14aは、筐体10aの前面中央に位置付けられている。表示入力部14は、表示領域14aにおいて画像を表示するとともに、表示領域14aにおいてタッチ入力を受け付ける。接続端子15は、ヘッドセット20の接続端子25を接続するための端子である。
ヘッドセット20は、ヘッドセットマイク21と、2つのヘッドセットスピーカー22と、バンド23と、ケーブル24と、接続端子25と、を備える。
ヘッドセットマイク21は、円弧状のバンド23の端部に、アーム23aを介して設置されている。ヘッドセットマイク21は、ヘッドセット20を装着したユーザーの発した音声を録音するためのマイクである。2つのヘッドセットスピーカー22は、バンド23の両端にそれぞれ設置されている。ヘッドセットスピーカー22は、ヘッドセット20を装着したユーザーに音声を出力するためのスピーカーである。ケーブル24は、バンド23の端部と接続端子25とを接続する。ケーブル24のバンド23側の端部は、図示しないケーブルにより、ヘッドセットマイク21と2つのヘッドセットスピーカー22とに接続されている。接続端子25は、本体10の接続端子15に接続される。
ヘッドセットマイク21と2つのヘッドセットスピーカー22は、ケーブル24と接続端子25を介して、本体10と信号の送受信を行う。ヘッドセットマイク21から入力された音声に基づく音声信号は、ケーブル24と接続端子25を介して、本体10に送信される。本体10から出力された音声信号は、ケーブル24と接続端子25を介して、2つのヘッドセットスピーカー22に送信され、2つのヘッドセットスピーカー22から音声が出力される。情報端末装置1を利用するユーザーは、ヘッドセット20を頭部に装着し、ヘッドセットマイク21を介して本体10に対して音声を入力し、ヘッドセットスピーカー22を介して本体10から出力された音声を聞く。
図2は、情報端末装置1の構成を示すブロック図である。
本体10は、図1に示した内蔵マイク11と、内蔵スピーカー12と、撮像部13と、表示入力部14と、接続端子15とに加え、制御部16と記憶部17を備える。制御部16と記憶部17は、図1に示した筐体10a内に収容されている。
表示入力部14は、図示しない平坦かつ透明なカバーと、液晶表示部14bと、タッチパッド14cとが、表示領域14aに垂直な方向に重ねられた構成となっている。液晶表示部14bは、液晶パネルと、液晶パネルを照明するLEDバックライトとを含み、各種の画像を表示する。なお、本体10は、液晶表示部14bに代えて、たとえば、有機ELタイプの表示部を備えてもよい。タッチパッド14cは、透明であり、液晶表示部14bの表示面上に配され、表示領域14aを介してタッチ入力を受け付ける。タッチパッド14cは、静電容量式のタッチパッドである。タッチパッド14cは、タッチ入力が行われると、静電容量の変化に基づいてタッチ入力を検出し、検出信号を出力する。
制御部16は、CPU等の演算処理回路により構成される。制御部16は、本体10の各部から信号を受信し、記憶部17に記憶されたプログラム17aに従って、本体10の各部を制御する。記憶部17は、ROM、RAM、フラッシュメモリ、ハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)などにより構成される。記憶部17は、制御部16によって実行されるプログラム17aを記憶している。プログラム17aは、オペレーティングシステムと、各種のアプリケーションを実行するためのプログラムと、を含んでいる。プログラム17aに含まれるオペレーティングシステムは、たとえば、Android(登録商標)である。
一般的なオペレーティングシステムは、内蔵マイク11からの音声入力とヘッドセットマイク21からの音声入力のいずれか一方のみを受け付けるように構成されている。すなわち、一般的なオペレーティングシステムは、本体10の接続端子15にヘッドセット20の接続端子25が接続されると、内蔵マイク11からの音声入力をオフに設定して、ヘッドセットマイク21からの音声入力のみを受け付ける。これに対し、実施形態1のオペレーティングシステムは、本体10の接続端子15にヘッドセット20の接続端子25が接続された場合でも、内蔵マイク11からの音声入力とヘッドセットマイク21からの音声入力の両方を受け付けるように構成されている。
ここで、情報端末装置1の具体的な使用形態について説明する。
実施形態1において、情報端末装置1は、外国語のスピーキングに関する模擬試験において用いられ、試験会場において受験者ごとに1台ずつ貸し出される。試験会場で配布される全ての情報端末装置1の記憶部17には、処理センターにおいて、あらかじめ模擬試験を実行するためのアプリケーションと、模擬試験の設問データとが書き込まれている。模擬試験が開始すると、受験者は、ヘッドセット20を頭部に装着し、表示入力部14に表示される設問文を参照し、または、ヘッドセットスピーカー22から出力される設問の音声を聞いて、解答を発声する。受験者が発した音声は、ヘッドセットマイク21を介して音声信号として本体10に取り込まれ、取り込まれた音声信号は、設問ごとに音声データとして記憶部17に記憶される。
模擬試験が終了すると、受験者に貸し出された情報端末装置1は回収され、処理センターに運ばれる。処理センターにおいて、情報端末装置1の記憶部17に記憶された解答に関する音声データは、処理センターのサーバに集約される。採点者は、解答に関する音声データを聞き取って、各受験者の解答の採点を行う。こうして、模擬試験の採点が行われ、受験者の模擬試験の結果として点数が取得される。
図3は、受験者が発した音声が、音声データとして記憶部17に記憶されるまでの流れを示す模式図である。
試験会場において受験者に配布される情報端末装置1の記憶部17には、あらかじめ模擬試験を実行するためのアプリケーションがインストールされている。このアプリケーションは、記憶部17に記憶されたオペレーティングシステム上で、制御部16により動作するように構成されている。模擬試験のためのアプリケーションは、模擬試験前にあらかじめ実行される。模擬試験が開始すると、受験者は、開始ボタン等を操作して模擬試験の解答を開始する。受験者は、所定の操作により設問を1問ずつ進める。そして、受験者は、設問ごとに解答を声に出して発声し、発声した音声を情報端末装置1に入力する。このとき、受験者によって発声された音声は、ヘッドセットマイク21と内蔵マイク11の両方に入力され、音声信号に変換される。すなわち、制御部16は、ヘッドセットマイク21と内蔵マイク11を介して音声の入力を並行して受け付ける。
模擬試験のアプリケーションは、オペレーティングシステムのAPI(Application Programming Interface)を介して、2つの音声信号に基づいてステレオ音声データを一時的に生成する。このとき生成されるステレオ音声データの2つのチャンネルには、それぞれ、ヘッドセットマイク21に基づく音声信号と、内蔵マイク11に基づく音声信号とが設定される。続いて、模擬試験のアプリケーションは、一時的に生成されたステレオ音声データから、ヘッドセットマイク21に基づくモノラル音声データと、内蔵マイク11に基づくモノラル音声データとを取り出し、それぞれのモノラル音声データを記憶部17に記憶させる。2つのモノラル音声データが記憶されると、一時的に生成されたステレオ音声データは消去される。
図4(a)は、設問ごとに保存された2つのモノラル音声データを示す模式図である。
情報端末装置1の記憶部17には、設問に対する解答ごとにフォルダが生成されており、各フォルダには2つのモノラル音声データが保存される。モノラル音声データのファイル名には、解答の番号と、ヘッドセットマイク21と内蔵マイク11のいずれに基づいて生成された音声データかを示す文字列と、が付されている。具体的には、設問の番号をNとすると、設問Nに対する解答番号のフォルダには、「解答N-ヘッドセットマイク.wav」と「解答N-内蔵マイク.wav」が保存される。また、ヘッドセットマイク21に基づく音声データの冒頭には、「ヘッドセットマイクに基づく音声です」との音声データが付され、内蔵マイク11に基づく音声データには、「内蔵マイクに基づく音声です」との音声データが付される。
採点者は、このような音声データのファイル群に基づいて、図4(b)に示すような画面100を用いて採点処理を行う。
図4(b)は、採点者が音声データのファイルを再生するための画面100を示す模式図である。採点者は、採点用の端末において、採点用のアプリケーションを起動し、画面100を表示させる。
画面100は、表示領域110と、ボタン121、122、131、132と、を備える。表示領域110は、再生する音声データの解答番号を表示する。ボタン121は、該当する解答番号のフォルダ内にあるヘッドセットマイク21に基づくモノラル音声データを再生するためのボタンである。ボタン122は、該当する解答番号のフォルダ内にある内蔵マイク11に基づくモノラル音声データを再生するためのボタンである。ボタン131は、再生対象の音声データを次の解答番号に移行するためのボタンである。ボタン132は、再生対象の音声データを前の解答番号に移行するためのボタンである。
採点者は、画面100を表示させた状態で、通常はボタン121を操作して、ヘッドセットマイク21に基づく音声データを再生する。このとき、ヘッドセットマイク21に基づく音声データに不具合がある場合、採点者は、ボタン122を操作して、内蔵マイク11に基づく音声データを再生する。採点者は、対象となる解答に対する採点を終えると、ボタン131を押して、再生対象を進める。こうして、採点者は、全ての設問の解答に対する採点を行う。
<実施形態1の効果>
実施形態1によれば、以下の効果が奏される。
制御部16は、ヘッドセットマイク21および内蔵マイク11を介して受験者が発した音声の入力を並行して受け付ける。そして、制御部16は、受け付けた音声に基づいてヘッドセットマイク21および内蔵マイク11ごとにモノラル音声データを生成し、生成した2つのモノラル音声データを記憶部17に記憶させる。これにより、ヘッドセットマイク21および内蔵マイク11の一方に不具合が生じたとしても、他方により受け付けられた音声に基づいてモノラル音声データが生成されているため、音声が録音されていない事態を回避できる。
実施形態1のように、情報端末装置1が外国語の模擬試験において用いられ、ヘッドセットマイク21がスピーキングの音声の入力を受け付ける場合、受験者が発した音声に基づく音声データが、ヘッドセットマイク21と内蔵マイク11の両方に基づいて記憶される。これにより、ヘッドセットマイク21に不具合が生じた場合でも、音声データを一切取得できないといった最悪の事態を回避できる。音声データが少なくとも1つ取得されれば、取得できた音声データを用いて採点処理を行うことができる。
また、録音に不具合が生じた場合、録音された音声データを再生して初めて録音に不具合があったことが判明する。このように、録音の不具合は情報端末装置1の起動不具合などとは異なり、リアルタイムで不具合に気付くことができないため、不具合を解消するための措置を迅速に行うことができない。このため、録音の処理が終了した後で、音声データが一切取得されていないといった致命的な問題が判明することになる。しかしながら、実施形態1によれば、リアルタイムで録音の不具合が判明しなかったとしても、ヘッドセットマイク21に基づく音声データと内蔵マイク11に基づく音声データの両方が生成されるため、音声データを一切取得できないといった最悪の事態を回避できる。
ヘッドセットマイク21は、情報端末装置1の本体10に接続された外部マイクであり、内蔵マイク11は、情報端末装置1の本体10に内蔵されたマイクである。ヘッドセットマイク21が用いられる場合、ヘッドセットマイク21を音声の発生源、たとえば口元に近付けることにより、本体10に内蔵マイク11に比べて高音質な音声データを生成できる。その一方で、ヘッドセット20の接続端子25が本体10の接続端子15から外れる事態や、ヘッドセット20のケーブル24が断線する事態などが不具合として意図せず起こり得る。これに対し、実施形態1によれば、ヘッドセットマイク21および内蔵マイク11の両方に基づく音声データがそれぞれ録音されている。したがって、ヘッドセットマイク21に不具合が生じた場合でも、音声が一切録音されていないといった最悪の事態を回避でき、内蔵マイク11により取得された音声データを用いてその後の採点処理を行うことができる。
図4(a)に示したように、ヘッドセットマイク21に基づく音声データのファイル名には、「ヘッドセットマイク」の文字列が付され、内蔵マイク11に基づく音声データのファイル名には、「内蔵マイク」の文字列が付される。また、ヘッドセットマイク21に基づく音声データには、「ヘッドセットマイクに基づく音声です」との音声データが付され、内蔵マイク11に基づく音声データには、「内蔵マイクに基づく音声です」との音声データが付される。これにより、音声データのファイル名を参照することにより、または、音声データを再生することにより、ヘッドセットマイク21と内蔵マイク11のどちらに基づく音声データかを円滑に把握して、音声データを用いた採点等のその後の処理を行うことができる。
このように、生成される音声データには、ヘッドセットマイク21および内蔵マイク11のいずれに基づいて生成された音声データであるかを識別可能な識別子が付与される。これにより、採点者は、ヘッドセットマイク21と内蔵マイク11のどちらに基づく音声データかを円滑に把握して、音声データを用いた採点処理を行うことができる。
<実施形態2>
図5に示すように、実施形態2のオペレーティングシステムは、実施形態1と同様に構成されており、制御部16は、実施形態1と同様、ヘッドセットマイク21と内蔵マイク11を介して音声の入力を並行して受け付け、ステレオ音声データを生成する。実施形態2では、制御部16は、ステレオ音声データから、ヘッドセットマイク21に基づくモノラル音声データと、内蔵マイク11に基づくモノラル音声データの両方を生成するのではなく、いずれか一方のモノラル音声データを生成する。ヘッドセットマイク21と内蔵マイク11のどちらに基づく音声データが生成されるかは、ヘッドセットマイク21を介した音声の受け付けに異常が生じているか否かに基づいて決定される。このような処理は、追って図7(a)~図10を参照して説明する。実施形態2のその他の構成は、図1、2を参照して説明した実施形態1と同様である。
図6(a)は、設問ごとに保存されたモノラル音声データを模式的に示す図である。
実施形態2では、実施形態1と異なり、ヘッドセットマイク21に基づく音声データファイルと、内蔵マイク11に基づく音声データファイルのいずれかが保存される。この場合、設問に対する解答ごとのフォルダに、1つのモノラル音声データのファイルが保存される。図6(a)に示す例では、解答1、2のフォルダには、ヘッドセットマイク21に基づく音声データファイルのみが保存され、解答3のフォルダには、内蔵マイク11に基づく音声データファイルのみが保存されている。また、実施形態1と同様、音声データのファイル名には、ヘッドセットマイク21と内蔵マイク11のどちらに基づく音声データかを文字列が付され、音声データには、どちらに基づく音声データかを示す音声データが付される。
図6(b)は、採点者が音声データのファイルを再生するための画面100を示す模式図である。図6(b)に示す画面100は、図4(b)に示した画面100と同様に構成されている。ただし、実施形態2では、解答ごとにヘッドセットマイク21と内蔵マイク11のいずれか一方の音声データのみが記憶されている。したがって、図6(b)に示すように、ボタン121、122のうち、生成されている音声データに対応するボタンが、実線で示すように有効とされ、生成されていない音声データに対応するボタンは、破線で示すように無効とされる。図6(b)に示す例では、解答1についてはヘッドセットマイク21に基づく音声データファイルのみが保存されているため、ボタン121が有効とされ、ボタン122が無効とされている。
図7(a)は、ヘッドセットマイク21の異常検知に関する処理を示すフローチャートである。制御部16は、図7(a)の処理を、プログラム17aに含まれる模擬試験のアプリケーションを実行することにより行って、模擬試験が終了するまで繰り返し行う。
制御部16は、模擬試験のアプリケーションが実行されると、第1フラグをONに設定する。第1フラグは、記憶部17に記憶された変数である。たとえば、第1フラグがONのとき変数の値が1に設定され、第1フラグがOFFのとき変数の値が0に設定される。
制御部16は、ヘッドセットマイク21が接続されているか否か、すなわち、本体10の接続端子15にヘッドセット20の接続端子25が接続されているか否かを判定する(S11)。ヘッドセットマイク21が接続されている場合(S11:YES)、制御部16は、第1フラグをONに設定する(S12)。
他方、ヘッドセットマイク21が接続されていない場合(S11:NO)、制御部16は、第1フラグがONに設定されているか否かを判定する(S13)。第1フラグがONに設定されている場合(S13:YES)、制御部16は、第1フラグをOFFに設定し(S14)、ヘッドセットマイク21に関する異常を報知する(S15)。具体的には、S15において、制御部16は、図7(b)に示す画面を表示入力部14に表示する。図7(b)に示す画面には、ヘッドセットマイク21を介した音声の受け付けに異常が生じていることを示すメッセージが表示される。なお、S15において、「ヘッドセットマイクが正しく接続されているか確認して下さい」などの確認を促すメッセージが表示されてもよい。
図8は、ヘッドセットマイク21の異常検知に関する処理を示すフローチャートである。制御部16は、図8の処理を、プログラム17aに含まれる模擬試験のアプリケーションを実行することにより行って、模擬試験が終了するまで図7(a)の処理と並行して繰り返し行う。具体的には、制御部16は、図8のS21~S26の処理を、模擬試験の設問ごとに実行し、同じ設問中で繰り返し実行する。
制御部16は、模擬試験のアプリケーションが実行されると、第2フラグをONに設定する。第2フラグも、第1フラグと同様、記憶部17に記憶された変数である。
制御部16は、図9(a)の第1解析および図9(b)の第2解析を行って、ヘッドセットマイク21を介した音声の受け付けが正常か否かを判定する(S21)。制御部16は、図9(a)、(b)の処理を、プログラム17aに含まれる模擬試験のアプリケーションを実行することにより行う。
図9(a)は、第1解析を示すフローチャートである。
制御部16は、内蔵マイク11からの音声データに基づいて、受験者が音声を発しているか否かを解析する(S101)。具体的には、制御部16は、内蔵マイク11に基づく音声データにおいて、人間の声の周波数帯に閾値以上の振幅レベルを有する音声が存在する場合に、受験者が音声を発していると判定する。続いて、制御部16は、ヘッドセットマイク21からの音声データに基づいて、受験者が音声を発しているか否かを解析する(S102)。具体的には、制御部16は、ヘッドセットマイク21に基づく音声データにおいて、人間の声の周波数帯に閾値以上の振幅レベルを有する音声が存在する場合に、受験者が音声を発していると判定する。
続いて、制御部16は、内蔵マイク11およびヘッドセットマイク21に基づいて、受験者の発声状態が重複しているか否かを判定する(S103)。具体的には、S103において、制御部16は、S101において内蔵マイク11に基づいて受験者の音声が発せられていると判定し、かつ、S102においてヘッドセットマイク21に基づいて受験者の音声が発せられていると判定した場合、受験者の発声状態が重複していると判定する。
なお、S103において、制御部16は、S101において内蔵マイク11に基づいて受験者の音声が発せられていないと判定し、かつ、S102においてヘッドセットマイク21に基づいて受験者の音声が発せられていないと判定した場合も、受験者がスピーキングの解答を実際に発声していない場合が想定されるため、受験者の発声状態が重複していると判定する。
受験者の発声状態が重複している場合(S103:YES)、制御部16は、ヘッドセットマイク21を介した音声の受け付けに異常が生じていない、すなわちヘッドセットマイク21を介した音声の受け付けが正常であると判定する(S104)。他方、受験者の発声状態が重複していない場合(S103:NO)、制御部16は、ヘッドセットマイク21を介した音声の受け付けに異常が生じていると判定する(S105)。
図9(b)は、第2解析を示すフローチャートである。
制御部16は、撮像部13により撮像された映像に基づいて、受験者が音声を発しているか否かを解析する(S111)。具体的には、制御部16は、撮像部13により撮像された映像において受験者の顔を認識し、顔領域内にある受験者の口が動いている場合に、受験者が音声を発していると判定する。続いて、制御部16は、図9(a)のS102と同様に、ヘッドセットマイク21からの音声データに基づいて、受験者が音声を発しているか否かを解析する(S112)。
続いて、制御部16は、撮像部13およびヘッドセットマイク21に基づいて受験者の発声状態が重複しているか否かを判定する(S113)。具体的には、S113において、制御部16は、S111において撮像部13に基づいて受験者の音声が発せられていると判定し、かつ、S112においてヘッドセットマイク21に基づいて受験者の音声が発せられていると判定した場合、受験者の発声状態が重複していると判定する。
なお、S113において、制御部16は、S111において撮像部13に基づいて受験者の音声が発せられていないと判定し、かつ、S112においてヘッドセットマイク21に基づいて受験者の音声が発せられていないと判定した場合も、受験者がスピーキングの解答を実際に発声していない場合が想定されるため、受験者の発声状態が重複していると判定する。
受験者の発声状態が重複している場合(S113:YES)、制御部16は、ヘッドセットマイク21を介した音声の受け付けに異常が生じていない、すなわちヘッドセットマイク21を介した音声の受け付けが正常であると判定する(S114)。他方、受験者の発声状態が重複していない場合(S113:NO)、制御部16は、ヘッドセットマイク21を介した音声の受け付けに異常が生じていると判定する(S115)。
図8に戻り、S21において、制御部16は、ヘッドセットマイク21を介した音声の受け付けが正常か否かを判定する。具体的には、制御部16は、第1解析および第2解析の両方において、ヘッドセットマイク21を介した音声の受け付けが正常であると判定した場合に、S21においてヘッドセットマイク21が正常であると判定する。
ヘッドセットマイク21が正常である場合(S21:YES)、制御部16は、第2フラグをONに設定する(S22)。他方、ヘッドセットマイク21に異常が生じている場合(S21:NO)、制御部16は、第2フラグがONに設定されているか否かを判定する(S23)。第2フラグがONに設定されている場合(S23:YES)、制御部16は、第2フラグをOFFに設定し(S24)、図7(a)のS15と同様、図7(b)に示すようにヘッドセットマイク21に関する異常を報知する(S25)。なお、S25において、「ヘッドセットマイクのケーブルに異常がないか確認して下さい」などの確認を促すメッセージが表示されてもよい。
続いて、制御部16は、模擬試験の設問に対する解答の録音が終了したか否かを判定する(S26)。録音が終了していない場合(S26:NO)、処理がS21に戻される。こうして、解答の録音が終了するまで、S21~S26の処理が所定の時間間隔で繰り返し行われる。他方、録音が終了すると(S26:YES)、図8の処理が終了する。
図10は、第1フラグおよび第2フラグに基づいてヘッドセットマイク21と内蔵マイク11のいずれか一方に基づく音声を録音する処理を示すフローチャートである。制御部16は、図10の処理を、プログラム17aに含まれる模擬試験のアプリケーションを実行することにより行って、模擬試験が終了するまで図7(a)~図9(b)の処理と並行して繰り返し行う。具体的には、制御部16は、図10のS31~S38の処理を、模擬試験の設問ごとに実行する。
制御部16は、第1フラグおよび第2フラグの両方がONに設定されているか否かを判定する(S31)。第1フラグおよび第2フラグの両方がONに設定されていると(S31:YES)、制御部16は、ヘッドセットマイク21に基づく音声を録音する(S32)。すなわち、制御部16は、ヘッドセットマイク21を介して受け付けた音声に基づいてモノラル音声データを生成する(S32)。そして、制御部16は、ヘッドセットマイク21を介して受け付けた音声の音量を示す第1インジケータ210を表示入力部14に表示させる(S33)。
図11(a)は、表示入力部14の表示領域14aに第1インジケータ210が表示された状態を示す模式図である。
第1インジケータ210は、色が付いた目盛が右方向に並んでいる個数で音量を示すメーターを備える。第1インジケータ210の目盛の色は、ヘッドセットマイク21を介して正常に音声が受け付けられていることを示す色である。第1インジケータ210は、ヘッドセットマイク21を介して正常に音声が受け付けられていることを示すアイコン211およびラベル212を含む。アイコン211は、ヘッドセット20を模した形状を有しており、ラベル212は、「ヘッドセットマイク」の文字列を含む。
図10に戻り、他方、第1フラグまたは第2フラグがOFFに設定されていると(S31:NO)、制御部16は、内蔵マイク11に基づく音声を録音する(S34)。すなわち、制御部16は、内蔵マイク11を介して受け付けた音声に基づいてモノラル音声データを生成する(S34)。そして、制御部16は、内蔵マイク11を介して受け付けた音声の音量を示す第2インジケータ220を表示入力部14に表示させる(S35)。
図11(b)は、表示入力部14の表示領域14aに第2インジケータ220が表示された状態を示す模式図である。
第2インジケータ220は、色が付いた目盛が右方向に並んでいる個数で音量を示すメーターである。第2インジケータ220の目盛の色は、ヘッドセットマイク21に代えて内蔵マイク11を介して音声が受け付けられていることを示す色であり、第1インジケータ210の目盛の色と異なっている。第2インジケータ220は、ヘッドセットマイク21に代えて内蔵マイク11を介して音声が受け付けられていることを示すアイコン221およびラベル222を含む。アイコン221は、本体10に設けられた内蔵マイク11を模した形状を有しており、ラベル212は、「内蔵マイク」の文字列を含む。
図10に戻り、制御部16は、模擬試験の設問に対する解答の録音が終了したか否かを判定する(S36)。録音が終了していない場合(S36:NO)、処理がS31に戻され、解答の録音が終了するまで、S31~S36の処理が所定の時間間隔で繰り返し行われる。他方、録音が終了すると(S36:YES)、処理がS37に進められる。
制御部16は、S31~S36の処理により生成した音声データのファイル名に、ヘッドセットマイク21と内蔵マイク11のどちらに基づいてモノラル音声データが生成されたかを示す文字列を識別子として付する(S37)。続いて、制御部16は、S31~S36の処理により生成した音声データの冒頭に、ヘッドセットマイク21と内蔵マイク11のどちらに基づいてモノラル音声データが生成されたかを示す音声データを識別子として付する(S38)。こうして、図10の処理が終了する。
なお、S31~S36の処理が繰り返し行われている間に、S31の判定が切り替わると、録音の途中で、最終的に生成されるモノラル音声データの元となる音声入力部が、ヘッドセットマイク21と内蔵マイク11との間で切り替わることになる。すなわち、生成される1つのモノラル音声データにおいて、ヘッドセットマイク21に基づく音声データと、内蔵マイク11に基づく音声データとが混在することになる。この場合、S37において、ファイル名に識別子として、「ヘッドセットマイクおよび内蔵マイク」の文字列が付される。また、S38において、音声データに識別子として、「ヘッドセットマイクおよび内蔵マイクに基づく音声です」との音声データが付される。
1つのモノラル音声データにおいて、ヘッドセットマイク21に基づく音声データと、内蔵マイク11に基づく音声データとが混在する場合、採点者が音声データのファイルを再生するための画面100において、ボタン121、122が無効とされ、さらに別のボタンが表示される。この場合に表示されるボタンには、「ヘッドセットマイクおよび内蔵マイク」の文字列が表示される。2種類の音声データが混在する場合、採点者は、「ヘッドセットマイクおよび内蔵マイク」の文字列が表示されたボタンを操作して、対象となる解答の音声データを再生する。
<実施形態2の効果>
実施形態2によれば、以下の効果が奏される。
制御部16は、ヘッドセットマイク21と内蔵マイク11を介して音声の入力を並行して受け付ける。そして、ヘッドセットマイク21を介した音声の受け付けに異常が生じていない場合、制御部16は、ヘッドセットマイク21を介して受け付けた音声に基づいてモノラル音声データを生成する。他方、ヘッドセットマイク21を介した音声の受け付けに異常が生じている場合、制御部16は、内蔵マイク11を介して受け付けた音声に基づいてモノラル音声データを生成する。このように、1つのモノラル音声データが生成されると、ヘッドセットマイク21に基づくモノラル音声データと、内蔵マイク11に基づくモノラル音声データのいずれを使うべきかを判断する必要がない。したがって、生成された音声データを用いて、採点処理等のその後の処理を円滑に進めることができる。
また、ヘッドセットマイク21を介した音声の受け付けに異常が生じている場合、内蔵マイク11を介して受け付けた音声に基づいて音声データが生成されるため、実施形態1と同様、音声データが一切録音されていないといった最悪の事態を回避できる。
また、ヘッドセットマイク21に基づく音声データと内蔵マイク11に基づく音声データのいずれか一方が記憶部17に記憶されるため、記憶部17に記憶されるデータ容量を小さくできる。これにより、制御部16や記憶部17への処理負荷を小さくできるため、情報端末装置1のハードウェア構成にかかる制約と、情報端末装置1にかかるコストとを抑制できる。
また、一般的に、内蔵マイク11に基づく音声データの音声品質は、ヘッドセットマイク21に基づく音声データの音声品質に比べて劣る。しかしながら、実施形態2によれば、主としてヘッドセットマイク21に基づく音声データが取得され、ヘッドセットマイク21を介して音声の受け付けに異常が生じた場合に限り、内蔵マイク11に基づく音声データが取得される。これにより、音声データを一切取得できないといった最悪の事態を回避しつつ、高品質な音声データを取得できる。
また、制御部16は、ヘッドセットマイク21と内蔵マイク11を介して音声の入力を並行して受け付けているため、ヘッドセットマイク21に基づくモノラル音声データの生成と、内蔵マイク11に基づくモノラル音声データの生成とを、迅速に切り替えることができる。これにより、受験者の発した音声が途切れることなく、モノラル音声データを生成できる。
ヘッドセットマイク21を介した音声の受け付けに異常が生じていない場合、ヘッドセットマイク21を介して受け付けた音声の音量を示す第1インジケータ210が表示入力部14に表示される。また、ヘッドセットマイク21を介した音声の受け付けに異常が生じている場合、内蔵マイク11を介して受け付けた音声の音量を示す第2インジケータ220が表示入力部14に表示される。
たとえば、常に第1インジケータ210のみが表示される場合、ヘッドセットマイク21を介した音声の受け付けに異常が生じると、第1インジケータ210の目盛が極端に小さい値、極端に大きな値、または変則的な値を示すようになる。このように第1インジケータ210の目盛が不自然になると、受験者は正しく音声が録音されているか不安を感じてしまう。これに対して実施形態2では、ヘッドセットマイク21を介した音声の受け付けに異常が生じると、第1インジケータ210に代えて第2インジケータ220が表示されるため、受験者の心理的な不安を抑制できる。
また、第1インジケータ210と第2インジケータ220の表示形態は、互いに異なっている。具体的には、第1インジケータ210と第2インジケータ220の目盛の色は互いに異なっており、アイコン211とアイコン221の形状は互いに異なっており、ラベル212とラベル222の文字列は互いに異なっている。これにより、受験者は、ヘッドセットマイク21を介した音声の受け付けに異常が生じていることを把握できる。
制御部16は、図8のS21で第1解析および第2解析を行って、ヘッドセットマイク21および内蔵マイク11を介して受け付けた音声をリアルタイムで解析し、撮像部13により撮像された映像およびヘッドセットマイク21を介して受け付けた音声をリアルタイムで解析して、ヘッドセットマイク21を介した音声の受け付けに異常が生じているか否かを判定する。そして、制御部16は、ヘッドセットマイク21を介した音声の受け付けに異常が生じている場合、図8のS25においてヘッドセットマイク21に関する異常を報知する。これにより、情報端末装置1のユーザーは、ヘッドセットマイク21を介した音声の受け付けの異常により、ヘッドセットマイク21に基づく録音が行われないことを把握できる。たとえば、情報端末装置1が模擬試験において用いられる場合、情報端末装置1を使用する受験者は、異常があることを迅速に把握できるため、試験会場において情報端末装置1の交換等の措置を迅速に進めることができる。
また、制御部16は、図7(a)のS11でヘッドセットマイク21が接続されているか否かを判定し、ヘッドセットマイク21が接続されていない場合、図7(a)のS15においてヘッドセットマイク21に関する異常を報知する。これにより、情報端末装置1のユーザーは、ヘッドセットマイク21を介した音声の受け付けの異常により、ヘッドセットマイク21に基づく録音が行われないことを把握できる。たとえば、情報端末装置1が模擬試験において用いられる場合、情報端末装置1を使用する受験者は、異常があることを迅速に把握できるため、試験会場において情報端末装置1の交換等の措置を迅速に進めることができる。
このように、ヘッドセットマイク21を介した音声の受け付けに異常が生じている場合に、試験会場において情報端末装置1の交換が迅速に行われると、どの受験者においても高品質なヘッドセットマイク21の音声データを録音できる。これにより、受験者ごとに音声データの品質が異なるといった不公平な状況を抑制して、受験者間の公平性を実現できる。
なお、実施形態2の第1解析では、図9(a)のS103において発声状態が重複していない場合、図9(a)のS105においてヘッドセットマイク21を介した音声の受け付けに異常が生じていると判定された。しかしながら、実際には、ヘッドセットマイク21を介した音声の受け付けが正常で、内蔵マイク11を介した音声の受け付けに異常が生じている場合も、受験者の発声状態は重複しない。したがって、実施形態2において、制御部16は、内蔵マイク11に基づいて受験者の音声が発せられていないと判定し、ヘッドセットマイク21に基づいて受験者の音声が発せられていると判定した場合、内蔵マイク11を介した音声の受け付けに異常が生じていると判定してもよい。この場合、制御部16は、内蔵マイク11に関する異常を報知してもよい。
<変更例>
以上、本発明の実施形態について説明したが、本発明は上記実施形態に何ら制限されるものではない。
たとえば、実施形態1、2では、情報端末装置1は、外国語のスピーキングに関する模擬試験において用いられたが、これに限らず、大学や高校などの教育機関の入学試験や資格試験のような各種試験などで、スピーキングに関する設問の解答に用いられてもよい。
また、実施形態1では、ヘッドセットマイク21と内蔵マイク11に基づいて一時的にステレオデータを作成し、ステレオデータに基づいて、ヘッドセットマイク21と内蔵マイク11に基づいて2つのモノラル音声データが生成された。しかしながら、これに限らず、ヘッドセットマイク21に基づく音声データと内蔵マイク11に基づく音声データとを含むステレオ音声データが、解答ごとにファイルとして生成されてもよい。この場合も、ヘッドセットマイク21と内蔵マイク11に基づく音声ごとに音声データ生成されているため、音声データが一切録音されていない最悪の事態を回避できる。なお、解答ごとにステレオ音声データのファイルが生成される場合、たとえば、採点処理などの後の処理において、ステレオ音声データが2つのモノラル音声データに分割され再生される。
また、実施形態1、2では、情報端末装置1は、1つのヘッドセットマイク21と、1つの内蔵マイク11とを備え、受験者は主としてヘッドセットマイク21を用いて音声を入力し、内蔵マイク11は、ヘッドセットマイク21のバックアップとして用いられた。しかしながら、これに限らず、情報端末装置1は、2つのヘッドセットマイク21を備えてもよく、あるいは2つの内蔵マイク11を備えてもよい。この場合も、受験者は主としていずれか一方のマイクを用いて音声を入力し、他方がバックアップとして用いられる。
このように、情報端末装置1が2つの音声入力部を備え、2つの音声入力部を介して音声の入力が並行して受け付けられ、受け付けられた音声に基づいて音声入力部ごとに音声データが生成されると、1つの音声入力部だけに基づいて音声データが生成される場合に比べて、音声データを一切取得できないといった最悪の事態を抑制できる。なお、情報端末装置1が備える音声入力部は、実施形態1、2のように2つに限らず、3つ以上でもよい。この場合、3つ以上の音声入力部のうち、受験者は主としていずれか1つの音声入力部を用いて音声を入力し、それ以外の音声入力部がバックアップとして用いられる。
また、実施形態1、2では、ヘッドセットマイク21に基づく音声データのファイル名には「ヘッドセットマイク」の文字列が付され、内蔵マイク11に基づく音声データのファイル名には「内蔵マイク」の文字列が付された。しかしながら、これに限らず、ヘッドセットマイク21と内蔵マイク11のいずれに基づく音声データであるかを識別可能であれば、ファイル名に付される文字列は、記号や数字であってもよい。
また、実施形態1、2では、ヘッドセットマイク21に基づく音声データには、「ヘッドセットマイクに基づく音声です」との音声データが付され、内蔵マイク11に基づく音声データには、「内蔵マイクに基づく音声です」との音声データが付された。しかしながら、これに限らず、ヘッドセットマイク21と内蔵マイク11のいずれに基づく音声データであるかを識別可能であれば、識別用の音声データは、アラーム音声やメロディ音声であってもよい。
また、実施形態1、2では、モノラル音声データのファイル形式は、図4(a)および図6(a)に示したようにWAVであったが、これに限らず、MP3など他のファイル形式でもよい。モノラル音声データが容量を圧縮可能なファイル形式で保存されれば、記憶部17に記憶されるデータ容量を小さくできる。
また、実施形態2において、第1インジケータ210のメーターと第2インジケータ220のメーターとは、同じ位置に表示された同じメーターであったが、これに限らず、上下に隣り合うように並んでもよい。また、第1インジケータ210と第2インジケータ220とが、上下に隣り合うように並んでもよい。こうすると、ヘッドセットマイク21を介して受け付けた音声の音量と、内蔵マイク11を介して受け付けた音声の音量とを同時に確認できる。
また、実施形態2では、第1インジケータ210において、アイコン211およびラベル212の両方が表示されたが、いずれか一方のみが表示されてもよい。第2インジケータ220において、アイコン221およびラベル222の両方が表示されたが、いずれか一方のみが表示されてもよい。
また、実施形態2では、ヘッドセットマイク21を介した音声の受け付けに異常が生じているか否かに応じて、第1インジケータ210と第2インジケータ220の表示が切り替えられたが、実施形態1においても、第1インジケータ210と第2インジケータ220の表示が切り替えられてもよい。たとえば、実施形態1において、制御部16は、ヘッドセットマイク21を介した音声の受け付けに異常が生じているか否かを判定し、判定結果に応じて実施形態2と同様、第1インジケータ210と第2インジケータ220の表示を切り替える。この場合、制御部16は、判定結果にかかわらず、ヘッドセットマイク21に基づくモノラル音声データと内蔵マイク11に基づくモノラル音声データの両方を記憶部17に記憶させる。
また、実施形態2では、ヘッドセットマイク21に関する異常を報知する処理(図7(a)のS15および図8のS25)において、図7(b)に示す画面が表示入力部14に表示された。しかしながら、これに限らず、ヘッドセットマイク21に関する異常を報知するための、メッセージ音声、アラーム音声、メロディ音声などが、内蔵スピーカー12およびヘッドセットスピーカー22から出力されてもよい。
また、実施形態2では、S21において第1解析および第2解析が実行されたが、これに限らず、第1解析および第2解析のいずれか一方が実行されてもよい。また、第1解析および第2解析において、受験者の音声が発せられているか否かの解析は、上述した手法に限らない。たとえば、制御部16は、ヘッドセットマイク21に基づく音声に、人間の声の周波数帯以外の周波数帯に閾値以上の振幅レベルを有する音声が存在する場合に、ヘッドセットマイク21を介した音声の受け付けに異常が生じていると判定してもよい。
また、ヘッドセット20の本体10に対する接続が不十分な場合、ヘッドセットマイク21と本体10との間の接続状態が、接続と非接続との間で繰り返し切り替えられることがある。この場合、たとえば、図12(a)の上段に示すように内蔵マイク11に基づいて人間の音声の有無が検出された場合、図12(a)の下段に示すようにヘッドセットマイク21に基づいて人間の音声の有無が検出されることになる。このとき、内蔵マイク11に基づく音声データとヘッドセットマイク21に基づく音声データとが、頻繁に切り替えられて録音される。こうなると、生成された音声データにおいて、高品質な音声データ部分と低品質な音声データ部分とが混在することになるため、採点者は、音声データを用いた採点等を円滑に進めにくくなる。このような問題は、以下のような処理によって解決できる。
図12(a)、(b)に示すように、所定期間ΔTごとに、内蔵マイク11に基づく人間の音声の有無の波形と、ヘッドセットマイク21に基づく人間の音声の有無の波形とが比較される。図12(a)の場合には、2つの波形は不一致と判定され、図12(b)の場合には、2つの波形は一致すると判定される。図12(a)の場合は、ΔTが経過したタイミングで、録音に用いる音声入力部が内蔵マイク11に切り替えられる。その後、所定のタイミングで、図12(b)に示すように2つの波形が一致すると、録音に用いる音声入力部がヘッドセットマイク21に戻される。
なお、図12(a)、(b)において、ヘッドセットマイク21に基づく音声の有無の波形と比較される波形は、撮像部13に基づく音声の有無の波形であってもよい。
このように2つの波形を比較して録音に用いる音声入力部が切り替えられると、ヘッドセットマイク21の接続が不十分な場合でも、録音に用いる音声入力部の頻繁な切り替えを抑制でき、生成された音声データの録音品質が頻繁に変わることを抑制できる。したがって、採点者は生成された音声データを用いて、採点処理等のその後の処理を進めやすくなる。
また、図12(a)、(b)を参照して説明した変更例において、内蔵マイク11に基づく人間の音声の有無とヘッドセットマイク21に基づく人間の音声の有無とが一致しない場合、録音に用いる音声入力部がヘッドセットマイク21から内蔵マイク11に切り替えられてもよい。この場合、図12(b)に示すように、その後の所定のタイミングで2つの波形が一致する場合に、録音に用いる音声入力部がヘッドセットマイク21に戻される。
同様に、撮像部13に基づく音声の有無とヘッドセットマイク21に基づく人間の音声の有無とが一致しない場合、録音に用いる音声入力部が内蔵マイク11に切り替えられ、その後の所定のタイミングで撮像部13に基づく波形とヘッドセットマイク21に基づく波形とが一致する場合に、録音に用いる音声入力部がヘッドセットに戻されてもよい。
また、実施形態2において、1つの設問についてS21~S26の処理が実行される間、第1解析または第2解析において発声状態が重複していないと判定された場合、その後S21~S26の処理が終了するまで、録音に用いる音声入力部が内蔵マイク11に固定されてもよい。
また、実施形態1、2では、採点者は、採点用の端末において採点用のアプリケーションを起動し、それぞれ、図4(b)および図6(b)の画面100を表示させた。しかしながら、これに限らず、プログラム17aが採点用のアプリケーションを含み、採点者は、情報端末装置1において採点用のアプリケーションを起動する指示を入力し、制御部16が画面100を表示入力部14に表示させてもよい。
この他、本発明の実施形態は、特許請求の範囲に示された技術的思想の範囲内において、適宜、種々の変更が可能である。
1 情報端末装置
11 内蔵マイク(音声入力部、第2音声入力部)
13 撮像部
14 表示入力部(表示部)
16 制御部
17 記憶部
17a プログラム
21 ヘッドセットマイク(音声入力部、第1音声入力部、外部マイク)
210 第1インジケータ
220 第2インジケータ

Claims (10)

  1. 複数の音声入力部と、
    記憶部と、
    前記複数の音声入力部を介して音声の入力を並行して受け付け、受け付けた前記音声に基づいて前記複数の音声入力部ごとに音声データを生成し、生成した前記音声データを前記記憶部に記憶させる制御部と、を備え、
    前記複数の音声入力部は、第1音声入力部および第2音声入力部により構成され、
    前記制御部は、前記記憶部に記憶させる前記音声データに、前記第1音声入力部および前記第2音声入力部のいずれに基づいて生成された前記音声データであるかを識別可能な識別子を付与し、
    前記識別子は、前記複数の音声入力部のいずれにより取得された前記音声データであるかを示す音声である、
    情報端末装置。
  2. 第1音声入力部と、
    第2音声入力部と、
    記憶部と、
    前記第1音声入力部および前記第2音声入力部を介して音声の入力を並行して受け付け、前記第1音声入力部を介した前記音声の受け付けに異常が生じていない場合、前記第1音声入力部を介して受け付けた前記音声に基づいて音声データを生成し、前記第1音声入力部を介した前記音声の受け付けに異常が生じている場合、前記第2音声入力部を介して受け付けた前記音声に基づいて音声データを生成し、生成した前記音声データを前記記憶部に記憶させる制御部と、を備え、
    前記制御部は、前記記憶部に記憶させる前記音声データに、前記第1音声入力部および前記第2音声入力部のいずれに基づいて生成された前記音声データであるかを識別可能な識別子を付与し、
    前記識別子は、前記複数の音声入力部のいずれにより取得された前記音声データであるかを示す音声である、
    情報端末装置。
  3. 前記第1音声入力部は、前記情報端末装置の本体に接続された外部マイクであり、
    前記第2音声入力部は、前記情報端末装置の本体の内蔵マイクである、
    請求項またはに記載の情報端末装置。
  4. 複数の音声入力部と、
    記憶部と、
    前記複数の音声入力部を介して音声の入力を並行して受け付け、受け付けた前記音声に基づいて前記複数の音声入力部ごとに音声データを生成し、生成した前記音声データを前記記憶部に記憶させる制御部と、
    表示部と、を備え、
    前記複数の音声入力部は、第1音声入力部および第2音声入力部により構成され、
    前記制御部は、
    前記第1音声入力部を介した前記音声の受け付けに異常が生じていない場合、前記第1音声入力部を介して受け付けた前記音声の音量を示す第1インジケータを前記表示部に表示させ、
    前記第1音声入力部を介した前記音声の受け付けに異常が生じている場合、前記第2音声入力部を介して受け付けた前記音声の音量を示す第2インジケータを前記第1インジケータに代えて前記表示部に表示させる
    情報端末装置。
  5. 前記第1インジケータと前記第2インジケータの表示形態は、互いに異なる、
    請求項に記載の情報端末装置。
  6. 前記制御部は、
    前記第1音声入力部および前記第2音声入力部を介して受け付けた前記音声をリアルタイムで解析して、前記第1音声入力部を介した前記音声の受け付けに異常が生じているか否かを判定し、
    前記第1音声入力部を介した前記音声の受け付けに異常が生じていると判定した場合に、前記第1音声入力部を介した前記音声の受け付けに異常が生じていることを報知する、
    請求項ないしの何れか一項に記載の情報端末装置。
  7. 複数の音声入力部と、
    記憶部と、
    前記複数の音声入力部を介して音声の入力を並行して受け付け、受け付けた前記音声に基づいて前記複数の音声入力部ごとに音声データを生成し、生成した前記音声データを前記記憶部に記憶させる制御部と、
    撮像部と、を備え、
    前記複数の音声入力部は、第1音声入力部および第2音声入力部により構成され、
    前記制御部は、
    前記撮像部により撮像された映像および第1音声入力部を介して受け付けた前記音声をリアルタイムで解析して、前記第1音声入力部を介した前記音声の受け付けに異常が生じているか否かを判定し、
    前記第1音声入力部を介した前記音声の受け付けに異常が生じていると判定した場合に、前記第1音声入力部を介した前記音声の受け付けに異常が生じていることを報知する
    情報端末装置。
  8. 第1音声入力部と、
    第2音声入力部と、
    撮像部と、
    制御部と、を備え、
    前記制御部は、
    前記撮像部により撮像された映像および前記第1音声入力部を介して受け付けた音声をリアルタイムで解析して、前記第1音声入力部を介した前記音声の受け付けに異常が生じているか否かを判定し、
    前記第1音声入力部を介した前記音声の受け付けに異常が生じていると判定した場合に、前記第1音声入力部を介した前記音声の受け付けに異常が生じていることを報知する、
    情報端末装置。
  9. 第1音声入力部と第2音声入力部とを備える情報端末装置の制御部に、
    前記第1音声入力部および前記第2音声入力部を介して並行して受け付けた音声に基づいて前記第1音声入力部および前記第2音声入力部ごとに音声データを生成する機能と、
    生成した前記音声データを記憶部に記憶させる機能と、
    前記記憶部に記憶させる前記音声データに、前記第1音声入力部および前記第2音声入力部のいずれに基づいて生成された前記音声データであるかを識別可能な識別子として、前記第1音声入力部および前記第2音声入力のいずれにより取得された前記音声データであるかを示す音声を付与機能と、を実行させる、
    プログラム。
  10. 第1音声入力部第2音声入力部および撮像部を備える情報端末装置の制御部に、
    前記撮像部により撮像された映像および前記第1音声入力部を介して受け付けた音声をリアルタイムで解析して、前記第1音声入力部を介した前記音声の受け付けに異常が生じているか否かを判定する機能と、
    前記第1音声入力部を介した前記音声の受け付けに異常が生じていると判定した場合に、前記第1音声入力部を介した前記音声の受け付けに異常が生じていることを報知する機能と、を実行させる、
    プログラム。
JP2019031667A 2019-02-25 2019-02-25 情報端末装置およびプログラム Active JP7344649B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019031667A JP7344649B2 (ja) 2019-02-25 2019-02-25 情報端末装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019031667A JP7344649B2 (ja) 2019-02-25 2019-02-25 情報端末装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2020135725A JP2020135725A (ja) 2020-08-31
JP7344649B2 true JP7344649B2 (ja) 2023-09-14

Family

ID=72263459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019031667A Active JP7344649B2 (ja) 2019-02-25 2019-02-25 情報端末装置およびプログラム

Country Status (1)

Country Link
JP (1) JP7344649B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004023535A (ja) 2002-06-18 2004-01-22 Kenwood Corp 通信端末、通信端末制御プログラム及び通信端末制御方法
JP2004185514A (ja) 2002-12-05 2004-07-02 Ricoh Co Ltd 音声記録装置、音声記録方法、音声記録プログラム及び記録媒体
JP2004312637A (ja) 2003-04-10 2004-11-04 Olympus Corp 音声入力装置
JP2005326587A (ja) 2004-05-13 2005-11-24 Fuji Television Network Inc 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
JP2006109136A (ja) 2004-10-06 2006-04-20 Canon Inc ビデオカメラ装置
JP2009222969A (ja) 2008-03-17 2009-10-01 Toyota Motor Corp 音声認識ロボットおよび音声認識ロボットの制御方法
JP2011250283A (ja) 2010-05-28 2011-12-08 Sanyo Electric Co Ltd 出力装置及び集音装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004023535A (ja) 2002-06-18 2004-01-22 Kenwood Corp 通信端末、通信端末制御プログラム及び通信端末制御方法
JP2004185514A (ja) 2002-12-05 2004-07-02 Ricoh Co Ltd 音声記録装置、音声記録方法、音声記録プログラム及び記録媒体
JP2004312637A (ja) 2003-04-10 2004-11-04 Olympus Corp 音声入力装置
JP2005326587A (ja) 2004-05-13 2005-11-24 Fuji Television Network Inc 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム
JP2006109136A (ja) 2004-10-06 2006-04-20 Canon Inc ビデオカメラ装置
JP2009222969A (ja) 2008-03-17 2009-10-01 Toyota Motor Corp 音声認識ロボットおよび音声認識ロボットの制御方法
JP2011250283A (ja) 2010-05-28 2011-12-08 Sanyo Electric Co Ltd 出力装置及び集音装置

Also Published As

Publication number Publication date
JP2020135725A (ja) 2020-08-31

Similar Documents

Publication Publication Date Title
US9047858B2 (en) Electronic apparatus
CN113377326B (zh) 一种音频数据处理方法、装置、终端及存储介质
JP5254487B1 (ja) 携帯情報端末、シャドー音声管理方法及びコンピュータプログラム
JP7344649B2 (ja) 情報端末装置およびプログラム
US20150364122A1 (en) Music Note Indicating Method And System For Electronic Piano, Mobile Terminal And Electronic Piano
JP6267819B1 (ja) 授業システム、授業サーバ、授業支援方法、及び授業支援プログラム
CN107274919A (zh) 使用高保真混放器的高保真双音频播放装置及其播放方法
JP2008032786A (ja) 語学学習システム及び語学学習システム用プログラム
JP2018097239A (ja) 音声再生装置及びプログラム
JP2015025873A (ja) 情報処理装置、情報処理方法及びプログラム
US11887569B2 (en) Performance system, performance mode setting method, and performance mode setting device
JP4282343B2 (ja) 情報管理装置、情報管理システム、及びプログラム
JP2018165978A (ja) 授業システム、授業サーバ、授業支援方法、及び授業支援プログラム
TW200945280A (en) Oral testing system
KR102190901B1 (ko) 가상현실을 이용한 발표 훈련 시스템
JP2003058148A (ja) 書面表示装置
JP4787875B2 (ja) 情報管理装置およびプログラム
JP2020187203A (ja) 情報処理装置、情報処理方法及びプログラム
JP2017070370A (ja) 聴力検査装置、聴力検査方法および聴力検査プログラム
RU42905U1 (ru) Система для обнаружения эмоций
Fencott et al. Audio delivery and territoriality in collaborative digital musical interaction
US11562663B1 (en) Production and presentation of aural cloze material
JP7225955B2 (ja) 電子機器、機能選択方法およびプログラム
JP7379808B2 (ja) 録音装置
JP2007178641A (ja) 教育用サーバ、端末装置、教育システム、進捗管理方法、進捗管理プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190225

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230904

R150 Certificate of patent or registration of utility model

Ref document number: 7344649

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150