JP2015102955A - 情報処理装置、サーバ、情報処理方法及びプログラム - Google Patents

情報処理装置、サーバ、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2015102955A
JP2015102955A JP2013242023A JP2013242023A JP2015102955A JP 2015102955 A JP2015102955 A JP 2015102955A JP 2013242023 A JP2013242023 A JP 2013242023A JP 2013242023 A JP2013242023 A JP 2013242023A JP 2015102955 A JP2015102955 A JP 2015102955A
Authority
JP
Japan
Prior art keywords
voice
calculation
information processing
calculation formula
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013242023A
Other languages
English (en)
Inventor
昌明 遠藤
Masaaki Endo
昌明 遠藤
清幸 鈴木
Kiyoyuki Suzuki
清幸 鈴木
雅巳 中村
Masami Nakamura
雅巳 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CAREER & BRIDGE Inc
Advanced Media Inc
Original Assignee
CAREER & BRIDGE Inc
Advanced Media Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CAREER & BRIDGE Inc, Advanced Media Inc filed Critical CAREER & BRIDGE Inc
Priority to JP2013242023A priority Critical patent/JP2015102955A/ja
Publication of JP2015102955A publication Critical patent/JP2015102955A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】電子化されていない数値の計算をより正確かつ効率的に行うこと。【解決手段】情報処理装置1は、音声認識部51と、計算式生成部52と、数値計算部53とを備える。音声認識部51は、数値計算に関する音声の入力に対して音声認識処理を実行する。計算式生成部52は、音声認識部51による音声の認識結果に基づいて、入力された音声に対応する計算式を生成する。数値計算部53は、計算式生成部52によって生成された計算式に基づいて、数値計算を実行する。【選択図】図2

Description

本発明は、情報処理装置、サーバ、情報処理方法及びプログラムに関する。
従来より、紙媒体の帳票等に記入された数値の計算を行う場合、オペレータが、電卓に数値を打ち込んで計算する、あるいは、表計算ソフトに数値を打ち込んで計算するといったことが行われている。
ところが、オペレータが数値を打ち込む作業においては、打ち間違い等が発生する可能性があり、正しい数値計算を行えるとは限らない。このような事態は、入力すべき数値が多数に及ぶほど発生する可能性が高くなる。
一方、帳票等に記入された数値の計算を行う技術として、例えば特許文献1に記載された技術が知られている。
特許文献1に記載された技術においては、紙媒体の帳票に記入されている数値を光学的文字読取装置によって読み取り、文字認識を行った上で、自動的に数値計算を行うこととしている。
特開平5−342401号公報
しかしながら、特許文献1に記載の技術においては、文字認識が正しく行われない可能性があり、その場合、数値計算の結果が誤ったものとなる。そのため、特許文献1に記載の技術を用いた場合、文字認識が正しく行われているか否かを改めて確認する必要がある。
このように、従来の技術においては、紙媒体の帳票等に記入された電子化されていない数値の計算を正確かつ効率的に行うことが困難であった。
本発明は、このような状況に鑑みてなされたものであり、電子化されていない数値の計算をより正確かつ効率的に行うことを目的とする。
上記目的を達成するため、本発明の一態様の情報処理装置は、
数値計算に関する音声の入力に対して音声認識処理を実行する音声認識手段と、
前記音声認識手段による音声の認識結果に基づいて、入力された音声に対応する計算式を生成する計算式生成手段と、
前記計算式生成手段によって生成された計算式に基づいて、数値計算を実行する数値計算手段と、
を備えることを特徴とする。
本発明によれば、電子化されていない数値の計算をより正確かつ効率的に行うことが可能となる。
本発明の第1実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。 情報処理装置の機能的構成のうち、読み上げ算実行処理を実行するための機能的構成を示す機能ブロック図である。 特定語データベースの内容を示す模式図である。 図2の機能構成を有する図1の情報処理装置が実行する読み上げ算実行処理の流れの一例を示すフローチャートである。 本発明を実現する情報処理システムの構成例を示す模式図である。 算盤の玉の移動と併せて、玉を移動させる指の画像を表示する場合の表示例を示す模式図である。 暗算の練習を支援する場合の情報処理装置の機能構成を示す機能ブロック図である。
以下、本発明の実施形態について、図面を用いて説明する。
[第1実施形態]
図1は、本発明の第1実施形態に係る情報処理装置1のハードウェア構成を示すブロック図である。
本実施形態において、情報処理装置1は、スマートフォンによって構成される。ただし、情報処理装置1として、音声入力が可能なPC(Personal Computer)等のコンピュータを用いることも可能である。
情報処理装置1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、タッチ操作入力部16と、表示部17と、音声入出力部18と、撮像部19、記憶部20と、通信部21と、ドライブ22と、を備えている。
CPU11は、ROM12に記録されているプログラム、又は、記憶部20からRAM13にロードされたプログラムに従って各種の処理を実行する。例えば、CPU11は、後述する読み上げ算実行処理のためのプログラム(読み上げ算実行処理プログラム)に従って、読み上げ算実行処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、タッチ操作入力部16、表示部17、音声入出力部18、撮像部19、記憶部20、通信部21、及びドライブ22が接続されている。
タッチ操作入力部16は、例えば表示部17の表示領域に積層される静電容量式又は抵抗膜式の位置入力センサにより構成され、タッチ操作がなされた位置の座標を検出する。ここで、タッチ操作とは、タッチ操作入力部16に対する物体(ユーザの指やタッチペン等)の接触又は近接の操作をいう。
表示部17は、ディスプレイにより構成され、各種画像を表示する。
即ち、本実施形態では、タッチ操作入力部16と表示部17とにより、タッチパネルが構成されている。
音声入出力部18は、例えばマイクロフォンを備え、入力された音声をアナログ電気信号に変換する。
なお、音声のアナログ信号は、A/D変換処理が施されて、音声データを表すデジタル信号に変換される。このA/D変換処理の実行主体は、特に限定されず、CPU11であってもよいし、図示せぬ専用のハードウェアであってもよいが、本実施形態では説明の便宜上、音声入出力部18であるものとする。
即ち、本実施形態では、音声入出力部18は、入力された音声に基づく音声データをCPU11等に出力する。
また、音声入出力部18は、例えばスピーカを備え、音声のアナログ信号を音声として出力する。なお、音声のアナログ信号は音声データを表すデジタル信号を基に生成されるが、音声データを表すデジタル信号を音声のアナログ信号に変換するD/A変換処理の実行主体は、A/D変換処理と同様に、CPU11、図示せぬ専用のハードウェアあるいは音声入出力部18のいずれであってもよい。本実施形態では、A/D変換処理と同様に、音声入出力部18がD/A変換処理を実行するものとする。
撮像部19は、図示はしないが、光学レンズ部と、イメージセンサと、を備えている。
光学レンズ部は、被写体を撮影するために、光を集光するレンズ、例えばフォーカスレンズ等で構成される。なお、フォーカスレンズの他、焦点距離を一定の範囲で自在に変化させるズームレンズを光学レンズ部に備えることとしてもよい。
光学レンズ部にはまた、必要に応じて、焦点、露出、ホワイトバランス等の設定パラメータを調整する周辺回路が設けられる。
イメージセンサは、光電変換素子や、AFE(Analog Front End)等から構成される。
光電変換素子は、例えばCMOS(Complementary Metal Oxide Semiconductor)型の光電変換素子等から構成される。本実施形態においては撮像素子には、Bayer配列の色フィルタが装着されている。撮像素子は、一定時間毎に、その間に入射されて蓄積された被写体像の光信号を光電変換(撮像)して、その結果得られるアナログの電気信号をAFEに順次供給する。
AFEは、このアナログの電気信号に対して、A/D(Analog/Digital)変換処理等の各種信号処理を実行する。各種信号処理によって、デジタル信号が生成され、撮像部19の出力信号として出力される。撮像部19の出力信号によって示される画像のデータを、以下、適宜「撮像画像データ」と呼ぶ。撮像画像データは、CPU11の指示に従って、RAM13あるいは記憶部20に記憶される。
記憶部20は、DRAM(Dynamic Random Access Memory)等の記憶装置で構成され、各種データを記憶する。
通信部21は、ネットワークを介して他の装置との間で行う通信を制御する。
ドライブ22には、必要に応じて、リムーバブルメディア31が適宜装着される。ドライブ22によってリムーバブルメディア31から読み出されたプログラムは、必要に応じて記憶部20にインストールされる。また、リムーバブルメディア31は、記憶部20に記憶されている各種データも、記憶部20と同様に記憶することができる。
なお、情報処理装置1には、上述のハードウェア以外のハードウェアを適宜備えることが可能であり、例えば、スピーカを含む音声出力部や、音声認識処理用のプロセッサ等を備えることができる。
図2は、このような情報処理装置1の機能的構成のうち、読み上げ算実行処理を実行するための機能的構成を示す機能ブロック図である。
読み上げ算実行処理とは、読み上げ算の形式で読み上げられた数値計算に関する音声を認識し、音声が表す数値計算を実行して計算結果を得るまでの一連の処理である。
読み上げ算実行処理が実行される場合、CPU11においては、図2に示すように、音声認識部51と、計算式生成部52と、数値計算部53と、算盤画像表示制御部54とが機能する。
この場合、記憶部20の一領域として設けられた特定語記憶部91と、算盤画像記憶部92とが用いられる。
特定語記憶部91においては、読み上げ算で用いられる特定の用語と、その特定の用語の意味とが対応付けられた特定語データベースが記憶されている。
算盤画像記憶部92においては、計算時の算盤を表現するための要素となる画像が記憶されている。具体的には、算盤画像記憶部92には、要素となる画像として、けたの画像、玉の画像、はりの画像及び枠の画像が記憶されている。計算時の算盤の画像が生成される場合、各けたについて、0から9までの玉の配置の画像が生成され、これらの画像と枠及びはりの画像とが合成されて、算盤全体の画像とされる。
図3は、特定語データベースの内容を示す模式図である。
図3に示すように、特定語データベースには、「ねがいましては」という用語と「読み上げ算の開始」という意味とが対応付けて記憶されている。同様に、特定語データベースには、「なり」という用語と「数値の区切り」という意味、「ひいては」という用語と「引き算」という意味、「くわえて」という用語と「足し算」という意味、「とんで」という用語と「ゼロの桁」という意味、あるいは、「では」という用語と「合計」という意味とが対応付けて記憶されている。また、特定語データベースには、読み上げ算で用いられる特有の数字の読み方(例えば、数字の「2」を「に」ではなく「ふた」と読む読み方)の用語(「20」を表す「ふたじゅう」等)とその意味とが対応付けて記憶されている。なお、特定語データベースには、上述の例の他、ユーザが定義した用語とその意味とを任意に記憶しておくことが可能である。
音声認識部51は、音声入出力部18から入力された音声データに基づいて、音声認識を行い、音声に対応するテキストデータを生成する。具体的には、音声認識部51は、音声入出力部18から入力された音声データに対して、音響モデル及び言語モデルに基づく解析を行い、音声をテキストデータに変換する。
計算式生成部52は、音声認識部51によって生成されたテキストデータを解析し、そのテキストデータに対応する計算式を生成する。具体的には、計算式生成部52は、特定語記憶部91に記憶されている特定語データベースを参照し、音声認識部51によって生成されたテキストデータに含まれる特定の用語を検出する。そして、計算式生成部52は、テキストデータに含まれる特定の用語の意味に応じて、計算式を生成する。
例えば、計算式生成部52は、「ねがいましては、ふたひゃくごじゅうえんなり、ひいては、ひゃくさんじゅうえんなり、くわえて、せんとんでごじゅうごえんでは。」というテキストデータが入力された場合、特定語データベースを参照して、「ねがいましては」、「ふたひゃく」、「なり」、「ひいては」、「くわえて」、「とんで」、「では」という特定の用語を検出する。そして、計算式生成部52は、特定語データベースを参照して、これらの用語の意味を判定する。その結果、計算式生成部52は、「250円−130円+1050円=」という計算式を生成する。
なお、計算式生成部52は、読み上げ算で用いられる特定の用語以外については、一般の単語として解析を行う。
例えば、計算式生成部52は、「ふたひゃく」等の用語が「ふた」ではなく一般の読み方である「に」と読まれた場合には、「に」を「2」と判定する。即ち、「にひゃく」というテキストデータであれば、その意味を「200」と判定する。
また、読み上げ算の読み上げ方式として、「とんで」を省略する場合等もあり、このような場合には、計算式生成部52は、引き続く単語が解析されることに対応して、桁にゼロを挿入する等、音声に対応した計算式となるよう処理を実行する。
即ち、計算式生成部52は、種々の読み上げ方式に対応してテキストデータを解析し、計算式を生成する。
数値計算部53は、計算式生成部52によって生成された計算式を実行し、合計値を算出する。このとき、数値計算部53は、計算式を1項ずつ実行し、その実行結果を算盤画像表示制御部54に順次出力する。なお、「1項」とは、計算式において「+」や「−」等の算術記号で区切られた各数値である。
算盤画像表示制御部54は、数値計算部53から入力された計算式の実行結果を示す算盤の画像を生成し、表示部17に表示させる。具体的には、算盤画像表示制御部54は、数値計算部53から順次入力される計算式の1項ずつの実行結果について、実行結果を示す算盤の画像を生成し、表示部17に順次表示させる。このとき、算盤画像表示制御部54は、算盤画像記憶部92から要素となる画像を読み出し、各けたについて、0から9までの玉の配置の画像を生成し、さらに、これらの画像と枠及びはりの画像とを合成して、算盤全体の画像を生成する。
また、算盤画像表示制御部54は、計算式における1項ずつの実行結果を示す算盤の画像を表示する場合、実際に算盤で計算する際の玉の運びに倣って、玉を移動させるアニメーションを表示する。なお、本実施形態においては、算盤画像表示制御部54は、計算式の実行結果を算盤の画像として表示することに加え、数値によって表示するものとする。
ここで、算盤画像表示制御部54は、音声認識部51によって認識された音声のテキストデータを参照し、1項ずつの実行結果を各桁の算盤の玉を移動させるアニメーションとして表示することが可能である。例えば、「ふたひゃくごじゅうえんなり」という1項であれば、「ふたひゃく」の部分に対応して百の位の桁の玉(一だま2つ)を移動させるアニメーションを表示し、「ごじゅう」の部分に対応して十の位の桁の玉(五だま1つ)を移動させるアニメーションを表示することができる。
ただし、万以上の単位の計算の場合、「まん」の音声を認識するまでアニメーションを表示することができないため、算盤画像表示制御部54は、「まん」という音声が認識された後に、算盤の玉を移動させるアニメーションを表示する。例えば、「ごひゃくさんじゅうろくまんとんでふたひゃくごじゅうえんなり」の音声が読み上げられた場合、算盤画像表示制御部54は、「ごひゃくさんじゅうろくまん」の音声が認識された後に、百万の位の桁の玉(五だま1つ)を移動させるアニメーションを表示し、十万の位の桁の玉(一だま3つ)を移動させるアニメーションを表示し、一万の位の桁の玉(一だま1つと五だま1つ)を移動させるアニメーションを表示することができる。続いて、算盤画像表示制御部54は、「ふたひゃく」の音声が認識された後に、百の位の桁の玉(一だま2つ)を移動させるアニメーションを表示し、「ごじゅう」の音声が認識された後に、十の位の桁の玉(五だま1つ)を移動させるアニメーションを表示することができる。
このような表示形態とすることで、より具体的な算盤の玉の運びを表示することができる。
次に、図4のフローチャートを参照して、図2の機能的構成を有する図1の情報処理装置1が実行する読み上げ算実行処理について説明する。
図4は、図2の機能構成を有する図1の情報処理装置1が実行する読み上げ算実行処理の流れの一例を示すフローチャートである。
読み上げ算実行処理は、タッチ操作入力部16を介して読み上げ算実行処理の開始が指示入力されることに対応して実行される。
ステップS1において、音声認識部51は、音声入出力部18を介して音声の入力を受け付ける待機状態となる。
ステップS2において、音声認識部51は、音声入出力部18から入力された音声データに基づいて、音声認識を行い、音声に対応するテキストデータを生成する。
ステップS3において、計算式生成部52は、音声認識部51によって生成されたテキストデータを解析し、そのテキストデータに対応する計算式を生成する。
ステップS4において、数値計算部53は、計算式生成部52によって生成された計算式を1項ずつ実行する。
ステップS5において、算盤画像表示制御部54は、数値計算部53によって算出された計算式の1項ずつの実行結果について、実行結果を示す算盤の画像を生成する。
ステップS6において、算盤画像表示制御部54は、計算式における1項ずつの実行結果を示す算盤の画像を、実際に算盤で計算する際の玉の運びに倣って、玉を移動させるアニメーションによって表示部17に表示させる。このとき、算盤画像表示制御部54は、計算式の実行結果を数値によって併せて表示させる。
ステップS7において、数値計算部53は、計算式のすべての項の実行が完了したか否かの判定を行う。
計算式のすべての項の実行が完了した場合、ステップS7においてYESと判定されて、読み上げ算実行処理は終了となる。
これに対し、計算式のすべての項の実行が完了していない場合、ステップS7においてNOと判定されて、処理はステップS4に移行する。
このような処理により、読み上げ算の形式で読み上げられた数値計算に関する音声を認識し、音声が表す数値計算を実行して、その計算結果を算盤の玉の移動を表すアニメーション及び数値によって表示することができる。
そのため、誤りが発生しにくい読み上げ算の形式で数値を入力することができると共に、その計算過程を算盤の画像及び数値で順次表示しながら、読み上げ算によって示される計算を行うことができる。
したがって、電子化されていない数値の計算をより正確かつ効率的に行うことが可能となる。
また、算盤の経験者が暗算を行う際は、頭の中で算盤の玉を弾きながら素早く正確に暗算を行っている。このような能力は、実際に算盤を経験することで培われるが、上述のように、読み上げ算の音声と、それに連動した算盤の玉の動きを画面上に表示することで、視覚的に算盤の操作を習得しつつ、暗算の訓練を効率的に行うことができる。
また、情報処理装置1をスマートフォンのような携帯端末として実現することで、実際に算盤を使用しなくても、仮想的に算盤の訓練を行うことができるので、電車の中等、種々の場所で手軽に訓練することが可能となる。
[応用例1]
上記実施形態において、本発明を情報処理装置1単体で実現することとして説明したが、情報処理装置1の機能を複数の装置に分散し、これらが連携するシステムによって、本発明を実現することもできる。
例えば、図2における情報処理装置1の機能のうち、音声認識部51、計算式生成部52及び特定語データベースの機能をネットワークを介して情報処理装置1と通信可能に構成されたサーバに移譲し、本発明を情報処理システムとして実現することができる。
図5は、本発明を実現する情報処理システム100の構成例を示す模式図である。
図5に示す情報処理システム100の場合、情報処理装置1の音声入出力部18に入力された読み上げ算の音声が音声データとされ、ネットワークNを介してサーバSに送信される。
サーバSでは、情報処理装置1から送信された音声データに基づいて、音声認識部51が音声認識を行い、音声に対応するテキストデータを生成する。さらに、計算式生成部52が、音声認識部51によって生成されたテキストデータを解析し、そのテキストデータに対応する計算式を生成する。
このように生成された計算式のデータが、サーバSの送信部Cによって情報処理装置1に送信され、情報処理装置1において、数値計算部53が計算式を実行し、合計値を算出する。
以後、第1実施形態と同様に、算盤画像表示制御部54が、数値計算部53から入力された計算式の実行結果を示す算盤の画像を生成し、表示部17に表示させる。
このような構成により、処理負荷が比較的大きい音声認識に関わる機能をサーバS側で負担することができ、処理能力が比較的低い情報処理装置1を用いた場合であっても、本発明を実現することが可能となる。
なお、図5に示す情報処理システム100において、音声認識部51のみをサーバSに移譲し、計算式生成部52及び特定語データベースを情報処理装置1に備える構成とすることも可能である。
この場合、サーバSとして、ネットワークを介して受信した音声データを基に音声認識のサービスを提供する汎用のサーバを利用することができる。
[応用例2]
上記実施形態において、算盤画像表示制御部54は、数値計算部53から入力される計算式の1項ずつの実行結果を算盤の玉を移動させるアニメーションによって表示するものとして説明した。
このような表示を行う場合に、算盤の玉の移動と併せて、玉を移動させる指の画像を表示させることとしてもよい。
図6は、算盤の玉の移動と併せて、玉を移動させる指Fの画像を表示する場合の表示例を示す模式図である。
図6に示すように、算盤において計算式の実行結果を表す玉の移動に重ねて、玉を移動させる手(指F)の画像が透過的に表示されている。
このように指Fの画像を表示することで、計算の際に、算盤の玉をどのように弾けばよいかを容易に認識することができるため、算盤の操作を効果的に習得することが可能となる。
[応用例3]
上記実施形態において、算盤画像表示制御部54は、数値計算部53から入力される計算式の1項ずつの実行結果を算盤の玉を移動させるアニメーションによって表示するものとして説明した。
これに対し、計算式の実行結果を表示する場合に、玉を点滅させる、あるいは、色を変化させる等の形態で、移動される算盤の玉を識別して表示することとしてもよい。
このような表示形態とすることにより、いずれの玉が移動されるかが容易に把握できるため、計算の際に、算盤の玉をどのように弾けばよいかを容易に認識することができ、算盤の操作を効果的に習得することが可能となる。
[応用例4]
上記実施形態において、ユーザが読み上げ算を読み上げて情報処理装置1に音声を入力し、音声に対応する計算を情報処理装置1が行うこととした。
これに対し、情報処理装置1の画面に計算式や計算表等の問題を表示し、画面に表示された算盤の画像をユーザがタッチ操作して、実物の算盤と同様に玉を移動させることにより、正解を導き出すこととしてもよい。なお、表示する問題として、検定試験の問題や珠算教育のための問題等を用いることができる。
この場合、音声によって計算結果を情報処理装置1に入力したり、画面における算盤の画像から情報処理装置1が計算結果を取得したりすることにより、計算結果が正解であるか否かを情報処理装置1が判定することができる。
これにより、ユーザの計算能力の向上を図ることができる。
[応用例5]
上記実施形態において、情報処理装置1の撮像機能を利用して、音声認識による数値計算の結果を検証することとしてもよい。
この場合、例えば、読み上げ算の対象となった帳票の画像を撮像部19によって撮影し、文字認識することでテキストデータとする。そして、読み上げ算によって音声入力された内容のテキストデータと、文字認識によって得られたテキストデータとを比較し、計算の要素となった数値に相違があるか否かを判定することにより、計算結果を検証することができる。
これにより、音声認識による数値計算の結果を簡単に検証することが可能となる。
[応用例6]
上記実施形態において、情報処理装置1の音声出力機能及び算盤画像表示機能を利用して、暗算の練習を支援することとしてもよい。
図7は、暗算の練習を支援する場合の情報処理装置1の機能構成を示す機能ブロック図である。
図7において、情報処理装置1は、図2に示す第1実施形態の機能構成に対して、音声再生部55及び音声記憶部93が追加された機能構成となっている。
音声記憶部93は、記憶部20の一領域として設けられ、音声入出力部18を介して入力された読み上げ算の音声データや、予め他の装置で録音された読み上げ算の音声データを記憶している。
音声再生部55は、暗算の練習の支援を行う場合に、音声記憶部93に記憶されている音声データを読み出し、読み出した音声データが表す音声を音声入出力部18から出力させて再生する。
音声再生部55によって再生される音声データは、音声認識部51に併せて入力され、この音声データを対象として、図4に示す読み上げ算実行処理が実行される。
そして、読み上げ算実行処理において、算盤画像表示制御部54が、音声再生部55による音声の再生とタイミングを合わせて、1項ずつの計算式の実行結果を各桁の算盤の玉を移動させるアニメーションによって表示する。
これにより、学習者である情報処理装置1のユーザは、読み上げ算の音声を聞きながら、算盤のアニメーションを確認しつつ、暗算の練習を行うことができる。
なお、本応用例において、時間軸上の音声再生位置(音声の再生タイミング)と算盤の玉の動きのアニメーションとを関連付けて記憶部20に記憶しておき、以降、音声認識を実行することなく、音声を再生しながら算盤の玉を移動させるアニメーションを表示することも可能である。
以上説明したように、本実施形態に係る情報処理装置1は、音声認識部51と、計算式生成部52と、数値計算部53とを備える。
音声認識部51は、数値計算に関する音声の入力に対して音声認識処理を実行する。
計算式生成部52は、音声認識部51による音声の認識結果に基づいて、入力された音声に対応する計算式を生成する。
数値計算部53は、計算式生成部52によって生成された計算式に基づいて、数値計算を実行する。
これにより、読み上げ算の音声等、数値計算に関する音声を認識し、音声が表す数値計算を実行することができる。
そのため、誤りが発生しにくい音声による入力を用いて、数値を入力することができる。
したがって、電子化されていない数値の計算をより正確かつ効率的に行うことが可能となる。
また、情報処理装置1は、算盤画像表示制御部54を備える。
算盤画像表示制御部54は、数値計算部53による数値計算の過程を算盤における計算の過程を示す画像によって表示するための制御を行う。
これにより、計算結果を算盤の玉の移動によって表示することができる。
そのため、計算過程を算盤の画像で表示しながら、数値計算に関する音声に対応する計算を行うことができる。
したがって、電子化されていない数値の計算をより正確かつ効率的に行うことが可能となる。
また、数値計算に関する音声と、それに連動した算盤の玉の動きを画面上に表示することで、視覚的に算盤の操作を習得しつつ、暗算の訓練を効率的に行うことができる。
また、算盤画像表示制御部54は、算盤における計算の過程を示す画像において、算盤の玉を移動させるアニメーションを表示させる。
これにより、計算の過程における算盤の玉の状態をよりわかりやすく表示できる。
また、算盤画像表示制御部54は、算盤における計算の過程を示す画像において、移動される玉を識別して表示させる。
これにより、いずれの玉が移動されるかが容易に把握できるため、計算の際に、算盤の玉をどのように弾けばよいかを容易に認識することができ、算盤の操作を効果的に習得することが可能となる。
また、算盤画像表示制御部54は、算盤における計算の過程を示す画像において、玉を移動させる指の画像を併せて表示させる。
これにより、計算の際に、算盤の玉をどのように弾けばよいかを容易に認識することができるため、算盤の操作を効果的に習得することが可能となる。
また、情報処理装置1は、音声再生部55を備える。
音声再生部55は、予め記憶された数値計算に関する音声を再生する。
算盤画像表示制御部54は、音声再生手段によって再生される音声と対応して、算盤における計算の過程を示す画像を表示するための表示制御を行う。
これにより、ユーザは、読み上げ算の音声を聞きながら、算盤における計算の過程を示す画像を確認しつつ、暗算の練習を行うことができる。
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
例えば、上記実施形態においては、音声入力の対象として、読み上げ算を例に挙げて説明したが、これに限られない。
即ち、本発明における音声入力の対象を読み上げ算以外とすることができる。例えば、筆算や分数を音声によって読み上げ、読み上げられた音声を解析することにより、計算式を生成して、数値計算を行うことができる。
また、上述の実施形態及び各応用例として説明した構成を適宜組み合わせることも可能である。
また、上述の実施形態では、本発明が適用される情報処理装置として、スマートフォンあるいはPCを例として説明したが、特にこれに限定されない。
例えば、本発明は、音声入力を受け付け可能な電子機器一般に適用することができる。具体的には、本発明は、携帯型ナビゲーション装置、携帯電話機、ポータブルゲーム、デジタルカメラ、プリンタ、テレビジョン受像機、ビデオカメラ等に適用可能である。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、図2の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が情報処理装置1に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図2の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図2のリムーバブルメディア31により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディア31は、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk−Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini−Disk)等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図2のROM12や、図2の記憶部20に含まれるDRAM等で構成される。
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。
1・・・情報処理装置,11・・・CPU,12・・・ROM,13・・・RAM,14・・・バス,15・・・入出力インターフェース,16・・・タッチ操作入力部、17・・・表示部、18・・・音声入出力部、19・・・撮像部,20・・・記憶部,21・・・通信部,22・・・ドライブ,31・・・リムーバブルメディア,51・・・音声認識部,52・・・計算式生成部、53・・・数値計算部、54・・・算盤画像表示制御部,55・・・音声再生部,91・・・特定語記憶部,92・・・算盤画像記憶部,93・・・音声記憶部,S・・・サーバ,N・・・ネットワーク,C・・・送信部,F・・・指

Claims (14)

  1. 数値計算に関する音声の入力に対して音声認識処理を実行する音声認識手段と、
    前記音声認識手段による音声の認識結果に基づいて、入力された音声に対応する計算式を生成する計算式生成手段と、
    前記計算式生成手段によって生成された計算式に基づいて、数値計算を実行する数値計算手段と、
    を備える情報処理装置。
  2. 前記数値計算手段による数値計算の過程を算盤における計算の過程を示す画像によって表示するための制御を行う算盤画像表示制御手段を備える請求項1に記載の情報処理装置。
  3. 前記算盤画像表示制御手段は、前記算盤における計算の過程を示す画像において、算盤の玉を移動させるアニメーションを表示させる請求項2に記載の情報処理装置。
  4. 前記算盤画像表示制御手段は、前記算盤における計算の過程を示す画像において、移動される玉を識別して表示させる請求項2又は3に記載の情報処理装置。
  5. 前記算盤画像表示制御手段は、前記算盤における計算の過程を示す画像において、玉を移動させる指の画像を併せて表示させる請求項2から4のいずれか1項に記載の情報処理装置。
  6. 予め記憶された前記数値計算に関する音声を再生する音声再生手段を備え、
    前記算盤画像表示制御手段は、前記音声再生手段によって再生される音声と対応して、前記算盤における計算の過程を示す画像を表示するための表示制御を行う請求項2から5のいずれか1項に記載の情報処理装置。
  7. 数値計算に関する音声の入力に応じて、音声認識処理を実行するサーバに前記音声のデータを送信する音声入力手段と、
    前記サーバにおける音声の認識結果に基づいて生成された、入力された音声に対応する計算式に基づいて、数値計算を実行する数値計算手段と、
    を備える情報処理装置。
  8. 音声入力を受け付ける情報処理装置から、数値計算に関する音声のデータを受信して音声認識処理を実行する音声認識手段と、
    前記音声認識手段による音声の認識結果に基づいて、入力された音声に対応する計算式を生成する計算式生成手段と、
    前記計算式生成手段によって生成された計算式のデータを前記情報処理装置に送信する送信手段と、
    を備えるサーバ。
  9. 音声入力を受け付ける情報処理装置における情報処理方法であって、
    数値計算に関する音声の入力に対して音声認識処理を実行する音声認識ステップと、
    前記音声認識ステップにおける音声の認識結果に基づいて、入力された音声に対応する計算式を生成する計算式生成ステップと、
    前記計算式生成ステップにおいて生成された計算式に基づいて、数値計算を実行する数値計算ステップと、
    を含む情報処理方法。
  10. 音声入力を受け付ける情報処理装置における情報処理方法であって、
    数値計算に関する音声の入力に応じて、音声認識処理を実行するサーバに前記音声のデータを送信する音声入力ステップと、
    前記サーバにおける音声の認識結果に基づいて生成された、入力された音声に対応する計算式に基づいて、数値計算を実行する数値計算ステップと、
    を含む情報処理方法。
  11. 音声認識処理を実行可能なサーバにおける情報処理方法であって、
    音声入力機能を有する情報処理装置から、数値計算に関する音声のデータを受信して音声認識処理を実行する音声認識ステップと、
    前記音声認識ステップにおける音声の認識結果に基づいて、入力された音声に対応する計算式を生成する計算式生成ステップと、
    前記計算式生成ステップにおいて生成された計算式のデータを前記情報処理装置に送信する送信ステップと、
    を含む情報処理方法。
  12. 音声入力を受け付ける情報処理装置を構成するコンピュータに、
    数値計算に関する音声の入力に対して音声認識処理を実行する音声認識機能と、
    前記音声認識機能による音声の認識結果に基づいて、入力された音声に対応する計算式を生成する計算式生成機能と、
    前記計算式生成機能によって生成された計算式に基づいて、数値計算を実行する数値計算機能と、
    を実現させるプログラム。
  13. 音声入力を受け付ける情報処理装置を構成するコンピュータに、
    数値計算に関する音声の入力に応じて、音声認識処理を実行するサーバに前記音声のデータを送信する音声入力機能と、
    前記サーバにおける音声の認識結果に基づいて生成された、入力された音声に対応する計算式に基づいて、数値計算を実行する数値計算機能と、
    を実現させるプログラム。
  14. 音声認識処理を実行可能なサーバを構成するコンピュータに、
    音声入力を受け付ける情報処理装置から、数値計算に関する音声のデータを受信して音声認識処理を実行する音声認識機能と、
    前記音声認識機能による音声の認識結果に基づいて、入力された音声に対応する計算式を生成する計算式生成機能と、
    前記計算式生成機能によって生成された計算式のデータを前記情報処理装置に送信する送信機能と、
    を実現させるプログラム。
JP2013242023A 2013-11-22 2013-11-22 情報処理装置、サーバ、情報処理方法及びプログラム Pending JP2015102955A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013242023A JP2015102955A (ja) 2013-11-22 2013-11-22 情報処理装置、サーバ、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013242023A JP2015102955A (ja) 2013-11-22 2013-11-22 情報処理装置、サーバ、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2015102955A true JP2015102955A (ja) 2015-06-04

Family

ID=53378621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013242023A Pending JP2015102955A (ja) 2013-11-22 2013-11-22 情報処理装置、サーバ、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2015102955A (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063292A (ja) * 1996-08-13 1998-03-06 Sony Corp 音声処理装置および音声処理方法
JP2002014606A (ja) * 2000-06-29 2002-01-18 Toshibumi Yamada そろばん型入力装置と、そろばん教育装置とその記録媒体、及びそろばん教育システム
JP2002072859A (ja) * 2000-09-01 2002-03-12 Susumu Kato 暗算学習支援システム
US20080312928A1 (en) * 2007-06-12 2008-12-18 Robert Patrick Goebel Natural language speech recognition calculator
US20110151417A1 (en) * 2008-07-31 2011-06-23 Senapps Llc Computer-based abacus training system
JP2012256036A (ja) * 2011-05-14 2012-12-27 Yasushi Miyamoto そろばん学習プログラム及びそろばん学習装置
JP3181641U (ja) * 2012-12-05 2013-02-14 毅 槙坪 音声入力式計算機
JP2013228523A (ja) * 2012-04-25 2013-11-07 Casio Comput Co Ltd 数式入力装置およびプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063292A (ja) * 1996-08-13 1998-03-06 Sony Corp 音声処理装置および音声処理方法
JP2002014606A (ja) * 2000-06-29 2002-01-18 Toshibumi Yamada そろばん型入力装置と、そろばん教育装置とその記録媒体、及びそろばん教育システム
JP2002072859A (ja) * 2000-09-01 2002-03-12 Susumu Kato 暗算学習支援システム
US20080312928A1 (en) * 2007-06-12 2008-12-18 Robert Patrick Goebel Natural language speech recognition calculator
US20110151417A1 (en) * 2008-07-31 2011-06-23 Senapps Llc Computer-based abacus training system
JP2012256036A (ja) * 2011-05-14 2012-12-27 Yasushi Miyamoto そろばん学習プログラム及びそろばん学習装置
JP2013228523A (ja) * 2012-04-25 2013-11-07 Casio Comput Co Ltd 数式入力装置およびプログラム
JP3181641U (ja) * 2012-12-05 2013-02-14 毅 槙坪 音声入力式計算機

Similar Documents

Publication Publication Date Title
WO2021232775A1 (zh) 视频处理方法及装置、电子设备和存储介质
CN109614876A (zh) 关键点检测方法及装置、电子设备和存储介质
TWI643155B (zh) 認知訓練系統
JP2016118991A (ja) 画像生成装置、画像生成方法及びプログラム
WO2020155915A1 (zh) 用于播放音频的方法和装置
JP2007213282A (ja) 講演者支援装置および講演者支援方法
JP2009267621A (ja) 通信装置
JP6166831B1 (ja) 単語学習支援装置、単語学習支援プログラム、単語学習支援方法
WO2022054687A1 (ja) プログラム、情報処理装置及び情報処理方法
JP7130290B2 (ja) 情報抽出装置
JP2015102955A (ja) 情報処理装置、サーバ、情報処理方法及びプログラム
JP5573402B2 (ja) 会議支援装置、会議支援方法、会議支援プログラムおよび記録媒体
JP6836877B2 (ja) 吹奏楽器の練習支援装置及び練習支援方法
CN114830208A (zh) 信息处理装置、信息处理方法和程序
JP2023046127A (ja) 発話認識システム、通信システム、発話認識装置、移動体制御システム、発話認識方法及びプログラム
JP6199598B2 (ja) 技能習得装置、技能習得プログラム、技能習得方法
JP6637917B2 (ja) 教育支援システムおよび教育支援方法
KR20110065276A (ko) 비교 영상을 이용한 발음 학습 방법 및 장치
WO2019146199A1 (ja) 情報処理装置、及び情報処理方法
JP2017049537A (ja) 操作装置、訂正方法およびプログラム
JP2017009875A (ja) 学習支援装置およびプログラム
WO2022054675A1 (ja) プログラム、情報処理装置及び情報処理方法
JP2021058231A (ja) 認知機能推定方法、コンピュータプログラム及び認知機能推定装置
TWI792444B (zh) 攝像頭的控制方法、裝置、介質和電子設備
TWI470589B (zh) 雲端數位語音教學錄音系統

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20161026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170829

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180306