以下、本発明による送金処理装置について、実施の形態を用いて説明する。なお、以下の実施の形態において、同じ符号を付した構成要素及びステップは同一または相当するものであり、再度の説明を省略することがある。本実施の形態による送金処理装置は、2以上のユーザによる送金の口約束の会話に応じて送金処理を行うものである。
図1は、本実施の形態による送金処理装置1の構成を示すブロック図である。本実施の形態による送金処理装置1は、口約束の会話に応じて送金処理を行うものであり、音声受付部11と、音声認識部12と、音声認識結果受付部13と、受付部14と、取引情報取得部15と、記憶部16と、判断部17と、判断結果出力部18と、確認出力部19と、指示受付部20と、送金処理部21と、通知部22とを備える。なお、送金処理装置1は、ユーザが携帯可能な端末装置であってもよく、または、その端末装置と通信可能なサーバであってもよい。端末装置は、例えば、スマートフォンやタブレット、PDA(Personal Digital Assistant)等であってもよい。本実施の形態では、送金処理装置1がサーバである場合について主に説明し、送金処理装置1が端末装置である場合については後述する。なお、送金処理は、例えば、銀行振り込みであってもよく、電子マネーを送金先のユーザのアカウントに払い込むことであってもよく、その他の方法によって金銭を送ることであってもよい。
ここで、送金処理装置1と端末装置2との通信形態について、図3A~図3Dを参照しながら説明する。図3Aでは、ユーザA,Bは、送金処理装置1を介して通話を行っている。この場合には、送金処理装置1において、送信元に応じて話者区別を行うことができ、また、送信元の電話番号やアドレス等を用いて話者識別を行うこともできる。その話者識別では、例えば、端末装置2の所有者が話者であるとみなしてもよい。
図3Bでは、ユーザA,Bは、送金処理装置1を介さないで通話を行っており、少なくとも一方の端末装置2から送金処理装置1に通話の音声が送信される。なお、各端末装置2から送金処理装置1に通話の音声が送信されてもよい。各端末装置2から音声が送信される場合には、図3Aと同様に、送金処理装置1において、話者区別や話者識別を行うことができる。また、各端末装置2から音声が送信される場合には、例えば、各端末装置2のマイクロフォンで集音された音声のみが送金処理装置1に送信されてもよく、通話相手の音声も一緒に送信されてもよい。また、1個の端末装置2から通話の音声が送金処理装置1に送信される場合には、話者区別や話者識別の行われた状態で送信されてもよく、または、そうでなくてもよい。話者区別は、例えば、マイクロフォンで集音された音声と、受信した音声とを区別することによって行うことができる。また、話者識別は、例えば、マイクロフォンで集音された音声は、自端末装置2の所有者の音声であり、受信した音声は、その音声の送信元の端末装置2の所有者の音声であるとみなすことによって行われてもよい。
図3Cでは、ユーザA,Bは、端末装置2を介さないで会話しており、その会話の音声が1個の端末装置2から送金処理装置1に送信される。この場合には、図3Aや図3Bのように話者区別や話者識別を行うことはできない。一方、マイクロフォンで集音された音声に対する音声処理として、話者区別が行われてもよく、後述するユーザ識別部31と同様の方法によって話者識別が行われてもよい。したがって、送金処理装置1に送信される会話の音声では、話者区別や話者識別が行われていてもよく、または、そうでなくてもよい。
図3Dでは、ユーザA,Bは、端末装置2を介さないで会話しているが、各ユーザの音声は、それぞれのユーザの端末装置2から送金処理装置1に送信される。この場合には、図3Aと同様に、送金処理装置1において、送信元に応じて話者区別を行うことができ、また、送信元に応じて話者識別を行うこともできる。その話者識別において、例えば、端末装置2の所有者が話者であるとみなしてもよいことは図3Aの場合と同様である。
話者区別が行われた状態で音声が送信される場合には、例えば、発話ごとに話者を区別可能な情報(例えば、発呼側、着呼側や、第1の話者、第2の話者など)も一緒に送信されてもよい。また、話者識別が行われた状態で音声が送信される場合には、例えば、発話ごとに話者を識別可能な情報(例えば、話者の電話番号やユーザ識別子など)も一緒に送信されてもよい。ここで、話者区別(speaker diarisation)とは、複数人の会話において、各人がどの発言をしたのかを区別することである。したがって、話者区別の行われた状態では、何人の話者が発言したのかを知ることができ、また、ある発言の話者の別の発言がどれであるのかを特定することもできるが、ある話者が誰であるのかを知ることはできない。話者識別(speaker identification)とは、話者区別に加えて、話者が誰であるのかも知ることができる状態であるとする。そのため、話者識別が行われた状態では、各発言が誰によって行われたのかを知ることができることになる。話者区別が行われている状態は、発話の区分けと、発話に関する話者ごとのクラスタリングとが行われている状態であると考えることもできる。話者区別や話者識別が行われた状態で通話の音声が送信される際には、例えば、話者ごとのチャネルで音声信号が送信されてもよく、または、話者ごとにラベルの付与された音声信号が送信されてもよい。
図3A~図3Dにおける通話や通信は、例えば、公衆電話回線網を介して行われてもよく、または、インターネットやイントラネット等のネットワークを介して行われてもよい。ネットワークを介した通話は、例えば、SIP(Session Initiation Protocol)などを用いたVoIP(Voice over Internet Protocol)等によって行われてもよく、通話が行われる方式は問わない。また、図3A~図3Dでは、1対1で通話や会話が行われる場合について示しているが、通話や会話は、3人以上によって行われてもよい。3人以上で行われる通話は、いわゆるグループ通話であってもよい。また、図3A~図3D以外の方法によって、送金の口約束に関する通話や会話、通信等が行われてもよいことは言うまでもない。
なお、図3Dの場合には、送金処理装置1は、複数のユーザが会話を行っているのかどうかを判断し、会話を行っていることが確認できたときに、送金処理を行うようにしてもよい。例えば、図3Dにおいて、各端末装置2から現在位置も送金処理装置1に送信され、各端末装置2の現在位置が近傍である場合、具体的には、各端末装置2の現在位置間の距離が所定の閾値より短い場合に、送金処理装置1は、複数のユーザが会話を行っていると判断してもよい。また、例えば、各端末装置2から送信される音声に含まれるノイズが一致している場合に、送金処理装置1は、複数のユーザが会話を行っていると判断してもよい。なお、ノイズが一致しているとは、例えば、複数の端末装置2から送信された音声の各ノイズが完全に一致していることであってもよく、各ノイズの類似度が所定の閾値より大きいことであってもよい。
音声受付部11は、2以上のユーザによる送金取引の口約束の会話に応じた音声を受け付ける。音声受付部11は、その会話を行っている2以上のユーザの音声をそれぞれ受け付けてもよい。したがって、送金者の音声と受取人の音声とのそれぞれが受け付けられてもよい。送金処理装置1がサーバである場合には、音声受付部11は、通常、公衆電話回線網やインターネットなどを介してユーザの音声の信号を受け付ける。上記のように、音声受付部11は、話者区別や話者識別の行われた音声を受け付けてもよく、または、そうでない音声を受け付けてもよい。また、音声受付部11によって受け付けられた音声に対して、例えば図3A等のように、送信元を用いた話者区別や話者識別を行うことができることもある。そのような場合には、送金処理装置1において、送信元を用いた話者区別や話者識別が行われてもよい。その話者区別等は、例えば、取引情報取得部15によって行われてもよい。また、音声受付部11によって、話者区別や話者識別の行われていない音声が受け付けられ、その音声に対して送信元を用いた話者区別や話者識別を行うことができない場合であっても、音声に対する音声処理として、話者区別や話者識別が行われてもよい。送金処理装置1において行われる、音声処理としての話者識別については、図8を用いて後述する。
音声受付部11は、例えば、マイクロフォン等のデバイスを介して入力された音声を受け付けてもよく、有線または無線の通信回線を介して送信された音声を受信してもよい。なお、送金処理装置1がサーバである場合には、通常、この受け付けは端末装置2からの音声の受信であるとする。なお、音声受付部11は、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよく、または含まなくてもよい。また、音声受付部11は、ハードウェアによって実現されてもよく、または所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
音声認識部12は、音声受付部11によって受け付けられたユーザの音声に対して音声認識処理を行い、音声認識結果を取得する。音声認識処理は公知であり、その詳細な説明を省略する。なお、音声認識結果は、通常、音声に対応するテキストデータである。音声認識結果は、記録媒体等を介して音声認識結果受付部13に渡されてもよい。また、話者区別や話者識別のなされた音声に対して音声認識処理が行われた場合には、音声認識結果においても話者区別や話者識別が可能となる。
音声認識結果受付部13は、音声認識部12によって取得された、2以上のユーザによる送金取引の口約束の会話に応じた音声認識結果を受け付ける。この音声認識結果は、上記のとおり、話者区別や話者識別が行われている場合と、そうでない場合とがある。また、通常、音声認識結果受付部13は、送金者の音声の音声認識結果と、受取人の音声の音声認識結果とを受け付けることになる。音声認識結果受付部13は、例えば、記録媒体等からの読み出しによって音声認識結果を受け付けてもよい。
受付部14は、後述する取引情報に必要な情報である追加情報を受け付けてもよい。また、受付部14は、追加情報以外を受け付けてもよい。受付部14は、例えば、入力デバイス(例えば、キーボードやマウス、タッチパネルなど)から入力された情報を受け付けてもよく、有線または無線の通信回線を介して送信された情報を受信してもよく、所定の記録媒体(例えば、光ディスクや磁気ディスク、半導体メモリなど)から読み出された情報を受け付けてもよい。なお、送金処理装置1がサーバである場合には、通常、この受け付けは端末装置2からの受信であるとする。なお、受付部14は、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよく、または含まなくてもよい。また、受付部14は、ハードウェアによって実現されてもよく、または所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
取引情報取得部15は、音声認識結果受付部13によって受け付けられた音声認識結果を少なくとも用いて、送金取引に関する情報である取引情報を取得する。取引情報は、送金するユーザを識別する送金者識別子、送金を受け取るユーザを識別する受取人識別子、及び送金金額を含む情報である。したがって、取引情報取得部15は、それらの情報を、音声認識結果等を用いて取得する。また、取引情報は、送金処理の行われる時点を示す送金時点を含んでいてもよい。その送金時点は、例えば、送金処理の行われる時点を示す年月日であってもよく、さらに時刻も含んでいてもよい。本実施の形態では、取引情報に送金時点も含まれる場合について主に説明する。音声認識結果に送信時点を示す情報が含まれている場合には、取引情報取得部15は、その送信時点を取得してもよい。また、音声認識結果に送信時点を示す情報が含まれていない場合には、取引情報取得部15は、その時点(現在の時点)を示す送信時点を、図示しないカレンダー部や時計部等を用いて取得してもよい。
取引情報取得部15による取引情報の取得は、あらかじめ決められた情報を、音声認識結果等を用いて取得することによって行われてもよい。なお、取引情報取得部15によって取得された取引情報は、送金取引が実行されるのに必要なすべての情報を含む完全な取引情報である場合と、送金取引が実行されるのに必要な情報の少なくとも一部を含んでいない不完全な取引情報である場合とがありうる。音声認識結果等から送金取引に必要なすべての情報を取得できないこともあるからである。例えば、2以上のユーザによる会話に送金金額が含まれていなかった場合には、取引情報取得部15は、ヌルの送金金額を取得することになり、取得された取引情報は、送金金額を含まない不完全なものとなる。不完全な取引情報が取得された場合には、送金取引を行うことができないこともありうる。また、取引情報取得部15は、取引情報を取得する際に、音声認識結果以外の情報を用いてもよい。例えば、取引情報取得部15は、話者区別や話者識別が行われている場合には、その話者識別や話者区別の結果をも用いてもよい。また、取引情報取得部15は、受付部14が受け付けた追加情報をも用いて取引情報を取得してもよい。例えば、取引情報取得部15は、音声認識結果を用いて取得した不完全な取引情報に、追加情報を追加することによって、完全な取引情報を取得してもよい。このように、取引情報の取得は、段階的に行われてもよい。
取引情報取得部15は、音声認識結果を用いて送金者識別子、受取人識別子、及び送金金額を取得してもよい。その際に、取引情報取得部15は、例えば、送金者の音声認識結果と、受取人の音声認識結果との両方を用いて、送金者識別子及び受取人識別子を取得してもよい。なお、音声認識結果から取引情報に含まれる情報を取得する際に、例えば、形態素解析や係り受け解析などの自然言語処理が行われてもよい。また、音声受付部11で受け付けられた音声について話者区別や話者識別が行われていない場合には、例えば、取引情報取得部15によって話者区別や話者識別が行われてもよい。
以下、音声認識結果を用いて送信者識別子等を取得する方法の一例について説明する。図4A~図4Fは、2以上のユーザの会話に対応する音声認識結果を示す図である。各図において、ユーザA,B等が明記されている場合には、少なくとも話者区別が行われているものとする。さらに、ユーザA,Bが誰であるのかが分かっているのであれば、話者識別も行われていることになる。一方、図4Dの会話のように、ユーザA,B等が明記されていない場合には、発話の区切りは特定されているが、話者区別は行われていないものとする。
まず、送金者識別子、受取人識別子を取得する方法について説明する。例えば、音声認識結果において話者識別が行われている場合には、取引情報取得部15は、音声認識結果を用いて、各話者が送金者側であるのか、受取人側であるのかをそれぞれ特定することによって、送金者識別子、及び受取人識別子を取得することができる。例えば、図4Aで示される会話において、話者識別が行われており、ユーザA,Bのユーザ識別子を特定できている場合には、取引情報取得部15は、送金する旨の動詞「送金し」を発話したユーザAが送金者側であるとし、その会話の相手方であるユーザBが受取人側であるとしてもよい。例えば、取引情報取得部15は、あらかじめ設定されている、送金する旨の動詞「送金する」「振り込む」「送る」等のいずれかの動詞を、命令形や依頼の形式でなく含んでいる発話を行ったユーザを、送金者側と判断してもよい。そして、取引情報取得部15は、ユーザAのユーザ識別子を送金者識別子として取得し、ユーザBのユーザ識別子を受取人識別子として取得してもよい。
なお、話者区別はできているが、話者識別まではできていない場合には、取引情報取得部15は、会話内容に含まれる姓名などのユーザを識別可能な情報を用いて話者識別を行ってもよい。例えば、図4Bで示される会話において、話者区別は行われているが、ユーザA,Bが誰であるのかは分かっておらず、話者識別はできていなかったとする。すると、取引情報取得部15は、会話内容に関する形態素解析の結果を用いて、会話に含まれる姓名「山田太郎」「木村一郎」と、その姓名に対する名詞性接尾辞である敬称「さん」とを特定し、ユーザAの会話相手であるユーザBの姓名が「山田太郎」であり、ユーザBの会話相手であるユーザAの姓名が「木村一郎」であると判断して、ユーザA,Bのユーザ識別子として、それぞれ姓名「木村一郎」「木村一郎」に対応するユーザ識別子を特定してもよい。このようにして、音声認識結果を用いて話者識別を行うことができる。なお、図4Bの例においては、送金者識別子や受取人識別子の取得のために、送金者の音声認識結果と、受取人の音声認識結果との両方が用いられることになる。
また、話者区別の行われていない音声が音声受付部11において受け付けられた場合には、例えば、図4Dで示されるように、発話の区分けのみが行われていることもある。その場合には、送金処理装置1において、話者ごとの音声を用いたクラスタリングを行うことなどによって、話者区別を行うことができ、音声認識結果に含まれる姓名などの情報を用いて話者識別を行うことができる。一方、話者区別等を行うことなく、音声認識結果に含まれる姓名などのユーザを識別可能な情報を用いて、送金者識別子と受取人識別子とが取得されてもよい。例えば、図4Dで示される場合には、取引情報取得部15は、3個目の発話の音声認識結果について係り受け解析等を行い、送金する旨の動詞の主語が「木村一郎」であり、「山田太郎」が送金の対象であることを特定し、「木村一郎」に対応するユーザ識別子を送金者識別子として取得し、「山田太郎」に対応するユーザ識別子を受取人識別子として取得してもよい。この場合には、1つの発話から送金者識別子と受取人識別子とが取得されるため、送金者識別子及び受取人識別子の取得に、送金者及び受取人の両方の音声認識結果は用いられないことになる。
また、図3A~図3Dや上記説明では、2人のユーザによって会話が行われている場合について主に説明したが、そうでなくてもよい。3人以上のユーザによって会話が行われてもよい。その場合には、例えば、1対Nの送金が行われてもよい。Nは2以上の整数である。また、送金者側がN人であってもよく、受取人側がN人であってもよい。例えば、図4Eで示される会話が行われた場合には、ユーザAが受取人であり、ユーザB,C,D,Eが送金者である。図4Eの場合においても、話者識別が行われていれば、上記の処理と同様にして、ユーザB~Eの各ユーザ識別子を、送金者識別子として取得することができる。なお、3人以上の会話では、受取人のユーザが一意に特定されないこともあるため、受け取る旨の発話を行ったユーザが、受取人と判断されてもよい。例えば、取引情報取得部15は、あらかじめ設定されている、金銭を受け取る旨の動詞「集金する」「集める」「受け取る」等のいずれかの動詞を、命令形や依頼の形式でなく含んでいる発話を行ったユーザを、受取人側と判断してもよい。図4Eの場合においては、金銭を受け取る旨の動詞「集金し」を発話したユーザAが受取人であると判断され、ユーザAのユーザ識別子が受取人識別子として取得されてもよい。図4Eの場合には、送金者識別子や受取人識別子の取得のために、送金者の音声認識結果と、受取人の音声認識結果との両方が用いられることになる。
次に、送金金額を取得する方法について説明する。取引情報取得部15は、例えば、音声認識結果に対する形態素解析の結果を用いて送金金額を取得してもよい。取引情報取得部15は、例えば、形態素解析の結果において、「円」や「ドル」などの通貨単位に隣接する数詞の形態素から送金金額を取得してもよい。また、音声認識結果に、通貨単位に隣接する複数の数詞が含まれている場合には、取引情報取得部15は、係り受け解析を行い、送金する旨の動詞「送金する」「振り込む」「送る」等に係る数詞を送金金額として取得してもよい。係り受け解析には、例えばCaboChaなどを用いてもよい。例えば、図4Aの例においては、ユーザAの発話の音声認識結果から、動詞「送金し」に係る、通貨単位「円」に隣接する数詞「五千(5000)」を送金金額として取得してもよい。また、取引情報取得部15は、形態素解析の結果に含まれる数詞が送金金額であることを確認するために、その係り受け解析を行ってもよい。その場合には、音声認識結果に、通貨単位に隣接する数詞が1個しか含まれないときであっても、その係り受け解析が行われてもよい。
次に、送金時点を取得する方法について説明する。取引情報取得部15は、例えば、音声認識結果を用いて送金時点を取得してもよい。取引情報取得部15は、例えば、音声認識結果のテキストにおいて、年月日や日時などの時点を示す情報を取得し、その時点を送金時点としてもよい。また、音声認識結果に含まれる時点を示す情報が、相対的な時点を示す情報、例えば、「今日」「本日」「明日」である場合には、取引情報取得部15は、その相対的な時点を示す情報と、現在の時点を示す情報とを用いて、送金時点を取得してもよい。現在の時点を示す情報は、例えば、図示しないカレンダー部や時計部から取得されてもよい。具体的には、音声認識結果に「明日」が含まれており、送金時点の取得時点が2018年8月10日である場合には、取引情報取得部15は、「明日」に対応する送金時点として、2018年8月11日を取得してもよい。また、音声認識結果に、複数の時点を示す情報が含まれている場合には、取引情報取得部15は、係り受け解析を行い、送金する旨の動詞「送金する」等に係る時点を示す情報を送金時点として取得してもよい。例えば、図4Cの例においては、取引情報取得部15は、ユーザAの発話の音声認識結果から、動詞「送金し」に係る、時点を示す情報「明日」を取得し、その取得時点の年月日をカレンダー部から取得し、それらを用いて送金時点を取得してもよい。また、音声認識結果に、時点を示す情報が含まれない場合には、取引情報取得部15は、現在の時点を示す送金時点を、図示しないカレンダー部や時計部から取得してもよい。
なお、取引情報には、送金取引の口約束が成立したかどうかを示す情報が含まれてもよい。口約束とは、証文などの書面を作成しないで、言葉を取り交わすことによって行われる約束である。口約束も、契約の一種であるため、申し込みと、承諾とによって成立することになる。したがって、取引情報に、送金取引の口約束が成立したかどうかを示す情報が含まれている場合には、取引情報取得部15は、送金に関する申し込みに相当する表現と、その申し込みへの承諾に相当する表現とが音声認識結果に含まれているかどうか判断し、それらが含まれているときに、送金取引の口約束が成立したことを示す情報を取得し、それらが含まれていないときに、送金取引の口約束が成立しなかったことを示す情報を取得してもよい。具体的には、取引情報取得部15は、音声認識結果に、「送金します」「振り込みます」「送ります」「払います」などの送金の申し込みと、それに対する「ありがとう」「分かりました」「了解です」などの承諾とが含まれる場合に、送金取引の口約束が成立したことを示す情報を取得してもよく、音声認識結果に、「送金して下さい」「振り込んで下さい」「送って下さい」「払って下さい」などの送金依頼の申し込みと、それに対する「分かりました」「承知しました」「了解です」「送金します」「振り込みます」「送ります」「払います」などの承諾とが含まれる場合に、送金取引の口約束が成立したことを示す情報を取得してもよい。なお、音声認識結果に、送金に関する申し込みと承諾とが含まれていない場合には、取引情報取得部15は、送金取引の口約束が成立しなかったことを示す情報を取得してもよい。送金取引の口約束が成立したかどうかを示す情報は、例えば、フラグ的な情報であってもよい。
取引情報取得部15は、前述のように、受付部14によって受け付けられた追加情報をも用いて取引情報を取得してもよい。例えば、音声認識結果を用いて送金金額を取得できなかった場合に、後述する判断結果出力部18の出力に応じて端末装置2から送金金額が送信され、受付部14によって受け付けられると、その送金金額を含む取引情報が取得されてもよい。
記憶部16では、取引情報取得部15によって取得された取引情報が記憶される。また、記憶部16では、例えば、ユーザごとの情報であるユーザ情報が記憶されていてもよい。ユーザ情報は、例えば、ユーザの銀行口座の情報や、電子決済サービスにおけるアカウントの情報、ユーザの氏名、ユーザの識別に用いられる情報(例えば、電話番号やIPアドレスなどの通信に関するユーザに固有な情報等)等を含んでいてもよい。
記憶部16に取引情報以外の情報が記憶される過程は問わない。例えば、記録媒体を介して情報が記憶部16で記憶されるようになってもよく、通信回線等を介して送信された情報が記憶部16で記憶されるようになってもよく、または、入力デバイスを介して入力された情報が記憶部16で記憶されるようになってもよい。また、取引情報は、取引情報取得部15によって記憶部16に蓄積される。記憶部16での記憶は、RAM等における一時的な記憶でもよく、または、長期的な記憶でもよい。記憶部16は、所定の記録媒体(例えば、半導体メモリや磁気ディスクなど)によって実現されうる。
判断部17は、取引情報取得部15によって取得された取引情報によって送金取引が成立するかどうか判断する。判断部17は、例えば、取得された取引情報について、あらかじめ決められた条件がみたされる場合に、送金取引が成立すると判断してもよい。判断部17は、例えば、送金取引に必要な情報、例えば、送金者識別子、受取人識別子、送金金額が取引情報に含まれない場合に、その取引情報によって送金取引が成立しないと判断してもよい。また、取引情報に送信時点も含まれることになっている場合には、判断部17は、例えば、送信時点が取引情報に含まれないときに、その取引情報によって送金取引が成立しないと判断してもよい。このように取引情報に情報が含まれるかどうかによって判断される場合には、例えば、完全な取引情報が取得されたときに、送金取引が成立すると判断され、不完全な取引情報が取得されたときに、送金取引が成立しないと判断されてもよい。また、判断部17は、例えば、取引情報に含まれる送金者識別子で識別されるユーザに関する銀行口座の情報または電子マネーのアカウントの情報と、取引情報に含まれる受取人識別子で識別されるユーザに関する銀行口座の情報または電子マネーのアカウントの情報との両方が記憶部16で記憶されていない場合には、送金取引が成立しないと判断してもよい。また、取引情報に送金取引の口約束が成立したかどうかを示す情報が含まれている場合であって、その情報によって、送金取引の口約束が成立しなかったことが示されるときには、判断部17は、送金取引が成立しないと判断してもよい。また、送金取引が成立しないと判断する要因が何も存在しない場合に、判断部17は、取引情報によって送金取引が成立すると判断してもよい。
判断結果出力部18は、判断部17によって送金取引が成立しないと判断された場合に、その判断結果を出力してもよい。この判断結果は、送金者であるユーザに出力されてもよく、受取人であるユーザに出力されてもよく、両者に出力されてもよい。本実施の形態では、送金者であるユーザに判断結果が出力される場合について主に説明する。その判断結果において、送金取引が成立するために必要な情報の入力が要求されてもよい。例えば、送金金額が取引情報に含まれていないために送金取引が成立しない場合には、その旨が判断結果と一緒に出力されてもよい。その出力に応じて、送金取引が成立しない原因となっている情報を含む追加情報が、受付部14によって受け付けられてもよい。また、判断結果出力部18は、判断部17によって送金取引が成立すると判断された場合には、その判断結果を出力してもよく、または、出力しなくてもよい。
ここで、この出力は、例えば、表示デバイス(例えば、液晶ディスプレイや有機ELディスプレイなど)への表示でもよく、所定の機器への通信回線を介した送信でもよく、プリンタによる印刷でもよく、スピーカによる音声出力でもよい。なお、送金処理装置1がサーバである場合には、通常、この出力は端末装置2への送信であるとする。また、判断結果出力部18は、出力を行うデバイス(例えば、通信デバイスなど)を含んでもよく、または含まなくてもよい。また、判断結果出力部18は、ハードウェアによって実現されてもよく、または、それらのデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
確認出力部19は、送金処理部21による送金処理が実行される前に、送金処理の実行の可否を確認するための出力を送金者であるユーザに対して行う。この出力では、例えば、受取人の情報、送金金額が出力されてもよい。受取人の情報は、例えば、受取人識別子であってもよく、受取人の氏名であってもよく、受取人を特定可能なその他の情報であってもよい。
ここで、この出力は、例えば、表示デバイス(例えば、液晶ディスプレイや有機ELディスプレイなど)への表示でもよく、所定の機器への通信回線を介した送信でもよく、プリンタによる印刷でもよく、スピーカによる音声出力でもよい。なお、送金処理装置1がサーバである場合には、通常、この出力は端末装置2への送信であるとする。また、確認出力部19は、出力を行うデバイス(例えば、通信デバイスなど)を含んでもよく、または含まなくてもよい。また、確認出力部19は、ハードウェアによって実現されてもよく、または、それらのデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
指示受付部20は、確認出力部19による出力に応じて、送金者であるユーザからの送金処理の指示を受け付ける。なお、指示受付部20は、送金処理を行わない旨の指示を受け付けてもよい。
指示受付部20は、例えば、入力デバイス(例えば、キーボードやマウス、タッチパネルなど)から入力された情報を受け付けてもよく、有線または無線の通信回線を介して送信された情報を受信してもよい。なお、送金処理装置1がサーバである場合には、通常、この受け付けは端末装置2からの指示の受信であるとする。また、指示受付部20は、受け付けを行うためのデバイス(例えば、モデムやネットワークカードなど)を含んでもよく、または含まなくてもよい。また、指示受付部20は、ハードウェアによって実現されてもよく、または所定のデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
送金処理部21は、取引情報によって送金取引が成立すると判断部17によって判断され、指示受付部20によって、その取引情報に関する送金処理の指示が受け付けられた場合に、その取引情報に応じた送金処理を行う。なお、送金処理部21は、判断部17によって送金取引が成立しないと判断された場合や、指示受付部20によって、送金処理の指示が受け付けられなかった場合、または送信処理を行わない旨の指示が受け付けられた場合には、送金処理を行わない。また、取引情報に送金時点が含まれる場合には、送金処理部21は、送金時点が到来したときに、その送金時点を含む取引情報に関する送金処理を行ってもよい。送金処理は、上記のように、例えば、銀行振り込みの処理であってもよく、電子マネーを送金先のユーザのアカウントに払い込む処理であってもよい。送金処理は、通常、送金処理部21が、送金に必要な情報を銀行のサーバや、電子マネーを管理しているサーバ等に送信することによって行われる。送金者や受取人、送金金額が特定されている場合における送金処理はすでに公知であり、その詳細な説明を省略する。
通知部22は、取引情報に含まれる送金時点が到来する前及び後の少なくとも一方に、その送金時点の到来を通知する。この通知は、例えば、送金者に行われてもよく、受取人に行われてもよく、送金者と受取人との両方に行われてもよい。本実施の形態では、この通知が送金者と受取人との両方に行われる場合について主に説明する。また、その通知は、送金時点の到来する前または後にのみ行われてもよく、または、その両方に行われてもよい。
ここで、この通知は、例えば、表示デバイス(例えば、液晶ディスプレイや有機ELディスプレイなど)への表示でもよく、所定の機器への通信回線を介した送信でもよく、スピーカによる音声出力でもよい。なお、送金処理装置1がサーバである場合には、通常、この通知は端末装置2への送信であるとする。また、通知部22は、出力を行うデバイス(例えば、通信デバイスなど)を含んでもよく、または含まなくてもよい。また、通知部22は、ハードウェアによって実現されてもよく、または、それらのデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
次に、送金処理装置1の動作について図2のフローチャートを用いて説明する。
(ステップS101)音声受付部11は、音声を受け付けるかどうか判断する。そして、音声を受けつける場合には、ステップS102に進み、そうでない場合には、ステップS110に進む。なお、音声受付部11は、例えば、端末装置2との通信が開始された場合に、音声を受け付けると判断してもよい。
(ステップS102)音声受付部11は、ユーザによる送金取引の口約束の会話に応じた音声を受け付ける。なお、受け付けられた音声は、図示しない記録媒体で記憶されてもよい。
(ステップS103)音声受付部11は、音声の受け付けが終了したかどうか判断する。そして、音声の受け付けが終了した場合には、ステップS104に進み、そうでない場合には、ステップS102に戻る。なお、音声受付部11は、例えば、端末装置2との通信が終了された場合に、音声の受け付けが終了したと判断してもよい。
(ステップS104)音声認識部12は、受け付けられた音声に対して音声認識処理を行い、音声認識結果を取得する。なお、音声認識結果は、図示しない記録媒体で記憶されてもよい。
(ステップS105)音声認識結果受付部13は、音声認識結果を受け付ける。その受け付けは、例えば、記録媒体で記憶されている音声認識結果の読み出しであってもよい。
(ステップS106)取引情報取得部15は、少なくとも音声認識結果を用いて、取引情報を取得する。その取引情報の取得に、例えば、話者区別や話者識別の結果が用いられてもよい。そして、取引情報取得部15は、取得した取引情報を記憶部16に蓄積する。なお、ステップS109からステップS106に戻った場合には、取引情報取得部15は、受付部14によって受け付けられた追加情報を用いて取引情報を取得する。その取引情報の取得は、例えば、追加情報に含まれる情報を、記憶部16で記憶されている取引情報に追加することであってもよい。
(ステップS107)判断部17は、取得された取引情報によって送金取引が成立するかどうか判断する。そして、送金取引が成立する場合には、ステップS110に進み、送金取引が成立していない場合には、ステップS108に進む。
(ステップS108)判断結果出力部18は、送金取引が成立しない旨の判断結果を出力する。
(ステップS109)受付部14は、判断結果の出力に応じて、送金取引に必要な情報である追加情報を受け付けたかどうか判断する。そして、追加情報を受け付けた場合には、ステップS106に戻り、そうでない場合には、受け付けるまでステップS109の処理を繰り返す。なお、判断結果が出力されてから所定の時間が経過しても追加情報が受け付けられない場合には、タイムアウトであるとしてステップS101に戻ってもよい。その場合には、ステップS106で取得された取引情報に応じた送金は行われないことになる。
(ステップS110)送金処理部21は、送金処理を行うかどうか判断する。そして、送金処理を行う場合には、ステップS111に進み、そうでない場合には、ステップS101に戻る。なお、送金処理部21は、例えば、ある取引情報に含まれる送金時点と、現在の時点とが所定の閾値以内となった場合に、その取引情報について送金処理を行うと判断してもよい。
(ステップS111)通知部22は、ステップS110で送金処理を行うと判断された取引情報に関して、送金時点が到来した旨を送金者と受取人に通知する。なお、この通知は、送金に関する当事者への送金前の注意喚起であってもよい。
(ステップS112)確認出力部19は、ステップS110で送金処理を行うと判断された取引情報に関して、実行の可否を確認するための出力を送金者に対して行う。
(ステップS113)指示受付部20は、ステップS112の出力に応じて、送金者からの送金処理の指示を受け付けたかどうか判断する。そして、送金処理の指示を受け付けた場合には、ステップS114に進み、そうでない場合には、送金処理の指示を受け付けるまでステップS113の処理を繰り返す。なお、ステップS112の出力が行われてから所定の時間が経過しても送金処理の指示が受け付けられない場合や、送金処理を行わない旨の指示が受け付けられた場合には、ステップS101に戻ってもよい。
(ステップS114)送金処理部21は、ステップS110で送金処理を行うと判断された取引情報に関して送金処理を行う。
(ステップS115)通知部22は、ステップS110で送金処理を行うと判断された取引情報に関して、送金時点が到来した旨を送金者と受取人に通知する。なお、この通知は、送金に関する当事者への送金後の報告であってもよい。そして、ステップS101に戻る。
なお、図2のフローチャートのステップS110において、送金処理を行うと判断された取引情報が2以上存在する場合には、各取引情報について、ステップS111~S115の処理が行われてもよい。また、図2のフローチャートでは、ステップS112において、送金実行の確認の出力が送金者側に行われるため、ステップS111の通知は、受取人側に対してのみ行われてもよい。また、図2のフローチャートにおける処理の順序は一例であり、同様の結果を得られるのであれば、各ステップの順序を変更してもよい。また、図2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、本実施の形態による送金処理装置1の動作について、具体例を用いて説明する。この具体例では、記憶部16において、図5Aで示されるユーザ情報が記憶されているものとする。図5Aのユーザ情報は、ユーザを識別するユーザ識別子と、そのユーザの氏名と、そのユーザの端末装置2の電話番号と、そのユーザの口座情報とを含む情報である。口座情報には、銀行名、支店名、口座番号が含まれている。また、この具体例では、図3Aのように送金処理装置1を介した通話によって口約束が行われるものとする。また、この具体例では、ユーザAがユーザ識別子「U001」で識別される「木村一郎」であり、ユーザBがユーザ識別子「U002」で識別される「山田太郎」であるとする。
ユーザA,Bは、一緒に食事に行き、その会計において、ユーザBがすべてを立て替えて支払ったとする。その後、ユーザA,Bは、送金処理装置1を介した通話、すなわち、図3Aで示される通話において、図4Aのような会話を行ったとする。
すると、送金処理装置1の音声受付部11は、図4Aで示される各音声を受け付け、各音声をユーザA,Bの話者区別を行った状態で音声認識部12に渡す(ステップS101~S103)。なお、音声受付部11は、ユーザAの電話番号「090-1234-56**」、及びユーザBの電話番号「080-9876-54**」をも受け付けており、それらの電話番号を取引情報取得部15に渡す。ユーザA,Bの音声について、それぞれ音声認識処理が音声認識部12によって行われ、音声認識結果が音声認識結果受付部13を介して取引情報取得部15に渡される(ステップS104,S105)。なお、その音声認識結果では、話者区別が行われているものとする。
取引情報取得部15は、音声受付部11から受け取った電話番号を検索キーとして図5Aのユーザ情報を検索することにより、ユーザAがユーザ識別子「U001」で識別されるユーザ(以下、「ユーザU001」とすることもある。他のユーザ識別子で識別されるユーザについても同様であるとする。)であり、ユーザBがユーザU002であることを特定する。また、取引情報取得部15は、音声認識結果において、ユーザAによる「では、五千円送金します。」の発話に送金する旨の動詞「送金し」が含まれているため、ユーザU001が送金者側であり、ユーザU002が受取人側であると判断し、送金者識別子「U001」と、受取人識別子「U002」とを取得する。また、取引情報取得部15は、音声認識結果に関する係り受け解析によって、送金する旨の動詞「送金し」に係る「五千円」を特定し、送金金額「5000(円)」を取得する。また、音声認識結果には、時点を示す情報が含まれていないため、取引情報取得部15は、その時点の日時である送金時点「2018年8月10日13時30分」を図示しないカレンダー部と時計部から取得する。このようにして、送金者識別子、受取人識別子、送金金額、及び送金時点を含む取引情報が取得されたことになる(ステップS106)。そして、取引情報取得部15は、図6Aで示されるように、送金者識別子、受取人識別子、送金金額、送金時点を含む取引情報を記憶部16に蓄積する。なお、図6Aでは、取引情報に、取引ID、判断フラグ、送金フラグがさらに含まれているが、取引IDは、取引情報を識別するための情報であり、判断フラグは、判断部17による判断結果を示す情報であり、送金フラグは、送金処理が行われたかどうかを示す情報である。判断フラグ「1」は、送金取引が成立すると判断されたことを示し、判断フラグ「0」は、送金取引が成立しないと判断されたこと、またはその判断が行われていないことを示すものとする。また、送金フラグ「1」は、送金処理が行われたことを示し、送金フラグ「0」は、送金処理が行われていないことを示すものとする。
取引情報取得部15は、新たに蓄積した取引情報に含まれる取引ID「T001」を判断部17に渡し、その取引IDで示される取引情報に関する判断を行うように指示する。その指示に応じて、判断部17は、記憶部16で記憶されている取引ID「T001」を含む図6Aで示される取引情報に関する判断を行う。この具体例では、取引情報に、送金者識別子、受取人識別子、送金金額、送金時点が含まれており、また、送金者識別子に対応する口座情報と、受取人識別子に対応する口座情報とがユーザ情報に含まれている場合に、取引情報によって送金取引が成立すると判断されるものとする。図6Aで示される取引情報には、送金者識別子、受取人識別子、送金金額、及び送金時点が含まれており、また、送金者識別子「U001」に対応する口座情報、及び、受取人識別子「U002」に対応する口座情報が図5Aで示されるユーザ情報に含まれているため、判断部17は、送金取引が成立すると判断し、判断フラグを「1」に更新する(ステップS107)。その結果、記憶部16で記憶されている取引情報は、図6Bで示されるようになる。
その後、送金処理部21は、送金処理を行う取引情報が存在するかどうか判断する。この具体例では、現在の時点と送金時点とが30分以内であり、判断フラグが「1」であり、送金フラグが「0」である取引情報が、送金処理を行う取引情報と判断されるものとする。この場合には、取引ID「T001」で識別される取引情報が、送金処理を行う取引情報と判断されることになる(ステップS110)。そして、送金処理部21は、取引ID「T001」で識別される取引情報に関して、送金前の通知を行うように通知部22に指示する。すると、その指示に応じて、通知部22は、記憶部16で記憶されている取引ID「T001」に関する情報を読み出し、その情報を所定のテンプレートに追加することによって、通知対象の情報を構成する。また、通知部22は、送金者識別子「U001」及び受取人識別子「U002」にそれぞれ対応する送金者及び受取人の各端末装置2のアドレスを図示しない管理情報から取得する。そして、通知部22は、その取得したアドレスを送信先として、通知対象の情報を送信する(ステップS111)。その結果、送金者であるユーザU001、及び受取人であるユーザU002の端末装置2において、図7Aで示される通知が表示されることになる。
次に、送金処理部21は、取引ID「T001」で識別される取引情報に含まれる受取人識別子に対応する氏名「山田太郎」と、送金金額「5000円」と、送金者識別子「U001」とを確認出力部19に渡す。すると、確認出力部19は、受け取った氏名や送金金額を所定のテンプレートに追加することによって、送金処理の実行の可否を確認するための情報を構成する。また、確認出力部19は、受け取った送金者識別子に対応する端末装置2のアドレスを図示しない管理情報から取得する。そして、確認出力部19は、その取得したアドレスを送信先として、受取人の氏名や送金金額等を含む、送金処理の実行の可否を確認するための情報を送信する(ステップS112)。その結果、送金者であるユーザU001の端末装置2において、図7Bで示される表示が行われることになる。
図7Bの表示において、ユーザU001が、「送金する」ボタンをタップしたとする。すると、ユーザU001の端末装置2から送金処理装置1に、送金処理の指示が送信される。その送金処理の指示は、指示受付部20によって受信され、送金処理部21に、送金処理の指示が受信された旨が渡される(ステップS113)。送金処理の指示が受信された旨を受け取ると、送金処理部21は、取引ID「T001」で識別される取引情報に関する送金処理を実行する(ステップS114)。具体的には、送金処理部21は、ユーザU001の口座から、ユーザU002の口座に5000円が送金されるように処理を行う。その結果、ABC銀行の横浜支店の木村一郎の口座から、XYZ銀行の新橋支店の山田太郎の口座に、5000円が送金されることになる。
その後、送金処理部21は、取引ID「T001」で識別される取引情報に含まれる送金フラグを「1」に更新する。その結果、記憶部16で記憶されている取引情報は、図6Cで示されるようになる。また、送金処理部21は、取引ID「T001」で識別される取引情報に関して、送金後の通知を行うように通知部22に指示する。すると、その指示に応じて、通知部22は、取引ID「T001」に関する情報を読み出し、また、送金者識別子「U001」及び受取人識別子「U002」にそれぞれ対応するアドレスを送信先として、送金処理に関する通知を送信する(ステップS115)。その結果、送金者であるユーザU001、及び受取人であるユーザU002の端末装置2において、図7Cで示される通知が表示されることになる。このようにして、送金手続の口約束の会話に応じて、送金処理が行われることになる。
なお、上記具体例では、音声認識結果等を用いて取引情報に含まれるすべての情報を取得することができる場合について説明したが、そうでない場合もありうる。例えば、図4Fで示されるように、金額の部分がノイズ等の原因によって正しく音声認識されなかったとすると、その会話には、送金金額が含まれていないことになるため、送金金額を取得することができない。なお、図4Fにおける「※※※」の箇所は、音声認識結果が存在しないことを示しているものとする。そのような場合には、記憶部16で記憶されている取引情報が図6Dで示されるものとなり、判断部17によって、取引情報に送金金額がないため送金取引が成立しないと判断され(ステップS107)、ユーザU001に、山田太郎への送金金額の入力指示を含む判断結果を送信する旨の指示が判断結果出力部18に渡される。その指示に応じて、判断結果出力部18は、ユーザU001に対応するアドレスを取得し、その取得したアドレスに、山田太郎への送金金額を入力する旨の指示を含む判断結果を送信する(ステップS108)。その結果、送金者であるユーザU001の端末装置2において、図7Dで示される表示が行われることになる。この図7Dの表示において、ユーザU001が送金金額「5000(円)」を入力し、「OK」ボタンをタップすると、端末装置2から送金処理装置1に、送金金額「5000(円)」を含む追加情報が送信される。その追加情報は、受付部14で受信され、受信された追加情報に含まれる送金金額が取引情報取得部15に渡される(ステップS109)。受付部14から送金金額を取得すると、取引情報取得部15は、その送金金額を、記憶部16で記憶されている取引情報に追加する(ステップS106)。その結果、送金金額を追加後の取引情報は、図6Aで示されるものとなり、上記説明と同様にして、送金処理が行われることになる。
以上のように、本実施の形態による送金処理装置1によれば、2以上のユーザの口約束の会話に応じて送金処理を行うことができる。したがって、ユーザが送金処理を手動で行う場合と比較して、ユーザの手続負担を軽減することができ、ユーザの利便性が向上されることになる。また、送金時点の到来の前後の少なくとも一方において、送金時点の到来を当事者に通知することによって、送金が行われる旨、または送金が行われた旨を当事者が知ることができるようになる。また、判断部17によって送金取引が成立しないと判断された場合には、その判断結果が出力されることによって、送金者は、送金取引が成立していないことを知ることができる。その結果、不足している情報を送金者が入力することなどによって、送金取引が成立するようにすることができる。また、送金処理が行われる前に、送金処理の実行の可否を確認するための出力が行われることによって、送金に関する安全性を向上させることができ、誤った送金を防止することができるようになる。
なお、本実施の形態では、送信元の情報や、音声認識結果に含まれるユーザを識別可能な情報などを用いて話者識別を行う場合について主に説明したが、それ以外の方法によって話者識別が行われてもよい。例えば、図8で示されるように、送金処理装置1は、ユーザ識別部31をさらに備えていてもよい。ユーザ識別部31は、音声受付部11によって受け付けられた各ユーザの音声の特徴量を用いて、各ユーザを識別するものである。したがって、送信元の情報等を用いた話者識別を行わない場合であっても、ユーザ識別部31によって、話者識別を行うことができることになる。取引情報取得部15は、ユーザ識別部31による識別結果を用いて、送金するユーザを識別する送金者識別子、及び送金を受け取るユーザを識別する受取人識別子を取得することができる。なお、ユーザ識別部31によって行われるのは、話者識別までであるため、各ユーザが送金者側であるのか受取人側であるのかの判断は、音声認識結果を用いて行われてもよい。また、送金金額については、取引情報取得部15は、上記説明と同様にして、音声認識結果から取得することになる。
ユーザ識別部31による話者識別は、例えば、声紋認証によって行われてもよい。そのため、例えば、図5Bで示されるように、各ユーザ情報に、声紋認証データが含まれており、その声紋認証データを用いて、音声について特徴量を用いた声紋認証が行われ、音声に対応するユーザが識別されてもよい。その声紋認証データは、例えば、ユーザの音声そのものであってもよく、ユーザの音声から抽出した特徴量を示す情報であってもよい。その特徴量を示す情報は、例えば、特徴量のベクトル等であってもよい。このようなユーザの音声の特徴量を用いてユーザを識別することによって、生体認証を行うことができ、音声認識結果に含まれるユーザを識別可能な氏名等の情報を用いた話者識別よりも、精度の高い話者識別を実現することができるようになる。氏名には、同姓同名もあり、また、音声認識において、読みから漢字に変換する際に、揺らぎの生じることもあるからである(例えば、「こうじ」が「浩二」や「孝司」、「弘治」等に変換される可能性がある)。
また、本実施の形態では、送金処理装置1がサーバであり、端末装置2からユーザの音声を受信する場合について主に説明したが、サーバである送金処理装置1は、端末装置2から音声認識結果を受信してもよい。その場合には、送金処理装置1は、音声受付部11や音声認識部12を有していなくてもよい。そして、音声認識結果受付部13は、端末装置2から送信された音声認識結果を受信してもよい。
また、本実施の形態では、送金処理装置1がサーバである場合について主に説明したが、送金処理装置1は、ユーザが携帯可能な端末装置であってもよい。その場合には、送金処理装置1は、例えば、スマートフォンやタブレット、PDA、ノートパソコン等であってもよい。送金処理装置1が端末装置である場合には、口約束の会話を行う少なくとも一人のユーザの音声は、端末装置である送金処理装置1が直接、マイクロフォンで受け付けてもよい。一方、他のユーザの音声は、同じマイクロフォンで受け付けてもよく、または、通信回線を介して受け付けてもよい。後者の場合には、他のユーザの音声は受信されることになる。したがって、そのような場合には、音声受付部11は、マイクロフォンと、受信手段との両方を有していてもよい。他のユーザの音声が受信される場合には、通常、送金処理装置1において、話者識別を行うことができる。端末装置である送金処理装置1のマイクロフォンで受け付けた音声は、その端末装置の所有者の音声であると考えることができ、また、受信されたユーザの音声は、送信元の電話番号等に対応するユーザの音声であると考えることができるからである。なお、他のユーザの音声が受信される場合であっても、ユーザ識別部31を用いた話者識別が行われてもよい。また、口約束の会話を行う各ユーザの音声が、端末装置である送金処理装置1のマイクロフォンで受け付けられる場合には、例えば、ユーザ識別部31を用いた話者識別が行われてもよく、または、音声認識結果に含まれるユーザの氏名等のユーザを識別可能な情報を用いた話者識別が行われてもよい。話者識別が行われた後の送金処理装置1に関する処理は、上記実施の形態における説明と同様であり、その詳細な説明を省略する。なお、送金処理装置1が端末装置である場合であって、その端末装置の所有者が送金者である場合には、送金者側への出力は、送金処理装置1における表示やスピーカからの音声出力等であってもよい。
また、上記実施の形態では、電話番号等の送信元の情報を用いた話者識別が行われる場合や、ユーザの音声の特徴量を用いた話者識別が行われる場合について説明したが、送信元の情報と、ユーザの音声の特徴量の両方を用いて話者識別が行われてもよい。そのようにすることで、より精度の高い話者識別を実現することができるようになる。
また、口約束の会話を行っている各ユーザの端末装置が送金処理装置1の機能を有している場合には、例えば、送金者側の端末装置である送金処理装置1において送金処理が行われ、また、受取人側の端末装置である送金処理装置1においても送金処理が行われる可能性もあり得る。したがって、そのような場合には、あらかじめ設定されている側の送金処理装置1、例えば送金者側の送金処理装置1においてのみ、送金処理が行われるように設定されていてもよい。そして、例えば、ユーザが通話している端末装置間で、送金処理装置1としての機能を有しているかどうかが自動的に送受信され、両装置が送金処理装置1としての機能を有しているときには、あらかじめ設定されている側、例えば、送金者側や受取人側においてのみ、送金処理が行われてもよい。
また、送金処理装置1が端末装置であり、音声受付部11が、ユーザからの音声を受け付けるマイクロフォンである場合には、図9で示されるように、送金処理装置1は、取引情報に関する音声が受け付けられる前に、音声受付部11の感度を上げる感度調整部41をさらに備えていてもよい。マイクロフォンである音声受付部11の感度を上げるとは、より小さな音でも集音することができるようにマイクロフォンを調整することである。このようにすることで、ユーザの小さな声も集音することができるようになり、より正確に音声認識を行うことができ、より精度の高い送金処理を実現することができるようになる。特に、1個の送金処理装置1の音声受付部11によって、複数のユーザの音声を集音する場合には、このように感度調整部41による感度の調整を行うことが好適である。マイクロフォンから少し離れた位置にいるユーザの音声も、より適切に集音することができるようにするためである。
なお、感度調整部41が上記のようにマイクロフォンの感度を上げるタイミングは問わない。感度調整部41は、所定のイベントの発生を検知すると、それに応じてマイクロフォンの感度を上げ、送金処理に関連する一連の音声の受け付けが終了したタイミングで、マイクロフォンの感度を元に戻してもよい。所定のイベントは、例えば、「今から集金します」などの集金の開始を示す音声の受け付けであってもよく、端末装置である送金処理装置1に関するあらかじめ決められた操作の受け付けであってもよい。所定のイベントが所定の音声の受け付けである場合には、端末装置である送金処理装置1において、音声の受け付けと音声認識の処理が継続してリアルタイムで行われ、その音声認識結果に、所定の音声に相当するテキストが含まれているときに、感度調整部41は、所定のイベントが発生したと判断してもよい。また、所定のイベントがあらかじめ決められた操作(例えば、端末装置を2回叩くことや、端末装置2を振ること、端末装置2において所定のアプリケーションを起動することなど)の受け付けである場合には、感度調整部41は、例えば、所定のセンサ(例えば、加速度センサや、ジャイロセンサ、タッチパネル等)の出力やアプリケーションの実行状況等を用いて、あらかじめ決められた操作の行われたことを検知したときに、所定のイベントが発生したと判断してもよい。
また、本実施の形態において、取引情報取得部15が、本来の送金取引の口約束を行う2以上のユーザの近くにいる別のユーザの発話に応じて取引情報を取得する可能性もある。例えば、図3Cにおいて、ユーザA,Bの隣にユーザC,Dがいた場合には、端末装置2が、ユーザC,Dの会話の音声も送金処理装置1に送信することによって、そのようなことが起こりうる。そのような場合には、本来の送金取引の口約束を行うユーザが、その取得された取引情報に応じた送金処理を停止したり、その取引情報の内容を変更したりできるようにしてもよい。その場合には、送金処理装置1は、取引情報取得部15によって取得された取引情報に応じた取引内容を出力する取引内容出力部(図示せず)を備えてもよい。取引内容は、例えば、送金者識別子や受取人識別子を含んでいてもよく、送金金額をも含んでいてもよい。また、取引内容の出力は、本来の送金取引の口約束を行うユーザに対して行われてもよい。例えば、送金処理装置1がサーバである場合には、取引内容出力部は、音声や音声認識結果の送信元である端末装置2に取引内容を送信してもよい。その場合には、取引内容の送信先は、例えば、図3Cにおいては、ユーザA,Bが使用している端末装置2となり、図3Dにおいては、ユーザA,Bの各端末装置2となる。また、例えば、送金処理装置1が端末装置である場合には、取引内容出力部は、取引内容を表示したり、音声出力したりしてもよい。そして、その取引内容の出力によって示される送金者が意図されていないユーザである場合や、受取人が意図されていないユーザである場合、送金金額が意図されていない金額である場合には、例えば、ユーザが、送金処理を停止する指示を入力することによって、送金処理が停止されてもよく、取引内容を変更した上で送金処理を実行する旨を入力することによって、変更後の取引情報に応じた送金処理が行われてもよい。送金処理の停止の指示や、取引内容の変更の指示等は、受付部14によって受け付けられてもよい。送金処理を停止する指示の入力は、例えば、NGボタンの押下等であってもよい。また、取引内容の変更は、例えば、送金者の変更であってもよく、受取人の変更であってもよく、送金金額の変更であってもよく、それらの組み合わせであってもよい。
また、本実施の形態では、送金時点の到来が通知される場合について説明したが、そうでなくてもよい。送金時点の到来の通知が行われない場合には、送金処理装置1は、通知部22を備えていなくてもよい。また、取引情報には、送金時点が含まれていなくてもよい。取引情報に送金時点が含まれてないに場合には、送金処理部21は、送金処理の終了していない取引情報については、送金処理を行うと判断してもよい。
また、本実施の形態では、判断部17による、送金取引が成立しない旨の判断結果が出力される場合について説明したが、そうでなくてもよい。その判断結果の出力が行われない場合には、送金処理装置1は、判断結果出力部18を備えていなくてもよい。
また、本実施の形態では、送金処理の実行の可否を確認するための出力に対して、送金処理の指示が受け付けられると、送金処理が行われる場合について説明したが、その送金処理の指示の受け付けにおいて、所定の認証が行われてもよい。その認証は、パスワード認証や、指紋などの生体認証、認証データを含むデバイス(例えば、カードや指輪など)を用いた認証であってもよい。そして、正当であること(例えば、送金者であることや、送金を行ってよいこと)が認証された場合に、その受け付けられた送金処理の指示に応じた送金処理が行われてもよい。
また、本実施の形態では、送金処理の実行の可否を確認するための出力が行われ、送金処理の指示が受け付けられると、送金処理が行われる場合について説明したが、そうでなくてもよい。そのような確認の出力や指示の受け付けが行われない場合には、送金処理装置1は、確認出力部19や指示受付部20を備えていなくてもよい。その場合には、送金処理部21は、送金取引が成立すると判断部17によって判断されたときに、取引情報に応じた送金処理を行い、そうでないときに、送金処理を行わなくてもよい。
また、本実施の形態において、送金処理装置1においてユーザの音声が受け付けられた場合に、その音声は送金取引の口約束に関する情報として記録されてもよい。その場合には、例えば、取引情報に、その音声のデータが含まれてもよい。
また、上記実施の形態では、個人のユーザ間において口約束に応じた送金処理が行われる場合(CtoCの場合)について主に説明したが、口約束を行うユーザは、個人でなくてもよい。したがって、2以上のユーザによる送金取引の口約束は、例えば、企業対消費者間取引(BtoC)において行われてもよく、企業間取引(BtoB)において行われてもよい。より具体的には、店舗における消費者の支払や公共料金等の支払に送金処理装置1が用いられてもよく、企業間の購買等に送金処理装置1が用いられてもよい。
また、上記実施の形態では、送金処理装置1がサーバである場合や、ユーザが携帯可能な端末装置である場合について説明したが、そうでなくてもよい。送金処理装置1は、例えば、デスクトップパソコンのように、携帯可能でない端末装置であってもよい。
また、上記実施の形態において、各処理または各機能は、単一の装置または単一のシステムによって集中処理されることによって実現されてもよく、または、複数の装置または複数のシステムによって分散処理されることによって実現されてもよい。
また、上記実施の形態において、各構成要素間で行われる情報の受け渡しは、例えば、その情報の受け渡しを行う2個の構成要素が物理的に異なるものである場合には、一方の構成要素による情報の出力と、他方の構成要素による情報の受け付けとによって行われてもよく、または、その情報の受け渡しを行う2個の構成要素が物理的に同じものである場合には、一方の構成要素に対応する処理のフェーズから、他方の構成要素に対応する処理のフェーズに移ることによって行われてもよい。
また、上記実施の形態において、各構成要素が実行する処理に関係する情報、例えば、各構成要素が受け付けたり、取得したり、選択したり、生成したり、送信したり、受信したりした情報や、各構成要素が処理で用いる閾値や数式、アドレス等の情報等は、上記説明で明記していなくても、図示しない記録媒体において、一時的に、または長期にわたって保持されていてもよい。また、その図示しない記録媒体への情報の蓄積を、各構成要素、または、図示しない蓄積部が行ってもよい。また、その図示しない記録媒体からの情報の読み出しを、各構成要素、または、図示しない読み出し部が行ってもよい。
また、上記実施の形態において、各構成要素等で用いられる情報、例えば、各構成要素が処理で用いる閾値やアドレス、各種の設定値等の情報がユーザによって変更されてもよい場合には、上記説明で明記していなくても、ユーザが適宜、それらの情報を変更できるようにしてもよく、または、そうでなくてもよい。それらの情報をユーザが変更可能な場合には、その変更は、例えば、ユーザからの変更指示を受け付ける図示しない受付部と、その変更指示に応じて情報を変更する図示しない変更部とによって実現されてもよい。その図示しない受付部による変更指示の受け付けは、例えば、入力デバイスからの受け付けでもよく、通信回線を介して送信された情報の受信でもよく、所定の記録媒体から読み出された情報の受け付けでもよい。
また、上記実施の形態において、送金処理装置1に含まれる2以上の構成要素が通信デバイスや入力デバイス等を有する場合に、2以上の構成要素が物理的に単一のデバイスを有してもよく、または、別々のデバイスを有してもよい。
また、上記実施の形態において、各構成要素は専用のハードウェアにより構成されてもよく、または、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。その実行時に、プログラム実行部は、記憶部や記録媒体にアクセスしながらプログラムを実行してもよい。なお、上記実施の形態における送金処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、2以上のユーザによる送金取引の口約束の会話に応じた音声認識結果を受け付ける音声認識結果受付部、前記音声認識結果受付部によって受け付けられた音声認識結果を少なくとも用いて、送金取引に関する情報である取引情報を取得する取引情報取得部、前記取引情報取得部によって取得された取引情報によって送金取引が成立するかどうか判断する判断部、送金取引が成立すると前記判断部によって判断された場合に、前記取引情報に応じた送金処理を行う送金処理部として機能させるためのプログラムであってもよい。
なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得部や、情報を出力する出力部、情報を受け付ける受付部などにおけるモデムやインターフェースカードなどのハードウェアでしか実現できない機能は、上記プログラムが実現する機能には少なくとも含まれない。
また、このプログラムは、サーバなどからダウンロードされることによって実行されてもよく、所定の記録媒体(例えば、CD-ROMなどの光ディスクや磁気ディスク、半導体メモリなど)に記録されたプログラムが読み出されることによって実行されてもよい。また、このプログラムは、プログラムプロダクトを構成するプログラムとして用いられてもよい。
また、このプログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、または分散処理を行ってもよい。
図10は、上記プログラムを実行して、上記実施の形態による送金処理装置1を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現されうる。
図10において、コンピュータシステム900は、CD-ROMドライブ905を含むコンピュータ901と、キーボード902と、マウス903と、モニタ904とを備える。
図11は、コンピュータシステム900の内部構成を示す図である。図11において、コンピュータ901は、CD-ROMドライブ905に加えて、MPU(Micro Processing Unit)911と、ブートアッププログラム等のプログラムを記憶するためのROM912と、MPU911に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM913と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク914と、MPU911、ROM912等を相互に接続するバス915とを備える。なお、コンピュータ901は、LANやWAN等への接続を提供する図示しないネットワークカードを含んでいてもよい。
コンピュータシステム900に、上記実施の形態による送金処理装置1の機能を実行させるプログラムは、CD-ROM921に記憶されて、CD-ROMドライブ905に挿入され、ハードディスク914に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ901に送信され、ハードディスク914に記憶されてもよい。プログラムは実行の際にRAM913にロードされる。なお、プログラムは、CD-ROM921、またはネットワークから直接、ロードされてもよい。また、CD-ROM921に代えて他の記録媒体(例えば、DVD等)を介して、プログラムがコンピュータシステム900に読み込まれてもよい。
プログラムは、コンピュータ901に、上記実施の形態による送金処理装置1の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能やモジュールを呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム900がどのように動作するのかについては周知であり、詳細な説明は省略する。
また、図10、図11では、デスクトップタイプであるコンピュータシステム900について示しているが、送金処理装置1が端末装置である場合には、コンピュータシステム900は、携帯タイプのものであってもよい。
また、本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。