JP2018517917A - 通信ソフトウェアにおいて音声により業務を起動する方法及びこれに対応する装置 - Google Patents

通信ソフトウェアにおいて音声により業務を起動する方法及びこれに対応する装置 Download PDF

Info

Publication number
JP2018517917A
JP2018517917A JP2017548264A JP2017548264A JP2018517917A JP 2018517917 A JP2018517917 A JP 2018517917A JP 2017548264 A JP2017548264 A JP 2017548264A JP 2017548264 A JP2017548264 A JP 2017548264A JP 2018517917 A JP2018517917 A JP 2018517917A
Authority
JP
Japan
Prior art keywords
business
user
information
voice
transaction data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017548264A
Other languages
English (en)
Other versions
JP2018517917A5 (ja
JP6859501B2 (ja
Inventor
ジョウ,ジンウェン
ヂュ,チン
Original Assignee
アリババ グループ ホウルディング リミテッド
アリババ グループ ホウルディング リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アリババ グループ ホウルディング リミテッド, アリババ グループ ホウルディング リミテッド filed Critical アリババ グループ ホウルディング リミテッド
Publication of JP2018517917A publication Critical patent/JP2018517917A/ja
Publication of JP2018517917A5 publication Critical patent/JP2018517917A5/ja
Application granted granted Critical
Publication of JP6859501B2 publication Critical patent/JP6859501B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/30Payment architectures, schemes or protocols characterised by the use of specific devices or networks
    • G06Q20/32Payment architectures, schemes or protocols characterised by the use of specific devices or networks using wireless devices
    • G06Q20/327Short range or proximity payments by means of M-devices
    • G06Q20/3272Short range or proximity payments by means of M-devices using an audio code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/384Payment protocols; Details thereof using social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4014Identity check for transactions
    • G06Q20/40145Biometric identity checks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0222During e-commerce, i.e. online transactions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/18Commands or executable codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Telephonic Communication Services (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本出願は、通信技術の分野、特に、通信ソフトウェアにおいて音声により業務を起動する方法及び関連する装置に関し、ユーザがチャット通信中に音声により業務機能を実施し、ユーザエクスペリエンスを向上させたものである。この方法は、ユーザが通信ソフトウェアを用いて別の人と通信する際に、ユーザが入力した音声情報を収集するステップと、音声情報を認識し、音声情報が特定コマンドを含む場合には対応する業務を起動するステップと、業務処理装置が業務を処理できるように、業務情報と、取引データを含む情報とを業務処理装置へ送信するステップとを含む。本出願の実施の形態で提供される技術的解決から分かるように、ユーザがチャット中に業務を開始することが可能である。ユーザは、チャットインターフェースを終えて複雑なクリック操作を実行することなく、業務機能を用いることができるため、ユーザにとって複雑な操作が著しく単純化され、ユーザが一層優れたユーザエクスペリエンスを体験できる。
【選択図】図1

Description

本出願は、通信技術の分野、特に、通信ソフトウェアにおいて音声により業務(ビジネス)を起動する方法及びこれに対応する装置に関する。
自動決済技術はますます成熟度を増し、様々なタイプの決済形式が次第に普及し、日常生活において人々に利用されるようになった。例えば、モバイルバンキング技術、電子銀行(e-bank)などは、交通、税金、ファイナンス、セキュリティのように人々の日常生活のあらゆる分野に関与してきている。通信ネットワークシステムによって実施される自動支払い及び自動送金の支払い技術は、人々の日常生活に優れた利便性を提供する。
一方で、現在のインスタントメッセージング技術は利用者に迅速で効率的な通信プラットフォームを提供するので、オンラインユーザはインターネット上で迅速で即時的な情報のインタラクション対話(やりとり)を行うことができ、また、インターネットを使用し、インスタントメッセージングソフトウェアで様々な請求代金(financial charge)の支払処理を実施することができる。これにより、利用者は便宜的かつ迅速にオンライン支払を実施することが可能になる。
既存のインスタントメッセージングソフトウェアによっては、利用者(支払先)は、集金(collection of money)オーダー(命令)を確立することで、相対する側(支払元)への集金を開始できる。しかし、支払先は、支払元とのチャットインターフェースを終えてから、集金機能を選択するボタンをクリックし、続いて、集金を実施する操作工程に従って一連の操作及びクリックを実行する。したがって、操作が複雑である。
本出願の実施の形態の目的は、通信ソフトウェアにおいて音声により業務を起動する方法及びこれに関連する装置を提供し、従来技術におけるチャットソフトウェアでの業務機能モジュールの呼び出し操作が複雑である問題を解決し、ユーザが業務機能を用いる際に向上したユーザエクスペリエンスを体験できるようにすることである。
本出願の実施の形態は、通信ソフトウェアにおいて音声により業務を起動する方法を提供し、当該方法は:
ユーザが通信ソフトウェアを用いて別の人と通信する際に、ユーザが入力した音声情報を収集するステップと;
音声情報を認識し、音声情報が特定のコマンドを含む場合には、対応する業務を起動するステップと;
業務処理装置が業務を処理できるようにするために、業務情報と、取引データを含む情報とを業務処理装置へ送信するステップとを備える。
本出願の実施の形態は、通信ソフトウェアにおいて音声により業務を起動する方法をさらに提供し、当該方法は:
ユーザ端末から送信された業務情報と取引データを含む情報とを受信するステップと;
業務情報と取引データを含む情報とに基づいて業務を処理するステップとを備える。
本出願の実施の形態は、通信ソフトウェアにおいて音声により業務を起動する装置をさらに提供し、当該装置は:
ユーザが通信ソフトウェアを用いて別の人と通信する場合に、ユーザが入力した音声情報を収集するように構成された収集ユニットと;
音声情報を認識し、音声情報が特定コマンドを含む場合には、対応する業務を起動するように構成されたコマンド認識ユニットと;
業務処理装置が業務を処理できるように、業務情報と、取引データを含む情報とを業務処理装置へ送信するように構成された送信ユニットとを備える。
本出願の実施の形態は、業務処理装置をさらに提供し、当該装置は:
ユーザ端末から送信された業務情報と取引データを含む情報とを受信するように構成された受信ユニットと;
業務情報と取引データを含む情報とに基づいて業務を処理するように構成された処理ユニットとを備える。
本出願の各実施の形態で提供される技術的解決から分かるように、ユーザ端末上の通信ソフトウェアにおいて、音声により業務を起動する解決法を追加することで、ユーザのチャット中に業務を開始できるようになる。ユーザは、チャットインターフェースを終了させ複雑なクリック操作を実行することなく業務機能を使用できる。したがって、ユーザにとって複雑な操作は著しく単純化され、これによりユーザはより優れたユーザエクスペリエンスを体験できる。
当然ながら、本出願を実施するあらゆる製品や方法は、上で述べた全ての利点を同時に達成する必要はない。
本出願の実施の形態又は従来技術の技術的解決を一層明確に説明するために、実施の形態又は従来技術の説明に用いる添付図面を以下、簡単に説明する。以下で説明する添付図面は単に本出願のいくつかの実施の形態であり、当業者は、これらの添付図面からこれ以外の図面を創造的な努力なく導き出せることは明らかである。
本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動する方法のフローチャートである。 本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動する方法のフローチャートである。 本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動する装置の概略の構造図である。 本出願の一の実施の形態による業務処理装置の概略の構造図である。 本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動するデータフロー図である。 本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動する別のデータフロー図である。
本出願の実施の形態は、通信ソフトウェアにおいて音声により業務を起動する方法及びこれに対応する装置を提供する。
当業者が本出願の技術的解決をより深く理解できるように、本出願の実施の形態において、添付図面を参照しつつ、本出願の実施の形態における技術的解決を明瞭かつ完全に以下で説明する。説明する実施の形態は、本出願の実施の形態のすべてではなく、その一部であることは明らかである。本出願の実施の形態に基づいて当業者が創造的な努力をせずに導き出されたすべての実施の形態は何れも本出願の保護範囲内に含まれるものとする。
図1は、本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動する方法のフローチャートである。この方法は、支払い業務などの業務を音声によって起動するために、インスタントメッセージングに適用できる。支払い業務とは、具体的に、別のユーザなどへの送金又は支払いであってよい。
具体的に、図1に示す実施の形態の方法は下記のステップを含んでよい。
ステップ101:ユーザが通信ソフトウェアを用いて別の一人と通信する際に、ユーザが入力した音声情報を収集する。
ステップ102:音声情報を認識し、音声情報に特定のコマンドが含まれていれば、これに対応する業務を起動する。
ステップ103:業務処理装置に当該業務を処理させるために、業務情報と、取引データを含む情報とを業務処理装置へ送信する。
この実施の形態は、インスタントメッセージングシステムに適用でき、このシステムは携帯電話、タブレットコンピュータ、コンピュータのようなユーザ端末を含んでよい。このシステムは、インスタントメッセージングサーバをさらに含んでもよい。各ユーザは、自分の端末を使ってインスタントメッセージングサーバにアカウントを登録し、ユーザ間でインスタントメッセージングを実施できる。インスタントメッセージングシステムはQQ、Wechat、Laiwangなどであってよい。通信ソフトウェアは、具体的には、QQソフトウェア、Wechatアプリケーション、Laiwangアプリケーションなどであってよい。
この実施の形態では、ステップ102からステップ103はユーザ端末によって実行されてよく、具体的には、ユーザ端末が、インスタントメッセージングにてユーザの音声情報を収集することで対応の業務を起動し、この業務を業務処理装置へ送信して処理する。本明細書において、業務処理装置は、具体的にはインスタントメッセージングサーバであってよい。あるいは、ユーザ端末が、インスタントメッセージングサーバを介して別体の業務処理装置へ業務を送信することであってもよい。
本出願の一の実施の形態として、この方法は、ユーザが正規ユーザであるかどうか認証するステップをさらに含む。ユーザが正規ユーザであるかを認証するこのステップは、ユーザが通信ソフトウェアを開始する時に実施できる。ユーザが正規ユーザである場合に、ユーザは通信ソフトウェアの使用を許可され、正規ユーザでない場合には、ユーザは通信ソフトウェアの使用を拒否される。さらに、今、音声情報を入力しているユーザが正規ユーザであるかどうかを認証してもよく、これは、通信ソフトウェアの開始後に相対する側への送信のための情報を入力するユーザが正規ユーザであるかどうかの認証を含んでもよく、又は、特定のコマンドを入力しているユーザが正規ユーザであるかの認証を含んでもよい。以降に示す、ユーザが正規ユーザであるかどうかを認証する方法は、個別に又は組み合わせて用いることができる。
本出願の一の実施の形態として、ユーザが正規ユーザかどうかを認証するステップは、具体的に、ユーザが正規ユーザかどうかを、ユーザの入力操作を認証することにより、又は、ユーザの生体特徴を認証することにより判定するステップを含んでよい。
本出願の一の実施の形態として、入力操作は、ユーザが入力した文字列で形成されたパスワード、ユーザのスライド入力、ユーザによるキー押しの組み合わせのうち少なくとも1つを含む。
本出願の一の実施の形態として、生体特徴は、ユーザの指紋、ユーザの顔画像、ユーザの声紋のうち少なくとも1つを含む。
本出願の一の実施の形態として、ユーザが正規ユーザであるかどうかを、ユーザの音声を認証することで判定するステップは、ユーザが正規ユーザであるかどうかを声紋認識によって認証するステップを含む。
本出願の一の実施の形態として、音声情報を認識するステップは、音声情報に含まれる取引データを認識するステップをさらに含む。
本出願の一の実施の形態として、業務情報と、取引データを含む情報とを業務処理装置へ送信するステップは、業務情報と取引データとを業務処理装置へ送信するステップをさらに含む。
本出願の一の実施の形態として、業務情報と、取引データを含む情報とを業務処理装置へ送信するステップは、業務情報と音声情報とを業務処理装置へ送信するステップをさらに含む。
本出願の一の実施の形態として、業務情報と、取引データを含む情報とを受信した後に、業務装置は、業務オーダーのようなオーダー(命令)情報をさらに生成し、これをユーザ端末へ戻してもよい。業務オーダーは、音声情報に従って業務処理装置により認識された業務情報と取引データとを含んでよい。
本出願の一の実施の形態として、業務情報は業務IDと、通信ソフトウェアを介して通信している様々な参加ユーザの識別子とを少なくとも含む。
上で述べた本出願の実施の形態の方法により、ユーザ端末上の通信ソフトウェアにおいて音声により業務を起動する解決策を追加することで、ユーザがチャット中に金銭取引業務を開始できるようになる。ユーザは、チャットインターフェースを終えて複雑なクリック操作を実行することなく金銭取引業務を使用できるため、ユーザにとって複雑な操作は著しく単純化され、これによりユーザはさらに優れたユーザエクスペリエンスを体験できる。さらに、金銭取引業務を開始する音声情報の声紋認識によれば、金銭取引業務を開始しているユーザが正規ユーザであると確信できるので、別の人がインテリジェント端末を使って金銭取引業務を開始する危険要因を回避できる。一方で、同一の音声情報を認証に用いることができ(取引指示と声紋認証内容の両方)、ユーザは本出願の方法をより便利に使えるようになる。
図2は、本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動する方法のフローチャートである。
ステップ201:ユーザ端末から送信された業務情報と、取引データを含む情報とを受信する。
ステップ202:業務情報と、取引データを含む情報とに基づいて業務を処理する。
本出願の一の実施の形態として、取引データを含む情報は音声情報であり、この方法は、音声情報中の取引データを認識するステップをさらに含む。
本出願の一の実施の形態として、ユーザ端末が送信した業務情報と、取引データを含む情報とを受信するステップは、その業務情報と取引データを含む情報とを、今送信しているユーザが、正規ユーザであるかどうかを認証するステップをさらに含む。
本出願の一の実施の形態として、ユーザが正規ユーザであるかどうかは、ユーザ端末から送信された音声情報に声紋認識を実施することで判定される。
本出願の一の実施の形態として、業務情報は、業務IDと、通信ソフトウェアを介して通信している様々な参加ユーザの識別子とを少なくとも含む。業務情報と、取引データを含む情報とを受信すると、業務装置は業務を処理して業務オーダーなどのオーダー(命令)情報を形成し、これを、業務に関与している複数のユーザ端末へ戻す。業務は支払業務を含んでよく、支払業務とは具体的には別のユーザへの送金又は支払などの業務であってよい。
上で述べた本出願の実施の形態の方法によれば、ユーザ端末上で音声機能により起動された業務情報を受信することで、チャットサービスをユーザに提供する工程中に金銭取引業務への応答を行うことができる。ユーザは、チャットインターフェースを終えてから複雑なクリック操作を実行することなく金銭取引業務を使用できるので、ユーザにとって複雑な操作は著しく単純化され、よって、ユーザはより優れたユーザエクスペリエンスを体験できる。さらに、金銭取引業務を開始する音声情報の声紋認識により、金銭取引業務を開始するユーザが正規ユーザであると確信できるので、別の人がインテリジェント端末を用いて金銭取引業務を開始する危険要因を回避できる。一方で、同一の音声情報を認証に用いることができ(取引指示と声紋認証内容の両方)、ユーザは本出願の方法をより便利に使えるようになる。
図3は、本出願による、通信ソフトウェアにおいて音声により業務を起動する装置の概略の構造図である。
この装置は、ユーザが通信ソフトウェアを用いて別の人と通信する場合に、ユーザが入力した音声情報を収集するように構成された収集ユニット301と;
音声情報を認識し、音声情報が特定のコマンドを含む場合には、対応する業務を起動するように構成されたコマンド認識ユニット302と;
業務装置が業務を処理できるように、業務情報と、取引データを含む情報とを業務処理装置へ送信するように構成された送信ユニット303とを備える。
本出願の一の実施の形態として、この装置は、業務処理装置から送信された業務オーダーを受信するように構成された受信ユニット304をさらに含む。
本出願の一の実施の形態として、この装置は、ユーザが正規ユーザであるかどうかを認証するように構成された認証ユニット305をさらに含む。ユーザが正規ユーザであるかどうかを認証ユニットが認証する特定のステップについては、図1に示す実施の形態の方法を参照できるため、ここでは繰り返さない。
本出願の一の実施の形態として、認証ユニット305は、ユーザが正規ユーザであるかどうかを声紋認識によって認証する。
この実施の形態では、受信ユニット及び送信ユニットが、携帯電話(又は、タブレットコンピュータのようなインテリジェント端末)のWiFiモジュール、GPRS、又は3G、4Gネットワークを用いてデータの送受信を行うことができる。収集ユニットは携帯電話(又は、タブレットコンピュータのようなインテリジェント端末)のマイクロフォンであってよい。コマンド認識ユニットは、従来技術の音声認識モジュールを用いて、音声中の特定の言葉を認識することにより特定のコマンドを認識できる。認証ユニットは、次のようなユーザの入力操作によってユーザの正当性を認証することができる。例えば、仮想キーボード(又は物理的キーボード)をクリックすることによる認証情報の入力、スライディングによる認証情報の入力、指紋認識モジュールなどの生体特徴認識モジュールを用いた指紋入力情報の認証、マイクロフォン及び声紋認識モジュールを用いた音声入力情報の認証、カメラ及び人物顔認識モジュールを用いた人物顔のアバターの入力情報の認証。
上で述べた本出願の実施の形態の装置により、ユーザ端末上の通信ソフトウェアにおいて音声により業務を起動する解決法を追加することで、ユーザはチャット中に金銭取引業務を開始することができる。ユーザは、チャットインターフェースを終えて複雑なクリック操作を実行することなく金銭取引業務を行えるので、ユーザにとって複雑な操作が著しく単純化され、これによりユーザはより優れたユーザエクスペリエンスを体験することができる。さらに、金銭取引業務を開始する音声情報の声紋認識により、金銭取引業務を開始しているユーザが正規ユーザであると確信できるので、別の人がインテリジェント端末を用いて金銭取引業務を開始する危険要因を回避できる。一方で、同一の音声情報を認証に用いることができ(取引指示と声紋認証内容の両方)、ユーザは本出願の方法をより便利に使えるようになる。
図4は、本出願の一の実施の形態による、業務処理装置の概略の構造図である。
この装置は、ユーザ端末から送信された業務情報と、取引データを含む情報とを受信するように構成された受信ユニット401と、業務を業務情報と、取引データを含む情報とに基づいて処理するように構成された処理ユニット402とを含む。
本出願の一の実施の形態として、装置は、取引データを含む情報が音声情報である場合に、この音声情報中の取引データを認識するように構成された音声認識ユニット403をさらに含む。
本出願の一の実施の形態として、装置は、業務情報と、取引データを含む情報とを今送信しているユーザが正規ユーザであるかどうかを認証するように構成された認証ユニット404をさらに含む。
本出願の一の実施の形態として、認証ユニット404は、ユーザが正規ユーザであるかどうかを、ユーザ端末から送信された音声情報に声紋認識を実施することで判定するように構成された声紋認識ユニットである。
この実施の形態では、受信ユニットは、例えばイーサネット(登録商標)接続デバイスなどを含むコンピュータの通信ユニットであってよい。コンピュータのCPU、特定の設定をしたDSP、シングルチップマイクロコンピュータのようなデバイスを用いて、オーダー生成ユニットを実現することができる。音声認識ユニットは音声認識モジュールを用いて実現できる。音声認識モジュールは従来技術の音声認識アルゴリズムを使用できるため、ここでは説明を繰り返さない。認証ユニットは、受信した文字列を事前に記憶されている認証情報と比較することによって、認証目的を達成できる。例えば、認証ユニットは、ユーザ端末から送信され、受信した文字列認証情報を、事前に記憶されている認証情報と比較するか、受信した生体特徴を、事前に記憶されている認証情報と比較することで、認証目的を達成できる。例えば、認証ユニットは、ユーザ端末から受信した指紋情報を事前に記憶されている指紋認証情報と比較するか、ユーザ端末から受信した音声情報を事前に記憶されている声紋認証情報と比較するか、又は、ユーザ端末から受信した人物顔のアバター情報を事前に記憶されている人物顔認証情報と比較する。
上で述べた本出願の実施の形態の装置によれば、ユーザ端末上で音声機能により起動した業務情報を受信することで、チャットサービスをユーザに提供する工程中に金銭取引業務への応答を行うことができる。ユーザは、チャットインターフェースを終えてから複雑なクリック操作を実行しなくても金銭取引業務を行えるため、ユーザにとって複雑な操作が著しく単純化され、これによりユーザは一層優れたユーザエクスペリエンスを体験することができる。さらに、金銭取引業務を開始する音声情報の声紋認識により、金銭取引業務を開始しているユーザが正規ユーザであると確信できるので、別の人がインテリジェント端末を使って金銭取引業務を開始する危険要因を回避できる。一方で、同一の音声情報を認証に用いることができ(取引指示と声紋認証内容の両方)、ユーザは本出願の方法をより便利に使えるようになる。
図5は、本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動するデータフロー図である。この実施の形態を特定のアプリケーションのシナリオを例にして説明する。この実施の形態は、通信ソフトウェアを介してチャット中のユーザ端末A及びユーザ端末Bと、ユーザ端末が開始した業務を対応処理する業務処理装置とを含む。ユーザ端末Aとユーザ端末Bは、携帯電話、タブレットコンピュータ、コンピュータなどを含んでよい。通信ソフトウェアはQQソフトウェア、Wechatアプリケーション、Laiwangアプリケーションなどであってよい。当然ながら、別の実施の形態では、チャット通信状態にあるユーザ端末数はさらに多くてよい。
ステップ501:ユーザ端末Aがユーザ端末Bとの間のチャット通信を実施する。
通信はテキスト式チャット通信又は音声式通信を含んでよい。ここで、音声式通信とは、チャットソフトウェアにおいてユーザが音声でショートメッセージを入力して送信するチャット通信方式を指す。
ステップ502:ユーザ端末Aは、ユーザが入力した音声情報を、マイクロフォンを介して収集する。
このステップで収集される音声情報はチャット内容と特定の指示を含んでよい。例えば、ユーザ端末Aが携帯電話のマイクロフォンを使って音声情報「こんにちは」を入力し、これをユーザ端末Bへ送信すると、ユーザ端末Bが音声情報で「こんにちは」と応答し、次に、ユーザ端末Aがマイクロフォンを介して「全能なるAlipay集金、あなたに100元請求したい」と入力する。音声情報は特定コマンド「全能なるAlipay集金」と、取引データ「あなたに100元請求したい」を含んでいる。
ステップ503:ユーザ端末Aのコマンド認識ユニットが、ユーザが入力した全ての音声情報を認識する。
音声認識にはユーザ端末A内の音声認識モジュールを使えるので、ここでは説明を繰り返さない。
ステップ504:認識した音声情報に特定コマンドが含まれているかどうかを判定し、特定コマンドが含まれている場合にはステップ505を、特定コマンドが含まれていない場合にはステップ506を実行する。
この実施例では、ユーザ端末Aが、ユーザが入力した音声情報「こんにちは」には特定コマンドが含まれていないと認識し、ステップ506を実行して音声情報をチャット内容として通常送信する。ユーザが入力した「全能なるAlipay集金、あなたに100元請求したい」には、特定コマンド「全能なるAlipay集金」が含まれている。当然ながら、別の実施の形態では、特定コマンドは、一般的なチャット音声情報と違ったものである限り、これとは別のものであってよい。
ステップ505:入力された音声情報に声紋認識を実施し、この声紋認識が成功した場合にはステップ507を、失敗した場合にはステップ508を実行する。
このステップでは、ユーザは、比較的正確な声紋モデルを取得する前に、携帯電話の声紋認識のトレーニングを実行する。声紋モデルは、隠れマルコフモデル(HMM)、ガウス混合モデル(GMM)、サポートベクターマシン(SVM)などであってよい。次に、実行中の音声情報に声紋認識を実施する。例えば、現在業務を開始しているユーザが正規ユーザであるかどうかを確認するために、「全能なるAlipay集金」を声紋モデルと照合する。こうすることで、従来技術で発生した、携帯電話を別の人が用いた場合に、取引を開始した友人への金銭取引によって金銭損失が生じる可能性を回避できる。一方で、ユーザが声紋情報をアップロードしたサーバが攻撃されて情報漏洩が生じた場合にユーザの個人情報が漏洩してしまう問題を回避するために、手元の携帯電話で声紋認識を実施する。
当然ながら、別の実施の形態では、このステップでユーザが正規ユーザであるかどうかを認証することは、ユーザがユーザ端末Aのタッチ画面又はキーボード上でパスワードを入力することでさらに代用でき(又は、例えば、電源キーと音量下げキーを同時に押すなどの、キーを組み合わせて押すこともパスワードとしてさらに使用できる)、パスワードが正確である場合にのみ、実行中の業務が正規ユーザによって開始されていると証明できる。あるいは、例えば、ユーザ端末Aのタッチ画面上で指によるスライド操作を用いることで、スライド操作の進路が所定の進路であれば、実行中の業務が正規ユーザによって開始されたものであると証明できる。同様に、さらに指紋認識方式を用いてもよい。既存の携帯電話の多くは指紋認識ユニットを設けており、ユーザが指紋認識ユニットに圧力をかけたり指紋認識ユニットで指紋サンプルを取ったりすると、その指紋は事前に記憶されている指紋と比較される。比較結果が一致した場合は、実行中の業務が正規ユーザによって開始されたと証明される。別の例として、現在、業務を開始しているユーザが正規ユーザであるかどうかを、携帯電話のカメラで現在のユーザの人物顔画像を採取し、人物顔認識を実施することによってもさらに認証できる。これ以外にも多くの認証方法を利用できるが、本出願では説明を繰り返さない。
別の実施の形態として、このステップの声紋認識(又は、その他の認証方法)を業務処理装置においても実施できる。この場合には、業務処理装置へ事前に声紋サンプルデータベース(又は、別の認証方法で必要な対応データ)を設定しておくことができる。業務要求が送信されると、リモートエンドでユーザを認証するために、音声情報又は別の認証方法で必要なデータが業務処理装置へ送信される。
上で述べた実施の形態から分かるように、声紋を使った認識は好ましい実施の形態である。なぜなら、ユーザが音声情報(すなわち、特定コマンド及び取引データを含んでいる)を入力している間にユーザ正当性の認証を実行することが可能であり、ユーザはさらなる認証情報を再び入力する必要がないので、ユーザは対応の業務をより便宜的かつ迅速に起動させることができ、これによりユーザエクスペリエンスが向上するからである。
他の実施の形態では、ユーザの正当性の認証をさらにステップ501の前又は後に設定するか、あるいは同時に実行することもできる。この認証は、ユーザが通信ソフトウェアを開始するときに実行されるため、ユーザの正当性が保証される。あるいは、この認証は、ユーザAがユーザBとチャット通信を実施するときに実行することもできる。例えば、チャットソフトウェアの使用工程中にチャット目的で音声ショートメッセージが入力された際に、ユーザの正当性を認証するために声紋認識が実施される。あるいは、別のステップにおいて認証を行ってもよい。例えば、特定のコマンドが含まれているかどうかを判定するために、ユーザが入力した音声情報に音声認識を実施する工程において、声紋認識を実施してユーザの正当性を認証する。この認証方法については先の説明で包括的に述べており、異なる点は認証のタイミングだけであることから、ここでは認証方法についての説明を繰り返さない。
ステップ506:チャット内容としての音声情報を通常送信する。
ステップ507:集金業務モジュールを開始して、業務処理装置への集金業務要求を開始する。
このステップでは、集金業務要求は業務情報と音声情報を含む。業務情報は、業務ID(集金業務を表す)と、チャット通信における異なる参加ユーザ識別子(ユーザ端末A及びユーザ端末Bのユーザの一意識別子、又はSIMカードの一意識別子など)を含む。音声情報は「全能なるAlipay集金、あなたに100元請求したい」を含み、音声情報は取引データ「あなたに100元請求したい」を含む。
ステップ508:エラー情報がユーザに対して表示され、集金業務モジュールは開始されない。
ステップ509:業務処理装置がユーザ端末Aから送信された集金業務要求を構文解析する。
業務情報から、現在処理対象である業務(業務IDに従って取得)、この業務に関与するユーザ(ユーザ識別子を介して取得)、音声情報が取得される。
ステップ510:音声情報に含まれている取引データを取得するために、音声情報に音声認識を実施する。
このステップでは、音声情報に含まれている取引データを取得するために、音声認識ユニットを用いて音声情報に認識を実施してもよい。高性能コンピュータを用いて構成された業務処理装置は、比較的正確な音声認識結果を提供することができる、言い換えれば、音声情報中の正確な取引データを取得することができる。
この実施例では、認識される取引データは「あなたに100元請求したい」である。実行中の通信の意味解析及びユーザ識別子によって、支払先はユーザ端末A、支払元はユーザ端末B、取引金額は100元であることが判定される。
ステップ511:業務を処理し、業務オーダーを生成し、この業務オーダーを業務に関係しているユーザ端末Aとユーザ端末Bに送信する。
業務ID及び業務に関与するユーザに従って、また、取引データに従って対応の業務を処理し、業務オーダーを生成して、この集金業務に関わる双方に送信する。ユーザ端末Aに送信する業務オーダーは通知であり、ユーザ端末Bに送信する業務オーダーは支払要求である。ユーザ端末Bは、従来技術の業務工程に従って支払操作を実行してもよい。
図6は、本出願の一の実施の形態による、通信ソフトウェアにて音声で業務を起動する別のデータフロー図である。
この実施の形態は、通信ソフトウェアを用いてチャット中のユーザ端末A、ユーザ端末B、ユーザ端末Cと、これらユーザ端末が開始した業務を対応処理するように構成された業務処理装置とを含む。
ステップ601において、ユーザ端末A、ユーザ端末B、ユーザ端末Cがチャット通信を実施する。
ステップ602:ユーザ端末Aは、ユーザが入力した音声情報を、マイクロフォンを介して収集する。
この実施の形態では、図5に示す実施の形態と同一の内容については説明を繰り返さない。このステップにおいて、特定の指示を含む音声情報は「全能なるAlipay集金、ユーザ端末Cに100元を支払いたい」である。
ステップ603:ユーザ端末Aのコマンド認識ユニットが、ユーザが入力した全ての音声情報を認識する。
このステップでは、音声情報「全能なるAlipay集金、ユーザ端末Cに100元を支払いたい」が完全に認識される。言い換えれば、特定の指示「全能なるAlipay集金」が認識されるだけでなく、取引データ「ユーザ端末Cに100元を支払いたい」も認識される。実行中の通信の意味解析及びユーザ識別子によって次の取得データが取得される。支払元はユーザ端末A、支払先はユーザ端末C、取引金額は100元である。
ステップ604:認識された音声情報が特定コマンドを含んでいるかどうかを判定し、特定コマンドを含む場合にはステップ605を、含まない場合にはステップ606を実行する。
ステップ605:入力された音声情報に声紋認識を実施し、声紋認識が成功した場合にはステップ607を、失敗した場合にはステップ608を実行する。
このステップでは、ユーザ正当性の認証を声紋認識によって行うが、これは図5に示す実施の形態のようなその他の認証方法を用いて実施してもよいため、ここでは説明を繰り返さない。
さらに、このステップでのユーザ正当性の認証は、業務処理装置内で実施してもよい。この場合には、ユーザ正当性の認証に必要なデータが業務処理装置へ送信される必要がある。
ステップ607:業務処理装置への支払業務要求を開始するために、支払業務モジュールを開始する。
このステップでは、支払業務要求が業務情報と取引データとを含む。業務情報は業務ID(集金業務を表す)と、チャット通信の各参加者のユーザ識別子(ユーザ端末A、ユーザ端末B、ユーザ端末C)とを含む。取引データは、支払元がユーザ端末Aであり、支払先がユーザ端末Cであり、取引金額が100元である。
ステップ608:エラー情報がユーザに対して表示され、支払業務モジュールは開始されない。
ステップ609:業務処理装置が、ユーザ端末Aが送信した集金業務要求を構文解析する。
業務情報から現在処理対象である業務(業務IDに従って取得)が取得され、また、取引データから、支払元がユーザ端末Aであり、支払先がユーザ端末Cであり、取引金額が100元であることが取得される。すでに音声認識をユーザ端末Aで実施しているので、このステップでの構文解析に音声認識は不要であり、また、ユーザ端末Aから送信された支払業務要求は文字形式の業務情報と取引データとを含む。
ステップ610:業務処理装置は業務を処理し、業務オーダーを生成して、これを当該の業務に関連するユーザ端末Aとユーザ端末Cに送信する。
業務オーダーは業務ID及び業務に関与するユーザに従って、また、取引データに従って生成される。業務オーダーは支払業務に関わる双方に送信される。ユーザ端末Aに送信される業務オーダーは支払要求であり、ユーザ端末Aは従来技術の業務工程に従って支払操作を実行してもよい。ユーザ端末Cに送信される業務オーダーは集金通知である。
上で述べた本出願の実施の形態における方法及び装置によって、ユーザ端末にて音声機能で起動することにより、ユーザにチャットサービスを提供している工程中に、金銭取引業務に対する応答を行うことができる。ユーザは、チャットインターフェースを終えて複雑なクリック操作を実行することなく金銭取引業務を行えるので、ユーザにとって複雑な操作は著しく単純化され、これによりユーザは一層優れたユーザエクスペリエンスを体験することができる。さらに、金銭取引業務を開始する音声情報の声紋認識によれば、金銭取引業務を開始しているユーザが正規ユーザであると確信できるので、別の人がインテリジェント端末を使って金銭取引業務を開始する危険要因を回避できる。一方で、同一の音声情報を認証に用いることができ(取引指示と声紋認証内容の両方)、ユーザは本出願の方法をより便利に使えるようになる。
技術の向上は、ハードウェアの改良(例えば、ダイオード、トランジスタ、スイッチのような回路構造の改良)、又はソフトウェアの改良(方法手順の改良)として明確に区別できる。しかし、技術の開発に伴い、現在、多くの方法手順の改良はハードウェア回路構造の直接の改良とみなされ得る。ほぼ全ての設計者は、改良した方法手順をハードウェア回路に組み込むことで、この方法手順に対応したハードウェア回路構造を得ている。そのため、方法手順はハードウェアエンティティ(実体)モジュールを用いて改良することができないと仮定することは不可能である。例えば、プログラマブル論理デバイス(PLD)(例えば、フィールドプログラマブルゲートアレイ(FPGA))はこのような集積回路であり、その論理機能はユーザプログラミングデバイスによって決定される。設計者は、専用の集積回路チップ2の設計及び製造をチップメーカに依頼するのではなく、デジタルシステムを1つのPLDの中に統合するよう独自でプログラムする。さらに、現在、プログラミングは、集積回路チップを手作業で製造するのではなく、ほとんどが「論理コンパイラ」ソフトウェアを用いて実施されている。このソフトウェアは、プログラムの開発及び書き込みに使用されるソフトウェアコンパイラと類似しており、また、コンパイリング前のオリジナルコードはハードウェア記述言語(HDL)と呼ばれる特定のプログラミング言語で書かれている必要がある。HDLには、ABEL(Advanced Boolean Expression Language)、AHDL(アルテラハードウェア記述言語:Altera Hardware Description Language)、Confluence、CUPL(コーネル大学プログラミング言語:Cornell University Programming Language)、HDCal、JHDL(Java(登録商標)ハードウェア記述言語:Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Rubyハードウェア記述言語:Ruby Hardware Description Language)など種々あり、中でも、VHDL(超高速集積回路ハードウェア記述言語:Very-High-Speed Integrated Circuit Hardware Description Language)とVerilog2が現在最も一般的に使用されている。当業者は、上で述べたいくつかのハードウェア記述言語を用いて方法手順を論理的にプログラミングし、これを集積回路に組み込むことで、論理方法手順を実施するためのハードウェア回路を容易に得られることも熟知しているはずである。
制御装置は任意の適切な方法で実現できる。例えば、制御装置はマイクロプロセッサ又はプロセッサ、コンピュータ読取り可能な媒体の形態であってよく、コンピュータ読取り可能な媒体は、(マイクロ)プロセッサ、論理ゲート、スイッチ、特定用途向け集積回路(ASIC)、プログラマブル論理制御装置、埋込型マイクロコントローラによって実行可能な、コンピュータ読取り可能なプログラムコード(例えばソフトウェア又はファームウェア)を記憶する。制御装置の例は次のマイクロコントローラを非限定的に含む。ARC625D、Atmel AT91SAM、Microchip PIC18F26K20、Silicone Labs C8051F320。メモリ制御装置をメモリの制御論理の一部として実現してもよい。
当業者は、制御装置を純粋なコンピュータ読取り可能なプログラムコードを用いて実現するだけでなく、制御装置に、論理ゲート、スイッチ、特定用途向け集積回路、プログラマブル論理制御装置、埋込型マイクロコントローラの形態にて同じ機能を実施させるよう、方法ステップを論理的にプログラムできることも熟知している。したがって、このような制御装置はハードウェアコンポーネントとみなすことができ、また、制御装置に内蔵され、様々な機能を実施するように構成された装置もハードウェアコンポーネント内部の構造体とみなすことができる。あるいは、様々な機能を実施するように構成された装置は、方法を実施するためのソフトウェアモジュールと、ハードウェアコンポーネント内の構造体の両方、とみなすこともできる。
上記の実施の形態で例証したシステム、装置、モジュール又はユニットは、具体的には、コンピュータチップ又はエンティティ(実体)、もしくは、特定の機能を持った製品を用いて実現することができる。
説明を容易にするために、前述の装置を、機能に関連した種々のユニットに分割して説明した。本出願を実施する際には、種々のユニットの機能は、同一もしくは複数のソフトウェア及び/又はハードウェアで実施できることは明らかである。
上で述べた実施方法の説明に基づき、当業者は、本出願がソフトウェア及び必要なユニバーサルハードウェアプラットフォームで実施できることを明確に理解できる。この理解に基づき、本質的な本出願の技術的解決、又は従来技術に寄与する部分は、ソフトウェア製品の形態で実施され得る。このソフトウェア製品は、ROM/RAM、磁気ディスク、又は光学ディスクのような記憶媒体に記憶できる。また、このソフトウェア製品は、コンピュータデバイス(パーソナルコンピュータ、サーバ、ネットワークデバイスなどであってよい)に本出願の実施の形態又は実施の形態の特定部分に記載の方法を実行させることが可能ないくつかのインストラクション(命令、指示)を含んでいる。
本明細書の実施の形態は段階的に説明されており、種々の実施の形態の同一又は類似の部分は相互参照によって得られ、それぞれの実施の形態は他の実施の形態とは異なる部分を強調している。特に、システムの実施の形態は方法の実施の形態と基本的に類似するので、説明は簡単である。関連部分については、方法の実施の形態における該当部分の説明を参照されたい。
本出願は様々な汎用(ユニバーサル)又は専用のコンピュータシステム環境又は構成に適用できる。例えば、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルド型機器又はポータブル機器、タブレット機器、マルチプロセッサシステム、マイクロプロセッサベースシステム、セットトップボックス、プログラム可能な家電用電子デバイス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、及び上記の任意のシステム又は機器を含む分散コンピューティング環境である。
本出願は、プログラムモジュールなど、コンピュータによって実行されるコンピュータで実行可能なインストラクション(命令、指示)の一般的な文脈内において記述され得る。一般に、プログラムモジュールは、特定タスクの実行又は特定の抽象データ型の実装のための、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。本出願は分散コンピューティング環境でも実施することができ、分散コンピューティング環境では、タスクは、通信ネットワークを介して接続されているリモート処理デバイスを用いて実行される。分散コンピューティング環境では、プログラムモジュールは記憶装置を含むローカル及びリモートのコンピュータ記憶媒体内に配置されてよい。
本出願を実施の形態によって説明したが、当業者は、本出願の精神から逸脱せずに本出願に多くの変形及び変更を加えることが可能であり、これらの変形及び変更は、本出願の精神から逸脱せずに添付する特許請求の範囲に含まれるものであることを理解するはずである。

Claims (22)

  1. 通信ソフトウェアにおいて音声により業務を起動する方法であって:
    ユーザが通信ソフトウェアを用いて別の人と通信する際に、前記ユーザが入力した音声情報を収集するステップと;
    前記音声情報を認識し、前記音声情報が特定コマンドを含む場合には、対応する業務を起動するステップと;
    業務処理装置が前記業務を処理できるようにするために、業務情報と、取引データを含む情報とを前記業務処理装置へ送信するステップと;を備える、
    通信ソフトウェアにおいて音声により業務を起動する方法。
  2. 前記ユーザが正規ユーザであるかどうかを認証するステップ;をさらに備える、
    請求項1に記載の方法。
  3. 前記ユーザが正規ユーザであるかどうかを認証する前記ステップは、前記ユーザが正規ユーザであるかどうかを、前記ユーザの入力操作を認証することによって、又は、前記ユーザの生体特徴を認証することによって判定するステップ;をさらに備える、
    請求項2に記載の方法。
  4. 現在音声情報を入力している前記ユーザが正規ユーザであるかどうかを認証する前記ステップは、声紋認識によって認証される、
    請求項2に記載の方法。
  5. 前記音声情報が認識されると、前記音声情報内に含まれている取引データがさらに認識される、
    請求項1に記載の方法。
  6. 業務情報と、取引データを含む情報とを業務処理装置へ送信する前記ステップは、具体的に、前記業務情報と前記取引データとを前記業務処理装置へ送信するステップ;を備える、
    請求項5に記載の方法。
  7. 業務情報と、取引データを含む情報とを業務処理装置へ送信する前記ステップは、具体的に、前記業務情報と前記音声情報とを前記業務処理装置へ送信するステップ;を備え、
    前記音声情報は、取引データを含む、
    請求項1に記載の方法。
  8. 前記業務情報は、業務IDと、前記通信ソフトウェアを介して通信している様々な参加ユーザの識別子とを少なくとも含む、
    請求項1に記載の方法。
  9. 業務情報と、取引データを含む情報とを業務処理装置へ送信する前記ステップの後に、前記方法は、前記業務処理装置から送信された業務オーダーを受信するステップ;をさらに備える、
    請求項1に記載の方法。
  10. 通信ソフトウェアにおいて音声により業務を起動する方法であって:
    ユーザ端末から送信された業務情報と、取引データを含む情報とを受信するステップと;
    前記業務情報と、前記取引データを含む情報とに基づいて業務を処理するステップと;を備える、
    通信ソフトウェアにおいて音声により業務を起動する方法。
  11. 前記取引データを含む情報は、音声情報であり、
    前記方法は、前記音声情報中の前記取引データを認識するステップ;をさらに備える、
    請求項10に記載の方法。
  12. ユーザ端末から送信された、前記業務情報と、前記取引データを含む情報とを受信するステップは、前記業務情報と、前記取引データを含む情報とを現在送信しているユーザが正規ユーザであるかどうかを認証するステップ;をさらに備える、
    請求項10に記載の方法。
  13. 前記ユーザが正規ユーザであるかどうかは、前記ユーザ端末から送信された前記音声情報に声紋認識を実施することにより判定される、
    請求項12に記載の方法。
  14. 前記業務情報は、業務IDと、前記通信ソフトウェアを介して通信している様々な参加ユーザの識別子と;を少なくとも備える、
    請求項10に記載の方法。
  15. 通信ソフトウェアにおいて音声により業務を起動する装置であって:
    ユーザが通信ソフトウェアを用いて別の人と通信する場合に、前記ユーザが入力した音声情報を収集するように構成された収集ユニットと;
    前記音声情報を認識し、前記音声情報が特定コマンドを含む場合には、対応する業務を起動するように構成されたコマンド認識ユニットと;
    業務処理装置が前記業務を処理できるように、業務情報と、取引データを含む情報とを前記業務処理装置へ送信するように構成された送信ユニットと;を備える、
    通信ソフトウェアにおいて音声により業務を起動する装置。
  16. 前記ユーザが正規ユーザであるかどうかを認証するように構成された認証ユニット;をさらに備える、
    請求項15に記載の装置。
  17. 前記認証ユニットは、前記ユーザが正規ユーザであるかどうかを声紋認識によって認証する、
    請求項16に記載の装置。
  18. 前記業務処理装置から送信された業務オーダーを受信するように構成された受信ユニット;をさらに備える、
    請求項15に記載の装置。
  19. 業務処理装置であって:
    ユーザ端末から送信された業務情報と取引データを含む情報とを受信するように構成された受信ユニットと;
    前記業務情報と取引データを含む情報とに基づいて業務を処理するように構成された処理ユニットと;を備える、
    業務処理装置。
  20. 前記取引データを含む情報が音声情報である場合に、前記音声情報中の前記取引データを認識するように構成された音声認識ユニット;をさらに備える、
    請求項19に記載の装置。
  21. 前記業務情報と、前記取引データを含む情報とを現在送信しているユーザが正規ユーザであるかどうかを認証するように構成された認証ユニット;をさらに備える、
    請求項19に記載の装置。
  22. 前記認証ユニットは、前記ユーザが正規ユーザであるかどうかを、前記ユーザ端末から送信された前記音声情報に声紋認識を実施することで判定するように構成された声紋認識ユニットである、
    請求項21に記載の装置。
JP2017548264A 2015-03-13 2016-03-02 通信ソフトウェアにおいて音声により業務を起動する方法及びこれに対応する装置 Active JP6859501B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510111878.7 2015-03-13
CN201510111878.7A CN106034063A (zh) 2015-03-13 2015-03-13 一种在通信软件中通过语音启动业务的方法及相应装置
PCT/CN2016/075377 WO2016145992A1 (zh) 2015-03-13 2016-03-02 一种在通信软件中通过语音启动业务的方法及相应装置

Publications (3)

Publication Number Publication Date
JP2018517917A true JP2018517917A (ja) 2018-07-05
JP2018517917A5 JP2018517917A5 (ja) 2019-04-11
JP6859501B2 JP6859501B2 (ja) 2021-04-14

Family

ID=56918393

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017548264A Active JP6859501B2 (ja) 2015-03-13 2016-03-02 通信ソフトウェアにおいて音声により業務を起動する方法及びこれに対応する装置

Country Status (7)

Country Link
US (1) US10353666B2 (ja)
EP (1) EP3270550B1 (ja)
JP (1) JP6859501B2 (ja)
KR (1) KR102388512B1 (ja)
CN (1) CN106034063A (ja)
SG (1) SG11201707417YA (ja)
WO (1) WO2016145992A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020021230A (ja) * 2018-07-31 2020-02-06 株式会社日本総合研究所 送金処理装置、及びプログラム
JP2020173668A (ja) * 2019-04-11 2020-10-22 国立大学法人 鹿児島大学 認証システム、認証方法及びプログラム

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977834B (zh) * 2016-10-21 2022-03-18 阿里巴巴集团控股有限公司 一种虚拟现实/增强现实空间环境中的数据对象交互方法及装置
CN107437416B (zh) * 2017-05-23 2020-11-17 创新先进技术有限公司 一种基于语音识别的咨询业务处理方法及装置
CN107731234A (zh) * 2017-09-06 2018-02-23 阿里巴巴集团控股有限公司 一种身份验证的方法及装置
US11216801B2 (en) * 2017-11-01 2022-01-04 Mastercard International Incorporated Voice controlled systems and methods for onboarding users and exchanging data
US11900339B1 (en) * 2017-11-30 2024-02-13 Worldpay, Llc Systems and methods for hyperledger-based payment transactions, alerts, and dispute settlement, using smart contracts
CN107911483A (zh) 2017-12-12 2018-04-13 阿里巴巴集团控股有限公司 一种信息传输方法和装置
DE102018200088B3 (de) * 2018-01-04 2019-06-13 Volkswagen Aktiengesellschaft Verfahren, Vorrichtung und computerlesbares Speichermedium mit Instruktionen zum Verarbeiten einer Spracheingabe, Kraftfahrzeug und Nutzerendgerät mit einer Sprachverarbeitung
JP7141226B2 (ja) * 2018-03-20 2022-09-22 シャープ株式会社 音声入力装置、及び遠隔対話システム
CN110490592A (zh) * 2018-05-15 2019-11-22 上海博泰悦臻网络技术服务有限公司 基于人脸识别的车内消费支付方法与云端服务器
JP2020004192A (ja) * 2018-06-29 2020-01-09 株式会社フュートレック 通信装置および通信装置を備える音声認識端末装置
CN108985739A (zh) * 2018-07-06 2018-12-11 上海博泰悦臻电子设备制造有限公司 车内支付的处理方法、系统、计算机存储介质及车机端
CN109150696B (zh) * 2018-08-29 2021-08-10 江苏奇异点网络有限公司 信息处理方法、服务器、客户端及计算机可读存储介质
CN109347721B (zh) * 2018-09-28 2021-12-24 维沃移动通信有限公司 一种信息发送方法及终端设备
CN109960918A (zh) * 2019-03-14 2019-07-02 中国银行股份有限公司 一种业务处理方法、装置及设备
CN111833864B (zh) * 2019-04-22 2024-04-16 北京京东尚科信息技术有限公司 信息处理方法、装置、系统和可读介质
JP7462634B2 (ja) * 2019-07-17 2024-04-05 ホシデン株式会社 マイクユニット
US10839060B1 (en) * 2019-08-27 2020-11-17 Capital One Services, Llc Techniques for multi-voice speech recognition commands
CN113556695B (zh) * 2021-06-29 2022-12-09 东软集团股份有限公司 一种基于5g消息的信息交互方法、信息交互系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1139540A (ja) * 1998-05-18 1999-02-12 Toshiba Corp 自動取引装置
US6383074B1 (en) * 1999-04-16 2002-05-07 Amtote International, Inc. Methods and apparatus for parimutuel gaming using speech recognition
JP2002279245A (ja) * 2001-03-19 2002-09-27 Ntt Docomo Inc サービスセンタ及び発注受付方法
JP2009521745A (ja) * 2005-12-22 2009-06-04 マイクロソフト コーポレーション 音声で起動されるネットワーク動作
WO2011037134A1 (ja) * 2009-09-24 2011-03-31 日本電信電話株式会社 電子決済方法、システム、サーバ及びそのプログラム
WO2014173286A1 (en) * 2013-04-26 2014-10-30 Tencent Technology (Shenzhen) Company Limited Method and apparatus for implementing a network transaction

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5893902A (en) * 1996-02-15 1999-04-13 Intelidata Technologies Corp. Voice recognition bill payment system with speaker verification and confirmation
JP2004318731A (ja) 2003-04-18 2004-11-11 Chugoku Electric Power Co Inc:The 音声認識による指令のセキュリティ方法及びこの方法を用いた各種取引方法
CN1797452A (zh) * 2004-12-24 2006-07-05 华为技术有限公司 基于智能网的语音支付系统及其方法
CN101595521A (zh) 2006-06-28 2009-12-02 行星付款公司 基于电话的商务系统和方法
UA101469C2 (uk) * 2006-08-01 2013-04-10 К'Юпей Холдінгс Лімітед Система авторизації транзакцій та спосіб її застосування
CN1905598A (zh) * 2006-08-18 2007-01-31 北京邮电大学 基于语音识别技术的搜索和获取wap网址的方法和系统
US20080095331A1 (en) 2006-10-18 2008-04-24 Prokom Investments S.A. Systems and methods for interactively accessing networked services using voice communications
US20080177661A1 (en) * 2007-01-22 2008-07-24 Divya Mehra System and methods for phone-based payments
US8271285B2 (en) * 2007-08-02 2012-09-18 International Business Machines Corporation Using speaker identification and verification speech processing technologies to activate and deactivate a payment card
US8090650B2 (en) * 2008-07-24 2012-01-03 At&T Intellectual Property I, L.P. Secure payment service and system for interactive voice response (IVR) systems
US8275097B2 (en) * 2008-08-28 2012-09-25 Ebay Inc. Voice phone-based method and system to authenticate users
US8117036B2 (en) * 2008-12-03 2012-02-14 At&T Intellectual Property I, L.P. Non-disruptive side conversation information retrieval
KR101089385B1 (ko) 2009-03-09 2011-12-02 주식회사 비즈모델라인 음성 결제 처리방법
CN101777101B (zh) * 2010-01-22 2013-12-18 北京深思洛克软件技术股份有限公司 一种提高智能密钥设备易用性的方法和智能密钥设备
US8554280B2 (en) * 2010-03-23 2013-10-08 Ebay Inc. Free-form entries during payment processes
KR101318958B1 (ko) * 2010-05-06 2013-10-29 (주)시루정보 전자결제 서비스 방법과, 이를 실행하는 전자결제 서비스 장치, 이동통신 단말기 및 거래 단말기
US8767035B2 (en) * 2011-12-06 2014-07-01 At&T Intellectual Property I, L.P. In-call command control
KR20130104470A (ko) 2012-03-14 2013-09-25 주식회사 포스뱅크 Pos 시스템에서 음성 인식을 이용한 서비스 제공 방법 및 장치
US9361878B2 (en) * 2012-03-30 2016-06-07 Michael Boukadakis Computer-readable medium, system and method of providing domain-specific information
CN102917000A (zh) * 2012-07-17 2013-02-06 上海语联信息技术有限公司 智能云语音应用服务技术平台
CN103152244B (zh) * 2013-01-30 2015-12-02 歌尔声学股份有限公司 一种控制即时通信平台通信的方法、装置和通信系统
WO2014139117A1 (en) * 2013-03-14 2014-09-18 Intel Corporation Voice and/or facial recognition based service provision
US9576758B2 (en) 2013-04-22 2017-02-21 Chang Zhou Current Supply Company Of Jiangsu Electric Power Company Portable single-phase air bypass switch for live power distribution network
CN103929540A (zh) * 2014-04-25 2014-07-16 浙江翼信科技有限公司 一种消息操作方法及装置
US20160012422A1 (en) * 2014-07-11 2016-01-14 Google Inc. Hands-free transactions with a transaction confirmation request
EP3195145A4 (en) * 2014-09-16 2018-01-24 VoiceBox Technologies Corporation Voice commerce

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1139540A (ja) * 1998-05-18 1999-02-12 Toshiba Corp 自動取引装置
US6383074B1 (en) * 1999-04-16 2002-05-07 Amtote International, Inc. Methods and apparatus for parimutuel gaming using speech recognition
JP2002279245A (ja) * 2001-03-19 2002-09-27 Ntt Docomo Inc サービスセンタ及び発注受付方法
JP2009521745A (ja) * 2005-12-22 2009-06-04 マイクロソフト コーポレーション 音声で起動されるネットワーク動作
WO2011037134A1 (ja) * 2009-09-24 2011-03-31 日本電信電話株式会社 電子決済方法、システム、サーバ及びそのプログラム
WO2014173286A1 (en) * 2013-04-26 2014-10-30 Tencent Technology (Shenzhen) Company Limited Method and apparatus for implementing a network transaction

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020021230A (ja) * 2018-07-31 2020-02-06 株式会社日本総合研究所 送金処理装置、及びプログラム
JP7085437B2 (ja) 2018-07-31 2022-06-16 株式会社日本総合研究所 送金処理装置、及びプログラム
JP2020173668A (ja) * 2019-04-11 2020-10-22 国立大学法人 鹿児島大学 認証システム、認証方法及びプログラム

Also Published As

Publication number Publication date
WO2016145992A1 (zh) 2016-09-22
CN106034063A (zh) 2016-10-19
US10353666B2 (en) 2019-07-16
KR102388512B1 (ko) 2022-04-20
EP3270550B1 (en) 2021-07-07
EP3270550A4 (en) 2018-12-12
SG11201707417YA (en) 2017-10-30
EP3270550A1 (en) 2018-01-17
KR20170129203A (ko) 2017-11-24
US20170371620A1 (en) 2017-12-28
JP6859501B2 (ja) 2021-04-14

Similar Documents

Publication Publication Date Title
JP6859501B2 (ja) 通信ソフトウェアにおいて音声により業務を起動する方法及びこれに対応する装置
US10650824B1 (en) Computer systems and methods for securing access to content provided by virtual assistants
US20140090039A1 (en) Secure System Access Using Mobile Biometric Devices
EP2779012B1 (en) Pro-Active Identity Verification For Authentication Of Transaction Initiated Via Non-Voice Channel
CN109656512A (zh) 基于语音助手的交互方法、装置、存储介质及终端
CN103686274A (zh) 带指纹识别功能的安卓智能电视遥控器及其遥控处理方法
CN105656850B (zh) 一种数据处理方法、相关装置及系统
WO2016119359A1 (zh) 一种基于语音控制的移动支付方法和装置
US11010763B1 (en) Biometric authentication on push notification
CN107533598B (zh) 应用程序的登录密码的输入方法、装置和终端
CN113826135B (zh) 使用话音识别进行非接触式认证的系统、方法和计算机系统
CN110399708A (zh) 一种双重身份认证方法、装置以及电子设备
WO2016197717A1 (zh) 一种在移动终端上输入信息的方法及装置
WO2018140155A1 (en) Systems and methods for using nonvisual communication to obtain permission for authorizing a transaction
US10270771B1 (en) Mid-session live user authentication
WO2016086708A1 (zh) 支付验证方法、装置及系统
WO2016065739A1 (zh) 一种智能终端及身份认证方法
CN106487754A (zh) 认证方法
CN106411523B (zh) 银行卡密码的生成方法、校验方法、设备以及系统
US10440003B2 (en) Automatic on demand re-authentication of software agents
WO2021169731A1 (zh) 一种将生物特征同虚拟资源关联的方法、系统及非暂时性存储介质
CN113011891B (zh) 应用于关联支付的核身处理方法及装置
CN111598577B (zh) 资源转移方法、装置、计算机设备和存储介质
CN110166417B (zh) 任务执行方法、装置、计算机设备和存储介质
WO2020191547A1 (zh) 生物识别方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190304

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200324

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20200601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201124

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20201224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201224

R150 Certificate of patent or registration of utility model

Ref document number: 6859501

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250