JP5652406B2 - 音声入力システムおよび音声入力プログラム - Google Patents

音声入力システムおよび音声入力プログラム Download PDF

Info

Publication number
JP5652406B2
JP5652406B2 JP2011545934A JP2011545934A JP5652406B2 JP 5652406 B2 JP5652406 B2 JP 5652406B2 JP 2011545934 A JP2011545934 A JP 2011545934A JP 2011545934 A JP2011545934 A JP 2011545934A JP 5652406 B2 JP5652406 B2 JP 5652406B2
Authority
JP
Japan
Prior art keywords
voice
telephone
identification information
terminal device
input system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011545934A
Other languages
English (en)
Other versions
JPWO2011074180A1 (ja
Inventor
長友 健太郎
健太郎 長友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011545934A priority Critical patent/JP5652406B2/ja
Publication of JPWO2011074180A1 publication Critical patent/JPWO2011074180A1/ja
Application granted granted Critical
Publication of JP5652406B2 publication Critical patent/JP5652406B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42025Calling or Called party identification service
    • H04M3/42034Calling party identification service
    • H04M3/42042Notifying the called party of information on the calling party
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42195Arrangements for calling back a calling subscriber
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/41Electronic components, circuits, software, systems or apparatus used in telephone systems using speaker recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、音声入力システムおよび音声入力プログラムに関する。
近年、情報を音声で入力して、音声認識処理技術を用いて当該音声をテキストデータに変換する技術が開発されている。また、電話を用いて音声を入力して音声認識処理を行うことも試みられている。
特許文献1(特開2001−268241号公報)には、マイクとスピーカと表示画面とキー操作部が設けられ、音声通信機能及びパケット通信機能を有する無線携帯端末と、前記無線携帯端末がパケット通信を実行中に前記無線携帯端末との間で音声通信を行う音声制御部と、該音声制御部で受信した前記無線携帯端末からの音声信号を認識する音声認識部と、該音声認識部で認識された音声情報に対応する情報を検索する情報検索部と、該情報検索部で検索した情報の中で音声に変換可能な情報を音声信号に変換して前記音声制御部に出力する音声変換部と、前記情報検索部で検索した情報の中で画面に表示可能な情報をパケット通信を介して前記無線携帯端末に送信するパケット制御部とを有するセンターと、を備えていることを特徴とする無線携帯端末通信システムが記載されている。ここで、センターの音声制御部は、無線携帯端末の自局IPアドレスと自局音声通信アドレスの対応テーブルを備えており、音声通信開始時の発信者番号通知機能による前記無線携帯端末の自局音声通信アドレスに基づいて前記対応テーブルを参照して得た前記自局IPアドレスを前記パケット制御部に通知する機能を有する、と記載されている。これにより、情報検索語やデータを音声で入力可能にして無線携帯端末の操作性を向上するとともに、検索結果を画像や文字で確認できる、とされている。
特許文献2(特開2003−125109号公報)には、データ通信機能と音声通信機能を有する端末でネットワークコンテンツの閲覧中に、当該ネットワークコンテンツに対して音声による情報入力を支援する方法であって、端末からのコンテンツ配信要求をデータ通信路を介してコンテンツ提供装置で受付け、要求されたコンテンツが音声入力サービスと連携可能に設定されたコンテンツか否かを判定し、その判定結果に応じて、当該コンテンツに音声入力サービス提供装置へのリンク先情報を付加して要求元の端末に配信する第1のステップと、配信した端末における前記リンク先情報の選択操作によって当該端末と音声入力サービス提供装置との音声通信路を確立する第2のステップと、前記音声入力サービス提供装置において音声通信路を介した端末からの入力音声を認識し、その認識結果を前記コンテンツ提供装置に送信する第3のステップとを備えることを特徴とする音声入力サービス提供方法が記載されている。これにより、端末に表示されたコンテンツの情報入力欄に対する音声入力をコンテンツ表示と同期して実施可能にすることができる、とされている。
特許文献3(特開2005−110034号公報)には、CTIサーバにインタフェースを有し、複数の内線電話を具備する構内交換機に着信した電話コールの客先情報を、ローカルエリアネットワークを介して該CTIサーバに接続された情報機器の画面に表示させることにより該電話コールに応対する応対者を支援する電話応対支援システムが記載されている。前記CTIサーバは、前記電話コールの発信者と該電話コールの応対者との間でやり取りされる通話の音声信号を認識して文字データを出力する音声認識手段と、前記音声認識手段から出力された文字データを格納する情報格納手段とを有し、前記情報機器は、前記音声認識手段から出力された文字データおよび前記情報格納手段に格納された文字データのうち何れか一方又は双方を画面に文字表示させる。
特許文献4(特開2000−148677号公報)には、以下の技術が記載されている。ウエブサーバに接続すると、ウエブ画面には、エージェント側に接続を要求するボタンを含むコンテンツが表示される。お客様情報のエントリに自分の電話番号を登録しておくと、カスタマがこのボタンをクリックすると、エージェント側からコールバックを受けることができる。また、カスタマは、希望により通常の外線電話、インターネットフォン、チャット等、エージェントとのコミュニケーション手段を選択でき、選択されたコミュニケーション手段によりコールバックを受けることができる。エージェントのスキルグループも選択できる。
特開2001−268241号公報 特開2003−125109号公報 特開2005−110034号公報 特開2000−148677号公報
しかし、上記特許文献1から3に記載された技術では、たとえば特許文献1では無線携帯端末の自局IPアドレスと自局音声通信アドレスとの対応テーブルが準備されている等、音声認識処理を行う際に、音声を入力するための端末と、結果のテキストデータを表示する装置とが予め固定された構成となっている。そのため、任意の端末を用いて音声を入力したり、任意の装置で結果のテキストデータを確認するという柔軟な対応を行うことができなかった。
本発明の目的は、上述した課題である、音声認識処理を行う際に、任意の端末を用いて音声を入力したり、任意の装置で結果のデータを確認することができないという問題を解決する音声入力システムおよび音声入力プログラムを提供することにある。
本発明によれば、
音声認識処理依頼とともに、音声を入力するために発呼を受ける電話の識別情報を受け付ける処理依頼受付手段と、
前記処理依頼受付手段が受け付けた前記電話の識別情報に基づき、発呼する発信手段と、
前記発信手段の発呼に対して着呼があり、ユーザの音声が入力されると、当該音声の音声データを受け付ける音声データ受付手段と、
前記音声データ受付手段が受け付けた前記音声データの音声認識結果のデータである結果データを、前記電話の識別情報に対応付けて記憶する音声認識結果記憶手段と、
を含む音声入力システムが提供される。
本発明によれば、
コンピュータを、
音声認識処理依頼とともに、音声を入力するために発呼を受ける電話の識別情報を受け付ける処理依頼受付手段、
前記処理依頼受付手段が受け付けた前記電話の識別情報に基づき、発呼する発信手段、
前記発信手段の発呼に対して着呼があり、ユーザの音声が入力されると、当該音声の音声データを受け付ける音声データ受付手段、
前記音声データ受付手段が受け付けた前記音声データの音声認識結果のデータを、前記電話の識別情報に対応付けて記憶する音声認識結果記憶手段、
として機能させる音声入力プログラムが提供される。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、音声認識処理を行う際に、任意の端末から音声を入力することができるとともに、任意の装置で結果のデータを確認することができる。
本発明の実施の形態における音声入力システムを含むネットワーク構造の一例を示すブロック図である。 音声認識結果記憶部の内部構成の一例を示す図である。 本発明の実施の形態における音声入力システムを含むネットワーク構造の処理手順の一例を示すフローチャートである。 第1のユーザ端末装置の表示処理部により表示されるメッセージ入力ページ画面の一例を示す図である。 第1のユーザ端末装置の表示処理部により表示されるメッセージ入力ページ画面の一例を示す図である。 第2のユーザ端末装置の表示処理部により表示されるメッセージ確認ページ画面の一例を示す図である。 第2のユーザ端末装置の表示処理部により表示されるメッセージ確認ページ画面の一例を示す図である。 第2のユーザ端末装置の表示処理部により表示されるメッセージ確認ページ画面の一例を示す図である。 本発明の実施の形態における音声入力システムを含むネットワーク構造の処理手順の他の例を示すフローチャートである。 本発明の実施の形態における音声入力システムを含むネットワーク構造の一例を示すブロック図である。 本発明の実施の形態における音声入力システムを含むネットワーク構造の処理手順の一例を示すフローチャートである。 第1のユーザ端末装置の表示処理部により表示されるメッセージ入力ページ画面の一例を示す図である。 第1のユーザ端末装置の表示処理部により表示されるメッセージ入力ページ画面の一例を示す図である。 第1のユーザ端末装置の表示処理部により表示されるメッセージ入力ページ画面の一例を示す図である。 テンプレート記憶部の内部構成の一例を示す図である。 本発明の実施の形態における音声入力システムを含むネットワーク構造の他の例を示すブロック図である。
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様の構成要素には同様の符号を付し、適宜説明を省略する。
本実施の形態において、音声でメッセージ等を入力して、そのメッセージの音声認識結果のデータを取得したいユーザは、音声入力システムに、音声を入力するために発呼を受ける電話の識別情報を入力する。ここで、電話の識別情報は、たとえば発呼(コールバック)を受けたい電話端末の電話番号等の識別情報とすることができる。音声入力システムは、入力された電話の識別情報に基づき、発呼(コールバック)する。そして、当該発呼に応じてユーザが電話に出て、音声を入力すると、音声入力システムは、その音声の音声データに対して音声認識処理を行う。そして、音声入力システムは、その音声認識処理の結果を示すデータを、電話の識別情報に対応付けて記憶する。このような構成により、ユーザは、任意の端末装置から所定のウェブページにアクセスして、所望の任意の電話番号を入力するだけで、音声を入力して、音声認識結果のデータを得ることができる。また、後に、電話の識別情報を指定することにより、任意の端末装置から、音声認識結果のテキストデータを取得することができる。
(第1の実施の形態)
図1は、本実施の形態における音声入力システムを含むネットワーク構造を示すブロック図である。
図1に示したネットワーク構造は、音声入力システム100と、音声入力システム100にネットワーク150を介して接続された第1のユーザ端末装置200(ユーザ端末装置1)および第2のユーザ端末装置210(ユーザ端末装置2)と、電話端末300とを含む。ネットワーク150は、たとえばインターネットまたはイントラネット等とすることができる。
音声入力システム100は、ウェブアプリケーションを備える。第1のユーザ端末装置200および第2のユーザ端末装置210は、ユーザのPC等とすることができる。本実施の形態において、各ユーザ端末装置には、ブラウザがインストールされている。各ユーザは、各ユーザ端末装置のブラウザから音声入力システム100のウェブアプリケーションにネットワーク150を介してアクセスし、ウェブアプリケーションを起動し、音声入力システム100の機能を利用することができる。
第1のユーザ端末装置200は、入力受付部202および表示処理部204を含む。入力受付部202は、たとえばキーボード等の操作部を含む。第1のユーザ端末装置200は、入力受付部202を介してユーザの指示を受け付ける。また、第1のユーザ端末装置200の表示処理部204は、ディスプレイおよびブラウザを含み、音声入力システム100の情報提供部102から提供されるウェブページをディスプレイに表示する。入力受付部202を介して入力されたユーザの指示は、ネットワーク150を介して音声入力システム100の処理受付部104に提供される。
第2のユーザ端末装置210も第1のユーザ端末装置200と同様、入力受付部212および表示処理部214を含む。入力受付部212および表示処理部214は、第1のユーザ端末装置200の入力受付部202および表示処理部204と同様の機能を有する。第1のユーザ端末装置200および第2のユーザ端末装置210は、たとえばパーソナルコンピュータ等により構成することができる。
音声入力システム100は、情報提供部102と、処理受付部104と、発信処理部106と、音声データ受付部108と、データ管理部110と、メール送信部112と、テンプレート記憶部120と、音声認識結果記憶部122と、ユーザ情報記憶部124と、音声認識処理部130とを含む。本実施の形態において、情報提供部102および処理受付部104の機能は、ウェブアプリケーションにより実現することができる。
情報提供部102(情報提供手段)は、ネットワーク150を介して接続された各ユーザ端末装置にウェブページを提供する。処理受付部104(処理依頼受付手段、提供依頼受付手段)は、ネットワーク150を介して接続された各ユーザ端末装置から、ウェブページを介して入力された指示を受け付ける。
処理受付部104(処理依頼受付手段)は、ネットワーク150を介して接続されたユーザ端末装置から、音声認識処理依頼とともに、音声認識処理のために音声を入力したい電話の識別情報を受け付ける。本実施の形態において、電話の識別情報は、電話端末の電話番号とすることができる。以下、電話の識別情報が電話端末の電話番号である場合を例として説明する。
発信処理部106(発信手段)は、処理受付部104が受け付けた電話端末の電話番号に基づき、当該電話端末に発呼する処理を行う。なお、発信処理部106の機能は、音声入力システム100のウェブアプリケーションに含まれるClick-to-Callプラグインにより実現することができる。
音声データ受付部108は、発信処理部106の発呼処理に対して着呼があり、当該電話端末からユーザの音声が入力されると、当該音声を音声データとして受け付ける。
データ管理部110は、音声入力システム100の各機能ブロックが処理するデータを、たとえば電話番号と対応付けて識別して、他の機能ブロックとの間でやり取りする処理を行う。データ管理部110は、音声データ受付部108が受け付けた音声データを音声認識処理部130に提供し、音声認識処理部130から当該音声データの音声認識結果のデータである結果データを取得する。
音声認識処理部130は、データ管理部110から提供された音声データを音声認識し、当該音声認識の結果データをデータ管理部110に送信する。音声認識処理部130は、結果データを所定のデータ形式(例:テキストデータ)に変換後、変換後の結果データをデータ管理部110に送信することもできる。音声認識処理部130がデータ管理部110に送信する結果データのデータ形式は特段制限されない。なお、図1では、音声認識処理部130が音声入力システム100に含まれる構成を示しているが、音声認識処理部130は、音声入力システム100の他の機能ブロックとは異なる外部の端末に設けられた構成とすることができ、たとえばネットワーク150等を介して、音声入力システム100と接続された構成とすることもできる。
データ管理部110は、音声認識処理部130から取得した結果データを、電話番号に対応付けて音声認識結果記憶部122(音声認識結果記憶手段)に記憶する。データ管理部110は、音声データ受付部108が音声データを取得した時間も、音声認識処理部130から取得した結果データに対応付けて音声認識結果記憶部122に記憶することができる。また、データ管理部110は、音声データ受付部108が取得した音声データも、音声認識処理部130から取得した結果データに対応付けて音声認識結果記憶部122に記憶することができる。
図2は、音声認識結果記憶部122の内部構成の一例を示す図である。
音声認識結果記憶部122は、電話番号欄と、時間欄と、結果データ欄と、音声データ欄とを含む。電話番号欄には、発信処理部106が発呼を行った電話端末の電話番号が記憶される。時間欄には、音声データ受付部108が音声データを取得した時間(日時)が記憶される。結果データ欄には、音声認識処理部130が音声認識処理を行った結果のデータである結果データが記憶される。音声データ欄には、音声データ受付部108が取得した音声データが記憶される。
図1に戻り、処理受付部104(提供依頼受付手段)は、ネットワーク150を介して接続されたユーザ端末装置から、電話端末の電話番号とともに結果データの提供依頼を受け付ける。本実施の形態において、このとき、処理受付部104は、ネットワーク150を介して接続されたユーザ端末装置から、当該ユーザ端末装置の識別情報も受け付けることができる。ここで、ユーザ端末装置の識別情報は、当該ユーザ端末装置の識別情報のIPアドレスとすることができる。なお、ユーザ端末装置の識別情報は、ユーザが入力するのではなく、当該ユーザ端末装置と音声入力システム100との間での接続確立時に、ユーザ端末装置から音声入力システム100に自動的に送信される構成とすることができる。
データ管理部110は、処理受付部104が受け付けた電話端末の電話番号に基づき、当該電話番号をキーとして音声認識結果記憶部122から該当する結果データを抽出する。
情報提供部102は、ユーザ端末装置の識別情報に基づき、データ管理部110が抽出した結果データを該当するユーザ端末装置に提供する。情報提供部102は、抽出した結果データを、所定のデータ形式に変換後、変換後の結果データを、該当するユーザ端末装置に提供することができる。例えば、情報提供部102は、結果データを、テキストデータで、ユーザ端末装置に提供することができる。その他、情報提供部102は、結果データを、発話時間、単語の読みや品詞などのマークアップ付きのデータ(SGML、HTML、TeXなど)で、ユーザ端末装置に提供することもできる。なお、予め、結果データを、例えば音声認識処理部130が所定のデータ形式に変換し、変換後の結果データを、音声認識結果記憶部122に記憶させている場合には、情報提供部102による上記データ形式の変換処理は不要となる。
テンプレート記憶部120は、後述するように、音声入力システム100を利用するユーザが、電話端末300に入力する、たとえば伝言メッセージ等のテンプレート文章を記憶する。
図15は、テンプレート記憶部120の内部構成の一例を示す図である。
テンプレート記憶部120は、テンプレート番号欄と、タイトル欄と、テンプレート文章欄と、特徴データ欄とを含む。このようなテンプレートは、音声入力システム100の管理者が準備することもでき、また、音声入力システム100のユーザが適宜設定することもできる。ここで、特徴データ欄には、たとえばテンプレート番号「1」の「テンプレート文章」のうちの穴埋め箇所、たとえば「○○様から・・・」の「○○」には人名が入ることや、「お電話番号○○○○に・・・」の「○○○○」には電話番号(数字)が入ること等が記憶される。このような構成のテンプレートを用いることにより、ユーザが自在にメッセージを入力する場合に比べて、音声認識精度を高めることができる。
メール送信部112は、結果データを、ユーザが指定する所定のメールアドレスに送信する。ユーザは、結果データを表示して確認する際に、その結果データを送信するメールアドレスを指定することができる。
また、本実施の形態において、音声入力システム100が提供するウェブページにアクセスするユーザ端末装置のユーザは、予め音声入力システム100が提供するサービスに登録しておくこともできる。このような場合、ユーザには、IDとパスワードを付与しておくことができる。また、ユーザは、予め、メールを送信したい送信先のアドレスを登録しておくことができる。ユーザ情報記憶部124は、ユーザのIDおよびパスワード、ならびに当該ユーザが登録した所望の送信先等の情報を記憶する。ここで、ユーザが、音声入力システム100が提供するウェブページにアクセスする際、IDとパスワードを用いてログインすることにより、ユーザが認識されるので、当該ユーザに表示されるウェブページには、予め登録されているメールアドレスのリストを表示することができる。これにより、このサービスに登録しているユーザは、自分が登録したメッセージを、所望のメールアドレスに送信することができる。
本実施の形態において、電話端末300は、たとえば携帯電話端末(PHS(Personal Handyphone System)も含む。)とすることもでき、またIPフォンやアナログ固定電話機等とすることもできる。本実施の形態において、ユーザは、電話端末300から音声を入力する。そのため、第1のユーザ端末装置200や第2のユーザ端末装置210には、音声を入力するためのマイク等を設けておく必要がない。
次に、本実施の形態におけるネットワーク構造の処理手順を説明する。
図3は、本実施の形態における音声入力システム100を含むネットワーク構造の処理手順を示すフローチャートである。なお、ここでは、ユーザは、図1に示した電話端末300にコールバックを受けるものとすることができる。
まず、ユーザが、第1のユーザ端末装置200から、コールバックを受けたい電話端末300の電話番号を入力して音声認識処理依頼を行う(ステップS120)。具体的には、ユーザは、第1のユーザ端末装置200から、音声入力システム100から提供されるメッセージ入力ページ等のウェブページにアクセスして、当該ウェブページに電話端末300の電話番号を入力するとともに音声認識処理依頼を行う。
図4は、音声入力システム100の情報提供部102から提供され、第1のユーザ端末装置200の表示処理部204により表示されるメッセージ入力ページ画面420の一例を示す図である。メッセージ入力ページ画面420には、テンプレート選択ボックス402、テンプレート文章表示領域404、電話番号入力ボックス406、コールバック依頼ボタン408等が表示されている。
ここで、テンプレート選択ボックス402には、音声入力システム100のテンプレート記憶部120に記憶されたテンプレートのタイトルが表示されている。ここでは、選択可能なテンプレートとして、「コールバック依頼」、「かけ直します」、「伝言のみ」等が表示されている。たとえば、ユーザが「コールバック依頼」を選択すると、テンプレート文章表示領域404に、これに対応付けられたテンプレート文章である「○○様からお電話がありました お電話番号○○○○にかけ直して下さい」が表示される。
図5は、図4に示したメッセージ入力ページ画面420において、ユーザがテンプレート選択ボックス402の「かけ直します」を選択した場合の状態を示す図である。ここでは、テンプレート文章表示領域404には、「かけ直します」に対応付けられたテンプレート文章である「○○様からお電話がありました またお電話されるそうです」が表示される。
ユーザがテンプレート選択ボックス402でテンプレートを選択して、電話番号入力ボックス406に電話端末300の電話番号、たとえば「03−××××−××××」を入力して、コールバック依頼ボタン408を押すと、音声認識処理依頼および電話番号が音声入力システム100に送信される。なお、テンプレートの選択は、コールバック依頼ボタン408を押してから電話端末300に電話がかかってくるまでの間や電話端末300に電話がかかってきた後等に行うこともできる。
図3に戻り、第1のユーザ端末装置200から音声認識処理依頼および電話番号が送信されると、処理受付部104は、それを受け付け、データ管理部110に通知する。データ管理部110は、発信処理部106に、当該電話番号に発呼する指示を行う。ついで、発信処理部106が送信された電話番号「03−××××−××××」に電話する(ステップS122)。
電話端末300に電話がありユーザが応答すると、発信処理部106は、たとえば「メッセージを話して下さい」等の音声を流すことができる。これに対して、ユーザは、電話端末300からメッセージを音声で入力する。なお、ユーザは、第1のユーザ端末装置200の表示処理部204に表示されたメッセージ入力ページ画面420を見ながら音声を入力することができる。そのため、ユーザは、テンプレート文章表示領域404に表示されたテンプレート文章に沿ってメッセージを発声することができる。また、ユーザは、コールバック依頼ボタン408を押す前にテンプレート選択ボックス402の中から所望のテンプレートを選択して、テンプレート文章表示領域404にテンプレート文章を表示させておくことができる。これにより、ユーザが発話に詰まったりすることなく、メッセージを発話することができる。さらに、上述したように、テンプレートを用いることにより、ユーザが自在にメッセージを入力する場合に比べて、音声認識精度を高めることもできる。
音声入力システム100において、音声データ受付部108は、ユーザが電話端末300から入力した音声の音声データを受け付け(ステップS124)、データ管理部110に通知する。データ管理部110は、音声認識処理部130に、入力された音声データの音声認識処理を行わせる。音声認識処理部130は、音声認識処理を行う(ステップS126)。なお、本実施の形態において、データ管理部110は、ユーザが用いたテンプレート番号を把握しておくことができ、そのテンプレート番号を音声認識処理部130に通知することができる。これにより、音声認識処理部130は、テンプレート記憶部120を参照して、該当するテンプレート番号のテンプレートの特徴データも考慮して音声認識処理を行うことができる。これにより、音声認識処理部130の音声認識処理の精度を高めることができる。
なお、図示していないが、音声入力システム100は、ステップS122で発信処理部106が発呼したにもかかわらずユーザが応答しない場合は、メッセージ入力ページ画面420にエラーメッセージを表示する等のエラー処理を行うことができる。
音声認識処理部130の音声認識処理が終了すると、データ管理部110は、音声認識処理の結果データを、電話番号に対応付けて音声認識結果記憶部122に記憶する(ステップS128)。
以上の処理受付部104が第1のユーザ端末装置200から音声認識処理依頼を受けてから、音声認識処理部130に音声認識処理を行わせ、音声認識処理の結果データを音声認識結果記憶部122に記憶するまでの間、データ管理部110は、各機能ブロックが処理するデータを電話端末300の電話番号と対応付けて管理している。
以上で、音声入力システム100に音声入力でメッセージを残す処理が終了する。これにより、特別に音声入力のためのマイク等を準備しなくても、簡単に音声認識処理により、音声でメッセージを残すことができる。また、ユーザは、任意の端末装置から所定のウェブページにアクセスして、所望の任意の電話番号を入力するだけで、音声を入力して、音声認識処理の結果データを得ることができる。
この後、ユーザは、所望の任意の端末装置から所定のウェブページにアクセスして、電話番号を指定することにより、音声入力システム100の音声認識結果記憶部122に記憶された結果データを見ることができる。
ユーザは、たとえば、第1のユーザ端末装置200とは別の第2のユーザ端末装置210から、電話端末300の電話番号を入力して、音声認識結果の表示依頼を行う。本実施の形態において、このとき、電話端末300の電話番号および音声認識結果の表示依頼とともに、第2のユーザ端末装置210のIPアドレスも音声入力システム100に送信される(ステップS130)。
具体的には、ユーザは、第2のユーザ端末装置210から、音声入力システム100から提供されるメッセージ確認ページ画面等のウェブページにアクセスする。
図6は、音声入力システム100の情報提供部102から提供され、第2のユーザ端末装置210の表示処理部214により表示されるメッセージ確認ページ画面430の一例を示す図である。メッセージ確認ページ画面430には、電話番号入力ボックス432、メッセージ確認ボタン434、メッセージリスト表示領域436、メッセージ表示ボタン438、メッセージ表示領域440、メール送信先表示領域412、および送信ボタン414等が表示されている。なお、たとえばユーザが音声入力システム100の提供するサービスに登録しており、IDおよびパスワードを入力してログインしていた場合、この段階で、メール送信先表示領域412に、当該ユーザがメールを送信したいメールアドレスのリストを表示しておくことができる。
ユーザが電話番号入力ボックス432に電話端末300の電話番号、たとえば「03−××××−××××」を入力して、メッセージ確認ボタン434を押すと、電話番号および音声認識結果表示依頼が音声入力システム100に送信される。なお、このとき、電話番号および音声認識結果表示依頼とともに、第2のユーザ端末装置210のIPアドレスも第2のユーザ端末装置210から音声入力システム100に送信される。
図3に戻り、第2のユーザ端末装置210から音声認識結果表示依頼、電話番号、およびIPアドレスが入力されると、処理受付部104は、それを受け付け、データ管理部110に通知する。データ管理部110は、入力された電話番号をキーとして音声認識結果記憶部122から当該電話番号に対応付けて記憶された結果データを抽出する(ステップS132)。次いで、データ管理部110は、第2のユーザ端末装置210のIPアドレスに基づき、情報提供部102から第2のユーザ端末装置210に、ステップS132で抽出した結果データを送信する(ステップS134)。これにより、第2のユーザ端末装置210において、表示処理部214は、音声認識処理の結果データを表示する(ステップS136)。
なお、本実施の形態において、メッセージ確認ページ画面430には、音声認識処理の結果データが表示される前に、キーとなった電話番号に対応付けられている結果データの項目がリストとして表示される。図7および図8を参照して説明する。
図7は、電話番号入力ボックス432に電話番号が入力され、メッセージ確認ボタン434が押された後のメッセージ確認ページ画面430を示す図である。図7に示すように、メッセージリスト表示領域436には、音声入力システム100の音声認識結果記憶部122において、電話番号入力ボックス432に入力された電話番号「03−××××−××××」に対応付けられた結果データの時間(日時)が項目として表示される。また、他の例として、ユーザは、図4および図5に示したメッセージ入力ページ画面420において、音声で入力するメッセージのタイトル等を指定して入力することもできる。音声入力システム100において、データ管理部110は、音声認識結果記憶部122に、結果データと、ユーザが指定していたタイトルとを対応付けて記憶することができる。この場合、メッセージリスト表示領域436に、ユーザが指定したタイトルのリストを表示することもできる。
ユーザがメッセージリスト表示領域436のいずれかの項目を選択して、メッセージ表示ボタン438を押すと、当該時間が音声入力システム100に送信される。
図8は、図7に示したメッセージ確認ページ画面430において、ユーザがたとえばメッセージリスト表示領域436の「2009/11/01 15:21」を選択した後に、メッセージ表示ボタン438が押された後のメッセージ確認ページ画面430を示す図である。図8に示すように、メッセージ表示領域440には、音声入力システム100の音声認識結果記憶部122において、時間「2009/11/01 15:21」に対応付けられた結果データが表示される。
なお、ユーザは、第2のユーザ端末装置210の入力受付部212から、メッセージ表示領域440に表示されたメッセージを適宜修正することができる。ユーザが修正した場合、メッセージ表示領域440に表示されたメッセージが変更されるとともに、音声認識結果記憶部122に記憶された結果データも変更される構成とすることができる。
音声入力システム100において、データ管理部110は、処理受付部104が音声認識結果表示依頼を受け付けた後、キーとなった電話番号に対応付けられている結果データの項目や結果データが第2のユーザ端末装置210に提供され、また第2のユーザ端末装置210からの修正依頼等の処理が終わるまでの間、音声入力システム100と第2のユーザ端末装置210とのデータのやり取りを管理しており、第2のユーザ端末装置210から既に送信されている電話番号および第2のユーザ端末装置210のIPアドレスに基づき、処理を行うことができる。データ管理部110は、このような管理情報を一時記憶部(不図示)に記憶して、管理を行うことができる。
また、ユーザは、メール送信先表示領域412に表示されたメールアドレスから、所望の送信先を選んで、送信ボタン414を押すことにより、当該送信先に、メッセージ表示領域440に表示されたメッセージを送信することができる。また、ユーザは、新たなメール送信先を設定することもできる。メールの送信処理は、音声入力システム100のメール送信部112により行われる。
なお、以上の例では、ユーザが音声認識処理依頼を行う端末と、音声認識結果の表示依頼を行う端末とが異なる場合を例として説明したが、これらの端末は、同じものとすることもできる。図9にユーザが音声認識処理依頼を行う端末および音声認識結果の表示依頼を行う端末の両方が第1のユーザ端末装置200である場合の処理手順を示す。この場合、ステップS130の音声認識結果表示依頼を行うユーザ端末が第1のユーザ端末装置200となるので、ステップS130で、音声入力システム100には、第1のユーザ端末装置200のIPアドレスが送信される。そのため、ステップS134において、音声入力システム100の情報提供部102は、第1のユーザ端末装置200に結果データを送信する。
以上のように、本実施の形態において、音声認識処理を行う際に、任意の電話端末を用いて音声を入力したり、任意の装置で音声認識処理の結果データを確認することができる。
また、以上の構成によれば、電話端末300を用いて音声を入力するので、ユーザがたとえばパーソナルコンピュータ等の端末から音声を入力する場合のようにマイクを準備する等の環境を設定する必要がない。これにより、パーソナルコンピュータ等の端末で音声認識処理や音声入力を頻繁に利用しないようなユーザでも、簡易に音声認識処理を利用することができる。
(第2の実施の形態)
図10は、音声入力システム100の他の例を示すブロック図である。
本実施の形態においても、音声入力システム100は、図1に示した構成と同じである。
本実施の形態において、音声入力と同時に、ユーザのユーザ端末装置に音声認識処理の結果データが表示される点で、第1の実施の形態に示した例と異なる。
次に、本実施の形態におけるネットワーク構造の処理手順を説明する。図11は、本実施の形態における音声入力システム100を含むネットワーク構造の処理手順を示すフローチャートである。なお、ここでは、ユーザは、図10に示した電話端末300にコールバックを受けるものとすることができる。
まず、ユーザが、第1のユーザ端末装置200から、コールバックを受けたい電話端末300の電話番号を入力して音声認識処理依頼を行う(ステップS100)。具体的には、ユーザは、第1のユーザ端末装置200から、音声入力システム100から提供されるメッセージ入力ページ等のウェブページにアクセスして、当該ウェブページに電話端末300の電話番号を入力するとともに音声認識処理依頼を行う。
図12は、音声入力システム100の情報提供部102から提供され、第1のユーザ端末装置200の表示処理部204により表示されるメッセージ入力ページ画面400の一例を示す図である。メッセージ入力ページ画面400には、テンプレート選択ボックス402、テンプレート文章表示領域404、電話番号入力ボックス406、コールバック依頼ボタン408、音声認識結果表示領域410、メール送信先表示領域412、送信ボタン414等が表示されている。
テンプレート選択ボックス402、テンプレート文章表示領域404、電話番号入力ボックス406およびコールバック依頼ボタン408の構成は、図4および図5を参照して説明したのと同様とすることができる。
ユーザがテンプレート選択ボックス402でテンプレートを選択して、電話番号入力ボックス406に電話端末300の電話番号、たとえば「03−××××−××××」を入力して、コールバック依頼ボタン408を押すと、音声認識処理依頼および電話番号が音声入力システム100に送信される。本実施の形態において、このとき、音声認識結果表示依頼および電話番号とともに、第1のユーザ端末装置200のIPアドレスも第1のユーザ端末装置200から音声入力システム100に送信される。なお、第1の実施の形態で説明したのと同様、ユーザ端末装置の識別情報は、ユーザが入力するのではなく、当該ユーザ端末装置と音声入力システム100との間での接続確立時に、ユーザ端末装置から音声入力システム100に自動的に送信される構成とすることができる。
本実施の形態においても、音声入力システム100のデータ管理部110は、処理受付部104が第1のユーザ端末装置200から音声認識処理依頼を受けてから、音声認識処理部130に音声認識処理を行わせ、音声認識処理の結果データが第1のユーザ端末装置200に送信されるまでの間、各機能ブロックが処理するデータを電話端末300の電話番号と対応付けて管理している。
図11に戻り、第1のユーザ端末装置200から音声認識処理依頼、電話番号およびIPアドレスが送信されると、処理受付部104は、それを受け付け、データ管理部110に通知する。データ管理部110は、発信処理部106に、当該電話番号に発呼する指示を行う。ついで、発信処理部106が送信された電話番号「03−××××−××××」に電話する(ステップS102)。
電話端末300に電話があり、ユーザが応答すると、発信処理部106は、たとえば「メッセージを話して下さい」等の音声を流すことができる。これに対して、ユーザは、電話端末300からメッセージを音声で入力する。なお、ユーザは、第1のユーザ端末装置200の表示処理部204に表示されたメッセージ入力ページ画面400を見ながら音声を入力することができ、テンプレート文章表示領域404に表示されたテンプレート文章に沿ってメッセージを発声することができる。
音声入力システム100において、音声データ受付部108は、ユーザが電話端末300から入力した音声の音声データを受け付け(ステップS104)、データ管理部110に通知する。データ管理部110は、音声認識処理部130に、入力された音声データの音声認識処理を行わせる。音声認識処理部130は、音声認識処理を行う(ステップS106)。なお、本実施の形態において、音声認識処理部130が音声認識処理を行うと、音声入力システム100は、略リアルタイムで、当該音声認識処理の結果データを第1のユーザ端末装置200に送信することができる(ステップS110)。
この手順を図13および図14を参照して説明する。
ユーザが電話端末300から音声を入力すると、音声入力システム100で当該音声データの音声認識処理が行われ、その結果データが第1のユーザ端末装置200に送信されて、メッセージ入力ページ画面400の音声認識結果表示領域410に表示されていく。結果データを送信する第1のユーザ端末装置200を特定する処理は、例えば、データ管理部110が管理している電話番号およびIPアドレスを対応付けた情報を利用し、実現することができる。なお、ユーザは、音声入力システム100の入力受付部202から、音声認識結果表示領域410に表示されたメッセージを適宜修正することができる。ユーザが修正した場合、メッセージ表示領域440に表示されたメッセージが変更されるとともに、音声認識結果記憶部122に記憶された結果データも変更される構成とすることができる。
なお、本実施の形態においても、第1の実施の形態で説明したように、音声認識処理の結果データを音声認識結果記憶部122に記憶される。これにより、後にユーザが任意のユーザ端末装置から、電話番号を指定することにより、結果データを確認できるようにすることができる。
次に、第1の実施の形態における音声入力システム100のまた他の例を説明する。
以上の実施の形態においては、ユーザが、ネットワーク150を介して音声入力システム100と接続された第1のユーザ端末装置200や第2のユーザ端末装置210から音声認識処理依頼を行ったり、音声認識結果表示処理依頼を行う例を示した。しかし、ユーザが、音声入力システム100に直接このような依頼を行う構成とすることもできる。
図16は、音声入力システム100の他の例を示すブロック図である。
音声入力システム100は、図1に示した構成に加えて、入力受付部114および表示処理部116をさらに含む。入力受付部114は、たとえばキーボード等の操作部を含む。音声入力システム100の処理受付部104は、入力受付部114を介してユーザの指示を受け付ける。また、表示処理部116は、ディスプレイおよびブラウザを含み、情報提供部102から提供されるウェブページをディスプレイに表示する。ここで、とくに限定されないが、音声入力システム100は、たとえばロボット等とすることもできる。
このような構成においても、ユーザが入力受付部114を介して所望の電話端末、たとえば電話端末300の電話番号を入力することにより、電話端末300にコールバックを受けることができ、音声認識処理の結果データを、電話端末300の電話番号に対応付けて記憶しておくことができる。なお、ここではメール送信部112を図示していないが、本例においても、音声入力システム100は、メール送信部112を有する構成とすることができる。
以上の図で示した音声入力システム100、第1のユーザ端末装置200、第2のユーザ端末装置210の各構成要素は、ハードウエア単位の構成ではなく、機能単位のブロックを示している。音声入力システム100、第1のユーザ端末装置200、第2のユーザ端末装置210の各構成要素は、任意のコンピュータのCPU、メモリ、メモリにロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するハードディスクなどの記憶ユニット、ネットワーク接続用インタフェースを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
なお、以上の実施の形態では、音声でメッセージ等を入力して、そのメッセージの音声認識処理の結果データを取得したいユーザが携帯電話端末等の電話端末にコールバックを受ける例を説明した。しかし、ユーザは、たとえばパーソナルコンピュータ等にPCソフトフォンやVoIP(Voice Over IP)クライアントの機能を持たせて、当該機能を用いて音声でメッセージ等を入力するようにすることもできる。この場合、電話の識別情報は、PCソフトフォンやVoIPクライアントでユーザが発呼を受けるための、たとえばSIP(Session Initiation Protocol)アドレス等のユーザの識別情報とすることができる。また、この場合、図1に示した構成の電話端末300の機能は、たとえば第1のユーザ端末装置200内に設けることができる。
本発明の構成によれば、ユーザが任意の端末において自分のPCソフトフォンやVoIPクライアントのユーザの識別情報への発呼を受けられる状態にして、音声認識処理依頼とともに当該ユーザの識別情報を指定することにより、当該ユーザの識別情報に発呼を受けることができる。これにより、ユーザがかかってきた電話に応答して音声を入力するだけで、ユーザの識別情報と音声認識処理の結果データとを対応付けて記憶しておくことができる。そのため、この場合も、ユーザは、後に他の端末からユーザの識別情報を指定することにより、音声認識処理の結果データを取得することができる。
この出願は、2009年12月17日に出願された日本特許出願特願2009−286775号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
<<付記>>
<発明1>
音声認識処理依頼とともに、音声を入力するために発呼を受ける電話の識別情報を受け付ける処理依頼受付手段と、
前記処理依頼受付手段が受け付けた前記電話の識別情報に基づき、発呼する発信手段と、
前記発信手段の発呼に対して着呼があり、ユーザの音声が入力されると、当該音声の音声データを受け付ける音声データ受付手段と、
前記音声データ受付手段が受け付けた前記音声データの音声認識結果のデータである結果データを、前記電話の識別情報に対応付けて記憶する音声認識結果記憶手段と、
を含む音声入力システム。
<発明2>
発明1に記載の音声入力システムにおいて、
電話の識別情報とともに前記結果データの提供依頼を受け付ける提供依頼受付手段と、
前記提供依頼受付手段が前記結果データの提供依頼を受け付けると、前記電話の識別情報をキーとして前記音声認識結果記憶手段から該当する前記結果データを抽出して当該結果データを提供する情報提供手段と、
をさらに含む音声入力システム。
<発明3>
発明2に記載の音声入力システムにおいて、
前記提供依頼受付手段は、他の第2の端末装置からネットワークを介して、電話の識別情報および前記結果データの提供依頼とともに、当該第2の端末装置の識別情報を受け付け、
前記情報提供手段は、前記提供依頼受付手段が前記結果データの提供依頼を受け付けると、前記電話の識別情報をキーとして前記音声認識結果記憶手段から該当する前記結果データを抽出し、前記第2の端末装置の前記識別情報に基づき、当該第2の端末装置に、抽出した前記結果データを提供する音声入力システム。
<発明4>
発明3に記載の音声入力システムにおいて、
前記第2の端末装置の識別情報は、当該第2の端末装置のIPアドレスである音声入力システム。
<発明5>
発明1から4いずれかに記載の音声入力システムにおいて、
前記処理依頼受付手段は、他の第1の端末装置からネットワークを介して、音声認識処理依頼とともに前記電話の識別情報を受け付ける音声入力システム。
<発明6>
発明5に記載の音声入力システムにおいて、
前記処理依頼受付手段は、前記他の第1の端末装置から前記ネットワークを介して、前記音声認識処理依頼および前記電話の識別情報とともに、当該第1の端末装置の識別情報とを受け付け、
当該音声入力システムは、前記結果データを、前記第1の端末装置の前記識別情報に基づき、当該第1の端末装置に提供する情報提供手段をさらに含む音声入力システム。
<発明7>
発明6に記載の音声入力システムにおいて、
前記第1の端末装置の識別情報は、当該第1の端末装置のIPアドレスである音声入力システム。
<発明8>
発明1から7いずれかに記載の音声入力システムにおいて、
前記電話の識別情報は、電話端末の電話番号である音声入力システム。
<発明9>
発明1から8いずれかに記載の音声入力システムにおいて、
前記処理依頼受付手段は、前記電話の識別情報の入力ボックスを含むウェブページを提供し、当該入力ボックスに入力された前記電話の識別情報を受け付ける音声入力システム。
<発明10>
発明9に記載の音声入力システムにおいて、
前記処理依頼受付手段は、前記電話の識別情報の入力ボックスを含む前記ウェブページに、ユーザが電話で発話するメッセージのテンプレート文章を表示する音声入力システム。
<発明11>
発明10に記載の音声入力システムにおいて、
前記テンプレート文章の中で、ユーザが穴埋めで発言する内容の種類を記憶する特徴データを当該テンプレート文章に対応付けて記憶するとともに、音声認識処理手段に、当該特徴データを提供可能に構成されたテンプレート記憶手段をさらに含む音声入力システム。
<発明12>
発明1から11いずれかに記載の音声入力システムにおいて、
ユーザから、前記結果データの送信先のメールアドレスの指定を受け付け、当該メールアドレスに、前記結果データを送信するメール送信部をさらに含む音声入力システム。
<発明13>
コンピュータを、
音声認識処理依頼とともに、音声を入力するために発呼を受ける電話の識別情報を受け付ける処理依頼受付手段、
前記処理依頼受付手段が受け付けた前記電話の識別情報に基づき、発呼する発信手段、
前記発信手段の発呼に対して着呼があり、ユーザの音声が入力されると、当該音声の音声データを受け付ける音声データ受付手段、
前記音声データ受付手段が受け付けた前記音声データの音声認識結果のデータを、前記電話の識別情報に対応付けて記憶する音声認識結果記憶手段、
として機能させる音声入力プログラム。

Claims (11)

  1. 音声認識処理依頼とともに、音声を入力するために発呼を受ける電話の識別情報を受け付ける処理依頼受付手段と、
    前記処理依頼受付手段が受け付けた前記電話の識別情報に基づき、発呼する発信手段と、
    前記発信手段の発呼に対して着呼があり、ユーザの音声が入力されると、当該音声の音声データを受け付ける音声データ受付手段と、
    前記音声データ受付手段が受け付けた前記音声データの音声認識結果のデータである結果データを、前記電話の識別情報に対応付けて記憶する音声認識結果記憶手段と、
    電話の識別情報とともに前記結果データの提供依頼を受け付ける提供依頼受付手段と、
    前記提供依頼受付手段が前記結果データの提供依頼を受け付けると、前記電話の識別情報をキーとして前記音声認識結果記憶手段から該当する前記結果データを抽出して当該結果データを提供する情報提供手段と、
    を含み、
    前記提供依頼受付手段は、他の第2の端末装置からネットワークを介して、電話の識別情報および前記結果データの提供依頼とともに、当該第2の端末装置の識別情報を受け付け、
    前記情報提供手段は、前記提供依頼受付手段が前記結果データの提供依頼を受け付けると、前記電話の識別情報をキーとして前記音声認識結果記憶手段から該当する前記結果データを抽出し、前記第2の端末装置の前記識別情報に基づき、当該第2の端末装置に、抽出した前記結果データを提供する音声入力システム。
  2. 請求項1に記載の音声入力システムにおいて、
    前記第2の端末装置の識別情報は、当該第2の端末装置のIPアドレスである音声入力システム。
  3. 請求項1または2に記載の音声入力システムにおいて、
    前記処理依頼受付手段は、他の第1の端末装置からネットワークを介して、音声認識処理依頼とともに前記電話の識別情報を受け付ける音声入力システム。
  4. 請求項3に記載の音声入力システムにおいて、
    前記処理依頼受付手段は、前記他の第1の端末装置から前記ネットワークを介して、前記音声認識処理依頼および前記電話の識別情報とともに、当該第1の端末装置の識別情報とを受け付け、
    当該音声入力システムは、前記結果データを、前記第1の端末装置の前記識別情報に基づき、当該第1の端末装置に提供する情報提供手段をさらに含む音声入力システム。
  5. 請求項4に記載の音声入力システムにおいて、
    前記第1の端末装置の識別情報は、当該第1の端末装置のIPアドレスである音声入力システム。
  6. 請求項1から5いずれかに記載の音声入力システムにおいて、
    前記電話の識別情報は、電話端末の電話番号である音声入力システム。
  7. 請求項1から6いずれかに記載の音声入力システムにおいて、
    前記処理依頼受付手段は、前記電話の識別情報の入力ボックスを含むウェブページを提供し、当該入力ボックスに入力された前記電話の識別情報を受け付ける音声入力システム。
  8. 請求項7に記載の音声入力システムにおいて、
    前記処理依頼受付手段は、前記電話の識別情報の入力ボックスを含む前記ウェブページに、ユーザが電話で発話するメッセージのテンプレート文章を表示する音声入力システム。
  9. 請求項8に記載の音声入力システムにおいて、
    前記テンプレート文章の中で、ユーザが穴埋めで発言する内容の種類を記憶する特徴データを当該テンプレート文章に対応付けて記憶するとともに、音声認識処理手段に、当該特徴データを提供可能に構成されたテンプレート記憶手段をさらに含む音声入力システム。
  10. 請求項1から9いずれかに記載の音声入力システムにおいて、
    ユーザから、前記結果データの送信先のメールアドレスの指定を受け付け、当該メールアドレスに、前記結果データを送信するメール送信部をさらに含む音声入力システム。
  11. コンピュータを、
    音声認識処理依頼とともに、音声を入力するために発呼を受ける電話の識別情報を受け付ける処理依頼受付手段、
    前記処理依頼受付手段が受け付けた前記電話の識別情報に基づき、発呼する発信手段、
    前記発信手段の発呼に対して着呼があり、ユーザの音声が入力されると、当該音声の音声データを受け付ける音声データ受付手段、
    前記音声データ受付手段が受け付けた前記音声データの音声認識結果のデータである結果データを、前記電話の識別情報に対応付けて記憶する音声認識結果記憶手段、
    電話の識別情報とともに前記結果データの提供依頼を受け付ける提供依頼受付手段、
    前記提供依頼受付手段が前記結果データの提供依頼を受け付けると、前記電話の識別情報をキーとして前記音声認識結果記憶手段から該当する前記結果データを抽出して当該結果データを提供する情報提供手段、
    として機能させ、
    前記提供依頼受付手段に、他の第2の端末装置からネットワークを介して、電話の識別情報および前記結果データの提供依頼とともに、当該第2の端末装置の識別情報を受け付けさせ、
    前記情報提供手段に、前記提供依頼受付手段が前記結果データの提供依頼を受け付けると、前記電話の識別情報をキーとして前記音声認識結果記憶手段から該当する前記結果データを抽出し、前記第2の端末装置の前記識別情報に基づき、当該第2の端末装置に、抽出した前記結果データを提供させるための音声入力プログラム。
JP2011545934A 2009-12-17 2010-11-12 音声入力システムおよび音声入力プログラム Expired - Fee Related JP5652406B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011545934A JP5652406B2 (ja) 2009-12-17 2010-11-12 音声入力システムおよび音声入力プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009286775 2009-12-17
JP2009286775 2009-12-17
PCT/JP2010/006666 WO2011074180A1 (ja) 2009-12-17 2010-11-12 音声入力システムおよび音声入力プログラム
JP2011545934A JP5652406B2 (ja) 2009-12-17 2010-11-12 音声入力システムおよび音声入力プログラム

Publications (2)

Publication Number Publication Date
JPWO2011074180A1 JPWO2011074180A1 (ja) 2013-04-25
JP5652406B2 true JP5652406B2 (ja) 2015-01-14

Family

ID=44166955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011545934A Expired - Fee Related JP5652406B2 (ja) 2009-12-17 2010-11-12 音声入力システムおよび音声入力プログラム

Country Status (3)

Country Link
US (1) US9215314B2 (ja)
JP (1) JP5652406B2 (ja)
WO (1) WO2011074180A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024172A (zh) * 2012-12-10 2013-04-03 广东欧珀移动通信有限公司 一种手机来电的语音播报方法
US9374446B2 (en) * 2013-05-15 2016-06-21 Microsoft Technology Licensing, Llc Web platform with select-to-call functionality
US9641663B2 (en) 2013-05-15 2017-05-02 Microsoft Technology Licensing, Llc Reverse number look up
US9633659B1 (en) * 2016-01-20 2017-04-25 Motorola Mobility Llc Method and apparatus for voice enrolling an electronic computing device
JP6596373B6 (ja) * 2016-03-24 2019-12-11 株式会社アドバンスト・メディア 表示処理装置及び表示処理プログラム
US9824691B1 (en) * 2017-06-02 2017-11-21 Sorenson Ip Holdings, Llc Automated population of electronic records
KR20210015428A (ko) * 2019-08-02 2021-02-10 삼성전자주식회사 사용자 인터페이스를 제공하는 전자 장치 및 방법
CN111427532A (zh) * 2020-03-20 2020-07-17 青岛聚好联科技有限公司 一种App语音输入控制的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002359688A (ja) * 2001-03-30 2002-12-13 Ntt Comware Corp 音声認識による情報提供サーバならびにその方法
JP2003044445A (ja) * 2001-08-02 2003-02-14 Matsushita Graphic Communication Systems Inc 認証システム、サービス提供サーバ装置および音声認証装置並びに認証方法
JP2003186837A (ja) * 2001-12-19 2003-07-04 Ntt Advanced Technology Corp ワンタイムパスワード認証装置及び方法、ならびにその認証プログラム
JP2003233595A (ja) * 2002-02-12 2003-08-22 Kddi Corp 携帯電話端末における利用者認証システム及び方法、並びに利用者認証プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3594219B2 (ja) 1998-11-13 2004-11-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 通信方法、通信システム、通信を制御するためのソフトウエア・プロダクトを格納した記録媒体
JP3452250B2 (ja) 2000-03-15 2003-09-29 日本電気株式会社 無線携帯端末通信システム
US7805310B2 (en) * 2001-02-26 2010-09-28 Rohwer Elizabeth A Apparatus and methods for implementing voice enabling applications in a converged voice and data network environment
JP2003125109A (ja) 2001-10-18 2003-04-25 Hitachi Software Eng Co Ltd 音声入力サービス提供方法及びシステム
US7231232B2 (en) * 2002-02-13 2007-06-12 Osann Jr Robert Courtesy answering solution for wireless communication devices
US7167899B2 (en) * 2002-03-26 2007-01-23 Matsushita Electric Industrial Co., Ltd. Web-content aware automatic call transfer system and process for mobile users and operators
US7383572B2 (en) * 2002-05-24 2008-06-03 Authentify, Inc. Use of public switched telephone network for authentication and authorization in on-line transactions
US20050025127A1 (en) * 2003-07-31 2005-02-03 Strathmeyer Carl R. Method and apparatus for communication web services
JP4088229B2 (ja) 2003-09-30 2008-05-21 富士通エフ・アイ・ピー株式会社 電話応対支援システムおよび電話応対支援方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002359688A (ja) * 2001-03-30 2002-12-13 Ntt Comware Corp 音声認識による情報提供サーバならびにその方法
JP2003044445A (ja) * 2001-08-02 2003-02-14 Matsushita Graphic Communication Systems Inc 認証システム、サービス提供サーバ装置および音声認証装置並びに認証方法
JP2003186837A (ja) * 2001-12-19 2003-07-04 Ntt Advanced Technology Corp ワンタイムパスワード認証装置及び方法、ならびにその認証プログラム
JP2003233595A (ja) * 2002-02-12 2003-08-22 Kddi Corp 携帯電話端末における利用者認証システム及び方法、並びに利用者認証プログラム

Also Published As

Publication number Publication date
WO2011074180A1 (ja) 2011-06-23
US9215314B2 (en) 2015-12-15
US20120258769A1 (en) 2012-10-11
JPWO2011074180A1 (ja) 2013-04-25

Similar Documents

Publication Publication Date Title
JP5652406B2 (ja) 音声入力システムおよび音声入力プログラム
US8175651B2 (en) Devices and methods for automating interactive voice response system interaction
KR100701852B1 (ko) 통신망에서 정보를 교환하는 방법 및 장치
JP4648906B2 (ja) 通話を伴うプッシュ型情報通信システム
US7643846B2 (en) Retrieving voice-based content in conjunction with wireless application protocol browsing
US9325845B2 (en) Method and apparatus for diverting callers to Web sessions
JP5542065B2 (ja) 発話名の発音の音声版を提供するシステムおよび方法
JP2007028410A (ja) 電子掲示板に対する音声情報の登録又は取り出しの取次のためのプログラム、装置、及び方法
JP2007067544A (ja) 第三者呼制御機能を備えるWebサーバ
JP2009027560A (ja) 伝言サーバ装置とその動作方法、及びこの伝言サーバ装置で使用されるプログラムとその記録媒体
JP2006222815A (ja) 電話発信要求装置、通信装置、通信システム、及びプログラム
US8805330B1 (en) Audio phone number capture, conversion, and use
KR20020028501A (ko) 통신망에서의 음성 데이터와 문자 데이터간의 변환 방법및 그 장치
US20070036135A1 (en) Communication identification system
US20040109543A1 (en) Method of accessing an information source
JP5049203B2 (ja) サービス提供方法及びサーバ装置
KR100929531B1 (ko) 음성 인식을 이용한 무선 환경에서의 정보 제공 시스템 및그 방법
JP2005332179A (ja) 通信装置、通信システム及び通信方法
JP2009044217A (ja) 情報登録システム、サーバ装置、サーバ処理プログラム、及び情報登録方法
RU2266624C2 (ru) Способ и устройство для обмена информацией в коммуникационной сети
JP2004221902A (ja) 情報提供システムおよびその情報提供方法
JP6460526B2 (ja) 安否確認装置と安否確認方法
JP7280608B2 (ja) 電話営業用ctiシステム
JP4113109B2 (ja) サービス提供システム
JP2001127888A (ja) 音声出力メールシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141021

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141103

R150 Certificate of patent or registration of utility model

Ref document number: 5652406

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees