JP2005038067A - 音声入力機能を備えたフォームを提供する電子フォームシステム - Google Patents

音声入力機能を備えたフォームを提供する電子フォームシステム Download PDF

Info

Publication number
JP2005038067A
JP2005038067A JP2003198145A JP2003198145A JP2005038067A JP 2005038067 A JP2005038067 A JP 2005038067A JP 2003198145 A JP2003198145 A JP 2003198145A JP 2003198145 A JP2003198145 A JP 2003198145A JP 2005038067 A JP2005038067 A JP 2005038067A
Authority
JP
Japan
Prior art keywords
input
electronic form
voice
user
form system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003198145A
Other languages
English (en)
Inventor
Tomoko Wada
朋子 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2003198145A priority Critical patent/JP2005038067A/ja
Publication of JP2005038067A publication Critical patent/JP2005038067A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】音声入力を可能とすることで電子フォーム入力時の利用者の負担を軽減させ、さらに、使い勝手のよい音声インターフェースを備えた電子フォームシステムを提供する。
【解決手段】下記の態様の対話入力機能をVoiceXMLで記述した電子フォームシステムにより上記課題を解決する。
1)各項目の入力順序とそれを促す音声ガイドの内容が決められており、利用者はプログラムされた音声ガイドに従って入力項目の内容を順に発声することにより電子フォームへの入力がなされることを特徴とする
2)音声ガイドを省略し、決められた項目順序で、入力内容を順に発声する、
3)1)または2)を利用者が選択できる。
4)最初の入力は音声で行い、確認訂正は画面インターフェースで行なう
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、電子フォームの入力を音声によりできる電子フォームシステムに関する。ここで電子フォームとは、ネットワーク環境下で実行される業務プロセスを、従来の紙の帳票に代わって実現するツールである。ネットワーク環境下で動作する電子フォームシステムにより提供される。
【0002】
【従来技術】
電子フォームは、電子フォームシステムのユーザーインターフェースとして、特に従来の紙帳票類の電子的なメタファとして、入力・表示・出力等の機能を持ち、さらに、電子化の特性を活かして、例えば入力時点では入力ナビゲーション機能、誤入力チェック機能、自動計算機能等を持たせることもできるものとして利用されている。
【0003】
電子フォームに何か入力するには、通常、キーボード若しくはそれに準じたもの(ペンパッド、マウス等)から入力する方法が一般的である。そのような操作ができないか非常に困難な状況下では一般に入力が不可能となる。また、身体的特徴により操作ができない場合フォーム入力は補助が必要となる。そのような悪条件の状況ではない場合であっても、入力ははしばしば利用者に負荷を強いる。
【0004】
これを解決する一つの方法として、特許文献1では、電子フォームシステムの機能を提供するサーバー側で利用者の属性をあらかじめ記憶しておき、利用者の属性に応じて適切有効なナビゲーション機能を使い分ける仕組みを備えた電子書類作成支援システムが開示されている。そのような機能の一つとして音声によりユーザーの入力を受付け、音声信号を電子フォームの入力データに変換して受付ける手段を含んだ構成のシステムが開示されている。
【0005】
【特許文献1】
特開2002−149906号公報
【0006】
【発明が解決しようとする課題】
特許文献1では、電子フォームシステムの機能を提供するサーバー側で利用者の属性をあらかじめ記憶しておかなければならないという制約がある。また、単に、音声信号を入力データとして受けつけることができるだけでは、必ずしも使い勝手のよい入力インターフェースとなるとは限らない場合がある。
【0007】
本発明はこのような問題点を考慮してなされたものであり、音声入力を可能とすることで電子フォーム入力時の利用者の負担を軽減させ、さらに、使い勝手のよい音声入力インターフェースを備えた電子フォームシステムを提供することを課題とする。
【0008】
【課題を解決するための手段】
課題を解決するための第1の発明は、利用者が発した音声を認識して電子フォームの入力データとして受付ける入力インターフェースを備えた電子フォームシステムであって、この電子フォームの入力インターフェース機能をVoiceXMLで記述したことを特徴とする電子フォームシステムである。
【0009】
VoiceXMLは音声だけで操作できるインターネットコンテンツを作成する標準記述言語である。XML(eXtensible Markup Language)をベースにした音声による対話インターフェースの記述言語である。標準化団体W3C(World Wide Web Consortium)が使用を策定している。従来から電話やFAXを用いて音声による対話インターフェースにより情報を取り出すシステムを実現する方法として音声応答装置を利用することが行われている。しかし音声応答装置を使用して作成した情報コンテンツは、音声応答装置に依存して作成せざるをえないため、ある音声応答装置用に作成した情報コンテンツを他のメーカーの音声応答装置で利用することができなかった。VoiceXMLはこのような問題を解消する技術である。HTML(HyperText Markup Language)で作成されたデータがインターネット経由でアクセスできるサーバーに置かれていれば、Webブラウザを備えたコンピュータであればどこからでも閲覧できるのと同じように、音声による情報コンテンツを広くインターネット上で利用可能とする技術である。
【0010】
第1の発明の好ましい第2の態様として、各項目の入力順序とそれを促す音声ガイド内容が電子フォームの対話インターフェース機能を記述するVoiceXMLデータにより記述されていて、利用者は前記プログラムされた音声ガイドに従って入力項目を決められた順序で順に発声することにより電子フォームへの入力がなされるように入力インターフェース機能を実現してもよい。
【0011】
あるいは、好ましい第3の態様として、定められた順番で必要項目数分の項目の値として入力したい内容を音声発声することにより、音声入力を促す音声ガイド無しに電子フォームへ音声入力できる入力インターフェースを備えたものとして第1の発明に係る電子フォームシステムを実現してもよい。
【0012】
あるいは、好ましい第4の態様として、利用者はこれから音声入力する内容の項目を表す項目名を、まず音声発声して指示し、次にその項目の値として入力したい内容を音声発声することを、必要項目数繰返すことにより、音声入力を促す音声ガイド無しに電子フォームへ音声入力できる入力インターフェースを備えたものとして第1の発明に係る電子フォームシステムを実現してもよい。
【0013】
あるいは、好ましい第5の態様として、1つの電子フォームにおいて、利用者の選択により、第2の態様の入力インターフェースか、第3または第4の態様の入力インターフェースを用いるかを選択して入力できることを特徴とする電子フォームシステムとして実現してもよい。
【0014】
第1の発明の好ましい第6の態様は、1回目の入力は音声を発声することにより受付けるが、利用者が入力内容送信を意味する対話操作を行なった後は、入力内容の訂正はマウスまたはキーボードまたはボタンの操作により画面上で受付けるようにしたことを特徴とする前記いずれかの態様の電子フォームシステムである。携帯電話端末の表示機能が充実してきたことを考慮すると、音声入力と画面入力の長所を利用できるこのような対話インターフェースが可能である。
【0015】
【発明の実施の形態】
以下図面を用いて、本発明の一実施形態である電子フォームシステム1(以下「システム1」)を説明してゆく。図1にシステム1の全体構成図を示す。システム1においてはセンターサーバー側の設備としては、VoiceXMLサーバー3とWebサーバー4を備える。8は固定電話、9は携帯電話である。5はマイク、イヤホン端子(スピーカ)を内蔵したパソコンである。利用者は、固定電話8若しくは携帯電話9あるいは、パソコン5を通じてセンターにアクセスする。7はインターネット、6は電話回線である。
【0016】
VoiceXMLサーバー3は、回線の着信や切断を監視/制御し電話網6とサーバー3の各部との間のインターフェースを提供する制御部30、着信した音声信号を認識して入力デジタルデータとする音声認識部32、出力デジタルデータを合成音声に変換する音声合成部33、HTTPサーバー41から送られてくるVoiceXML文書データを解釈して音声合成部33に渡す出力データとし、また、入力データをVoiceXMLのタグにしたがって解釈してHTTPサーバー41に渡すデータ形式に変換するVoiceXMLインタプリタ31を含んだ構成となっている。
【0017】
Webサーバー4は、HTTPサーバー41と電子フォームモジュール42を備える。電子フォームモジュール42は、幾つかのプログラムと必要なデータを含むソフトウエアモジュールである。電子フォームモジュール42は、電子フォーム機能を利用者に提供するために、利用者が要求する処理および利用者の対話入力に応じて必要なVoiceXMLデータ43、またはHTMLデータ44を作成して、または図示していない記憶装置よりフォームデータを読み出してHTTPサーバー41に提供する。尚、携帯電話8の画面データを提供する場合はHTML以外のデータ形式のデータを提供する場合がある。HTTPサーバー41は、HTMLデータ44をHTTPプロトコルでインターネット7を通じて直接利用者に送信する(HTMLデータ44の場合)か、または、HTTPプロトコルでVoiceXMLインタプリタ31に送付する(VoiceXMLデータ43の場合)。電子フォームモジュール42が提供する幾つかの処理は、HTTPサーバー41から呼出されるプログラムにより実行されるものである。尚、電子フォームモジュール42は、Webサーバー4とは別のサーバーに備えることも可能である。
【0018】
音声入力における各項目の入力順序はVoiceXMLに定められたタグを用いて、記述することで決まる。VoiceXMLインタプリタ31は、VoiceXMLのタグを認識し、タグを付されて記述されたデータの内容の意味を、タグにしたがって解釈して、入力案内音声として音声合成出力したり、音声の入力を待って、これを認識して、入力データとして扱うなどの処理を行なう。
【0019】
システム1の対話入力機能は、幾つかの方式が可能である。以下、VoiceXMLの記述例を示しながらさらに詳細に説明する。
【0020】
(方式1:システムが主導して対話音声入力を進める方式)図2は、方式1の対話入力例を示すものである。システムから、入力を促す案内音声が入力項目毎に音声出力され、利用者は項目毎にその値として入力する内容を音声発声して入力する。方式1では、使用するフォームの入力に慣れていない利用者でも音声ガイダンスにしたがって進めればよいので間違いなく入力することができる。
【0021】
図3は、方式1の対話インターフェースを実現するVoiceXMLドキュメントの一例である。<field name=”項目名”> と</field>で区切られるまとまりが1つの項目の入力を示す。このまとまりを必要な項目種類だけ繰返すことでフォームの入力ができる。<prompt> と</prompt>で区切られるまとまり案内音声を再生し、引き続く利用者の音声を待つ。
【0022】
(方式2および方式3:ユーザーが主導して対話音声入力を進める方式)図4は、方式2の対話入力例を示すものである。利用者は項目毎にその値として入力する内容を項目入力の順に連続して音声発声して入力する。使用するフォームの入力に慣れている利用者では項目の入力毎にいちいち音声ガイダンスを聞くよりも、この方が能率的に入力できる。入力順を間違えた時のシステム側の負荷がかかるので、利用者が項目値を発声する前にかならず項目名を発声するようにしてもよい。
【0023】
図6は、方式2の対話インターフェースを実現するVoiceXMLドキュメントの一例である。<field name=”項目名”> と</field>で区切られるまとまりが1つの項目の入力を示す。音声による入力ガイダンスを意味する<prompt>タグが省略されている。
利用者は、定められた項目の順に、その値として入力すべき内容を順に発声することでフォームの入力ができる。方式3はこの方式2の変形であって、入力順が前後しても正しく入力できるように、利用者が項目値を発声する前にかならず項目名を発声するようにしたものである。
【0024】
(方式4:選択可能な方式)上記3方式のいずれで行なうかを、利用者が選択できるようにした電子フォームである。図5は、方式4の対話入力例の冒頭部分を示すものである。この方式の場合にはどちらの方式で行なうかを選択する入力を冒頭で受付けるようなVoiceXMLドキュメントを用意すればよい。
【0025】
(方式5:確認訂正画面と併用する方式)携帯電話利用者が増え、携帯電話端末の表示機能が充実してきていることを考えると電子フォームへの入力をまず音声だけで行い、音声入力した後、確認は携帯電話機やパソコンの画面で行ない、訂正する時だけキー入力するという対話インターフェースも有効である。電子フォームモジュール42のプログラムを工夫することにより、このような音声入力と画面入力のそれぞれの利点を取り入れた複合型入力インターフェースを提供することが可能となる。すなわち、利用者は、名前や住所等の字数の多い入力は音声入力の方が楽であり、一方、入力データの確認、訂正のための入力操作は、画面とキーボードまたはボタン操作による方が速く訂正が可能なので、両者の長所を組合わせるわけである。
【0026】
具体的には、最初に、電子フォームの基本画面をHTMLデータ(携帯電話の場合は、携帯電話端末で表示可能な形式のデータの意味とする。以下同じ。)として利用者のパソコンに送り、そこで、キーボード、ボタン又はマウス操作を用いた対話画面により入力を行なうか、音声入力により入力を行なうか、音声入力の場合は、前記方式1〜3のいずれを用いるかを選択させ、一通りのデータ入力が終ったところで、利用者が入力終りを示す指示を行なった時に、センター側ではそれまでの入力したデータから確認訂正入力用の画面を表示するHTMLデータを生成し、これを利用者に送付する。利用者は、パソコン、または携帯電話機の画面上で、必要に応じて訂正入力を行なう。
【0027】
すなわち、電子フォームモジュール42を、最初の段階でHTTPサーバー41に呼出された時にVoiceXMLドキュメントを提供する第1のプログラムと、次の段階で、利用者が音声入力した結果がWebサーバー4に送り付けられた時にHTTPサーバー41から呼出されて、その入力データに基づいて確認画面・訂正入力画面として利用者の使用する端末で表示されるHTMLデータを生成して提供する第2のプログラムと、を含むように構成すればよい。
【0028】
以上説明した方式1から方式5の音声入力インターフェース機能を備えた電子フォームを利用できる電子フォームシステムは、音声を利用するコンテンツの記述言語であるVoiceXMLおよび、HTTPをはじめとするWWW技術を用いて実現可能である。
【0029】
【発明の効果】
以上、方式1から方式5の音声入力方式を実現した電子フォームを提供する電子フォームシステムを採用することにより、利用者の負担は軽減され、使い勝手のよい音声入力インターフェースを備えた電子フォームシステムを提供することができるという顕著な効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施形態である電子フォームシステム1の全体構成図である。
【図2】方式1による音声対話入力の一例である。
【図3】方式1による音声対話入力を行なうVoiceXMLの記述例である。
【図4】方式2による音声対話入力の一例である。
【図5】方式4による音声対話入力の一例である。
【図6】方式2による音声対話入力を行なうVoiceXMLの記述例である
【符号の説明】
1 電子フォームシステム
3 VoiceXMLサーバー
4 WWWサーバー
5 パソコン
6 電話回線網
7 インターネット
8 固定電話
9 携帯電話
30 制御部
31 VoiceXMLインタプリタ
32 音声認識部
33 音声合成部
41 HTTPサーバー
42 電子フォームモジュール
43 VoiceXMLドキュメント
44 HTMLドキュメント

Claims (6)

  1. 利用者が発した音声を認識して電子フォームの入力データとして受付ける入力インターフェースを備えた電子フォームシステムであって、この電子フォームの入力インターフェース機能をVoiceXMLで記述したことを特徴とする電子フォームシステム。
  2. 請求項1に記載の電子フォームシステムにおいて、各項目の入力順序とそれを促す音声ガイド内容が電子フォームの対話インターフェース機能を記述するVoiceXMLデータにより記述されていて、利用者は前記プログラムされた音声ガイドに従って入力項目を決められた順序で順に発声することにより電子フォームへの入力がなされることを特徴とする電子フォームシステム。
  3. 請求項1に記載の電子フォームシステムであって、定められた順番で必要項目数分の項目の値として入力したい内容を音声発声することにより、音声入力を促す音声ガイド無しに電子フォームへ音声入力できる入力インターフェースを備えたことを特徴とする電子フォームシステム。
  4. 請求項1に記載の電子フォームシステムであって、利用者はこれから音声入力する内容の項目を表す項目名を、まず音声発声して指示し、次にその項目の値として入力したい内容を音声発声することを、必要項目数繰返すことにより、音声入力を促す音声ガイド無しに電子フォームへ音声入力できる入力インターフェースを備えたことを特徴とする電子フォームシステム。
  5. 1つの電子フォームにおいて、利用者の選択により、請求項2に記載の入力インターフェースか、請求項3または請求項4に記載の入力インターフェースを用いるかを選択して入力できることを特徴とする電子フォームシステム。
  6. 1回目の入力は音声を発声することにより受付けるが、利用者が入力内容送信を意味する対話操作を行なった後は、入力内容の訂正はマウスまたはキーボードまたはボタンの操作により画面上で受付けるようにしたことを特徴とする請求項1から請求項5のいずれかに記載の電子フォームシステム。
JP2003198145A 2003-07-17 2003-07-17 音声入力機能を備えたフォームを提供する電子フォームシステム Withdrawn JP2005038067A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003198145A JP2005038067A (ja) 2003-07-17 2003-07-17 音声入力機能を備えたフォームを提供する電子フォームシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003198145A JP2005038067A (ja) 2003-07-17 2003-07-17 音声入力機能を備えたフォームを提供する電子フォームシステム

Publications (1)

Publication Number Publication Date
JP2005038067A true JP2005038067A (ja) 2005-02-10

Family

ID=34208013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003198145A Withdrawn JP2005038067A (ja) 2003-07-17 2003-07-17 音声入力機能を備えたフォームを提供する電子フォームシステム

Country Status (1)

Country Link
JP (1) JP2005038067A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102076793B1 (ko) * 2019-07-04 2020-02-12 주식회사 포시에스 음성을 통한 전자문서 제공 방법, 음성을 통한 전자문서 작성 방법 및 장치
WO2021100989A1 (ko) * 2019-11-22 2021-05-27 주식회사 포시에스 대화형 및 문서형 전자문서 작성 장치 및 방법과 대화형으로 작성 가능한 전자문서 제공 방법
JP2021124873A (ja) * 2020-02-04 2021-08-30 東芝エレベータ株式会社 検査データ入力装置および検査データ入力方法
JP7205962B1 (ja) * 2022-10-14 2023-01-17 ユニロボット株式会社 自動対話のためのシステム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102076793B1 (ko) * 2019-07-04 2020-02-12 주식회사 포시에스 음성을 통한 전자문서 제공 방법, 음성을 통한 전자문서 작성 방법 및 장치
WO2021002584A1 (ko) * 2019-07-04 2021-01-07 주식회사 포시에스 음성을 통한 전자문서 제공 방법, 음성을 통한 전자문서 작성 방법 및 장치
WO2021100989A1 (ko) * 2019-11-22 2021-05-27 주식회사 포시에스 대화형 및 문서형 전자문서 작성 장치 및 방법과 대화형으로 작성 가능한 전자문서 제공 방법
JP2021124873A (ja) * 2020-02-04 2021-08-30 東芝エレベータ株式会社 検査データ入力装置および検査データ入力方法
JP7205962B1 (ja) * 2022-10-14 2023-01-17 ユニロボット株式会社 自動対話のためのシステム

Similar Documents

Publication Publication Date Title
RU2349969C2 (ru) Синхронное понимание семантических объектов, реализованное с помощью тэгов речевого приложения
US7409349B2 (en) Servers for web enabled speech recognition
US7158779B2 (en) Sequential multimodal input
TWI249729B (en) Voice browser dialog enabler for a communication system
US7363027B2 (en) Sequential multimodal input
RU2352979C2 (ru) Синхронное понимание семантических объектов для высокоинтерактивного интерфейса
US7506022B2 (en) Web enabled recognition architecture
US7672436B1 (en) Voice rendering of E-mail with tags for improved user experience
EP1215656B1 (en) Idiom handling in voice service systems
US20040153323A1 (en) Method and system for voice activating web pages
US20040025115A1 (en) Method, terminal, browser application, and mark-up language for multimodal interaction between a user and a terminal
US20060020917A1 (en) Method for handling a multi-modal dialog
JP6832503B2 (ja) 情報提示方法、情報提示プログラム及び情報提示システム
JP5046589B2 (ja) 電話システムと通話補助方法とプログラム
KR20070119153A (ko) 멀티모달을 위한 브라우저 기반의 무선 단말과, 무선단말을 위한 브라우저 기반의 멀티모달 서버 및 시스템과이의 운용 방법
JP2005038067A (ja) 音声入力機能を備えたフォームを提供する電子フォームシステム
JP2004301980A (ja) 音声対話装置及び音声対話代行装置並びにそれらのプログラム
JP2005331608A (ja) 情報処理装置および情報処理方法
JP2004029457A (ja) 音声対話装置、および音声対話プログラム
JP2005266009A (ja) データ変換プログラムおよびデータ変換装置
JP2004287756A (ja) 電子メール作成装置及び電子メール作成方法
EP1881685B1 (en) A method and system for voice activating web pages
JP2001166915A (ja) 音声wwwブラウザ装置および制御方法
JP2004030395A (ja) Htmlデータ利用情報端末およびプログラム
JP2003304331A (ja) 文字入力装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061003