JP2002297639A - 音声文書変換装置 - Google Patents

音声文書変換装置

Info

Publication number
JP2002297639A
JP2002297639A JP2001095963A JP2001095963A JP2002297639A JP 2002297639 A JP2002297639 A JP 2002297639A JP 2001095963 A JP2001095963 A JP 2001095963A JP 2001095963 A JP2001095963 A JP 2001095963A JP 2002297639 A JP2002297639 A JP 2002297639A
Authority
JP
Japan
Prior art keywords
xml document
voice
document
data
xml
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001095963A
Other languages
English (en)
Inventor
Toru Shimizu
徹 清水
Tsuneo Kato
恒夫 加藤
Norio Higuchi
宜男 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2001095963A priority Critical patent/JP2002297639A/ja
Publication of JP2002297639A publication Critical patent/JP2002297639A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 XML文書データ以外に特別の談話管理用文書
を記述することなく、XML文書データの登録と検索を行
う音声文書変換装置を提供することにある 【解決手段】 音声XML変換部1は、文法作成部5によっ
て、XML文書格納部4に格納されたXML文書から自動的に
作成される文法を用いて、入力音声を音声認識処理す
る。入力がデータ登録である場合は、データ登録部2が
選択され、該データ登録部2にてXML文書データをXML文
書格納部4に格納されたXML文書データに登録する。一
方、入力が検索である場合は、データ検索部3が選択さ
れ、該データ検索部3にてXML文書格納部4に格納されたX
ML文書データを検索する。続いて、検索されたXML文書
データは、音声XML変換部1で文章に変換し、スピーカ又
は電話回線へ音声出力する。また、音声認識用文法は、
XML文書データの文書型定義(DTD)を使用して自動的に作
成することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声文書変換装置に
関し、特に、XML文書データのみを用いて、音声入出力
によりXML文書へのデータ登録と検索を行う音声文書変
換装置に関する。
【0002】
【従来の技術】従来装置の一例を図8のブロック図を参
照して説明する。従来は、テキスト入力あるいは画像表
示を行うブラウザ31上にデータ登録画面またはデータ検
索画面を表示し、該画面上の所定の欄に登録または検索
するデータを入力する。該入力されたデータは、データ
登録部32あるいはデータ検索部33を介してXML文書格納
部34へ送られる。このようにして、データ登録の場合
は、該XML文書格納部34に格納されたXML文書へのデータ
登録が行われ、一方データ検索の場合は、検索結果であ
るXML文書がデータ検索部33を介してブラウザ31に送ら
れ、ブラウザ31上に画像表示されていた。
【0003】
【発明が解決しようとする課題】しかし、従来装置は図
8の構成をしているので、音声入力により、XML文書デー
タの登録と検索を行うことはできなかった。音声入出力
を用いてXML文書データの登録や検索を行うためには、
従来は、XML文書を作成するための特別な談話管理を定
義する文書をXML文書データとは別に記述(例えば、Voic
eXML、 http://www.voicexml.org)する必要があった。
【0004】本発明は、前記した従来技術に鑑みてなさ
れたものであり、その目的は、XML文書データ以外に特
別の談話管理用文書を記述することなく、XML文書デー
タの登録と検索を行う音声文書変換装置を提供すること
にある。
【0005】
【課題を解決するための手段】前記した目的を達成する
ために、本発明は、音声によりXML文書へのデータ登録
ならびにXML文書の検索を行う音声文書変換装置におい
て、XML文書格納部に格納されたXML文書データから音声
認識用文法を作成する文法作成部と、該文法作成部で作
成した文法を用いて音声をXML文書に変換あるいはXML文
書を音声に変換する音声XML変換部とを具備した点に第
1の特徴がある。
【0006】この特徴によれば、音声により、XML文書
へのデータ登録ならびにXML文書の検索を行うことがで
きるようになる。
【0007】また、本発明は、前記文法作成部は、XML
文書データの文書型定義(DTD)を使用して文法を作成す
るようにした点に第2の特徴があり、また前記文法作成
部は、XML文書データの文書型定義(DTD)の階層構造を利
用して文法の語順を定めるようにした点に第3の特徴が
ある。
【0008】これらの特徴によれば、XML文書データの
文書構造であるDTDを使用して、音声データから、タグ
付きテキストのデータ登録処理またはデータ検索処理を
行うことが可能になる。
【0009】
【発明の実施の形態】以下に、本発明を図面を参照して
説明する。図1は、本発明の一実施形態の概略の構成を
示すブロック図である。
【0010】図1に示されているように、本実施形態の
音声文書変換装置は、音声XML変換部1と、データ登録部
2と、データ検索部3と、XML文書格納部4と、文法作成
部5を備えている。
【0011】音声XML変換部1には、マイクロフォン又は
電話回線から音声が入力、また、スピーカ又は電話回線
へ音声を出力する。音声XML変換部1で音声認識に用いる
文法は、文法作成部5によって、XML文書格納部4に格納
されたXML文書から自動的に作成される。音声XML変換部
1は、当該文法を用いて、入力音声を音声認識処理し、
入力がデータ登録である場合は、データ登録部2が選択
され、該データ登録部2にてXML文書データをXML文書格
納部4に格納されたXML文書データに登録する。
【0012】一方、入力が検索である場合は、データ検
索部3が選択され該データ検索部3にてXML文書格納部4に
格納されたXML文書データを検索する。続いて、検索さ
れたXML文書データは、音声XML変換部1で文章に変換
し、スピーカ又は電話回線へ音声出力する。文章の音声
出力は既存の音声合成技術で容易に実現できる。入力が
登録であるか検索であるかの判定は、登録用と検索用の
電話番号を別に設ける、あるいは音声XML変換部1に切
替スイッチを設けるなどの手段で容易に実現することが
できる。
【0013】XML文書データの例を図2に示す。XML文書
データは、XML文書の構造を定義する文書型定義(以下、
DTDと記述)とXML文書から成り立っている。XML文書デー
タにおいて、DTDは省略可能であるが、本発明では、DTD
が定義されている場合を対象とする。
【0014】図2に示すXML文書データ例では、社員名
簿、アナウンス、社員、名前、個人情報、電話番号、FA
X番号の7つの要素名(ELEMENT)を使用している。例え
ば、“<ELEMENT 社員名簿 (アナウンス、社員)>”はXML
の要素型宣言で、要素名は“社員名簿”、要素“社員名
簿”の子供の要素が“アナウンス”と“社員”であるこ
とを表している。このように、使用する要素名の種類と
階層構造はDTD情報の定義で一意に決定することができ
る。図3に図2のXML文書データの階層構造を示す。ま
た、アナウンス、名前、電話番号、FAX番号の4つの要素
名については、各要素の値の一例を示している(“社員
名を発声して下さい”、“鈴木一郎”、“1111”、“22
22”)。
【0015】図4は、図3に示された階層構造から文法作
成部5で作成する文法の例である。図4に示すように、図
3の階層構造を文法の状態遷移に置き換えている。な
お、要素名の部分には、単語を繋ぐための助詞の挿入を
許容する (子供の要素がある要素名には助詞“の”を、
子供のない要素名には助詞“は”の挿入を許容してい
る。例えば、“社員名簿(の)”は“社員名簿”あるいは
“社員名簿の”の意味であり、助詞“の”の挿入を許容
している。)。また、各要素の値については、単語が未
知であるため、任意の単語列としている。“ε”は空遷
移を表す。このような助詞や述語の挿入を含めた階層構
造から文法への変換ルールは、XML文書データの内容に
依存しない一般的なルールとして文法作成部5内に格納
しておく。
【0016】図5は、XML文書データの登録例を示す。音
声入力は「名前は鈴木一郎」である。図4に示す文法を
用いて、上記文章は、図4に示す文法で受理可能であ
り、音声認識結果を図4に示す文法でパースすることに
より、容易に、要素名“名前”に対する値が“鈴木一
郎”であることが解析可能である。音声XML変換部5で
は、図5に示すようなXML文書を生成することができる。
同様に、音声入力は「名前は鈴木一郎、電話番号は111
1。」については、要素名“名前”の値が“鈴木一
郎”、要素名“電話番号”の値が“1111”であることが
解析可能である。
【0017】図6は、XML文書データの検索例を示す。音
声入力は「鈴木一郎の電話番号は」である。音声認識結
果を図4に示す文法でパースすることにより、容易に、
要素名“名前”に対する値が“鈴木一郎”、要素名“電
話番号”であることが解析可能である。続いて、一般的
な問合せ言語(例えば、XQL、http://www.w3.org)を用い
て、XML文書格納部4に格納されたXML文書を検索する。
図6に検索例を示す。XQLによる問合せ“社員?[名前??=
“鈴木一郎”]//電話番号??”]を用いて、図2に示すXML
文書データを検索する。検索の結果、要素名“名前”、
値“鈴木一郎”の要素名“電話番号”の値が、“1111”
であることが分かる。検索されたXML文書は、図4の文法
を文生成に用いて、述語“です”を補うことにより、文
章に変換することができる。
【0018】次に、本発明の音声文書変換装置の第2実
施形態を、図7のブロック図を参照して説明する。この
実施形態は、前記した第1実施形態に、図8のブラウザ
を結合して該ブラウザを用いた入出力を加えたものであ
る。図7のブラウザ7は、図8のブラウザ31と同一また
は同等物である。
【0019】この実施形態によれば、ブラウザ7で入力
した内容を音声で検索する、あるいは、音声で入力した
検索内容をブラウザ7を用いて画像で表示させることが
できるようになる。
【0020】
【発明の効果】以上の説明から明らかなように、本発明
によれば、XML文書データから文法を自動生成すること
により、XML文書データ以外に特別の談話管理用文書を
記述することなく、音声データにより、XML文書データ
の登録と検索を行うことができるようになる。
【0021】また、音声データとテキストデータとを適
宜選択して、XML文書データの登録と検索を行うことが
できるようになる。
【0022】また、音声認識用文法は、XML文書データ
の文書型定義(DTD)を使用して作成することができるよ
うになる。さらに、文法の語順は、XML文書データの文
書型定義(DTD)の階層構造を利用して定めることができ
るようになる。
【図面の簡単な説明】
【図1】 本発明の音声文書変換装置の第1実施形態の
装置構成を示すブロック図である。
【図2】 XML文書データの一具体例を示す図である。
【図3】 XML文書データの一例の階層構造を示す図であ
る。
【図4】 XML文書データの一例の階層構造から生成され
る文法を示す図である。
【図5】 XML文書データの登録例を示す図である。
【図6】 XML文書データの検索例を示す図である。
【図7】 本発明の音声文書変換装置の第2実施形態の
装置構成を示すブロック図である。
【図8】 従来のXML文書作成装置の装置構成を示すブロ
ック図である。
【符号の説明】
1・・・音声XML変換部、2・・・データ登録部、3・・・データ
検索部、4・・・XML文書格納部、5・・・文法作成部、6・・・
ブラウザ。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 3/16 320 G06F 3/16 320H 330 330F (72)発明者 樋口 宜男 埼玉県上福岡市大原2−1−15 株式会社 ケイディディ研究所内 Fターム(参考) 5B075 ND35 NR03 PP07 PQ04 UU08

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声によりXML文書へのデータ登録なら
    びにXML文書の検索を行う音声文書変換装置において、 XML文書格納部に格納されたXML文書データから音声認識
    用文法を作成する文法作成部と、 該文法作成部で作成した文法を用いて音声をXML文書に
    変換あるいはXML文書を音声に変換する音声XML変換部と
    を具備することを特徴とする音声文書変換装置。
  2. 【請求項2】 請求項1に記載の音声文書変換装置にお
    いて、 テキスト入力または検索結果の画像表示を行うブラウザ
    をさらに備えたことを特徴とする音声文書変換装置。
  3. 【請求項3】 請求項1または2に記載の音声文書変換装
    置において、 前記文法作成部は、XML文書データの文書型定義(DTD)を
    使用して文法を作成することを特徴とする音声文書変換
    装置。
  4. 【請求項4】 請求項1ないし3のいずれかに記載の音声
    文書変換装置において、 前記文法作成部は、XML文書データの文書型定義(DTD)の
    階層構造を利用して文法の語順を定めることを特徴とす
    る音声文書変換装置。
JP2001095963A 2001-03-29 2001-03-29 音声文書変換装置 Pending JP2002297639A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001095963A JP2002297639A (ja) 2001-03-29 2001-03-29 音声文書変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001095963A JP2002297639A (ja) 2001-03-29 2001-03-29 音声文書変換装置

Publications (1)

Publication Number Publication Date
JP2002297639A true JP2002297639A (ja) 2002-10-11

Family

ID=18949950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001095963A Pending JP2002297639A (ja) 2001-03-29 2001-03-29 音声文書変換装置

Country Status (1)

Country Link
JP (1) JP2002297639A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030087831A (ko) * 2002-05-10 2003-11-15 삼성전자주식회사 Vxml 변환과 웹서빙을 제공하는 단말기
JP2004279841A (ja) * 2003-03-17 2004-10-07 Fujitsu Ltd 音声対話システム及び方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000250575A (ja) * 1999-03-01 2000-09-14 Matsushita Electric Ind Co Ltd 双方向性テレビ受像機を自動的に選局するための音声理解装置およびその方法
JP2001005481A (ja) * 1999-06-03 2001-01-12 Lucent Technol Inc 音声メッセージ中のキーセグメントにスポットをあてる方法。
JP2001022756A (ja) * 1999-07-05 2001-01-26 Pfu Ltd 音声対話型情報検索システムおよび記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000250575A (ja) * 1999-03-01 2000-09-14 Matsushita Electric Ind Co Ltd 双方向性テレビ受像機を自動的に選局するための音声理解装置およびその方法
JP2001005481A (ja) * 1999-06-03 2001-01-12 Lucent Technol Inc 音声メッセージ中のキーセグメントにスポットをあてる方法。
JP2001022756A (ja) * 1999-07-05 2001-01-26 Pfu Ltd 音声対話型情報検索システムおよび記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
山田 篤: "読み正解コーパスのXML化とXSLTの利用", 情報処理学会研究報告, vol. 第2000巻 第54号, CSNG200100873003, 2 June 2000 (2000-06-02), JP, pages 17 - 22, ISSN: 0000757227 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030087831A (ko) * 2002-05-10 2003-11-15 삼성전자주식회사 Vxml 변환과 웹서빙을 제공하는 단말기
JP2004279841A (ja) * 2003-03-17 2004-10-07 Fujitsu Ltd 音声対話システム及び方法

Similar Documents

Publication Publication Date Title
US8380516B2 (en) Retrieval and presentation of network service results for mobile device using a multimodal browser
US8515733B2 (en) Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language
JP5366810B2 (ja) 自然言語のテキストからオントロジを開発するための、コンピュータによって使用される方法
US6556973B1 (en) Conversion between data representation formats
US5970449A (en) Text normalization using a context-free grammar
US20100121630A1 (en) Language processing systems and methods
JPH03278174A (ja) 異言語交信用翻訳方法およびシステム
JP2005165958A (ja) 情報検索システム、情報検索支援システム及びその方法並びにプログラム
JP2001075966A (ja) データ分析システム
JP2006085160A (ja) アルファニューメリック概念のための音声認識文法の作成
US20110131033A1 (en) Weight-Ordered Enumeration of Referents and Cutting Off Lengthy Enumerations
JP2002297639A (ja) 音声文書変換装置
Dahl Natural language processing: past, present and future
KR20190115721A (ko) 질의어를 처리하는 장치, 방법 및 컴퓨터 프로그램
TW200947241A (en) Database indexing algorithm and method and system for database searching using the same
JPH09190453A (ja) データベース装置
JP2001350682A (ja) 音声ドメインによるインターネット接続媒介システムと媒介装置及びその媒介方法、並びに音声ドメインのデータベース生成方法
Faris-Cole et al. Exploring speech recognition technology: Children with learning and emotional/behavioral disorders
Annamalai et al. Accessing documents via audio: An extensible transcoder for HTML to VoiceXML conversion
JP5297234B2 (ja) 日本語エイリアスデータベースを利用して長音及び促音に対するエラーを減らし、日本語入力機の使用の際に単字検索機能を提供する方法及びシステム
JPH10161847A (ja) 文章データ音声変換システム
JP2752025B2 (ja) 機械翻訳装置
JP2006065542A (ja) 機械翻訳方法
Bird et al. Electronic dictionaries for languages of the Southwest
JP2010055506A (ja) 音声翻訳装置および方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060719

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070207