JP2002259373A

JP2002259373A - 辞書装置

Info

Publication number: JP2002259373A
Application number: JP2001051774A
Authority: JP
Inventors: Kazushi Kondo; 量資近藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2001-02-27
Filing date: 2001-02-27
Publication date: 2002-09-13

Abstract

(57)【要約】【課題】音声に含まれる未知の単語の辞書情報を容易
に取得できるようにする。【解決手段】音声データは、コントローラ１０１のワ
ードボタン１０４操作直前の所定時間（２秒間）の音声
データであり、ワードボタン操作に基づいて入力され
る。音声データは音声認識ソフトウェア２１に送られて
音声認識される。テキスト生成部３２は、２秒間に発声
された１または複数の単語をユーザに提示するテキスト
を音声認識結果に基づいて生成する。このテキストはス
ピーチソフトウェア２３に送られて音声合成されて出力
部３３を介してコントローラ１０１に送られてイヤーフ
ォン１０２から音声出力される。さらに選択された単語
について、辞書ソフトウェア２２を用いて辞書情報を取
り出し、辞書情報を表すテキストが生成され、最終的に
イヤーフォン１０２から辞書情報が音声出力される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、音声に含まれる
未知の単語の辞書情報を容易に取得できる辞書装置に関
する。

【０００２】

【従来の技術】音声情報を聞いているときに未知の単語
に遭遇することがある。とくに外国語の音声情報を聞い
ているこのようなことがしばしばある。通常、このよう
なときには、不便を感じることが多い。例えば、電車の
中で英語の学習をカセットテープ再生装置などを利用し
て行っていることを考える。聞いているうちに、知らな
い単語や聞き取れない単語があったときには、テキスト
を見て綴りを確認し、さらに、そのテキストにその単語
の意味が書いていないときには、辞書を引いていた。こ
のように通常は煩雑な手順を踏んでいた。

【０００３】また、混雑した電車の中や、歩いていると
き、自動車を運転しているときなど、テキストや辞書を
簡単に開くことができない状況下では、そもそも単語の
意味を確認する術がない。

【０００４】また、視覚障害者は、上述のテキストや辞
書を利用することがはなはだ困難である。

【０００５】語学学習に限っていえば、外国語の文章を
読み上げた後に、日本語の文章を続けて読み上げるもの
が知られている。これを利用すれば、テキストや辞書を
用いることなく未知の単語についての情報を取得するこ
とができる。しかし、このような教材は高価であり、ま
た自分でこのような教材を準備するのも大変である。

【０００６】結局、いままでは、聴覚だけを利用して未
知の単語に関する情報を取得するのは、極めて困難であ
った。

【０００７】

【発明が解決する課題】この発明は、以上の事情を考慮
してなされたものであり、主に聴覚だけを利用して音声
中に含まれる未知の単語に関する辞書情報を提供する技
術を提供することを目的としている。

【０００８】

【課題を解決するための手段】この発明によれば、上述
の目的を達成するために、辞書装置に、連続音声を出力
する手段と、操作者のタイミング指定を入力する手段
と、上記連続音声に対して音声認識を実行する手段と、
上記音声認識の認識結果と上記タイミング指定に基づい
て連続音声中の単語を特定する手段と、上記特定された
単語に基づいて辞書情報を生成する手段と、上記辞書情
報の音声を出力する手段とを設けるようにしている。

【０００９】この構成においては、連続音声中の、操作
者のタイミング指定に対応する単語を特定し、この単語
の辞書情報を音声出力するようにしている。したがっ
て、未知の単語の音声に遭遇しても、テキストや辞書を
参照することなしに、その単語の辞書情報を取得するこ
とができる。辞書情報は、例えば、綴り、１または複数
の意味、品詞、文例等、辞書が提供する種々の情報であ
る。

【００１０】音声認識は、連続して行うことが必ずしも
必要ではなく、操作者のタイミング指定に基づいて行う
ようにしてもよい。連続音声は所定のバッファメモリ等
により所定遅延を含んで音声認識処理部に送られるよう
にする。タイミング指定はボタン操作でも良いし、音声
認識を利用して音声コマンドで行っても良い。

【００１１】辞書装置は、単体の機器として構成しても
良いし、ユーザ装置（例えば携帯型の音声再生装置）と
支援計算機とで構成しても良い。支援計算機は、例え
ば、携帯型あるいは据え置き型のパーソナル・コンピュ
ータであり、ワイヤやＢｌｕｅｔｏｏｔｈ（商標）等に
用いる微弱電波の無線チャネルを介してユーザ装置に接
続される。インターネット上に置かれるサーバを支援計
算機として用いてもよい。

【００１２】また、辞書情報は、音声出力されても良い
し、表示装置を用いて表示出力されても良い。音声およ
び表示の双方で出力されても良い。

【００１３】なお、この発明は装置またはシステムの形
態として実現されるのみでなく、方法の形態でも実現可
能であり、その一部をコンピュータソフトウェアとして
実現することもできる。

【００１４】この発明の上述の側面およびこの発明の他
の側面は特許請求の範囲に記載されるとおりであり、以
下、実施例に即して詳細に説明される。

【００１５】

【発明の実施の形態】以下、この発明の実施例について
説明する。

【００１６】図１は、この発明の実施例を全体として示
しており、この図において、実施例の辞書装置は音声再
生装置１００および携帯型パーソナルコンピュータ２０
０を含んで構成されている。音声再生装置１００にはコ
ントローラ１０１が設けられている。音声再生装置１０
０は、オーディオカセットテープ、ミニディスク、ＤＡ
Ｔ（デジタルオーディオテープ）等の音声再生装置であ
り、任意の方式のものを採用できる。コントローラ１０
１はケーブルを用いて音声再生装置１００に接続され、
再生、再生中止、早送り等の制御を行うものである。操
作ボタン群１０３はこのような再生、再生中止等を制御
する一群のボタンであり、通常のものである。このコン
トローラ１０１には通常ではイヤーフォン１０２が接続
される。イヤーフォン１０２を用いて再生音声を聞くこ
とができる。なお、コントローラ１０１やイヤーフォン
１０２のケーブルに換えて無線チャネルを用いても良
い。

【００１７】コントローラ１０１にはワードボタン１０
４および通信インタフェース１０５も設けられている。
ワードボタン１０１は、聞いている音声に該当する単語
の辞書情報を調べたいときに操作するものである。通信
インタフェース１０５は無線で携帯型パーソナルコンピ
ュータ２００と通信するものである。この例では、無線
通信は、微弱電波を用いて行い、Ｂｌｕｅｔｏｏｔｈ
（商標）の仕様を採用している。もちろん、ＩＥＥＥ１
３９４やＵＳＢ（ユニバーサルシリアルバス）等の有線
チャネルを用いても良い。

【００１８】携帯型パーソナルコンピュータ２００は、
通常のハードウェア構成を有し、プロセッサ、主メモ
リ、ビデオメモリ、補助記憶装置、表示制御装置、表示
装置等を有している。さらに、この実施例の携帯型パー
ソナルコンピュータ２００は通信インタフェース２０１
を有し、コントローラ１０１と通信できるようになって
いる。

【００１９】図２は、携帯型パーソナルコンピュータ２
００のソフトウェア構成を示しており、この図におい
て、オペレーティング・システム２０上に音声認識ソフ
トウェア２１、辞書ソフトウェア２２、スピーチソフト
ウェア２３が実装されている。アプリケーション２４
は、コントローラ１０１からのデータや指示情報に基づ
いてユーザとの間で所望のインターラクションを行い、
所望の単語について辞書情報を提供するものである。そ
の詳細については図３の模式図および図４のフローチャ
ートを参照して以下に詳述する。

【００２０】図３はアプリケーション２４を模式的に示
しており、この図において、通信インターフェース２０
１（図１）を介して入力されたデータが入力部３０に入
力される。入力データは音声データやコマンドである。
音声データは、コントローラ１０１のワードボタン１０
４の操作直前の所定時間（例えば２秒間）の音声データ
であり、ワードボタン１０４の操作に基づいて入力され
る。コマンドは選択データ等である。音声データは音声
認識ソフトウェア２１（図２）に送られて音声認識され
る。音声認識結果はバッファ３１に送られ、バッファ３
１の認識結果を利用してテキスト生成部３２がテキスト
を生成する。このテキストは、２秒間に発声された１ま
たは複数の単語をユーザに提示し、複数の場合には１つ
の単語の選択を促すものである。このテキストはスピー
チソフトウェア２３（図２）に送られて音声合成されて
出力部３３を介してコントローラ１０１に送られてイヤ
ーフォン１０４（図１）から音声出力される。音声デー
タ以外のコマンド等はテキスト生成部３２に送られ、バ
ッファ３１にストアされている単語から所望の単語を選
択し、辞書ソフトウェア２２（図２）を用いて辞書情報
を取り出し、辞書情報を表すテキストを生成する。そし
てこの辞書情報を表せすテキストがスピーチソフトウェ
ア２３（図２）に送られその音声データがコントローラ
１０１に送られる。この結果イヤーフォン１０２から辞
書情報が音声出力される。

【００２１】図４は、この実施例の動作を示している。
なお、ユーザは、自分の好みに応じた辞書情報の提供方
法を指定できる。例えば、単語の綴りのみ、単語の意味
のみ等の結果の範囲、意味をいくつまで出力するかの指
定、例文を含めるかどうか、それらすべてか等を指定す
ることができる。このような個人ごとの好みをプロファ
イルに保持しておけば、とくにインターネット上のサー
バを用いる場合等に最適となる。

【００２２】また、図４の動作例では、出力の仕方を音
声出力とテキスト表示出力との２つから選択できる。テ
キスト表示出力は音声再生装置１００やコントローラ１
０１の液晶表示装置等の表示装置を用いて行うことがで
きる。

【００２３】図４の動作は以下のとおりである。

【００２４】［ステップＳ１０］：ユーザプロファイル
を読み込む。［ステップＳ１１］：ユーザのアクションすなわちワー
ドボタン１０４の押圧操作を検出する。［ステップＳ１２］：再生を一時停止する。［ステップＳ１３］：ユーザのアクションが起こる以前
の２秒間の音声データを送信する。［ステップＳ１４］：音声認識ソフトウェア２１で単語
に分割する。［ステップＳ１５］：テキスト表示か音声出力かを判別
する。［ステップＳ１６］：テキスト表示であれば分解した単
語を順番に表示装置に出力する。［ステップＳ１７］：音声出力であれば、分解した単語
を順に音声で出力する。［ステップＳ１８］：ワードボタン１０４が押されたか
どうかを判別する。［ステップＳ１９］：該当する単語を検出する。［ステップＳ２０］：検出した単語について辞書を参照
する。［ステップＳ２１］：テキスト表示か音声出力かを判別
する。［ステップＳ２２］：テキスト表示であれば、表示装置
に単語の意味を順番に出力する。［ステップＳ２３］：音声出力であれば、単語の意味を
順番に音声で出力する。［ステップＳ２４］：音声の再生を再開して元に戻る。

【００２５】具体的な例を挙げて上述の動作をさらに説
明する。

【００２６】例えば「ＴｈｉｓｉｓａＶＡＩＯ」
という音声が再生されて、ワードボタン１０４が押され
たとする。この文章が丁度２秒に収まっていると、この
部分を単語に分解してつぎのような音声出力を行う。

【００２７】「１ｓｔｔｈｉｓ」「２ｎｄｉｓ」「３ｒｄａ」「４ｔｈＶＡＩＯ」

【００２８】そして、４番目の「ＶＡＩＯ」について知
りたかったとすると、この発音時にワードボタン１０４
を操作する。そうするとつぎのような辞書情報に関する
音声が出力される。

【００２９】「４番目の単語は、ヴィ、エイ、アイ、オ
ウ、ヴァイオ」

【００３０】「ソニー株式会社のパーソナルコンピュー
タの名前です」この音声出力は例えばユーザが再度ワー
ドボタン１０４を操作するまで繰返される。もちろん、
上述の例で「１ｓｔ」、「２ｎｄ」等の音声出力を省略
して単語のみを順に音声出力しても良い。

【００３１】以上説明したように、この実施例によれ
ば、ワードボタンを操作するだけで所望の単語の辞書情
報を入手することができる。この実施例によれば、テキ
ストや辞書を携帯せずに未知の単語についての辞書情報
を簡易に取得できる。

【００３２】また、上述の実施例によれば、テレビ番
組、映画、ラジオ等をそのまま語学学習の教材として用
いることができる。

【００３３】以上でこの発明の実施例の説明を終了す
る。

【００３４】なお、この発明は上述の実施例に限定され
るものではなく、その趣旨を逸脱しない範囲で種々変更
が可能である。

【００３５】例えば、図５に示すように、携帯電話機３
００とコントローラ１０１とを無線通信で接続し、さら
に携帯電話機３００をその通信事業者のパケット網３０
１を介してインターネット４００に接続してインターネ
ット４００上のサーバ５００の辞書サービスや、音声認
識サービス、音声合成サービス等を利用するようにして
も良い。なお、携帯電話機３００は例えばＢｌｕｅｔｏ
ｏｔｈ（商標）の無線通信インタフェース３０２を有す
る。もちろん、コントローラ１０１がインターネットに
直接または間接に接続するインタフェース（例えば移動
局の機能）を具備して、携帯電話機３００を省略するよ
うにしても良い。

【００３６】また、図６に示すように、常時、連続音声
を単語に分解して表示装置に表示するようにしても良
い。なお、図６の動作は図から明らかであるので詳細に
説明を行わない。

【００３７】また図７に示すように、テキスト入力部４
０から規則音声合成部４１にテキストを供給してテキス
トの音声を出力し、音声出力部（アンプ等）４２を介し
てイヤーフォン１０２を発音駆動する際に、ワードボタ
ン１０４の操作によりテキスト中の単語を指定し辞書情
報を出力するようにしても良い。辞書情報や種々のナレ
ーションはテキスト生成部４３が辞書ソフトウェア２２
を参照して生成する。生成したテキストは規則音声合成
部４１で音声情報に変換されてイヤーフォン１０２に供
給される。規則音声合成部４１はスピーチソフトウェア
２３でもよい。少なくとも音声出力部４２およびイヤー
フォン１０２はユーザ装置に配置される。ユーザ装置の
処理能力に応じてテキスト入力部４０、規則音声合成部
４１、辞書ソフトウェア２２等もユーザ装置側に配置し
ても良い。この例でも、ユーザ装置と他のコンピュータ
資源との間は無線等のネットワークにより接続される。

【００３８】また、上述の例ではユーザ装置として音声
再生装置を用いたが音声とともにビデオを再生するもの
でもよい。また、ユーザ装置とパーソナルコンピュータ
やサーバとを連結して辞書システムを構成したが、ユー
ザ装置単体で辞書システムを構築するようにしても良
い。

【００３９】また、ワードボタン等の操作により単語位
置を指定するようにしたが、任意の入力操作で単語位置
を指定できる。たとえば、音声コマンドや「今の何
？」、「え？」等の音声に基づいて単語位置を指定でき
るようにしても良い。

【００４０】また、上述の例では、英語音声、日本語辞
書情報を例に挙げたが、他の任意の言語の音声から他の
任意の辞書情報を取り出すことができる。例えば日本語
音声を聞きながらフランス語の辞書情報を入手すること
ができる。もちろん、日本語音声を聞きながら日本語の
辞書情報を入手する等同一の自然言語同士でも利用可能
である。

【００４１】また、単語単位ではなく、文章を抽出して
翻訳文を音声出力あるいは表示出力するようにしてもよ
い。

【００４２】上述の実施例で出力した情報を保持してお
き再度学習に利用するようにしてもよい。また出力した
情報を元にテストを作成しても良い。

【００４３】

【発明の効果】以上説明したように、この発明によれ
ば、音声中に含まれる未知の単語あるいは不明な発音に
遭遇したときに簡易に該当箇所の辞書情報を取得でき
る。

【図面の簡単な説明】

【図１】この発明の実施例を全体として示すブロック
図である。

【図２】上述実施例のパーソナルコンピュータのソフ
トウェア構成を示す図である。

【図３】上述のパーソナルコンピュータのアプリケー
ションを説明する図である。

【図４】上述実施例の動作を説明するフローチャート
である。

【図５】上述実施例の変形例を説明するブロック図で
ある。

【図６】上述実施例の他の変形例を説明するフローチ
ャートである。

【図７】上述実施例のさらに他の変形例を説明するブ
ロック図である。

【符号の説明】

２０オペレーティング・システム２１音声認識ソフトウェア２２辞書ソフトウェア２３スピーチソフトウェア２４アプリケーション２４出力部３０入力部３１バッファ３２テキスト生成部３３出力部４０テキスト入力部４１規則音声合成部４２音声出力部４３テキスト生成部１００音声再生装置１０１コントローラ１０２イヤーフォン１０３操作ボタン群１０４ワードボタン２００携帯型パーソナルコンピュータ３００携帯電話機３０１パケット網３０２通信インタフェース４００インターネット５００サーバ

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 15/24 Ｇ１０Ｌ 3/00 ５７１ＲＨ０４Ｂ 7/26 Ｈ０４Ｂ 7/26 ＲＨ０４Ｑ 7/38 １０９Ｍ１０９ＨＦターム(参考） 5B091 AA03 BA02 CA21 CB12 CB32 CC02 CD03 5D015 AA02 BB01 GG01 KK04 LL06 LL08 5D045 AA20 AB04 AB26 5K067 AA34 BB04 BB41 CC10 EE00 EE02 EE12 EE35 FF02 FF25 HH22

Claims

【特許請求の範囲】

【請求項１】連続音声を出力する手段と、操作者のタイミング指定を入力する手段と、上記連続音声に対して音声認識を実行する手段と、上記タイミング指定に相当する部分の上記音声認識の認
識結果に基づいて連続音声中の単語を特定する手段と、上記特定された単語に基づいて辞書情報を生成する手段
と、上記辞書情報の音声を出力する手段とを有することを特
徴とする辞書装置。
【請求項２】上記単語を特定する手段は、上記タイミ
ングに応じた所定個数の一連の単語を特定し、さらに、
ユーザの指定に基づいて１の単語を特定する請求項１記
載の辞書装置。
【請求項３】上記タイミング指定を入力する手段は、
押しボタン装置を含む請求項１または２記載の辞書装
置。
【請求項４】ユーザ装置と支援計算機とをネットワー
クで接続し、上記ユーザ装置は、連続音声を出力する手段と、操作者のタイミング指定を入力する手段とを有し、上記支援計算機は、上記連続音声に対して音声認識を実行する手段と、上記タイミング指定に相当する部分の上記音声認識の認
識結果に基づいて連続音声中の単語を特定する手段と、上記特定された単語に基づいて辞書情報を生成する手段
とを有し、上記ユーザ装置は、さらに、上記辞書情報の音声を出力
する手段を有する辞書装置。
【請求項５】上記支援計算機は微弱電波に基づく無線
ネットワークでユーザ装置に接続されたパーソナルコン
ピュータとする請求項４記載の辞書装置。
【請求項６】上記支援計算機はインターネットを介し
て接続されるサーバ計算機とする請求項４記載の辞書装
置。
【請求項７】連続音声を出力する手段と、操作者のタイミング指定を入力する手段と、上記入力されたタイミング指定に基づいて連続音声中の
単語を特定する手段と、上記特定された単語に基づいて辞書情報を生成する手段
と、上記辞書情報を出力する手段とを有することを特徴とす
る辞書装置。
【請求項８】上記辞書情報は音声として出力される請
求項７記載の辞書装置。
【請求項９】上記単語を特定する手段は、上記連続音声に対して音声認識を実行する手段とを有
し、上記音声認識の認識結果と上記タイミング指定に基づい
て単語を特定する請求項７記載の辞書装置。
【請求項１０】上記連続音声はテキストに基づいて連
続音声を出力する音声合成手法により出力され、上記単語を特定する手段は、上記タイミング指定と上記
テキストの文字列とに基づいて単語を特定する請求項７
記載の辞書装置。