JP2005099741A

JP2005099741A - 音声辞書作成装置、音声辞書作成方法、及びプログラム

Info

Publication number: JP2005099741A
Application number: JP2004222876A
Authority: JP
Inventors: Masahiro Michiwaki; 正浩道脇
Original assignee: GF KK
Current assignee: GF KK
Priority date: 2003-09-02
Filing date: 2004-07-30
Publication date: 2005-04-14
Anticipated expiration: 2024-07-30
Also published as: JP4515186B2

Abstract

【課題】実用に耐え得る音声辞書を効率的に作成する。
【解決手段】音声辞書作成装置は、インターネット網に接続された読込処理部があり、読込処理部が文字入力を行おうとするサイトまたはそのサイトからリンクされたサイトまたはその他特に関連が深いとして使用者が指定したサイトを読み込んで、そのデータを文字列抽出部に受け渡し、文字列抽出部は、受け渡されたデータを単語等の音声認識に使用する文字列として解析してその結果を音声辞書作成部に受け渡し、音声辞書作成部は文字列抽出部から受け渡されたデータに従って、単語の使用頻度の調整や未知語の追加等の処理を行って音声辞書を作成する。
【選択図】図１

Description

この発明は、音声を認識して文字列に変換する際に用いられる音声辞書データを作成する音声辞書作成装置、音声辞書作成方法、及びプログラムに関する。

音声認識装置は、その一部または別個に音声辞書作成装置とともに用いられる。これは、たとえば用途によって、同じ「こうかい」という発音でも「公開」「後悔」「航海」などがあり、日本語の係り受けを使っても「こうかい−する」でいずれも成立することから、使用者側がどの用例を使うか指定してやらないと音声認識した結果の文字が、意図したものが得られないからである。このような音声辞書があらかじめ準備されている場合もあるが、それでも使用者側で優先順位（選択順序）などを調整してやらないと望む結果が得がたいので、やはり音声辞書を操作する必要が生じる。また、そもそも音声認識装置にとって既知でない単語である「未知語」が含まれていると、音声認識に支障を生じるため、そのような未知語を音声辞書作成装置で追加して音声認識装置の認識率を高めるのである。

このような音声辞書作成を行う場合、従来はひとつひとつの単語を、人間が辞書登録を行っており、実用に耐える辞書を作成するのには多くの工数を必要とした。また、あらかじめ準備された辞書を用いる場合でも、用途によって認識される単語の優先順位が異なるために、使用者による試行錯誤によって音声辞書を操作する手間が膨大に必要であった。また、大規模な長文を認識して効率を上げるような試みも行われていたが、用意する文章が必ずしも話者が意図したものに近似しているとは限らないので、やはり多く修正の工数が必要とされていた。

なお、音声認識により音声を文字列に変換する処理において、変換する文字列の候補が複数ある場合に、過去に入力された文字列の履歴に基づいて複数の候補の中から適切な候補を選択する音声認識装置及び音声認識方法が特許文献１に開示されている。
特開２００３−１０８１８９号公報

前述した通り、音声認識装置の使用者が音声を文字列に変換する際の優先順位をひとつひとつ登録することにより実用に耐え得る音声辞書を作成するには多くの工数が必要である。また、音声辞書作成装置があらかじめ備える音声辞書を用いる場合であっても、使用者の用途に応じて優先順位を調整するには膨大な手間がかかった。また、特許文献１に開示されている音声認識装置及び音声認識方法を用いる場合であっても、過去に入力された文字列の履歴が無ければ適切な文字列の候補を選択することができない。

本発明は前記課題に鑑み案出されたもので、インターネット接続手段がありインターネット接続手段を通じて提供されている文字入力可能なサイトに音声認識装置を使って文字入力を行いたいときに、短期間に実用に耐え得る音声辞書作成を可能にすることを目的とする。

インターネット網に接続された読込処理部が文字入力を行おうとするサイトまたはそのサイトからリンクされたサイトまたはその他特に関連が深いとして使用者が指定したサイトを読み込んで、そのデータを文字列抽出部に受け渡す。文字列抽出部は、受け渡されたデータを単語等の音声認識に使用する文字列として解析してその結果を音声辞書作成部に受け渡す。音声辞書作成部は文字列抽出部から受け渡されたデータに従って、単語の使用頻度を調整したり、未知語を追加するなどの処理を行って音声辞書を作成し音声認識装置の音声辞書を作成する。

従来は１件１件試行錯誤しながら人手によって音声辞書を作成していたが、本発明ではインターネット上から音声辞書を作成するためのデータを得ることとし、その範囲を、音声入力を行おうとするサイト、またそのリンク先、または使用者が特に関連が深いとして指定したサイトをデータ取得対象とする点が異なる。また、単に長文を音声辞書作成に使用するのではなく、その範囲を、音声入力を行おうとするサイト、またそのリンク先、または使用者が特に関連が深いとして指定したサイトをデータ取得対象とする点が異なる。

インターネットの性質を利用して、音声入力を行おうとするサイトそのもの又そのリンク先から音声辞書を作成する。また、以上でデータ量が不足である場合には使用者が任意に関連の深いと思われるサイトを読込処理部に追加することができる。このような手段により、効率的に音声辞書の作成を行う手段を提供する。

インターネット上に文字入力を受け付ける文字入力サイトが存在しており、インターネット網に接続されたインターネット接続装置がこの文字入力サイトに接続されており、インターネット接続装置に音声認識装置が付加されていて文字入力サイトに音声認識された文字を送信しようとするときに、インターネット網に接続された読込処理部が文字入力を行おうとするサイトまたはそのサイトからリンクされたサイトまたはその他特に関連が深いとして使用者が指定したサイトを読み込んで、そのデータを文字列抽出部に受け渡し、文字列抽出部は、受け渡されたデータを単語等の音声認識に使用する文字列として解析してその結果を音声辞書作成部に受け渡し、音声辞書作成部は文字列抽出部から受け渡されたデータに従って、単語の使用頻度を調整したり未知語を追加するなどの処理を行って音声辞書を作成して音声認識装置の音声辞書を作成し、この音声辞書を音声認識装置が用いることで効率的な音声認識処理による文字入力処理を行う。

本発明の音声辞書作成装置は、ＣＰＵ、メモリ、及びインターネットに接続するための通信インタフェースと、前記メモリに設けられた記憶領域である、第一の音声辞書記憶部、第二の音声辞書記憶部、読込ＵＲＬ記憶部、及び出現頻度記憶部と、前記ＣＰＵが前記メモリに記憶されているプログラムを実行することにより実現される、読込処理部、文字列抽出部、及び音声辞書作成部と、を備え、前記第一の音声辞書記憶部には、単語等の文字列を示す文字列データと、当該文字列の読みを示す読みデータとが対応付けて記憶され、前記読込ＵＲＬ記憶部には、ＷｅｂページのＵＲＬが記憶され、前記読込処理部は、前記読込ＵＲＬ記憶部に記憶されている前記ＵＲＬで指定されるＷｅｂページを、インターネット上のＷｅｂサーバにアクセスすることにより取得し、前記文字列抽出部は、前記読込処理部が取得した前記Ｗｅｂページを構成しているデータに含まれている前記文字列データを抽出して前記文字列データごとの出現頻度を求め、前記文字列データ及び前記出現頻度を示すデータである出現頻度データを対応付けて前記出現頻度記憶部に記憶し、前記音声辞書作成部は、前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部から取得し、取得した前記読みデータが同一の複数の前記文字列データの夫々に対して、音声認識によって得られる前記読みデータを前記複数の前記文字列データのうちから選択される一の文字列データに変換する際の前記文字列データの選択順序を前記出現頻度データに基づいて決定し、前記文字列データ、前記読みデータ、及び前記選択順序を示すデータである選択順序データを対応付けて、音声を認識して文字列に変換する際に用いられるデータである音声辞書データを生成し、当該音声辞書データを前記第二の音声辞書記憶部に記憶することとする。

また、本発明のプログラムは、ＣＰＵ、メモリ、及びインターネットに接続するための通信インタフェースと、前記メモリに設けられた記憶領域である、単語等の文字列を示す文字列データと、当該文字列の読みを示す読みデータとが対応付けて記憶されている第一の音声辞書記憶部と、ＷｅｂページのＵＲＬが記憶されている読込ＵＲＬ記憶部と、を備えるコンピュータに、前記読込ＵＲＬ記憶部に記憶されている前記ＵＲＬで指定されるＷｅｂページを、インターネット上のＷｅｂサーバにアクセスすることにより取得する手順と、取得した前記Ｗｅｂページに含まれている前記文字列データを抽出して前記文字列データごとの出現頻度を求める手順と、前記文字列データ及び前記出現頻度を示すデータである出現頻度データを対応付けて前記メモリに設けられた記憶領域である出現頻度記憶部に記憶する手順と、前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部から取得する手順と、取得した前記読みデータが同一の複数の前記文字列データの夫々に対して、音声認識によって得られる前記読みデータを前記複数の前記文字列データのうちから選択される一の文字列データに変換する際の前記文字列データの選択順序を前記出現頻度データに基づいて決定する手順と、前記文字列データ、前記読みデータ、及び前記選択順序を示すデータである選択順序データを対応付けて、音声を認識して文字列に変換する際に用いられるデータである音声辞書データを生成し、当該音声辞書データを前記メモリに設けられた記憶領域である第二の音声辞書記憶部に記憶する手順と、を実行させるためのものである。

音声認識技術の発達に伴い、音声認識プログラムを用いて音声を文字列に変換することが行われている。例えば、営業日報等の文字入力が必要なＷｅｂページへの文字入力や、学術論文等の文書データの作成等において用いられている。このような音声認識プログラムでは、音声を文字列に変換するための音声辞書が用いられる。音声認識プログラムが初めから備える標準の音声辞書（以後、「標準辞書」と称する。本発明の「第一の音声辞書」に該当。）には、例えば、「こうかい」という読みに対して「後悔」や「公開」、「航海」等の文字列が、変換される優先順位とともに記憶されている。音声認識プログラムは、認識した音声に対応する文字列を標準辞書の優先順位に従って決定する。

したがって、音声認識プログラムの使用者は、音声が使用者の意図する文字に変換されるよう、標準辞書に設定されている優先順位を調整する必要がある。例えば、対象が海洋分野であれば「航海」の優先順位を上げる等の作業が必要となる。

本発明のプログラムは、音声認識プログラムとともにコンピュータ（音声辞書作成装置）にインストールされて用いられる。そして、このような音声辞書作成装置を用いれば、音声認識させて文字入力を行おうとしている分野に関連するサイトのＷｅｂページのＵＲＬを読込ＵＲＬ記憶部に記憶させておくだけで、そのＷｅｂページにおける文字列の出現頻度に応じた優先順位が設定された音声辞書（以後、「ユーザ辞書」と称する。本発明の「第二の音声辞書」に該当。）を得ることができる。

なお、ユーザ辞書は、標準辞書とは別の新たな辞書として作成されることとしてもよいし、標準辞書を更新することにより作成されることとしてもよい。また、第一の音声辞書は、音声認識プログラムの標準辞書に限らず、文字列と読みが対応付けられているものであればよい。例えば、仮名漢字変換プログラムが備える仮名漢字変換用の辞書を第一の音声辞書として用いることも可能である。また、生成されたユーザ辞書は、音声認識における文字変換に限らず、仮名漢字変換においても使用可能である。

さらに、本発明のプログラムは、前記出現頻度記憶部に記憶されている前記文字列データのうち、前記第一の音声辞書記憶部に記憶されていない前記文字列データをディスプレイやプリンタ等の所定の出力装置に出力する手順と、前記コンピュータが備える所定の入力装置から入力される、前記出力装置に出力された前記文字列データによって表される文字列の読みを示す前記読みデータを受け付け、当該文字列データ及び当該読みデータを対応付けて前記メモリに設けられた記憶領域である読みデータ記憶部に記憶する手順と、を更に備え、前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを取得する前記手順は、前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部または前記読みデータ記憶部から取得する手順であることとしてもよい。

取得したＷｅｂページ中に、標準辞書に登録されていない文字列（以後、「未登録語」と称する。）が存在する場合、その文字列の読みを登録する必要がある。そこで、音声辞書作成装置によって未登録語がディスプレイ等の出力装置に出力され、ユーザが未登録語の読みをキーボードやマイク等の入力装置から入力する。そして、音声辞書作成装置は、未登録語も含めて同音異義語の優先順位を設定したユーザ辞書を生成する。このように、未登録語が多く存在する新しい技術分野等においても、文字列の出現頻度に応じた優先順位が設定されたユーザ辞書を得ることができ、音声を意図した文字列に変換することができる確率を高めることができる。

また、本発明のプログラムは、Ｗｅｂページに対応する画像や文字列等をディスプレイに表示するソフトウェアであるＷｅｂブラウザがユーザから指定されたＷｅｂページのＵＲＬを記憶する記憶領域であるＵＲＬ記憶部に記憶されている前記ＵＲＬを取得する手順と、前記ＵＲＬ記憶部から取得した前記ＵＲＬを前記読込ＵＲＬ記憶部に記憶する手順と、を更に備えることとしてもよい。

一般的に、Ｗｅｂブラウザは、ユーザからの指定により特定のＷｅｂページのＵＲＬを記憶しておく記憶部（以後、「ＵＲＬ記憶部」と称する。）を備えている。ユーザは、自分の業務や研究等に関連するＷｅｂページのＵＲＬを、このＵＲＬ記憶部に登録しておくことが多い。そこで、このＵＲＬ記憶部に記憶されているＵＲＬを本発明における読込ＵＲＬ記憶部に記憶することで、ユーザは音声辞書作成用に別途ＵＲＬを登録することなく、業務や研究等に関連する分野のＷｅｂページにおける文字列の出現頻度に応じた優先順位が設定された音声辞書を得ることができる。

さらに、本発明のプログラムは、前記読込ＵＲＬ記憶部が記憶する複数の前記ＵＲＬのうち、ユーザによって指定される前記ＵＲＬを受け付ける手順を更に備え、前記ＵＲＬ記憶部に記憶されている前記ＵＲＬを取得する前記手順は、前記ＵＲＬ記憶部に記憶されている前記ＵＲＬのうち、ユーザによって指定される前記ＵＲＬを前記ＵＲＬ記憶部から取得する手順であることとしてもよい。

ＵＲＬ記憶部には、多様な分野のＷｅｂページのＵＲＬが登録されている場合がある。そこで、ユーザは、ＵＲＬ記憶部に登録されているＵＲＬの中から、ユーザが文字入力を行おうとしている分野に合うＷｅｂページのＵＲＬを指定する。なお、ユーザがＵＲＬ記憶部に分野ごとのフォルダを設けている場合は、そのフォルダを選択することで、そのフォルダの中に格納されている複数のＵＲＬが指定されるようにすることもできる。

このように、Ｗｅｂブラウザが備えるＵＲＬ記憶部に多様な分野のＷｅｂページのＵＲＬが登録されている場合においても、ユーザが文字入力を行おうとしている分野に応じた優先順位が設定された音声辞書を得ることができる。また、ユーザがＵＲＬを分野別に整理してＵＲＬ記憶部に登録しておくことにより、目的とする分野に応じた音声辞書を容易に得ることができる。

また、Ｗｅｂページに設定された他のＷｅｂページへのリンクを辿る階層数を示すリンク階層データが前記メモリに設けられた記憶領域であるリンク階層記憶部に記憶され、前記読込ＵＲＬ記憶部に記憶されている前記ＵＲＬで指定される前記Ｗｅｂページを取得する前記手順には、取得した前記Ｗｅｂページを構成しているデータに含まれている他のＷｅｂページへのリンクを示すＵＲＬであるリンク先ＵＲＬを抽出して当該リンク先ＵＲＬで指定される前記他のＷｅｂページを取得する処理を、前記リンク階層記憶部に記憶されている前記リンク階層データによって示される前記階層数に応じて繰り返し実行する手順が含まれていることとしてもよい。

Ｗｅｂページには、そのＷｅｂページに関連するＷｅｂページのリンクが設定されていることが多い。そこで、音声辞書作成装置は、読込ＵＲＬ記憶部に記憶されているＵＲＬが示すＷｅｂページを取得する際に、そのＷｅｂページに設定されたリンクを辿って別のＷｅｂページを取得する。ここで、リンクを無限に辿ると、あらゆる分野のＷｅｂページが取得されてしまい、目的とする分野に応じた音声辞書を作成することができない。逆に、リンクを辿る階層数を少なくすると、取得できる文字列数が限られ、実用的な音声辞書を作成することができない。そこで、ユーザが、リンクを辿る階層数をリンク階層記憶部に設定しておくことにより、ユーザが目的とする分野に応じた音声辞書を作成することができる。

さらに、前記リンク階層記憶部には、前記読込ＵＲＬ記憶部に記憶されている前記ＷｅｂページのＵＲＬごとに前記リンク階層データが記憶され、前記他のＷｅｂページを取得する前記処理を、前記階層数に応じて繰り返し実行する前記手順は、前記他のＷｅｂページを取得する前記処理を、前記ＵＲＬ記憶部に記憶されている前記ＵＲＬに対応する前記リンク階層データによって示される前記階層数に応じて繰り返し実行する手順であることとしてもよい。

読込ＵＲＬ記憶部に記憶されているＵＲＬが示すＷｅｂページの特性に応じて、リンクを辿る階層数を指定することができる。例えば、ある分野の用語集のＷｅｂページであるような場合、そのＷｅｂページには、ユーザが目的とする分野の文字列が多く含まれており、リンクを更に辿る必要がない場合がある。一方、例えば、ある分野の総合サイトの入口にあるＷｅｂページ（トップページ）であるような場合、そのＷｅｂページに設定されたリンクを辿ることにより、ユーザが目的とする分野の文字列を得ることができる。このように、読込ＵＲＬ記憶部に記憶されているＵＲＬが示すＷｅｂページごとに、リンクを辿る階層数を指定可能とすることで、目的とする分野に一段と合致した音声辞書を作成することができる。

また、本発明のプログラムが、Ｗｅｂページを表示するソフトウェアが備える表示するＷｅｂページのＵＲＬを入力するエリアに入力されたＵＲＬを取得し、取得した当該ＵＲＬを前記読込ＵＲＬ記憶部に記憶する手順を更に備えることとしてもよい。

例えば、ユーザが音声認識を利用して文字入力を行おうとしているＷｅｂページが、営業日報の入力ページである場合、ユーザが入力しようとしている文字列は、そのＷｅｂページに含まれている過去の営業日報等に含まれていることが多い。このような場合、ＷｅｂブラウザのＵＲＬ入力エリアに入力されたＵＲＬを読込ＵＲＬ記憶部に記憶することにより、ユーザが文字入力を行おうとする際に、別途読込対象のＵＲＬを指定することなく、目的に応じた音声辞書を作成することができる。

１件１件試行錯誤を行って実用に耐え得る音声辞書を作成するよりも、効率的に実用に耐え得る音声辞書を作成することができる。また、適当な長文をもとに音声辞書を作成する手段は従来より存在していたが、インターネットの性質を利用してより高い精度で音声辞書の作成を行うことができる。さらに、迅速な音声辞書作成が行えることから、既存のサイトに対して音声認識機能を付加することが容易に行えるようになる。

このように、本発明によれば、実用に耐え得る音声辞書を効率的に作成する音声辞書作成装置、音声辞書作成方法、及びプログラムを提供することができる。

＝＝＝第一の実施形態＝＝＝
図１は本発明の実施例の構成図であり、インターネット上に文字入力を受け付ける文字入力サイトが存在しており、インターネット網に接続されたインターネット接続装置がこの文字入力サイトに接続されており、インターネット接続装置に音声認識装置が付加されていて文字入力サイトに音声認識された文字を送信できるようになっており、インターネット網に接続された読込処理部が文字入力を行おうとするサイトまたはそのサイトからリンクされたサイトまたはその他特に関連が深いとして使用者が指定したサイトを読み込み、そのデータを文字列抽出部に受け渡し、文字列抽出部は、受け渡されたデータを単語等の音声認識に使用する文字列として解析してその結果を音声辞書作成部に受け渡し、音声辞書作成部は文字列抽出部から受け渡されたデータに従って、単語の使用頻度を調整したり未知語を追加するなどの処理を行って音声辞書を作成して音声認識装置の音声辞書を作成することで効率的な音声認識による文字入力処理を行うものである。

一般に、音声入力を行おうとするときに問題になるのは、それぞれのサイトによって頻出語、業界用語、慣用句などの用例が異なることが原因である。しかし、これらの言葉はすでに音声入力を行おうとするサイト、またはそのリンク先のサイトにほとんど記述してあるものである。たとえば、船舶業界では「こうかい」は「航海」「公海」として用いられる例が多いはずであり「公開」「更改」などの用例は少なくなるはずである。そこで、「こうかいする」であれば「航海する」となり「公海する」はおかしいので、係り受けの解析から「航海する」が正しい音声認識である確率が高い者と判断できる。そして、インターネットの性質上、すでに文字入力しようとしているサイトまたはリンクされたサイトであれば、やはり船舶業界関連の内容が記述されているはずであり上記のような用例を容易に見出し得る。また、船舶業界で著名なサイトがあれば、そのようなサイトも音声辞書作成に有益であるから必要に応じてそのデータを取得すべきである。また、掲示板のようなサイトにおいては、書き込みしようとする者の前の書き込みを受けたかたちで内容の書き込みが行われるケースが多いはずであり、必然的に音声認識に必要な単語がすでに掲示板サイトに出現していると思われるのである。このようなインターネット自体が有する性質を利用して、読込処理部がインターネットからデータを取得することで結果的に効率的な音声辞書を作成することが可能になるのである。

＝＝＝第二の実施形態＝＝＝
＝＝全体構成＝＝
次に、本発明における第二の実施形態について説明する。図２は、第二の実施形態のネットワーク構成を示す図である。音声辞書作成装置１は、本発明における音声辞書作成プログラムを実行する装置であり、パーソナルコンピュータや音声認識に用いられる専用の装置等のコンピュータである。音声辞書作成装置１は、インターネットやイントラネット等のネットワーク２を介して複数のＷｅｂサーバ３ａ，３ｂ，３ｃと通信することができる。

Ｗｅｂサーバ３ａにはＨＴＭＬ（Hyper Text Markup Language）やＸＭＬ（eXtensible Markup Language）等のマークアップ言語で記述されたデータであるＷｅｂページ４ａが保存されている。そして、音声辞書作成装置１はＨＴＴＰ（Hyper Text Transfer Protocol）に則ってネットワーク２を介してＷｅｂサーバ３ａにアクセスすることで、Ｗｅｂページ４ａを取得することができる。図３に、Ｗｅｂページ４ａの一例を示す。Ｗｅｂページ４ａには、“<HTML>”や“<TITLE>”等のタグや、Ｗｅｂブラウザに表示される文書である文書データ５等が含まれている。また、Ｗｅｂページ４ａには、“<A HREF=”＠＠＠”></A>”というタグを用いて他のＷｅｂページへのリンク６が設定されている。「＠＠＠」の部分は、リンク先のＷｅｂページのＵＲＬを示すものである。

なお、Ｗｅｂブラウザとは、Ｗｅｂページを表示するソフトウェアである。図４は、Ｗｅｂページ４ａを表示したＷｅｂブラウザ７を示す図である。Ｗｅｂブラウザ７は、表示するＷｅｂページのＵＲＬを入力するＵＲＬ入力エリア８および文書データ５や画像データ等が表示される表示エリア９が設けられている。ＵＲＬ入力エリア８にＷｅｂページ４ａのＵＲＬが入力されると、音声辞書作成装置１はＷｅｂサーバ３ａからＷｅｂページ４ａを取得し、Ｗｅｂページ４ａに含まれる文書データ５等を表示エリア９に表示する。表示エリア９には、リンク６も表示されており、ユーザがリンク６をクリックすると、音声辞書作成装置１はリンク先のＷｅｂページを取得する。

このように、Ｗｅｂページに設定されたリンクを辿ることにより、複数のＷｅｂページを取得することができる。図２の例は、Ｗｅｂページ４ａにはＷｅｂサーバ３ｂに保存されたＷｅｂページ４ｂへのリンクが設定され、Ｗｅｂページ４ｂにはＷｅｂサーバ３ｃに保存されたＷｅｂページ４ｃへのリンクが設定されていることを示している。

＝＝ハードウェア構成＝＝
図５は、音声辞書作成装置１のハードウェア構成を示す図である。音声辞書作成装置１は、ＣＰＵ１０、メモリ１１、記憶装置１２、記録媒体読取装置１３、通信インタフェース１４、入力装置１５、出力装置１６、及びマイク１７を備えている。

ＣＰＵ１０は、音声辞書作成装置１の全体を制御するものであり、記憶装置１２に記憶されているプログラムを順次メモリ１１に格納し、メモリ１１に記憶されているプログラムを実行することができる。記憶装置１２は、ハードディスクドライブ等であり、プログラムやデータが記憶される。記録媒体読取装置１３は、ＣＤ−ＲＯＭ等の記録媒体１８に記録されているプログラムを読みとり、記憶装置１２に格納することができる。

通信インタフェース１４は、ネットワーク２を介してＷｅｂサーバ３ａ，３ｂ，３ｃとデータの送受信を行うためのインタフェースである。入力装置１５は、ユーザからのデータ入力を受け付ける装置であり、例えば、キーボードやマウス等である。出力装置１６は、ＣＰＵ１０の処理結果等を出力する装置であり、例えば、ディスプレイやプリンタ等である。マイク１７はユーザの発話により発生する音声を取得する装置である。なお、入力装置１５、出力装置１６、及びマイク１７は、音声辞書作成装置１と別体で構成され、ケーブル等を用いて音声辞書作成装置１と接続されることとしてもよい。

＝＝機能構成＝＝
図６は、音声辞書作成装置１が備える機能の構成を示す図である。音声辞書作成装置１は、音声認識機能部２０、音声辞書作成機能部３０、及び記憶部４０を備えている。

音声認識機能部２０は、音声辞書作成装置１のメモリ１１に記憶されている音声認識プログラムをＣＰＵ１０が実行することにより実現される、音声取得部２１、音声認識部２２、及び文字列変換部２３を備えている。

また、音声辞書作成機能部３０は、音声辞書作成装置１のメモリ１１に記憶されている音声辞書作成プログラムをＣＰＵ１０が実行することにより実現される、読込処理部３１、文字列抽出部３２、未登録語出力部３３、読みデータ受付部３４、音声辞書作成部３５、及び入力ＵＲＬ取得部３６を備えている。

そして、記憶部４０は、メモリ１１に設けられた記憶領域であり、標準辞書記憶部（本発明の「第一の音声辞書記憶部」に該当。）４１、ユーザ辞書記憶部（本発明の「第二の音声辞書記憶部」に該当。）４２、読込ＵＲＬ記憶部４３、リンク階層記憶部４４、出現頻度記憶部４５、及び読みデータ記憶部４６を含んでいる。

音声取得部２１は、マイク１７から入力された音声データを取得する。音声認識部２２は、音声取得部２１が取得した音声データによって示される文字を認識して文字データを生成する。文字列変換部２３は、音声認識部２２が生成した複数の文字データから平仮名の文字列を生成し、平仮名の文字列を漢字や片仮名等の文字列に変換する。

なお、文字列変換部２３は、文字列を変換する際に、標準辞書記憶部４１に記憶されている標準辞書またはユーザ辞書記憶部４２に記憶されているユーザ辞書を用いることができる。標準辞書とは、音声認識プログラムをインストールした際等に作成される、基本となる音声辞書である。また、ユーザ辞書とは、ユーザが文字列の追加・変更や、平仮名の文字列に対応する漢字や片仮名の文字列の候補が複数ある場合に、漢字や片仮名の文字列の夫々が選択される順序（優先順位）の変更等を行うことができる音声辞書である。なお、標準辞書を上書き更新してユーザ辞書を生成することも可能である。

図７は、標準辞書記憶部４１およびユーザ辞書記憶部４２の構造を示す図である。標準辞書記憶部４１およびユーザ辞書記憶部４２には、文字列データ、読みデータ、及び優先順位データが対応付けられたデータである音声辞書データが記憶されている。文字列データには、漢字や片仮名の文字列が設定され、読みデータには、その文字列の読みを示す平仮名の文字列が設定されている。そして、優先順位データには、文字列変換部２３が平仮名の文字列を漢字や片仮名の文字列に変換する際の優先順位を示すデータが設定されている。

図７に示す例では、「こうかい」という読みに対して「航海」、「公開」、「後悔」の優先順位が順に「１」、「２」、「３」となっている。この場合、文字列変換部２３は、「こうかい」という平仮名の文字列を優先順位が最も高い「航海」という漢字の文字列に変換する。

読込処理部３１は、読込ＵＲＬ記憶部４３に記憶されているＷｅｂページのＵＲＬを取得し、当該ＵＲＬが示すＷｅｂページをＷｅｂサーバから取得する。図８は、読込ＵＲＬ記憶部４３の構造を示す図である。読込ＵＲＬ記憶部４３には、ユーザによって指定されたＷｅｂページのＵＲＬが記憶されている。読込ＵＲＬ記憶部４３に記憶されているＵＲＬは、一つであってもよいし、複数であってもよい。

また、読込処理部３１は、取得したＷｅｂページに設定されているリンクを取得し、当該リンクに設定されたＵＲＬが示す他のＷｅｂページを取得する。このように、読込処理部３１は、Ｗｅｂページに設定されたリンクを辿って複数のＷｅｂページを取得する。図９は、リンク階層記憶部４４の構造を示す図である。リンク階層記憶部４４には、読込ＵＲＬ記憶部４３に記憶されているＵＲＬごとに、リンクを辿る階層数を示すデータであるリンク階層データが設定されている。なお、リンク階層記憶部４４には、読込ＵＲＬ記憶部４３に記憶されている全てのＵＲＬに共通のリンク階層データが一つだけ記憶されていることとしてもよい。

文字列抽出部３２は、読込処理部３１が取得したＷｅｂページを構成するデータからタグを除去して得られる文書データから、意味のある単位に分解した文字列データを抽出する。文書データから文字列データを抽出する方法としては、例えば、特開２０００−２５９６７３号公報に開示されている単語分割方法を用いることができる。そして、文字列抽出部３２は、文字列データごとの出現回数をカウントし、文字列データと出現回数を示すデータである出現頻度データとを対応付けて出現頻度記憶部４５に記憶する。図１０は、出現頻度記憶部４５の構造を示す図である。

未登録語出力部３３は、出現頻度記憶部４５に記憶されている文字列データのうち、標準辞書に登録されていない文字列データをディスプレイ等の出力装置１６に出力する。読みデータ受付部３４は、ユーザによって入力装置１５やマイク１７から入力される、出力装置１６に出力された文字列データの読みを示す読みデータを受け付け、当該文字列データと当該読みデータとを対応付けて読みデータ記憶部４６に記憶する。図１１は、読みデータ記憶部４６の構造を示す図である。

音声辞書作成部３５は、出現頻度記憶部４５に記憶されている文字列データに対応する読みデータを、標準辞書記憶部４１または読みデータ記憶部４６から取得し、読みデータが同一の文字列データの夫々について、出現頻度データに基づいて優先順位を決定する。つまり、音声辞書作成部３５は、読みデータが同一の文字列データに対して、出現回数が多い順に高い優先順位を設定する。そして、音声辞書作成部３５は、文字列データ、読みデータ、及び湯煎順位を示すデータである優先順位データを対応付けて音声辞書データを生成し、当該音声辞書データをユーザ辞書記憶部４２に記憶する。

入力ＵＲＬ取得部３６は、Ｗｅｂブラウザ７のＵＲＬ入力エリア８に入力されたＵＲＬを取得し、当該ＵＲＬを読込ＵＲＬ記憶部４３に記憶する。つまり、入力ＵＲＬ取得部３６は、ユーザがＷｅｂブラウザ７に表示させようとしているＷｅｂページに基づいて文字列の優先順位を設定する場合に用いられる。

＝＝音声辞書作成処理＝＝
次に、音声辞書作成装置１における音声辞書作成処理について説明する。図１２は、音声辞書作成処理のフローチャートである。まず、読込処理部３１が、読込ＵＲＬ記憶部４３に記憶されているＵＲＬを一つ取得する（Ｓ１２０１）。さらに、読込処理部３１は、当該ＵＲＬに対応するリンク階層データをリンク階層記憶部４４から取得し（Ｓ１２０２）、リンク階層をカウントするための作業用のデータである作業階層データに０を設定する（Ｓ１２０３）。

続いて、読込処理部３１は、取得したＵＲＬが示すＷｅｂページをＷｅｂサーバ３ａ，３ｂ，３ｃから取得する（Ｓ１２０４）。そして、読込処理部３１は作業階層データがリンク階層データと等しいかどうか確認する（Ｓ１２０５）。

作業階層データがリンク階層データと等しくない場合（Ｓ１２０５：Ｎｏ）、読込処理部３１は、取得したＷｅｂページを構成するデータに含まれるリンク先ＵＲＬを取得し（Ｓ１２０６）、当該リンク先ＵＲＬが示すＷｅｂページを取得する（Ｓ１２０７）。そして、読込処理部３１は、作業階層データに１加算し（Ｓ１２０８）、作業階層データとリンク階層データが等しいかどうか確認するステップ（Ｓ１２０５）に戻る。つまり、読込処理部３１は、Ｓ１２０５〜Ｓ１２０８の処理を繰り返すことによって、読込ＵＲＬ記憶部４３に記憶されているＵＲＬが示すＷｅｂページからリンク階層データによって示されるリンク階層の範囲内にあるＷｅｂページを取得する。

作業階層データがリンク階層データと等しくなると（Ｓ１２０５：Ｙｅｓ）、読込処理部３１は、読込ＵＲＬ記憶部４３に未取得のＵＲＬがあるかどうか確認する（Ｓ１２０９）。未取得のＵＲＬがある間（Ｓ１２０９：Ｙｅｓ）、読込処理部３１は、未取得のＵＲＬを一つ取得し、Ｗｅｂページを取得する一連の処理（Ｓ１２０１〜Ｓ１２０８）を繰り返し実行する。

読込処理部３１によって読込ＵＲＬ記憶部のＵＲＬが全て取得されると（Ｓ１２０９：Ｎｏ）、文字列抽出部３２は、読込処理部３１が取得したＷｅｂページを構成するデータに含まれる文字列データを抽出する（Ｓ１２１０）。そして、文字列抽出部３２は、抽出した文字列データごとの出現回数をカウントし、文字列データと出現回数を示す出現頻度データとを対応付けて出現頻度記憶部４５に記憶する（Ｓ１２１１）。

続いて、未登録語出力部３３は、出現頻度記憶部４５に記憶されている文字列データのうち、標準辞書記憶部４１に記憶されていない文字列データを抽出し、当該文字列データをディスプレイ等の出力装置１６に出力する（Ｓ１２１２）。そして、読みデータ受付部３４は、ユーザによってキーボード等の入力装置１５やマイク１７から入力される当該文字列データに対する読みデータを受け付け、当該文字列データと当該読みデータとを対応付けて読みデータ記憶部４６に記憶する（Ｓ１２１３）。

次に、音声辞書作成部３５は、出現頻度記憶部４５に記憶されている文字列データに対応する読みデータを標準辞書記憶部４１または読みデータ記憶部４６から取得する（Ｓ１２１４）。そして、音声辞書作成部３５は、読みデータが同じ複数の文字列データに対する優先順位を出現頻度記憶部４５に記憶されている出現頻度データに基づいて決定する（Ｓ１２１５）。最後に、音声辞書作成部３５は、文字列データ、読みデータ、及び優先順位を示すデータである優先順位データを対応付けて音声辞書データを生成し、当該音声辞書データをユーザ辞書記憶部４２に記憶する（Ｓ１２１６）。

ここで、出現頻度データに基づいて優先順位を決定する方法の例を説明する。図１３は、優先順位を決定する方法の第一の例を示す図である。まず、音声辞書作成部３５は、出現頻度記憶部４５に記憶されている出現頻度データの降順に各文字列データの優先順位を設定した音声辞書データをユーザ辞書記憶部４２に記憶する（Ｓ１３０１）。そして、音声辞書作成部３５は、標準辞書記憶部４１に記憶されている文字列データのうち、出現頻度記憶部４５に存在しない文字列データについて、Ｓ１３０１で記憶された文字列データよりも後の優先順位を設定して、ユーザ辞書記憶部４２に記憶する（Ｓ１３０２）。

また、図１４は、優先順位を決定する方法の第二の例を示す図である。まず、音声辞書作成部３５は、標準辞書記憶部４１に記憶されている文字列データの優先順位を、出現頻度記憶部４５に記憶されている出現回数分上昇させた音声辞書データをユーザ辞書記憶部４２に記憶する（Ｓ１４０１）。図１４の例では、「航海」の出現回数は２回であるため、標準辞書の「航海」の優先順位は「３」から「２」上昇し、「１」となる。これに伴い、「後悔」および「公開」の優先順位は１ずつ下げられる。

次に、音声辞書作成部３５は、未登録語に最も低い優先順位を設定した音声辞書データをユーザ辞書記憶部４２に記憶する（Ｓ１４０２）。図１４の例では、未登録語の「公海」に最も低い優先順位「４」が設定され、ユーザ辞書に追加されている。そして、音声辞書作成部３５は、追加した未登録語の優先順位を出現頻度記憶部４５に記憶されている出現回数分上昇させる（Ｓ１４０３）。図１４の例では、「公海」の出現回数は１回であるため、「公海」の優先順位は「４」から「１」上昇し、「３」となる。そして、「公開」の優先順位が「３」から「４」に下げられる。

図１３および図１４に例示したように、音声辞書作成部３５は、読みデータが同一の複数の文字列データの夫々に対する優先順位データを出現頻度記憶部４５に記憶されている出現頻度データに基づいて生成し、文字列データ、読みデータ、及び優先順位データを対応付けた音声辞書データをユーザ辞書記憶部４２に記憶することができる。

＝＝ＷｅｂブラウザのＵＲＬ記憶部を利用＝＝
次に、Ｗｅｂブラウザ７が備えるＵＲＬの記憶部を読込対象のＵＲＬとして用いる場合について説明する。図１５は、Ｗｅｂブラウザ７の登録ＵＲＬメニュー５０を表示した図である。ユーザは、自分の気に入ったＷｅｂページがあった場合、そのＷｅｂページがＷｅｂブラウザ７に表示されている際に、登録ＵＲＬメニュー５０で追加ボタン５１を選択する。すると、そのＷｅｂページのタイトル５２が登録ＵＲＬメニュー５０の中に追加される。また、ユーザは登録ＵＲＬメニュー５０の中にフォルダ５３を作成し、そのフォルダ５３の中にＷｅｂページのタイトル５４を追加することもできる。

図１６は、ユーザが登録ＵＲＬメニュー５０を用いて登録したＷｅｂページのＵＲＬを記憶しているＵＲＬ記憶部５５の構造を示す図である。ＵＲＬ記憶部５５は、メモリ１１に設けられた記憶領域である。ＵＲＬ記憶部５５には、フォルダ５３、Ｗｅｂページのタイトル５２，５４、及びＷｅｂページのＵＲＬが対応付けられて記憶されている。

読込処理部３１は、このＵＲＬ記憶部５５に記憶されているＵＲＬを取得し、読込ＵＲＬ記憶部４３に記憶することができる。また、読込処理部３１は、ユーザによって指定される登録ＵＲＬメニュー５０に登録されたＷｅｂページのタイトル５２，５４やフォルダ５３を受け付け、そのタイトル５２，５４やフォルダ５３に対応するＵＲＬを読込ＵＲＬ記憶部４３に記憶することも可能である。

＝＝Ｗｅｂブラウザで入力されたＵＲＬを利用＝＝
次に、Ｗｅｂブラウザ７のＵＲＬ入力エリア８に入力されたＵＲＬを読込対象のＵＲＬとして用いる場合について説明する。図１７は、入力ＵＲＬ取得部３６の処理を示すフローチャートである。まず、入力ＵＲＬ取得部３６は、ユーザがＵＲＬ入力エリア８に入力したＵＲＬを取得する（Ｓ１７０１）。そして、入力ＵＲＬ取得部３６は、取得したＵＲＬを読込ＵＲＬ記憶部４３に記憶し（Ｓ１７０２）、図１２に示した音声辞書作成処理を起動する（Ｓ１７０３）。これにより、ＵＲＬ入力エリア８に入力されたＵＲＬが示すＷｅｂページ及び当該Ｗｅｂページに設定されたリンクを辿って取得される他のＷｅｂページをもとに、ユーザ辞書が生成される。

以上、音声辞書作成プログラムを実行する音声辞書作成装置１の動作について説明した。前述したように、本発明の音声辞書作成プログラムがインストールされた音声辞書作成装置１を用いれば、音声認識させて文字入力を行おうとしている分野に関連するサイトのＷｅｂページのＵＲＬを読込ＵＲＬ記憶部４３に記憶させておくだけで、そのＷｅｂページにおける文字列の出現頻度に応じた優先順位が設定されたユーザ辞書を得ることができる。なお、生成されたユーザ辞書は、音声認識における文字変換に限らず、仮名漢字変換における文字変換においても使用可能である。

また、音声辞書作成装置１は未登録語をディスプレイ等の出力装置１６に出力する。そして、ユーザが未登録語の読みをキーボードやマイク等の入力装置から入力する。音声辞書作成装置１は、未登録語も含めて同音異義語の優先順位を設定したユーザ辞書を生成する。このように、未登録語が存在する場合においても、文字列の出現頻度に応じた優先順位が設定された音声辞書を得ることができる。

また、音声辞書作成装置１は、ユーザがＷｅｂブラウザ７の登録ＵＲＬメニュー５０から登録したＵＲＬが記憶されているＵＲＬ記憶部５５からＵＲＬを取得して読込ＵＲＬ記憶部４３に記憶することもできる。ユーザは、自分の業務や研究等に関連するＷｅｂページのＵＲＬを、このＵＲＬ記憶部５５に登録しておくことが多い。そこで、このＵＲＬ記憶部５５に記憶されているＵＲＬを読込ＵＲＬ記憶部に記憶することで、ユーザは音声辞書作成用に別途ＵＲＬを登録することなく、業務や研究等に関連する分野のＷｅｂページにおける文字列の出現頻度に応じた優先順位が設定された音声辞書を得ることができる。

この場合、ＵＲＬ記憶部５５には、多様な分野のＷｅｂページのＵＲＬが登録されている場合がある。そこで、音声辞書作成装置１は、ＵＲＬ記憶部５５に登録されているＵＲＬの中から、ユーザによって指定されたＵＲＬのみを読込ＵＲＬ記憶部４３に記憶することができる。なお、ユーザは、ＵＲＬ記憶部５５に分野ごとのフォルダを設けている場合は、そのフォルダを選択することにより、そのフォルダの中に格納されている複数のＵＲＬを指定することができる。

このように、Ｗｅｂブラウザが備えるＵＲＬ記憶部５５に多様な分野のＷｅｂページのＵＲＬが登録されている場合においても、ユーザが文字入力を行おうとしている分野に応じた優先順位が設定された音声辞書を得ることができる。また、ユーザがＵＲＬを分野別に整理してＵＲＬ記憶部５５に登録しておくことにより、目的とする分野に応じた音声辞書を容易に得ることができる。

また、Ｗｅｂページの特徴として、Ｗｅｂページには関連する他のＷｅｂページへのリンクが設定されていることが多い。そこで、音声辞書作成装置１は、読込ＵＲＬ記憶部４３に記憶されているＵＲＬが示すＷｅｂページを取得する際に、そのＷｅｂページに設定されたリンクを辿って他のＷｅｂページを取得する。ここで、リンクを無限に辿ると、あらゆる分野のＷｅｂページが取得されてしまい、目的とする分野に応じた音声辞書を作成することができない。逆に、リンクを辿る階層数を少なくすると、取得できる文字列数が限られ、実用的な音声辞書を作成することができない。そこで、ユーザが、リンクを辿る階層数をリンク階層記憶部４４に設定しておくことにより、ユーザが目的とする分野に応じた音声辞書を作成することができる。

この場合、読込ＵＲＬ記憶部４３に記憶されているＵＲＬが示すＷｅｂページの特性に応じて、リンクを辿る階層数を指定することも可能である。例えば、Ｗｅｂページがある分野の用語集のＷｅｂページであるような場合、そのＷｅｂページには、ユーザが目的とする分野の文字列が多く含まれており、リンクを更に辿る必要がない場合がある。一方、例えば、ある分野の総合サイトの入口にあるＷｅｂページ（トップページ）であるような場合、そのＷｅｂページに設定されたリンクを辿ることにより、ユーザが目的とする分野の文字列を得ることができる。このように、読込ＵＲＬ記憶部４３に記憶されているＵＲＬが示すＷｅｂページごとに、リンクを辿る階層数を指定可能とすることで、目的とする分野に一段と合致した音声辞書を作成することができる。

また、音声辞書作成装置１は、Ｗｅｂブラウザ７のＵＲＬ入力エリア８に入力されたＵＲＬを取得して、取得した当該ＵＲＬを読込ＵＲＬ記憶部４３に記憶することもできる。例えば、ユーザが音声認識を利用して文字入力を行おうとしているＷｅｂページが、営業日報の入力ページである場合、ユーザが入力しようとしている文字列は、そのＷｅｂページに含まれている過去の営業日報等に含まれていることが多い。このような場合、Ｗｅｂブラウザ７のＵＲＬ入力エリア８に入力されたＵＲＬを読込ＵＲＬ記憶部４３に記憶することにより、ユーザが文字入力を行おうとする際に、別途読込対象のＵＲＬを指定することなく、目的に応じた音声辞書を作成することができる。

以上本発明の実施形態について説明したが、以上の実施形態の説明は本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明はその趣旨を逸脱することなく、変更、改良され得ると共に本発明にはその等価物が含まれることは勿論である。

本発明の実施例の構成図である。本発明の第二の実施形態におけるネットワーク構成を示す図である。Ｗｅｂページの一例を示す図である。Ｗｅｂページを表示したＷｅｂブラウザを示す図である。音声辞書作成装置のハードウェア構成を示す図である。音声辞書作成装置が備える機能の構成を示す図である。標準辞書記憶部およびユーザ辞書記憶部の構造を示す図である。読込ＵＲＬ記憶部の構造を示す図である。リンク階層記憶部の構造を示す図である。出現頻度記憶部の構造を示す図である。読みデータ記憶部の構造を示す図である。音声辞書作成処理のフローチャートである。優先順位を決定する方法の第一の例を示す図である。優先順位を決定する方法の第二の例を示す図である。Ｗｅｂブラウザの登録ＵＲＬメニューを表示した図である。ユーザが登録ＵＲＬメニューを用いて登録したＷｅｂページのＵＲＬを記憶しているＵＲＬ記憶部の構造を示す図である。入力ＵＲＬ取得部の処理を示すフローチャートである。

符号の説明

１音声辞書作成装置２ネットワーク
３ａ，３ｂ，３ｃＷｅｂサーバ４ａ，４ｂ，４ｃＷｅｂページ
５文書データ６リンク
７Ｗｅｂブラウザ８ＵＲＬ入力エリア
９表示エリア１０ＣＰＵ
１１メモリ１２記憶装置
１３記録媒体読取装置１４通信インタフェース
１５入力装置１６出力装置
１７マイク１８記録媒体
２０音声認識機能部２１音声取得部
２２音声認識部２３文字列変換部
３０音声辞書作成機能部３１読込処理部
３２文字列抽出部３３未登録語出力部
３４読みデータ受付部３５音声辞書作成部
３６入力ＵＲＬ取得部４０記憶部
４１標準辞書記憶部４２ユーザ辞書記憶部
４３読込ＵＲＬ記憶部４４リンク階層記憶部
４５出現頻度記憶部４６読みデータ記憶部
５０登録ＵＲＬメニュー５１追加ボタン
５２，５４Ｗｅｂページのタイトル５３フォルダ
５５ＵＲＬ記憶部

Claims

ＣＰＵ、メモリ、及びインターネットに接続するための通信インタフェースと、
前記メモリに設けられた記憶領域である、第一の音声辞書記憶部、第二の音声辞書記憶部、読込ＵＲＬ記憶部、及び出現頻度記憶部と、
前記ＣＰＵが前記メモリに記憶されているプログラムを実行することにより実現される、読込処理部、文字列抽出部、及び音声辞書作成部と、
を備え、
前記第一の音声辞書記憶部には、単語等の文字列を示す文字列データと、当該文字列の読みを示す読みデータとが対応付けて記憶され、
前記読込ＵＲＬ記憶部には、ＷｅｂページのＵＲＬが記憶され、
前記読込処理部は、前記読込ＵＲＬ記憶部に記憶されている前記ＵＲＬで指定されるＷｅｂページを、インターネット上のＷｅｂサーバにアクセスすることにより取得し、
前記文字列抽出部は、
前記読込処理部が取得した前記Ｗｅｂページを構成しているデータに含まれている前記文字列データを抽出して前記文字列データごとの出現頻度を求め、
前記文字列データ及び前記出現頻度を示すデータである出現頻度データを対応付けて前記出現頻度記憶部に記憶し、
前記音声辞書作成部は、
前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部から取得し、
取得した前記読みデータが同一の複数の前記文字列データの夫々に対して、音声認識によって得られる前記読みデータを前記複数の前記文字列データのうちから選択される一の文字列データに変換する際の前記文字列データの選択順序を前記出現頻度データに基づいて決定し、
前記文字列データ、前記読みデータ、及び前記選択順序を示すデータである選択順序データを対応付けて、音声を認識して文字列に変換する際に用いられるデータである音声辞書データを生成し、当該音声辞書データを前記第二の音声辞書記憶部に記憶すること、
を特徴とする音声辞書作成装置。
ＣＰＵ、メモリ、及びインターネットに接続するための通信インタフェースと、
前記メモリに設けられた記憶領域である、
単語等の文字列を示す文字列データと、当該文字列の読みを示す読みデータとが対応付けて記憶されている第一の音声辞書記憶部と、
ＷｅｂページのＵＲＬが記憶されている読込ＵＲＬ記憶部と、
を備えるコンピュータに、
前記読込ＵＲＬ記憶部に記憶されている前記ＵＲＬで指定されるＷｅｂページを、インターネット上のＷｅｂサーバにアクセスすることにより取得する手順と、
取得した前記Ｗｅｂページに含まれている前記文字列データを抽出して前記文字列データごとの出現頻度を求める手順と、
前記文字列データ及び前記出現頻度を示すデータである出現頻度データを対応付けて前記メモリに設けられた記憶領域である出現頻度記憶部に記憶する手順と、
前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部から取得する手順と、
取得した前記読みデータが同一の複数の前記文字列データの夫々に対して、音声認識によって得られる前記読みデータを前記複数の前記文字列データのうちから選択される一の文字列データに変換する際の前記文字列データの選択順序を前記出現頻度データに基づいて決定する手順と、
前記文字列データ、前記読みデータ、及び前記選択順序を示すデータである選択順序データを対応付けて、音声を認識して文字列に変換する際に用いられるデータである音声辞書データを生成し、当該音声辞書データを前記メモリに設けられた記憶領域である第二の音声辞書記憶部に記憶する手順と、
を実行させるためのプログラム。
請求項２に記載のプログラムであって、
前記出現頻度記憶部に記憶されている前記文字列データのうち、前記第一の音声辞書記憶部に記憶されていない前記文字列データをディスプレイやプリンタ等の所定の出力装置に出力する手順と、
前記コンピュータが備える所定の入力装置から入力される、前記出力装置に出力された前記文字列データによって表される文字列の読みを示す前記読みデータを受け付け、当該文字列データ及び当該読みデータを対応付けて前記メモリに設けられた記憶領域である読みデータ記憶部に記憶する手順と、
を更に備え、
前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを取得する前記手順は、前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部または前記読みデータ記憶部から取得する手順であること、
を特徴とするプログラム。
ＣＰＵ、メモリ、入力装置、出力装置、及びインターネットに接続する通信インタフェースと、
前記メモリに設けられた記憶領域である、
単語等の文字列を示す文字列データと、当該文字列の読みを示す読みデータとが対応付けて記憶されている第一の音声辞書記憶部と、
ＷｅｂページのＵＲＬが記憶されている読込ＵＲＬ記憶部と、
を備えるコンピュータに、
前記読込ＵＲＬ記憶部に記憶されている前記ＵＲＬで指定されるＷｅｂページを、インターネット上のＷｅｂサーバにアクセスすることにより取得する手順と、
取得した前記Ｗｅｂページを構成しているデータに含まれている前記文字列データを抽出して前記文字列データごとの出現頻度を求める手順と、
前記文字列データ及び前記出現頻度を示すデータである出現頻度データを対応付けて前記メモリに設けられた記憶領域である出現頻度記憶部に記憶する手順と、
抽出した前記文字列データを前記出力装置に出力する手順と、
前記入力装置から入力される、前記出力装置に出力された前記文字列データによって表される文字列の読みを示す前記読みデータを受け付け、当該文字列データ及び当該読みデータを対応付けて前記メモリに設けられた記憶領域である読みデータ記憶部に記憶する手順と、
前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記読みデータ記憶部から取得する手順と、
取得した前記読みデータが同一の複数の前記文字列データの夫々に対して、音声認識によって得られる前記読みデータを前記読みデータが同一の前記複数の前記文字列データのうちから選択される一の前記文字列データに変換する際の前記文字列データの選択順序を前記出現頻度データに基づいて決定する手順と、
前記文字列データ、前記読みデータ、及び前記選択順序を示すデータである選択順序データを対応付けて、音声を認識して文字列に変換する際に用いられるデータである音声辞書データを生成し、当該音声辞書データを前記メモリに設けられた記憶領域である第二の音声辞書記憶部に記憶する手順と、
を実行させるためのプログラム。
請求項２又は４に記載のプログラムであって、
Ｗｅｂページに対応する画像や文字列等をディスプレイに表示するソフトウェアであるＷｅｂブラウザがユーザから指定されたＷｅｂページのＵＲＬを記憶する記憶領域であるＵＲＬ記憶部に記憶されている前記ＵＲＬを取得する手順と、
前記ＵＲＬ記憶部から取得した前記ＵＲＬを前記読込ＵＲＬ記憶部に記憶する手順と、
を更に備えることを特徴とするプログラム。
請求項５に記載の音声辞書作成プログラムであって、
前記読込ＵＲＬ記憶部が記憶する複数の前記ＵＲＬのうち、ユーザによって指定される前記ＵＲＬを受け付ける手順を更に備え、
前記ＵＲＬ記憶部に記憶されている前記ＵＲＬを取得する前記手順は、前記ＵＲＬ記憶部に記憶されている前記ＵＲＬのうち、ユーザによって指定される前記ＵＲＬを前記ＵＲＬ記憶部から取得する手順であること、
を特徴とするプログラム。
請求項２又は４に記載のプログラムであって、
Ｗｅｂページに設定された他のＷｅｂページへのリンクを辿る階層数を示すリンク階層データが前記メモリに設けられた記憶領域であるリンク階層記憶部に記憶され、
前記読込ＵＲＬ記憶部に記憶されている前記ＵＲＬで指定される前記Ｗｅｂページを取得する前記手順には、
取得した前記Ｗｅｂページを構成しているデータに含まれている他のＷｅｂページへのリンクを示すＵＲＬであるリンク先ＵＲＬを抽出して当該リンク先ＵＲＬで指定される前記他のＷｅｂページを取得する処理を、前記リンク階層記憶部に記憶されている前記リンク階層データによって示される前記階層数に応じて繰り返し実行する手順が含まれていること、
を特徴とするプログラム。
請求項７に記載のプログラムであって、
前記リンク階層記憶部には、前記読込ＵＲＬ記憶部に記憶されている前記ＷｅｂページのＵＲＬごとに前記リンク階層データが記憶され、
前記他のＷｅｂページを取得する前記処理を、前記階層数に応じて繰り返し実行する前記手順は、前記他のＷｅｂページを取得する前記処理を、前記ＵＲＬ記憶部に記憶されている前記ＵＲＬに対応する前記リンク階層データによって示される前記階層数に応じて繰り返し実行する手順であること、
を特徴とするプログラム。
請求項２又は４に記載のプログラムであって、
Ｗｅｂページを表示するソフトウェアが備える表示するＷｅｂページのＵＲＬを入力するエリアに入力されたＵＲＬを取得し、取得した当該ＵＲＬを前記読込ＵＲＬ記憶部に記憶する手順を更に備えることを特徴とするプログラム。
ＣＰＵ、メモリ、及びインターネットに接続する通信インタフェースと、
前記メモリに設けられた記憶領域である、
単語等の文字列を示す文字列データと、当該文字列の読みを示す読みデータとが対応付けて記憶されている第一の音声辞書記憶部と、
ＷｅｂページのＵＲＬが記憶されている読込ＵＲＬ記憶部と、
を備えるコンピュータが、
前記読込ＵＲＬ記憶部に記憶されている前記ＵＲＬで指定されるＷｅｂページを、インターネット上のＷｅｂサーバにアクセスすることにより取得し、
取得した前記Ｗｅｂページに含まれている前記文字列データを抽出して前記文字列データごとの出現頻度を求め、
前記文字列データ及び前記出現頻度を示すデータである出現頻度データを対応付けて前記メモリに設けられた記憶領域である出現頻度記憶部に記憶し、
前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部から取得し、
取得した前記読みデータが同一の複数の前記文字列データの夫々に対して、音声認識によって得られる前記読みデータを前記複数の前記文字列データのうちから選択される一の文字列データに変換する際の前記文字列データの選択順序を前記出現頻度データに基づいて決定し、
前記文字列データ、前記読みデータ、及び前記選択順序を示すデータである選択順序データを対応付けて、音声を認識して文字列に変換する際に用いられるデータである音声辞書データを生成し、当該音声辞書データを前記メモリに設けられた記憶領域である第二の音声辞書記憶部に記憶すること、
を特徴とする音声辞書作成方法。