JP2005099741A - 音声辞書作成装置、音声辞書作成方法、及びプログラム - Google Patents
音声辞書作成装置、音声辞書作成方法、及びプログラム Download PDFInfo
- Publication number
- JP2005099741A JP2005099741A JP2004222876A JP2004222876A JP2005099741A JP 2005099741 A JP2005099741 A JP 2005099741A JP 2004222876 A JP2004222876 A JP 2004222876A JP 2004222876 A JP2004222876 A JP 2004222876A JP 2005099741 A JP2005099741 A JP 2005099741A
- Authority
- JP
- Japan
- Prior art keywords
- data
- character string
- storage unit
- url
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】音声辞書作成装置は、インターネット網に接続された読込処理部があり、読込処理部が文字入力を行おうとするサイトまたはそのサイトからリンクされたサイトまたはその他特に関連が深いとして使用者が指定したサイトを読み込んで、そのデータを文字列抽出部に受け渡し、文字列抽出部は、受け渡されたデータを単語等の音声認識に使用する文字列として解析してその結果を音声辞書作成部に受け渡し、音声辞書作成部は文字列抽出部から受け渡されたデータに従って、単語の使用頻度の調整や未知語の追加等の処理を行って音声辞書を作成する。
【選択図】 図1
Description
図1は本発明の実施例の構成図であり、インターネット上に文字入力を受け付ける文字入力サイトが存在しており、インターネット網に接続されたインターネット接続装置がこの文字入力サイトに接続されており、インターネット接続装置に音声認識装置が付加されていて文字入力サイトに音声認識された文字を送信できるようになっており、インターネット網に接続された読込処理部が文字入力を行おうとするサイトまたはそのサイトからリンクされたサイトまたはその他特に関連が深いとして使用者が指定したサイトを読み込み、そのデータを文字列抽出部に受け渡し、文字列抽出部は、受け渡されたデータを単語等の音声認識に使用する文字列として解析してその結果を音声辞書作成部に受け渡し、音声辞書作成部は文字列抽出部から受け渡されたデータに従って、単語の使用頻度を調整したり未知語を追加するなどの処理を行って音声辞書を作成して音声認識装置の音声辞書を作成することで効率的な音声認識による文字入力処理を行うものである。
==全体構成==
次に、本発明における第二の実施形態について説明する。図2は、第二の実施形態のネットワーク構成を示す図である。音声辞書作成装置1は、本発明における音声辞書作成プログラムを実行する装置であり、パーソナルコンピュータや音声認識に用いられる専用の装置等のコンピュータである。音声辞書作成装置1は、インターネットやイントラネット等のネットワーク2を介して複数のWebサーバ3a,3b,3cと通信することができる。
図5は、音声辞書作成装置1のハードウェア構成を示す図である。音声辞書作成装置1は、CPU10、メモリ11、記憶装置12、記録媒体読取装置13、通信インタフェース14、入力装置15、出力装置16、及びマイク17を備えている。
図6は、音声辞書作成装置1が備える機能の構成を示す図である。音声辞書作成装置1は、音声認識機能部20、音声辞書作成機能部30、及び記憶部40を備えている。
次に、音声辞書作成装置1における音声辞書作成処理について説明する。図12は、音声辞書作成処理のフローチャートである。まず、読込処理部31が、読込URL記憶部43に記憶されているURLを一つ取得する(S1201)。さらに、読込処理部31は、当該URLに対応するリンク階層データをリンク階層記憶部44から取得し(S1202)、リンク階層をカウントするための作業用のデータである作業階層データに0を設定する(S1203)。
次に、Webブラウザ7が備えるURLの記憶部を読込対象のURLとして用いる場合について説明する。図15は、Webブラウザ7の登録URLメニュー50を表示した図である。ユーザは、自分の気に入ったWebページがあった場合、そのWebページがWebブラウザ7に表示されている際に、登録URLメニュー50で追加ボタン51を選択する。すると、そのWebページのタイトル52が登録URLメニュー50の中に追加される。また、ユーザは登録URLメニュー50の中にフォルダ53を作成し、そのフォルダ53の中にWebページのタイトル54を追加することもできる。
次に、Webブラウザ7のURL入力エリア8に入力されたURLを読込対象のURLとして用いる場合について説明する。図17は、入力URL取得部36の処理を示すフローチャートである。まず、入力URL取得部36は、ユーザがURL入力エリア8に入力したURLを取得する(S1701)。そして、入力URL取得部36は、取得したURLを読込URL記憶部43に記憶し(S1702)、図12に示した音声辞書作成処理を起動する(S1703)。これにより、URL入力エリア8に入力されたURLが示すWebページ及び当該Webページに設定されたリンクを辿って取得される他のWebページをもとに、ユーザ辞書が生成される。
3a,3b,3c Webサーバ 4a,4b,4c Webページ
5 文書データ 6 リンク
7 Webブラウザ 8 URL入力エリア
9 表示エリア 10 CPU
11 メモリ 12 記憶装置
13 記録媒体読取装置 14 通信インタフェース
15 入力装置 16 出力装置
17 マイク 18 記録媒体
20 音声認識機能部 21 音声取得部
22 音声認識部 23 文字列変換部
30 音声辞書作成機能部 31 読込処理部
32 文字列抽出部 33 未登録語出力部
34 読みデータ受付部 35 音声辞書作成部
36 入力URL取得部 40 記憶部
41 標準辞書記憶部 42 ユーザ辞書記憶部
43 読込URL記憶部 44 リンク階層記憶部
45 出現頻度記憶部 46 読みデータ記憶部
50 登録URLメニュー 51 追加ボタン
52,54 Webページのタイトル 53 フォルダ
55 URL記憶部
Claims (10)
- CPU、メモリ、及びインターネットに接続するための通信インタフェースと、
前記メモリに設けられた記憶領域である、第一の音声辞書記憶部、第二の音声辞書記憶部、読込URL記憶部、及び出現頻度記憶部と、
前記CPUが前記メモリに記憶されているプログラムを実行することにより実現される、読込処理部、文字列抽出部、及び音声辞書作成部と、
を備え、
前記第一の音声辞書記憶部には、単語等の文字列を示す文字列データと、当該文字列の読みを示す読みデータとが対応付けて記憶され、
前記読込URL記憶部には、WebページのURLが記憶され、
前記読込処理部は、前記読込URL記憶部に記憶されている前記URLで指定されるWebページを、インターネット上のWebサーバにアクセスすることにより取得し、
前記文字列抽出部は、
前記読込処理部が取得した前記Webページを構成しているデータに含まれている前記文字列データを抽出して前記文字列データごとの出現頻度を求め、
前記文字列データ及び前記出現頻度を示すデータである出現頻度データを対応付けて前記出現頻度記憶部に記憶し、
前記音声辞書作成部は、
前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部から取得し、
取得した前記読みデータが同一の複数の前記文字列データの夫々に対して、音声認識によって得られる前記読みデータを前記複数の前記文字列データのうちから選択される一の文字列データに変換する際の前記文字列データの選択順序を前記出現頻度データに基づいて決定し、
前記文字列データ、前記読みデータ、及び前記選択順序を示すデータである選択順序データを対応付けて、音声を認識して文字列に変換する際に用いられるデータである音声辞書データを生成し、当該音声辞書データを前記第二の音声辞書記憶部に記憶すること、
を特徴とする音声辞書作成装置。 - CPU、メモリ、及びインターネットに接続するための通信インタフェースと、
前記メモリに設けられた記憶領域である、
単語等の文字列を示す文字列データと、当該文字列の読みを示す読みデータとが対応付けて記憶されている第一の音声辞書記憶部と、
WebページのURLが記憶されている読込URL記憶部と、
を備えるコンピュータに、
前記読込URL記憶部に記憶されている前記URLで指定されるWebページを、インターネット上のWebサーバにアクセスすることにより取得する手順と、
取得した前記Webページに含まれている前記文字列データを抽出して前記文字列データごとの出現頻度を求める手順と、
前記文字列データ及び前記出現頻度を示すデータである出現頻度データを対応付けて前記メモリに設けられた記憶領域である出現頻度記憶部に記憶する手順と、
前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部から取得する手順と、
取得した前記読みデータが同一の複数の前記文字列データの夫々に対して、音声認識によって得られる前記読みデータを前記複数の前記文字列データのうちから選択される一の文字列データに変換する際の前記文字列データの選択順序を前記出現頻度データに基づいて決定する手順と、
前記文字列データ、前記読みデータ、及び前記選択順序を示すデータである選択順序データを対応付けて、音声を認識して文字列に変換する際に用いられるデータである音声辞書データを生成し、当該音声辞書データを前記メモリに設けられた記憶領域である第二の音声辞書記憶部に記憶する手順と、
を実行させるためのプログラム。 - 請求項2に記載のプログラムであって、
前記出現頻度記憶部に記憶されている前記文字列データのうち、前記第一の音声辞書記憶部に記憶されていない前記文字列データをディスプレイやプリンタ等の所定の出力装置に出力する手順と、
前記コンピュータが備える所定の入力装置から入力される、前記出力装置に出力された前記文字列データによって表される文字列の読みを示す前記読みデータを受け付け、当該文字列データ及び当該読みデータを対応付けて前記メモリに設けられた記憶領域である読みデータ記憶部に記憶する手順と、
を更に備え、
前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを取得する前記手順は、前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部または前記読みデータ記憶部から取得する手順であること、
を特徴とするプログラム。 - CPU、メモリ、入力装置、出力装置、及びインターネットに接続する通信インタフェースと、
前記メモリに設けられた記憶領域である、
単語等の文字列を示す文字列データと、当該文字列の読みを示す読みデータとが対応付けて記憶されている第一の音声辞書記憶部と、
WebページのURLが記憶されている読込URL記憶部と、
を備えるコンピュータに、
前記読込URL記憶部に記憶されている前記URLで指定されるWebページを、インターネット上のWebサーバにアクセスすることにより取得する手順と、
取得した前記Webページを構成しているデータに含まれている前記文字列データを抽出して前記文字列データごとの出現頻度を求める手順と、
前記文字列データ及び前記出現頻度を示すデータである出現頻度データを対応付けて前記メモリに設けられた記憶領域である出現頻度記憶部に記憶する手順と、
抽出した前記文字列データを前記出力装置に出力する手順と、
前記入力装置から入力される、前記出力装置に出力された前記文字列データによって表される文字列の読みを示す前記読みデータを受け付け、当該文字列データ及び当該読みデータを対応付けて前記メモリに設けられた記憶領域である読みデータ記憶部に記憶する手順と、
前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記読みデータ記憶部から取得する手順と、
取得した前記読みデータが同一の複数の前記文字列データの夫々に対して、音声認識によって得られる前記読みデータを前記読みデータが同一の前記複数の前記文字列データのうちから選択される一の前記文字列データに変換する際の前記文字列データの選択順序を前記出現頻度データに基づいて決定する手順と、
前記文字列データ、前記読みデータ、及び前記選択順序を示すデータである選択順序データを対応付けて、音声を認識して文字列に変換する際に用いられるデータである音声辞書データを生成し、当該音声辞書データを前記メモリに設けられた記憶領域である第二の音声辞書記憶部に記憶する手順と、
を実行させるためのプログラム。 - 請求項2又は4に記載のプログラムであって、
Webページに対応する画像や文字列等をディスプレイに表示するソフトウェアであるWebブラウザがユーザから指定されたWebページのURLを記憶する記憶領域であるURL記憶部に記憶されている前記URLを取得する手順と、
前記URL記憶部から取得した前記URLを前記読込URL記憶部に記憶する手順と、
を更に備えることを特徴とするプログラム。 - 請求項5に記載の音声辞書作成プログラムであって、
前記読込URL記憶部が記憶する複数の前記URLのうち、ユーザによって指定される前記URLを受け付ける手順を更に備え、
前記URL記憶部に記憶されている前記URLを取得する前記手順は、前記URL記憶部に記憶されている前記URLのうち、ユーザによって指定される前記URLを前記URL記憶部から取得する手順であること、
を特徴とするプログラム。 - 請求項2又は4に記載のプログラムであって、
Webページに設定された他のWebページへのリンクを辿る階層数を示すリンク階層データが前記メモリに設けられた記憶領域であるリンク階層記憶部に記憶され、
前記読込URL記憶部に記憶されている前記URLで指定される前記Webページを取得する前記手順には、
取得した前記Webページを構成しているデータに含まれている他のWebページへのリンクを示すURLであるリンク先URLを抽出して当該リンク先URLで指定される前記他のWebページを取得する処理を、前記リンク階層記憶部に記憶されている前記リンク階層データによって示される前記階層数に応じて繰り返し実行する手順が含まれていること、
を特徴とするプログラム。 - 請求項7に記載のプログラムであって、
前記リンク階層記憶部には、前記読込URL記憶部に記憶されている前記WebページのURLごとに前記リンク階層データが記憶され、
前記他のWebページを取得する前記処理を、前記階層数に応じて繰り返し実行する前記手順は、前記他のWebページを取得する前記処理を、前記URL記憶部に記憶されている前記URLに対応する前記リンク階層データによって示される前記階層数に応じて繰り返し実行する手順であること、
を特徴とするプログラム。 - 請求項2又は4に記載のプログラムであって、
Webページを表示するソフトウェアが備える表示するWebページのURLを入力するエリアに入力されたURLを取得し、取得した当該URLを前記読込URL記憶部に記憶する手順を更に備えることを特徴とするプログラム。 - CPU、メモリ、及びインターネットに接続する通信インタフェースと、
前記メモリに設けられた記憶領域である、
単語等の文字列を示す文字列データと、当該文字列の読みを示す読みデータとが対応付けて記憶されている第一の音声辞書記憶部と、
WebページのURLが記憶されている読込URL記憶部と、
を備えるコンピュータが、
前記読込URL記憶部に記憶されている前記URLで指定されるWebページを、インターネット上のWebサーバにアクセスすることにより取得し、
取得した前記Webページに含まれている前記文字列データを抽出して前記文字列データごとの出現頻度を求め、
前記文字列データ及び前記出現頻度を示すデータである出現頻度データを対応付けて前記メモリに設けられた記憶領域である出現頻度記憶部に記憶し、
前記出現頻度記憶部に記憶されている前記文字列データに対応する前記読みデータを前記第一の音声辞書記憶部から取得し、
取得した前記読みデータが同一の複数の前記文字列データの夫々に対して、音声認識によって得られる前記読みデータを前記複数の前記文字列データのうちから選択される一の文字列データに変換する際の前記文字列データの選択順序を前記出現頻度データに基づいて決定し、
前記文字列データ、前記読みデータ、及び前記選択順序を示すデータである選択順序データを対応付けて、音声を認識して文字列に変換する際に用いられるデータである音声辞書データを生成し、当該音声辞書データを前記メモリに設けられた記憶領域である第二の音声辞書記憶部に記憶すること、
を特徴とする音声辞書作成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004222876A JP4515186B2 (ja) | 2003-09-02 | 2004-07-30 | 音声辞書作成装置、音声辞書作成方法、及びプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003310299 | 2003-09-02 | ||
JP2004222876A JP4515186B2 (ja) | 2003-09-02 | 2004-07-30 | 音声辞書作成装置、音声辞書作成方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005099741A true JP2005099741A (ja) | 2005-04-14 |
JP4515186B2 JP4515186B2 (ja) | 2010-07-28 |
Family
ID=34467521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004222876A Expired - Fee Related JP4515186B2 (ja) | 2003-09-02 | 2004-07-30 | 音声辞書作成装置、音声辞書作成方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4515186B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009294269A (ja) * | 2008-06-03 | 2009-12-17 | Nec Corp | 音声認識システム |
JP2010041414A (ja) * | 2008-08-05 | 2010-02-18 | Kddi Corp | 留守番電話装置 |
WO2011045846A1 (ja) * | 2009-10-16 | 2011-04-21 | 三菱電機株式会社 | 音声認識装置 |
US8719021B2 (en) | 2006-02-23 | 2014-05-06 | Nec Corporation | Speech recognition dictionary compilation assisting system, speech recognition dictionary compilation assisting method and speech recognition dictionary compilation assisting program |
JP2015069334A (ja) * | 2013-09-27 | 2015-04-13 | 富士通株式会社 | 文字変換プログラム、文字変換装置、及び文字変換方法 |
JP2017167378A (ja) * | 2016-03-17 | 2017-09-21 | 株式会社東芝 | 単語スコア計算装置、単語スコア計算方法及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014693A (ja) * | 2000-06-30 | 2002-01-18 | Mitsubishi Electric Corp | 音声認識システム用辞書提供方法、および音声認識インタフェース |
JP2002162986A (ja) * | 2000-11-27 | 2002-06-07 | Canon Inc | 情報処理装置及びその方法、コンピュータ可読メモリ |
JP2002207731A (ja) * | 2001-01-12 | 2002-07-26 | Logo Vista Corp | 分野辞書作成装置 |
JP2002297177A (ja) * | 2001-03-29 | 2002-10-11 | Sharp Corp | 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体 |
-
2004
- 2004-07-30 JP JP2004222876A patent/JP4515186B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014693A (ja) * | 2000-06-30 | 2002-01-18 | Mitsubishi Electric Corp | 音声認識システム用辞書提供方法、および音声認識インタフェース |
JP2002162986A (ja) * | 2000-11-27 | 2002-06-07 | Canon Inc | 情報処理装置及びその方法、コンピュータ可読メモリ |
JP2002207731A (ja) * | 2001-01-12 | 2002-07-26 | Logo Vista Corp | 分野辞書作成装置 |
JP2002297177A (ja) * | 2001-03-29 | 2002-10-11 | Sharp Corp | 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8719021B2 (en) | 2006-02-23 | 2014-05-06 | Nec Corporation | Speech recognition dictionary compilation assisting system, speech recognition dictionary compilation assisting method and speech recognition dictionary compilation assisting program |
JP2009294269A (ja) * | 2008-06-03 | 2009-12-17 | Nec Corp | 音声認識システム |
JP2010041414A (ja) * | 2008-08-05 | 2010-02-18 | Kddi Corp | 留守番電話装置 |
WO2011045846A1 (ja) * | 2009-10-16 | 2011-04-21 | 三菱電機株式会社 | 音声認識装置 |
JP2015069334A (ja) * | 2013-09-27 | 2015-04-13 | 富士通株式会社 | 文字変換プログラム、文字変換装置、及び文字変換方法 |
JP2017167378A (ja) * | 2016-03-17 | 2017-09-21 | 株式会社東芝 | 単語スコア計算装置、単語スコア計算方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4515186B2 (ja) | 2010-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7197462B2 (en) | System and method for information access | |
TWI353585B (en) | Computer-implemented method,apparatus, and compute | |
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
US7962842B2 (en) | Method and systems for accessing data by spelling discrimination letters of link names | |
JP2004310748A (ja) | ユーザ入力に基づくデータの提示 | |
JP2011018330A (ja) | 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法 | |
KR100237385B1 (ko) | 웹 브라우저 상의 음성 인식기 구현방법 | |
CN100368960C (zh) | 信息处理方法和设备 | |
JP2009140466A (ja) | 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム | |
JP4738847B2 (ja) | データ検索装置および方法 | |
KR20120058544A (ko) | 이미지 구성요소의 검색 | |
Ghose et al. | Architecture of a web browser for visually handicapped people | |
JP4515186B2 (ja) | 音声辞書作成装置、音声辞書作成方法、及びプログラム | |
JP2002197118A (ja) | 情報アクセス方法、情報アクセスシステムおよび記録媒体 | |
JPH10124293A (ja) | 音声指令可能なコンピュータとそれ用の媒体 | |
JP5484113B2 (ja) | 文書画像関連情報提供装置、及び文書画像関連情報取得システム | |
JP2005128955A (ja) | 情報処理方法および記憶媒体、プログラム | |
KR100916814B1 (ko) | 태그 정보에 기초하여 텍스트를 추출하기 위한 방법,시스템 및 컴퓨터 판독 가능한 기록 매체 | |
JP2009169113A (ja) | 言語モデル作成装置、言語モデル作成方法および言語モデル作成プログラム | |
JPH10307837A (ja) | 検索装置並びに検索プログラムを記録した記録媒体 | |
JP4014361B2 (ja) | 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2010117529A (ja) | 音声読み上げ文生成装置、音声読み上げ文生成方法および音声読み上げ文生成プログラム | |
JP2008276561A (ja) | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 | |
JP2007164732A (ja) | コンピュータ実行可能なプログラム、および情報処理装置 | |
KR102639463B1 (ko) | 커먼 아이디정보의 매칭을 이용한 웹페이지 메모 공유방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070620 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100413 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100512 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130521 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |