JPS6076799A - 同音語同定装置 - Google Patents
同音語同定装置Info
- Publication number
- JPS6076799A JPS6076799A JP58185483A JP18548383A JPS6076799A JP S6076799 A JPS6076799 A JP S6076799A JP 58185483 A JP58185483 A JP 58185483A JP 18548383 A JP18548383 A JP 18548383A JP S6076799 A JPS6076799 A JP S6076799A
- Authority
- JP
- Japan
- Prior art keywords
- type
- accent
- character code
- code string
- homophone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
この発明は1文字列にカナ漢字変換を行う際の同音語同
定装置に関するものである。
定装置に関するものである。
従来例の構成とその問題点
入力された文字コード列から最長−教法によって単語を
切シ出しカナ漢字変換を行う際、同音語同定の必要が生
じる場合がある。
切シ出しカナ漢字変換を行う際、同音語同定の必要が生
じる場合がある。
第1図は1文字列を音声で入力した場合の従来例のブロ
ック図である。マイクロフォンjから入力された音自は
A/D変換器2を介してディジタル化され、音声−認識
部3で認識されて文字コード列に変換され、入力文字コ
ード列記憶部4に格納される。入力文字コード列は一致
判定部5で辞書6を用いて最長−教法による検索を行い
、単語が切シだされる。必要に応じて同音語同定部7で
同音語同定を行い結果8へ出力する。
ック図である。マイクロフォンjから入力された音自は
A/D変換器2を介してディジタル化され、音声−認識
部3で認識されて文字コード列に変換され、入力文字コ
ード列記憶部4に格納される。入力文字コード列は一致
判定部5で辞書6を用いて最長−教法による検索を行い
、単語が切シだされる。必要に応じて同音語同定部7で
同音語同定を行い結果8へ出力する。
(以 下 余 白)
第1表
第1表は従来の辞書構成の一例を示したものである。見
出し語、同音語の数1品詞および漢字の情報ともってい
る。例えば、「アオイ」をカナ漢字変換する場合には「
青い」なのか「葵」なのかを決定しなければならない。
出し語、同音語の数1品詞および漢字の情報ともってい
る。例えば、「アオイ」をカナ漢字変換する場合には「
青い」なのか「葵」なのかを決定しなければならない。
前後関係や品詞情報、意味情報を用いるものや統計処理
による出現頻度から同音語同定を行うなど種々の方法が
提案されているが、これらの規則は莫大煩雑でありすべ
てを網羅するのは困稚である。また直前使用は有効な方
法ではあるが、最初の1回は必ず同音語同定の必要があ
る。
による出現頻度から同音語同定を行うなど種々の方法が
提案されているが、これらの規則は莫大煩雑でありすべ
てを網羅するのは困稚である。また直前使用は有効な方
法ではあるが、最初の1回は必ず同音語同定の必要があ
る。
現在、同定率は充分とはいえず、いくつかの候補を表示
して入力者が#認の上決定しなければならないのが実情
である。
して入力者が#認の上決定しなければならないのが実情
である。
発明の目的
この発明の目的は、モーラ数、アクセントタイプを辞書
情報としてもち、音声入力された文字列のピッチ情報を
用いることによって同音語同定の同定率を向上させるこ
とができる同音語同定装置を提供することである。
情報としてもち、音声入力された文字列のピッチ情報を
用いることによって同音語同定の同定率を向上させるこ
とができる同音語同定装置を提供することである。
発明の構成
この発明の同音語同定装置は、入力文字コード列記憶手
段と、文字コード列力・らなる単語と各単語に対応して
アクセント型を含むff/報とを記憶する手段と、前記
入力文字コード列と前記記憶手段内の単語との一致を判
定する手段と、前記入力文字コード列のもとになる入力
音声情報のアクセント型を決定する手段と、このアクセ
ント型決定手段の出力と前記一致判定+段の出力とに基
いて同音語を同定する手段とを備えたものである。
段と、文字コード列力・らなる単語と各単語に対応して
アクセント型を含むff/報とを記憶する手段と、前記
入力文字コード列と前記記憶手段内の単語との一致を判
定する手段と、前記入力文字コード列のもとになる入力
音声情報のアクセント型を決定する手段と、このアクセ
ント型決定手段の出力と前記一致判定+段の出力とに基
いて同音語を同定する手段とを備えたものである。
以下、この構成について具体的に説明する。
例えば、人間が「アオイ」と発声された音声を聞いて脳
内で漢字に変換する場合、それが単独に発声されたもの
であっても「青いJか「葵」かの決定はできる。なぜな
らば、「背いコと「葵コにはアクセント位置の違いがあ
るからである。
内で漢字に変換する場合、それが単独に発声されたもの
であっても「青いJか「葵」かの決定はできる。なぜな
らば、「背いコと「葵コにはアクセント位置の違いがあ
るからである。
一般に人間が単語2文章を音声として自然に発声すると
きには、アクセントやイントネーションがある。日本語
におけるアクセント、イントネーションが音の高低、す
なわち基本周波a(以下ピッチというンの変化で表現さ
れること#−1′既に公知でhす1日本語は高低アクセ
ントの言語であると言われている。
きには、アクセントやイントネーションがある。日本語
におけるアクセント、イントネーションが音の高低、す
なわち基本周波a(以下ピッチというンの変化で表現さ
れること#−1′既に公知でhす1日本語は高低アクセ
ントの言語であると言われている。
(以 下 余 白)
第2表
第2表け3モ一ラ単語のアクセント型を示したものであ
る。モーラとIi韻律素単位であジ、B本語においては
単音節とほぼ同じと考えてさしつかえない。例えば、「
ア・オ・イ」ならば3モーラであり、「キ〕・つ・ジャ
・り」ならば4モーラである。一般に日本語のアクセン
ト型には次の特徴がある。
る。モーラとIi韻律素単位であジ、B本語においては
単音節とほぼ同じと考えてさしつかえない。例えば、「
ア・オ・イ」ならば3モーラであり、「キ〕・つ・ジャ
・り」ならば4モーラである。一般に日本語のアクセン
ト型には次の特徴がある。
(υ nモーン゛単語には(n+1)個のアクセント型
しか存在しない。
しか存在しない。
(2)1つの単語内ではピッチが上昇から下降に変わる
点けただ】っである。
点けただ】っである。
nモーラ単語のどのモーラからピンチの下降が始まるか
によって、それぞれのアクセント型をO型(平板型ン、
1型、・・・、n型と言う。3モ一ラ単語の場合、第2
表に示すO型、1型、2型、3型の4つのアクセント型
がある。日本語のアクセント感は次のモーラのピッチと
の差によって生じるため、実際のピンチのピーク位置が
必ずしもアクセントのあるモーラと一致するとは限らな
い。
によって、それぞれのアクセント型をO型(平板型ン、
1型、・・・、n型と言う。3モ一ラ単語の場合、第2
表に示すO型、1型、2型、3型の4つのアクセント型
がある。日本語のアクセント感は次のモーラのピッチと
の差によって生じるため、実際のピンチのピーク位置が
必ずしもアクセントのあるモーラと一致するとは限らな
い。
M4図(a) 、 (b)は「背い」と「葵Jのピッチ
を分析してプロットしたものである。横軸は時間でろシ
、(a) −1、(b) −1V′i原音波形、 (a
)−2、(b)−2は5m5ec毎の平均2乗和(RM
Sエネルギー′)。
を分析してプロットしたものである。横軸は時間でろシ
、(a) −1、(b) −1V′i原音波形、 (a
)−2、(b)−2は5m5ec毎の平均2乗和(RM
Sエネルギー′)。
(a) 3 + (b) −3Vi5 m5ec毎のピ
ッチ(縦軸は周波数である)を示している。目盛はタイ
ムスケールであり50 m sec毎に刻んである。「
背いJは3モーラ2型であり、「葵」け3モーラ0型で
ある。
ッチ(縦軸は周波数である)を示している。目盛はタイ
ムスケールであり50 m sec毎に刻んである。「
背いJは3モーラ2型であり、「葵」け3モーラ0型で
ある。
ピーク位置はあまり変わらないが、「青い」の方がピッ
チの下降する割合が犬きく、「葵」の方がより平板であ
′るという特徴を持っており、その差は明確である。
チの下降する割合が犬きく、「葵」の方がより平板であ
′るという特徴を持っており、その差は明確である。
この発明けこのアクセント型を用いて同音語同定を行う
もので、以下実施例に基いて詳細に説明する。
もので、以下実施例に基いて詳細に説明する。
実施例の説明
第3図はこの発明の一実施例のブロック図を示したもの
である。マイクロフォン】から入力された音声f″iA
/D変換器2を介して16KHz、12ピントでディジ
タル化され、音声認識部3で認識さnる。さらに音声認
識部3で得られたセグメンテーショ/の情報をもとにピ
ッチ抽出部9で母音部のピンチ抽出が行われる。音声認
識部3で認識された結果は入力文字コード列記憶部4に
格納さ!″L、一致判定部5で辞書6を検索して単語の
切り出しを行う。同音語同定の必要がある場合、ピッチ
抽出部9で得られたピッチ情報、一致判定部5で得られ
た単語情報からアクセント型決定部10でアクセント型
゛を決定し、同音語同定部7で同音語同定を行い結果8
を出力する。
である。マイクロフォン】から入力された音声f″iA
/D変換器2を介して16KHz、12ピントでディジ
タル化され、音声認識部3で認識さnる。さらに音声認
識部3で得られたセグメンテーショ/の情報をもとにピ
ッチ抽出部9で母音部のピンチ抽出が行われる。音声認
識部3で認識された結果は入力文字コード列記憶部4に
格納さ!″L、一致判定部5で辞書6を検索して単語の
切り出しを行う。同音語同定の必要がある場合、ピッチ
抽出部9で得られたピッチ情報、一致判定部5で得られ
た単語情報からアクセント型決定部10でアクセント型
゛を決定し、同音語同定部7で同音語同定を行い結果8
を出力する。
第 3 表
第3表は本実施例に用いた辞書6の一例である。
この発明の特徴であるモーラ数およびアクセント型につ
いての情報が付加されている。
いての情報が付加されている。
次にアクセント型の決定アルボ1ノズムについて説明す
る。第3図のピッチ抽出部9においてまず8KHzへの
ダウンサンフ゛1ノングをイテい、20m5ec毎にピ
ッチ抽出を行う。アクセント型決定部】0において得ら
れたピッチ列に3点スムージングを行って平滑化し、各
モーラ毎3点のピッチを決定する。この決定の方法とし
ては各モーラを3等分し、それぞれにおける平均値をめ
ている。すなわち3モーラの単語であれば(P□l 、
PI3 ”よ、。
る。第3図のピッチ抽出部9においてまず8KHzへの
ダウンサンフ゛1ノングをイテい、20m5ec毎にピ
ッチ抽出を行う。アクセント型決定部】0において得ら
れたピッチ列に3点スムージングを行って平滑化し、各
モーラ毎3点のピッチを決定する。この決定の方法とし
ては各モーラを3等分し、それぞれにおける平均値をめ
ている。すなわち3モーラの単語であれば(P□l 、
PI3 ”よ、。
P21・P22・P23・P31・P32・P33)の
9個のピンチ列が得られる。Pabの数字a(dモーラ
位置。
9個のピンチ列が得られる。Pabの数字a(dモーラ
位置。
数字すはモーラ内で分けられた位置を示している。
次にこのピッチ列から、ピーク位置、下降ヒ゛ツチ最大
変化点(例えばP工□とP□2の間でヒ“ソチ75:最
も犬きく下降しているならばPユ、とする。2モーラと
3モーラ、の間で平均的な下降がおきているとすれは単
にP2と表わす)、最終賀化率(例えばP工、7/P工
、)、最終ピッチ変化幅(P33/P32 )の4つを
用いてアクセント型を決定する。
変化点(例えばP工□とP□2の間でヒ“ソチ75:最
も犬きく下降しているならばPユ、とする。2モーラと
3モーラ、の間で平均的な下降がおきているとすれは単
にP2と表わす)、最終賀化率(例えばP工、7/P工
、)、最終ピッチ変化幅(P33/P32 )の4つを
用いてアクセント型を決定する。
第4表
第4表は3モーラの場合のアクセント型決定規則を示し
たものである。θ型、3型と1型、2型の区別は最大変
化率で行い、変化率の小さいものはθ型、3型であり、
変化率の大きいものは1型。
たものである。θ型、3型と1型、2型の区別は最大変
化率で行い、変化率の小さいものはθ型、3型であり、
変化率の大きいものは1型。
2型である。】型、2型の区別は、ピーク位置および最
大変化点で行う。またθ型、3型の区別は最終変化率で
行う。このようなアクセント型決定規則を各モーラ毎に
用意しておく。
大変化点で行う。またθ型、3型の区別は最終変化率で
行う。このようなアクセント型決定規則を各モーラ毎に
用意しておく。
このように音声で入力された文字列に対しそのピッチ情
報を用いることによって同音同定を行い同定率を向上さ
せる゛ことができる。
報を用いることによって同音同定を行い同定率を向上さ
せる゛ことができる。
発明の効果
この発明の同音語同定装置によれば1人間が音声認識す
る場合とほぼ同じ情報を用いて同音語同定を行うため、
同音語同定率を大幅に向上することができるという効果
がある。
る場合とほぼ同じ情報を用いて同音語同定を行うため、
同音語同定率を大幅に向上することができるという効果
がある。
第1図は従来例のブロック図、第2図の(a)は「青い
」のピッチパターンを、(b)は「葵」のピッチパター
ンを示す図、第3図はこの発明の一実施例のブロック図
である。 4・・・、入力文字コード列記憶部、5・・・一致判定
部。 6・・・辞書(単語記憶手段)、7・・・同音語同定部
。
」のピッチパターンを、(b)は「葵」のピッチパター
ンを示す図、第3図はこの発明の一実施例のブロック図
である。 4・・・、入力文字コード列記憶部、5・・・一致判定
部。 6・・・辞書(単語記憶手段)、7・・・同音語同定部
。
Claims (1)
- 【特許請求の範囲】 0)入力文字コード列記憶手段と1文字コード列からな
る単語と各単語に対応してアクセント型を含む情報とを
記憶する手段と、前記入力文字コード列と前記記憶手段
内の単語との一致を判定する手段と、前記入力文字コー
ド列のもとになる入力音声情報のアクセント型を決定す
る手段と、このアクセント型決定手段の出力と前記一致
判定手段の出力とに基いて同音語を同定する手段とを備
えた同音語同定装置。 (2)前記アクセント型決定手段が入力音声情報の周波
数変化に基いてアクセント型を決定するものである特許
請求の範囲第(1)項記載の同音語同定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58185483A JPS6076799A (ja) | 1983-10-03 | 1983-10-03 | 同音語同定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58185483A JPS6076799A (ja) | 1983-10-03 | 1983-10-03 | 同音語同定装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6076799A true JPS6076799A (ja) | 1985-05-01 |
Family
ID=16171550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58185483A Pending JPS6076799A (ja) | 1983-10-03 | 1983-10-03 | 同音語同定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6076799A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63111568A (ja) * | 1986-10-29 | 1988-05-16 | Nec Corp | 音声入力付仮名漢字変換装置 |
JPH01103768A (ja) * | 1987-03-16 | 1989-04-20 | Nec Corp | 知識データベースを用いた中国語ワードプロセッサ,中国語知識データベーファイルの構築方式および中国語の漢字文字パターンファイル方式 |
-
1983
- 1983-10-03 JP JP58185483A patent/JPS6076799A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63111568A (ja) * | 1986-10-29 | 1988-05-16 | Nec Corp | 音声入力付仮名漢字変換装置 |
JPH01103768A (ja) * | 1987-03-16 | 1989-04-20 | Nec Corp | 知識データベースを用いた中国語ワードプロセッサ,中国語知識データベーファイルの構築方式および中国語の漢字文字パターンファイル方式 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Webb et al. | Dialogue act classification based on intra-utterance features | |
JP2815579B2 (ja) | 音声認識における単語候補削減装置 | |
JP2000112938A5 (ja) | ||
Howell et al. | Development of a two-stage procedure for the automatic recognition of dysfluencies in the speech of children who stutter: I. Psychometric procedures appropriate for selection of training material for lexical dysfluency classifiers | |
JPH08248971A (ja) | テキスト朗読読み上げ装置 | |
KR100669241B1 (ko) | 화행 정보를 이용한 대화체 음성합성 시스템 및 방법 | |
JP3706758B2 (ja) | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 | |
JP2000259645A (ja) | 音声処理装置及び音声データ検索装置 | |
JPS6076799A (ja) | 同音語同定装置 | |
Singla et al. | Databases, classifiers for speech emotion recognition: a review | |
Adams et al. | Target word prediction and paraphasia classification in spoken discourse | |
JPH06186994A (ja) | 音声認識装置 | |
JP3240691B2 (ja) | 音声認識方法 | |
JP3001334B2 (ja) | 認識用言語処理装置 | |
JP2658476B2 (ja) | 文書点字化装置 | |
JPS62134698A (ja) | 多数単語の音声入力方式 | |
House et al. | Recognition of prosodic categories in Swedish: Rule implementation | |
JP2660998B2 (ja) | 日本語処理装置 | |
CN113077792A (zh) | 佛学主题词识别方法、装置、设备及存储介质 | |
JPS63148299A (ja) | 単語音声認識方法および装置 | |
JPH0632021B2 (ja) | 日本語音声認識装置 | |
JP3121530B2 (ja) | 音声認識装置 | |
Zhang et al. | Text-to-pinyin conversion based on contextual knowledge and D-tree for Mandarin | |
Brenier | The automatic prediction of prosodic prominence from text | |
JPS63140329A (ja) | 文章読み上げ方式 |