JPS6076799A - 同音語同定装置 - Google Patents

同音語同定装置

Info

Publication number
JPS6076799A
JPS6076799A JP58185483A JP18548383A JPS6076799A JP S6076799 A JPS6076799 A JP S6076799A JP 58185483 A JP58185483 A JP 58185483A JP 18548383 A JP18548383 A JP 18548383A JP S6076799 A JPS6076799 A JP S6076799A
Authority
JP
Japan
Prior art keywords
type
accent
character code
code string
homophone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58185483A
Other languages
English (en)
Inventor
高井 紀代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58185483A priority Critical patent/JPS6076799A/ja
Publication of JPS6076799A publication Critical patent/JPS6076799A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 この発明は1文字列にカナ漢字変換を行う際の同音語同
定装置に関するものである。
従来例の構成とその問題点 入力された文字コード列から最長−教法によって単語を
切シ出しカナ漢字変換を行う際、同音語同定の必要が生
じる場合がある。
第1図は1文字列を音声で入力した場合の従来例のブロ
ック図である。マイクロフォンjから入力された音自は
A/D変換器2を介してディジタル化され、音声−認識
部3で認識されて文字コード列に変換され、入力文字コ
ード列記憶部4に格納される。入力文字コード列は一致
判定部5で辞書6を用いて最長−教法による検索を行い
、単語が切シだされる。必要に応じて同音語同定部7で
同音語同定を行い結果8へ出力する。
(以 下 余 白) 第1表 第1表は従来の辞書構成の一例を示したものである。見
出し語、同音語の数1品詞および漢字の情報ともってい
る。例えば、「アオイ」をカナ漢字変換する場合には「
青い」なのか「葵」なのかを決定しなければならない。
前後関係や品詞情報、意味情報を用いるものや統計処理
による出現頻度から同音語同定を行うなど種々の方法が
提案されているが、これらの規則は莫大煩雑でありすべ
てを網羅するのは困稚である。また直前使用は有効な方
法ではあるが、最初の1回は必ず同音語同定の必要があ
る。
現在、同定率は充分とはいえず、いくつかの候補を表示
して入力者が#認の上決定しなければならないのが実情
である。
発明の目的 この発明の目的は、モーラ数、アクセントタイプを辞書
情報としてもち、音声入力された文字列のピッチ情報を
用いることによって同音語同定の同定率を向上させるこ
とができる同音語同定装置を提供することである。
発明の構成 この発明の同音語同定装置は、入力文字コード列記憶手
段と、文字コード列力・らなる単語と各単語に対応して
アクセント型を含むff/報とを記憶する手段と、前記
入力文字コード列と前記記憶手段内の単語との一致を判
定する手段と、前記入力文字コード列のもとになる入力
音声情報のアクセント型を決定する手段と、このアクセ
ント型決定手段の出力と前記一致判定+段の出力とに基
いて同音語を同定する手段とを備えたものである。
以下、この構成について具体的に説明する。
例えば、人間が「アオイ」と発声された音声を聞いて脳
内で漢字に変換する場合、それが単独に発声されたもの
であっても「青いJか「葵」かの決定はできる。なぜな
らば、「背いコと「葵コにはアクセント位置の違いがあ
るからである。
一般に人間が単語2文章を音声として自然に発声すると
きには、アクセントやイントネーションがある。日本語
におけるアクセント、イントネーションが音の高低、す
なわち基本周波a(以下ピッチというンの変化で表現さ
れること#−1′既に公知でhす1日本語は高低アクセ
ントの言語であると言われている。
(以 下 余 白) 第2表 第2表け3モ一ラ単語のアクセント型を示したものであ
る。モーラとIi韻律素単位であジ、B本語においては
単音節とほぼ同じと考えてさしつかえない。例えば、「
ア・オ・イ」ならば3モーラであり、「キ〕・つ・ジャ
・り」ならば4モーラである。一般に日本語のアクセン
ト型には次の特徴がある。
(υ nモーン゛単語には(n+1)個のアクセント型
しか存在しない。
(2)1つの単語内ではピッチが上昇から下降に変わる
点けただ】っである。
nモーラ単語のどのモーラからピンチの下降が始まるか
によって、それぞれのアクセント型をO型(平板型ン、
1型、・・・、n型と言う。3モ一ラ単語の場合、第2
表に示すO型、1型、2型、3型の4つのアクセント型
がある。日本語のアクセント感は次のモーラのピッチと
の差によって生じるため、実際のピンチのピーク位置が
必ずしもアクセントのあるモーラと一致するとは限らな
い。
M4図(a) 、 (b)は「背い」と「葵Jのピッチ
を分析してプロットしたものである。横軸は時間でろシ
、(a) −1、(b) −1V′i原音波形、 (a
)−2、(b)−2は5m5ec毎の平均2乗和(RM
Sエネルギー′)。
(a) 3 + (b) −3Vi5 m5ec毎のピ
ッチ(縦軸は周波数である)を示している。目盛はタイ
ムスケールであり50 m sec毎に刻んである。「
背いJは3モーラ2型であり、「葵」け3モーラ0型で
ある。
ピーク位置はあまり変わらないが、「青い」の方がピッ
チの下降する割合が犬きく、「葵」の方がより平板であ
′るという特徴を持っており、その差は明確である。
この発明けこのアクセント型を用いて同音語同定を行う
もので、以下実施例に基いて詳細に説明する。
実施例の説明 第3図はこの発明の一実施例のブロック図を示したもの
である。マイクロフォン】から入力された音声f″iA
/D変換器2を介して16KHz、12ピントでディジ
タル化され、音声認識部3で認識さnる。さらに音声認
識部3で得られたセグメンテーショ/の情報をもとにピ
ッチ抽出部9で母音部のピンチ抽出が行われる。音声認
識部3で認識された結果は入力文字コード列記憶部4に
格納さ!″L、一致判定部5で辞書6を検索して単語の
切り出しを行う。同音語同定の必要がある場合、ピッチ
抽出部9で得られたピッチ情報、一致判定部5で得られ
た単語情報からアクセント型決定部10でアクセント型
゛を決定し、同音語同定部7で同音語同定を行い結果8
を出力する。
第 3 表 第3表は本実施例に用いた辞書6の一例である。
この発明の特徴であるモーラ数およびアクセント型につ
いての情報が付加されている。
次にアクセント型の決定アルボ1ノズムについて説明す
る。第3図のピッチ抽出部9においてまず8KHzへの
ダウンサンフ゛1ノングをイテい、20m5ec毎にピ
ッチ抽出を行う。アクセント型決定部】0において得ら
れたピッチ列に3点スムージングを行って平滑化し、各
モーラ毎3点のピッチを決定する。この決定の方法とし
ては各モーラを3等分し、それぞれにおける平均値をめ
ている。すなわち3モーラの単語であれば(P□l 、
PI3 ”よ、。
P21・P22・P23・P31・P32・P33)の
9個のピンチ列が得られる。Pabの数字a(dモーラ
位置。
数字すはモーラ内で分けられた位置を示している。
次にこのピッチ列から、ピーク位置、下降ヒ゛ツチ最大
変化点(例えばP工□とP□2の間でヒ“ソチ75:最
も犬きく下降しているならばPユ、とする。2モーラと
3モーラ、の間で平均的な下降がおきているとすれは単
にP2と表わす)、最終賀化率(例えばP工、7/P工
、)、最終ピッチ変化幅(P33/P32 )の4つを
用いてアクセント型を決定する。
第4表 第4表は3モーラの場合のアクセント型決定規則を示し
たものである。θ型、3型と1型、2型の区別は最大変
化率で行い、変化率の小さいものはθ型、3型であり、
変化率の大きいものは1型。
2型である。】型、2型の区別は、ピーク位置および最
大変化点で行う。またθ型、3型の区別は最終変化率で
行う。このようなアクセント型決定規則を各モーラ毎に
用意しておく。
このように音声で入力された文字列に対しそのピッチ情
報を用いることによって同音同定を行い同定率を向上さ
せる゛ことができる。
発明の効果 この発明の同音語同定装置によれば1人間が音声認識す
る場合とほぼ同じ情報を用いて同音語同定を行うため、
同音語同定率を大幅に向上することができるという効果
がある。
【図面の簡単な説明】
第1図は従来例のブロック図、第2図の(a)は「青い
」のピッチパターンを、(b)は「葵」のピッチパター
ンを示す図、第3図はこの発明の一実施例のブロック図
である。 4・・・、入力文字コード列記憶部、5・・・一致判定
部。 6・・・辞書(単語記憶手段)、7・・・同音語同定部

Claims (1)

  1. 【特許請求の範囲】 0)入力文字コード列記憶手段と1文字コード列からな
    る単語と各単語に対応してアクセント型を含む情報とを
    記憶する手段と、前記入力文字コード列と前記記憶手段
    内の単語との一致を判定する手段と、前記入力文字コー
    ド列のもとになる入力音声情報のアクセント型を決定す
    る手段と、このアクセント型決定手段の出力と前記一致
    判定手段の出力とに基いて同音語を同定する手段とを備
    えた同音語同定装置。 (2)前記アクセント型決定手段が入力音声情報の周波
    数変化に基いてアクセント型を決定するものである特許
    請求の範囲第(1)項記載の同音語同定装置。
JP58185483A 1983-10-03 1983-10-03 同音語同定装置 Pending JPS6076799A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58185483A JPS6076799A (ja) 1983-10-03 1983-10-03 同音語同定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58185483A JPS6076799A (ja) 1983-10-03 1983-10-03 同音語同定装置

Publications (1)

Publication Number Publication Date
JPS6076799A true JPS6076799A (ja) 1985-05-01

Family

ID=16171550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58185483A Pending JPS6076799A (ja) 1983-10-03 1983-10-03 同音語同定装置

Country Status (1)

Country Link
JP (1) JPS6076799A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63111568A (ja) * 1986-10-29 1988-05-16 Nec Corp 音声入力付仮名漢字変換装置
JPH01103768A (ja) * 1987-03-16 1989-04-20 Nec Corp 知識データベースを用いた中国語ワードプロセッサ,中国語知識データベーファイルの構築方式および中国語の漢字文字パターンファイル方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63111568A (ja) * 1986-10-29 1988-05-16 Nec Corp 音声入力付仮名漢字変換装置
JPH01103768A (ja) * 1987-03-16 1989-04-20 Nec Corp 知識データベースを用いた中国語ワードプロセッサ,中国語知識データベーファイルの構築方式および中国語の漢字文字パターンファイル方式

Similar Documents

Publication Publication Date Title
Webb et al. Dialogue act classification based on intra-utterance features
JP2815579B2 (ja) 音声認識における単語候補削減装置
JP2000112938A5 (ja)
Howell et al. Development of a two-stage procedure for the automatic recognition of dysfluencies in the speech of children who stutter: I. Psychometric procedures appropriate for selection of training material for lexical dysfluency classifiers
JPH08248971A (ja) テキスト朗読読み上げ装置
KR100669241B1 (ko) 화행 정보를 이용한 대화체 음성합성 시스템 및 방법
JP3706758B2 (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JP2000259645A (ja) 音声処理装置及び音声データ検索装置
JPS6076799A (ja) 同音語同定装置
Singla et al. Databases, classifiers for speech emotion recognition: a review
Adams et al. Target word prediction and paraphasia classification in spoken discourse
JPH06186994A (ja) 音声認識装置
JP3240691B2 (ja) 音声認識方法
JP3001334B2 (ja) 認識用言語処理装置
JP2658476B2 (ja) 文書点字化装置
JPS62134698A (ja) 多数単語の音声入力方式
House et al. Recognition of prosodic categories in Swedish: Rule implementation
JP2660998B2 (ja) 日本語処理装置
CN113077792A (zh) 佛学主题词识别方法、装置、设备及存储介质
JPS63148299A (ja) 単語音声認識方法および装置
JPH0632021B2 (ja) 日本語音声認識装置
JP3121530B2 (ja) 音声認識装置
Zhang et al. Text-to-pinyin conversion based on contextual knowledge and D-tree for Mandarin
Brenier The automatic prediction of prosodic prominence from text
JPS63140329A (ja) 文章読み上げ方式