JP4653598B2 - 構文・意味解析装置、音声認識装置、及び構文・意味解析プログラム - Google Patents
構文・意味解析装置、音声認識装置、及び構文・意味解析プログラム Download PDFInfo
- Publication number
- JP4653598B2 JP4653598B2 JP2005247449A JP2005247449A JP4653598B2 JP 4653598 B2 JP4653598 B2 JP 4653598B2 JP 2005247449 A JP2005247449 A JP 2005247449A JP 2005247449 A JP2005247449 A JP 2005247449A JP 4653598 B2 JP4653598 B2 JP 4653598B2
- Authority
- JP
- Japan
- Prior art keywords
- semantic
- score
- speech
- syntax
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
「自然言語処理」、長尾真編、岩波書店、p.139,199、1996年 「確率的言語モデル」、北研二著、東京大学出版会、p.60〜62
本発明は、話し言葉等の現実世界の複雑な言語(単語列)や音声認識誤りを含む言語等の評価対象に対して、構文的・意味的な妥当性(人が単語列を構文や意味的な観点から妥当な(正しい)結果であると判断すること)を確率統計処理によって簡易に評価して評価対象の構文的・意味的な妥当性に対する高精度な解析結果を取得する。
図1は、本発明における構文・意味解析装置の一構成例を示す図である。図1に示す構文・意味解析装置10は、文節モデル学習手段11と、意味依存モデル学習手段12と、品詞・文節境界候補探索手段13と、意味依存構造同定手段14と、解析スコア算出手段15とを有するよう構成されている。なお、文節モデル学習手段11及び意味依存モデル学習手段12は、自然言語における構文・意味解析の学習フェーズとしての構成であり、品詞・文節境界候補探索手段13、意味依存構造同定手段14、及び解析スコア算出手段15は、入力される評価対象単語列を評価する評価フェーズとしての構成である。以下に、構文・意味解析装置10を学習フェーズと評価フェーズとに分けて説明する。
まず、図1に示す学習フェーズにおいて、文節モデル学習手段11は、例えば予め構文情報・意味素性が付与された複数の単語列からなる学習テキスト21から、文節モデル22を確率統計的に学習して出力する。出力された文節モデル22は、評価フェーズの品詞・文節境界候補探索手段13に入力される。
文節モデル学習手段11は、例えば文節内の品詞クラスモデルや品詞マルチグラムモデル(例えば、「確率的言語モデル」、北研二著、東京大学出版会、p.122〜125等)等、文節内の品詞及び文節境界に関する確率統計モデルを算出し、これを文節モデル22として出力する。
意味依存モデル学習手段12は、学習テキスト21のうち、文節係り受け関係にある自立語の組に対して、それらの意味素性に関する確率統計モデルを算出し、これを意味依存モデル23として出力する。
次に、構文・意味解析装置10における評価フェーズについて説明する。まず、評価対象となる文書中の単語列や音声認識の単語列候補等の評価対象単語列24が構文・意味解析装置10に入力されると、品詞・文節境界候補探索手段13は、文節モデル22によって品詞・文節境界候補を探索し、その時のそれぞれの品詞・文節境界の生起確率が最大となる単語列、又は上位から所定数の単語列を評価対象単語列の品詞・文節境界候補25として出力する。出力された評価対象単語列の品詞・文節境界候補25は、意味依存構造同定手段14に出力される。
maxΠP(ci|ci−1)*P(wi|ci)
により構文スコアが最大の品詞・文節境界候補を求める。また、他の例として文節モデル22が品詞マルチグラムモデルの場合には、
maxΠP(ci,ci−1|nj単語文節)*P(nj単語文節|nj−1単語文節)
により構文スコアが最大の品詞・文節境界候補を求める。
P(名詞一般|文節境界)*P(助詞|名詞一般)*P(文節境界|助詞)*P(名詞サ変|文節境界)*P(助詞|名詞サ変)*P(文節境界|助詞)*P(名詞一般|文節境界)*P(助動詞|名詞一般)*P(文節境界|助動詞)
による生起確率を求め、これを構文スコア26とする。
P(名詞一般、助詞|2単語文節)*P(2単語文節|2単語文節)*P(名詞サ変、助詞|2単語文節)*P(2単語文節|2単語文節)*P(名詞一般、助動詞|2単語文節)
による生起確率を求め、これを構文スコア26とする。
P(名詞一般、助詞)*P(名詞サ変、助詞|名詞一般、助詞)*P(名詞一般、助動詞|名詞サ変、助詞)と任意の品詞クラスモデルとの積
による生起確率を求め、これを構文スコア26とする。
P(出会い|家族)*P(日程|出会い)
及び、
P(日程|家族)*P(日程|出会い)
の2通りの依存確率を算出し、これらの値の大きい方を意味スコア28として出力する。
次に、上述した構文・意味解析装置10の適用例として、構文・意味解析装置10を音声認識装置に組み合わせた実施例について、図を用いて説明する。なお、以下の説明において、図1に示した構文・意味解析装置10と同様の構成については同一符号を用いることとし、その説明は省略する。
max P(W)*P(X|W)
となる単語列候補Wを認識結果として出力するだけであったが、本発明の構文・意味解析手法を音声認識装置30に組み込むことによって、文節モデルにより構文スコア(P(SY|W))を算出すると共に、意味依存モデルにより意味スコア(P(SM|SY,W))を算出し、その構文スコア(P(SY|W))及び意味スコア(P(SM|SY,W))を入力して、
max P(W)*P(X|W)*P(SY|W)*P(SM|SY,W)=max P(W,SY,SM|X)
となる単語列候補Wを認識結果として出力することができる。なお、上述の“SY”は、品詞・文節境界の文節構造を示し、“SM”は、自立語の意味素性の文節間での依存構造を示す。
ここで、上述した構文・意味解析装置10及び音声認識装置30は、上述した専用の装置構成等を用いて本発明における構文・意味解析処理及び音声認識処理を行うこともできるが、各構成における処理をコンピュータに実行させることができる実行プログラムを生成し、例えば、汎用のパーソナルコンピュータ、ワークステーション等にそのプログラムをインストールすることにより、本発明に係る構文・意味解析処理及び音声認識処理を実現することができる。
ここで、本発明における構文・意味解析処理及び音声認識処理が実行可能なコンピュータのハードウェア構成例について図を用いて説明する。図4は、本発明における構文・意味解析処理及び音声認識処理が実現可能なハードウェア構成の一例を示す図である。
次に、本発明における実行プログラム(構文・意味解析プログラム)を用いた構文・意味解析処理手順についてフローチャートを用いて説明する。図5は、構文・意味解析処理手順の一例を示すフローチャートである。
次に、本発明における構文意味解析処理を有する実行プログラム(音声認識プログラム)を用いた音声認識処理手順についてフローチャートを用いて説明する。図6は、音声認識処理手順の一例を示すフローチャートである。
11 文節モデル学習手段
12 意味依存モデル学習手段
13 品詞・文節境界候補探索手段
14 意味依存構造同定手段
15 解析スコア算出手段
21 学習テキスト
22 文節モデル
23 意味依存モデル
24 評価対象単語列
25 評価対象単語列の品詞・文節境界候補
26 構文スコア
27 意味素性辞書
28 意味スコア
29 構文的・意味的妥当性スコア・解析結果
30 音声認識装置
31 単語列生成手段
32 構文・意味解析手段
33 言語スコア算出手段
34 音響スコア算出手段
35 正解単語列探索手段
36 単語列候補
41 入力音声
42 単語Nグラムモデル
43 言語スコア
44 音響モデル
45 発音辞書
46 音響スコア
47 認識結果の単語列
51 入力装置
52 出力装置
53 ドライブ装置
54 補助記憶装置
55 メモリ装置
56 CPU
57 ネットワーク接続装置
58 記録媒体
Claims (5)
- 評価対象単語列に対する構文及び意味の解析を行う構文・意味解析装置において、
文節内の品詞及び文節境界の生起確率である文節モデルを用いて、前記評価対象単語列の品詞・文節境界候補の探索を行い、構文スコアを算出する品詞・文節境界候補探索手段と、
自立語の意味素性の文節間での依存確率である意味依存モデルを用いて、前記品詞・文節境界候補探索手段により得られる品詞・文節境界候補に対して各自立語の意味素性の文節間での依存構造の同定を行い、意味スコアを算出する意味依存構造同定手段と、
前記構文スコア及び前記意味スコアに基づいて妥当性スコアを算出し、前記品詞・文節境界候補のうち、特定の妥当性スコア及び/又は特定の妥当性スコアの構文・意味解析結果を出力する解析スコア算出手段とを有し、
予め構文情報と意味素性が付与された学習テキストから前記文節モデルを学習する文節モデル学習手段と、
前記学習テキストから前記意味依存モデルを学習する意味依存モデル学習手段とを有し、
前記意味依存構造同定手段は、
前記品詞・文節境界候補に対する各文節の自立語の意味素性を前記学習テキストと同一のシソーラス辞書により取得し、前記意味依存モデルを用いて文節間の意味素性の依存確率を算出し、依存確率最大の意味依存構造を同定し、その確率値を意味スコアとして出力することを特徴とする構文・意味解析装置。 - 前記品詞・文節境界候補探索手段は、
前記文節モデルを用いて品詞・文節境界候補を探索し、それぞれの品詞・文節境界の生起確率が最大となる単語列又は前記生起確率の上位から所定数の単語列を前記評価対象単語列の品詞・文節境界候補として出力することを特徴とする請求項1に記載の構文・意味解析装置。 - 前記解析スコア算出手段は、
前記構文スコアと、前記意味スコアを蓄積するための蓄積手段を有し、
前記評価対象単語列又は前記品詞・文節境界候補が、前記蓄積手段に蓄積されている前記構文スコア及び前記意味スコアを算出した際の評価対象単語列又は品詞・文節境界候補と類似する場合に、前記蓄積手段に蓄積された構文スコア及び意味スコアを用いて、前記妥当性スコアを算出することを特徴とする請求項1又は2に記載の構文・意味解析装置。 - 前記請求項1乃至3の何れか1項に記載の構文・意味解析装置を備えた音声認識装置。
- コンピュータを、前記請求項1乃至3の何れか1項に記載の構文・意味解析装置として機能させることを特徴とする構文・意味解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005247449A JP4653598B2 (ja) | 2005-08-29 | 2005-08-29 | 構文・意味解析装置、音声認識装置、及び構文・意味解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005247449A JP4653598B2 (ja) | 2005-08-29 | 2005-08-29 | 構文・意味解析装置、音声認識装置、及び構文・意味解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007065029A JP2007065029A (ja) | 2007-03-15 |
JP4653598B2 true JP4653598B2 (ja) | 2011-03-16 |
Family
ID=37927354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005247449A Expired - Fee Related JP4653598B2 (ja) | 2005-08-29 | 2005-08-29 | 構文・意味解析装置、音声認識装置、及び構文・意味解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4653598B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103377184B (zh) * | 2012-04-16 | 2016-03-30 | 富士通株式会社 | 处理语言数据的装置、方法以及设备 |
CN110851560B (zh) * | 2018-07-27 | 2023-03-10 | 杭州海康威视数字技术股份有限公司 | 信息检索方法、装置及设备 |
WO2020039247A1 (en) * | 2018-08-23 | 2020-02-27 | Google Llc | Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface |
US11205052B2 (en) | 2019-07-02 | 2021-12-21 | Servicenow, Inc. | Deriving multiple meaning representations for an utterance in a natural language understanding (NLU) framework |
CN112163407B (zh) * | 2020-10-29 | 2024-08-16 | 华东理工大学 | 基于语义依存关系的医疗文本标注方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06342298A (ja) * | 1993-06-01 | 1994-12-13 | A T R Jido Honyaku Denwa Kenkyusho:Kk | 音声認識方式 |
JP2000172294A (ja) * | 1998-12-07 | 2000-06-23 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、その装置及びプログラム記録媒体 |
JP2001092488A (ja) * | 1999-09-17 | 2001-04-06 | Atr Interpreting Telecommunications Res Lab | 統計的言語モデル生成装置及び音声認識装置 |
JP2005084681A (ja) * | 2003-09-05 | 2005-03-31 | Internatl Business Mach Corp <Ibm> | 意味的言語モデル化および信頼性測定のための方法およびシステム |
-
2005
- 2005-08-29 JP JP2005247449A patent/JP4653598B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06342298A (ja) * | 1993-06-01 | 1994-12-13 | A T R Jido Honyaku Denwa Kenkyusho:Kk | 音声認識方式 |
JP2000172294A (ja) * | 1998-12-07 | 2000-06-23 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、その装置及びプログラム記録媒体 |
JP2001092488A (ja) * | 1999-09-17 | 2001-04-06 | Atr Interpreting Telecommunications Res Lab | 統計的言語モデル生成装置及び音声認識装置 |
JP2005084681A (ja) * | 2003-09-05 | 2005-03-31 | Internatl Business Mach Corp <Ibm> | 意味的言語モデル化および信頼性測定のための方法およびシステム |
Also Published As
Publication number | Publication date |
---|---|
JP2007065029A (ja) | 2007-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11164566B2 (en) | Dialect-specific acoustic language modeling and speech recognition | |
JP5162697B2 (ja) | 情報検索手法による統一化されたタスク依存の言語モデルの生成 | |
US7072837B2 (en) | Method for processing initially recognized speech in a speech recognition session | |
US8768699B2 (en) | Techniques for aiding speech-to-speech translation | |
US8566076B2 (en) | System and method for applying bridging models for robust and efficient speech to speech translation | |
US20060129397A1 (en) | System and method for identifying semantic intent from acoustic information | |
US20060277028A1 (en) | Training a statistical parser on noisy data by filtering | |
US20110307252A1 (en) | Using Utterance Classification in Telephony and Speech Recognition Applications | |
US7805305B2 (en) | Enhancement to Viterbi speech processing algorithm for hybrid speech models that conserves memory | |
CN109754809A (zh) | 语音识别方法、装置、电子设备及存储介质 | |
KR20030078388A (ko) | 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법 | |
WO2003010754A1 (fr) | Systeme de recherche a entree vocale | |
JP2011154099A (ja) | 音声認識装置で利用される音声認識用辞書、音声認識用言語モデルの学習方法 | |
Li et al. | ASR2K: Speech recognition for around 2000 languages without audio | |
KR20170090127A (ko) | 음성 언어 이해 장치 | |
JP4653598B2 (ja) | 構文・意味解析装置、音声認識装置、及び構文・意味解析プログラム | |
Moyal et al. | Phonetic search methods for large speech databases | |
Pinto et al. | Design and evaluation of an ultra low-power human-quality speech recognition system | |
Le et al. | Automatic quality estimation for speech translation using joint ASR and MT features | |
Kuo et al. | Syntactic features for Arabic speech recognition | |
US20020143525A1 (en) | Method of decoding telegraphic speech | |
Lease et al. | A look at parsing and its applications | |
JP2006107353A (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
KR19980038185A (ko) | 자연언어 인터페이스 에이전트 및 그의 의미 분석방법 | |
US11900072B1 (en) | Quick lookup for speech translation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101217 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131224 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |