JP2010237351A - ユーザ辞書作成システム、方法、及び、プログラム - Google Patents
ユーザ辞書作成システム、方法、及び、プログラム Download PDFInfo
- Publication number
- JP2010237351A JP2010237351A JP2009084096A JP2009084096A JP2010237351A JP 2010237351 A JP2010237351 A JP 2010237351A JP 2009084096 A JP2009084096 A JP 2009084096A JP 2009084096 A JP2009084096 A JP 2009084096A JP 2010237351 A JP2010237351 A JP 2010237351A
- Authority
- JP
- Japan
- Prior art keywords
- word
- registered
- dictionary
- unknown
- unknown word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】ユーザ辞書作成システムは、文字列を入力するテキスト入力手段11と、入力された文字列から未知語を抽出する未知語抽出手段22と、抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段32と、類似度が所定値以上のときには、未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段33と、未知語及び環境情報を辞書に登録する登録手段41とを備える。
【選択図】図1
Description
11:テキスト入力手段
20、20A、20B:未知語抽出部
21:形態素解析手段
22:未知語抽出手段
23:未知語読み付け手段
24:登録単語抽出手段
30、30A:未知語選択部
31:未知語選択手段
32、34:類似度算出手段
33、35:環境情報抽出手段
40:ユーザ辞書登録部
41:登録手段
50:音声認識用辞書
60:ユーザ辞書
70:音声認識手段
80:文章作成手段
90:未知語読み付け辞書
Claims (8)
- 文字列を入力するテキスト入力手段と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、
前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段と、
前記未知語及び環境情報を辞書に登録する登録手段と、を備えるユーザ辞書作成システム。 - 前記未知語の読みを決定する未知語読み付け手段を更に有する、請求項1に記載のユーザ辞書作成システム。
- 入力された文字列から辞書に既に登録されている登録単語を抽出する登録単語抽出手段を更に備え、
前記環境情報抽出手段は、前記文字列中の登録単語の前後の文章の形態解析結果に基づいて、前記登録単語の前後の単語の情報を含む環境情報を抽出し、
前記登録手段は、前記登録されている登録単語に前記抽出された環境情報を付加して前記登録単語を更新する、請求項1又は2に記載のユーザ辞書作成システム。 - 前記更新すべき登録単語は、前記未知語と所定以上の類似度があると過去に判定された登録単語である、請求項3に記載のユーザ辞書作成システム。
- 前記登録される環境情報が前記未知語の品詞に依存する、請求項1〜4の何れか一に記載のユーザ辞書作成システム。
- 前記環境情報抽出手段は、前記未知語と所定以上の類似度を有すると判定された登録語が既に環境情報を含むときには、該含まれた環境情報よりも前記未知語と共に登録すべき環境情報を少なくとも1語だけ長くする、請求項1〜5の何れか一に記載のユーザ辞書作成システム。
- 文字列を入力する処理と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する処理と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する処理と、
前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する処理と、
前記未知語及び環境情報を辞書に登録する処理と、を有するユーザ辞書作成方法。 - コンピュータに、
文字列を入力する処理と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する処理と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する処理と、
前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する処理と、
前記未知語及び環境情報を辞書に登録する処理と、を実行させるユーザ辞書作成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009084096A JP4941495B2 (ja) | 2009-03-31 | 2009-03-31 | ユーザ辞書作成システム、方法、及び、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009084096A JP4941495B2 (ja) | 2009-03-31 | 2009-03-31 | ユーザ辞書作成システム、方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010237351A true JP2010237351A (ja) | 2010-10-21 |
JP4941495B2 JP4941495B2 (ja) | 2012-05-30 |
Family
ID=43091742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009084096A Expired - Fee Related JP4941495B2 (ja) | 2009-03-31 | 2009-03-31 | ユーザ辞書作成システム、方法、及び、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4941495B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014174423A (ja) * | 2013-03-12 | 2014-09-22 | Aisin Aw Co Ltd | 音声認識システム、方法およびプログラム |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6011897A (ja) * | 1983-06-30 | 1985-01-22 | 富士通株式会社 | 音声認識装置 |
JP2000112491A (ja) * | 1998-09-30 | 2000-04-21 | Nec Saitama Ltd | 文字類似度判定装置およびその方法並びに音声認識装置およびその方法 |
JP2001092494A (ja) * | 1999-09-24 | 2001-04-06 | Mitsubishi Electric Corp | 音声認識装置、音声認識方法および音声認識プログラム記録媒体 |
JP2003099087A (ja) * | 2001-09-25 | 2003-04-04 | Canon Inc | 自然言語処理のための解析用辞書作成装置および方法、ならびにプログラム |
JP2004029354A (ja) * | 2002-06-25 | 2004-01-29 | Toshiba Corp | 音声認識装置、音声認識方法及び音声認識プログラム |
JP2005227686A (ja) * | 2004-02-16 | 2005-08-25 | Sharp Corp | 音声認識装置、音声認識プログラムおよび記録媒体。 |
JP2005275348A (ja) * | 2004-02-23 | 2005-10-06 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 |
JP2008058341A (ja) * | 2006-08-29 | 2008-03-13 | Nippon Hoso Kyokai <Nhk> | 単語分類装置及び音声認識装置及び単語分類プログラム |
JP2010039539A (ja) * | 2008-07-31 | 2010-02-18 | Ntt Docomo Inc | 言語モデル作成装置および言語モデル作成方法 |
-
2009
- 2009-03-31 JP JP2009084096A patent/JP4941495B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6011897A (ja) * | 1983-06-30 | 1985-01-22 | 富士通株式会社 | 音声認識装置 |
JP2000112491A (ja) * | 1998-09-30 | 2000-04-21 | Nec Saitama Ltd | 文字類似度判定装置およびその方法並びに音声認識装置およびその方法 |
JP2001092494A (ja) * | 1999-09-24 | 2001-04-06 | Mitsubishi Electric Corp | 音声認識装置、音声認識方法および音声認識プログラム記録媒体 |
JP2003099087A (ja) * | 2001-09-25 | 2003-04-04 | Canon Inc | 自然言語処理のための解析用辞書作成装置および方法、ならびにプログラム |
JP2004029354A (ja) * | 2002-06-25 | 2004-01-29 | Toshiba Corp | 音声認識装置、音声認識方法及び音声認識プログラム |
JP2005227686A (ja) * | 2004-02-16 | 2005-08-25 | Sharp Corp | 音声認識装置、音声認識プログラムおよび記録媒体。 |
JP2005275348A (ja) * | 2004-02-23 | 2005-10-06 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 |
JP2008058341A (ja) * | 2006-08-29 | 2008-03-13 | Nippon Hoso Kyokai <Nhk> | 単語分類装置及び音声認識装置及び単語分類プログラム |
JP2010039539A (ja) * | 2008-07-31 | 2010-02-18 | Ntt Docomo Inc | 言語モデル作成装置および言語モデル作成方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014174423A (ja) * | 2013-03-12 | 2014-09-22 | Aisin Aw Co Ltd | 音声認識システム、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4941495B2 (ja) | 2012-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5599662B2 (ja) | 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法 | |
JP5997217B2 (ja) | 言語変換において複数の読み方の曖昧性を除去する方法 | |
US5930746A (en) | Parsing and translating natural language sentences automatically | |
CN108140019B (zh) | 语言模型生成装置、语言模型生成方法以及记录介质 | |
KR101279676B1 (ko) | 언어 모델을 생성하기 위한 방법, 가나-간지 변환 방법 및그 장치 | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
JP6778655B2 (ja) | 単語連接識別モデル学習装置、単語連接検出装置、方法、及びプログラム | |
Scherrer et al. | Word-based dialect identification with georeferenced rules | |
JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
JP4089861B2 (ja) | 音声認識文章入力装置 | |
JP5097802B2 (ja) | ローマ字変換を用いる日本語自動推薦システムおよび方法 | |
KR101483947B1 (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
JP4941495B2 (ja) | ユーザ辞書作成システム、方法、及び、プログラム | |
JP5611270B2 (ja) | 単語分割装置、及び単語分割方法 | |
JP5795302B2 (ja) | 形態素解析装置、方法、及びプログラム | |
JP2018077698A (ja) | 発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラム | |
Huang et al. | Error detection and correction based on Chinese phonemic alphabet in Chinese text | |
JP6055267B2 (ja) | 文字列分割装置、モデルファイル学習装置および文字列分割システム | |
JP2009176148A (ja) | 未知語判定システム、方法及びプログラム | |
Walentynowicz et al. | Tagger for polish computer mediated communication texts | |
JP2007264858A (ja) | 人名性別判定プログラム、機械翻訳プログラム、人名性別判定装置、機械翻訳装置、人名性別判定処理方法および機械翻訳処理方法 | |
KR101869016B1 (ko) | 등장인물 추출 방법 및 장치 | |
US20180033425A1 (en) | Evaluation device and evaluation method | |
JP2006343405A (ja) | 音声理解装置、音声理解方法、単語・意味表現組データベースの作成方法、そのプログラムおよび記憶媒体 | |
JP2014215970A (ja) | 誤り検出装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120131 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120213 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150309 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |