JP5838781B2 - 複合語読み表示方法及びプログラム,並びに読み生成装置 - Google Patents
複合語読み表示方法及びプログラム,並びに読み生成装置 Download PDFInfo
- Publication number
- JP5838781B2 JP5838781B2 JP2011277874A JP2011277874A JP5838781B2 JP 5838781 B2 JP5838781 B2 JP 5838781B2 JP 2011277874 A JP2011277874 A JP 2011277874A JP 2011277874 A JP2011277874 A JP 2011277874A JP 5838781 B2 JP5838781 B2 JP 5838781B2
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- compound word
- reading
- speech
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
第1実施例では,読み生成装置1は,入力テキスト51から抽出した複合語の分割結果が複数存在するかの判定処理を,分割結果の個数に基づいて行い,強調表示する複合語を決定する。
第2実施例では,読み生成装置1は,第1実施例と同様の処理により強調表示する複合語を決定し,さらに,分割結果数に応じた区分に対応する表示態様の設定を備えておき,求めた分割結果数に応じた多段階の態様で複合語を強調表示する。
第3実施例では,読み生成装置1は,入力テキスト51から抽出した複合語の分割結果が複数存在するかの判定処理を,分割結果の接続強度のスコア差に基づいて行い,強調表示する複合語を決定する。
第4実施例では,読み生成装置1は,第3実施例と同様の処理により強調表示する複合語を決定し,さらに,第1位と第2位の接続強度のスコア差に応じた区分に対応する表示態様の設定を備えておき,判定された区分に対応して多段階の態様で複合語を強調表示する。
読み生成装置1は,上述の第1実施例〜第4実施例の処理によって表示テキスト52が表示されると,ユーザによって選択された複合語の読みを修正する。
10 記憶部
11 単語辞書
12 連接規則
2 形態素列出力部
3 複合語検出部
31 複合語抽出部
33 複数分割可能複合語判定部
4 テキスト表示部
41 表示処理部
43 読み設定部
51 入力テキスト
52 表示テキスト
Claims (7)
- 複合語の読みを表示する読み表示方法において,
コンピュータが,
品詞として,1文字で単語として成立せずかつ接尾語または接頭語に該当しない漢字表記1文字の形態素で在ることを示す単漢字を含む品詞情報を定義した単語辞書を用いて,テキストデータに形態素解析を行って該テキストデータの形態素列を生成し,
前記テキストデータの形態素列から,前記単漢字以外の品詞で定められた複合語を示す品詞列に該当する形態素列の部分を複合語として抽出し,
複合語として抽出した前記形態素列の部分について,該形態素列の部分を形態素に分割した場合の各形態素の品詞列が前記複合語を示す品詞列に該当する分割結果が複数存在するかを判定し,
前記判定において分割結果の中に各形態素の品詞列が前記複合語を示す品詞列に該当する分割結果が複数存在すると判定された,複合語として抽出した前記形態素列の部分を,前記テキストデータを表示する際に強調表示する
ことを特徴とする複合語読み表示方法。 - 前記複合語の分割結果を判定する処理において,複合語として抽出した前記形態素列の部分に含まれる形態素間の連接可能性を示す値に基づいて,前記形態素列の部分の分割結果毎に接続強度のスコアを計算し,第1位のスコアと第2位のスコアとの差が予め設定した閾値以下である場合に前記形態素列の部分の分割結果が複数存在すると判定する
ことを特徴とする請求項1に記載の複合語読み表示方法。 - 複合語として抽出した前記形態素列の部分の分割結果を判定する処理において,前記第1位のスコアを得た分割結果を,該複合語として抽出した前記形態素列の部分の分割結果として出力する
ことを特徴とする請求項2に記載の複合語読み表示方法。 - 複合語として抽出した前記形態素列の部分の分割結果の個数に基づく区分に対応する強調表示の態様の設定を備えて,前記テキストデータを表示する処理において,複合語として抽出した前記形態素列の部分を該形態素列の部分の分割結果の個数に対応する態様で強調表示する
ことを特徴とする請求項1ないし請求項3のいずれか一項に記載の複合語読み表示方法。 - 前記分割結果のスコアの差に基づく区分に態様する強調表示の態様の設定を備えて,前記テキストデータを表示する処理において,複合語として抽出した前記形態素列の部分を,該形態素列の部分の分割結果の第1位のスコアと第2位のスコアの差に対応する態様で強調表示する
ことを特徴とする請求項2または請求項3に記載の複合語読み表示方法。 - 複合語の読みを生成する複合語読み表示プログラムであって,
コンピュータに,
品詞として,1文字で単語として成立せずかつ接尾語または接頭語に該当しない漢字表記1文字の形態素で在ることを示す単漢字を含む品詞情報を定義した単語辞書を用いて,テキストデータに形態素解析を行って該テキストデータの形態素列を生成し,
前記テキストデータの形態素列から,前記単漢字以外の品詞で定められた複合語を示す品詞列に該当する形態素列の部分を複合語として抽出し,
複合語として抽出した前記形態素列の部分について,該形態素列の部分を形態素に分割した場合の各形態素の品詞列が前記複合語を示す品詞列に該当する分割結果が複数存在するかを判定し,
前記判定において分割結果の中に各形態素の品詞列が前記複合語を示す品詞列に該当する分割結果が複数存在すると判定された,複合語として抽出した前記形態素列の部分を,前記テキストデータを表示する際に強調表示する処理を,実行させる
ことを特徴とする複合語読み表示プログラム。 - 読みを生成する読み生成装置において,
品詞として,1文字で単語として成立せずかつ接尾語または接頭語に該当しない漢字表記1文字の形態素で在ることを示す単漢字を含む品詞情報を定義した単語辞書を用いて,テキストデータに形態素解析を行って該テキストデータの形態素列を生成する形態素列出力部と,
前記テキストデータの形態素列から,前記単漢字以外の品詞で定められた複合語を示す品詞列に該当する形態素列の部分を複合語として抽出する複合語抽出部と,
複合語として抽出した前記形態素列の部分について,該形態素列の部分を形態素に分割した場合の各形態素の品詞列が前記複合語を示す品詞列に該当する分割結果が複数存在するかを判定する複数分割可能複合語判定部と,
前記複数分割可能複合語判定部による判定において,分割結果の中に各形態素の品詞列が前記複合語を示す品詞列に該当する分割結果が複数存在すると判定された,複合語として抽出した前記形態素列の部分を,前記テキストデータを表示する際に強調表示する表示処理部とを,備える
ことを特徴とする読み生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011277874A JP5838781B2 (ja) | 2011-12-20 | 2011-12-20 | 複合語読み表示方法及びプログラム,並びに読み生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011277874A JP5838781B2 (ja) | 2011-12-20 | 2011-12-20 | 複合語読み表示方法及びプログラム,並びに読み生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013130904A JP2013130904A (ja) | 2013-07-04 |
JP5838781B2 true JP5838781B2 (ja) | 2016-01-06 |
Family
ID=48908435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011277874A Expired - Fee Related JP5838781B2 (ja) | 2011-12-20 | 2011-12-20 | 複合語読み表示方法及びプログラム,並びに読み生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5838781B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7481999B2 (ja) | 2020-11-05 | 2024-05-13 | 株式会社東芝 | 辞書編集装置、辞書編集方法及び辞書編集プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3093498B2 (ja) * | 1992-12-28 | 2000-10-03 | 株式会社東芝 | 文書読み上げ装置 |
JPH07210556A (ja) * | 1994-01-21 | 1995-08-11 | Toshiba Corp | 自然言語処理装置及び自然言語処理方法 |
JP3483230B2 (ja) * | 1995-10-20 | 2004-01-06 | 株式会社リコー | 発声情報作成装置 |
JP2001188555A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 情報処理装置および方法、並びに記録媒体 |
JP3855989B2 (ja) * | 2003-11-10 | 2006-12-13 | オムロン株式会社 | 日本語文解析装置および日本語文解析方法 |
JP4859101B2 (ja) * | 2006-01-26 | 2012-01-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキストに付与する発音情報の編集を支援するシステム |
-
2011
- 2011-12-20 JP JP2011277874A patent/JP5838781B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013130904A (ja) | 2013-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5071373B2 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
MXPA05001676A (es) | Metodo y dispositivo para enfatizar visualmente los datos numericos contenidos en un documento electronico. | |
CN102193646B (zh) | 人名候选词的生成方法及装置 | |
US20150121200A1 (en) | Text processing apparatus, text processing method, and computer program product | |
JP3372532B2 (ja) | 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体 | |
JP5097802B2 (ja) | ローマ字変換を用いる日本語自動推薦システムおよび方法 | |
CN111046627A (zh) | 一种中文文字显示方法及系统 | |
JP5838781B2 (ja) | 複合語読み表示方法及びプログラム,並びに読み生成装置 | |
JP2011238159A (ja) | 計算機システム | |
JP5482236B2 (ja) | プログラムおよび情報処理装置 | |
JP2012511759A (ja) | ユーザ指定された語句入力学習 | |
JP5447368B2 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
JP6538563B2 (ja) | 入力支援装置、入力支援方法及びプログラム | |
JP6623840B2 (ja) | 同義語検出装置、同義語検出方法及び同義語検出用コンピュータプログラム | |
JP5326781B2 (ja) | 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム | |
JP4671440B2 (ja) | 評判関係抽出装置、その方法およびプログラム | |
JP5169602B2 (ja) | 形態素解析装置、形態素解析方法及びコンピュータプログラム | |
JP5142395B2 (ja) | 関係情報抽出装置、その方法、プログラム及び記録媒体 | |
JP5557469B2 (ja) | 文字検索装置、文字検索システム、文字検索方法、入力端末装置、検索サーバおよびプログラム | |
KR101658598B1 (ko) | 로마자 발음 표기를 매개로 하는 한글 기반의 중국어 입력 장치 및 방법 | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 | |
JP6303508B2 (ja) | 文書分析装置、文書分析システム、文書分析方法およびプログラム | |
JP2001109740A (ja) | 中国語文書作成装置及び中国語文書作成方法 | |
JPH10207875A (ja) | 表作成装置およびその方法 | |
JP2010134766A (ja) | 文書データ処理装置およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140805 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150417 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150428 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150629 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151026 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5838781 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |