JP5212725B2 - 電子書籍作成支援装置 - Google Patents
電子書籍作成支援装置 Download PDFInfo
- Publication number
- JP5212725B2 JP5212725B2 JP2009019124A JP2009019124A JP5212725B2 JP 5212725 B2 JP5212725 B2 JP 5212725B2 JP 2009019124 A JP2009019124 A JP 2009019124A JP 2009019124 A JP2009019124 A JP 2009019124A JP 5212725 B2 JP5212725 B2 JP 5212725B2
- Authority
- JP
- Japan
- Prior art keywords
- document data
- speech
- index
- correlation
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
以下、本発明の好適な実施形態について図面を参照して詳細に説明する。図1は、本発明に係る電子書籍作成支援装置の一実施形態を示す構成図である。本実施形態の電子書籍作成支援装置は、本文文書データ130を記憶手段120に格納するための文書データ入力手段102と、本文文書データ130から品詞情報付きの形態素に分解した形態素解析データ140を作成する形態素解析手段104と、形態素解析データ140から相関スコアデータ150を算出するための相関スコア算出手段106と、形態素解析データ140と相関スコアデータ150から索引語データ160を作成する索引語抽出手段108と、本文文書データ130と索引語データ160から索引リンク情報170を作成する索引リンク情報作成手段110と、本文文書データ130と索引語データ160と索引リンク情報170から書籍データ180を作成する電子書籍作成手段112と、スコア閾値値190を記憶手段120に格納するスコア設定手段114により構成されている。
次に、図1に示した電子書籍作成支援装置の処理動作について説明する。図6は、電子書籍作成支援装置の処理動作の概要を示すフローチャートである。処理開始前に、スコア設定手段114によりスコア閾値190は設定されている。スコア閾値が設定された状態で、処理を開始すると、文書データ入力手段102が、本文文書データ130を入力する(S1)。次に、形態素解析手段104が、本文文書データ130を形態素に分割する(S2)。
104・・・形態素解析手段
106・・・相関スコア算出手段
108・・・索引語抽出手段
110・・・索引リンク情報作成手段
112・・・電子書籍作成手段
114・・・スコア設定手段
120・・・記憶手段
130・・・本文文書データ
140・・・形態素解析データ
150・・・相関スコアデータ
160・・・索引語データ
170・・・索引リンク情報
180・・・書籍データ
190・・・スコア閾値
Claims (3)
- 本文文書データを記憶した文書データ記憶手段と、
前記本文文書データに対して形態素解析を実行し、形態素、および各形態素の品詞情報からなる形態素解析データを得る形態素解析手段と、
前記形態素解析データに含まれる形態素の品詞情報を用い、前記本文文書データ中の各品詞について、品詞c1と品詞c2の出現に相関がない仮説H1、品詞c1と品詞c2の出現に相関がある仮説H2を設定し、各仮説の尤度L(H1)、L(H2)を算出し、算出した尤度L(H1)、L(H2)の対数比λに基づき、相関スコアを算出する相関スコア算出手段と、
本文文書データ中の連続する2つの単語について、それぞれの品詞情報を用いて相関スコアを得て、当該相関スコアを事前に設定されたスコア閾値と比較し、相関が高いと判断される場合に、前記連続する2つの単語を索引語として本文文書データから抽出する索引語抽出手段と、
前記作成された索引語の集合である索引語データを前記本文文書データに付加する電子書籍作成手段と、
を有することを特徴とする電子書籍作成支援装置。 - 索引語抽出手段により抽出された索引語を用いて本文文書データを検索し、索引語が本文文書データ中のどの箇所に出現するかを求め、索引リンク情報を作成する索引リンク情報作成手段をさらに有し、
前記電子書籍作成手段は、前記索引リンク情報を前記本文文書データおよび索引語データに付加することを特徴とする請求項1に記載の電子書籍作成支援装置。 - コンピュータを、請求項1または請求項2に記載の電子書籍作成支援装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009019124A JP5212725B2 (ja) | 2009-01-30 | 2009-01-30 | 電子書籍作成支援装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009019124A JP5212725B2 (ja) | 2009-01-30 | 2009-01-30 | 電子書籍作成支援装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010176450A JP2010176450A (ja) | 2010-08-12 |
JP5212725B2 true JP5212725B2 (ja) | 2013-06-19 |
Family
ID=42707351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009019124A Active JP5212725B2 (ja) | 2009-01-30 | 2009-01-30 | 電子書籍作成支援装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5212725B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5629701B2 (ja) * | 2012-01-26 | 2014-11-26 | エヌ・ティ・ティ・コムウェア株式会社 | 類似度算出装置、類似度算出方法、および類似度算出プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4015661B2 (ja) * | 2004-12-24 | 2007-11-28 | 日本電信電話株式会社 | 固有表現抽出装置、方法、プログラム及びそれを記録した記録媒体 |
JP2006260601A (ja) * | 2006-06-08 | 2006-09-28 | Fujitsu Ltd | 索引生成装置及び方法及び記録媒体 |
-
2009
- 2009-01-30 JP JP2009019124A patent/JP5212725B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010176450A (ja) | 2010-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Oufaida et al. | Minimum redundancy and maximum relevance for single and multi-document Arabic text summarization | |
JP3983265B1 (ja) | 辞書作成支援システム、方法及びプログラム | |
Mishra et al. | MAULIK: an effective stemmer for Hindi language | |
Shaalan et al. | Arabic word generation and modelling for spell checking. | |
US8831945B2 (en) | Language model generating device, method thereof, and recording medium storing program thereof | |
Salloum et al. | ADAM: Analyzer for dialectal Arabic morphology | |
WO2014087703A1 (ja) | 単語分割装置、単語分割方法、及び単語分割プログラム | |
JP5751431B2 (ja) | 不整合検出システム、方法、およびプログラム | |
Khan et al. | A light weight stemmer for Urdu language: a scarce resourced language | |
KR101023209B1 (ko) | 문서 번역 장치 및 그 방법 | |
JP2004318510A (ja) | 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法 | |
JP2009217689A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
Alotaibi et al. | Extending the knowledge of the Arabic sentiment classification using a foreign external lexical source | |
Sharma et al. | Word prediction system for text entry in Hindi | |
Paul et al. | An affix removal stemmer for natural language text in nepali | |
KR101663038B1 (ko) | 개체의 표면형 문자열 용례학습기반에 의한 텍스트에서의 개체 범위 인식 장치 및 그 방법 | |
JP5212725B2 (ja) | 電子書籍作成支援装置 | |
JP5447368B2 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
KR20200057824A (ko) | 단어 교정 시스템 | |
Aziz et al. | A hybrid model for spelling error detection and correction for Urdu language | |
Ung et al. | Combination of features for vietnamese news multi-document summarization | |
Al Oudah et al. | Wajeez: An extractive automatic arabic text summarisation system | |
CN112257408A (zh) | 一种文本对比的方法及相关装置 | |
Borin et al. | Language technology for digital linguistics: Turning the linguistic survey of India into a rich source of linguistic information | |
Ahmed et al. | Arabic/english word translation disambiguation approach based on naive bayesian classifier |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130131 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5212725 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |