JP6736224B2 - 文章解析装置及び文章解析プログラム - Google Patents
文章解析装置及び文章解析プログラム Download PDFInfo
- Publication number
- JP6736224B2 JP6736224B2 JP2017032891A JP2017032891A JP6736224B2 JP 6736224 B2 JP6736224 B2 JP 6736224B2 JP 2017032891 A JP2017032891 A JP 2017032891A JP 2017032891 A JP2017032891 A JP 2017032891A JP 6736224 B2 JP6736224 B2 JP 6736224B2
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- color image
- image information
- sentence
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
11 主メモリ
12 バス
13 記憶装置コントローラ
14 メモリコントローラ
15 表示器コントローラ
16 入力コントローラ
23 外部記憶装置
24 文言・色対応テーブル
25 表示器
26 入力装置
31 入力部
32 文字コード変換手段
33 色画像情報変換手段
34 類似度検出手段
35 類似度出力手段
36 表示手段
41 記憶手段
42 抽出手段
43 文章復元手段
44 類似度幅調整手段
Claims (16)
- 文節を構成する文節文言情報と色画像情報とが対応付けられた文言・色対応テーブルと、
入力された文章を文節に分割し、前記文言・色対応テーブルの情報に基づき、前記入力された色画像情報の配列により構成される文章色画像情報へ変換する色画像情報変換手段と、
前記色画像情報変換手段により第1の文章が変換された第1の文章色画像情報と、前記色画像情報変換手段により第2の文章が変換された第2の文章色画像情報とを比較し、類似度を求める類似度検出手段と、
前記類似度検出手段により求められた類似度に基づき2文章の類似度を表す類似度標記情報を作成し、表示手段に出力する類似度出力手段と、
を具備することを特徴とする文章解析装置。 - 前記文言・色対応テーブルの色画像情報は、2つの文節文言の類似度が高くなるほど値の変化が小さく設定され、また、2つの文節文言の類似度が低くなるほど値の変化が大きく設定されていることを特徴とする請求項1に記載の文章解析装置。
- 前記文言・色対応テーブルでは、文字コードにより構成される文節文言情報と、RGBの色データを所定ビットで表現した色画像情報とが、対応付けられていることを特徴とする請求項1または2に記載の文章解析装置。
- 前記文言・色対応テーブルは、文節文言情報に含まれている自立語の品詞毎に分けた系列により構成されていることを特徴とする請求項1乃至3のいずれか1項に記載の文章解析装置。
- 2文章の類似度を表す類似度標記情報は、パーセントの数字類似度標記により構成されることを特徴とする請求項1乃至4のいずれか1項に記載の文章解析装置。
- 前記色画像情報変換手段により処理された文章色画像情報が記憶される記憶手段を有し、
前記類似度検出手段は、新たに入力され変換された文章色画像情報と前記記憶手段に記載された文章色画像情報とを比較して、類似度情報を求め、
前記類似度検出手段により求められた類似度情報に基づき、所定以上の類似度を持つ文章色画像情報を抽出する抽出手段を
備えることを特徴とする請求項1乃至5のいずれか1項に記載の文章解析装置。 - 前記記憶手段に記憶された文章色画像情報を前記文言・色対応テーブルの情報に基づき文章に変換する文章復元手段を備えることを特徴とする請求項6に記載の文章解析装置。
- 前記類似度検出手段が検出する類似度の幅を調整する類似度幅調整手段が備えられていることを特徴とする請求項1乃至7のいずれか1項に記載の文章解析装置。
- 文節を構成する文節文言情報と色画像情報とが対応付けられた文言・色対応テーブルを有する文章解析装置のコンピュータを、
入力された文章を文節に分割し、前記文言・色対応テーブルの情報に基づき、前記入力された色画像情報の配列により構成される文章色画像情報へ変換する色画像情報変換手段、
前記色画像情報変換手段により第1の文章が変換された第1の文章色画像情報と、前記色画像情報変換手段により第2の文章が変換された第2の文章色画像情報とを比較し、類似度を求める類似度検出手段、
前記類似度検出手段により求められた類似度に基づき2文章の類似度を表す類似度標記情報を作成し、表示手段に出力する類似度出力手段、
として機能させることを特徴とする文章解析プログラム。 - 前記文言・色対応テーブルの色画像情報は、2つの文節文言の類似度が高くなるほど値の変化が小さく設定され、また、2つの文節文言の類似度が低くなるほど値の変化が大きく設定されていることを特徴とする請求項9に記載の文章解析プログラム。
- 前記文言・色対応テーブルでは、文字コードにより構成される文節文言情報と、RGBの色データを所定ビットで表現した色画像情報とが、対応付けられていることを特徴とする請求項9または10に記載の文章解析プログラム。
- 前記文言・色対応テーブルは、文節文言情報に含まれている自立語の品詞毎に分けた系列により構成されていることを特徴とする請求項9乃至11のいずれか1項に記載の文章解析プログラム。
- 2文章の類似度を表す類似度標記情報は、パーセントの数字類似度標記により構成されることを特徴とする請求項9乃至12のいずれか1項に記載の文章解析プログラム。
- 前記文章解析装置は、前記色画像情報変換手段により処理された文章色画像情報が記憶される記憶手段を有し、
前記類似度検出手段は、新たに入力され変換された文章色画像情報と前記記憶手段に記載された文章色画像情報とを比較して、類似度情報を求めるように機能し、
前記コンピュータを、前記類似度検出手段により求められた類似度情報に基づき、所定以上の類似度を持つ文章色画像情報を抽出する抽出手段
として機能させることを特徴とする請求項9乃至13のいずれか1項に記載の文章解析プログラム。 - 前記コンピュータを、前記記憶手段に記憶された文章色画像情報を前記文言・色対応テーブルの情報に基づき文章に変換する文章復元手段
として機能させることを特徴とする請求項14に記載の文章解析プログラム。 - 前記コンピュータを、前記類似度検出手段が検出する類似度の幅を調整する類似度幅調整手段として機能させることを特徴とする請求項9乃至15のいずれか1項に記載の文章解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017032891A JP6736224B2 (ja) | 2017-02-24 | 2017-02-24 | 文章解析装置及び文章解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017032891A JP6736224B2 (ja) | 2017-02-24 | 2017-02-24 | 文章解析装置及び文章解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018136900A JP2018136900A (ja) | 2018-08-30 |
JP6736224B2 true JP6736224B2 (ja) | 2020-08-05 |
Family
ID=63367023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017032891A Active JP6736224B2 (ja) | 2017-02-24 | 2017-02-24 | 文章解析装置及び文章解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6736224B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107633048B (zh) * | 2017-09-15 | 2021-02-26 | 国网重庆市电力公司电力科学研究院 | 一种图像标注鉴别方法及系统 |
CN110188180B (zh) * | 2019-05-31 | 2021-06-01 | 腾讯科技(深圳)有限公司 | 相似问题的确定方法、装置、电子设备及可读存储介质 |
CN112215013B (zh) * | 2020-11-02 | 2022-04-19 | 天津大学 | 一种基于深度学习的克隆代码语义检测方法 |
CN114222196A (zh) * | 2022-01-04 | 2022-03-22 | 阿里巴巴新加坡控股有限公司 | 一种剧情解说短视频的生成方法、装置及电子设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006092344A (ja) * | 2004-09-24 | 2006-04-06 | Fuji Xerox Co Ltd | 重複文書検出装置、重複文書検出方法および重複文書検出プログラム |
JP2008257537A (ja) * | 2007-04-06 | 2008-10-23 | Fuji Xerox Co Ltd | 情報登録装置、情報検索装置、情報検索システム、情報登録プログラム、および情報検索プログラム |
JP5245151B2 (ja) * | 2007-12-17 | 2013-07-24 | 日本学校図書株式会社 | 文章作成教育用積木玩具 |
-
2017
- 2017-02-24 JP JP2017032891A patent/JP6736224B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018136900A (ja) | 2018-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
JP6736224B2 (ja) | 文章解析装置及び文章解析プログラム | |
US7269544B2 (en) | System and method for identifying special word usage in a document | |
KR102509836B1 (ko) | 문서 타이틀 트리의 구축 방법, 장치, 전자기기, 저장매체 및 컴퓨터 프로그램 | |
Sakuntharaj et al. | Use of a novel hash-table for speeding-up suggestions for misspelt Tamil words | |
Zouaghi et al. | Combination of information retrieval methods with LESK algorithm for Arabic word sense disambiguation | |
JP2012185722A (ja) | 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム | |
WO2009123288A1 (ja) | 単語分類システム、方法およびプログラム | |
Vinnarasu et al. | Speech to text conversion and summarization for effective understanding and documentation | |
Freihat et al. | Towards an optimal solution to lemmatization in Arabic | |
CN115794995A (zh) | 目标答案获取方法及相关装置、电子设备和存储介质 | |
JP2006318219A (ja) | 類似スライド検索プログラム及び検索方法 | |
JP4325370B2 (ja) | 文書関連語彙獲得装置及びプログラム | |
JP2009277099A (ja) | 類似文書検索装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
CN116719999A (zh) | 文本相似度检测方法和装置、电子设备及存储介质 | |
JP5447368B2 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
US11842152B2 (en) | Sentence structure vectorization device, sentence structure vectorization method, and storage medium storing sentence structure vectorization program | |
Helmy et al. | Towards building a standard dataset for arabic keyphrase extraction evaluation | |
JP5298834B2 (ja) | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 | |
JP2006235916A (ja) | テキスト解析装置およびテキスト解析方法ならびに音声合成装置 | |
JP7322468B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JPWO2009041661A1 (ja) | 情報処理装置、及びプログラム | |
Melinamath | Rule based methodology for recognition of Kannada named entities | |
JP6303508B2 (ja) | 文書分析装置、文書分析システム、文書分析方法およびプログラム | |
JP2001101184A (ja) | 構造化文書生成方法及び装置及び構造化文書生成プログラムを格納した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191118 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20191118 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200708 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200714 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6736224 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |