JP6277921B2 - 用語集管理装置および用語集管理プログラム - Google Patents
用語集管理装置および用語集管理プログラム Download PDFInfo
- Publication number
- JP6277921B2 JP6277921B2 JP2014194569A JP2014194569A JP6277921B2 JP 6277921 B2 JP6277921 B2 JP 6277921B2 JP 2014194569 A JP2014194569 A JP 2014194569A JP 2014194569 A JP2014194569 A JP 2014194569A JP 6277921 B2 JP6277921 B2 JP 6277921B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- glossary
- unit
- extracted character
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/157—Transformation using dictionaries or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00244—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
- Electrically Operated Instructional Devices (AREA)
- Document Processing Apparatus (AREA)
- Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
Description
[概要]
最初に、本発明の一実施形態に係る用語集管理装置の概要について説明する。本発明の用語集管理装置では、用語集に登録する文字列の収集とは無関係に、ユーザーが一般的に行う、文書のコピーや印刷などの作業が行われることを前提としている。
また、ユーザーが用語集を作成する手間を削減することも出来る。
なお、用語を収集して作成した用語集に対しては、各用語の意味を登録することにより、作成した用語集の有用性を高めることが出来る。
次に、本発明の用語集管理装置の構成について説明する。なお、以下では、最初に用語集管理装置の一般的な構成を説明する。その後、用語集管理装置を1つの画像形成装置(MFP、Multifunction Peripheral)として実現した実施形態の構成を説明する。さらに、用語集管理装置を、ネットワークを介したクライアント・サーバー型の構成で実現する場合の構成についても説明する。
図1は、用語集管理装置1の一般的な構成を示す構成図である。用語集管理装置1は、スキャナー2、情報処理装置3、出力装置9を備えている。
次に、用語集管理装置を画像形成装置として実現する場合の構成について説明する。図2は、用語集管理装置を画像形成装置10として実現する場合の構成図である。
次に、用語集管理装置を、情報処理装置を中心としたクライアント・サーバー型の用語集管理システムで実現する構成について説明する。図3は、用語集管理装置を、情報処理装置50を中心としたクライアント・サーバー型の用語集管理システム100で実現する場合の構成図である。
次に、文字列を収集してからローカル用語集21aに登録するまでの処理の流れについて説明する。図4は、文字列を収集してからローカル用語集21aに登録するまでの処理の流れについて説明するためのフローチャートである。
次に、ローカル用語集21aへの文字列の登録処理の詳細について説明する。図5は、ローカル用語集21aへの文字列の登録処理の詳細について説明するためのフローチャートである。
その他、本技術は、上述の実施形態にのみ限定されるものではなく、本技術の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
2 … スキャナー
3 … 情報処理装置
5 … 記憶部
5a… 用語集
6 … 入力部
7 … 制御部
7a… OCR処理部
7b… 取得部
7c… 解析部
7d… 用語マッチング部
7e… 登録部
8 … 通信部
9 … 出力装置
10 … 画像形成装置
11 … 制御部
11a… OCR処理部
11b… 取得部
11c… 解析部
11d… 用語マッチング部
11e… 登録部
12 … 画像読取部
13 … 画像処理部
14 … 画像メモリー
15 … 画像形成部
18 … 操作部
18a… 表示部
19 … ファクシミリ通信部
20 … ネットワークインターフェイス部
21 … 記憶部
21a… 用語集
40 … 画像形成装置
50 … 情報処理装置
60 … パブリック辞書サーバー
100 … 用語集管理システム
Claims (5)
- 文書を読み取る読み取り部と、
前記文書から抽出された文字列により構成される用語集を記憶可能な記憶部と、
ユーザーが前記文書の読み取る際、前記文書からテキストデータを取得する取得部と、
前記取得部により取得された前記テキストデータを記述している言語および前記テキストデータを構成している文字列の品詞を解析し、解析結果に基づいて、前記文字列を抽出する解析部と、
前記抽出された文字列を、一般的な用語が登録されたパブリック辞書とマッチングさせる用語マッチング部と、
前記抽出された文字列を前記用語集に登録する登録部とを具備し、
前記解析部は、前記抽出された文字列が固有名詞であるか否かを判定し、
前記登録部は、前記解析部により前記抽出された文字列が固有名詞であると判定された場合には、前記用語マッチング部が前記抽出された文字列を前記パブリック辞書とマッチングさせることなく、前記抽出された文字列を前記用語集に登録し、
前記用語マッチング部は、前記解析部により前記抽出された文字列が固有名詞ではないと判定された場合には、前記抽出された文字列を前記パブリック辞書とマッチングさせ、
前記登録部は、前記用語マッチング部によるマッチングにより前記抽出された文字列が前記パブリック辞書の見出し語と一致しないときには、前記抽出された文字列を前記用語集に登録する
用語集管理装置。 - 請求項1に記載の用語集管理装置であって、
前記取得部は、社内外区分の入力を受け付け、前記受け付けた社内外区分が社内文書を示すとき、前記文書が社内文書であると判断し、前記文書からテキストデータを取得する
用語集管理装置。 - 請求項1または2に記載の用語集管理装置であって、
前記解析部は、
解析した前記文字列の前記品詞が名詞であるとき、前記文字列を抽出する
用語集管理装置。 - 請求項1〜3のうちいずれか1項に記載の用語集管理装置であって、
前記登録部は、
前記テキストデータが日本語で記述されており、抽出された前記文字列がアルファベットで構成されており、抽出された前記文字列が固有名詞であるとき、抽出された前記文字列を前記用語集に登録する
用語集管理装置。 - ユーザーが前記文書の読み取る際、文書からテキストデータを取得し、
取得された前記テキストデータを記述している言語および前記テキストデータを構成している文字列の品詞を解析し、解析結果に基づいて、前記文字列を抽出し、
前記抽出し文字列を、一般的な用語が登録されたパブリック辞書とマッチングさせ、
前記抽出された文字列を前記用語集に登録する手順を
コンピューターに実行させる用語集管理プログラムであって、更に
前記抽出された文字列が固有名詞であるか否かを判定し、
前記抽出された文字列が固有名詞であると判定された場合には、前記抽出された文字列を前記パブリック辞書とマッチングさせることなく、前記抽出された文字列を前記用語集に登録し、
前記抽出された文字列が固有名詞ではないと判定された場合には、前記抽出された文字列を前記パブリック辞書とマッチングさせ、
前記抽出された文字列を前記パブリック辞書とマッチングさせて前記抽出された文字列が前記パブリック辞書の見出し語と一致しないときには、前記抽出された文字列を前記用語集に登録する手順を
コンピューターに実行させる用語集管理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014194569A JP6277921B2 (ja) | 2014-09-25 | 2014-09-25 | 用語集管理装置および用語集管理プログラム |
CN201510607171.5A CN105468581B (zh) | 2014-09-25 | 2015-09-22 | 词汇表管理装置、词汇表管理系统和词汇表管理方法 |
US14/862,981 US9529792B2 (en) | 2014-09-25 | 2015-09-23 | Glossary management device, glossary management system, and recording medium for glossary generation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014194569A JP6277921B2 (ja) | 2014-09-25 | 2014-09-25 | 用語集管理装置および用語集管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016066233A JP2016066233A (ja) | 2016-04-28 |
JP6277921B2 true JP6277921B2 (ja) | 2018-02-14 |
Family
ID=55584610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014194569A Expired - Fee Related JP6277921B2 (ja) | 2014-09-25 | 2014-09-25 | 用語集管理装置および用語集管理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9529792B2 (ja) |
JP (1) | JP6277921B2 (ja) |
CN (1) | CN105468581B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10146979B2 (en) * | 2015-06-03 | 2018-12-04 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Processing visual cues to improve device understanding of user input |
JP6782644B2 (ja) * | 2017-01-20 | 2020-11-11 | 株式会社野村総合研究所 | 情報処理システム、情報処理方法、およびコンピュータプログラム |
JP2019105957A (ja) * | 2017-12-12 | 2019-06-27 | コニカミノルタ株式会社 | 文書構成解析システム、文書構成解析方法、プログラム |
US10997225B2 (en) | 2018-03-20 | 2021-05-04 | The Boeing Company | Predictive query processing for complex system lifecycle management |
US11966686B2 (en) * | 2019-06-17 | 2024-04-23 | The Boeing Company | Synthetic intelligent extraction of relevant solutions for lifecycle management of complex systems |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5440481A (en) * | 1992-10-28 | 1995-08-08 | The United States Of America As Represented By The Secretary Of The Navy | System and method for database tomography |
US7680649B2 (en) * | 2002-06-17 | 2010-03-16 | International Business Machines Corporation | System, method, program product, and networking use for recognizing words and their parts of speech in one or more natural languages |
CN1922605A (zh) * | 2003-12-26 | 2007-02-28 | 松下电器产业株式会社 | 辞典制作装置以及辞典制作方法 |
JP5039654B2 (ja) * | 2008-07-09 | 2012-10-03 | 株式会社キーエンス | 流量計 |
JP5106636B2 (ja) * | 2008-10-02 | 2012-12-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキストセグメントを有する文書から用語を抽出するためのシステム |
JP2011096015A (ja) * | 2009-10-29 | 2011-05-12 | J&K Car Electronics Corp | 電流値報知装置および発振制御回路 |
DE112010005226T5 (de) * | 2010-02-05 | 2012-11-08 | Mitsubishi Electric Corporation | Erkennungswörterbuch-Erzeugungsvorrichtung und Spracherkennungsvorrichtung |
EP2616927A4 (en) * | 2010-09-24 | 2017-02-22 | International Business Machines Corporation | Using ontological information in open domain type coercion |
JP2013072973A (ja) | 2011-09-27 | 2013-04-22 | Hitachi Solutions Ltd | 語学学習教材提供システム、文章変換方法及びプログラム |
-
2014
- 2014-09-25 JP JP2014194569A patent/JP6277921B2/ja not_active Expired - Fee Related
-
2015
- 2015-09-22 CN CN201510607171.5A patent/CN105468581B/zh not_active Expired - Fee Related
- 2015-09-23 US US14/862,981 patent/US9529792B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN105468581A (zh) | 2016-04-06 |
US20160092436A1 (en) | 2016-03-31 |
JP2016066233A (ja) | 2016-04-28 |
CN105468581B (zh) | 2018-04-06 |
US9529792B2 (en) | 2016-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6277921B2 (ja) | 用語集管理装置および用語集管理プログラム | |
US8732570B2 (en) | Non-symbolic data system for the automated completion of forms | |
US8630852B2 (en) | Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program | |
US20060217958A1 (en) | Electronic device and recording medium | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
US20150309977A1 (en) | Document management apparatus and recording medium for easy register and display of character string indicating meaning | |
US9876916B1 (en) | Image forming apparatus that image-forms result of proofreading process with respect to sentence | |
JP2012018633A (ja) | 語句解説装置、語句解説方法、翻訳制御装置および翻訳制御方法 | |
JP2007052613A (ja) | 翻訳装置、翻訳システムおよび翻訳方法 | |
JP6749583B2 (ja) | 情報処理装置、画像処理装置およびプログラム | |
CN111597827B (zh) | 一种提高机器翻译准确度的方法及其装置 | |
JP2006252164A (ja) | 中国語文書処理装置 | |
JP4797507B2 (ja) | 翻訳装置、翻訳システムおよびプログラム | |
JP2007018158A (ja) | 文字処理装置、文字処理方法及び記録媒体 | |
JP5961656B2 (ja) | 文書管理装置および文書管理プログラム | |
JP2021018520A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP7333526B2 (ja) | 漫画の機械翻訳装置、漫画の対訳データベース生成装置、漫画の機械翻訳方法およびプログラム | |
US10853588B2 (en) | Electronic device translating secret word using mask character string and translation support method | |
JP2016033743A (ja) | 用語集管理装置および用語集管理プログラム | |
US11881041B2 (en) | Automated categorization and processing of document images of varying degrees of quality | |
US20230177859A1 (en) | Document Processing Method, and Information Processing Device | |
US11206335B2 (en) | Information processing apparatus, method and non-transitory computer readable medium | |
JP2023091261A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6021274B2 (ja) | 文書管理装置および文書管理プログラム | |
JP2006349836A (ja) | 文書処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160923 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6277921 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |