CN105045771A - 文档管理装置以及文档管理方法 - Google Patents

文档管理装置以及文档管理方法 Download PDF

Info

Publication number
CN105045771A
CN105045771A CN201510173767.9A CN201510173767A CN105045771A CN 105045771 A CN105045771 A CN 105045771A CN 201510173767 A CN201510173767 A CN 201510173767A CN 105045771 A CN105045771 A CN 105045771A
Authority
CN
China
Prior art keywords
character string
article
attribute
user
document management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510173767.9A
Other languages
English (en)
Other versions
CN105045771B (zh
Inventor
实克洋
高木淳平
辻知佳
吉田大辅
野村高志
大林雄一
中村刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2014090830A external-priority patent/JP5961656B2/ja
Priority claimed from JP2014156338A external-priority patent/JP6021274B2/ja
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Publication of CN105045771A publication Critical patent/CN105045771A/zh
Application granted granted Critical
Publication of CN105045771B publication Critical patent/CN105045771B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种文档管理装置以及文档管理方法。本发明的文档管理装置包括读取部、存储部以及控制部。控制部使读取部读取原稿,检测字符串,利用词典检索所检测出的字符串的注释,将检测出的字符串与检索出的注释相互建立关联并使存储部进行存储。根据本发明,用户能够不费事地登记希望知道含义的字符串。

Description

文档管理装置以及文档管理方法
技术领域
本发明涉及对字符串添加注释的文档管理装置以及文档管理方法。
背景技术
在国语及外语的学习当中,泛读被当作有效的手段之一。而且目前为了学习,能够从互联网等处获取很多文章来进行阅读。
但是,从互联网处获取的文章等并不是以特定水平的学习者为对象而创建的文章。因而,这样并不能称为适于语言学习。
因此,例如在某种典型的技术中,按照英语的每个单词或短语、表达来添加属性。如果是用户已学习过的,则添加“已学习”属性,如果是下一个应学习的,则添加“正在学习”属性。而且,在将获取到的英文转换为浅显的英文时,若转换为以学习为目的的英文时,则使用“已学习”和“正在学习”这两个词语来进行转换。此外,若转换为以理解内容为目的的英文时,则仅使用“已学习”这一个词语来进行转换。
发明内容
本发明的实施方式所涉及的文档管理装置包括读取部、存储部以及控制部。所述读取部从原稿中读取字符串。所述控制部,在对字符串进行登记的字符串登记模式下,使所述读取部读取所述原稿,对读取出的所述字符串进行检测,利用词典对检测出的字符串的注释进行检索,将所述检测出的字符串与检索出的注释相互建立关联并使所述存储部进行存储。
本发明的实施方式所涉及的文档管理方法包括:(i)通过读取部,从原稿中读取字符串;(ii)通过控制部,在对字符串进行登记的字符串登记模式下,使所述读取部读取所述原稿,对读取出的所述字符串进行检测,利用词典对检测出的字符串的注释进行检索,将所述检测出的字符串与检索出的注释相互建立关联;(iii)通过存储部,对建立了关联的所述检测出的字符串与所述检索出的注释进行存储。
附图说明
图1示出本发明的第一实施方式所涉及的文档管理装置的概要。
图2示出第一实施方式所涉及的文档管理装置的一般性结构。
图3示出将第一实施方式所涉及的文档管理装置实现为图像形成装置时的结构。
图4示出利用以图像形成装置为中心的客户端-服务器型的文档管理系统来实现第一实施方式所涉及的文档管理装置时的结构。
图5示出第一实施方式所涉及的字符串登记模式下的处理流程。
图6示出在第一实施方式所涉及的登记于存储部中的信息的例子。
图7示出在第一实施方式所涉及的文章输出模式下,用户对成为对欲插入注释的字符串进行选择的基准的用户标识符及用户属性进行指定的方法的例子。
图8示出第一实施方式所涉及的文章输出模式下的处理流程。
图9示出在第一实施方式中,在所获取的文章中插入表示与用户所指定的用户标识符或用户属性相对应的字符串的含义的字符串(注释)的例子。
图10示出在第二实施方式所涉及的存储于存储部中的信息的例子。
图11示出第二实施方式所涉及的文章输出模式下的处理流程。
具体实施方式
以下参考附图对本发明的各实施方式进行说明。
第一实施方式
图1是用于对本发明的第一实施方式所涉及的文档管理装置的概要进行说明的图。
如图1所示,本发明的第一实施方式所涉及的文档管理装置在字符串登记模式和文章输出模式这两个模式下进行工作。
在字符串登记模式下,用户不明白含义的字符串等希望为该字符串添加注释的字符串被登记到文档管理装置中。登记是在写有希望登记的字符串的纸质原稿上利用例如为希望登记的字符串加下划线等方法来进行。
在图1的例子中,当由于不明白写在纸质原稿上的“身在法隆寺,啖柿听钟鸣”这一文章中的“钟”的含义因而希望添加注释时,用户在“钟”下划线,并使其被文档管理装置读入。
如此,用户对于不明白的字符串等希望添加注释的字符串,通过对纸质原稿的字符串进行标记,从而能够简单地将其登记到文档管理装置中。
文档管理装置读入“钟”并利用词典进行检索以获取注释,该注释是表示“用于敲响的器具”这样含义的字符串。
接着,在文章输出模式下,如图1所示,文档管理装置从用户处获取成为欲输出的文章的基础的文本数据。该文本数据不限于在字符串登记模式下读入的原稿而为任意的文章。
由于在文档管理装置中登记有“钟”,因此在文本数据的“钟”之后,作为“钟”的注释的“用于敲响的器具”这一字符串被插入。插入注释后的文章通过显示装置的显示或打印装置的打印而被提示给用户。
如此,用户能够简单地在欲输出的文章中插入所登记的字符串的注释。
以上对本发明的第一实施方式所涉及的文档管理装置的概要进行了说明。
下面对本发明的第一实施方式所涉及的文档管理装置的结构进行说明。另外,在下文中,首先对文档管理装置的一般性结构进行说明。然后,对将文档管理装置实现为一个复合机(MFP,MultifunctionPeripheral)的实施方式的结构进行说明。进一步地,还对以经由网络的客户端-服务器型的结构来实现文档管理装置时的结构进行说明。
图2是示出文档管理装置1的结构的结构图。文档管理装置1包括:扫描仪2、信息处理装置3以及输出装置9。
扫描仪2在字符串登记模式下读入原稿,且在文章输出模式下读入欲输出的文章。
输出装置9是显示器等显示装置、打印机等打印装置、用于向网络上的外部设备发送数据的网络设备等。输出装置9用于输出已插入注释后的文章。
信息处理装置3可以使用一般的计算机来实现。信息处理装置3包括:存储部5、输入部6、控制部7以及词典8。
存储部5对用户登记的字符串及表示其含义的字符串、用户标识符(后述)、用户属性(后述)等进行存储。
输入部6接收用户对用户标识符及用户属性的输入。
词典8登记有大量的字符串以及用于表示其含义的字符串即注释。
控制部7具有:OCR(OpticalCharacterRecognition,光学字符识别)处理部7a、输入控制部7b、读取控制部7c、检测部7d、检索部7e、存储控制部7f、文章接收部7g、属性获取部7h、属性对照部7i、字符串选择部7j以及输出控制部7k。控制部7执行上述两种模式下的处理。
OCR处理部7a从利用扫描仪2读入的原稿的图像数据中识别出文字,并生成电子文本数据。另外,扫描仪2和OCR处理部7a合在一起相当于读取部。
输入控制部7b对输入部6进行控制。输入控制部7b在字符串登记模式下使输入部6接收对字符串进行登记的用户(登记者)的属性。输入控制部7b在文章输出模式下使输入部6接收欲将文章输出的用户(输出者)的属性。
读取控制部7c在字符串登记模式下使扫描仪2读取已标记出欲登记的字符串的原稿。
检测部7d根据从原稿中读取出的标记的位置,检测出为了添加注释而登记的字符串。
检索部7e利用词典8对通过检测部7d检测出的字符串进行检索。
存储控制部7f将从原稿中检测出的字符串、利用词典8检索出的注释、以及对字符串进行登记的用户的属性相互建立关联并使存储部5进行存储。
文章接收部7g在文章输出模式下接收用户欲输出的文章。另外,文章接收部7g也可以使输入部6接收欲输出的文章。
属性获取部7h根据为了进行输出而接收的文章的文件信息,获取所接收的文章的作者的属性。
属性对照部7i对欲将文章输出的用户的属性、属性获取部7h所获取的文章的作者的属性、以及登记了字符串的用户的属性进行对照。
字符串选择部7j根据属性对照部7i的对照结果,从存储部5所存储的字符串中选择出在欲输出的文章中所包含的字符串中欲插入注释的字符串。
输出控制部7k使通过字符串选择部7j选择出的字符串的注释与欲输出的文章内的字符串相对应,并与文章一起输出到输出装置9。
以上即为文档管理装置1的一般性的结构。
下面对将文档管理装置实现为图像形成装置时的结构进行说明。图3是将文档管理装置实现为图像形成装置10时的结构图。
图像形成装置10具备控制部11。控制部11由中央处理器(CPU,CentralProcessingUnit)、随机存取存储器(RAM,RandomAccessMemory)、只读存储器(ROM,ReadOnlyMemory)以及专用的硬件电路等构成,负责图像形成装置10的整体的动作控制。
控制部11与图像读取部12、图像处理部13、图像存储器14、图像形成部15、词典部16、操作部18、传真通信部19、网络接口部20、存储部21等相连接。控制部11进行所连接的上述各部的动作控制以及各个块之间的信号或数据的发送接收。
控制部11对为了按照通过操作部18或网络连接的PC等而从用户输入的作业执行指示来执行针对扫描仪功能、打印功能、复印功能以及传真发送接收功能等各功能的动作控制而所需的机构的驱动及处理进行控制。
此外,控制部11具有:OCR处理部11a、输入控制部11b、读取控制部11c、检测部11d、检索部11e、存储控制部11f、文章接收部11g、属性获取部11h、属性对照部11i、字符串选择部11j以及输出控制部11k。OCR处理部11a、输入控制部11b、读取控制部11c、检测部11d、检索部11e、存储控制部11f、文章接收部11g、属性获取部11h、属性对照部11i、字符串选择部11j以及输出控制部11k是通过由CPU执行从ROM等加载到RAM中的程序来实现的功能块。
OCR处理部11a、输入控制部11b、读取控制部11c、检测部11d、检索部11e、存储控制部11f、文章接收部11g、属性获取部11h、属性对照部11i、字符串选择部11j以及输出控制部11k分别相当于图2中的OCR处理部7a、输入控制部7b、读取控制部7c、检测部7d、检索部7e、存储控制部7f、文章接收部7g、属性获取部7h、属性对照部7i、字符串选择部7j以及输出控制部7k。
图像读取部12用于从原稿中读取图像,相当于图2中的扫描仪2。
图像处理部13根据需要对利用图像读取部12读取到的图像的图像数据进行图像处理。例如,图像处理部13为了提高通过图像读取部12读取到的图像经过图像形成后的质量,进行阴影校正等图像处理。
图像存储器14是用于临时存储利用图像读取部12的读取而获得的原稿图像的数据且临时存储成为图像形成部15的打印对象的数据的区域。
图像形成部15对利用图像读取部12读取出的图像数据等进行图像形成。
词典部16相当于图2中的词典8。
操作部18包括针对图像形成装置10所能够执行的各种动作及处理而接收来自用户的指示的触摸面板部和操作按键部。触摸面板部包括设有触摸面板的液晶显示器(LCD,LiquidCrystalDisplay)等显示部18a。操作部18相当于图2中的输入部6。
传真通信部19包括未图示的编码解码部、调制解调部以及网络控制单元(NCU,NetworkControlUnit),进行利用公共交换电话网络的传真发送。
网络接口部20由LAN卡等通信模块构成。网络接口部20经由被连接于网络接口部20的LAN等与本地区域内的装置(服务器、PC等外部设备)进行各种数据的发送接收。
存储部21存储通过图像读取部12读取出的原稿图像等,且存储在字符串登记模式下登记的字符串及其注释等。存储部21是硬盘驱动器(HDD,HardDiskDrive)等大容量的存储装置。
以上对将文档管理装置实现为图像形成装置时的结构进行了说明。
下面对利用以图像形成装置为中心的客户端-服务器型的文档管理系统来实现文档管理装置的结构进行说明。图4是利用以图像形成装置为中心的客户端-服务器型的文档管理系统100来实现文档管理装置时的结构图。
文档管理系统100是通过图像形成装置40、词典服务器50以及DB(数据库)服务器60经由网络进行通信从而得以实现的。
词典服务器50相当于图2中的词典8或者图3中的词典部16。词典服务器50也可以利用互联网上提供的任意数量的一般的词典服务器来实现。
DB服务器60相当于图2中的存储部5或者图3中的存储部21。DB服务器60对用户欲登记的字符串及用于表示其含义的字符串即注释、用户标识符、用户属性进行存储。
图像形成装置40从图3所示的图像形成装置10中省去了由词典服务器50和DB服务器60所承担的功能。
以上对利用以图像形成装置为中心的客户端-服务器型的文档管理系统来实现文档管理装置的结构进行了说明。
下面对字符串登记模式下的处理流程进行说明。图5是用于对字符串登记模式下的处理流程进行说明的流程图。另外,在以下的说明中,使用图3所示的将文档管理装置实施为一个图像形成装置10的例子来进行说明。
首先,控制部11的输入控制部11b经由操作部18进行用户(登记者)的登录处理(步骤S1)。通过该处理,使得指示将已标记出字符串的原稿读入的用户与预先登记的用户标识符(用户ID)及用户属性能够相对应。
另外,这里所说的用户标识符是指例如用户的姓名、登录ID、职员号码等能够使图像形成装置10识别出用户的用户信息。
此外,用户属性例如为用户的词汇水平、擅长的领域、归属等,是用户可以自由设定的信息。
接着,读取控制部11c使图像读取部12读入已对字符串实施了标记的原稿(步骤S2)。
接着,OCR处理部11a根据在所读入的原稿中记入的标记的位置,扫描用户欲登记的字符串(步骤S3)。
接着,控制部11的检测部11d判断是否存在被标记了的字符串(步骤S4)。
当存在被标记的字符串时(步骤S4的“是”),控制部11的检索部11e首先利用词典部16来对表示所标记的字符串的含义的字符串即注释进行检索(步骤S5)。
接着,控制部11的检索部11e判断词典部16中是否存在所标记的字符串(步骤S6)。
当词典部16中存在所标记的字符串时(步骤S6的“是”),控制部11的存储控制部11f使存储部21对所标记的字符串、字符串的含义、对应的用户标识符、对应的用户属性这四个信息进行存储(步骤S7)。
从步骤S5到S7的处理按照每个被标记的字符串而重复进行。
以上对字符串登记模式下的处理流程进行了说明。
下面对在存储部21中登记的信息的例子进行说明。图6是在存储部21中登记的信息的示例图。
一条记录由字符串MR、表示字符串MR的含义的字符串即注释CS、登记了字符串MR的用户的用户标识符UI、以及登记了字符串MR的用户的用户属性UZ构成。
例如,在第一条记录E1中,作为字符串MR登记了“祗园精舍”,作为含义CS登记了“寺院的名称”,作为用户标识符UI登记了“佐藤”,作为用户属性UZ登记了“初中生”。这样,字符串MR与用户标识符UI及用户属性UZ建立关联并被存储到存储部21中。
以上对在存储部21中登记的信息的例子进行了说明。
用户标识符及用户属性的指定方法的例子
下面对在文章输出模式下用户对成为对欲插入注释的字符串进行选择的基准的用户标识符UI及用户属性UZ进行指定的方法的例子进行说明。图7是示出在文章输出模式下用户对成为对欲插入注释的字符串进行选择的基准的用户标识符UI及用户属性UZ进行指定的方法的例子的、显示部18a的画面例。
在图7所示的显示部18a的画面例中,左侧显示有在存储部21中存储的用户标识符UI的一览表,右侧显示有在存储部21中存储的用户属性UZ的一览表。
而且,图7示出了用户选择“佐藤”作为用户标识符UI且选择“小学生”作为用户属性的状态。其中,佐藤是初中生,但却主动地选择了“小学生”。由此,使得对于小学生水平的比较简单的用语也能够被显示。
图6所示的信息被存储于存储部21,当选择“佐藤”作为用户标识符UI且选择“小学生”作为用户属性时,控制部11提取符合“佐藤”的记录E1和E2,进而提取符合“小学生”的记录E4。
其结果是,在欲输出的文章中存在“祗园精舍”、“诸行无常”以及“钟”这些字符串时,与这些字符串相对应的注释与文章一起被输出。
以上对在文章输出模式下用户对作为对欲插入注释的字符串进行选择的基准的用户标识符UI及用户属性UZ进行指定的方法的例子进行了说明。
下面对文章输出模式下的处理流程进行说明。图8是用于对文章输出模式下的处理流程进行说明的流程图。另外,在以下的说明中,使用图3所示的将文档管理装置实施为一个图像形成装置10的例子来进行说明。
首先,控制部11的文章接收部11g从用户处获取欲输出的文章,并判断所获取的文章是否为电子文本数据(步骤S10)。作为文章的获取方法,例如有利用图像读取部12来获取作为图像数据的方法、以及经由网络从个人计算机(PC,PersonalComputer)等外部设备接收的方法。
当所获取的文章不是电子文本数据时(步骤S10的“否”),保持这种状态则无法进行以后的处理。为此,控制部11利用OCR处理部11a将读入的图像数据转换为电子文本数据(步骤S11)。
接着,控制部11将所获取的文章与用户通过上述的指定方法等指定并被存储到存储部21中的用户标识符及用户属性所分别对应的字符串进行对照(步骤S12)。即,控制部11对与用户标识符UI及用户属性UZ建立关联并被存储到存储部21中的字符串MR进行查询。
接着,控制部11判断在所获取的文章中是否存在与用户指定的用户标识符或用户属性相对应的字符串(步骤S13)。
当存在与用户指定的用户标识符或用户属性相对应的字符串时(步骤S13的“是”),控制部11在所获取的文章中紧随符合的字符串之后,插入表示与用户指定的用户标识符或用户属性相对应的字符串的含义的字符串即注释(步骤S14)。
另外,这里在所获取的文章中紧随与用户指定的用户标识符或用户属性相对应的字符串之后,插入了表示与用户指定的用户标识符或用户属性相对应的字符串的含义的字符串即注释。然而,并不限于这种方案,例如,也可以将表示与用户指定的用户标识符或用户属性相对应的字符串的含义的字符串即注释作为脚注来附加。
此外,还可以为如下方案:从所获取的文章中的与用户指定的用户标识符或用户属性相对应的字符串处引出气球,将表示对应含义的字符串即注释记入到该气球内。
接着,控制部11为了与插入相应地对欲输出的文章进行整形,按照所插入的注释的文字数来调整文章的换行位置(步骤S15)。调整可以通过将换行位置向前挪动等来进行。
步骤S14和S15的处理针对每个欲插入注释的字符串而重复进行。
当不存在与用户指定的用户标识符或用户属性相对应的字符串时(步骤S13的“否”),控制部11进行所生成文章的打印处理(步骤S16)。
接着,控制部11根据需要进行渗透去除或图像旋转等其他的图像处理(步骤S17)。
以上对文章输出模式下的处理流程进行了说明。
最后,对在获取的文章中插入表示与用户指定的用户标识符或用户属性相对应的字符串的含义的字符串即注释的例子进行说明。图9是在获取的文章中插入表示与用户指定的用户标识符或用户属性相对应的字符串的含义的字符串即注释的示例图。
在该例中,以图6所示的信息被存储于存储部21、且图7所示的用户标识符及用户属性被指定为前提。
因此,在紧随“祗园精舍”、“钟”以及“诸行无常”这些字符串之后,表示这些字符串的含义的字符串即注释被插入,换行位置被调整。
以上对在获取的文章中插入表示与用户指定的用户标识符或用户属性相对应的字符串的含义的字符串即注释的例子进行了说明。
以上对于第一实施方式进行了说明。
第二实施方式
下面对于第二实施方式进行说明。
首先,作为第二实施方式的概要,对与第一实施方式的区别进行说明。
在第一实施方式中,在文章输出模式下,用户明确地指定了用户标识符UI及用户属性UZ。与此相对,在第二实施方式中,在文章输出模式下,用户标识符UI及用户属性UZ被自动判断并输入。
根据该方案,能够省去用户指定用户标识符UI及用户属性UZ的麻烦。
此外,在第一实施方式的方案中,当用户指定了不恰当的用户属性UZ时,可能出现在对用户而言并不需要注释的字符串中也插入注释、或者在对用户而言需要注释的字符串中没有插入注释等情况。
但是,在第二实施方式的方案中,自动指定用户属性UZ。因此,在第二实施方式的方案中,能够减少因指定不恰当的用户属性UZ而引起的注释插入的过分或不足。
另外,在本实施方式所涉及的文档管理装置中,在文章输出模式下,对在创建了欲输出的文章的作者的属性与欲将插入注释后的文章输出的用户的属性之间相关联的属性进行确定。然后,对于登记于词典的字符串之中具有与确定出的相关联的属性一致的属性的字符串,并不插入注释。
例如,当想要输出某文章的用户A具有“数学”作为“擅长的领域”属性、且创建了欲输出的文章的作者B具有“数学”作为“擅长的领域”属性时,文档管理装置提取出“数学”作为用户A与作者B的相关联的属性。
于是,当文档管理装置从词典中检索具有作为相关联的属性而被提取出的“数学”的字符串并找到了字符串C时,即使在欲输出的文章中包含字符串C时,文档管理装置也不在字符串C之后插入表示其含义的字符串。
对于这样的处理,例如,当某个登记了字符串C的用户D具有“数学”作为“擅长的领域”属性、且欲将插入有注释的文章输出的用户A与创建了欲插入注释的文章的作者B也具有“数学”作为“擅长的领域”属性时,用户A被认为对于与数学有关的字符串(用语)知识丰富。因此,关于用户D登记的字符串C,以不进行注释的插入为前提。
以上作为第二实施方式的概要,对与第一实施方式的区别进行了说明。
下面对本发明的第二实施方式所涉及的文档管理装置的结构进行说明。第二实施方式所涉及的文档管理装置与第一实施方式同样地,也可以实现为文档管理装置1、图像形成装置10或文档管理系统100。
因而,除了控制部7或控制部11的处理流程有部分不同之外,呈现相同的结构,因此省略详细说明。
以上对本发明的第二实施方式所涉及的文档管理装置的结构进行了说明。
字符串登记模式下的处理流程由于与第一实施方式中的处理流程相同,因此省略说明。
下面对在存储部21中存储的信息的例子进行说明。图10是在存储部21中存储的信息的示例图。
一条记录由字符串MR、表示字符串MR的含义的字符串即注释CS、登记了字符串MR的用户的用户标识符UI、登记了字符串MR的用户的用户属性UZ1和UZ2构成。
例如,在第一条记录E1中,作为字符串MR登记了“祗园精舍”,作为含义CS登记了“寺院的名称”,作为用户标识符UI登记了“佐藤”,作为表示用户的擅长的领域的用户属性UZ1登记了“国语”,作为表示用户的水平(专业性的高低)的用户属性UZ2登记了“初中生”。
另外,在该例中,使用了两个用户属性UZ1和UZ2,但存储部21中存储的用户属性的数目只要能够恰当地设定用户属性则几个都可以。
此外,在用户属性中,存在着在对在含义插入中所使用的字符串进行判断的处理(后述)中要判断一致和不一致的用户属性(例如,“国语”、“数学”)、以及要判断大小关系或上下关系的用户属性(例如,“小学生”<“初中生”<“高中生”)。
通过恰当地使用这些用户属性,能够恰当地选择出在含义插入中所使用的字符串。
以上对在存储部21中登记的信息的例子进行了说明。
下面对文章输出模式下的处理流程进行说明。图11是用于对文章输出模式下的处理流程进行说明的流程图。另外,在以下的说明中,使用图3所示的将文档管理装置实施为一个图像形成装置10的例子来进行说明。
首先,输入控制部11b通过ID卡的读取或ID号码的输入等对作为欲将文章输出的输出者的用户进行认证,根据在认证中使用的认证信息,来获取用户信息(步骤S20)。在获取到的用户信息中,如上所述,包含有用户标识符UI以及用户属性UZ1、UZ2。
接着,属性获取部11h从用户想要输出的文件中提取文件信息(步骤S21)。在提取出的文件信息中,包含有用户标识符UI以及用户属性UZ1、UZ2,所述用户标识符UI用于标识作为创建(或修改)了该文件的作者的用户,所述用户属性UZ1、UZ2是作为作者的用户的属性。
接着,属性对照部11i对用户信息与文件信息进行比较,确定用户与文件的关联度以及用户的水平(步骤S22)。
接着,字符串选择部11j选择出登记于词典部16的字符串之中关联度未满特定阈值的字符串或者用户的水平为特定阈值以上的字符串(步骤S23)。
接着,控制部11针对选择出的每个字符串进行下面的处理(步骤S24)。另外,当针对选择出的每个字符串的处理完成之后,插入注释后的文章经由输出控制部11k被输出。
当选择出的字符串存在于文件中时,控制部11在文件中紧随该字符串之后,插入表示该字符串的含义的字符串即注释(步骤S25)。
以上对文章输出模式下的处理流程进行了说明。
下面,对在文章输出模式下控制部11自动选择成为对欲插入注释的字符串进行选择的基准的用户标识符UI以及用户属性UZ1、UZ2的方法的例子进行说明。
另外,在以下的说明中,假设信息按照图10所示的信息的例子那样存储在存储部21中。
具体例1
假设欲将插入有注释的文件输出的用户具有以下属性。
用户标识符UI:田中
用户属性UZ1:国语
用户属性UZ2:初中生
此外,假设作为创建了欲插入注释的文件的作者的用户具有以下属性。
用户标识符UI:佐藤
用户属性UZ1:国语
用户属性UZ2:初中讲师
此外,将处理中使用的特定阈值设为2。另外,阈值既可以在文档管理装置出厂时设定为特定值,也可以在运用文档管理装置时由管理者判断注释的插入量来适当变更。
在这种情况下,在用户与作者之间,由于“国语”的属性一致且“初中”的属性相关联,因此将关联度设为“2”。
于是,由于特定阈值为2,因此,在登记于词典部16的字符串之中,以“国语”及“初中”这两个属性一致或关联的字符串之外的字符串为对象,进行注释的插入。
即,去掉“国语”及“初中”这两个属性一致或关联的记录E1和E3后的记录E2(诸行无常)和记录E4(钟)的注释被插入到文件内的字符串之后。
具体例2
假设欲将插入有注释的文件输出的用户具有以下属性。
用户标识符UI:桥本
用户属性UZ1:数学
用户属性UZ2:高中生
此外,假设作为创建了欲插入注释的文件的作者的用户具有以下属性。
用户标识符UI:田中
用户属性UZ1:数学
用户属性UZ2:小学生
此外,将处理中使用的特定阈值设为1。
在这种情况下,在用户与作者之间,由于“数学”这一个属性一致(关联),因此将关联度设为“1”。
于是,由于特定阈值为1,因此,在登记于词典部16的字符串之中,以“数学”的属性内容一致的字符串之外的字符串为对象,进行注释的插入。
即,去掉“数学”这一属性一致的记录E2之后的记录E1(祗园精舍)、记录E3(回响)以及记录E4(钟)的注释被插入到文件内的字符串之后。
具体例3
假设欲将插入有注释的文件输出的用户具有以下属性。
用户标识符UI:服部
用户属性UZ1:数学
用户属性UZ2:初中生
此外,假设作为创建了欲插入注释的文件的作者的用户具有以下属性。
用户标识符UI:近藤
用户属性UZ1:数学
用户属性UZ2:高中生
此外,将处理中使用的特定阈值设为1。
在这种情况下,在作为输出者的用户与作为作者的用户之间,由于“数学”这一个属性一致(关联),因此将关联度设为“1”。
在这种情况下,表示用户的水平的用户属性UZ2为“初中生”,与此相对,表示文件作者的水平的用户属性UZ2为“高中生”。与初中生相比,高中生被认为知道含义的词语更多,因而在登记于词典部16的字符串之中,仅用户属性UZ2为“高中生”以上的字符串成为注释插入的对象。
因此,仅用户属性UZ2为“高中生”的记录E2(诸行无常)和记录E4(钟)的注释被插入到文件内的字符串之后。
以上对在文章输出模式下控制部11自动选择成为对欲插入注释的字符串进行选择的基准的用户标识符UI以及用户属性UZ1、UZ2的方法的例子进行了说明。
另外,本发明并不仅仅限定于上述的实施方式,在不脱离本技术的宗旨的范围内可以施加各种变更,这是不言而喻的。

Claims (10)

1.一种文档管理装置,包括:
读取部,从原稿中读取字符串;
存储部;以及
控制部,在对字符串进行登记的字符串登记模式下,使所述读取部读取所述原稿,对读取出的所述字符串进行检测,利用词典对检测出的字符串的注释进行检索,将所述检测出的字符串与检索出的注释相互建立关联并使所述存储部进行存储。
2.根据权利要求1所述的文档管理装置,
所述读取部从所述原稿中读取被标记的字符串和标记,
所述控制部在所述字符串登记模式下,根据读取出的标记的位置来检测所述字符串。
3.根据权利要求1或2所述的文档管理装置,
在对文章进行输出的文章输出模式下,输入所述文章,将接收到的文章与存储于所述存储部的字符串进行对照,获取在所述对照中相符合的字符串的注释,使获取到的注释与所述相符合的字符串相对应,并与所述文章一起输出。
4.根据权利要求3所述的文档管理装置,
进一步包括:输入部,接收用户标识符,所述用户标识符用于标识对所述文档管理装置进行操作的用户,
所述控制部,
在所述字符串登记模式下,将所述检测出的字符串与所述用户标识符建立关联并使存储部进行存储,
在所述文章输出模式下,从所述输入部获取所述用户标识符,将所述文章与存储于所述存储部且与获取到的用户标识符建立了关联的字符串进行对照。
5.根据权利要求3所述的文档管理装置,
进一步包括:输入部,接收对所述文档管理装置进行操作的用户的属性信息,
所述控制部,
在所述字符串登记模式下,将所述检测出的字符串与所述属性信息建立关联并使存储部进行存储,
在所述文章输出模式下,从所述输入部获取所述属性信息,将所述文章与存储于所述存储部且与获取到的属性信息建立了关联的字符串进行对照。
6.根据权利要求3所述的文档管理装置,
所述控制部,
在所述文章输出模式下,对所述文章进行输出时,将所述获取到的注释嵌入到所述文章内的所述相符合的字符串的附近。
7.根据权利要求3所述的文档管理装置,
进一步包括:输入部,能够接收作为对字符串进行登记的登记者的用户的属性以及作为欲将文章输出的输出者的用户的属性,
所述读取部从由所述登记者标记出所述字符串的原稿中读取所述字符串和所述标记,
所述控制部包括:
输入控制部,在所述字符串登记模式下,使所述输入部接收所述登记者的属性,在对所述文章进行输出的文章输出模式下,使所述输入部接收所述输出者的属性;
读取控制部,在所述字符串登记模式下,使所述读取部读取所述原稿;
检测部,根据读取出的标记的位置,检测欲添加注释的字符串;
检索部,利用词典对检测出的字符串的注释进行检索;
存储控制部,使所述检测出的字符串、检索出的注释、以及接收到的所述登记者的属性相对应并使所述存储部进行存储;
文章接收部,从所述输出者接收欲输出的文章;
属性获取部,根据接收到的文章的文件信息,获取所述接收到的文章的作者的属性;
属性对照部,将接收到的所述输出者的属性、获取到的所述作者的属性、以及存储的所述登记者的属性进行对照;
字符串选择部,根据所述对照的结果,对存储于所述存储部的字符串进行选择;以及
输出控制部,使选择出的字符串的注释与所述文章内的所述字符串相对应,并与所述文章一起输出。
8.根据权利要求7所述的文档管理装置,
所述属性对照部在所述文章输出模式下,将所述接收到的所述输出者的属性与所述获取到的所述作者的属性进行对照,选择出相一致的属性值;
所述字符串选择部在所述文章输出模式下,将不具有选择出的属性值的字符串选择出来。
9.根据权利要求7所述的文档管理装置,
当所述属性为表示专业性高低的属性时,
所述属性对照部在所述文章输出模式下,将所述接收到的所述输出者的属性与所述获取到的所述作者的属性进行对照,选择出相一致的属性值;
所述字符串选择部在所述文章输出模式下,将具有比选择出的属性值高的属性值的字符串选择出来。
10.一种文档管理方法,包括:
通过读取部,从原稿中读取字符串;
通过控制部,在对字符串进行登记的字符串登记模式下,使所述读取部读取所述原稿,对读取出的所述字符串进行检测,利用词典对检测出的字符串的注释进行检索,将所述检测出的字符串与检索出的注释相互建立关联;
通过存储部,对建立了关联的所述检测出的字符串与所述检索出的注释进行存储。
CN201510173767.9A 2014-04-25 2015-04-14 文档管理装置以及文档管理方法 Expired - Fee Related CN105045771B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2014090830A JP5961656B2 (ja) 2014-04-25 2014-04-25 文書管理装置および文書管理プログラム
JP2014-090830 2014-04-25
JP2014156338A JP6021274B2 (ja) 2014-07-31 2014-07-31 文書管理装置および文書管理プログラム
JP2014-156338 2014-07-31

Publications (2)

Publication Number Publication Date
CN105045771A true CN105045771A (zh) 2015-11-11
CN105045771B CN105045771B (zh) 2017-12-26

Family

ID=54334939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510173767.9A Expired - Fee Related CN105045771B (zh) 2014-04-25 2015-04-14 文档管理装置以及文档管理方法

Country Status (2)

Country Link
US (1) US20150309977A1 (zh)
CN (1) CN105045771B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363795A (zh) * 2017-12-14 2018-08-03 凉山彝族自治州科学技术情报研究所 一种计算机信息检索方法及系统
CN110909740A (zh) * 2018-09-18 2020-03-24 富士施乐株式会社 信息处理装置以及存储介质
CN111142683A (zh) * 2018-11-06 2020-05-12 Ib研究株式会社 输入辅助程序、输入辅助方法以及输入辅助装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874241A (zh) * 2016-12-23 2017-06-20 《中国医药科学》杂志社有限公司 一种智能化文稿编辑系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1700201A (zh) * 2004-05-18 2005-11-23 夏普株式会社 图像处理装置、图像处理系统、图像处理方法
CN1841364A (zh) * 2005-03-28 2006-10-04 富士施乐株式会社 文件翻译方法和文件翻译装置
CN101257554A (zh) * 2007-02-27 2008-09-03 富士施乐株式会社 文档处理装置、文档处理系统和文档处理方法
US20080313172A1 (en) * 2004-12-03 2008-12-18 King Martin T Determining actions involving captured information and electronic content associated with rendered documents

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327387B1 (en) * 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US7812860B2 (en) * 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US7917554B2 (en) * 2005-08-23 2011-03-29 Ricoh Co. Ltd. Visibly-perceptible hot spots in documents
DE202010018601U1 (de) * 2009-02-18 2018-04-30 Google LLC (n.d.Ges.d. Staates Delaware) Automatisches Erfassen von Informationen, wie etwa Erfassen von Informationen unter Verwendung einer dokumentenerkennenden Vorrichtung
KR20140053915A (ko) * 2011-05-24 2014-05-08 인두 엠. 아난드 어플리케이션 데이터 파일로부터의 정보의 컴퓨터-에이디드 소비를 위한 방법 및 그 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1700201A (zh) * 2004-05-18 2005-11-23 夏普株式会社 图像处理装置、图像处理系统、图像处理方法
US20080313172A1 (en) * 2004-12-03 2008-12-18 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
CN1841364A (zh) * 2005-03-28 2006-10-04 富士施乐株式会社 文件翻译方法和文件翻译装置
CN101257554A (zh) * 2007-02-27 2008-09-03 富士施乐株式会社 文档处理装置、文档处理系统和文档处理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363795A (zh) * 2017-12-14 2018-08-03 凉山彝族自治州科学技术情报研究所 一种计算机信息检索方法及系统
CN110909740A (zh) * 2018-09-18 2020-03-24 富士施乐株式会社 信息处理装置以及存储介质
CN111142683A (zh) * 2018-11-06 2020-05-12 Ib研究株式会社 输入辅助程序、输入辅助方法以及输入辅助装置
CN111142683B (zh) * 2018-11-06 2024-06-11 Ib研究株式会社 输入辅助程序、输入辅助方法以及输入辅助装置

Also Published As

Publication number Publication date
US20150309977A1 (en) 2015-10-29
CN105045771B (zh) 2017-12-26

Similar Documents

Publication Publication Date Title
JP6881990B2 (ja) 画像処理装置とその制御方法、及びプログラム
US10237424B2 (en) System and method for analyzing, notifying, and routing documents
JP4926004B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
US8310711B2 (en) Output device and its control method for managing and reusing a job history
US20080174790A1 (en) Image processing system, image processing method, and computer readable medium
US9697179B2 (en) Method and apparatus for inserting image into electronic document
US10136005B2 (en) Image processing apparatus and image processing system capable of generating scan data and metadata
US9369605B2 (en) Image processing apparatus for outputting information embedded in a code image according to version information included in the code image
CN105045771A (zh) 文档管理装置以及文档管理方法
CN106484663A (zh) 一种文档内容的提取方法和装置
EP2854047A1 (en) Automatic keyword tracking and association
US20200358913A1 (en) Information processing apparatus, and non-transitory computer readable medium
US9516189B2 (en) Image processing apparatus, system, and non-transitory computer readable medium for generating code image expressing acquired attribute information
EP2778895B1 (en) Pull copying using document-file identifiers
JP2011045024A (ja) 文書出力装置及びプログラム
JP2008136021A (ja) 画像処理機器,記事画像選択方法,プログラム,および記録媒体
US11887391B2 (en) Information processing system, data output system, image processing method, and recording medium
US20070245226A1 (en) Data processing apparatus and method
CN103309634B (zh) 服务器、该服务器的作业的印刷控制方法
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP6021274B2 (ja) 文書管理装置および文書管理プログラム
US11431868B2 (en) Information processing apparatus, information processing method, and storage medium comprising extracting a character string from a scanned document and determining if pre-defined candidates of a selection-type match the extracted character string, determining whether to display or not display one of the pre-defined candidates as a default value based on the result of the match between the extracted character string and the pre-defined candidates
US20200410230A1 (en) Document classification system and non-transitory computer readable recording medium storing document classification program
US6854008B1 (en) Automatically uploading and organizing documents in a document server
JP5961656B2 (ja) 文書管理装置および文書管理プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171226

Termination date: 20210414