KR20060115262A - Location-information offer system of printed matter - Google Patents

Location-information offer system of printed matter Download PDF

Info

Publication number
KR20060115262A
KR20060115262A KR1020050037723A KR20050037723A KR20060115262A KR 20060115262 A KR20060115262 A KR 20060115262A KR 1020050037723 A KR1020050037723 A KR 1020050037723A KR 20050037723 A KR20050037723 A KR 20050037723A KR 20060115262 A KR20060115262 A KR 20060115262A
Authority
KR
South Korea
Prior art keywords
article
unit
user
document
file
Prior art date
Application number
KR1020050037723A
Other languages
Korean (ko)
Other versions
KR100715320B1 (en
Inventor
최길원
배성환
Original Assignee
주식회사 알에스엔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 알에스엔 filed Critical 주식회사 알에스엔
Priority to KR1020050037723A priority Critical patent/KR100715320B1/en
Publication of KR20060115262A publication Critical patent/KR20060115262A/en
Application granted granted Critical
Publication of KR100715320B1 publication Critical patent/KR100715320B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

A system for offering location information of prints is provided to offer the entire page of print in a PDF(Portable Document Format) type, search an article by recognizing a document, and enable a user to recognize importance of the article by visually offering the location/size of each article in the entire PDF document of the prints. A document scanner(105) scans/converts various newspapers, newsletters, and prints into a PDF file. An article separator(110) separates each article in the entire screen while displaying the scanned PDF file. A face input part(115) separates the scanned PDF file into each article and stores a corresponding page. A location information input part(120) automatically inputs the location in the entire screen when each article is separated in the entire screen of the scanned PDF file. A document recognizer(125) recognizes the PDF file separated into each article and generates a text file by converting the recognized article. A keyword extractor(130) extracts keywords from data converted from the text file. A database storing part(135) stores the generated data to a database. A PDF database(145) stores the PDF file and the PDF files separated into each article.

Description

인쇄물 위치정보 제공시스템{Location-Information Offer System of Printed Matter}Location-Information Offer System of Printed Matter}

도 1은 본 발명의 일실시예에 따른 인쇄물 위치정보 제공시스템의 전체 구성도이다.1 is an overall configuration diagram of a printed matter position information providing system according to an embodiment of the present invention.

도 2는 본 발명의 일실시예에 따른 인쇄물 위치정보 제공시스템의 검색엔진의 링크를 나타낸 예시도이다.2 is an exemplary view showing a link of a search engine of a system for providing print position information according to an embodiment of the present invention.

도 3은 본 발명의 일실시예에 따른 인쇄물 위치정보 제공시스템이 사용자에게 서비스되는 예시도이다.3 is an exemplary view in which a system for providing print position information according to an embodiment of the present invention is serviced to a user.

도 4는 본 발명의 일실시예에 따른 사용자가 특정 기사를 클릭할 경우에 해당하는 기사를 화면에 나타낸 예시도이다.4 is an exemplary diagram showing an article corresponding to a case where a user clicks a specific article according to an embodiment of the present invention.

도 5는 본 발명의 일실시예에 따른 전체기사내 기사분리 및 개별 기사를 디스플레이한 화면을 나타낸 도면이다.FIG. 5 is a diagram illustrating a screen displaying article separation and individual articles in an entire article according to an embodiment of the present invention.

* 도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

105 : 문서스캔부 110 : 기사분리부105: document scanning unit 110: article separation unit

115 : 면입력부 120 : 위치정보입력부115: surface input unit 120: location information input unit

125 : 문서인식부 130 : 키워드추출부125: document recognition unit 130: keyword extraction unit

135 : 디비저장부 140 : 텍스트디비135: DVD storage 140: text DVD

145 : 피디에프디비 150 : 키워드디비145: PD DVD 150: Keyword DVD

155 : 위치정보디비 160 : 사용자스크랩디비155: location information DVD 160: user scrap DVD

165 : 검색엔진 170 : 목차클릭부165: search engine 170: table of contents click

175 : 피디에프표시부 180 : 위치정보출력부175: PD display unit 180: Position information output unit

185 : 피디에프목차표시부 190 : 의견입력부185: PD table of contents display unit 190: Opinion input unit

200 : 사용자단말기200: user terminal

본 발명은 인쇄물 위치정보 제공시스템에 관한 것으로서, 더욱 상세하게는 사용자가 원하는 인쇄물의 전체 내용 뿐만아니라, 기사별 내용들을 용이하게 파악할 수 있으며, 인쇄물 전체 내용내에 각각의 기사별로 해당하는 위치를 제공하여 기사별 내용들의 비중을 파악할 수 있는 인쇄물 위치정보 제공시스템에 관한 것이다.The present invention relates to a system for providing a print position information, and more particularly, it is possible to easily grasp not only the entire contents of the printed material desired by the user, but also the contents of each article, and to provide a corresponding position for each article in the entire contents of the printed matter. The present invention relates to a system for providing printed position information that can grasp the weight of contents of articles.

일반적으로 인터넷을 이용하여 사용자들에게 정보를 제공하는 인쇄물(예를들어, 인터넷 신문등)은 전체면의 피디에프(PDF) 화면만 제공하고 기사별 피디에프(PDF) 화면은 제공하지 않아 사용자들이 자신이 원하는 기사를 찾기위해서는 전체 면의 피디에프(PDF)에서 해당하는 기사를 일일이 찾아야하는 번거로움을 가지고 있었으며, 텍스트화된 기사만을 제공하고 있었다.In general, printed materials (eg, Internet newspapers) that provide information to users using the Internet provide only a full-page PDF screen and do not provide an article-specific PDF screen. In order to find the article he wanted, he had to find the corresponding article in the entire page (PDF) and provided only textual articles.

또한, 각 일간지에서 제공하는 인쇄물이외에 시중 인쇄물(예를들어 사내 일간지, 광고물, 홍보물등)들의 정보를 제공하지 못하였으며, 기사별 위치정보 또한 제공하지 않아 사용자가 일일이 해당하는 기사를 찾아야 하는 애로사항이 많았었다. In addition, it failed to provide information on commercial printed materials (for example, in-house daily newspapers, advertisements, and promotional materials) in addition to the prints provided by the daily newspapers, and also does not provide location information for each article, so users have to find a corresponding article. There were a lot of things.

본 발명은 상기의 문제점을 해결하기 위한 것으로, 인쇄물 전체면의 피디에프(PDF)를 제공할 뿐만아니라, 제 1 목적은 문서인식을 하여 기사 검색을 가능케 하며, 제 2 목적은 기사별로 피디에프(PDF)를 사용자에게 제공하는데 목적이 있으며 또한, 제 3 목적은 인쇄물 전체 피디에프(PDF)내에 각각의 기사별로 해당 위치및 크기를 가시적으로 제공하여 사용자가 기사의 중요성을 인식할 수 있게 하며, 이는 광고 및 홍보에 있어서도 비용이 차이가 나므로 이를 사용자가 인식할 수 있도록 하는데 목적을 가지며, 제 4 목적은 기사별로 스크랩할 수 있도록 하며 스크랩된 기사에 사용자 의견을 추가할 수 있도록 하는데 그 목적이 있다.The present invention is to solve the above problems, and provides not only the PDF (PDF) of the entire surface of the printed matter, but also the first object is to enable the article search by recognizing the document, the second object is the PDF) to the user, and the third purpose is to visually provide the location and size of each article in the entire printed document (PDF) so that the user can recognize the importance of the article. Costs are also different in advertisements and promotions so that the user can recognize them, and the fourth purpose is to enable scraps by articles and to add user opinions to scraped articles.

상기의 목적을 달성하기 위하여 본 발명인 인쇄물 위치정보 제공시스템은,In order to achieve the above object, the present inventors position information providing system,

사용자에게 인쇄물의 정보를 제공하는 시스템에 있어서,A system for providing information of a printed matter to a user,

신문 혹은 각종 소식지, 인쇄물을 스캔하여 피디에프 화일로 변환하는 문서스캔부와;A document scanning unit which scans newspapers or various newsletters and printed matters and converts them into PD F files;

스캔된 피디에프화일을 디스플레이 하면서 기사별로 전체 화면에서 분리하는 기사분리부와;An article separator configured to separate the image from the entire screen for each article while displaying the scanned PD file;

스캔된 피디에프화일을 기사별로 분리한 후 해당 면을 입력하는 면입력부와;A plane input unit for separating the scanned PD file by article and inputting a plane;

스캔된 피디에프 화일 전체 화면에서 기사별로 분리할 때 전체화면에서의 위치를 연산하여 자동으로 입력되는 위치정보입력부와;A position information input unit which automatically calculates a position on the full screen and separates the article from the scanned PD file in the entire screen;

기사별로 분리된 피디에프화일을 문서인식하고, 기사별로 문서인식된 것을 텍스트로 변환하여 생성하는 문서인식부와;A document recognition unit for recognizing document files separated by articles and converting documents recognized for each article into text;

문서인식되어 텍스트 화일로 변환된 데이터에서 키워드를 추출하는 키워드추출부와;A keyword extraction unit for extracting a keyword from data recognized and converted into a text file;

생성된 자료를 디비에 저장하는 디비저장부와;A DB storage unit for storing the generated data in a DB;

문서인식부에서 생성된 텍스트를 저장하는 텍스트디비와;A text DB for storing the text generated by the document recognition unit;

문서스캔부에서 생성된 피디에프 및 기사분리부에서 분리된 기사별 피디에프를 저장하는 피디에프디비와;PDFF for storing the PDF generated by the document scanning unit and the article-specific PDF separated in the article separating unit;

문서인식부에서 생성된 텍스트로부터 키워드를 생성하는 키워드 추출부에서 생성된 키워드를 저장하는 키워드디비와;A keyword DB for storing the keyword generated by the keyword extracting unit which generates a keyword from the text generated by the document recognition unit;

위치정보입력부에서 생성된 위치 정보 및 크기를 저장하는 위치정보디비와;A location information database for storing location information and size generated by the location information input unit;

사용자가 스크랩한 기사 혹은 전체면의 인덱스와 사용자의 의견을 저장하는 사용자스크랩디비와;A user scrap DB for storing an article or an entire index of the article scraped by the user and a user's opinion;

사용자가 신문 혹은 각종 소식지, 인쇄물을 확인하기 위한 사용자단말기와;A user terminal for the user to check newspapers or various newsletters and printed matters;

상기 사용자단말기의 입력창에 사용자가 입력한 키워드에 해당하는 기사를 검색하는 검색엔진과;A search engine for searching for an article corresponding to a keyword input by a user in an input window of the user terminal;

선택된 피디에프를 피디에프디비로부터 가져와 사용자단말기에 디스플레이하는 피디에프표시부와;A PD display unit which takes a selected PD from a PD TV and displays it on a user terminal;

선택된 기사의 위치정보를 사용자단말기의 위치정보창에 출력하는 위치정보출력부와;A location information output unit configured to output location information of the selected article to a location information window of a user terminal;

문서스캔부로부터 변환된 피디에프화일별로 목차를 제공하는 피디에프목차표시부와;A PD table of contents display unit which provides a table of contents for each PD file converted from the document scanning unit;

사용자가 원하는 피디에프목차표시부의 피디에프화일을 선택하는 목차클릭부와;A contents clicking portion for selecting a PD file of a desired PD table of contents display unit;

사용자가 스크랩한 기사 혹은 피디에프화일에 사용작의 의견을 입력하는 의견입력부;를 포함하여 구성되는 것을 특징으로 한다.And a comment input unit for inputting a comment of a user's work in an article or a PD file scraped by the user.

이하, 첨부된 도면을 참조하여 본 발명인 인쇄물 위치정보 제공시스템의 바람직한 실시예를 상세하게 설명한다.Hereinafter, with reference to the accompanying drawings will be described in detail a preferred embodiment of the present invention the print position information providing system.

도 1은 본 발명의 일실시예에 따른 인쇄물 위치정보 제공시스템의 전체 구성도이다.1 is an overall configuration diagram of a printed matter position information providing system according to an embodiment of the present invention.

도시된 바와 같이, 본 발명에 따른 인쇄물 위치정보 제공시스템은,As shown, the print position information providing system according to the present invention,

사용자에게 인쇄물의 정보를 제공하는 시스템에 있어서,A system for providing information of a printed matter to a user,

신문 혹은 각종 소식지, 인쇄물을 스캔하여 피디에프 화일로 변환하는 문서 스캔부(105)와;A document scanning unit 105 which scans newspapers or various newsletters and printed matters and converts them into PD F files;

스캔된 피디에프화일을 디스플레이 하면서 기사별로 전체 화면에서 분리하는 기사분리부(110)와;Article separation unit 110 for separating the article from the full screen by displaying the scanned PD file;

스캔된 피디에프화일을 기사별로 분리한 후 해당 면을 입력하는 면입력부(115)와;A plane input unit 115 for separating the scanned PD file into articles and inputting corresponding planes;

스캔된 피디에프 화일 전체 화면에서 기사별로 분리할 때 전체화면에서의 위치를 연산하여 자동으로 입력되는 위치정보입력부(120)와;A position information input unit 120 which automatically calculates a position on the full screen when the scanned PD file is separated for each article in the full screen;

기사별로 분리된 피디에프화일을 문서인식하고, 기사별로 문서인식된 것을 텍스트로 변환하여 생성하는 문서인식부(125)와;A document recognition unit 125 for recognizing a document separated by articles and generating a document by converting the document recognition for each article into text;

문서인식되어 텍스트 화일로 변환된 데이터에서 키워드를 추출하는 키워드추출부(130)와;A keyword extraction unit 130 for extracting a keyword from data recognized and converted into a text file;

생성된 자료를 디비에 저장하는 디비저장부(135)와;A DB storage unit 135 for storing the generated data in a DB;

문서인식부에서 생성된 텍스트를 저장하는 텍스트디비(140)와;A text DB 140 for storing text generated by the document recognition unit;

문서스캔부에서 생성된 피디에프 및 기사분리부에서 분리된 기사별 피디에프를 저장하는 피디에프디비(145)와;PD FT 145 for storing PD FP generated in the document scanning unit and the article-specific PD separated in the article separating unit;

문서인식부에서 생성된 텍스트로부터 키워드를 생성하는 키워드 추출부에서 생성된 키워드를 저장하는 키워드디비(150)와;A keyword DB 150 for storing the keyword generated by the keyword extracting unit that generates the keyword from the text generated by the document recognition unit;

위치정보입력부에서 생성된 위치 정보 및 크기를 저장하는 위치정보 디비(155)와;A location information DB 155 for storing location information and size generated by the location information input unit;

사용자가 스크랩한 기사 혹은 전체면의 인덱스와 사용자의 의견을 저장하는 사용자스크랩디비(160)와;A user scrap DB 160 for storing an index of the article or the whole surface of the user and the opinion of the user;

사용자가 신문 혹은 각종 소식지, 인쇄물을 확인하기 위한 사용자단말기(200)와;A user terminal 200 for the user to check newspapers or various newsletters and printed matters;

상기 사용자단말기(200)의 입력창에 사용자가 입력한 키워드에 해당하는 기사를 검색하는 검색엔진(165)과;A search engine 165 for searching for an article corresponding to a keyword input by a user in an input window of the user terminal 200;

선택된 피디에프를 피디에프디비로부터 가져와 사용자단말기에 디스플레이하는 피디에프표시부(175)와;A PD display unit 175 which displays the selected PD from the PD DVD and displays the same on the user terminal;

선택된 기사의 위치정보를 사용자단말기의 위치정보창에 출력하는 위치정보출력부(180)와;A location information output unit 180 for outputting location information of the selected article to a location information window of a user terminal;

문서스캔부로부터 변환된 피디에프화일별로 목차를 제공하는 피디에프목차표시부(185)와;A PD table of contents display unit 185 which provides a table of contents for each PD file converted from the document scanning unit;

사용자가 원하는 피디에프목차표시부의 피디에프화일을 선택하는 목차클릭부(170)와;A table of contents clicker 170 for selecting a PD file of a desired PD table of contents display unit;

사용자가 스크랩한 기사 혹은 피디에프화일에 사용작의 의견을 입력하는 의견입력부(190);를 포함하여 구성되는 것을 특징으로 한다.And a comment input unit 190 for inputting a comment of a user's work in a user scraped article or PD file.

상기 문서스캔부(105)는 신문 혹은 각종 소식지, 인쇄물등(예를들어 일간지, 주간지, 지역지, 사내지등)을 스캔장치를 통해 스캔한 화일을 피디에프 화일로 변환하는 기능을 수행한다.The document scanning unit 105 performs a function of converting a file scanned by a newspaper or various newsletters, printed matters (for example, daily papers, weekly papers, local papers, company papers, etc.) through a scanning device into a PD file.

상기 면입력부(115)는 스캔된 피디에프화일을 기사별로 분리한 후 해당 면을 입력하는 기능을 수행하는데 상기 스캔된 피디에프화일을 디스플레이 하면서 기사 별로 전체 화면에서 분리하는 기사분리부(110)를 통해 분리된 기사를 관리자가 직접 전체 스캔된 피디에프화일중 해당하는 면을 입력하게 되고 입력된 정보를 토대로 상기 위치정보입력부(120)를 통해 스캔된 피디에프 화일 전체 화면에서 기사별로 분리할 경우 전체화면에서의 위치를 연산하여 자동으로 위치정보를 입력하게 된다. 이때, 상기 위치정보입력부(120)를 통해 해당 기사의 크기 및 위치등을 사용자가 파악할 수 있어 해당 기사의 중요도를 용이하게 한 눈으로 파악할 수 있게 된다.The surface input unit 115 performs a function of inputting a corresponding surface after separating the scanned PD files by articles, and displaying the scanned PD files by separating the articles from the entire screen for each article. When the administrator separates the articles separated through the input directly into the corresponding page of the entire scanned PDF file, and separates by article on the entire screen of the PD file scanned through the location information input unit 120 based on the input information The location information is automatically entered by calculating the location on the screen. At this time, the user can grasp the size and location of the article through the location information input unit 120, so that it is possible to easily grasp the importance of the article.

예를들면, 조선일보 및 대전신문의 광고비가 다르듯이 각 면별로 그리고 위치별로 크기별로 광고비가 다르듯이 기사별 인쇄 정보의 위치와 크기에 따라 사용자가 기사의 중요성을 용이하게 파악할 수 있으며, 이는 인쇄 정보의 위치와 크기에 따라 자동 연산하여 그 가치를 금액으로 환산할 수 있는 가치금액환산부(미도시)를 더 포함하여 구성할 수 있다.For example, as the advertising costs of Chosun Ilbo and Daejeon Newspaper are different, the advertising costs of each side and location are different, so the user can easily grasp the importance of the article according to the location and size of the printing information of each article. It may be configured to further include a value amount conversion unit (not shown) that can be automatically calculated according to the location and size of the information to convert the value into an amount.

한편, 위치정보입력부(120)는 마우스를 드래그하여 영역을 설정함으로써 전체 기사로부터 개별기사의 상대 위치와 크기가 자동 연산되는데, 예를 들면 각 모서리 네점의 상대 좌표가 자동 연산되어 지게 된다.Meanwhile, the location information input unit 120 automatically calculates the relative position and size of individual articles from the entire article by setting a region by dragging a mouse. For example, the relative coordinates of four corners of each corner are automatically calculated.

상기 문서인식부(125)를 통해 기사별로 분리된 피디에프화일을 문서인식하고, 기사별로 문서인식된 것을 텍스트로 변환하여 생성하게 되는데, 이떼 사용되는 문서처리자동화기술은 인쇄체와 필기체 숫자, 영문, 한글등을 멀티 오씨알(구조적 OCR 및 통계적 OCR로 이루어짐) 방식을 사용하여 인식하므로 99%의 높은 인식률과 빠른 속도를 제공할 수 있어 사용자 지정에 따른 특성 인식이 가능하므로 사용자에 게 편리성을 제공할 수 있다.Through the document recognition unit 125 to recognize the document separated by the document PDF file, and to convert the document recognition by the article to the text to generate, the document processing automation technology used in the printed and handwritten numbers, English, It recognizes Hangul, etc. using multi-OCR (consisting of structured OCR and statistical OCR) method, so it can provide 99% high recognition rate and high speed, and it is convenient for users because it can recognize characteristics according to customization. can do.

좀 더 상세히 설명하자면, 형태 인식은 여러 종류의 양식을 자동인식 및 분류하는데 관리자에 의해 설정된 순서로 자동 분류 또는 입력자의 판단에 따라 첨부 문서를 분류하게 된다. 또한, 간지를 자동 인식하여 건별로 하나의 이미지 문건을 생성하여 인식된 결과중 불확실한 건이나 오작성된 양식을 오류 목록을 통해 확인 및 수정하며 각 이미지를 보면서도 인식된 결과 및 첨부물을 구분 및 수정한다.In more detail, shape recognition automatically recognizes and classifies various types of forms, and automatically classifies the attached documents according to the automatic classification or inputter's judgment in the order set by the administrator. In addition, it automatically recognizes slip sheets and creates one image document for each case to check and correct any unclear or incorrectly written form through an error list, and to classify and correct recognized results and attachments while viewing each image.

한편 형태 출력은 다양한 종류의 양식을 자동을 인식하고 반복되는 양식을 제거하여 필요한 정보만을 신속히 추출하며 오씨알(OCR) 및 아이씨알(ICR)의 정확도를 높이기 위해 데이터의 질을 향상시키게 된다. 이는 인식 대상의 위치나 오염에 상관없이 인식할 수 있도록 하는 모듈을 장착하고 있다.On the other hand, the form output automatically recognizes various types of forms, removes repeated forms, and extracts only the necessary information quickly, and improves data quality in order to increase the accuracy of OCR and ICR. It is equipped with a module that enables recognition regardless of the location or contamination of the object to be recognized.

상기 문서인식부(125)를 통해 인식된 문서를 키워드추출부(130)에서 텍스트 화일로 변환된 데이터의 키워드를 추출하게 된다.The keyword recognized by the document recognition unit 125 extracts a keyword of data converted into a text file by the keyword extraction unit 130.

상기 과정을 통해 생성된 자료를 디비저장부(135)를 통해 문서인식부에서 생성된 텍스트는 텍스트디비(140)에 문서스캔부에서 생성된 피디에프 및 기사분리부에서 분리된 기사별 피디에프를 피디에프디비(145)에 문서인식부에서 생성된 텍스트로부터 키워드를 생성하는 키워드 추출부에서 생성된 키워드를 키워드디비(150)에 위치정보입력부에서 생성된 위치 정보를 위치정보디비(155)에 사용자가 스크랩한 기사 혹은 전체면의 인덱스와 사용자의 의견을 사용자스크랩디비(160)에 각각 저장하게 된다. 상기에서 서술한 바와 같이 본 발명을 통해 신문 혹은 각종 소식지, 인쇄물(예를들어 일간지, 주간지, 지역지, 사내지등) 전체면의 피디에프(PDF) 를 제공할 뿐만아니라, 문서인식을 하여 기사별로 피디에프(PDF)를 사용자에게 제공할 수 있게 되는 것이다.The text generated by the document recognition unit through the DB storage unit 135 through the above-mentioned process is the text DIFF generated by the document scan unit and the article separation unit separated from the article separation unit in the text DB 140 The user of the keyword information generated by the keyword extracting unit that generates a keyword from the text generated by the document recognition unit in the PD DB 145 to the keyword DB 150 and the location information generated by the location information input unit to the location information DB 155. The scraps of the article or the entire surface and the user's comments are stored in the user scrap DB (160), respectively. As described above, the present invention not only provides a PDF or the like on the entire surface of a newspaper or various newsletters and printed matters (for example, daily, weekly, regional, corporate, etc.), but also recognizes articles. It will be able to provide users with PDF (PDF).

다음은 사용자가 사용자단말기(200)를 통해 찾고자 하는 기사를 클릭할 경우에 작용을 설명하고자 한다.The following will describe the action when the user clicks on the article to be found through the user terminal 200.

사용자가 사용자단말기(200)를 통해 해당 키워드를 입력하여 본 발명인 인쇄물 위치정보 제공시스템에 접근하여 사용자가 원하는 피디에프목차표시부의 피디에프화일을 선택하게 되면 상기 검색엔진(165)를 통해 사용자가 입력한 키워드에 해당하는 기사를 검색하게 된다. 상기 검색엔진을 통해 검색된 기사를 사용자가 알아보기 쉽게 피디에프표시부(175)에서 선택된 피디에프를 피디에프디비로부터 가져와 사용자단말기에 디스플레이하며, 위치정보출력부(180)에서 선택된 기사의 위치정보를 사용자단말기의 위치정보창에 출력하게 되어 사용자는 본인이 입력한 기사의 중요도를 한눈에 식별할 수 있게 되어 상기 기사의 신빙성 및 중요성을 인식할 수 있게 된다.When the user inputs the corresponding keyword through the user terminal 200 to access the system for providing the print position information of the present invention and selects the desired PD file of the PD table of contents display unit, the user inputs through the search engine 165. Search for articles that match a keyword. To retrieve the articles searched through the search engine so that the user can easily recognize the PD F display from the PD display unit 175 to display on the user terminal, the location information of the article selected by the location information output unit 180 to the user Output to the location information window of the terminal, the user can identify the importance of the article entered by the user at a glance can recognize the reliability and importance of the article.

도 2는 본 발명의 일실시예에 따른 인쇄물 위치정보 제공시스템의 검색엔진의 링크를 나타낸 예시도이다.2 is an exemplary view showing a link of a search engine of a system for providing print position information according to an embodiment of the present invention.

도2에 도시한 바와 같이, 검색엔진을 통해 사용자가 입력한 요청키워드에 해당하는 사이트의 위치정보 및 내용정보를 안내해주게 되며 이때 해당하는 키워드를 사용자가 선택하게 되면 해당 언론사 피디에프 및 아이피큐(IPQ) 서비스를 하는 페이지로 완전 이동하게 된다. 그러면, 해당하는 키워드를 확인하기 위해서 사용자는 직접 자기 아이디로 접속하여 해당 페이지에서 파일을 다운로드할 수 있으며, 스크 랩 또한 할 수 있게 된다.As shown in Figure 2, through the search engine guides the location information and content information of the site corresponding to the request keyword entered by the user, and when the user selects the corresponding keywords, the corresponding media companies PD and IP ( You will be redirected to the page that provides the IPQ) service. Then, in order to check the corresponding keyword, the user can directly access the user's ID, download the file from the page, and can also scrap.

도 3은 본 발명의 일실시예에 따른 인쇄물 위치정보 제공시스템이 사용자에게 서비스되는 예시도이다.3 is an exemplary view in which a system for providing print position information according to an embodiment of the present invention is serviced to a user.

도 4는 본 발명의 일실시예에 따른 사용자가 특정 기사를 클릭할 경우에 해당하는 기사를 화면에 나타낸 예시도이다.4 is an exemplary diagram showing an article corresponding to a case where a user clicks a specific article according to an embodiment of the present invention.

도3에 도시한 바와 같이, 예를들어 설명하자면 언론사에서 해당하는 피디에프 파일을 본 발명인 인쇄물 위치정보 제공시스템에 전송한 화면을 나타낸 것이다.As shown in FIG. 3, for example, a screen in which a media company transmits a corresponding PD file to the present inventors position information providing system is shown.

이때, 언론사에서 직접 스캔장치를 통해 스캔한 피디에프화일을 의미하고 있지만 일반 일간지, 주간지, 지역지 이외의 사내홍보지 혹은 기타 유용한 인쇄물 그대로 인수할 경우에는 상기 문서스캔부(105)를 통해 스캔을 하게 된다. 이하 진행과정은 상기에서 자세히 설명하였으므로 이에 대한 설명은 생략하기로 한다.In this case, the media company means a PD file scanned through a direct scanning device, but when the company takes over a general daily paper, weekly paper, local promotional paper or other useful printed material as it is, the document scanning unit 105 scans the document. do. Since the following process has been described in detail above, a description thereof will be omitted.

예를 들어 설명하자면, 사용자가 도3에 도시한 가판 피디에프 화일 11면 국제 기사를 클릭할 경우에 도4에 도시한 바와 같이 좌측에 해당 기사의 표지를 표시하고 우측 상단에 해당하는 분류체계를 표시하므로 사용자는 이를 확인할 수 있게 된다. 이때, 사용자가 해당하는 기사를 보관하고 싶으면 스크랩 툴(미도시)를 통해 해당기사를 스크랩하게 된다. 또한, 사용자가 상기 기사에 대한 개인의 의견을 서술하고 싶을 경우에 하단의 의견란에 사용자의 의견을 기재할 수 있도록 하였다.For example, if the user clicks the international newsletter page 11 of FIG. 3, the cover of the article is displayed on the left side as shown in FIG. So that the user can see it. In this case, if the user wants to keep the corresponding article, the corresponding article is scrapped through a scrap tool (not shown). In addition, when a user wants to describe an individual's opinion on the article, the user's opinion can be described in the comment field below.

상기와 같은 구성을 통해 사용자는 시중에서 제공하고 있지 않은 인쇄물 정보를 쉽게 확인할 수 있고 사용자가 관심있어 하는 분야의 중요 기사들을 스크랩하여 의견을 기재할 수 있게 된다.Through the above configuration, the user can easily check printed information that is not provided on the market, and can write comments by scraping important articles in a field of interest to the user.

상기 도면에는 서술되어 있지는 않지만 본 발명인 인쇄물 위치정보 제공시스템의 사용자 요청 키워드별 해당자료의 분류는 검색엔진(165)를 통해 검색된 피디에프 화일을 디비저장부(135)를 통해 각각의 디비에서 해당 키워드 내용을 검색하게 된다. 이때 해당하는 요청 키워드의 자료를 분류하여 사용자에게 요청 키워드가 포함된 전체지면을 보여주게 되고, 사용자 단말기에 자체 사용자 스크랩 프로세스를 이용하여 사용자가 요청한 기사 스크랩을 확인할 수 있게 된다.Although not described in the drawings, the classification of the corresponding data for each user request keyword of the present inventors' location information providing system includes a corresponding keyword in each DB through the DB storage unit 135. The content will be searched. At this time, by classifying the data of the corresponding request keyword to show the user the entire surface including the request keyword, it is possible to check the article scrap requested by the user using the user scrap process on the user terminal.

따라서, 상기와 같이 구성함으로써, 인쇄물 전체면의 피디에프(PDF)를 제공할 뿐만아니라, 문서인식을 하여 기사별로 피디에프(PDF)를 사용자에게 제공할 수 있게 된다.Therefore, by configuring as described above, it is possible not only to provide PD (PDF) of the entire printed matter, but also to recognize the document and provide the PD (PDF) for each article.

또한, 인쇄물 전체 피디에프(PDF)내에 각각의 기사별로 해당 위치를 제공하게 되며 기사별로 사용자의 의견을 기재하여 스크랩할 수 있게 된다.In addition, the entire position of each article in the PDF (PDF) of the printed matter will be provided and the user's opinions for each article can be scrapped.

도 5는 본 발명의 일실시예에 따른 전체 기사내 기사 분리 및 개별 기사를 디스플레이한 화면을 나타낸 도면이다.FIG. 5 is a diagram illustrating a screen displaying article separation and individual articles within an entire article according to an embodiment of the present invention.

도 5에 도시한 바와 같이, 전체 기사에서 해당 기사를 분리한 도면을 나타낸 것이고, 도 5는 사용자의 사용자 단말기에 개별기사가 디스플레이되는 화면을 나타낸 도면으로 도 5에 나타나듯이 사용자가 선택한 개별기사가 디스플레이되고 위치정보창에 해당 기사가 전체 기사중 해당하는 위치를 표시하게 된다. 상기와 같이 표시함으로써 사용자는 해당 기사의 위치 및 비중도를 용이하게 파악할 수 있게 된다.As shown in FIG. 5, the entire article is separated from the corresponding article, and FIG. 5 is a diagram illustrating a screen on which an individual article is displayed on a user's user terminal. The article is displayed and the location information window displays the corresponding position among all the articles. By displaying as described above, the user can easily grasp the position and specific gravity of the article.

이상에서와 같은 내용의 본 발명이 속하는 기술분야의 당업자는 본 발명의 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시된 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. Those skilled in the art to which the present invention pertains as described above may understand that the present invention may be implemented in other specific forms without changing the technical spirit or essential features of the present invention. Therefore, the above-described embodiments are to be understood as illustrative in all respects and not restrictive.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구 범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the invention is indicated by the following claims rather than the above description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be construed as being included in the scope of the invention. do.

본 발명은 인쇄물 위치정보 제공시스템으로, 쉽게 각종 인쇄물을 사용자가 접할 수 있게 되며 각 기사별로 기사 크기 및 위치를 제공하여 사용자가 기사의 중요성을 인지할 수 있는 효과를 제공하며 광고 및 홍보 효과를 인지하기에 편리성을제공하는 효과가 있다. 또한, 찾고자 하는 검색어를 입력하여 전체 혹은 기사별 피디에프를 볼 수 있고 사용자가 원하는 기사를 스크랩하고 의견을 남길 수 있어 사용자에게 편리성을 제공하는 효과가 있다.The present invention is a print position information providing system, users can easily access a variety of printed matters by providing the article size and location for each article provides the effect that the user can recognize the importance of the article and recognize the advertising and promotional effect There is an effect of providing convenience. In addition, it is possible to view the entire or article by PD by entering a search term to find, and the user can scrap the desired article and leave comments to provide convenience to the user.

Claims (5)

사용자에게 인쇄물의 정보를 제공하는 시스템에 있어서,A system for providing information of a printed matter to a user, 신문 혹은 각종 소식지, 인쇄물을 스캔하여 피디에프 화일로 변환하는 문서스캔부(105)와;A document scanning unit 105 which scans newspapers or various newsletters and printed matters and converts them into PD F files; 스캔된 피디에프화일을 디스플레이 하면서 기사별로 전체 화면에서 분리하는 기사분리부(110)와;Article separation unit 110 for separating the article from the full screen by displaying the scanned PD file; 스캔된 피디에프화일을 기사별로 분리한 후 해당 면을 입력하는 면입력부(115)와;A plane input unit 115 for separating the scanned PD file into articles and inputting corresponding planes; 스캔된 피디에프 화일 전체 화면에서 기사별로 분리할 때 전체 화면에서의 위치를 연산하여 자동으로 입력되는 위치정보입력부(120)와;A location information input unit 120 that automatically calculates a location on the full screen when the scanned PD file is separated for each article in the full screen; 기사별로 분리된 피디에프화일을 문서인식하고, 기사별로 문서인식된 것을 텍스트로 변환하여 생성하는 문서인식부(125)와;A document recognition unit 125 for recognizing a document separated by articles and generating a document by converting the document recognition for each article into text; 문서인식되어 텍스트 화일로 변환된 데이터에서 키워드를 추출하는 키워드추출부(130)와;A keyword extraction unit 130 for extracting a keyword from data recognized and converted into a text file; 생성된 자료를 디비에 저장하는 디비저장부(135)와;A DB storage unit 135 for storing the generated data in a DB; 문서인식부에서 생성된 텍스트를 저장하는 텍스트디비(140)와;A text DB 140 for storing text generated by the document recognition unit; 문서스캔부에서 생성된 피디에프 및 기사분리부에서 분리된 기사별 피디에프를 저장하는 피디에프디비(145)와;PD FT 145 for storing PD FP generated in the document scanning unit and the article-specific PD separated in the article separating unit; 문서인식부에서 생성된 텍스트로부터 키워드를 생성하는 키워드 추출부에서 생성된 키워드를 저장하는 키워드디비(150)와;A keyword DB 150 for storing the keyword generated by the keyword extracting unit that generates the keyword from the text generated by the document recognition unit; 위치정보입력부에서 생성된 위치 정보 및 크기를 저장하는 위치정보 디비(155)와;A location information DB 155 for storing location information and size generated by the location information input unit; 사용자가 스크랩한 기사 혹은 전체면의 인덱스와 사용자의 의견을 저장하는 사용자스크랩디비(160)와;A user scrap DB 160 for storing an index of the article or the whole surface of the user and the opinion of the user; 사용자가 신문 혹은 각종 소식지, 인쇄물을 확인하기 위한 사용자단말기(200)와;A user terminal 200 for the user to check newspapers or various newsletters and printed matters; 상기 사용자단말기(200)의 입력창에 사용자가 입력한 키워드에 해당하는 기사를 검색하는 검색엔진(165)과;A search engine 165 for searching for an article corresponding to a keyword input by a user in an input window of the user terminal 200; 선택된 피디에프를 피디에프디비로부터 가져와 사용자단말기에 디스플레이하는 피디에프표시부(175)와;A PD display unit 175 which displays the selected PD from the PD DVD and displays the same on the user terminal; 선택된 기사의 위치정보를 사용자단말기의 위치정보창에 출력하는 위치정보출력부(180)와;A location information output unit 180 for outputting location information of the selected article to a location information window of a user terminal; 문서스캔부로부터 변환된 피디에프화일별로 목차를 제공하는 피디에프목차표시부(185)와;A PD table of contents display unit 185 which provides a table of contents for each PD file converted from the document scanning unit; 사용자가 원하는 피디에프목차표시부의 피디에프화일을 선택하는 목차클릭부(170)와;A table of contents clicker 170 for selecting a PD file of a desired PD table of contents display unit; 사용자가 스크랩한 기사 혹은 피디에프화일에 사용작의 의견을 입력하는 의견입력부(190);를 포함하여 구성되는 것을 특징으로 하는 인쇄물 위치정보 제공시스템.Print position information providing system, characterized in that it comprises a; input unit 190 for inputting the opinion of the work to the user scraped articles or PD file. 제1항에 있어서,The method of claim 1, 상기 문서인식부(125)는,The document recognition unit 125, 인쇄체와 필기체 숫자, 영문, 한글등을 멀티 오씨알(구조적 OCR 및 통계적 OCR로 이루어짐) 방식을 사용하여 인식하는 것을 특징으로 하는 인쇄물 위치정보 제공시스템.Printed position information providing system, characterized in that the recognition using a multi-OCR (consisting of structural OCR and statistical OCR) method, such as printed and handwritten numerals, English, Korean. 제1항에 있어서,The method of claim 1, 상기 문서인식부(125)는,The document recognition unit 125, 오씨알(OCR) 및 아이씨알(ICR)의 정확도를 높이고 인식 대상의 위치나 오염에 상관없이 인식할 수 있는 인식모듈을 포함하고 있는 것을 특징으로 하는 인쇄물 위치정보 제공시스템.A system for providing printed matter location information, comprising: a recognition module for improving accuracy of OCR and ICR and recognizing the object regardless of the position or contamination of the object. 제1항에 있어서,The method of claim 1, 상기 선택된 기사의 위치정보를 사용자단말기의 위치정보창에 출력하는 위치정보출력부(180)를 통해 사용자가 기사별 중요 비중을 확인할 수 있는 것을 특징으로 하는 인쇄물 위치정보 제공시스템.Printed position information providing system, characterized in that the user can check the importance of each article through the position information output unit 180 for outputting the position information of the selected article to the location information window of the user terminal. 제1항에 있어서,The method of claim 1, 상기 위치정보입력부(120)는,The location information input unit 120, 사용자가 마우스를 드래그하여 영역을 설정하면 전체 기사로부터 개별기사의 상대 위치와 크기가 자동 연산되는 것을 특징으로 하는 인쇄물 위치정보 제공시스템.Printed position information providing system, characterized in that the relative position and size of the individual article is automatically calculated from the entire article when the user sets the area by dragging the mouse.
KR1020050037723A 2005-05-04 2005-05-04 Location-Information Offer System of Printed Matter KR100715320B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050037723A KR100715320B1 (en) 2005-05-04 2005-05-04 Location-Information Offer System of Printed Matter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050037723A KR100715320B1 (en) 2005-05-04 2005-05-04 Location-Information Offer System of Printed Matter

Publications (2)

Publication Number Publication Date
KR20060115262A true KR20060115262A (en) 2006-11-08
KR100715320B1 KR100715320B1 (en) 2007-05-08

Family

ID=37652765

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050037723A KR100715320B1 (en) 2005-05-04 2005-05-04 Location-Information Offer System of Printed Matter

Country Status (1)

Country Link
KR (1) KR100715320B1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100867199B1 (en) * 2008-03-11 2008-11-06 유니닥스주식회사 Pdf-based scraping and publishing system with user orientation
KR100869781B1 (en) * 2008-03-26 2008-11-21 유니닥스주식회사 Method for providing object contents embodied utilizing bidirectional communication and computer readable media stored thereon computer executable instruction for performing the method
EP2105855A3 (en) * 2008-03-27 2010-07-21 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method
US8032524B2 (en) 2008-03-27 2011-10-04 Brother Kogyo Kabushiki Kaisha Content management system and content management method
KR20120036048A (en) * 2010-10-07 2012-04-17 엘지전자 주식회사 Electronic device and control method for electronic device
KR20200058026A (en) * 2018-11-19 2020-05-27 한국기술교육대학교 산학협력단 Operating methed in electronic device for kanji study using agumented reality

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101693464B1 (en) 2016-03-29 2017-01-06 주식회사 에이엠아이시스템즈 System for managing article news

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100867199B1 (en) * 2008-03-11 2008-11-06 유니닥스주식회사 Pdf-based scraping and publishing system with user orientation
KR100869781B1 (en) * 2008-03-26 2008-11-21 유니닥스주식회사 Method for providing object contents embodied utilizing bidirectional communication and computer readable media stored thereon computer executable instruction for performing the method
EP2105855A3 (en) * 2008-03-27 2010-07-21 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method
US8032524B2 (en) 2008-03-27 2011-10-04 Brother Kogyo Kabushiki Kaisha Content management system and content management method
US8239360B2 (en) 2008-03-27 2012-08-07 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method
US8694484B2 (en) 2008-03-27 2014-04-08 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method
KR20120036048A (en) * 2010-10-07 2012-04-17 엘지전자 주식회사 Electronic device and control method for electronic device
KR20200058026A (en) * 2018-11-19 2020-05-27 한국기술교육대학교 산학협력단 Operating methed in electronic device for kanji study using agumented reality

Also Published As

Publication number Publication date
KR100715320B1 (en) 2007-05-08

Similar Documents

Publication Publication Date Title
KR100715320B1 (en) Location-Information Offer System of Printed Matter
US5903904A (en) Iconic paper for alphabetic, japanese and graphic documents
US8726178B2 (en) Device, method, and computer program product for information retrieval
US9552516B2 (en) Document information extraction using geometric models
JP5699623B2 (en) Image processing apparatus, image processing system, image processing method, and program
US7672940B2 (en) Processing an electronic document for information extraction
US7689037B2 (en) System and method for identifying and labeling fields of text associated with scanned business documents
JP3298676B2 (en) How to access perceivable information segments
JP5181886B2 (en) Electronic document search method, search system, and computer program
JP5095534B2 (en) System and method for generating a junction
EP1109125A2 (en) System for heuristically organizing scanned information
EP1675376A1 (en) Document separator pages
CN101178725A (en) Device, method, and computer program product for information retrieval
JP2008234658A (en) Course-to-fine navigation through whole paginated documents retrieved by text search engine
JP2001126026A (en) Information input device
US20080218812A1 (en) Metadata image processing
US20070116362A1 (en) Method and device for the structural analysis of a document
CN108197119A (en) The archives of paper quality digitizing solution of knowledge based collection of illustrative plates
US20090276411A1 (en) Issue trend analysis system
US20210064863A1 (en) Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program
CN112464907A (en) Document processing system and method
Lii et al. Location of name and address on fax cover pages
CN113806368A (en) System and method for identifying document and automatically establishing database
JP2007011683A (en) Document management support device
JP3841318B2 (en) Icon generation method, document search method, and document server

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130228

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140226

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150210

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180221

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20190411

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20200310

Year of fee payment: 14