KR100196980B1 - 표 데이터의 자르기와 붙이기 방법 및 데이터 처리 시스템 - Google Patents

표 데이터의 자르기와 붙이기 방법 및 데이터 처리 시스템 Download PDF

Info

Publication number
KR100196980B1
KR100196980B1 KR1019950030174A KR19950030174A KR100196980B1 KR 100196980 B1 KR100196980 B1 KR 100196980B1 KR 1019950030174 A KR1019950030174 A KR 1019950030174A KR 19950030174 A KR19950030174 A KR 19950030174A KR 100196980 B1 KR100196980 B1 KR 100196980B1
Authority
KR
South Korea
Prior art keywords
data
uniform
input data
data blocks
columns
Prior art date
Application number
KR1019950030174A
Other languages
English (en)
Other versions
KR960011773A (ko
Inventor
아끼오 야마시따
유끼 히라야마
Original Assignee
포만 제프리 엘
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포만 제프리 엘, 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 포만 제프리 엘
Publication of KR960011773A publication Critical patent/KR960011773A/ko
Application granted granted Critical
Publication of KR100196980B1 publication Critical patent/KR100196980B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Document Processing Apparatus (AREA)
  • Character Input (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)
  • Digital Computer Display Output (AREA)

Abstract

문서 편집 프로그램에 있어서 표 형식으로 나열되며 어떻게도 형상화 되어 있지 않은 텍스트 표시 데이터를 통상의 셀 데이터로서 스프레드시트 프로그램의 표 영역에 붙일 수 있도록 한다.
자르기와 붙이기로 되는 문서편집 프로그램의 측에서 클립보드로 보내며, 혹은 DDE 에 의해 스프레드시트 프로그램에 전송되는 데이터를 가공하는 표 형식 데이터 변환 수단을 설치하는 것에 의해 상기 목적이 달성된다. 표 형식 데이터 변환 수단은 문서편집 프로그램의 표의 틀선 정보나 열 사이에 존재하는 공백등을 검출하는 것에 의해 CSV 등의 표구조를 반영하는 형식으로 데이터를 변환한다.

Description

표 데이터의 자르기와 붙이기 방법 및 데이터 처리 시스템
제1도는 본발명이 실행되는 하드웨어 구성을 도시하는 도면.
제2도는 본 발명의 처리 유닛(processing unit)을 도시하는 블럭도.
제3a도 내지 제3d도는 본 발명에 따라, 광학적 문자 인식장치(OCR: optical character reader)의 뷰어(viewer)로부터 스프레드시트 프로그램으포 표를 잘라서 붙이는 모습을 도시하는 도면.
제4도는 본 발명의 처리(processing)를 도시하는 순서도.
제5도는 워드프로세서 또는 텍스트 에디터 중의 표를 틀선 정보(ruled line information)에 따라서 해석하는 처리의 순서도.
제6도는 표의 자르기와 붙이기를 행하기 전의 광학적 문자 인식장치(OCR)의 뷰어와 스프레드시트 프로그램의 화면의 예를 도시하는 도면.
제7도는 표의 자르기와 붙이기를 행한 후의 광학적 문자 인식장치(OCR)의 뷰어의 화면과 스프레드시트 프로그램의 화면의 예를 도시하는 도면.
제8도는 워드프로세서 또는 텍스트 에디터에 있어서의 틀선을 포함하는 표의 예를 도시하는 도면.
제9도는 틀선에 기초하여 가상 격자 영역(imaginary lattice region)을 도시하는 도면.
제10도는 표내의 격자 셀과 실제데이터사이의 대응 관계를 도시하는 도면.
제11도는 표내의 CSV 형식(Comma Separated Value format)내의 변환 데이터를 도시하는 도면.
제12도는 스프레드 시트 프로그램상에 표가 붙여진 상태를 도시하는 도면.
제13도는 틀선 데이터에 의존하지 않는 표-구조 데이터(table-structure data) 해석 방법을 설명하는데 사용되는 도면.
제14도는 틀선 데이터에 의존하지 않는 표-구조 데이터 해석 방법을 설명하는데 사용되는 화면도.
제15도는 틀선 정보에 의존하지 않는 표-구조 데이터 해석 방법을 설명하는데 사용되는 도면.
제16도는 틀선 정보에 의존하지 않는 표-구조 데이터 해석 방법을 설명하는데 사용되는 도면.
제17도는 틀선 정보에 의존하지 않는 표-구조 데이터 해석 방법을 설명하는데 사용되는 도면.
제18도는 틀선 정보에 의존하지 않는 표-구조 데이터 해석 방법을 설명하는데 사용되는 도면.
제19도는 틀선 정보에 의존하지 않는 표-구조 데이터 해석 방법을 설명하는데 사용되는 도면.
제20도는 틀선 정보에 의존하지 않는 표-구조 데이터 해석 방법을 설명하는데 사용되는 도면.
* 도면의 주요부분에 대한 부호의 설명
1002 : 시스템 장치 1004 : 키보드
1006 : 디스플레이 유닛 1008 : 마우스
1010 : 이미지 스캐너 2001 : 광학적 문자 인식 장치(OCR)
[본 발명이 속하는 기술분야]
본 발명은 컴퓨터의 멀티-윈도우 환경(multi-window environment)에서 동작하는 워드프로세서 프로그램(wordprocessor program)이나, 스프레드시트 프로그램(spreadsheet program)등의 응용 프로그램(application program) 사이에서 문서나 데이터를 자르기 및 붙이기(cut and paste)하는 기술에 관한 것이다.
[종래의 기술]
PC(personal computer)가 등장한 초기에는 CPU(central processing unit) 성능이 떨어지고 주기억 용량이 제한되어서, 오퍼레이팅 시스템(operating system)은 싱글 태스크(single task)만 수행할 수 있었고, 따라서 개인용 컴퓨터는 워드프로세서나 텍스트 에디터(text editor) 혹은 스프레드시트 프로그램 중에서 한번에 하나의 응용 프로그램만을 실행할 수 있었다.
그럼에도 불구하고 어떤 경우에는, 워드프로세서로 일단 작성된 문서를 스프레드시트 프로그램으로 판독하거나, 반대로 스프레드시트 프로그램에서 작성한 표를 워드프로세서에서 이용할 필요가 생겼다. 이것은 매우 번거러운 조작에 의해 겨우 수행되었다. 즉, 워드프로세서 또는 워드프로세서의 프로그램의 특정 기능을 액세스하여서 범위가 지정된 표의 영역이나 문서에 텍스트-포맷 데이터(text-format data)로서 화일명을 부여하여 디스크에 기록한 다음, 일단 그 프로그램을 종료한 후, 별도의 프로그램을 기동하여 디스크에 격납되어 있는 텍스트 화일의 화일명을 지정하는 것에 의해, 기동한 프로그램으로 문서 또는 표의 데이터를 인출한다는 것이다.
그러나, 비교적 최근에 와서 CPU의 성능이 향상되고 CPU의 어드레스 공간이 증대되었으며 또한 저렴한 반도체 메모리 및 대용량 하드 디스크가 이용가능하게 되면서, OS/2(IBM 의 상표)나 윈도우즈(마이크로 소프트의 상표)등과 같이 멀티-태스크(multi-task) 및 멀티 윈도우 시스템(multi-window system)을 지원하는 오퍼레이팅 시스템이 개발되어 널리 사용되고 있다.
이러한 오퍼레이팅 시스템하에서는, 예를 들어 하나의 윈도우에서 워드프로세서를 사용하면서 동시에 다른 윈도우에서 스프레드시트 프로그램을 사용할 수 있을 뿐만 아니라, 클립보드(clipboard)라고 불리는 공유의 기억 영역을 이용하여 하나의 응용 프로그램으로부터 다른 응용 프로그램으로 데이터를 자르기 및 붙이기하는 것이 가능하다.
상기는 구체적으로는 다음과 같이 행하여진다. 즉, 우선 하나의 응용 프로그램의 윈도우를 활성화하여 마우스등의 포인팅 디바이스로 직사각형 영역 범위를 지정한 다음, 메뉴 바에서 편집 메뉴를 풀다운 시켜서 복사(copy) 또는 자르기(cut)를 선택한다. 이제 범위 지정한 영역의 데이터(엑스트(text) 또는 비트 맵(bit map))는 일단 클립보드에 기억된다.
다음, 다른 응용 프로그램의 윈도우를 활성화하여 커서를 원하는 위치로 이동하고, 메뉴 바로부터 편집 메뉴를 풀 다운 시켜 붙이기(paste)를 선택한다. 이제, 클립보드내에 기억되어 있는 텍스트 또는 비트 맵의 데이터는 커서 위치에 붙여진다.
이와 같은 인터페이스는, 응용 프로그램 고유의 데이터 형식에 관계없이 화면으로 본 그대로의 텍스트 데이터 또는 비트 맵 데이터가 클립보드를 경유하여 다른 응용 프로그램의 윈도우상에 붙여질 수 있다는 점에서 유리하다. 예를 들면, TIFF 형식(Tagged Image File Format)의 이미지 화일을 편집하고 있는 이미지 에디터로부터 이미지 붙이기 기능을 갖는 워드프로세서의 소정 위치에 이미지의 일부를 붙이는 일이 가능하며, 이 경우 붙여지는 측의 워드프로세서가 TIFF(Tagged Image File Format)의 이미지 형식을 지원하는지의 여부는 문제가 되지 않는다.
그런데, 리포트 등을 작성하기 위해 기존의 인쇄된 문서에 기재되어 있는 표를 워드프로세서 등으로 판독하고자 하는 경우가 자주 생기지만, 그와 같은 문서가 전자적 형식으로 어딘가에 기억되어 있다는 상황은 매우 행운이며, 문서가 일반적인 잡지인 경우에는 그와 같은 가능성은 없다.
일본 특허 공개 공보 평 4-278634 호에 의하면, 인쇄된 문서를 스캐너(scanner)에 의해 이미지 화일로 변환하여, 레이아웃 정보를 반영하도록 문서 인식을 행하는 기술이 제공되며, 이와 같은 기술에 따르면 인쇄된 순서로부터 원래 문서의 표, 문단등을 유지하면서 전자화된 화일을 얻는 것이 가능하다.
또한, 일본 특허 공개 공보 평 2-58970 호는 호스트 컴퓨터로부터의 화상과 스캐너로 판독한 화상을 임의로 이동하고, 자르고, 합성하여 화상 출력하는 것을 개시한다.
게다가, 일본 특허 공개 공보 평 2-301860호는 문장 입력 수단과 화상 입력 수단등을 구비하고 화상 메모리에는 입력한 화상 데이터가 기억되며, 화상 메모리에서의 화상 데이터의 기억을 마스킹하는 마스킹 수단과 화상 메모리상의 문장 전개 위치를 지정하는 지정수단과 문장 데이터에 대응하는 각 문자 패턴을 화상 메모리의 문자 전개 위치에 전개하는 전개 수단을 구비한 것을 개시한다.
이와 같은 종래기술에 의하면, 인쇄된 문서로부터 얻은 뷰어(viewer)상의 화상 이미지와 문자 데이터를 자르기 및 붙이기(cut and paste) 등의 기술을 구사하여 조합시켜 원하는 레이아웃으로 전자적으로 문서를 작성하는 일이 가능하다.
한편, 많은 기업에서의 주요한 업무인 재무관리나 영업관리 등의 분야에 주목하면 스프레드시트(표 계산) 프로그램이 자주 이용되고 있다. 그렇지만, 상기 종래 기술에 의해 잘라서 붙여지는 데이터는 이미지 데이터이기 때문에 스프레드시트 프로그램에 대해서는 통상의 셀 데이터로서 표에 붙여질 수 없으며, 기껏해야 스프레드 시트 프로그램에 의해 표시되는 파이 도표(pie chart)의 장식용으로 붙이는 정도의 목적 밖에 이룰 수 없다. 따라서, 표 형식의 이미지가 이미 작성되어 있으면서도, 스프레드시트 프로그램에 데이터를 입력하기 위해서는 표를 보면서 수작업으로 문자를 입력하여야 하는 비능률적인 처리를 행해야만 한다.
그러나, 이것은 잘라서 붙여지는 데이터가 비트맵 이미지이기 때문에 초래되는 그런 특유의 곤란은 아니다. 예들 들면, 표 형식으로 쓰여져 있는 장소를 통상의 워드프로세서 프로그램으로 자르기 및 붙이기를 하면 통상 클립 보드에는 텍스트 데이터가 기억된다. 그렇지만, 그것을 스프레드시트 프로그램에 대하여 붙이면 1개의 셀에 원래 문서의 1개의 행 전체가 기억되어 버려서, 숫자들이 세로로 배열된 장소가 있어도 이 숫자의 열에 기초하여 평균치를 계산하거나 막대 그래프를 그리거나 하는 것은 불가능하다.
[발명이 해결하려는 과제]
본 발명의 목적은 광학적 문자 인식장치(OCR: optical character reader)에서 판독한 표 데이터를 통상의 셀 데이터(cell data)로서 스프레드시트 프로그램의 표 영역에 붙이는 것을 가능케 하는 방법 및 시스템을 제공하는 것이다.
본 발명의 또다른 목적은, 표 형식으로 배열되고 조금도 형식화되어 있지 않은 텍스트 표시 데이터를, 통상의 셀 데이터로서 스프레드시트 프로그램의 표 영역에 붙이는 것을 가능케 할 수 있는 방법 및 시스템을 제공하는 것이다.
[과제를 해결하기 위한 수단]
본 발명에 따라서, 클립보드로 보내지거나 혹은 동적 데이터 전송(DDE:dynamic data exchange)에 의해 타겟 프로그램(target program)에 직접 전송되는 데이터를 처리하는 메카니즘을, 잘라서 붙여지는 응용 프로그램측에 제공하는 것에 의해 상기 목적이 달성된다.
즉, 잘라서 붙여지는 응용 프로그램이 광학적 문자 인식장치(OCR)의 인식 결과의 뷰어인 경우, 인식 결과를 태그가 부착된 텍스트(tagged text)로 유지하도록 응용 프로그램을 구성한다. 여기에서 말하는 태그란 문자 데이터 자체를 나타내는 것이 아니라, 예를 들면 인식한 표 레이아웃에서의 표의 크기, 높이, 시작점의 좌표등을, 예를 들어 「\」 로 시작하는, 특수 기호로 나타낸 것이다. 따라서, 잘라서 붙여지는 범위가 마우스의 끌기(drag) 조작 등에 의해 지정된 경우, 유지되어 있는 태그가 부착 된 텍스트 중의 좌표 데이터 등을 참조하는 것에 의해 태그가 부착된 텍스트 중의 어느 부분이 범위 지정되어 있는지를 계산할 수 있다. 이렇게 하여 태그가 부착된 텍스트의 범위 지정된 부분을 그 응용 프로그램의 버퍼 영역에 기억한 후, 곧바로 클립보드에 버퍼 영역의 내용을 전송하는 것이 아니라, 표 데이터를, 예를 들어 CSV 형식(Comma Separated Value format)으로 머리하는 기능을 호출한다. 이것에 의해 행의 끝이 개행 신호(new line signal)이며, 열의 끝이 콤마(또는 탭)인 것과 같은 텍스트 데이터 형식으로 변환된다. 이와 같은 형식에 의해 윈도즈 용 로터스 1-2-3(로터스 디벨로프멘트의 상표), 엑셀(Excel: 마이크로소프트의 상표)등의 전형적인 스프레드시트 프로그램에 대하여 클립 보드로부터의 붙이기 처리를 행하는 것에 의해 표 형식을 유지하면서 표의 각 셀에 원하는 데이터를 기억하는 것이 가능하게 된다.
잘라서 붙여지는 응용 프로그램이 워드프로세서 또는 텍스트 에디터등의 통상의 텍스트를 처리하는 응용 프로그램인 경우 종래 기술에 의하면 자르기 및 붙이기 처리를 행하면 마우스 조작 등에 의해 범위 지정된 텍스트가 그대로 클립 보드에 전송된다. 그러나 본 발명에 의하면 클립 보드에 전송하기 전에 범위 지정된 내용은 일단 버퍼에 기억되며 틀선 정보등에 기초하여 영역이 격자화되며 그렇게 하여 상기 광학적 문자 인식장치(OCR)의 경우에 태그가 부착된 텍스트 데이터를 CSV형식(Comma Separated Value format)으로 변환하는 기능과 유사한 기능이 호출되며, 결국 클립보드에 보내지는 텍스트는 행의 끝이 개행 신호이며 열의 끝이 콤마(또는 탭)인 것과 같은 텍스트 데이터 형식으로 변환된다.
[실시예]
이하 도면을 참조하여 본 발명의 실시예를 설명한다.
A. 하드 웨어의 구성
제1도를 참조하면 본 발명을 실시하기 위한 시스템 구성의 개요가 도시되어 있다. 이 구성은 특수한 것이 아니라, 주기억장치(RAM)와, 중앙 처리 장치(CPU)와, 주변 장치 콘트롤러와, 하드 디스크 장치 등을 구비하는 시스템 장치(1002)를 포함하며, 상기 시스템 장치(1002)에 대하여 커맨드나 문자열 등을 키 입력하기 위한 키보드(1004)와, 문자 및 그래픽을 컬러의 비트맵으로 표시하기 위한 디스 플레이 장치(1006)와, 상기 디스플레이 장치(1006)의 화면상의 임의의 위치를 지시하여 그 위치 정보를 중앙 처리장치에 전달하기 위한 마우스(1008)로 이루어지는 통상의 구성이다. 상기에 더하여, 시스템 장치(1002)에는 소정의 인터페이스 카드를 통해 광학적 문자 인식장치(OCR)용 이미지 스캐너(image scanner)(1010)가 접속되어 있다.
하드 디스크 장치에는 오퍼레이팅 시스템과 표 계산(스프레드시트) 프로그램, 워드프로세서, 데이터 베이스, 텍스트 에디터 등의 응용 프로그램이 기억되어 있다.
오퍼레이팅 시스템으로서는 윈도우즈(Windows: 마인크로소프트의 상표), OS/2(IBM의 상표), AIX(IBM의 상표)상의 X-WINDOW시스템(MIT의 상표)등의 GUI(Graphic User Interface) 멀티윈도우 환경을 지원하고 또한 서로 다른 윈도우 상에서 동작하는 응용 프로그램들 사이에서 클립보드, 동적 데이터 전송(DDE)등을 거쳐서 데이터의 자르기 및 붙이기를 행하기 위한 기능을 갖는 임의의 것을 채용할 수 있다.
B. 시스템 구성
다음, 제2도를 참조하여 본 발명의 시스템 구성에 관하여 보다 상세히 설명한다.
우선, 화상 입력부(2002)는 광학적 문자 인식장치(OCR)(2001)에 접속되며 스캐너(1010)에 의해 판독된 이미지는 광학적 문자 인식장치(OCR)(2001)와 화상 입력부(2002)와 출력 제어부(2012)를 거쳐서 표시장치(1006)의 화면의 한 윈도우상에 표시된다.
텍스트 입력부(2004)는 텍스트 표시 데이터를 처리부(2010)등으로부터 받아서 출력 제어부(2012)에 전송하며, 그리하여 표시장치(1006)의 화면의 한 윈도우상에 그 내용을 표시할 수 있게 된다.
입력부(2006)는 마우스의 클릭킹(clicking), 드래깅(dragging) 및 더블-클릭킹(double-clicking)파, 키보드의 커서 이동, 개행 키(new line key)의 누름등의 사실을 검출하는 처리부이며, 이 검출신호는 실제로는 입력 판정부(2007)에서 판정된다.
입력 판정부(2007)는 현재의 커서의 위치와 그 커서 위치에 기초하는 지정범위를 검출한다. 지정범위는 일반적으로 직사각형이며, 예를 들어 어느 커서 위치로부터 마우스 버튼을 누른채로 마우스를 이동(드랙, drag)하는 것에 의해 직사각형 영역이 나타나며 마우스 버튼을 누른채로 마우스를 더 이동하면 직사각형 영역이 확장된다. 그렇게 하여 원하는 영역을 커버할 만큼 직사각형 영역을 확장한 시점에서 마우스 버튼을 놓으면 범위 지정이 완료된다.
광학적 문자 인식장치(OCR)(2001)에 접속된 처리부(2008)는 상기 광학적 문자 인식장치(OCR)(2001)에 의해 해석된 태그가 부착된 텍스트 데이터를 기억하는 것이며, 그 태그가 부착된 텍스트 데이터 중에서 특히 본 발명이 이용하는 것은 표를 나타내는 것으로 해석된 부분이다.
처리부(2010)는 본 발명에 따른 처리를 수행하는 워드프로세서 또는 텍스트 에디터의 텍스트 데이터를 기억하는 버퍼 메모리를 포함하며, 그 내용의 일부가 텍스트 입력부(2004) 및 출력 제어부(2012)를 거쳐서 화면의 한 윈도우상에 표시된다.
표 정보 취득부(table data acquisition unit: 2014)는, 입력 판정부(2007)에 의해 지정되는 지정 범위에 기초하여 처리부(2008)에 기억되어 있는 태그 부착 텍스트 데이터를 액세스하여 태그 부착 텍스트 데이터로부터 표에 관한 부분을 취득한다.
틀선 및 문자 정보 취득부(2016)는 워드프로세서 또는 텍스트 에디터의 내부 데이터를 기억하는 처리부(2010)에 액세스하여 입력 판정부(2007)에 의해 지정되는 지정 범위내의 틀선 및 문자 데이터를 취득한다.
표 해석부(2018)는 틀선 정보에 기초하여 지정범위를 격자 형상으로 분할함에 의해 각각의 분할 영역에 기억되어지는 문자를 검출하는 처리를 수행한다. 표 해석부(2018)에서의 처리에 관해서는 뒤에서 보다 상세하게 설명한다.
스프레드시트 데이터 변환부(2020)는 표 정보 취득부(2014) 또는 표 해석부(2018)로부터 데이터를 수신하여 윈도우즈용 로터스 1-2-3(로터스 디벨롭먼트의 상표), 엑셀(Excel: 마이크로 소프트의 상표) 등의 전형적인 스프레드시트 프로그램에 대하여 표 형식을 유지하면서 개별의 셀에 데이터를 기억할 수 있는 CSV(Comma Separated Value) 또는 탭으로 구분된 텍스트 데이터인 스프레드시트 데이터 형식으로 변환한다.
이와 같이 하여 변환된 스프레드시트 데이터는, 외부 기억 장치 전송부(2022)를 거쳐서 클립보드에 전송되거나, 동적 데이터 전송(DDE: dynamic data exchange)에 의해 직접 스프레드시트 프로그램에 전송된다 혹은 OLE(Object Linking and Embedding)에 의해 스프레드시트 프로그램에 들어있는 표의 오브젝트의 데이터를 변경한다.
C. 본 발명의 처리
다음, 제3a도 내지 제3d도의 동작 설명도 및 제4, 제5도의 흐름도를 참조하여 본 발명의 처리에 관하여 설명한다. 본 발명의 실시예는 (1) 광학적 문자 인식장치(OCR)의 데이터의 뷰어(viewer)의 경우와 (2) 워드프로세서 또는 텍스트 에디터의 경우는 처리가 다소 다르기 때문에 각각 개별적으로 설명한다.
C-1. 광학적 문자 인식장치(OCR)의 데이터의 뷰어의 경우
본 발명에 따른 광학적 문자 인식장치(OCR) 데이터용 뷰어에 있어서, 예를들면 타이틀 바(title bar)의 「문서」(구체적으로는 제6도의 윈도우(6010)를 참조)를 클릭하여 나타난 풀다운 메뉴의 「표복사」 를 선택하면 제4도의 흐름도의 처리가 개시된다. 제4도의 스텝(4002) 에서는 마우스(1008)등의 포인터 디바이스(pointer device)에 의해 제3a도에 도시하듯이 직사각형 영역을 범위 지정한다. 이것은 제2도에서는 입력부(2006)에 의해 수행된다. 직사각형 영역의 지정 방법은 상술한 드랙(drag)에 의한 방법이나, 메뉴바의 풀다운 메뉴에서 「범위지정」을 선택하여 단순히 마우스를 이동하거나 또는 커서 키(cursor key)를 누른 채로 마우스를 이동함에 의해 직사각형 영역을 확장하여 마우스를 클릭하거나 개행 키를 누르는 것에 의해 직사각형 영역을 지정하는 방법등 여러가지 방법이 있으며, 본 발명은 그것들 중의 특정한 범위 지정 방법에 제한되지 않으며, 임의의 범위 지정 방법도 채택될 수 있다.
이와 같이 하여 범위가 확정되면 스텝(4004)에서는 제2도의 입력 판정부(2007)에 의해 확정된 직사각형 영역의 4개 모서리 점의 좌표가 결정된다.
다음, 스텝(4006)에서는 확정된 직사각형 영역의 4개의 모서리 점의 좌표에따라 표 정보 취득부(2014)에 의해 광학적 문자 인식장치(OCR)에서 해석된 데이터(2008)가 액세스되며, 이것에 의해 제3b도에 도시하는 광학적 문자 인식장치(OCR)에서 해석된 데이터의 begin{table}에서 시작되며,¥end{table}에서 끝나는 표 데이터의 텍스트 정보가 표 정보 취득부(2014)에 의해 취득된다. 광학적 문자 인식장치(OCR)에 의해 제3a도와 같은 태그 부착 텍스트 정보를 생성하는 기법에 관하여는, 그것이 본 발명의 주제가 아니며, 또한 일본 특허 공개 공보 평 4-278634호 등의 간행물에 기재되어 있기 때문에 여기에서는 설명을 생략한다.
제3b도에서 틀선 정보에 해당하는 것은, 수직선(vertical line)을 나타내는 begin{table}의 행의{10, 500, 500, 300}등의 데이터와 수평선(horizontal line)을 나타내는 ¥line{10, 600}등의 테이터이다.
스텝(4008)에서는 스프레드시트 데이터 변환부(2020)에 의해, 표 정보 취득부(2014)로부터 제공된 제3b도와 같은 데이터가, 예를 들면, 제3c도에 도시되는 CSV 형식(Comma Separated Value format)의 데이터로 변환된다. 이를 위해 필요한 처리는 가장 단순한 경우 간단히 태그를 제거하는 정도로 충분하다. 그러나, 특정한 스프레드시트 프로그램의 경우 표 데이터의 붙이기를 위해 콤마가 아닌 탭 코드로 구분된 텍스트 데이터가 요구되는 경우가 있다. 또한, 문자열은 「」 로서 둘러쌓을 필요가 있거나, 멀티플랜(Multiplan; 마이크로소프트의 상표)에서 사용되는 SYLK 형식(Symbolic LinK format)에 준하는 것도 있으며 여러가지 변형이 있다.
따라서 본 발명에 따른 광학적 문자 인식장치(OCR) 데이터용 뷰어의 메뉴 옵션에서 미리 준비한 복수의 표 데이터 형식 중에서 1 개를 선택하여 두도록 하는 것이 바람직하다.
CSV 형식(Comma Separated Value format)과 SYLK 형식(Symbolic LinK format)의 대응 관계는 다음과 같다. 즉, 콤마로 구분되는 CSV에서
표 1
동경', 1, 110.21
대판, 2, 89.05
와 같이 나타내어지는 데이터는, SYLK 형식(Symbolic LinK format)에서는,
식 1
B;Y2:X3
C;Y1;X1;K동경
C;X2;K1
C;X3;K110.21
C;Y2;X1;K대판
C;X2;K2
C;X3;K89.05
E
로 나타내어진다. 여기에서, B;Y2;X3 는 표 데이터의 y 방향의 사이즈가 2이며 x 방향의 사이즈가 3 인 것을 나타낸다. 또한, C; 로 시작하는 행에 있어서 Yn;Xm;Ka 와 같은 형식은 n 행 m 열의 셀에는 a 라는 데이터가 기억되는 것을 나타낸다. 또한, Yn의 표시가 생략되어 있는 행은 그 위의 행과 같은 행 위치인 것을 나타낸다.
스텝(4010)에서는 제3c도에 도시하는 데이터가 외부 기억 장치 전송부(2022)에 의해 클립보드(clipboard)에 기입된다. 이제, 스프레드시트 응용 프로그램이 실행되는 윈도우를 활성화하고 마우스의 클릭등에 의해 커서 위치를 스프레드시트의 원하는 셀에 배치하고, 다음 그 스프레드시트 응용 프로그램의 메뉴바에서 「편집」 메뉴를 풀다운 시켜서 「붙이기」 를 선택하면 현재의 셀 위치를 좌측 상단 모서리로 하도록 스텝(4010)에서 기입된 표의 데이터가 붙여진다. 이와 같이 스프레드시트에 붙여진 표는 원래의 표 데인터의 형식을 유지하고 있기 때문에, 예를들면 제3d도에 도시하듯이 숫자가 늘어서 있는 셀 열에 기초하여 막대 그래프를 그리거나 혹은 숫자를 포함하는 복수의 셀을 범위 지정하여 평균치나 표준 편차를 계산하거나 하는 것이 가능하다.
이 예를 보다 구체적으로 제6도 및 제7도 화면의 도면을 참조하여 설명한다. 제6도에서는 왼도우(6010)에 광학적 문자 인식장치(OCR) 인식 결과의 뷰어(viewer)가 표시되며 윈도우(6020) 스프레드시트 프로그램이 표시되어 있다. 뷰어는 본 발명에 따른 클립보드 전송 기능을 구비한 것임을 이해하기 바란다.
그래서 예를 들어 뷰어의 표(6012)를 마우스에 의해 범위지정 하여 타이틀 바의 「문서」를 클릭하여 풀다운 메뉴(도시 생략)를 표시하고, 거기서 「표 복사」(도시생략)를 선택하여 클립보드에 기억되는 것은, 본 발명에 따르면, 뷰어상에서 범위 지정한 영역의 비트 맵 이미지가 아니며, 표의 뷰어의 표시 내용과 관련되어 주기억 또는 하드디스크상에 유지되어 있는 표의 위치의 인식결과의 태그 부착 텍스트도 또한 아니며, 예를 들어 표(6012)의 구조를 반영한 CSV 형식(Comma Separated Value format)의 텍스트 데이터이다.
다음, 윈도우(6020)를 활성 윈도우로서 선택하여 마우스의 클릭에 의해 현재의 셀을 A1으로 하고 메뉴바의 「편집」을 클릭하여 「편집」 메뉴를 풀다운시켜 「붙이기」 를 선택하면, A1 셀을 좌상 모서리 위치로 하여 표(6012)의 구조를 반영한 표(7010)가 스프레드시트(7002)에 붙여진다.
C-2. 워드프로세서 또는 텍스트 에디터의 경우
본 발명의 표 복사기능을 갖는 워드프로세서 또는 텍스트 에디터에 있어서, 예를 들면 타이틀 바의 「편집」(도시생략)을 클릭하여 펼친 풀다운 메뉴의 「표 복사」 를 선택하면, 역시 제4도의 흐름도의 처리(4002)가 개시된다. 이 경우 마우스 또는 키보드의 커서 키에 의한 「범위 지정」 조작은 상기 광학적 문자 인식장치(OCR)용 뷰어의 경우와 같다.
다음, 스텝(4004)에서는 확정된 직사각형 영역의 4개 모서리점의 좌표에 따라 표 정보 취득부(2014)에 의해 워드프로세서 또는 텍스트 에디터의 내부 데이터(2010)가 액세스되며, 이것에 의해 스텝(4006)에서는 범위 지정된 위치내의 텍스트 데이터가 틀선 및 문자 정보 취득부(2016)에 의해 취득된다. 여기에서 「틀선(ruled line)」 이라는 표현에서 이해되듯이, 틀선 의 문자 정보 취득부(2016)는 문자 정보뿐만이 아니라 틀선 정보도 취득하며, 틀선 정보는 범위 지정한 영역 표의 구조 이해에 이용된다. 즉, 본 발명에 따른 워드프로세서 또는 텍스트 에디터의 경우 스텝(4008)은, 상기한 광학적 문자 인식장치(OCR) 데이터용 뷰어의 경우와는 달리, 제5도에 도시하는 복수의 스텝(5002∼5010) 으로 구성된다.
즉, 제5도를 참조하면 스텝(5002)에서는 틀선의 연장(extending a ruled line)이라는 처리가 행해진다. 이것이 필요한 이유는, 워드프로세서 또는 텍스트 에디터의 경우 제8도에 도시하듯이 각 열(혹은 행)내의 블록의 길이들이 항상 일정한 것은 아니기 때문이다(실제로, 광학적 문자 인식장치(OCR)에서 인식되어지는 표에 관해서도 각 열내의 블록들의 길이가 항상 일정한 것은 아니다. 그러나 이와같은 표의 인식 및 해석은 광학적 문자 인식장치(OCR)가 미리 행하여져 결과로써 생성되고 제3b도에 도시하듯이 태그 부착 텍스트에 반영되기 때문에 표 정보 취득부(2014)는 새로이 틀선 정보등을 감안하여 표의 해석을 행할 필요가 없다). 틀선 정보는 워드 프로세서의 경우 고유의 특수 기호를 사용하여 문서중에 들어가지만, 문서에 관련된 별개의 속성 화일에 기술되기 때문에 그것을 해석하도록 한다.
텍스트 에디터의 경우, 특수한 틀선 기능을 구비하는 것이 아니라 「ㅜ」 나, 「ㅓ」나, 「ㄴ」 등의 틀선용 문자가 텍스트로서 들어가는 것이 보통이기 때문에, 그와 같은 틀선용 문자의 출현 위치를 해석하도록 한다.
이렇게 하여 틀선의 존재를 검출하여 스텝(5002)에서 틀선을 연장하면 스텝(5004)에서는 제9도에 도시하듯이 영역의 격자화가 달성된다. 제9도에서 실선은 실제의 틀선, 파선은 스텝(5002)에서 연장한 가상적인 틀선이다. 또한, 제9도에서 1∼20 이라는 숫자는 표의 실제데이터가 아니며 표의 가상적인 격자 셀에 대응하는 영역에 붙인 일련 번호이다.
스텝(5006)에서는 표의 실제텍스트 데이터의 표의 가상 격자 영역에 대한 맵핑(mapping)이 행해진다. 그 결과는 제10도에 도시하는 그대로이다. 특히 제10도에 있어서 문자 F 나, 문자 H 등이 복수의 격자 셀을 점유하고 있는 것에 유의 하길 바란다. 이렇게 하여 맵핑이 얻어지면, 다음과 같은 처리가 번호순으로 각각의 격자 셀에 대하여 수행된다. 즉, 에를 들어 F=(9, 10, 11)과 같이 어느 문자가 복수의 격자 셀을 점유하고 있을때 가장 번호가 낮은 격자 셀에 그 문자를 기억하며 뒤의 격자 셀은 공백으로 된다.
이와 같은 대응관계가 행해지면, 제12도에 도시하는 바와 같이 격자 셀이 문자에 의해 점유된다. 이와 같은 격자 셀의 점유를 구하는 것이 스텝(5008)이다.
이와 같이 제12도와 같은 형식의 데이터를 작성하여 두면 스텝(5010)에서는 극히 용이하게 스프레드시트가 상정하는 임의의 텍스트 형식의 데이터를 작성할 수 있다.
예를 들어 제12도에서 실제데이터가 기억되어 있는 격자 셀은 실제데이터를 「」로 둘러싼 문자로 변환하며, 인접한 격자 셀의 옆면의 경계는 「,」로 나타내며, 행의 종료는 개행 코드로 나타내는 것에 의해 제11도에 도시하는 CSV형식(Comma Separated Value format)의 텍스트 데이터가 얻어진다. 이때 어떠한 스프레드시트 프로그램에의 붙이기를 행하는 가에 따라서, 「,」 를 탭으로 나타내거나, 「」 로 둘러쌓는 것을 생략하는 등의 여러가지 변형이 있'음은 상기한 바와 같다.
제12도는 또한, 제8도와 같은 워드프로세서 또는 텍스트 에디터 중의 표를 실제로 스프레드시트 프로그램에 붙였을 때 스프레드시트 프로그램중에서 그 표가 나타내는 격자를 도시하는 것으로 생각할 수도 있다.
상술한 스텝(5002∼5010)은 제2도에서는 표 해석부(2018)에서 실행되는 처리라는 것을 주목하라.
스텝(5010)이 완료되면 워드프로세서 또는 텍스트 에디터의 경우의 본 발명 처리는 제4도의 스텝(4010)으로 되돌아가지만, 잇따르는 처리는 상기의 광학적 문자 인식장치(OCR) 뷰어의 경우와 마찬가지이기때문에 설명은 생략한다.
상기 스텝(5002∼5010)은 틀선의 정보를 이용하고 있기 때문에 워드프로세서 또는 텍스트 에디터의 경우 본 발명의 처리는 틀선 정보를 갖는 것이 필수인 것 처럼 보이지만, 실제로는 틀선 정보 없이도 표의 정보를 반영시키는 것이 가능하다는 것을 주목하라. 그래서 제13도 이하를 참조하여, 워드프로세서 또는 텍스트 에디터에서 잘려나온 표 영역에 틀선이 항상 있지는 않는 경우(즉, 틀선의 존재에 의존하지 않음)의 처리 방법에 관하여 설명한다.
C-21 표해석 처리의 다른 실시예
제13도에 도시되어 것과 같은 있는 표 형식의 텍스트가 자르기와 붙이기 처리에 의해 잘려지며, 해석되는 대상으로 가정한다. 이 실시예에 따른 표 해석 프로그램은 우선 표내의 공백 영역의 그룹(공백 블럭)을 종횡방향으로 각각 구한다.
단, 이미 틀선이 있은 경우( 「ㅜ」, 「ㅓ」, 「ㄴ」등 뿐만이 아니라,마이너스 기호의 연속도 틀선으로 간주한다) 그것은 공백으로 간주한다.
제14도에 종방향의 공백 블럭을, 제15도에 횡방향의 공백 블럭을 도시한다. 제14도 및 제15도에서 공백 블럭은 각각 횡방향과 종방향의 「←→」 로 표시되어 있다.
이제 다음의 규칙에 따라, 범위 지정되어 있는 표 내에 가상적인 틀선을 그린다.
(1) 종 방향 공백 블럭의 양단이 외주 또는 이미 그려져 있는 가상 틀선에 접하여 있는 경우, 그 종방향 공백 블럭의 위치에 가상 틀선을 그린다.
(2) 횡 방향 공백 블럭의 양단이 외주 또는 이미 그려져 있는 실제틀선에 접해 있는 경우, 그 횡방향 공백 블럭의 위치에 가상 틀선을 그린다.
이하, 제13도의 영역에 대해서 상기 규칙(1) 및(2)를 적용하는 것에 의해 가상 틀선을 그리는 처리에 관하여 설명한다.
최초의 처리는, 제16도에 도시하듯이 규칙(1)에 따라서 양단이 외주에 도달하는 종 방향의 가상 틀선을 그리는 것이다.
다음 단계의 처리는 제17도에 도시하듯이 규칙(1)에 따라서 한끝단이 외주에 도달하며 다른 끝단이 실제 틀선에 도달하는 종방향의 가상 틀선을 그리는 것이다.
다음은 제18도에 도시하듯이 규칙(2)가 적용되어 양 끝단이 외주에 도달하는 횡 방향의 틀선이 그려진다.
이와 같이 해서 그려진 틀선 전체를 도시하면 제19도와 같이 된다. 제19도에서는 「다나까」의 행과 「야마다」의 행등의 행들사이에 경계선이 도시되어 있지 않지만, 실제로 스프레드시트상에서는 「다나까」와 「야마다」는 그의 경계가 종 방향으로 접하는 서로 다른 셀에 기억되는 것으로 상정되어 있음을 주목하라. 따라서, 각각의 행사이에는 전부 횡 방향의 가상 틀선이 그려져 있다고 생각하여도 좋다. 제19도에서 표시되지 않은 행사이의 횡 방향의 가상 틀선을 단선(single line)으로, 제13도에서 미리 주어진 실제 틀선 및 제18도에서 공백행으로 그려진 횡방향의 가상 틀선을 2중선(double line)으로 나타내면, 제20도와 같은 표 구조를 얻는다. 이 구조로부터, 제8도 내지 제12도에 관하여 설명한 방법에 의해, 제11도에 도시하는 CSV 형식(Comma Separated Value format)의 텍스트를 얻을 수 있다.
제8도 내지 제12도에 도시한 방법을 적용하는 경우 제20도에 있어서의 단선의 틀선과 2중선의 틀선은 동일시 되지만, 경우에 따라서는 단선은 단순한 셀의 경계를 부여하고, 2중선은 공백 셀을 포함하는 행을 부여하도록 해석하여도 좋다. 또는, 2중선의 위치는 스프레드시트내의 틀선으로 되도록, 속성 정보를 포함하는 표 정보의 데이터를 스프레드시트에 붙일 수도 있다.
본 발명에 있어서 바람직하게는, 워드프로세서 또는 텍스트 에디터에 있어서의 표 형식에 대응해서 서로 다른 복수 종류의 표 해석 방법을 제공하여, 메뉴로부터 적당한 표 해석 방법을 선택할 수 있도록 하는 것이 요망된다. 이와 같이 해두면 틀선을 포함하는 표, 단순히 행렬 모양에 문자 또는 숫자를 배열한 표, 텍스트 상에서 이미 탭으로 구분되어 있는 표 등의 특징에 대응해 서로 다른 표 해석 방법을 메뉴에서 선택함으로써 스프레드시트에 구조를 가진 표를 붙일 수 있는 가용성이 높다.
상기 실시예에서는 워드프로세서와 스프레드시트 프로그램이 별개의 윈도우에 액세스되어 있는 것으로 설명을 해왔지만, 최근의 워드프로세서에는 스프레드시트 기능을 갖는 표를 임의의 위치에 설정할 수 있는 것도 있다.
본 발명은 이와 같은 동일 윈도우내의 응용 프로그램의 텍스트 부분에서 그의 스프레드시트 부분으로의 표구조 데이터의 자르기 및 붙이기에도 적용 가능한 것임을 유의하라.
또한, 최근에 스프레드시트 프로그램이나 워드프로세서 이외의 데이터 베이스 프로그램에서도, 기록을 표형식으로 표시할 수 있고 CSV(Comma Separated Value)등의 형식의 데이터를 클립보드를 거쳐서 혹은 동적 데이터 전송(DDE: Dynamic Data Exchange)에 의해 붙이기 가능한 것이 알려져 있다.
따라서, 본 발명에 따르면, 표 구조의 데이터를 붙이는 타겟 응용 프로그램은 스프레드시트 프로그램에 한정되는 것이 아니며, 데이터를 표형식으로 표시하고 표 구조를 갖는 특정의 형식내에 데이터를 붙일 수 있는 임의의 응용 프로그램이라도 좋다는 것을 알수 있다.
더하여, 상기 실시예에서는 표 구조 데이터를 취득하는 소스 측의 응용 프로그램으로서 광학적 문자 인식장치(OCR)의 뷰어와, 워드프로세서 및 텍스트 에디터를 상정하였지만, 이들 응용 프로그램에 한정되는 것이 당연히 아니며, 본 발명은 화면상의 표시 위치에 기초하여 주 기억장치 또는 보조 기억장치로 액세스하여 그 표시 내용에 관련되는 텍스트 데이터를 취득할 수 있는 임의의 응용 프로그램에도 적용 가능함을 유의하여야 한다. 이때, 소스측의 응용 프로그램의 표시 화면은 비트맵 데이터(bit map data)와, 이미지 데이터(image data)와, 벡터 선 그림 데이터(vector line drawing data)등을 표시할 수 있는 그래픽 표시 화면이라도 좋으며, 텍스트 에디터등과 같이 텍스트 문자 밖에 표시하지 않는 표시화면도 좋다. 요약하면, 본질적인 것은 소스측의 애플리케이션 프로그램에 있어서 화면의 텍스트 문자 부분에 관련되어 텍스트 정보를 기억할 수 있고, 지정된 범위내의 문자 데이터의 위치 정보에 기초하여 그 텍스트 정보의 대응 부분에 액세스할 수 있어야 하는 것이다. 본 발명에 따른 표 형식 데이터 변환을 행할 경우에 틀선 정보등은 필요에 따라서 참조되는 것이지만, 일반적으로는 지정된 범위내의 텍스트 정보에 관련되어 있지 않은 정보(비트맵 등)는 표 데이터 변환부(예를 들면, 제2도에 도시하는 스프레드시트 변환부(2020))에는 전송되지 않는다.
[발명의 효과]
이상 설명한 바와 같이 본 발명에 의하면 이용자는 시간을 허비하는 일 없이 워드프로세서, 텍스트 에디터, 뷰어에 있어서의 표형식의 표시 데이터를 표로서의 구조를 유지하면서 자르기 및 붙이기 처리에 의해 곧바로 스프레드시트 프로그램으로 붙이는 것이 가능하게 된다.

Claims (3)

  1. 데이터 처리 시스템내에서, 비균일 표구조 입력 데이터(non-uniform table-structure input data)를 균일한 셀형 데이터 구조(uniform cellular data structure)로 맵핑(mapping)하는 방법으로서-상기 비균일 표구조 입력 데이터는 틀선에 의해 서로 다른 크기의 데이터 블록들로 윤곽이 그려지고, 데이터 블록들의 행과 열을 포함하되, 상기 행과 열내의 상기 데이터 블록들의 폭과 높이는 둘다 균일하지 않음, 상기 맵핑 방법은 컴퓨터로 실행되는, ① 상기 비균일 표구조 입력 데이터의 더 큰 입력 데이터 블록을 균일한 셀형 데이터 구도내 균일한 행과 열내의 더 작은 균일한 크기로 생기는 데이터 블록들로 분할 하는 단계와, ② 각 열내에서 그리고 다음은 인접한 열들내에서 일정한 방향으로 상기 균일한 크기로 생기는 데이터 블록 모두에 연속 번호를 붙이는 단계와, ③ 상기 입력 데이터 블록을 상기 번호가 붙여진 균일한 크기로 생기는 데이터 블록상으로 맵핑하는 단계와, ④ 각각의 개별 입력 데이터 블록에 대해, 각각의 상기 개별 입력 데이터 블록의 데이터 내용을 각각의 상기 개별 입력 데이터 블록으로 맵핑되는 상기 균일한 셀형 데이터 구조중의 가장 낮은 번호가 붙여진 균일한 크기로 생기는 데이터 블록으로 맵핑하는 단계를 포함하는 맵핑 방법.
  2. 비균일 표구조 입력 데이터(non-uniform table-dtructure input data)를 균일한 셀형 테이터 구조(uniform cellular data structure)로 맵핑(mapping)하는 데이터 처리 시스템으로서-상기 비균일 표구조 입력 데이터는 틀선에 의해 서로 다른 크기의 데이터 블록들로 윤곽이 그려지고, 데이터 블록들의 행과 열을 포함하되, 상기 행과 열내의 데이터 블록의 폭과 높이는 둘다 균일하지 않음-, 상기 데이터 처리 시스템은, ① 상기 비균일 표구조 입력 데이터의 더 큰 입력 데이터 블록을 균일한 셀형 데이터 구조내 균일한 행과 열내의 더 작은 균일한 크기로 생기는 데이터 블록들로 분할하는 수단과, ② 각 열내에서 그리고 그 다음은 인접한 열들내에서 일정한 방향으로 상기 균일한 크기로 생기는 데이터 블록들 모두에 연속 번호를 붙이는 수단과, ③ 상기 입력 데이터 블록들을 상기 번호가 붙여진 균일한 크기로 생기는 데이터 블록들상으로 맵핑하는 수단과, ④ 각각의 개별 입력 데이터 블록에 대해, 각각의 상기 개별 입력 데이터 블록의 데이터 내용을 각각의 상기 개별 입력 데이터 블록으로 맵핑되는 상기 균일한 셀형 데이터 구조중의 가장 낮은 번호가 붙여진 균일한 크기로 생기는 데이터 블록으로 맵핑하는 수단을 포함하는 데이터 처리 시스템.
  3. 데이터 처리 시스템에서 사용하는 컴퓨터 프로그램 장치에 있어서, ① 비균일 표구조 입력 데이터를 균일한 셀형 데이터 구조로 맵핑하기 위해 매체내에 구현된 컴퓨터 판독가능한 프로그램 코드를 가진 컴퓨터 사용가능한 상기 매체와-상기 비균일 표구조 입력 데이터는 틀선에 의해 서로 다른 크기의 데이터 블록들로 윤곽이 그려지고, 데이터 블록들의 행과 열을 포함하되, 상기 행과 열내의 데이터 블록들의 폭과 높이는 둘다 균일하지 않음-, ② 상기 비균일 표구조 입력 데이터의 더 큰 입력 데이터 블록을 균일한 셀형 데이터 구조내 균일한 행과 열내의 더 작은 균일한 크기로 생기는 데이터 블록들로 분할하는 컴퓨터 판독가능한 프로그램 코드 수단과, ③ 각 열내에서 그리고 그 다음은 인접한 열들내에서 일정한 방향으로 상기 균일한 크기로 생기는 데이터 블록 모두에 연속 번호를 붙이는 컴퓨터 판독가능한 프로그램 코드 수단과, ④ 상기 입력 데이터 블록들을 상기 번호가 붙여진 균일한 크기로 생기는 데이터 블록들상으로 맵핑하는 컴퓨터 판독가능한 프로그램 코드 수단과, ⑤ 각각의 개별 입력 데이터 블록의 데이터 내용을 각각의 상기 개별 입력 데이터 블록으로 맵핑되는 상기 균일한 셀형 데이터 구조중의 가장 낮은 번호가 붙여진 균일한 크기로 생기는 데이터 블록으로 맵핑하는 컴퓨터 판독가능한 프로그램 코드 수단을 포함하는 컴퓨터 프로그램 장치.
KR1019950030174A 1994-09-16 1995-09-15 표 데이터의 자르기와 붙이기 방법 및 데이터 처리 시스템 KR100196980B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP6221543A JPH0887495A (ja) 1994-09-16 1994-09-16 表データのカット・アンド・ペースト方法及びデータ処理システム
JP94-221543 1994-09-16

Publications (2)

Publication Number Publication Date
KR960011773A KR960011773A (ko) 1996-04-20
KR100196980B1 true KR100196980B1 (ko) 1999-06-15

Family

ID=16768375

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950030174A KR100196980B1 (ko) 1994-09-16 1995-09-15 표 데이터의 자르기와 붙이기 방법 및 데이터 처리 시스템

Country Status (6)

Country Link
US (1) US5881381A (ko)
JP (1) JPH0887495A (ko)
KR (1) KR100196980B1 (ko)
CN (1) CN1104677C (ko)
CA (1) CA2157972C (ko)
TW (1) TW313645B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015146111A (ja) * 2014-02-03 2015-08-13 富士通株式会社 アグリゲーションプログラム、端末装置及びアグリゲーション方法

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6222542B1 (en) 1995-10-10 2001-04-24 Anysoft, Ltd Apparatus for and method of acquiring, processing and routing data contained in a GUI window
US5889518A (en) * 1995-10-10 1999-03-30 Anysoft Ltd. Apparatus for and method of acquiring, processing and routing data contained in a GUI window
JP3970357B2 (ja) * 1996-08-13 2007-09-05 富士ゼロックス株式会社 表割付装置及び表割付方法
US6006240A (en) * 1997-03-31 1999-12-21 Xerox Corporation Cell identification in table analysis
US6249283B1 (en) * 1997-07-15 2001-06-19 International Business Machines Corporation Using OCR to enter graphics as text into a clipboard
US6640234B1 (en) * 1998-12-31 2003-10-28 Microsoft Corporation Extension of formulas and formatting in an electronic spreadsheet
JP3258287B2 (ja) * 1999-01-06 2002-02-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 画像データの解析方法及び解析装置、及び画像データの解析を行うためのプログラム・プロダクトを格納した記録媒体
JP2000293511A (ja) * 1999-04-09 2000-10-20 Canon Inc 文書処理装置、方法、及び記憶媒体
WO2000070526A1 (en) * 1999-05-17 2000-11-23 Infineon Technologies Asia Pacific, Pte. Ltd. Efficient coding in processors
US9262383B2 (en) 1999-05-21 2016-02-16 E-Numerate Solutions, Inc. System, method, and computer program product for processing a markup document
US7249328B1 (en) * 1999-05-21 2007-07-24 E-Numerate Solutions, Inc. Tree view for reusable data markup language
US7421648B1 (en) * 1999-05-21 2008-09-02 E-Numerate Solutions, Inc. Reusable data markup language
US9268748B2 (en) 1999-05-21 2016-02-23 E-Numerate Solutions, Inc. System, method, and computer program product for outputting markup language documents
US9262384B2 (en) 1999-05-21 2016-02-16 E-Numerate Solutions, Inc. Markup language system, method, and computer program product
US6779152B1 (en) 1999-12-07 2004-08-17 International Business Machines Corporation Method for rotating a dynamic HTML table
JP2001256220A (ja) * 2000-03-10 2001-09-21 Fujitsu Ltd 情報処理方法、情報処理装置、記録媒体及び伝送媒体
KR100368913B1 (ko) * 2000-05-17 2003-01-24 김지섭 Csv 포맷 파일 작성방법
US7146561B2 (en) 2000-07-13 2006-12-05 International Business Machines Corporation Method and system in an electronic spreadsheet for comparing series of cells
US7178098B2 (en) 2000-07-13 2007-02-13 International Business Machines Corporation Method and system in an electronic spreadsheet for handling user-defined options in a copy/cut—paste operation
US7272783B2 (en) * 2000-07-13 2007-09-18 International Business Machines Corporation Method and system in an electronic spreadsheet for managing and handling user-defined options
US9600842B2 (en) * 2001-01-24 2017-03-21 E-Numerate Solutions, Inc. RDX enhancement of system and method for implementing reusable data markup language (RDL)
TWI251751B (en) 2001-02-27 2006-03-21 Ibm Method and system in an electronic spreadsheet for handling graphical objects referring to working ranges of cells in a copy/cut and paste operation
US7039256B2 (en) * 2001-07-12 2006-05-02 International Business Machines Corporation Efficient verification of recognition results
US7499602B2 (en) * 2001-07-12 2009-03-03 International Business Machines Corporation Efficiency and speed in verification of recognition results
US20040218351A1 (en) * 2002-11-12 2004-11-04 Mitac Technology Corp. Method and apparatus for integrating personal computer and electronic device functions
TW591478B (en) 2002-11-12 2004-06-11 Mitac Technology Corp Apparatus and method of using personal computer to integrate functions of home electronics
KR20030011386A (ko) * 2003-01-16 2003-02-07 이승민 전자 가계부 혹은 자산관리 시스템에서의 데이타 입력방법
US20040172584A1 (en) * 2003-02-28 2004-09-02 Microsoft Corporation Method and system for enhancing paste functionality of a computer software application
US7231593B1 (en) * 2003-07-24 2007-06-12 Balenz Software, Inc. System and method for managing a spreadsheet
US7882427B2 (en) * 2003-07-24 2011-02-01 Balenz Software, Inc. System and method for managing a spreadsheet
US7757165B1 (en) * 2003-09-23 2010-07-13 Stuart Stuple Method and system for deriving and matching local formatting in an electronic document
US7546291B2 (en) * 2004-02-19 2009-06-09 Microsoft Corporation Data source task pane
US7225189B1 (en) 2004-02-19 2007-05-29 Microsoft Corporation Data source write back and offline data editing and storage in a spreadsheet
US8135755B2 (en) * 2005-06-29 2012-03-13 Microsoft Corporation Templates in a schema editor
US7716168B2 (en) 2005-06-29 2010-05-11 Microsoft Corporation Modifying table definitions within a database application
US7546286B2 (en) * 2004-02-19 2009-06-09 Microsoft Corporation Offline multi-table data editing and storage
US8271866B2 (en) * 2004-08-19 2012-09-18 International Business Machines Corporation User-controlled web browser table reduction
US7594165B2 (en) * 2005-01-11 2009-09-22 International Business Machines Corporation Embedded ad hoc browser web to spreadsheet conversion control
US7743026B2 (en) * 2006-01-31 2010-06-22 Microsoft Corporation Redirection to local copies of server-based files
US7930683B2 (en) * 2006-03-31 2011-04-19 Sap Ag Test automation method for software programs
US20070300171A1 (en) * 2006-06-26 2007-12-27 Microsoft Corporation Multicurrency display
JP2008108187A (ja) * 2006-10-27 2008-05-08 Fukui Computer Kk Cadデータ変換装置、cadデータ変換方法、及びcadデータ変換プログラム
JP5239300B2 (ja) * 2007-11-07 2013-07-17 株式会社明電舎 帳票データの移植システムと帳票データの移植方法
US20100083091A1 (en) * 2008-09-30 2010-04-01 Apple Inc. Dynamic text escaping
US9292592B2 (en) 2009-05-29 2016-03-22 Red Hat, Inc. Object-based modeling using composite model object having independently updatable component objects
US9292485B2 (en) 2009-05-29 2016-03-22 Red Hat, Inc. Extracting data cell transformable to model object
JP5361574B2 (ja) * 2009-07-01 2013-12-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US20110054854A1 (en) * 2009-08-31 2011-03-03 Eric Williamson Systems and methods for generating dimensionally altered model objects
CN102103587B (zh) * 2009-12-17 2014-06-04 北大方正集团有限公司 一种表格转换的方法和装置
JP5329602B2 (ja) * 2011-05-12 2013-10-30 株式会社三菱東京Ufj銀行 端末装置およびプログラム
US9477650B2 (en) * 2011-08-30 2016-10-25 Microsoft Technology Licensing, Llc Underlying grid structure and animation of tables
US10061758B2 (en) * 2012-03-29 2018-08-28 Red Hat, Inc. Tabular widget with mergable cells
JP6065467B2 (ja) * 2012-08-30 2017-01-25 コニカミノルタ株式会社 表計算ソフトのレイアウト保持装置
KR102157327B1 (ko) * 2013-05-09 2020-09-17 삼성전자주식회사 이미지 형식의 객체를 텍스트 형식으로 변환하는 전자 장치 및 방법
US9977772B1 (en) * 2013-09-24 2018-05-22 Mehrdad Samadani Method and system for cellular text processor and display
JP6102886B2 (ja) * 2014-10-28 2017-03-29 カシオ計算機株式会社 データ入力装置及びプログラム
US10171696B2 (en) * 2017-01-09 2019-01-01 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method for recognizing characters in character string regions and table regions on a medium
US10740123B2 (en) 2017-01-26 2020-08-11 Nice Ltd. Method and system for accessing table content in a digital image of the table
US10540167B2 (en) 2017-01-26 2020-01-21 Nice Ltd. Image based method and system for building object model and application states comparison and graphic-based interoperability with an application
US10339212B2 (en) * 2017-08-14 2019-07-02 Adobe Inc. Detecting the bounds of borderless tables in fixed-format structured documents using machine learning
US11544799B2 (en) 2017-12-05 2023-01-03 Sureprep, Llc Comprehensive tax return preparation system
US11314887B2 (en) * 2017-12-05 2022-04-26 Sureprep, Llc Automated document access regulation system
US11238540B2 (en) 2017-12-05 2022-02-01 Sureprep, Llc Automatic document analysis filtering, and matching system
US10489644B2 (en) 2018-03-15 2019-11-26 Sureprep, Llc System and method for automatic detection and verification of optical character recognition data
JP7146210B2 (ja) * 2019-09-06 2022-10-04 株式会社ドヴァ 情報処理装置、制御方法及びプログラム
CN111814443A (zh) * 2020-07-21 2020-10-23 北京来也网络科技有限公司 结合rpa和ai的表格生成方法及装置、计算设备、存储介质
US11790110B2 (en) 2021-02-09 2023-10-17 Nice Ltd. System and method for preventing sensitive information from being recorded
US11860950B2 (en) 2021-03-30 2024-01-02 Sureprep, Llc Document matching and data extraction
US20230229850A1 (en) * 2022-01-14 2023-07-20 Microsoft Technology Licensing, Llc Smart tabular paste from a clipboard buffer

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4435778C1 (en) * 1981-05-18 2002-09-03 Ibm Method for editing spatially related data in an interactive text processing system
JPS63266574A (ja) * 1987-04-24 1988-11-02 Hitachi Ltd 文書作成装置
JPH02116970A (ja) * 1988-10-27 1990-05-01 Fujitsu Ltd 表内データ自動抽出処理方式
JP2575480B2 (ja) * 1988-11-30 1997-01-22 富士電機株式会社 表構造化方式
JP2940936B2 (ja) * 1989-06-06 1999-08-25 株式会社リコー 表領域識別方法
US5175810A (en) * 1989-06-19 1992-12-29 Digital Equipment Corporation Tabular data format
KR930009639B1 (ko) * 1989-07-09 1993-10-08 가부시끼가이샤 히다찌세이사꾸쇼 화상데이타를 이용하는 문서데이타 처리방법 및 장치
JPH0362121A (ja) * 1989-07-28 1991-03-18 Nec Corp データ変換方式
US5293429A (en) * 1991-08-06 1994-03-08 Ricoh Company, Ltd. System and method for automatically classifying heterogeneous business forms
JP2579397B2 (ja) * 1991-12-18 1997-02-05 インターナショナル・ビジネス・マシーンズ・コーポレイション 文書画像のレイアウトモデルを作成する方法及び装置
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
US5438657A (en) * 1992-04-24 1995-08-01 Casio Computer Co., Ltd. Document processing apparatus for extracting a format from one document and using the extracted format to automatically edit another document
US5613131A (en) * 1993-01-29 1997-03-18 Microsoft Corporation Auto-formatting of tables in a spreadsheet program
US5615367A (en) * 1993-05-25 1997-03-25 Borland International, Inc. System and methods including automatic linking of tables for improved relational database modeling with interface
US5485566A (en) * 1993-10-29 1996-01-16 Xerox Corporation Method of finding columns in tabular documents

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015146111A (ja) * 2014-02-03 2015-08-13 富士通株式会社 アグリゲーションプログラム、端末装置及びアグリゲーション方法

Also Published As

Publication number Publication date
TW313645B (ko) 1997-08-21
KR960011773A (ko) 1996-04-20
US5881381A (en) 1999-03-09
JPH0887495A (ja) 1996-04-02
CA2157972C (en) 2002-10-08
CN1128372A (zh) 1996-08-07
CN1104677C (zh) 2003-04-02
CA2157972A1 (en) 1996-03-17

Similar Documents

Publication Publication Date Title
KR100196980B1 (ko) 표 데이터의 자르기와 붙이기 방법 및 데이터 처리 시스템
US5572651A (en) Table-based user interface for retrieving and manipulating indices between data structures
US5930813A (en) Method and system for designating objects
US5592608A (en) Interactively producing indices into image and gesture-based data using unrecognized graphical objects
US6867786B2 (en) In-situ digital inking for applications
US8230322B2 (en) Electronic spreadsheet for displaying and/or hiding a range of cells
US5495565A (en) Integrated form document editor with form descriptor table, background bitmap, graphics editor and text editor, composite image generator and intelligent autofill
US5450538A (en) Graphical user interface control for expansion and re-sizing of data fields in forms
JP2993673B2 (ja) 電子ファイル装置
US6952803B1 (en) Method and system for transcribing and editing using a structured freeform editor
US5680561A (en) Effectively locating an object within a compound document using an elevator
EP0051857A1 (en) Method for editing document
JP3167500B2 (ja) 手書き情報入力処理方式
US20030188257A1 (en) System and method in an electronic spreadsheet for displaying and/or hiding range of cells
JPH05224859A (ja) グラフィカル・ユーザ・インターフェース
JP2010020795A (ja) インクとのインターフェース
JPH0814822B2 (ja) 命令入力装置
JPH06208654A (ja) ペン入力図形編集システム
JPH06175775A (ja) 情報処理装置
JPS59220867A (ja) 機械設計の部品デ−タ処理方式
JP2642698B2 (ja) ハイパーテキスト間の関連性表示方法
JP3153863B2 (ja) フィールドにデータ・オブジェクトをリンクさせる方法及びシステム
JP2641391B2 (ja) 文字認識方法
JPS6360671A (ja) 画像処理装置およびその方法
JP2993881B2 (ja) キーワード生成方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080204

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee