KR101260594B1 - 문자열 검지 장치, 문자 평가 장치, 화상 처리 장치, 문자열 검지 방법, 문자 평가 방법, 제어 프로그램 및 기록 매체 - Google Patents

문자열 검지 장치, 문자 평가 장치, 화상 처리 장치, 문자열 검지 방법, 문자 평가 방법, 제어 프로그램 및 기록 매체 Download PDF

Info

Publication number
KR101260594B1
KR101260594B1 KR1020110002663A KR20110002663A KR101260594B1 KR 101260594 B1 KR101260594 B1 KR 101260594B1 KR 1020110002663 A KR1020110002663 A KR 1020110002663A KR 20110002663 A KR20110002663 A KR 20110002663A KR 101260594 B1 KR101260594 B1 KR 101260594B1
Authority
KR
South Korea
Prior art keywords
character
search
characteristic
detected
image
Prior art date
Application number
KR1020110002663A
Other languages
English (en)
Other versions
KR20110103840A (ko
Inventor
토모요시 아이자와
Original Assignee
오므론 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오므론 가부시키가이샤 filed Critical 오므론 가부시키가이샤
Publication of KR20110103840A publication Critical patent/KR20110103840A/ko
Application granted granted Critical
Publication of KR101260594B1 publication Critical patent/KR101260594B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

[과제]
화상에 대한 문자열 검지 처리의 처리 부하 경감 및 처리시간 단축을 실현한다.
[해결 수단]
본 발명의 문자열 검지 장치는, 1 이상의 문자로 된 문자열을 화상으로부터 검지하는 것이고, 문자의 오검지될 어려움을 나타내는 평가치를 문자마다 기억하는 문자 정보 기억부(32)와, 검지해야 할 문자열로서 자장치에 입력된 키워드에 포함되는 문자마다의, 문자 정보 기억부(32)에 기억되어 있는 평가치에 근거하고, 해당 문자마다, 검색 순서를 결정하는 검색 순서 결정부(23)와, 결정된 검색 순서에 따라, 키워드에 포함되는 문자마다 검색을 행하는 문자 검색부(24)를 구비하고 있는 것을 특징으로 한다.

Description

문자열 검지 장치, 문자 평가 장치, 화상 처리 장치, 문자열 검지 방법, 문자 평가 방법, 제어 프로그램 및 기록 매체{CHARACTER ARRAY DETECTING DEVICE, CHARACTER ESTIMATING DEVICE, IMAGE PROCESSING DEVICE, CHARACTER ARRAY DETECTING METHOD, CHARACTER ESTIMATING METHOD, CONTROL PROGRAM AND RECORDING MEDIUM}
본 발명은, 정지 화상 또는 동화상 등의 화상의 데이터를 처리하고 화상중에서 문자를 검지하는 문자 검지 처리에 관한 것이다.
종래, 화상(정지 화상 또는 동화상)중에서, 특정한 문자(키워드)를 검지하는 기술이 수많이 존재한다. 예를 들면, 특허 문헌 1 내지 3에는, 화상중의 모든 문자 영역을 반출하고, 반출한 각각에 관하여 문자 인식 처리를 행하고 텍스트 데이터로 변환하고 나서, 검지해야 할 키워드인지 아닌지를 판단하는 기술이 개시되어 있다.
그러나, 상술한 특허 문헌 1 내지 3에 기재된 기술에 있어서는, 아래와 같은 문제가 있다. 즉, 검지하고 싶은 문자 열인지 아닌지를 판단하기 위해, 화상으로부터 잘라낸 모든 문자에 관하여 인식 처리가 필요해지고, 결과로서 처리시간이 길어진다는 문제가 있다.
예를 들면, 인식 대상 문자가 일본어나 중국어의 경우, 문자 수가 많은(각각, 제일 수준 한자만으로 3000 문자 이상, 제2 수준 한자도 맞춘다면 6000 문자 이상 있다). 따라서 이러한 언어로, 문자 인식 처리를 실행하기 위해서는, 3000 내지 6000 이상의 문자와의 조합 처리가 필요해지고, 결과로서, 문자 인식 처리가, 막대한 시간을 필요로 하는 부하가 높은 처리로 되어 버렸다. 그리고, 인식된 모든 문자열에 관하여, 키워드와의 조합 처리가 더해지고, 처리시간은 또한 길어진다.
상기 처리시간의 문제는, 정지 화상보다도, 실시간 처리성이 요구되는 동화상를 처리하는 케이스에 있어서는, 한층더 심각한 문제가 된다.
상기의 기술에 대하여, 특허 문헌 4, 5에는, 문자 영역의 화상끼리를 조합하여 목적의 문자열 검지를 행하는 기술이 개시되어 있다. 구체적으로는, 먼저, 특정한 키워드를 구성하는 문자 폰트를 1 문자씩 판독하여 묘화하고, 그 키워드에 대응하는 문자열 화상을 작성한다. 다음에, 이 문자열 화상을 키로서, 화상에 대하여 유사 화상 검색을 행하는 것에 의해, 상기 화상으로부터 키워드를 검지한다.
상기 특허 문헌 4, 5에 기재된 기술에 의하면, 화상 사이의 조합 처리에 의해 문자열 검지를 행하기 때문에, 화상중의 모든 문자 영역에 대하여 문자 인식 처리를 행할 필요가 없고, 상술한 특허 문헌 1 내지 3에 기재된 기술과 비교하여, 처리시간을 단축시킬 수 있다.
또한, 화상 사이의 조합 처리에 이용하기 위한, 화상으로부터 문자의 특징량을 검출하는 기술로서는, 예를 들면, 비특허문헌 1에 기재된 코너 검출 기술, 윤곽선 검출 기술을 이용하는 것이 고려된다.
[선행 기술 문헌]
[특허 문헌]
특허 문헌 1 : 일본 특개평 08-205043호 공보(1996년 8월 9일 공개)
특허 문헌 2 : 일본 특개 2006-134156호 공보(2006년 5월 25일 공개)
특허 문헌 3 : 일본 특개 2008-131413호 공보(2008년 6월 5일 공개)
특허 문헌 4 : 일본 특개평 10-191190(1998년 7월 21일 공개)
특허 문헌 5 : 일본 특개 2008-004116호 공보(2008년 1월 10일 공개)
[비특허문헌]
[비특허문헌 1]
오쿠토미 쇼빈, 외 저 「디지털 화상 처리」CG-ARTS 협회 출판, 2007년 3월 1일 (제2판 이쇄), P. 208 내지 210, 12-2 절 「특징점 검출」
그러나, 상술한 특허 문헌 4, 5에 기재된 기술에 있어서는, 아래와 같은 문제가 있다. 즉, 조합 처리에 이용하는 문자열의 화상을 격납하기 위한 메모리 용량의 문제이다.
예를 들면, 영어로는, 키워드로서 지정된 「desk」라는 문자열에 대하여, 화상중에서 검색해야 할 문자열로서는, 「desk」, 「Desk」 및 「DESK」라고 한 복수의 표기 패턴이 고려된다. 일본어에서도, 「りんご(사과(링고))」라는 문자열에 대하여, 「りんご」뿐만 아니라 「リンゴ(링고)」라는 표기 패턴이 고려된다. 또, 한자에 있어서도, 「相澤(상택)」이라는 문자열에 대해서는, 「相澤」 및 「
Figure 112011002188432-pat00001
」의 2개의 표기 패턴이 고려된다.
상술한 특허 문헌 4, 5에 기재된 기술에 있어서는, 1개의 동일한 의미 내용의 키워드에서도, 복수의 표기 패턴이 있기 때문에, 그에 대응하여 복수의 문자열 화상을 생성할 필요가 있고, 화상 생성 처리의 부하가 증대한다는 문제가 있다. 또, 조합하기 위한 화상도 복수의 표기 패턴 부분을 준비하고 격납해 두기 때문에, 메모리 용량이 방대하게 된다는 문제가 있다.
나아가서는, 일본어, 중국어, 한국어 등의 언어에 있어서는, 문자를 철하는 방향으로 하여, 가로쓰기, 세로쓰기의 양쪽이 고려된다. 동일한 문자열이라도 세로쓰기와 가로쓰기에서는 다른 문자열 화상으로서 인식되기 때문에, 상술한 특허 문헌 4, 5에 기재된 기술에 있어서는, 세로쓰기와 가로쓰기의 양쪽의 화상을 준비할 필요가 있다. 따라서 처리 부하의 증대나 메모리 용량의 문제는, 한층더 심각하게 되고, 이와 같이 조합하는 것이 당연한 화상이 증가하면, 결과로서, 유사 화상 검색에 필요로 하는 처리시간도 문제가 된다. 상술한 바와 같이, 처리시간의 문제는, 정지 화상보다도, 실시간 처리성이 요구되는 동화상를 처리하는 케이스에 있어서는, 한층더 심각한 문제가 된다.
상기 문제점은, 상술한 특정한 언어의 문자에만 생기는 것이 아니고, 모든 언어의 문자 검지 처리 때에 공통으로 생기는 문제이고, 또, 동화상뿐만 아니라 정지 화상을 포함한 화상으로부터 문자를 검지한 때에 마찬가지로 생기는 문제이다.
본 발명은, 상기의 문제점을 감안하여 이루어진 것이고, 그 목적은, 화상에 대한 문자열 검지 처리의 처리 부하 경감 및 처리시간 단축을 실현하는 문자열 검지 장치, 문자 평가 장치, 화상 처리 장치, 문자열 검지 방법, 문자 평가 방법, 제어 프로그램 및 기록 매체를 실현하는 것에 있다. 또, 본 발명의 다른 목적은, 문자열 검지 처리를 실행하는 문자열 검지 장치에 있어서, 처리 부하 경감 및 처리시간 단축과 동시에, 성 메모리화를 양립한 것에 있다.
본 발명의 문자열 검지 장치는, 상기 과제를 해결하기 위해, 1 이상의 문자로 된 문자열을 화상으로부터 검지한 문자열 검지 장치에 있어서, 문자의 오검지되는 어려움을 나타내는 평가치를 문자마다 기억한 문자 정보 기억부와, 검지해야 할 문자열로서 자장치에 입력된 검지 대상 문자열에 포함되는 문자마다의, 상기 문자 정보 기억부에 기억되어 있는 평가치에 근거하고, 해당 문자마다, 상기 화상으로부터 문자를 검색하기 위한 검색 순서를 결정한 검색 순서 결정 수단과, 상기 검색 순서 결정 수단이 결정한 검색 순서에 따라, 상기 검지 대상 문자열에 포함되는 문자마다 상기 화상을 검색하는 문자 검색 수단을 구비하고 있는 것을 특징으로 한다.
상기 구성에 의하면, 문자열 검지 장치에 대하여 검지하는 것이 당연한 문자열이 지정되면, 먼저, 상기 검색 순서 결정 수단은, 상기 문자 정보 기억부에서, 지정된 문자열의 문자마다의 평가치를 참조한다. 평가치는, 오검지될 어려움을 나타내는 값이다. 그리고, 이 평가치에 근거하여, 지정된 문자열의 문자마다 검색 순서를 결정한다.
상기 문자 검색 수단은, 결정된 검색 순서대로, 문자마다 검색을 행한다.
이에 의해, 문자 인식 처리를 행하는 일 없이, 문자의 조합 처리에 의해 문자 검색을 행하는 경우에, 지정된 문자열이 복수의 문자로 이루어지고 있다고 하여도, 1자 1자 검색하여, 최종적으로 지정된 문자열을 검지할 수 있다. 1자 1자 검색하는 구성은, 복수의 문자를 검색하는 경우와 비교하여, 처리 부하를 경감할 수 있다. 또, 세로쓰기나 가로쓰기 등을 고려할 필요가 없어진다. 결과로서, 문자열 검지 처리의 부하 경감 및 처리시간 단축을 실현하는 것이 가능해진다. 또한, 비교 대상의 문자열에 관하여 세로쓰기와 가로쓰기를 제외하고 미리 문자의 정보를 지지해 둘 필요가 없기 때문에, 문자열 검지 장치에 있어서 성 메모리화를 실현할 수 있다.
또, 본 발명의 문자열 검지 장치는, 1자 1자 검색한 구성이고, 검색한 문자의 순서를, 상기 검색 순서 결정 수단이 상기 평가치에 근거하여 결정한다. 즉, 검색 순서는, 오검지될 어려움(검지되기 쉬움)에 따라 결정된다.
상기 구성에 의하면, 문자 검색 수단은, 지정된 문자열의 각 문자에 관하여, 올바르게 검지되기 쉬운 문자인지 어떤지, 어느 정도 오검지되기 어려운 것인가(되기 쉬운 것인가) 등을 고려하여 문자 검색을 실시할 수 있다. 따라서, 오검지를 가능한 한 회피하고, 더 효율적으로 문자열 검지 처리를 실행하는 것이 가능해지고, 결과로서, 처리 부하 경감 및 처리시간 단축을 실현할 수 있다.
상기 검색 순서 결정 수단은, 상기 검지 대상 문자열에 포함되는 문자중, 상기 오검지될 어려움을 나타내는 평가치가 가장 큰 값을 갖는 문자를 처음에 검색한다고 결정하는 것이 바람직하다.
상기 구성에 의하면, 상기 문자열의 본래의 문자의 병렬과는 무관계하게, 가장 올바르게 검지될 가능성이 높은 문자를 우선적으로 검색할 수 있기 때문에, 화상에 포함된 목적의 문자열을, 효율적으로 검지할 수 있다. 또, 화상 중에 목적의 문자열이 포함되지 않은 경우에는, 그것을 문자열 검지 처리가 빠른 단계에서, 더 올바르게 판단하는 것이 가능해진다.
상기 검색 순서 결정 수단은, 상기 문자 검색 수단이 상기 검지 대상 문자열에 포함된 목적의 문자를 상기 화상으로부터 검지하면, 다음에 검색한 문자를, 상기 검지 대상 문자열에 있어서의 문자의 나열에 있어서, 검지가 끝난 문자의 좌우 이웃의 문자중 상기 평가치가 큰 쪽으로 결정해도 좋다.
문자의 나열에 있어서 검지가 끝난 문자의 좌우 이웃의 문자는, 상기 화상에 있어서, 검지가 끝난 문자에 가까운 위치에 배치되어 있다고 생각된다. 따라서, 상기 화상에 있어서 검지가 끝난 문자의 위치를 기준으로 하고, 이러한 문자를 우선적으로 검색하는 것으로, 빠른 단계에서, 더 올바르게, 목적의 문자열의 유무를 검지할 수 있다. 또한, 좌우 이웃중, 평가치가 큰(즉, 오검지되기 어렵다)문자로부터 우선적으로 검색하기 때문에, 정밀도는 더욱 향상된다.
상기 검색 순서 결정 수단은, 문자의 평가치가 큰 순서로 검색되도록, 상기 검색 순서를 결정하는 것이 바람직하다.
상기 구성에 의하면, 지정된 문자열의, 본래의 문자의 ㄴ병렬과는 무관계하게, 올바르게 검지하기 쉬운 문자부터 순서로 문자를 검지해 갈 수 있다. 따라서, 화상에 포함된 목적의 문자열을, 효율적으로 검지할 수 있다. 또, 화상 중에 목적의 문자열이 포함되지 않은 경우에는, 그것을 문자열 검지 처리가 빠른 단계에서, 더 올바르게 판단하는 것이 가능해진다.
상기 문자 검색 수단은, 상기 검지 대상 문자열에 포함된 목적의 문자를 상기 화상으로부터 검지하면, 다음 문자를 검색하기 위한 검색 대상 영역을, 상기 화상의 전 영역에서, 검지가 끝난 문자의 근처 영역으로 한정하는 것이 바람직하다.
상기 구성에 의하면, 문자 검색 수단은, 검색 대상 영역을 화상의 전 영역에서 검지가 끝난 문자의 근처 영역으로 한정하고 문자 검색을 행한다. 문자열은, 많은 경우, 종 나열 또는 가로 나열하여 배치되어 있기 때문에, 목적의 문자열이 검지되면, 그 근처에 그 밖의 문자가 배치되어 있을 가능성이 높다.
이와 같이 검지될 가능성이 높은 영역으로 좁혀서 이후의 문자의 검색을 행하는 것에 의해, 조합 처리를 행할 범위를 대폭적으로 삭감할 수 있고, 문자열 검지 처리의 처리 부하 경감 및 처리시간 단축을 실현하는 것이 가능해진다.
상기 문자 검색 수단은, 상기 검지가 끝난 문자가, 상기 검지 대상 문자열에 있어서의 문자의 나열에 있어서 n번째의 문자이고, 다음에 검색하는 문자가 (n+1)번째 이상의 문자인 경우에, 검색 대상 영역을, 상기 검지가 끝난 문자의 우측 및 하측의 근처 영역으로 한정하고, 다음에 검색한 문자가 (n-1)번째 이하의 문자인 경우에, 검색 대상 영역을, 상기 검지가 끝난 문자의 좌측 및 상측의 근처 영역으로 한정하는 것이 바람직하다.
상기 구성에 의하면, 본래의 문자의 나열 근거하고, 검지가 끝난 문자의 위치에서, 다음에 검색할 문자의 위치를, 더 정확하게 엄선할 수 있다. 즉, 지정된 문자열의 나열에 있어서, 다음에 검색하는 문자가, 검지가 끝난 문자의 후에 오는 문자라면, 가로쓰기라면 검지가 끝난 문자의 우측, 세로쓰기라면 검지가 끝난 문자의 하측에 배치되어 있을 가능성이 높다. 또, 다음에 검색하는 문자가, 검지가 끝난 문자전에 오는 문자라면, 가로쓰기라면 검지가 끝난 문자의 좌측, 세로쓰기라면 검지가 끝난 문자의 상측에 배치되어 있을 가능성이 높다.
이처럼 검지될 가능성이 높은 영역으로 좁혀서 이후의 문자의 검색을 행하는 것에 의해, 조합 처리를 행하는 범위를 대폭적으로 삭감할 수 있고, 문자열 검지 처리의 처리 부하 경감 및 처리시간 단축을 실현하는 것이 가능해진다.
상기 평가치는, 문자의 형태가 복잡한 정도 오검지되기 어려운 문자로서 하여 문자의 형상 특성에 근거하여 산출되는 것이고, 상기 평가치는, 문자를 형성하는 선의 길이를 나타내는 요소 길이의 특성치, 및, 문자를 형성하는 선의 방향의 다양성을 나타내는 이방위성의 특성치의 적어도 어느 1개에 근거하여 산출되어도 좋다. 나아가서는, 상기 요소 길이의 특성치, 및, 상기 이방위성의 특성치는, 상기 문자를 형성하는 선의 방향이 수평 또는 수직 방향의 선보다도, 선의 방향이 경사인 선에 대하여 중량감 부여를 행하여 산출되어도 좋다.
상기 평가치는, 다른 문자 또 다른 문자의 일부와 비슷한 형상이 없는 문자 정도 오검지되기 어려운 문자로서, 다른 문자와의 판별의 용이성을 나타내는 판별 용이성의 특성치에 근거하여 산출되어도 좋다.
상기 평가치는, 문자의 표기가 한결같은 문자 정도 오검지되기 어려운 문자로서, 다른 표기의 유무 또는 다른 표기가 있는 경우의 다른 표기 문자끼리의 유사도에 근거하여 특정된 표기 균일성의 특성치에 근거하여 산출되어도 좋다.
상기 화상은 복수의 프레임으로 된 동화상이고, 상기 문자 검색 수단은, 상기 동화상로부터 검색 대상으로서 추출된 검색 대상 프레임마다, 상기 검지 대상 문자열에 포함된 각 문자를 검색한 것이고, 상기 문자 검색 수단은, 상기 검색 순서에 따라 각 문자를 검색할 때, 상기 검색 대상 프레임으로부터 목적의 문자를 검지할 수 없는 경우에 해당 검색 대상 프레임으로의 검색을 종료하고, 다음 검색 대상 프레임에 있어서, 검색 순서가 처음의 문자를 검색하는 것이 바람직하다.
상기 구성에 의하면, 문자 검색 수단은, 동화상의 1개의 프레임에 관하여, 결정된 검색 순서에 따라, 오검지되기 어려운 문자부터 순서로 목적의 문자를 검색하여 간다. 그리고, 목적의 문자가 검지되지 않는다면, 그 프레임에 대한 검색을 종료하고, 다음 프레임에 관하여, 또 오검지되기 어려운 문자부터 순서로 검색을 반복한다.
결정된 검색 순서에 따라 문자를 검색하면, 화상에 포함된 목적의 문자열을, 효율적으로 검지할 수 있고, 또, 화상 중에 목적의 문자열이 포함되지 않은 경우에는, 그것을 문자열 검지 처리가 빠른 단계에서, 더욱 올바르게 판단하는 것이 가능하기 때문에, 헷갈리기 쉽게 검지하기 어려운 문자의 판별에 시간이 걸리거나, 최후의 단계에서 문자열이 포함되지 않은 것이 판명되고 그때까지의 문자 검지 처리가 로스가 커지거나 하는 불편함을 회피할 수 있다.
이것에 의해, 실시간 처리성이 요구되는 동화상를 처리하고, 문자열을 검지할 때에, 더한층 심각한 문제였다, 처리 부하 및 처리시간의 문제에 관하여, 대폭적인 처리 부하의 삭감과, 처리시간의 단축을 실현할 수 있다.
본 발명의 문자 평가 장치는, 상기 과제를 해결하기 위해, 오검지될 어려움을 평가해야 할 문자로서 입력된 평가 대상 문자의 문자 특성을 분석한 문자 분석 수단과, 문자 특성을 문자마다 미리 기억하는 문자 특성 기억부와, 상기 문자 분석 수단이 분석한 문자 특성, 및, 상기 문자 특성 기억부에 기억되어 있는 문자 특성의 적어도 어느 한쪽에 근거하고, 상기 평가 대상 문자의 문자 특성마다의 특성치를 특정한 특성치 특정 수단과, 상기 특성치 특정 수단이 특정하는 이상의 특성치를 이용하여, 문자의 오검지될 어려움을 나타내는 평가치를 산출한 평가치 산출 수단과, 상기 평가치 산출 수단이 산출한 평가치를 상기 평가 대상 문자에 대응시키고 문자 정보 기억부에 격납한 평가치 격납 수단을 구비하고 있는 것을 특징으로 한다.
상기 문자 분석 수단은, 상기 평가 대상 문자의 형상 특성을 분석한 것이고, 상기 특성치 특정 수단은, 상기 문자 분석 수단이 분석한 결과에 근거하여, 상기 평가 대상 문자에 관하여, 문자를 형성하는 선의 길이를 나타내는 요소 길이 특성치, 및, 문자를 형성하는 선의 방향의 다양성을 나타내는 이방위성의 특성치의 적어도 어느 1개를 산출해도 좋다.
상기 문자 특성 기억부는, 다른 문자 또는 다른 문자의 일부와 비슷한 형상이 없는 문자 정도 오검지되기 어려운 문자로서, 다른 문자와의 판별의 용이성을 문자 특성으로서 문자마다 기억하는 것이고, 상기 특성치 특정 수단은, 상기 문자 특성 기억부에 기억되어 있다, 상기 평가 대상 문자의 문자 특성에 근거하고, 상기 평가 대상 문자의 판별 용이성의 특성치를 특정해도 좋다.
상기 문자 특성 기억부는, 문자 특성으로서, 다른 표기 문자의 그룹과 다른 표기 문자끼리의 유사도와 대응시켜 기억하는 것이고, 상기 특성치 특정 수단은, 상기 평가 대상 문자의 다른 표기의 유무 또는 다른 표기가 있는 경우의 다른 표기 문자끼리의 유사도에 근거하고, 문자의 표기가 한결같은 문자 정도 오검지되기 어려운 문자로서, 그 평가 대상 문자의 표기 균일성의 특성치를 특정해도 좋다.
이상으로 말한 문자 평가 장치의 구성에 의하면, 문자의 형상 특정 및 언어적 특성에 근거하고, 문자의 오검지될 어려움을 평가하는 것이 가능해진다. 어느 문자가 오검지되기 어렵고, 어느 문자가 오검지되기 쉬운 것인가를 미리 파악할 수 있다면, 문자열 검지 장치는, 단시간이면서 저 부하 처리로, 더욱더 효율적으로 목적의 문자열을 화상으로부터 검지하는 것이 가능해진다.
본 발명의 상술한 문자열 검지 장치는, 화상을 처리하는 것이 가능한 모든 화상 처리 장치에 적용하는 것이 가능하고, 본 발명의 문자열 검지 장치를 탑재했다, 그러한 화상 처리 장치도 본 발명의 범주에 들어간다.
본 발명의 문자열 검지 방법은, 상기 과제를 해결하기 위해, 1 이상의 문자로 된 문자열을 화상으로부터 검지한 문자열 검지 방법에 있어서, 검지해야 할 문자열로서 입력된 검지 대상 문자열을 취득한 문자열 취득 스텝과, 문자의 오검지될 어려움을 나타내는 평가치를 문자마다 기억한 문자 정보 기억부에 기억되어 있다, 상기 문자열 취득 스텝에 취득된 상기 검지 대상 문자열에 포함된 문자마다의 평가치에 근거하고, 해당 문자마다, 상기 화상으로부터 문자를 검색하기 위한 검색 순서를 결정한 검색 순서 결정 스텝과, 상기 검색 순서 결정 스텝에 결정된 검색 순서에 따라, 상기 검지 대상 문자열에 포함된 문자마다 상기 화상을 검색하는 문자 검색 스텝을 포함하는 것을 특징으로 한다.
본 발명의 문자 평가 방법은, 상기 과제를 해결하기 위해, 오검지될 어려움을 평가해야 할 문자로서 입력된 평가 대상 문자의 문자 특성을 분석하는 문자 분석 스텝과, 상기 문자 분석 스텝에 분석된 문자 특성, 및, 문자 특성을 문자마다 미리 기억하는 문자 특성 기억부에 기억되어 있는 문자 특성의 적어도 어느 한쪽에 근거하고, 상기 평가 대상 문자의 문자 특성마다의 특성치를 특정한 특성치 특정 스텝과, 상기 특성치 특정 스텝에 특정되는 1 이상의 특성치를 이용하고, 문자의 오검지될 어려움을 나타내는 평가치를 산출한 평가치 산출 스텝과, 상기 평가치 산출 스텝에 산출된 평가치를 상기 평가 대상 문자에 대응시켜 문자 정보 기억부에 격납하는 평가치 격납 스텝을 포함하는 것을 특징으로 한다.
또한, 상기 문자열 검지 장치 또는 상기 문자 평가 장치는, 컴퓨터에 의해 실현하여도 좋고, 이 경우에는, 컴퓨터를 상기 각 수단으로서 동작시키는 것에 의해 상기 문자열 검지 장치 또는 상기 문자 평가 장치를 컴퓨터에 실현시키는 상기 문자열 검지 장치 또는 상기 문자 평가 장치의 제어 프로그램, 및, 그것을 기록한 컴퓨터 판독 가능한 기록 매체도, 본 발명의 범주에 들어간다.
본 발명의 문자열 검지 장치는, 상기 과제를 해결하기 위해, 1 이상의 문자로 된 문자열을 화상으로부터 검지한 문자열 검지 장치에 있어서, 문자의 오검지될 어려움을 나타내는 평가치를 문자마다 기억하는 문자 정보 기억부와, 검지해야 할 문자열로서 자장치에 입력된 검지 대상 문자열에 포함된 문자마다의, 상기 문자 정보 기억부에 기억되어 있는 평가치에 근거하고, 해당 문자마다, 상기 화상으로부터 문자를 검색하기 위한 검색 순서를 결정한 검색 순서 결정 수단과, 상기 검색 순서 결정 수단이 결정하는 검색 순서에 따라, 상기 검지 대상 문자열에 포함된 문자마다 상기 화상을 검색하는 문자 검색 수단을 구비하고 있는 것을 특징으로 한다.
본 발명의 문자 평가 장치는, 상기 과제를 해결하기 위해, 오검지될 어려움을 평가해야 할 문자로서 입력된 평가 대상 문자의 문자 특성을 분석한 문자 분석 수단과, 문자 특성을 문자마다 미리 기억하는 문자 특성 기억부와, 상기 문자 분석 수단이 분석한 문자 특성, 및, 상기 문자 특성 기억부에 기억되어 있는 문자 특성의 적어도 어느 한쪽에 근거하고, 상기 평가 대상 문자의 문자 특성마다의 특성치를 특정한 특성치 특정 수단과, 상기 특성치 특정 수단이 특정한 1 이상의 특성치를 이용하고, 문자의 오검지될 어려움을 나타내는 평가치를 산출하는 평가치 산출 수단과, 상기 평가치 산출 수단이 산출한 평가치를 상기 평가 대상 문자에 대응시켜 문자 정보 기억부에 격납하는 평가치 격납 수단을 구비하고 있는 것을 특징으로 한다.
본 발명의 문자열 검지 방법은, 상기 과제를 해결하기 위해, 1 이상의 문자로 된 문자열을 화상으로부터 검지하는 문자열 검지 방법에 있어서, 검지해야 할 문자열로서 입력된 검지 대상 문자열을 취득하는 문자열 취득 스텝과, 문자의 오검지될 어려움을 나타내는 평가치를 문자마다 기억하는 문자 정보 기억부에 기억되어 있다, 상기 문자열 취득 스텝에 취득된 상기 검지 대상 문자열에 포함된 문자마다의 평가치에 근거하여, 해당 문자마다, 상기 화상으로부터 문자를 검색하기 위한 검색 순서를 결정하는 검색 순서 결정 스텝과, 상기 검색 순서 결정 스텝에 결정된 검색 순서에 따라, 상기 검지 대상 문자열에 포함된 문자마다 상기 화상을 검색하는 문자 검색 스텝을 포함하는 것을 특징으로 한다.
본 발명의 문자 평가 방법은, 상기 과제를 해결하기 위해, 오검지될 어려움을 평가해야 할 문자로서 입력된 평가 대상 문자의 문자 특성을 분석하는 문자 분석 스텝과, 상기 문자 분석 스텝으로 분석되는 문자 특성, 및, 문자 특성을 문자마다 미리 기억하는 문자 특성 기억부에 기억되어 있는 문자 특성의 적어도 어느 한쪽에 근거하고, 상기 평가 대상 문자의 문자 특성마다의 특성치를 특정하는 특성치 특정 스텝과, 상기 특성치 특정 스텝으로 특정된 1 이상의 특성치를 이용하고, 문자의 오검지될 어려움을 나타내는 평가치를 산출한 평가치 산출 스텝과, 상기 평가치 산출 스텝에 산출된 평가치를 상기 평가 대상 문자에 대응시키고 문자 정보 기억부에 격납하는 평가치 격납 스텝을 포함하는 것을 특징으로 한다.
따라서 화상에 대한 문자열 검지 처리의 처리 부하 경감 및 처리시간 단축을 실현하는 것이 가능해진다는 효과를 이룬다.
도 1은 본 발명의 실시 형태에 있어서 DVD 플레이어의 주요 부분 구성을 도시하는 블록도.
도 2는 문자 평가 장치의 문자 분석부가 실행하는 문자 요소 검출 처리 및 문자 요소 분해 처리의 일례를 도시하는 도면.
도 3의 (a) 및 (b)은, 문자 분석부가 구하는, 형상에 관한 특성치의 구체적인 예를 도시하는 도면.
도 4는 문자 분석부가, 복수의 문자에 관하여, 문자 분석을 실행한 결과의 일례를 도시하는 도면.
도 5의 (a)는, 문자 특성 기억부에 기억되어 있는, 판별 용이성에 관한 문자 특성 정보의 구체적인 예를 도시하는 도이고, (b)는, 문자 특성 기억부에 기억되어 있는, 표기 균일성에 관한 문자 특성 정보의 구체적인 예를 도시하는 도면.
도 6은 문자 평가 장치의 평가치 산출부가 산출한 평가치의 일례를 도시하는 도면.
도 7은 문자열 검지 장치의 문자 정보 기억부에 기억된 문자 데이터베이스의 구체적인 예를 도시하는 도면.
도 8은 문자 평가 장치가 실행하는 문자 평가 처리의 흐름을 도시하는 플로우차트.
도 9는 본 발명의 화상 처리 장치(DVD 플레이어), 표시부(텔레비전), 및, 조작부(리모트 콘트롤)의 외관과, 유저가 목적의 문자열을 입력하는 모습을 설명한 도면.
도 10은 문자열 검지 장치의 키워드 보존부에 유지되는 키워드의 데이터 구조의 일례를 도시하는 도면.
도 11은 검지 종료 문자의 영역에 대하여, 문자열 검지 장치의 문자 검색부에 의해 결정되는, 다음 문자를 검색하기 위한 검색 대상 영역의 일례를 도시하는 도면.
도 12는 검지 종료 문자의 영역에 대하여, 문자열 검지 장치의 문자 검색부에 의해 결정되는, 다음 문자를 검색하기 위한 검색 대상 영역의 구체적인 예를 도시하는 도면.
도 13은 DVD 플레이어에 있어서 화상 처리 및 문자열 검지 처리의 흐름을 도시하는 플로우차트.
도 14는 문자열 검지 장치가 실행하는 문자열 검지 처리의 흐름을 도시하는 플로우차트.
도 15는 오검지의 구체적인 예를 도시하는 도면.
<<실시 형태 1>>
본 발명의 실시 형태에 관하여, 도면에 근거하여 설명하면 이하와 같다.
이하에서는, 일례로서, 본 발명의 문자열 검지 장치를, 화상을 재생하고 표시한 DVD 플레이어에 탑재한 경우에 관하여 설명한다.
또한, 본 발명의 문자열 검지 장치는, DVD 플레이어로 한정하지 않고, 화상을 처리하는 것이 가능한 모든 화상 처리 장치에 적용하는 것이 가능하다. 예를 들면, 이것으로 한정되지 않지만, 디지털 비디오 레코더/플레이어, 블루 레이 디스크 플레이어, 디지털 비디오 카메라, 디지털 카메라, 디지털 텔레비전, 퍼스널 컴퓨터, 휴대 전화, 프린터, 스캐너 등, 정지 화상 및/또는 동화상를 처리하는 각종 화상 처리 장치에 적용하는 것이 가능하다. 또한, 정지 화상 데이터 및 동화상 데이터를 모두, 여기에서는 화상이라고 칭한다.
[DVD 플레이어(1)의 구성]
도 1은, 본 발명의 실시 형태에 있어서 DVD 플레이어(1)의 주요 부분 구성을 나타내는 블록도이다.
도 1에 나타내는 바와 같이, 본 실시 형태의 DVD 플레이어(화상 처리 장치)(1)는, 제어부(10), 기억부(11), 표시부(12), 조작부(13), 일시 기억부(14), 및, 이러한 각 부분에서 데이터의 송수신을 행하기 위한 공통의 신호선으로서의 버스(15)를 구비하는 구성으로 되어 있다.
표시부(12)는, DVD 플레이어(1)가 처리하는 화상을 표시하거나, 유저가 DVD 플레이어(1)를 조작하기 위한 조작 화면을 GUI(Graphical User Interface)화면으로서 표시하기도 하는 것이다. 표시부(12)는, 예를 들면, LCD(액정 디스플레이), 유기 EL 디스플레이 등의 표시 장치로 구성된다.
조작부(13)는, 유저가 DVD 플레이어(1)에 지시 신호를 입력하고, 조작하기 위한 것이다.
DVD 플레이어(1)는, 버스(15)를 통하여 직접 데이터 송수신을 행하는 것이 가능한 표시부(12) 및 조작부(13)를 구비하고 있어도 좋지만, 이와 같은 구성으로 한정되지 않는다.
본 실시 형태에서는, 표시부(12)는, 디지털 텔레비전에서 실현되고 있고, 버스(15)를 통하여 제어부(10)와 접속한 DVD 플레이어(1)의 외부 인터페이스(도시하지 않음)는, HDMI(High Definition Multimedia Interface) 단자 및 HDMI 케이블을 통하여, 디지털 텔레비전으로서의 표시부(12)와 접속하고 있다. 이것에 의해, DVD 플레이어(1)는, 자장치가 재생한 화상을 표시부(12)에 출력하고, 표시시킬 수 있다.
또, 본 실시 형태에서는, 조작부(13)는, 일례로서, 상기 디지털 텔레비전 및 해당 DVD 플레이어(1)에 공통의 리모트 콘트롤로서 실현되고 있어도 좋다. 조작부(13)에 설치된 버튼(십자 키, 결정 키, 문자 입력 키 등)에 대응한 신호는, 그 버튼이 눌린 때에, 적외선 신호로서 조작부(13)의 발광부에서 출력되고, DVD 플레이어(1) 또는 상기 디지털 텔레비전의 본체에 설치된 수광부를 통하여 DVD 플레이어(1) 또는 디지털 텔레비전에 입력된다. DVD 플레이어(1)의 수광부(도시하지 않음)를 통하여 수신된 신호는, 버스(15)를 통해 제어부(10)에 공급되고, 제어부(10)가 상기 신호에 응한 동작을 행한다.
제어부(10)는, 기억부(11)로부터 일시 기억부(14)에 판독된 프로그램을 실행하는 것에 의해, 각종의 연산을 행함과 동시에, DVD 플레이어(1)가 구비한 각 부분을, 버스(15)를 통하여 통괄적으로 제어하는 것이다.
본 실시 형태에서는, 제어부(10)는, 기능 블록으로서, 적어도, 키워드 취득부(22), 검색 순서 결정부(23), 및, 문자 검색부(24)를 구비하는 구성이다. 이러한 각 기능 블록은, DVD 플레이어(1)를 본 발명의 문자열 검지 장치(3)로서 기능시키기 위한 것이다.
또, DVD 플레이어(1)는 화상 처리 장치이기 때문에, 제어부(10)는, DVD 플레이어(1)를 화상 처리 장치로서 기능시키기 위한 기능 블록으로서, 동화상 재생부(25), 정지 화상 생성부(26), 및, 특징량 추출부(27)를 구비하고 있다. 상기 구성은, 화상 처리 장치가 기본적으로 구비하고 있는 기능 블록의 일례이고, 본 발명의 문자열 검지 장치(3)의 구성을 한정하는 것이 아니고, 화상 처리 장치의 기능에 따라 적절히 설계된 것이다.
또한, 본 실시 형태의 DVD 플레이어(1)에는, 본 발명의 문자 평가 장치(2)를 탑재하는 것도 가능하다. 본 발명의 문자 평가 장치(2)는, 문자열 검지 장치(3)가 검지할 수 있는 흔한 문자를 분석하고 평가하기 위한 것이고, 문자 평가 장치(2)가 평가하여 얻어진 문자의 정보를 이용하고, 문자열 검지 장치(3)는, 화상에 포함된 문자열을 검지하는 것이 가능해진다.
제어부(10)는, DVD 플레이어(1)를 본 발명의 문자 평가 장치(2)로서 기능시키기 위한 기능 블록으로서, 문자 분석부(20) 및 평가치 산출부(21)를 구비하고 있다.
상술한 제어부(10)의 각 기능 블록(20 내지 27)은, CPU(central processing unit)가, ROM(read only memory) 등으로 실현된 기억 장치에 기억되어 있는 프로그램을 RAM(random access memory) 등으로 실현된 일시 기억부(14)에 판독하여 실행함으로써 실현할 수 있다.
기억부(11)는, 제어부(10)가 실행하는 제어 프로그램 및 OS 프로그램, 및, 제어부(10)가, DVD 플레이어(1)가 갖는 각종 기능(예를 들면, 화상 처리, 문자열 검지 처리, 문자 평가 처리 등)을 실행할 때에 판독하는 각종의 고정 데이터를 기억하는 것이다. 본 실시 형태에서는, 기억부(11)에는, 예를 들면, 화상 기억부(30), 문자 특성 기억부(31), 및, 문자 정보 기억부(32)가 포함되고 있고, 각종의 고정 데이터를 기억한다. 기억부(11)는, 예를 들면, 내용의 개서가 가능한 불휘발성 메모리이다, EPROM(Erasable ROM), EEPROM(Electrically EPROM), 플래시 메모리 등으로 실현된다. 또한, 내용의 개서가 불필요한 정보를 기억하는 기억부로서는, 상술한 바와 같이, 기억부(11)와는 다른, 도시하지 않은, 읽기 전용의 반도체 메모리인 ROM (Read Only Memory) 등으로 실현되어도 좋다.
화상 기억부(30)는, DVD 플레이어(1)가 화상 처리 장치로서 처리하는 대상으로 된 화상의 데이터를 기억하는 것이다. 본 실시 형태에서는, 화상 기억부(30)는, 정지 화상 및 동화상를 모두 화상으로서 기억할 수 있다.
문자 특성 기억부(31)는, 평가치 산출부(21)가 문자를 평가할 때에 이용하는 문자의 특성에 관한 정보인 문자 특성 정보를 기억하는 것이다. 문자 특성 정보에 관해서는 후에 상술한다.
문자 정보 기억부(32)는, 문자열 검지 장치(3)가 문자열 검지 처리를 실행할 때에 이용하는 문자의 정보를 데이터베이스화하고 기억하는 것이다. 문자 정보 기억부(32)가 기억하는 문자 데이터베이스는, 문자마다, 문자를 하나의 의미로 식별하기 위한 문자 코드, 그 문자의 특징량, 및, 그 문자의 평가치를 대응시켜 격납한다. 이 문자 데이터베이스의 데이터 구조에 관해서는 후에 상술한다.
일시 기억부(14)는, DVD 플레이어(1)가 실행하는 각종 처리의 과정에서, 연산에 사용하는 데이터 및 연산 결과 등을 일시적으로 기억하는 이른바 워킹 메모리이고, RAM(Random Access Memory) 등으로 실현된다. 더 구체적으로는, 정지 화상 생성부(26)는, 화상 처리를 실행할 때, 처리 대상이 된는 화상을, 일시 기억부(14)의 화상 메모리(14a)에 전개하고, 이것에 의해, 특징량 추출부(27)가 화상에 관하여 픽셀 단위로 자세한 해석을 할 수가 있다. 또, 유저에 의해 입력된 키워드에 근거하여 문자열 검지 장치(3)가 문자열 검지 처리를 실행할 때, 입력된 상기 키워드는, 일시 기억부(14)의 키워드 보존부(14b)에 일시적으로 격납된다. 문자열 검지 장치(3)의 각 부분은, 적절히 키워드 보존부(14b)를 참조하고, 지정된 키워드를 화상으로부터 검지하는 문자열 검지 처리를 실행한다. 키워드 보존부(14b)의 데이터 구조에 관해서는 후에 상술한다.
제어부(10)의 동화상 재생부(25)는, 화상 기억부(30)에 기억되어 있는 동화상를 판독하고, 외부 출력용의 처리를 실시하여, 동화상를 재생하는 것이다.
동화상를 재생·표시하는 취지의 지시가 입력된 경우, 동화상 재생부(25)가 처리한 동화상는, 일단 화상 메모리(14a)에 격납되고, 프레임마다, 도시하지 않은 표시 제어부의 제어하에, 표시부(12)에 출력된다.
동화상로부터 소정의 문자열을 검지하는 취지의 지시가 입력된 경우, 동화상 재생부(25)가 처리한 동화상는, 정지 화상 생성부(26)에 출력된다.
또한, 화상 기억부(30)에 기억되어 있는 정지 화상을 표시하는 취지의 지시가 입력된 경우에는, 상기 표시 제어부는, 화상 기억부(30)로부터 정지 화상을 판독하고, 표시부(12)에 출력한다.
정지 화상 생성부(26)는, 동화상의 각 프레임으로부터, 문자열 검지 처리가 실행되는 대상으로 된 프레임을 추출하고, 처리 대상의 정지 화상을 생성하는 것이다. 정지 화상 생성부(26)는, 동화상에 포함되는 모든 프레임을 각각 정지 화상으로 하여도 좋지만, 본 실시 형태에서는, 소정초 간격, 또는, 소정 프레임 간격으로, 처리 대상으로 되는 정지 화상을 인발하는 처리를 실행한다.
또한, 정지 화상으로부터 소정의 문자열을 검지하는 취지의 지시가 입력된 경우, 도시하지 않은 표시 제어부가 지정된 정지 화상을 화상 기억부(30)로부터 판독하고 특징량 추출부(27)에 출력한다.
특징량 추출부(27)는, 정지 화상 생성부(26)가 생성한 정지 화상, 또는, 상기 표시 제어부가 판독 정지 화상으로부터, 문자열 검지 처리에 사용하는 특징량을 추출하는 것이다. 본 발명의 문자열 검지 장치(3)가 이용하는 특징량은, 문자열 검지 장치(3)가, 문자의 형상을, 문자마다 식별할 수 있는 것이라면 무엇이라도 좋다.
다만, 문자 검색부(24)는, 상기 특징량을 기지의 모델 특징량 비교하는 것에 의해, 문자의 검지를 실현하는 것이다. 따라서 문자 정보 기억부(32)에 기억되어 있는 문자마다의 모델의 특징량과, 특징량 추출부(27)가 추출하는 문자의 특징량과는 같은 수법으로 추출된 특징량인 것이 바람직하다. 또한, 화상으로부터 문자의 특징량을 검출하는 기술로서는, 예를 들면, 비특허 문헌 1에 기재된 코너 검출 기술, 윤곽선(에지)검출 기술을 이용하는 것이 고려되지만, 특징량 추출부(27)의 구성은, 이것으로 한정되지 않는다. 또는, 문자의 특징량이란, 문자의 화상라도 좋다.
[문자 평가 장치(2)의 구성]
본 발명의 문자 평가 장치(2)(도 1)는, 문자를 평가하고, 문자 1자 1자에 관하여, 평가치를 출력하는 것이다. 상세히는, 문자 평가 장치(2)는, 문자의 형상 특성 및 문자의 언어적 특성에 근거하고, 문자를 분석하고, 그 문자가 어느 정도 오검지되기 어려운 것인가(어느 정도 올바르게 검지되기 쉬운 것인가)라는 관점에서 평가를 행하고, 오검지될 어려움을 나타내는 평가치를 구한다. 평가치는, 문자 정보 기억부(32)에 있어서 문자마다 미리 기억된다.
본 발명의 문자 평가 장치(2)가 구한 평가치에 의해, 문자열 검지 장치(3)는, 문자의 오검지될 어려움을 문자마다 미리 파악하는 것이 가능해진다. 이것에 의해, 문자열 검지 장치(3)는, 키워드 중의 오검지되기 어려운 문자부터 순서로 검색을 행하는 것이 가능해지고, 종래와 비교하여 효율적인 문자열 검지 처리를 실현할 수 있다.
여기에서, 오검지란, 본래 문자가 아닌 배경 영역에, 목적의 문자가 포함되어 있다고 잘못 검지해 버리는 것, 다른 문자를 목적의 문자라고 잘못 검지해 버리는 것, 본래 목적의 문자인데 목적의 문자를 검지하고 손상시키는 것 등을 가리키고 있다. 이러한 오검지는, 문자의 형상이 심플한 것, 이(異) 표기 문자가 있는 것에 일어나기 쉽다. 예를 들면, 그 문자에 문자같은 특징적인 형태가 적거나 (숫자의 “1”, 장음을 나타내는“-” 등), 한자의 부수 등 다양한 문자의 요소의 일부로 하여 자주 쓰이는 문자이거나(“口”, “日” 등), 다른 문자인데 형상이 비슷할 것 같은 문자끼리이거나(가타카나의 “ニ(니)”와 한자 숫자의 “二”, 가타카나의 “ロ(로)”와 한자의 “口”, 통상의 “つ(츠)”와 촉음을 나타내는“っ” 등), 역으로, 1개의 의미로 표기가 복수 있는 문자이거나(“
Figure 112011002188432-pat00002
”과 “澤”, “A”와 “a” 등)하면, 오검지의 가능성은 높아진다.
이상의 내용으로부터, 「오검지될 어려움」과는, 문자의 형상이 복잡한 것, 유사 형상의 문자가 없는 것, 다른 표기 문자가 없는 것 등에 의해 평가할 수 있다고 할 수 있다. 다만, 이것으로 한정하지않고, 그 밖의 문자 형상의 특징, 그 밖의 문자 특성을, 오검지될 어려움의 평가에 이용해도 좋다.
문자 평가 장치(2)는, 문자의 형상 및 문자의 언어적 특성에 근거하여, 상술한 관점에서, 문자를 평가한다. 이하에서는, 문자 평가 장치(2)의 구성에 관하여 상세히 설명한다.
제어부(10)의 문자 분석부(20)는, 문자의 형상을 분석한 것이다. 본 실시 형태에서는, 문자 분석부(20)는, 문자를, 1개 이상의 선의 요소로 구성되어 있는 것이라고 파악하고, 문자 형상으로부터 요소를 검출한다. 문자 분석부(20)가 검출한 요소는, 직선이라도 곡선이라도 좋고, 또는, 곡선을 근사하여 직선으로서 검출해도 좋다. 그리고, 문자 분석부(20)는, 검출한 요소(선(線))의 방향, 또는, 직선인가 곡선인가에 따라, 검출한 각각의 요소를 분류하고, 문자를 분해한다.
도 2는, 문자 분석부(20)가 실행하는 문자 요소 검출 처리 및 문자 요소 분해 처리의 일례를 나타내는 도이다.
먼저, 평가를 행하고자 하는 평가 대상의 문자가 문자 평가 장치(2)에 대하여 입력된다. 여기에서는, 일례로서 가타카나의 「ボ」라는 문자가 조작부(13)에서 문자 평가 장치(2)에 대하여 입력되었다고 한다. 여기에서, 문자는, 문자 평가 장치(2)가, 입력된 문자가 「ボ」인 것을 인식할 수 있다면 어떤 형태로 입력되어도 좋다. 예를 들면, 문자 「ボ」는, 텍스트 데이터로 입력되어도 좋고, 화상으로 입력되어도 좋고, 문자 코드로 입력되어도 좋고, 음성으로 입력되어도 좋다.
문자 분석부(20)는, 평가 대상 문자 「ボ」를 취득하면, 해당 문자를 일정한 크기로 정규화한다. 도 2에 나타내는 예로는, 스케일(40)을 이용하고, 세로×가로=6 매스×6 매스의 틀에 균형있게 수습되도록 문자 「ボ」의 크기를 정규화한다. 이와 같이 하면, 평가 대상의 문자가 입력될 때의 크기의 불규칙함을 무시하고, 문자의 형상만을 올바르게 분석할 수 있다.
다음에, 문자 분석부(20)는, 스케일(40)로 통일된 문자 「ボ」로부터, 요소를 검출한다. 도 2에 나타내는 예로는, 곡선을 직선으로 근사하고, 모든 요소를 직선(41 내지 44)으로서 검출한다. 또한, 문자 형상으로부터 선을 검출한 방법은, 특히 한정되지 않고, 종래의 화상 처리 기술을 적절히 채용하는 것이 생각된다. 예를 들면, 비특허 문헌 1에 기재된 코너 검출 기술, 윤곽선(에지)검출 기술을 이용할 수 있다.
계속해서, 문자 분석부(20)는, 검출한 모든 요소를, 그 선의 종류나 방향 등에 따라 분류하고, 요소를 분해한다. 도 2에 나타내는 예는 일례이고, 본 발명은 이것으로 한정되지 않지만, 예를 들면, 문자 분석부(20)는, 문자 「ボ」로부터, 7개의 직선의 요소를 검출했기 때문에, 그러한 요소를, 종선(41), 횡선(42), 오른쪽 위 사선(43), 오른쪽 밑 사선(44)의 4개의 그룹으로 분류한다. 이렇게, 문자 분석부(20)는, 문자 「ボ」를, 종선(41)이 1개, 횡선(42)이 1개, 오른쪽 위 사선(43)이 1개, 오른쪽 밑 사선(44)이 4개의, 합계 7개의 요소(선)으로 분해한다. 이러한 분해된 요소(선)의 길이에 관해서도, 스케일(40)이 유효해진다.
문자 분석부(20)는, 상술한 순서로 얻어진 평가 대상의 문자(여기에서는「ボ」)의 분석 결과를 이용하고, 평가 대상 문자의 형상에 관한 특성치를 구한다. 특성치란, 문자 특성을 수치, 랭크 등의 값으로 나타내는 것이고, 상기 평가치를 산출하기 위해 사용된다. 본 실시 형태에서는, 문자 분석부(20)는, 분석 결과로부터, 형상에 관한 특성치로서, 요소 길이 및 이방위성의 2 종류의 특성치를 구한다.
도 3의 (a) 및 (b)은, 문자 분석부(20)가 구한, 형상에 관한 특성치의 구체적인 예를 나타내는 도이다. 도 3의 (a) 및 (b)은, 도 2에 나타내는 순서에 따라 얻어진 문자 「ボ」의 분석 결과에 근거하고, 문자 분석부(20)가, 문자 「ボ」의 요소 길이 및 이방위성을, 각각 구한 예를 나타내고 있다.
(요소 길이 산출)
특성치요소 길이는, 문자가 갖는 전(全) 요소(선)의 길이를 나타내는 것이다. 요소 길이가 클수록, 문자의 구성에 의해 많은 선이 사용되는 것으로 되고, 따라서 문자를 형성한 선이 많은만큼, 문자가 복잡하다(오검지되기 어렵다)고 판단할 수 있다.
상술한 바와 같이, 분해된 각선의 길이는, 문자를 정규화한 때에 사용한 스케일(40)을 이용하고 나타낼 수 있다.
문자 「ボ」는, 분석의 결과, 종선(41), 횡선(42), 오른쪽 위 사선(43), 오른쪽 밑 사선(44)의 4개의 그룹으로 되었기 때문에, 문자 분석부(20)는, 먼저, 선의 길이를 그룹마다 소계 한다. 도 3의 (a)에 나타내는 예로는, 종선(41)에 관하여, 길이 「5」의 선이 1개로 소계 「5」, 횡선(42)에 관하여, 길이 「5. 5」의 선이 1개로 소계「5. 5」, 오른쪽 위 사선(43)에 관하여, 길이 「3」의 선이 1개로 소계 「3」, 오른쪽 밑 사선(44)에 관하여, 4개의 길이가 각각 「2. 5」, 「2」, 「1. 5」, 「1. 5」로 소계 「7. 5」라고 산출된다.
마지막으로, 문자 분석부(20)는, 전 그룹의 선의 길이의 소계를 합계하고, 문자 「ボ」의 요소 길이를 「21」로 구한다. 여기에서는, 숫자의 「1」은, 스케일(40)의 1 매스 부분의 길이에 상당한다.
여기에서, 종선 길이의 소계를 X, 횡선의 길이의 소계를 Y, 사선의 길이의 소계(오른쪽 위, 오른쪽 밑 합쳐서)를 Z라고 할 때, 다음 식,
특성치 「요소 길이」=X+Y+kZ (단, k>1)
에 따라, 요소 길이를 산출해도 좋다. 즉, 종횡선보다도 사선의 길이에 비중 계수를 부가하는 구성이다. 예를 들면, 도 3에 나타내는 예에 있어서, 비중 계수 k=2라고 하면, 종선(41), 횡선(42), 오른쪽 위 사선(43), 오른쪽 밑 사선(44)의 소계는, 각각, 「5」, 「5. 5」, 「6」, 「15」로 되고, 문자 「ボ」의 요소 길이는, 「31. 5」가 된다.
상기 구성에 의하면, 종횡선(수평 방향의 선, 또는, 수직 방향의 선)보다도 사선이 많이 쓰이는 문자를 더 복잡하다(오검지되기 어렵다)고 판단할 수 있다.
(이방위성의 산출)
특성치 「이방위성」은, 문자를 구성한 선 방향의 다양성을 나타내는 것이다. 다양한 방향의 선이 사용되고 있는 문자만큼, 문자가 복잡하다고 판단할 수 있다. 예를 들면, 횡선만으로 구성된 문자보다도, 종선과 횡선으로 구성된 문자의 쪽이 복잡하다고 판단할 수 있고, 또한, 사선도 사용되고 있는 문자의 쪽이 한층더 복잡하다고 판단할 수 있다.
상술한 바와 같이, 문자 「ボ」가 분해된 각 선은, 선 방향에 따라, 종선(41), 횡선(42), 오른쪽 위 사선(43), 오른쪽 밑 사선(44)의 4개의 그룹으로 분류되어 있다. 문자 분석부(20)는, 먼저, 각 그룹에 속한 선의 유무를 확인한다. 문자 「ボ」는, 상기 4개의 그룹 전(全) 종류의 선을 갖고 있기 때문에, 종선 「있음」, 횡선 「있음」, 오른쪽 위 사선 「있음」, 오른쪽 밑 사선 「있음」으로 된다. 만약, 문자 「ロ」의 경우라면, 종선 「있음」, 횡선 「있음」, 오른쪽 위 사선 「없음」, 오른쪽 밑 사선 「없음」으로 된다.
그리고, 문자 분석부(20)는, 도 3의 (b)에 나타내는 테이블의 유무의 난에, 그 그룹에 속한 선이 「있음」이라면 「1」을, 「없음」이라면 「0」을 격납한다. 문자 「ボ」는, 모든 선이 「있음」으로 판단되기 때문에, 「유무」의 난에는, 「1」이 격납된다. 이들을 그대로 합계하여 이방위성의 특성치로 하여도 좋지만, 본 실시 형태에서는, 방향 계수를 이용하여 사선이 「있음」의 케이스 비중을 부가한다.
도 3의 (b)에 나타내는 예로는, 예를 들면, 종선, 횡선의 방향 계수를 「1」로 하는 데 대하여, 오른쪽 위 사선 및 오른쪽 밑 사선의 방향 계수를 「2」라고 미리 설정해 둔다. 문자 분석부(20)는, 그룹마다의 이방위성의 소계를, 「유무」×「방향 계수」로 구한다. 구체적으로는, 종선(41)에 관하여, 1×1로 소계「1」, 횡선(42)에 관하여, 1×1로 소계「1」, 오른쪽 위 사선(43)에 관하여, 1×2로 소계「2」, 오른쪽 밑 사선(44)에 관하여, 1×2로 소계「2」라고 산출된다.
마지막으로, 문자 분석부(20)는, 전 그룹의 이방위성의 소계를 합계하고, 문자 「ボ」의 이방위성을 「6」이라고 구한다. 상기 구성에 의하면, 종횡선보다도 사선이 사용되어 있는 문자를 더 복잡하다고 판단할 수 있다.
또한, 문자를 위에서 설명한 바와 같이 일정한 크기로 정규화한 때의 선의 길이에 대하여 반응을 일으키는 최소의 물리량을 설치하고, 그 방위의 선의 길이의 소계가, 일정 이하의 경우에는, 그 방위의 선은 「없음」이라고 판단해도 좋다.
여기에서, 예를 들면, 종선의 길이가 소정의 반응을 일으키는 최소의 물리량 이상일 때를 P=1, 그렇치 않을 때를 P=0으로 하고, 횡선의 길이가 소정의 반응을 일으키는 최소의 물리량 이상일 때를 Q=1, 그렇치 않을 때를 Q=0으로 하여, 사선의 길이가 소정의 반응을 일으키는 최소의 물리량 이상일 때를 R=1, 그렇치 않을 때를 R=0이라고 한다. 이때, 다음 식,
특성치 「이방위성」=P+Q+hR (단, h>1)
에 따라, 이방위성을 산출해도 좋다. 여기에서, 사선의 방향(오른쪽 위 사선(43)과 오른쪽 밑 사선(44)의 2와 같다)이, 1과 같을 때 h=2, 2와 같을 때 h=4라고 한다. 또, 소정의 반응을 일으키는 최소의 물리량을 「2」라고 한다.
이와 같은 법칙에 근거하면, 문자 「ボ」는, 종선의 길이 소계가 반응을 일으키는 최소의 물리량 이상이기 때문에 P=1, 횡선도 동일하게 Q=1, 그리고, 사선도 동일하게 R=1이 되고, 또한, 사선은, 오른쪽 위 사선과 오른쪽 밑 사선의 2와 같기 때문에, h=4가 된다. 따라서, 상술힌 식에 따라, 이방위성=1+1+4×1=6으로 산출된다. 예를 들면, 문자 「ロ」의 경우는, 종선은, P=1, 횡선은, Q=1, 사선은, R=0으로 되기 때문에, 이방위성의 특성치는, 1+1=2라고 산출된다.
「요소 길이」와 「이방위성」의 산출에 있어서, 사선에 중량감 부여를 행하는 구성에는, 아래와 같은 이점이 있다. 일반적으로, 배경 화상(=비분자화 상)안에는, 종선이나 횡선이 사선보다도 많이 존재하는 경우가 많다. 따라서 역으로 말하면, 선이 밀집하고, 그 선 가운데에서도, 경사 방향의 선은, 문자를 형성하고 있을 가능성이 높다고 판단할 수 있다. 즉, 사선을 갖는 문자는, 검지되기 쉽고, 또한, 오검지되기 어려운 경향에 있다고 할 수 있다. 그러므로, 종선이나 횡선보다도 사선에 대하여 중점을 두고 문자의 평가를 행하는 것으로, 문자의 오검지될 어려움을 더 올바르게 평가하는 것이 가능해진다. 그러한 평가에 의해 얻어진 평가치를 이용하면, 결과로서, 문자열 검지 처리의 처리시간을 더욱 단축시키고, 또한, 검지 정밀도를 보다 향상시키는 것이 가능해진다.
위에서 설명한 바와 같이 하여 요구된 문자의 형상에 관한 각 특성치는, 평가치가 최종적으로 산출되기까지의 동안, 일시 기억부(14)에 일시적으로 보존된 것이라도 좋고, 한 번 요구된 특성치는, 문자마다, 문자 특성 기억부(31)에 불휘발적으로 보존된 것이라도 상관하지 않는다.
또, 문자의 형상에 관한 특성치는, 상술한 예로 한정하지 않고, 예를 들면,요소(선) 수를 특성치로 하여도 좋고, 획수를 특성치로 하여도 좋다.
문자 분석부(20)는, 입력된 1 문자에 관하여, 이상의 문자 분석을 실행해도 좋고, 키워드가 입력된 경우에는, 그 키워드를 구성하는 전 문자 각각에 관하여, 이상의 문자 분석을 실행해도 좋다.
도 4는, 복수의 문자에 관하여, 문자 분석을 실행한 결과의 일례를 나타내는 도이다. 예를 들면, 「ロボット(로봇토)」이라는 문자열이 문자 평가 장치(2)에 입력된 경우, 도 4에 나타내는 바와 같이, 「ロ(로)」, 「ッ(츠)」, 「ト(토)」에 대해서도, 「ボ(보)」와 마찬가지로, 문자 분석부(20)가, 문자 형상으로부터 요소 검출을 행하여 요소의 분해를 행한다. 도 4에서는, 「ボ」의 분석 결과는, 도 2 및 도 3의 (a), (b)에 나타낸 바와 같기 때문에 기재를 생략한다.
평가치 산출부(21)는, 문자 분석부(20)가 산출한 문자 형상의 특성치, 및/또는, 문자 특성 기억부(31)에 기억되어 있는 문자 특성 정보로부터 요구되는 특성치를 이용하여, 평가 대상 문자의 평가치(오검지될 어려움)를 산출하는 것이다.
문자 특성 기억부(31)에는, 문자 분석부(20)의 분석에 의해 얻어지는 형상에 관한 문자 특성 이외의 모든 문자 특성에 관한 정보가 기억되어 있다. 본 실시 형태에서는, 일례로서, 평가치 산출부(21)는, 문자 특성 기억부(31)에 기억되어 있는 문자 특성 정보에 근거하여, 평가 대상 문자의 특성치 「판별용이성」과, 특성치 「표기균일성」을 특정한다.
(판별 용이성의 특정)
특성치 「판별용이성」은, 그 문자가 다른 문자라고 오해받는 일 없이(또 문자가 아닌 영역으로 헷갈리지 않고) 그 문자라고 올바르게 판별되는 것의 용이성을 나타내는 것이다. 문자 형상이 기하학적으로 심플하고, 문자같은 특징적인 형태가 적은 것이나, 한자의 부수 등 다양한 문자의 요소의 일부로서 자주 쓰여지는 것이나, 다른 문자인데 형상이 비슷할 것 같은 문자가 있는 것은, 판별 용이성이 낮고, 오검지 되기 쉽다고 할 수 있다.
본 실시 형태에서는, 판별 용이성은, 과거의 경험으로부터 미리 정해져 있는 것으로 한다. 예를 들면, 과거의 오검지의 비율이나, 부수(「변」이나 「방」 등)로서 다른 문자의 일부가 되는 출현 빈도나, 형상이 고사하는 다른 문자가 어느 정도 있는지 등에 따라, 헷갈리기 쉬운 문자 정도 판별 용이성이 낮은 값이 되도록 수치가 설정되어 있다.
도 5의 (a)은, 문자 특성 기억부(31)에 기억되어 있는, 판별 용이성에 관한 문자 특성 정보의 구체적인 예를 나타내는 도이다. 도 5의 (a)에 나타내는 예로는, 문자마다, 판별 용이성의 특성치가 관련지어 기억되어 있다. 이와 같이, 문자 특성 정보는, 판별 용이성의 특성치 그 자체라도 좋다. 또는, 문자 특성 정보에 대해 또한 다른 처리를 행하고, 최종적으로 특성치를 특정할 수 있는 것이라도 좋다.
본 실시 형태에서는, 판별 용이성의 정의역을, 일례로서, 0<「판별용이성」≤10이라고 한다. 어느 다른 문자와 헷갈리기 쉬운 것만큼 0에 가까운 값으로 한다. 예를 들면, 가타카나의 「ロ」는, 한자의 「口」와 유사하고, 기하학적 형상으로 문자가 아닌 사각형 모두 헷갈리기 쉽다. 또, 한자 「
Figure 112011002188432-pat00003
(협)」의 「변」이나, 한자 「知」의 「방」 등, 다른 문자의 일부로 하여 출현하는 확률의 큰 문자이다. 따라서 예를 들면, 가타카나의 「ロ」의 판별 용이성을 「1」로 한다. 한편, 가타카나의 「ボ」는, 「ロ」보다도 복잡하고, 타에 유사 형상의 문자도 없고, 다른 문자의 일부가 될 확률이 작다. 이 때문에, 예를 들면, 가타카나의 「ボ」의 판별 용이성을 「8」로 한다. 다른 모든 문자에 대해서도 마찬가지로, 문자마다 판별 용이성의 특성치가 미리 격납되어 있다. 상기 구성에 의하면, 평가치 산출부(21)는, 문자 특성 기억부(31)를 참조한 것에 의해, 입력된 문자의 판별 용이성을 곧바로 파악할 수 있다.
(표기 균일성의 특정)
특성치 「표기 균일성」은, 동의에서 형상이 다른 문자, 즉, 표기 변화의 적음을 나타내는 것이다. 만약, 표기 변화가 복수 있고, 게다가, 그러한 형상이 동떨어진 것이면, 1 종류의 표기에 관해서만 검색을 행한 때에, 그 문자를 검지하고 손상시키는 리스크가 높아진다.
따라서 표기가 1개밖에 없는 것이 가장 좋고, 표기 변화가 복수 있는 경우에도 적으면 적을수록 좋다. 나아가서는, 다른 표기문자끼리는, 형상이 비슷하면 비슷한만큼 좋다. 즉, 문자의 표기는 한결같은만큼 오검지되기 어렵다.
그래서, 본 실시 형태에서는, 평가치 산출부(21)는, 평가 대상 문자에 관하여, 다른 표기 문자의 유무, 및, 있음의 경우는 다른 표기 변화 수 및 다른 표기 문자끼리의 유사도에 근거하고, 그 문자의 표기 균일성을, 정의 역 0<「표기 균일성」≤10으로서 특정한다. 값이 클수록, 헷갈리기 쉬운 별도의 표기가 없고, 오검지되기 어렵다는 것을 의미한다.
도 5의 (b)은, 문자 특성 기억부(31)에 기억되어 있는, 표기 균일성에 관한 문자 특성 정보의 구체적인 예를 나타내는 도이다. 도 5의 (b)에 나타내는 예로는, 문자 특성 정보는, 다른 표기 문자가 존재하는 문자 그룹마다, 그것들 문자끼리의 유사도를 대응시킨 것이다.
평가치 산출부(21)는, 도 5의 (b)에 나타내는 테이블을 참조하고, 평가 대상 문자가, 다른 표기 그룹에 포함되어 있는지 아닌지를 검색한다. 문자가 다른 표기 그룹에 포함되고 있지 않으면, 평가치 산출부(21)는, 그 문자의 표기 균일성의 특성치를, 최대치의 「10」으로 특성 한다. 문자가 다른 표기 그룹에 포함되어 있는 경우는, 다음에, 평가치 산출부(21)는, 그러한 문자 사이에서의 문자 형상의 유사도를 참조한다. 예를 들면, 유사도 「10」은, 다른 표기 문자끼리가 아주 비슷한 경우에서 (예를 들면, 알파벳의 C의 대문자와 소문자), 표기의 다양성은 문자열 검지 처리에 악영향을 미치지 않는 문자 그룹에 부여된다. 평가치 산출부(21)는, 이와 같은 문자의 표기 균일성(특성치)을, 상기 유사도에 따라 「10」으로 특정한다.
또는, 예를 들면, 「ロ」, 「ボ」, 「ッ」, 「ト」의 4 문자는, 각각, 「ろ」, 「ぼ」, 「っ」, 「と」라는 다른 표기법을 갖고, 그들의 문자끼리의 문자 형상은 전혀 유사하지 않다. 그러면, 이러한 다른 표기 문자 그룹 4쌍에 관해서는, 유사도 「1」이 설정되어 있어도 좋다. 이 경우, 평가치 산출부(21)는, 「ロ」, 「ボ」, 「ッ」, 「ト」의 4 문자의 표기 균일성을, 상기 유사도에 따라 전부 「1」로 특정한다.
상기 구성에 의하면, 평가치 산출부(21)는, 1개의 평가 대상 문자에 관하여, 오검지될 어려움에 관계되는 4 종류의 특성치를 취득할 수 있다. 즉, 문자 분석부(20)가 산출한 요소 길이 및 이방위성, 문자 특성 기억부(31)에 기억되어 있는 판별 용이성, 및, 문자 특성 기억부(31)에 기억되어 있는 다른 표기에 관계된 문자 특성 정보로부터 특정된 표기 균일성의 4 종류이다. 평가치 산출부(21)는, 이 4 종류의 특성치를 이용하여, 문자의 평가치를 산출하고, 문자의 오검지될 어려움을 평가할 수 있다.
본 실시 형태에서는, 평가치 산출부(21)는, 평가치를, 다음 식,
평가치=요소 길이×이방위성×판별 용이성×표기 균일성에 의해 산출한다.
도 6은, 평가치 산출부(21)가 산출한 평가치의 일례를 나타내는 도이다. 예를 들면, 「ロボット」이라는 문자열이 문자 평가 장치(2)에 입력된 경우, 평가치 산출부(21)는, 도 6에 나타내는 바와 같이, 「ロ」, 「ボ」, 「ッ」, 및, 「ト」의 4 문자에 관하여, 각각, 4 종류(요소 길이, 이방위성, 판별 용이성, 표기 균일성)의 특성치를 취득한다.
그리고, 평가치 산출부(21)는, 문자 「ロ」의 평가치를, 상기 식에 따라, 「ロ」의 평가치=12×2×1×1=24라고 산출한다. 「ボ」, 「ッ」, 및, 「ト」에 대해서도 마찬가지로 평가치를 산출한다. 이와 같이 하여 산출된 평가치는, 문자마다 대응시키고, 문자 정보 기억부(32)에 격납되고, 문자열 검지 장치(3)가 참조할 수 있는 상태로 된다.
또한, 도 6에 나타내는 문자마다의 특성치의 테이블은, 평가치를 산출하기 위한 도중 경과의 정보이기 때문에, 일시 기억부(14)에 일시적으로 격납되고 있으면 되고, 후술하는 도 7에 나타내는 바와 같이, 평가치가 문자 정보 기억부(32)에 불휘발적으로 기록된 후는, 삭제되어도 상관하지 않는다. 그러나, DVD 플레이어(1)의 문자 평가 장치(2)가, 동일한 문자에 관하여 몇 번이나 평가를 행할 것 같은 상황에 있는 경우에는, 처음에 한 번 구한 특성치를 문자마다 기억부(11)에 불휘발적으로 기억해 두어도 좋다.
도 7은, 문자 정보 기억부(32)에 기억된 문자 데이터베이스의 구체적인 예를 나타내는 도면이다.
도 7에 나타내는 바와 같이, 문자 정보 기억부(32)의 문자 데이터베이스는, 문자마다, 문자를 하나의 의미로 식별하기 위한 문자 코드와, 문자 평가 장치(2)가 산출한 그 문자의 평가치와, 문자열 검지 장치(3)가 문자의 조합 처리로 이용하는 문자의 특징량이 대응된 구조로 되어 있다.
문자의 특징량은, 여기에서는, 특히 한정되지 않지만, 문자를 선 요소로 파악한 것, 문자의 윤곽선, 에지를 검출한 것, 문자의 코너를 검출한 것, 등인 것이 상정되어 있다. 그러나, 이러한 예로 한정하는, 특징량은, 문자열 검지 장치(3)가, 문자 데이터베이스에 기억되어 있는 특징량과, 검지 대상의 동화상로부터 얻어진 특징량을 비교하고, 문자의 일치, 불일치를 판단할 수 있는 정보라면 무엇이라도 좋다.
도 7에 나타내는 예로는, 문자「ロ」의 평가치는 「24」로 있고, 문자 「ボ」의 평가치는 문자 「1008」이고, 문자「ッ」의 평가치는 「114」이고, 문자 「ト」의 평가치는 「48」이다. 따라서 키워드 「ロボット」이 입력된 경우, 문자열 검지 장치(3)는, 문자 정보 기억부(32)의 문자 데이터베이스를 참조한 것에 의해, 키워드 안의 모든 문자의 오검지될 어려움을 파악하는 것이 가능해진다. 상기의 예로는, 문자열 검지 장치(3)는, 문자 「ボ」가 가장 오검지되기 어렵다고 판단할 수 있다.
[문자 평가 처리 플로우]
도 8은, 문자 평가 장치(2)가 실행하는 문자 평가 처리의 흐름을 나타내는 플로우차트이다. 먼저, 문자 평가 장치(2)에 대하여, 문자를 평가하는 취지의 지시와 동시에, 평가 대상 문자가 입력된다. 평가 대상 문자는, 1자라도, 복수의 문자라도 좋다.
평가 대상 문자가 입력되면 (S101에 있어서 YES), 먼저, 문자 분석부(20)는, 문자의 크기를 일정한 스케일 위에 정규화하고 문자의 형상을 분석하고, 그 문자를 구성하는 요소(직선, 곡선 등)를 검출한다(S102). 계속해서, 문자 분석부(20)는, 검출한 요소마다 문자를 분해하고, 각 요소를, 선 방향 등의 종류마다 분류한다(S103).
그리고, 문자 분석부(20)는, 분해한 선의 상기 스케일 상의 길이에 근거하고, 특성치 요소 길이를 산출한다(S104). 또, 문자 분석부(20)는, 분해한 선 방향의 다양성에 근거하고, 특성치 「이방위성」을 산출한다(S105).
한편, 평가치 산출부(21)는, 문자 특성 기억부(31)를 참조하고, 평가 대상 문자의 판별 용이성의 특성치를 특정한다(S106).
또한, 평가치 산출부(21)는, 문자 특성 기억부(31)를 참조하고, 다른 표기에 관한 문자 특성 정보를 취득한다(S107). 그리고, 평가치 산출부(21)는, 취득한 문자 특성 정보(예를 들면, 도 5의 (b))의 중에, 상기 평가 대상 문자가 다른 표기 그룹으로서 포함되어 있는지 아닌지를 판단한다(S108).
여기에서, 평가치 산출부(21)는, 평가 대상 문자가 다른 표기 문자를 갖지 않는다고 판단한 경우에는 (S108에 있어서 NO), 해당 문자의 표기 균일성의 특성치를, 최고치(여기에서는 「10」이라고 특정한다(S109). 반대로, 평가치 산출부(21)는, 평가 대상 문자가 다른 표기 문자를 갖는다고 판단한 경우에는 (S108에 있어서 YES), 평가 대상 문자와 그리 표기 문자와의 유사도에 따라, 표기 균일성의 특성치를 특정한다(S110). 예를 들면, 유사도가 「1」(유사하지 않다)라면, 표기 균일성의 특성치를 「1」이라고 특정한다.
그리고, 평가치 산출부(21)는, 이상의 각 스텝으로 요구된 4개의 특성치, 즉, 요소 길이, 이방위성, 판별 용이성, 및, 표기 균일성에 근거하고, 오검지될 어려움을 나타내는 평가치를 산출한다(S111). 예를 들면, 각 특성치를 승산하는 것에 의해 평가치를 구해도 좋다.
마지막으로, 평가치 산출부(21)는, 산출한 평가치를 해당 평가 대상 문자에 관련짓고 문자 정보 기억부(32)에 기억한다(S112).
도 8에서는, S104 내지 S110에 있어서, 4개의 특성치가 순차적으로 요구된 예를 나타내고 있지만, 이들 4개의 특성치는 도 8에 나타내는 각 스텝의 순서로 한정되지 않는다. 각각의 특성치는, 어느 순번으로 요구되어도 좋다.
이상으로 진술한 문자 평가 장치(2)의 구성 및 문자 평가 방법에 의하면, 문자의 형상 특성 및 언어적 특성에 근거하고, 문자의 오검지될 어려움을 평가하는 것이 가능해진다. 어느 문자가 오검지되기 어렵고, 어느 문자가 오검지되기 쉬운 것인가를 미리 파악할 수 있으면, 문자열 검지 장치(3)는, 단시간이면서 저 부하 처리로, 보다 효율적으로 목적의 문자열을 화상으로부터 검지하는 것이 가능해진다.
또한, 본 실시 형태에서는, 문자 평가 장치(2)가, 문자마다의 평가치를, 검지 대상으로 된 모든 문자에 관하여 미리 산출해 두는 구성에 관하여 설명했지만, 본 발명은, 상기 구성으로 한정되지 않는다. 예를 들면, 문자 평가 장치(2)의 구성을, 문자열 검지 장치(3)에 대하여 검지하고 싶은 키워드가 입력된 후에, 그 입력된 각 문자에 관하여 먼저 평가를 행하는 구성으로 해도 좋다.
다음에, 문자 평가 장치(2)가 산출한 평가치를 이용하고, 보다 효율적으로 문자열 검지 처리를 실행하는 문자열 검지 장치(3)의 구성에 관하여 상세히 설명한다.
[문자열 검지 장치(3)의 구성〕
발명의 문자열 검지 장치(3)(도 1)는, 문자 평가 장치(2)가 산출한 문자마다의 평가치를 이용하고, 효율적으로 문자열 검지 처리를 실행하는 것이다. 문자열 검지 처리란, 동화상나 정지 화상 등으로부터 지정된 문자열(1자라도 복수자라도 좋다)을 검지하는 처리이다.
제어부(10)의 키워드 취득부(22)는, 문자열을 검지하는 취지의 지시와 동시에, 검지해야 할 목적의 문자열을 취득하는한 것이다.
도 9는, 본 발명의 DVD 플레이어(1), 표시부(12)(텔레비전), 및, 조작부(13)(리모트 콘트롤)의 외관과, 유저가 목적의 문자열을 입력하는 모습을 설명한 도이다. 도 9에 나타내는 예로는, DVD 플레이어(1)는, 유저가 문자열 검지 장치(3)를 조작하기 위한 조작 화면을 표시부(12)에 출력하고, 표시시킨다. 도 9에 나타내는 예로는, 표시부(12)는, 유저가 검색한 문자열을, 조작부(13)를 조작하여 입력할 수 있는 GUI 화면을 표시한다.
유저는, 조작부(13)를 조작하는 것에 의해, 처리 대상의 동화상(또는 정지 화상)로부터 찾고 싶은 문자열을 문자열 검지 장치(3)에 대하여 입력할 수 있다. 도 9는, 목적의 문자열로서, 키워드 「ロボット」이 입력된 예를 나타내고 있다.
키워드 취득부(22)는, 키워드가 입력되고, 예를 들면, 조작부(13)의 결정 버튼 등이 눌리면, 입력된 키워드(예를 들면, 「ロボット」)를 취득하고, 일시 기억부(14)의 키워드 보존부(14b)에 격납한다.
도 10은, 키워드 보존부(14b)로 유지된 키워드의 데이터 구조의 일례를 나타내는 도이다. 도 10에 나타내는 바와 같이, 키워드 취득부(22)는, 취득한 키워드의 각 문자를 키워드의 나열 순서로 격납한다. 예를 들면, 키워드「ロボット」의 경우, 「ロ」는 이 키워드 가운데에서, 1 번째문자이기 때문에, 키워드 취득부(22)는, 문자「ロ」를 격납하고, 또한, 해당 문자에 문자 순서 「1」의 정보를 대응시키고 기억한다. 「ボ」, 「ッ」, 「ト」의 각 문자에 대해서도 마찬가지로, 문자 순서「2」, 「3」, 「4」를 대응시키고 기억한다.
검색 순서 결정부(23)는, 문자 검색부(24)가 키워드를 화상으로부터 검색한 때의, 키워드 중의 각 문자를 검색하는 순번을 결정하는 것이다. 검색 순서 결정부(23)는, 문자 평가 장치(2)가 산출하는 평가치에 근거하고, 검색 순서를 결정한다. 구체적으로는, 오검지되기 어려운(즉, 올바르게 찾기 쉬운)문자로부터 우선하고, 문자열 검지 처리에 걸리도록, 평가치가 높은 문자만큼, 검색 순서를 상위로 설정한다.
입력된 키워드가, 「ロボット」인 경우, 검색 순서 결정부(23)는, 도 7에 나타내는 문자 정보 기억부(32)의 문자 데이터베이스를 참조하고, 「ロ」, 「ボ」, 「ッ」, 「ト」의 각 문자의 평가치를 취득한다. 각 문자의 평가치는, 각각, 「24」, 「1008」, 「114」, 「48」이기 때문에, 검색 순서 결정부(23)는, 평가치가 높은 문자로부터 차례로 검색되도록, 검색 순서를, 「ボ」가 1번째, 「ッ」가 2번째, 「ト」가 3번째, 「ロ」가 4번째로 결정한다.
검색 순서 결정부(23)는, 결정한 검색 순서를, 도 10에 나타내는 바와 같이, 입력된 각 문자에 대응시키고 격납해도 좋다.
문자 검색부(24)는, 지정된 문자열을 화상의 중에서 검지한 문자열 검지 처리를 실행하는 것이다. 문자 검색부(24)는, 키워드 취득부(22)에 의해 취득된 키워드에 포함된 문자를 1 문자 1 문자 검색한다. 구체적으로는, 문자 정보 기억부(32)의 문자 데이터베이스에 기억되어 있는 목적의 문자의 특징량과, 화상으로부터 추출된 특징량을 비교하고, 매치한 특징량이 화상에 안에 포함되어 있는 것을 검지하고, 목적의 문자가 화상에 포함되어 있다고 판단한다.
본 발명에 있어서, 문자 검색부(24)는, 키워드의 각 문자를 검색할 때, 검색 순서 결정부(23)가 정한 검색 순서에 따라, 문자열 검지 처리를 실행한다. 예를 들면, 상술한 예로는, 문자 검색부(24)는, 키워드 보존부(14b)에 격납되어 있는 검색 순서(도 10)를 참조하고, 「ボ」, 「ッ」, 「ト」, 「ロ」의 순서로, 처리 대상 화상 중에서 목적의 문자를 검색한다.
문자 검색부(24)는, 가장 오검지되기 어려운 「ボ」에서 검색을 행하고, 「ボ」를 검지할 수 있다면, 다음 문자의 검색을 계속한다. 예를 들면, 도 10에 나타내는 바와 같이, 검지할 수 있었던 문자에 대해서는, 검지 종료인 것을 나타내는 「제(濟)」의 플래그를 부여해도 좋다. 문자 검색부(24)는, 다음에, 미 검지의 문자 가운데에서, 가장 높은 순서의 문자 검색을 행하고, 이것을 반복한다.
문자 검색부(24)는, 「ボ」를 검지할 수 없으면, 그 화상에는 지정된 키워드 「ロボット」이 포함되어 있지 않다고 판단한다. 이 판단은, 오검지되기 어려운 문자로부터 차례로 행해지기 때문에, 보다 빨리 올바르게 판단되고, 이후의, 오검지되기 쉬운 문자의 시간이 걸리는 필요없는 검지 처리를 생략할 수 있다.
또한, 문자 검색부(24)는, 1개 이상의 문자의 검지에 성공한 후는, 검지종료의 문자와, 앞으로 검지하려고 하는 문자와의 문자의 나열에 근거하고, 문자끼리의 위치 관계를 예측하고, 검색 대상 영역을 검지 종료의 문자의 근처 영역으로 좁히고, 문자열 검지 처리를 실행한다.
상세하게는, 검지 종료 문자가 문자열중의 n번째의 문자이고, 다음에 검색한 문자가 문자열중의 (n+1)번째의 문자인 경우에는, 문자 검색부(24)는, 검색 대상 영역을 화상 전체로 하지 않고, 상기 검지 종료 문자의 우측 및 하측의 소정의 크기의 영역으로 한정할 수 있다. 또, 문자 검색부(24)는, 다음에 검색한 문자가 문자열중의 (n-1)번째의 문자인 경우에는, 상기 검지 종료 문자의 좌측 및 상측의 소정의 크기의 영역으로 한정할 수 있다.
상기 구성에 의하면, 화상 전체 영역에서 목적의 문자를 검색한 경우와 비교하고, 또한 검색 범위를 좁힐 수 있기 때문에, 처리시간을 더욱 단축할 수 있다.
구체적인 예를 이용하여 설명하면 아래와 같다. 문자 검색부(24)가, 검색 순서 1번째의 문자 「ボ」를 검지한 후, 다음에, 문자를 검색한다고 한다. 도 10의 문자 순서에 의하면, 검지 종료 문자 「ボ」가 2번째임에 대하여, 다음에 검색하는 「ッ」는 3번째이다. 따라서, 「ッ」는 「ボ」의 근처 영역(일본어로는, 특히, 위나 아래)에 존재할 가능성이 높다.
그래서, 문자 검색부(24)는, 「ッ」를 검색하는 대상 영역을, 상기 검지 종료 문자 「ボ」의 근처 영역으로 한정한다. 예를 들면, 도 11에 나타내는 바와 같이, 「ボ」의 우측의 소정의 크기의 영역으로 한정한다(파선 틀내 망점 영역). 소정의 크기란, 예를 들면, 도 11에 나타내는 바와 같이, 검지 종료 문자의 영역의 사이즈를 h×h라고 하면, 그 오른편의 3h×3h의 크기의 영역으로 한정하는 것 등이 고려된다.
도 12에 나타내는 예로는, 검지 종료 문자(예를 들면 「ボ」)의 위 영역(1)에 있어서, 목적의 문자(예를 들면,「ッ」)가 검지된다. 이와 같이, 검색 대상 영역을 한정하면, 화상 전체를 검색하는 경우와 비교하여, 훨씬 단시간이면서 저 부하로, 목적의 문자「ッ」를 검지할 수 있다.
또한, 검지 종료 문자(예를 들면, 「ボ」)의 위 영역(1)에 목적의 문자(예를 들면)이 발견되지 못한 경우에는, 다음에 발견될 가능성이 있는 아래의 영역(2), 왼쪽의 영역(3), 위의 영역(4)이라는 바와 같이, 순차적으로 검색 대상 영역을 확대해 가고, 검색을 계속하면 좋다. 그러나, 그래도 발견되지 못한 경우에는, 최종적으로는, 검색 대상 영역을 화상 전체로 되돌려 재검색하면 좋다.
상기 구성에 의하면, 문자 검색부(24)에 있어서 문자열 검지 처리의 처리 효율을 비약적으로 향상시키는 것이 가능해진다.
또한, 문자 검색부(24)는, n번째의 검지 종료 문자에 대하여, 다음에 검색하는 문자의 문자 순서가, (n±2)번째, (n±3)번째, (n±4)번째, ··· 등과 같이, 검지 종료 문자와 다음에 검색하는 문자와의 거리가 길어지는 것에 따라, 그 위치 관계를 예측하고, 위치 관계에 합쳐서 검색 대상 영역을 더욱 넓혀도 좋다.
예를 들면, 도 12에 나타내는 예에 있어서, 「
Figure 112011002188432-pat00004
ロボット」의 「知」를 검지하고, 다음에 「ト」를 검지하는 경우에는, 「ト」를 검색하기 위한 영역을, 검지 종료 문자 「知」의 영역의 사이즈를 h×h라고 하면, 그 오른편의 6h×6h의 크기의 영역으로 한정하는 것 등이 고려된다.
이와 같은 경우에도, 화상 전체를 검색 대상 영역이라고 한 경우와 비교하고, 검색 대상 영역의 면적을 대폭으로 한정할 수 있고, 처리 부하의 절감 및 처리시간의 단축을 실현할 수 있다.
또한, 문자 검색부(24)는, 화상으로부터 얻어진 특징량으로부터, 선·에지가 밀집하고 있는 띠 모양의 영역을 검출하고, 수평 방향으로 늘어나는 대(帶) 영역이라면 문자는 가로쓰기일 가능성이 높다고 하여, 좌우의 영역을 상하의 영역보다도 우선적으로 검색하도록 하고, 수직 방향으로 늘어나는 대 영역이라면 문자는 세로쓰기일 가능성이 높다고 하여, 상하의 영역을 좌우의 영역보다도 우선적으로 검색하도록 하여도 좋다.
상기 구성에 의하면, 문자 검색부(24)에 있어서 처리 효율을 더욱 향상시키는 것이 가능해진다.
또, 문자 검색부(24)는, 문자열중에 있는 문자(예를 들면 「ボ」)를 검지한 후, 다음에 다른 문자를 검색할 때에는, 검지한 문자의 좌우 이웃의 문자(여기에서는, 「ロ」와 「ッ」)중, 평가치가 큰 문자(여기에서는, 「ッ」)를 우선적으로 검색하는 구성으로 해도 좋다.
[문자열 검색 처리 플로우]
도 13은, DVD 플레이어(1)에 있어서 화상 처리 및 문자열 검지 처리의 흐름을 나타내는 플로우차트이다. 여기에서는, 문자열 검지 장치(3)는, 동화상의 중에서 지정된 키워드를 검색하고, 목적의 키워드가 검지된 재생 위치를 출력한 것으로 한다. 먼저, 문자열 검지 장치(3)에 대하여, 문자열을 검지한 취지의 지시와 동시에, 검색하고 싶은 목적의 문자열(예를 들면, 키워드「ロボット」등)이 입력된다. 검색 대상 문자열은, 1자라도, 복수의 문자라도 좋다. 또, 검지 대상의 동화상가 여기에서 지정되어도 좋다.
키워드가 입력되면 (S201에 있어서 YES), 키워드 취득부(22)는, 입력된 키워드를 키워드 보존부(14b)에 격납한다(S202). 여기에서, 키워드 취득부(22)는, 문자의 나열에 따라서 취득한 문자마다 문자 순서를 대응시키고 동일하게 키워드 보존부(14b)에 격납한다.
계속해서, 검색 순서 결정부(23)는, 문자 정보 기억부(32)를 참조하고, 키워드 취득부(22)에 의해 취득된 키워드의 각 문자에 관하여, 평가치를 취득한다. 그리고, 검색 순서 결정부(23)는, 평가치가 큰 순서로, 검색 순서를 결정한다(S203). 검색 순서 결정부(23)는, 결정한 검색 순서를, 키워드 보존부(14b)에 문자마다 격납한다.
동화상 재생부(25)는, 지정된 검지 대상의 동화상를 화상 기억부(30)로부터 해독하고, 재생 위치(t)를 초기화(t=0에 세트)하여(S204), 동화상의 재생을 시작한다(S205).
본 실시 형태에서는, 처리 효율의 관점에서, 동화상의 전 프레임에 대하여 문자열 검지 처리를 실행하지 않고, 소정 초간격(예를 들면, t0 초)으로 인발한 프레임을, 검색 대상 프레임이라고 한다.
동화상 재생부(25)가 동화상를 재생하고, 재생 위치(t)가, 검색 대상 프레임에 도달할 때까지는 (S206에 있어서 NO), 동화상 재생부(25)는, 동화상의 재생을 진행한다(S210). 재생 위치(t)가, 동화상의 최종 프레임에 도달하지 않는 한은 동화상의 재생을 추진할 수 있다(S211에 있어서 NO). 그리고, 재생 위치(t)가 진행되는 중에, 재생 위치(t)가, 검색 대상 프레임에 도달한다면 (S206에 있어서 YES), 정지 화상 생성부(26)가, 도달한 검색 대상 프레임의 정지 화상을 생성한다(디코드 처리)(S207).
계속해서, 특징량 추출부(27)는, 생성된 정지 화상으로부터 특징량을 추출한다(S208). 상기 특징량은, 예를 들면, 비특허 문헌 1에 기재된 코너 검출 기술, 윤곽선(에지) 검출 기술 등을 이용하여 얻어지는 정보이고, 문자열 검지 장치(3)가 문자 형상을 식별하는 것이 가능한 정보이다.
문자 검색부(24)는, 검색 대상 프레임에 대하여 문자열 검지 처리를 실행한다(S209). 상세히는, 검색 대상 프레임의 특징량과, 문자 정보 기억부(32)에 기억되어 있는 키워드 중의 각 문자의 특징량과의 조합 처리를 행하고, 지정된 키워드(예;「ロボット」)가 검색 대상 프레임에 포함되어 있는지 아닌지를 판단한다. 문자열 검지 처리의 흐름의 상세한 것은, 도 14를 참조하면서 후술한다. 문자 검색부(24)는, 문자마다 검색을 행하고, 해당 검색 대상 프레임에 관하여, 지정된 키워드가 검지되었는지의 여부를 출력한다.
S209에서, 상기 검색 대상 프레임으로의 문자열 검지 처리가 종료되면, 동화상 재생부(25)는, 동화상의 재생을 더욱 진행한다(S210). 동화상 재생부(25)는, 재생 위치(t)가, 동화상의 최종 프레임에 도달하지 않는 한은 동화상의 재생을 추진할 수 있다(S211에 있어서 NO). 그리고, 다음 검색 대상 프레임에 도달하면, 그 검색 대상 프레임에 관하여, 상술한 문자열 검지 처리를 반복한다. 이후도, 문자 검색부(24)는, 소정 초(t0 초) 간격으로, 검색 대상 프레임에 관하여 문자열 검지 처리를 실행하고, 키워드 「ロボット」이 검지된 프레임의 재생 위치를 기억해 간다.
이렇게 하여, 마지막으로, 재생 위치(t)가 최종 프레임에 도달하고, 동화상의 재생이 종료된 경우에는 (S211에 있어서 YES), 문자 검색부(24)는, 문자열 검지 처리의 결과를 출력한다(S212). 예를 들면, 동화상중에, 키워드 「ロボット」이 1 회도 검지되지 않은 경우에는, 문자 검색부(24)는, 검지에 실패한 취지의 메시지를 표시부(12)에 출력한다. 또는, 키워드가 동화상중의 프레임에 있어서 검지된 경우에는, 키워드의 검지에 성공한 취지의 메시지와, 그 키워드가 검지된 프레임에 대응하는 검지 재생 위치를 표시부(12)에 출력한다.
[문자열 검색 처리 플로우-자세한 내용]
도 14는, 문자열 검지 장치(3)가 실행하는 문자열 검지 처리의 흐름을 나타내는 플로우차트이다. 도 13에 나타내는 S208에 있어서, 특징량 추출부(27)가 검색 대상 프레임(정지 화상)의 특징량을 추출하면, 문자열 검지 장치(3)는, S209의 문자열 검지 처리를 시작한다.
먼저, 문자 검색부(24)는, 키워드 보존부(14b)를 참조하고, 입력된 키워드의 문자중, 검색 순서가 최상위의 문자를 검지 대상 문자로서 취득한다(S301). 도 10에 나타내는 예로는, 문자 「ボ」가, 검지 대상 문자로서 취득된다.
그리고, 문자 검색부(24)는, 검색 대상 프레임(정지 화상)으로부터 추출된 특징량과, 문자 정보 기억부(32)에 기억되어 있는 「ボ」의 특징량을 비교하고, 상기 검색 대상 프레임에 대하여 검지 대상 문자 「ボ」의 검색을 행한다(S302).
목적의 문자(여기에서는 「ボ」)가 상기 검색 대상 프레임에 존재하지 않았던 경우는 (S303에 있어서 NO), 해당 검색 대상 프레임에는 지정된 키워드가 포함되지 않았다고 판단하고, 이 검색 대상 프레임에 대한 문자열 검지 처리를 종료한다(S304). 한편, 목적의 문자(여기에서는 「ボ」)가 상기 검색 대상 프레임에 존재하는 경우는 (S303에 있어서 YES), 문자 「ボ」를 검지 종료 문자로 하여, 도 10에 나타내는 바와 같이, 키워드 보존부(14b)에 있어서, 검지 종료 문자 「ボ」에 대하여 검지 종료 플래그를 세운다(S305). 여기에서, 입력된 키워드의 전문자에 대하여 검지 처리가 종료되고 있으면(즉, 전 문자에 관하여 검지 종료 플래그가 설정되고 있으면)(S306에 있어서 NO), 문자 검색부(24)는, 해당 검색 대상 프레임으로 지정되었던 키워드가 포함되어 있다고 판단하고, 이 검색 대상 프레임의 재생 위치를 기억하고, 그 검색 대상 프레임에 대한 문자열 검지 처리를 종료한다(S307).
한편, 문자 검색부(24)는, 아직 검색을 행하지 않은 미처리 문자가 있으면(S306에 있어서 YES), 미처리 문자(예를 들면, 도 10에 나타내는 검지종료 플래그가 부여되고 있지 않은 문자)중, 검색 순서가 최상위의 문자(도 10에 나타내는 예로는, 문자 「ッ」)를 다음 검지 대상 문자로서 취득한다(S308).
계속해서, 문자 검색부(24)는, 검지 종료 문자 「ボ」의 위치에 근거하고, 검색 대상 영역을 한정한다(S309). 예를 들면, 도 12에 나타내는 검색 대상 프레임에 있어서, 「ボ」의 근처 영역(1) 내지 (4)에 검색 대상 영역을 한정해도 좋다. 또는, 도 10에 나타내는 문자 순서에 의하면, 검지 종료 문자 「ボ」가 2번째의 문자인데 대하여, 다음 검지 대상 문자는 3번째의 문자이기 때문에, 「ボ」의 위 영역(1)과, 아래 영역(2)에 검색 대상 영역을 한정해도 좋다.
문자 검색부(24)는, 한정한 검색 대상 영역에 대하여, 검지 대상 문자의 특징량과의 조합을 행하고, 문자를 검색한다(S310).
상기 검색 대상 영역에 목적의 문자가 존재하는 경우에는 (S311에서 YES), S305에서 검지한 문자에 검지종료 플래그를 세운다. 미처리 문자가 있으면 문자의 검색을 반복하고(S308~), 없다면 해당 검색 대상 프레임에 있어서 문자열 검지 처리를 종료한다(S307).
한편, 상기 검색 대상 영역에 목적의 문자가 존재하지 않는 경우에는 (S311에서 NO), 프레임 전 영역으로 범위를 넓히고, 검지 대상 문자의 검색을 행한다(S312). 그래도 목적의 문자가 존재하지 않는다면(S303에서 NO), 해당 검색 대상 프레임에 있어서 문자열 검지 처리를 종료한다(S304).
문자 검색부(24)가, 해당 검색 대상 프레임에 있어서 문자열 검지 처리를 종료하면 (S304 또는 S307), 동화상 재생부(25)가, 다음 검색 대상 프레임에 도달할 때까지 동화상의 재생을 진행하고, 새로운 검색 대상 프레임에 대하여 상술한 문자열 검색 처리가 반복된다.
이상으로 진술한 문자열 검지 장치(3)의 구성 및 문자열 검지 방법에 의하면, 문자열 검지 장치(3)는, 처리 대상 화상으로부터 지정된 키워드를 검지한 때, 오검지되기 어려운 문자로부터 차례로, 문자를 검색할 수 있다. 오검지되기 어려운 문자는, 오검지되기 쉬운 문자와 비교하고, 적은 후보의 중에서 올바르고, 빨리 검지될 가능성이 높다. 따라서 키워드 중의 문자의 나열에 따라서 순차적으로 검색한 경우와 비교하고, 단시간·저 부하 처리로, 더욱 정밀도 좋게, 더 효율적으로 목적의 문자열을 화상으로부터 검지할 수 있다.
또한, 본 발명의 문자열 검지 장치(3)에 의하면, 문자마다의 특징량을 이용하고 1자 1자 조합하기 위해, 복수 문자의 문자열 화상이나 특징량을 샘플로서 보존해 둘 필요가 없다. 즉, 가로쓰기, 세로쓰기의 양쪽의 샘플을 용이하게 해 둘 필요가 없기 때문에, 문자 정보 기억부(32)에 있어서 메모리 절약화를 실현하는 것이 가능해진다. 또, 처리시간도 종래의 구성과 비교하여 유리하다.
[본원 발명의 효과]
본 발명의 문자열 검지 장치(3)는, 복수 문자로 된 키워드를 화상으로부터 검지한 경우에도, 문자마다의 특징량을 이용하고 1자 1자 조합하는 구성이다. 그리고, 문자열 검지 장치(3)는, 키워드의 문자의 병렬과는 무관계하게 오검지되기 어려운 문자로부터 차례로, 문자열 검색 처리를 실행하는 것을 특징으로 한다.
상기 특징은, 상기 구성에 있어서 생기는 이하의 문제를 해결하는 것이 가능해진다는 효과를 갖는다.
상술한 바와 같이, 대상 화상중에서 1 문자씩 검색을 행한 구성에서는, 가로쓰기, 세로쓰기의 양쪽의 복수의 문자열 화상을 생성할 필요가 없고, 종래와 비교해도, 처리시간 및 메모리 용량 모두 유리하다. 그러나, 이와 같은 구성에 있어서는, 아래와 같은 문제가 있다. 이하, 구체적인 예를 이용하여 이 문제점을 설명한다.
일반적으로, 배경 화상(=비문자화상)내에는, 「一」, 「十」, 「ロ」와 같이, 종횡 에지로 이루어지는 간단한 방의 모양이 수많이 존재하는 경우가 있다. 따라서 예를 들면, 도 15에 나타내는 화상을 검색 대상 화상으로 하여, 검지하고 싶은 키워드로서 「ロボット」이라는 문자열이 지정된 경우, 1번째문자의 「ロ」로부터 순서로 검색해 가면, 「ロ」와 비슷한 형상의 영역이 수많이 존재하기 때문에, 1 번째문자를 검색하는 단계에서 여분의 것까지 수많이 후보에게 열거되어 버린다는 문제가 있다. 도 15에 나타내는 화상에서 「ロ」를 검색하면, 액자(150)나, 창틀(151)···이나, 한자 「知」의 방의 부분(152) 등이, 문자 「ロ」와 달라서, 오검지된다는 문제가 있다. 이러한 오검지에 의한 여분의 후보가 열거된 것에 의해, 결과로서, 결과적으로 여분의 처리시간이 소비되어 버리는 문제가 있다. 또한, 이 후보 수에 제한을 마련한 경우, 본래라면, 자막 슈퍼임포즈 내의 가타카나의 「ロ」가 후보 필두에 열거되지 않으면 안되는 것을, 잘못한 후보가 너무나도 다수 열거됐기 때문에, 그 올바른 후보(153)가, 후보로부터 벗어나 버리는 것도 있고, 결과적으로 검지 정밀도가 나빠져 버린다는 문제가 있다.
또, 문자 「ロ」 등과 같이, 어느 다른 문자의 요소(「변」이나 「방」등)가 될 확률이 큰 문자는, 검지하고 싶은 대상뿐만 아니라, 어느 다른 문자의 요소까지도 잘못하여 후보에게 열거되어 버릴 확률이 크다. 예를 들면, 키워드로서 「ロボット」이라는 문자열이 지정된 경우, 「ロ」는 「
Figure 112011002188432-pat00005
」의 「변」이고, 또한, 「知」의 「방」 등, 어느 다른 문자의 요소가 될 확률이 큰 문자이다. 그 때문에, 예를 들면 대상 화상에 「
Figure 112011002188432-pat00006
ロボット」이라는 문자열이 존재하고 있던 경우, 「ロ」에서 검색하면, 처음의 검색의 단계에서 「ロ」뿐만 아니라, 「知」의 「방」의 부분까지도 후보에게 열거되어 버리고, 상기와 마찬가지로, 결과적으로 여분의 처리시간이 필요하게 되어 버린다. 또한, 이 후보수에 제한을 마련하고 있던 경우, 정답 문자열이 후보로부터 벗어나 버리는 것도 있고, 결과적으로 검지 정밀도가 나빠져 버린다.
또, 문자 형상의 특징량으로, 문자의 비교를 행하는 경우에는, 「desk」와 「DESK」, 「りんご」와 「リンゴ」, 「澤」과 「
Figure 112011002188432-pat00007
」과 같이, 동일한 의미인데 형태가 다른 표기가 있고, 그것을 고려하게 되면, 그것에 필요로 하는 처리시간이 늘어난다는 문제가 있다.
그러나, 본 발명의 문자 평가 장치(2)는, 문자를, 오검지될 어려움이라는 관점에서 평가하고 평가치를 부여하고, 문자마다 어느 정도 오검지되기 어려운 것인가(되기 쉬운 것인가)를 객관적으로 판단할 수 있도록 했다. 그리고, 본 발명의 문자열 검지 장치(3)를, 키워드의 각 문자를 1자씩 검색한 경우에, 그 중에서 가장 오검지되기 어려운 문자로부터 차례로 검색하는 구성으로 했다.
이 때문에, 상술한 문자 「ロ」 등과 같이 극히 오검지되기 쉬운 문자는, 극히 낮은 평가가 이루어지고, 검색이 뒤로 가도록 하는 한편, 문자 「ボ」 등과 같이 비교적 오검지되기 어렵고, 올바르게 검지되기 쉬운 문자가 우선적으로 검색되도록 했다. 또, 다른 표기를 갖는 문자로 처리시간이 걸리는 문자도, 낮은 평가가 이루어지고, 검색이 뒤로 가도록 했다.
이처럼, 본원 발명은, 지정된 문자열을 대상 화상으로부터 검지한 때에는, 상기 평가치가 큰 문자로부터 차례로 검색하는 것으로, 처리시간을 단축시킬 수 있다. 또, 올바르게 검지되기 쉬운 문자로부터 차례로 검색을 행하는 것으로, 정밀도 향상의 효과도 기대할 수 있다. 또한, 1자 1자 조합한 구성이기 때문에, 모델로 된 특징량은 1자씩 지지해 두는 것만으로 종료되기 때문에, 성(省)메모리화의 효과도 기대할 수 있다.
많은 문자 화상은, 문자 이외의 화상과 비교하고, 에지(선)가 밀집해 있고, 또한, 에지의 이방위성이 높다(선이 여러 가지 방향을 향하고 있다)고 하는 특징이 있다. 따라서 일반적으로, 이러한 특징을 특히 강하게 갖는 문자는, 검지하기 쉽고, 또한, 오검지하기 어려운(=배경의 모양 등을 문자로서 오검지해 버릴 가능성이 적다)경향에 있다고 할 수 있다. 때문에, 이러한 특징을 지표로서 정해진 평가치가 큰 문자로부터 검색하는 것으로, 처음의 검색의 단계에서 효과적으로 후보를 엄선할 수 있기 때문에, 처리시간을 단축시킬 수 있다.
예를 들면, 키워드로서 「ロボット」이라는 문자열이 지정된 경우, 배경 화상내와 비슷한 것 같은 모양이 흔히 있는 「ロ」(도 15 참조)에서 검색하는 것이 아니라, 에지가 밀집해 있고, 또한, 에지의 이방위성이 높은 「ロ」에서 검색하는 것으로, 처음의 검색의 단계에서 여분의 것까지 수많이 후보에게 열거되어 버리는 것이 없어지고, 결과, 처리시간을 단축시킬 수 있다. 또한, 후보수에 제한을 마련하고 있는 경우에도, 정답 문자열이 후보로부터 벗어나 버릴 가능성이 낮아지고, 결과적으로 검지 정밀도도 향상시킬 수 있다.
또, 어느 다른 문자의 요소(「변」이나 「방」 등)가 될 확률이 큰 문자는, 검지하고 싶은 대상뿐만 아니라, 어느 다른 문자의 요소까지도 잘못하여 후보에게 열거되어 버리는 확률이 크다고 할 수 있다. 예를 들면, 키워드로서 「ロボット」이라는 문자열이 지정된 경우, 「ロ」는 「
Figure 112011002188432-pat00008
」의 「변」으로 있고, 또한, 「知」의 「방」임 등, 어느 다른 문자의 요소가 될 확률이 큰 문자이기 때문에, 예를 들면 대상 화상에 지각 「ロボット」이라는 문자열이 존재한 경우, 「ロ」에서 검색하면, 처음의 검색의 단계에서 「ロ」뿐만 아니라, 「知」의 「방」의 부분까지도 후보에게 열거되어 버린다. 그러나, 어느 다른 문자의 요소가 될 확률이 작은 「ボ」에서 검색하면, 처음의 검색의 단계에서 「
Figure 112011002188432-pat00009
ロボット」이라는 문자열의 부분에서는 「ボ」만이 후보에게 열거될 가능성이 크다. 때문에, 이 점에 착안하여 정해진 평가치가 큰 문자로부터 검색하는 것으로, 처음의 검색의 단계에서 효과적으로 후보를 엄선할 수 있기 때문에, 처리시간을 단축시킬 수 있다.
또한, 후보수에 제한을 마련하고 있는 경우에도, 정답 문자열이 후보로부터 벗어나 버릴 가능성이 낮아지고, 결과적으로 검지 정밀도도 향상시킬 수 있다.
또, 다른 표기법을 갖지 않는 문자, 또는, 갖는 경우에도, 그러한 문자간에서의 문자 형상이 유사하고 있는 것은, 대상 화상내를 검색할 때에 1과 같이 문자 형상만을 검색하면 되기 때문에, 2과 같이 이상의 문자 형상에 관하여 검색해야 할 문자와 비교하여, 빠르게 검지하기 쉽다고 할 수 있다. 때문에, 이 점에 착안하여 정해진 평가치가 큰 문자로부터 검색하는 것으로, 처리시간을 단축시킬 수 있다.
또한, 본 발명의 문자열 검지 방법에 의하면, 1 문자씩 검색을 행하기 때문에, 가로쓰기, 세로쓰기의 양자의 문자열 화상을 생성할 필요가 없고, 메모리 생략화도 양립할 수 있다.
또한, 본 발명의 문자열 검지 장치(3)는, 오검지되기 어려운 문자로부터 차례로 검색을 행하고 목적의 문자가 검지된 후, 2번째 문자 이후의 문자 검지 처리에 있어서는, 검색 대상 영역을 화상 전체로 하지 않고, 검지 종료의 문자 영역 근처로 좁히는 것이 가능하다.
상기 구성에 의하면, 문자 검색부(24)는, 전술의 「ロ」를 검색할 때에는, 「ロ」보다도 평가치가 높은 「ボ」「ッ」「ト」의 각 문자가 이미 검지 종료가 되어 있고, 이들 「ボ」「ッ」「ト」의 각 문자의 위치 관계로부터, 「ロ」가 존재하는 영역을 한정할 수 있다. 도 12에 나타내는 예로는, 영역(3)으로 한정하는 것이 가능하다.
이것에 의해, 화상 전체에서 「ロ」 검색하는 구성에서는, 액자(150)나, 창틀(151)··· 등, 잘못된 후보를 다수 열거해 버리는 바, 본원의 영역(3)으로 한정하고 「ロ」검색하는 구성에서는, 잘못되었다 하여도 「知」의 방 부분(152)을 후보에게 열거하는 정도로 종료한다.
이와 같이, 처리 부하를 대폭적으로 삭감하는 것이 가능해지고, 결과로서, 처리시간을 대폭적으로 단축하고, 효율적이고 또 제도 있게 키워드를 화상으로부터 검지하는 것이 가능해진다.
본 발명은 상술한 실시 형태로 한정되는 것이 아니고, 청구항에 나타낸 범위에서 다양한 변경이 가능하다. 즉, 청구항에 나타낸 범위에서 적절히 변경한 기술적 수단을 조합시키고 얻어지는 실시 형태에 대해서도 본 발명의 기술적 범위에 포함된다.
마지막으로, 문자 평가 장치(2), 및, 문자열 검지 장치(3)의 각 블록, 특히, 문자 분석부(20), 평가치 산출부(21), 키워드 취득부(22), 검색 순서 결정부(23), 및, 문자 검색부(24)는, 하드웨어 로직에 의해 구성해도 좋고, 다음과 같이 CPU를 이용하여 소프트웨어에 의해 실현해도 좋다.
즉, 문자 평가 장치(2)(문자열 검지 장치(3))는, 각 기능을 실현하는 제어 프로그램의 명령을 실행하는 CPU(central processing unit), 상기 프로그램을 격납하는 ROM(read only memory), 상기 프로그램을 전개하는 RAM(random access memory), 상기 프로그램 및 각종 데이터를 격납하는 메모리 등의 기억 장치 등(기록 매체)을 구비하고 있다. 그리고, 본 발명의 목적은, 상술한 기능을 실현하는 소프트웨어인 문자 평가 장치(2)(문자열 검지 장치(3))의 제어 프로그램의 프로그램 코드(실행 형식 프로그램, 중간 코드 프로그램, 원시 프로그램)를 컴퓨터로 판독 가능하게 기록한 기록 매체를, 상기 문자 평가 장치(2)(문자열 검지 장치(3))에 공급하고, 그 컴퓨터(또는 CPU나 MPU)가 기록 매체에 기록되어 있는 프로그램 코드를 판독하고 실행하는 것에 따라서도, 달성 가능하다.
상기 기록 매체로서는, 예를 들면, 자기 테이프나 카세트 테이프 등의 테이프 계, 플로피디스크(등록상표) 디스크/하드 디스크 등의 자기 디스크나 CD-ROM/MO/MD/DVD/CD-R 등의 광디스크를 포함한 디스크 계, IC 카드(메모리 카드를 포함함)/광카드(card) 등의 카드 계, 또는 마스크 ROM/EPROM/EEPROM/플래시 ROM 등의 반도체 메모리계 등을 이용할 수 있다.
또, 문자 평가 장치(2)(문자열 검지 장치(3))를 통신 네트워크와 접속 가능하게 구성하고, 상기 프로그램 코드를, 통신 네트워크를 이용하여 공급해도 좋다. 이 통신 네트워크로서는, 특히 한정되지 않고, 예를 들면, 인터넷, 인트라넷, 엑스트라 네트, LAN, ISDN, VAN, CATV 통신 망, 가상 전용 망(virtual private network), 전화 회선망, 이동체 통신 망, 위성 통신 망 등이 이용 가능하다. 또, 통신 네트워크를 구성하는 전송 매체로서는, 특히 한정되지 않고, 예를 들면, IEEE1394, USB, 전력선 반송, 케이블 TV 회선, 전화 선, ADSL 회선 등의 유선이라도, IrDA나 리모트 콘트롤과 같은 적외선, Bluetooth(등록상표), 802. 11 무선, HDR, 휴대 전화 망, 위성 회선, 지상파 디지털 망 등의 무선이라도 이용 가능하다. 또한, 본 발명은, 상기 프로그램 코드가 전자적인 전송으로 구현화됐다, 반송파에 매입된 컴퓨터 데이터 신호의 형태라도 실현될 수 있다.
[산업상의 이용 가능성]
본 발명의 문자열 검지 장치는, 화상으로부터 지정의 문자를 단시간이면서 저 부하 처리로 검지할 수 있기 때문에, 화상을 처리하는, 디지털 비디오 레코더/플레이어, 블루 레이 디스크 플레이어, 디지털 비디오 카메라, 디지털 카메라, 디지털 텔레비전, 퍼스널 컴퓨터, 휴대 전화, 프린터, 스캐너 등, 정지 화상 및/또는 동화상를 처리하는 각종 화상 처리 장치에 적용하는 것이 가능하다. 본 발명의 문자열 검지 장치는, 부하가 큰 동화상 처리에 있어서도 실시간 처리성을 손상시키는 일 없이 단시간에 문자열을 검지할 수 있기 때문에, 본 발명의 문자열 검지 장치를, 동화상 처리 장치 또는 동화상 재생 장치에 적용하는 것은 특히 메리트가 크다.
1 : DVD 플레이어(화상 처리 장치)
2 : 문자 평가 장치
3 : 문자열 검지 장치
10 : 제어부
11 : 기억부
12 : 표시부
13 : 조작부
14 : 일시 기억부
14a : 화상 메모리
14b : 키워드 보존부
15 : 버스
20 : 문자 분석부(문자 분석 수단/특성치 특정 수단)
21 : 평가치 산출부(특성치 특정 수단/평가치 산출 수단/평가치 격납 수단)
22 : 키워드 취득부(검지 대상 문자열 취득 수단)
23 : 검색 순서 결정부(검색 순서 결정 수단)
24 : 문자 검색부(문자 검색 수단)
25 : 동화상 재생부
26 : 정지 화상 생성부
27 : 특징량 추출부
30 : 화상 기억부
31 : 문자 특성 기억부
32 : 문자 정보 기억부
40 : 스케일
41 : 종선(요소)
42 : 횡선(요소)
43 : 사선(요소)
44 : 사선(요소)

Claims (20)

1 이상의 문자로 된 문자열을 화상으로부터 검지하는 문자열 검지 장치에 있어서,
문자의 오검지될 어려움을 나타내는 평가치를 문자마다 기억하는 문자 정보 기억부와;
검지해야 할 문자열로서 상기 문자열 검지 장치에 입력된 검지 대상 문자열에 포함된 문자마다의 상기 문자 정보 기억부에 기억되어 있는 평가치에 근거하여, 해당 문자마다, 상기 화상으로부터 문자를 검색하기 위한 검색 순서를 결정하는 검색 순서 결정 수단과;
상기 검색 순서에 따라, 상기 검지 대상 문자열에 포함된 문자를 상기 화상으로부터 검색하는 문자 검색 수단을 구비하는 것을 특징으로 하는 문자열 검지 장치.
제 1항에 있어서,
상기 검색 순서 결정 수단은, 상기 검지 대상 문자열에 포함되는 문자 중, 상기 오검지될 어려움을 나타내는 평가치가 가장 큰 값을 갖는 문자를 처음에 검색한다고 결정하는 것을 특징으로 하는 문자열 검지 장치.
제 1항 또는 제 2항에 있어서,
상기 문자 검색 수단이 상기 검지 대상 문자열에 포함된 문자를 상기 화상으로부터 검지하면, 상기 검색 순서 결정 수단은, 상기 검지 대상 문자열의 문자 배열에서, 검지가 끝난 문자의 좌우 이웃의 문자 중 상기 평가치가 큰 문자를 다음에 검색할 문자로서 결정하는 것을 특징으로 하는 문자열 검지 장치.
제 1항 또는 제 2항에 있어서,
상기 검색 순서 결정 수단은, 문자의 평가치가 큰 순서로 검색되도록, 상기 검색 순서를 결정하는 것을 특징으로 하는 문자열 검지 장치.
제 1항 또는 제 2항에 있어서,
상기 검지 대상 문자열에 포함된 문자를 상기 화상으로부터 검지하면, 상기 문자 검색 수단은, 다음 문자를 검색하기 위한 검색 대상 영역을, 상기 화상의 전 영역에서 검지가 끝난 문자의 근처 영역으로 한정하는 것을 특징으로 하는 문자열 검지 장치.
제 5항에 있어서,
상기 문자 검색 수단은, 상기 검지가 끝난 문자가, 상기 검지 대상 문자열에 있어서 문자의 나열에 있어서 n번째의 문자이고, 다음에 검색한 문자가 (n+1)번째 이상의 문자인 경우에, 검색 대상 영역을, 상기 검지가 끝난 문자의 우측 및 하측의 근처 영역으로 한정하고, 다음에 검색한 문자가 (n-1)번째 이하의 문자인 경우에, 검색 대상 영역을, 상기 검지가 끝난 문자의 좌측 및 상측의 근처 영역으로 한정하는 것을 특징으로 하는 문자열 검지 장치.
제 1항 또는 제 2항에 있어서,
상기 평가치는, 문자의 형태가 복잡한만큼 오검지되기 어려운 문자로서, 문자의 형상 특성에 근거하여 산출된 것이고, 상기 평가치는, 문자를 형성하는 선의 길이를 나타내는 요소 길이 특성치, 및, 문자를 형성하는 선 방향의 다양성을 나타내는 이방위성의 특성치의 적어도 어느 1개에 근거하여 산출된 것을 특징으로 하는 문자열 검지 장치.
제 1항 또는 제 2항에 있어서,
상기 평가치는, 다른 문자 또는 다른 문자의 일부와 비슷한 형상이 없는 문자만큼 오검지되기 어려운 문자로서, 다른 문자와의 판별의 용이성을 나타내는 판별 용이성의 특성치에 근거하여 산출되는 것을 특징으로 하는 문자열 검지 장치.
제 1항 또는 제 2항에 있어서,
상기 평가치는, 문자의 표기가 균일한 문자만큼 오검지되기 어려운 문자로서, 다른 표기의 유무 또는 다른 표기가 있는 경우의 다른 표기 문자끼리의 유사도에 근거하여 특정되는 표기 균일성(notation uniformity)의 특성치에 근거하여 산출되는 것을 특징으로 하는 문자열 검지 장치.
제 7항에 있어서,
상기 요소 길이 특성치, 및, 상기 이방위성의 특성치는, 상기 문자를 형성하는 선 방향이 수평 또는 수직 방향의 선보다도, 선 방향이 경사인 선에 대하여 중량감 부여를 행하여 산출되는 것을 특징으로 하는 문자열 검지 장치.
제 1항 또는 제 2항에 있어서,
상기 화상은 복수의 프레임으로 된 동화상이고, 상기 문자 검색 수단은, 상기 동화상로부터 검색 대상으로서 추출된 검색 대상 프레임마다, 상기 검지 대상 문자열에 포함된 각 문자를 검색하는 것이고,
상기 문자 검색 수단은,
상기 검색 순서에 따라 각 문자를 검색한 때, 상기 검색 대상 프레임으로부터 검지 대상의 문자가 검지할 수 없는 경우에 해당 검색 대상 프레임으로의 검색을 종료하고, 다음 검색 대상 프레임에 있어서, 검색 순서가 처음의 문자를 검색한 것을 특징으로 하는 문자열 검지 장치.
오검지될 어려움을 평가해야 할 문자로서 입력된 평가 대상 문자의 문자 특성을 분석한 문자 분석 수단과,
문자 특성을 문자마다 미리 기억하는 문자 특성 기억부와,
상기 문자 분석 수단이 분석한 문자 특성, 및, 상기 문자 특성 기억부에 기억되어 있는 문자 특성의 적어도 어느 한쪽에 근거하고, 상기 평가 대상 문자의 문자 특성마다의 특성치를 특정한 특성치 특정 수단과,
상기 특성치 특정 수단이 특정한 1 이상의 특성치를 이용하고, 문자의 오검지될 어려움을 나타내는 평가치를 산출한 평가치 산출 수단과,
상기 평가치 산출 수단이 산출한 평가치를 상기 평가 대상 문자에 대응시키고 문자 정보 기억부에 격납한 평가치 격납 수단을 구비하고 있는 것을 특징으로 하는 문자 평가 장치.
제 12항에 있어서,
상기 문자 분석 수단은, 상기 평가 대상 문자의 형상 특성을 분석한 것이고,
상기 특성치 특정 수단은,
상기 문자 분석 수단이 분석한 결과에 근거하고, 상기 평가 대상 문자에 관하여, 문자를 형성하는 선의 길이를 나타내는 요소 길이 특성치, 및, 문자를 형성하는 선 방향의 다양성을 나타내는 이방위성의 특성치의 적어도 어느 1개를 산출하는 것을 특징으로 하는 문자 평가 장치.
제 12항 또는 13항에 있어서,
상기 문자 특성 기억부는, 다른 문자 또는 다른 문자의 일부와 비슷한 형상이 없는 문자만큼 오검지되기 어려운 문자로서, 다른 문자와의 판별의 용이성을 문자 특성으로서 문자마다 기억하는 것이고,
상기 특성치 특정 수단은,
상기 문자 특성 기억부에 기억되어 있는, 상기 평가 대상 문자의 문자 특성에 근거하고, 상기 평가 대상 문자의 판별 용이성의 특성치를 특정한 것을 특징으로 하는 문자 평가 장치.
제 12항 또는 제 13항에 있어서,
상기 문자 특성 기억부는, 문자 특성으로서, 다른 표기 문자의 그룹과 다른 표기 문자끼리의 유사도와 대응시켜 기억하는 것이고,
상기 특성치 특정 수단은,
상기 평가 대상 문자의 다른 표기의 유무 또는 다른 표기가 있는 경우의 다른 표기 문자끼리의 유사도에 근거하고, 문자의 표기가 균일한 문자만큼 오검지되기 어려운 문자로서, 그 평가 대상 문자의 표기 균일성의 특성치를 특정한 것을 특징으로 하는 문자 평가 장치.
청구항 제1항 또는 제2항에 기재된 문자열 검지 장치를 구비하고 있는 것을 특징으로 하는 화상 처리 장치.
1 이상의 문자로 된 문자열을 화상으로부터 검지하는 문자열 검지 방법에 있어서,
검지해야 할 문자열로서 입력된 검지 대상 문자열을 취득한 문자열 취득 스텝과, 문자의 오검지될 어려움을 나타내는 평가치를 문자마다 기억하는 문자 정보 기억부에 기억되어 있는, 상기 문자열 취득 스텝에 취득된 상기 검지 대상 문자열에 포함된 문자마다의 평가치에 근거하고, 해당 문자마다, 상기 화상으로부터 문자를 검색하기 위한 검색 순서를 결정하는 검색 순서 결정 스텝과,
상기 검색 순서 결정 스텝에 결정된 검색 순서에 따라, 상기 검지 대상 문자열에 포함된 문자를 상기 화상으로부터 검색하는 문자 검색 스텝을 포함하는 것을 특징으로 하는 문자열 검지 방법.
오검지될 어려움을 평가해야 할 문자로서 입력된 평가 대상 문자의 문자 특성을 분석하는 문자 분석 스텝과,
상기 문자 분석 스텝에 분석된 문자 특성, 및, 문자 특성을 문자마다 미리 기억하는 문자 특성 기억부에 기억되어 있는 문자 특성의 적어도 어느 한쪽에 근거하고, 상기 평가 대상 문자의 문자 특성마다의 특성치를 특정하는 특성치 특정 스텝과,
상기 특성치 특정 스텝에 특정된 1 이상의 특성치를 이용하고, 문자의 오검지될 어려움을 나타내는 평가치를 산출하는 평가치 산출 스텝과, 상기 평가치 산출 스텝에 산출된 평가치를 상기 평가 대상 문자에 대응시키고 문자 정보 기억부에 격납한 평가치 격납 스텝을 포함하는 것을 특징으로 하는 문자 평가 방법.
청구항 제17항에 기재된 각 스텝을, 컴퓨터에 실행시키기 위한 제어 프로그램을 기록한 것을 특징으로 하는 컴퓨터 판독 가능한 기록 매체.
청구항 제18항에 기재된 각 스텝을, 컴퓨터에 실행시키기 위한 제어 프로그램을 기록한 것을 특징으로 하는 컴퓨터 판독 가능한 기록 매체.
KR1020110002663A 2010-03-15 2011-01-11 문자열 검지 장치, 문자 평가 장치, 화상 처리 장치, 문자열 검지 방법, 문자 평가 방법, 제어 프로그램 및 기록 매체 KR101260594B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2010-058550 2010-03-15
JP2010058550A JP5488077B2 (ja) 2010-03-15 2010-03-15 文字列検知装置、文字評価装置、画像処理装置、文字列検知方法、文字評価方法、制御プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
KR20110103840A KR20110103840A (ko) 2011-09-21
KR101260594B1 true KR101260594B1 (ko) 2013-05-06

Family

ID=44560031

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110002663A KR101260594B1 (ko) 2010-03-15 2011-01-11 문자열 검지 장치, 문자 평가 장치, 화상 처리 장치, 문자열 검지 방법, 문자 평가 방법, 제어 프로그램 및 기록 매체

Country Status (4)

Country Link
US (1) US20110222789A1 (ko)
JP (1) JP5488077B2 (ko)
KR (1) KR101260594B1 (ko)
CN (1) CN102194101B (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5935324B2 (ja) * 2012-01-04 2016-06-15 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
US9600731B2 (en) * 2015-04-08 2017-03-21 Toshiba Tec Kabushiki Kaisha Image processing apparatus, image processing method and computer-readable storage medium
CN107533671B (zh) * 2015-05-11 2021-02-23 株式会社东芝 模式识别装置、模式识别方法以及记录介质
JP2018124605A (ja) * 2017-01-30 2018-08-09 オムロン株式会社 画像処理システム、情報処理装置、情報処理方法、および、情報処理プログラム
US10699112B1 (en) * 2018-09-28 2020-06-30 Automation Anywhere, Inc. Identification of key segments in document images

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003242446A (ja) 2002-02-18 2003-08-29 Fujitsu Ltd 文字列予測装置及び方法並びに当該方法を具現化するコンピュータ実行可能なプログラム
JP2004334699A (ja) 2003-05-09 2004-11-25 Ricoh Co Ltd テキスト評価装置、テキスト評価方法、プログラム及び記憶媒体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0385681A (ja) * 1989-08-30 1991-04-10 Omron Corp 画像処理装置
US5926565A (en) * 1991-10-28 1999-07-20 Froessl; Horst Computer method for processing records with images and multiple fonts
JPH05258102A (ja) * 1992-03-11 1993-10-08 Fuji Xerox Co Ltd 文字/図形分離装置
JPH0684006A (ja) * 1992-04-09 1994-03-25 Internatl Business Mach Corp <Ibm> オンライン手書き文字認識方法
JP3425834B2 (ja) * 1995-09-06 2003-07-14 富士通株式会社 文書画像からのタイトル抽出装置および方法
US6094506A (en) * 1995-10-25 2000-07-25 Microsoft Corporation Automatic generation of probability tables for handwriting recognition systems
JP3313272B2 (ja) * 1996-01-08 2002-08-12 株式会社日立製作所 住所読み取り方法および識別関数重みベクトル生成方法
JP3427692B2 (ja) * 1996-11-20 2003-07-22 松下電器産業株式会社 文字認識方法および文字認識装置
JP3405155B2 (ja) * 1997-11-07 2003-05-12 松下電器産業株式会社 文書検索装置
US6289124B1 (en) * 1998-04-27 2001-09-11 Sanyo Electric Co., Ltd. Method and system of handwritten-character recognition
JP4053188B2 (ja) * 1999-07-06 2008-02-27 富士通株式会社 パターン切り出し装置及びパターン認識装置
JP2002163637A (ja) * 2000-11-27 2002-06-07 Omron Corp 画像検査装置及び画像検査方法
US7432432B2 (en) * 2004-09-21 2008-10-07 Microsoft Corporation System and method for recognizing handwritten music notations
JP2008004116A (ja) * 2007-08-02 2008-01-10 Hitachi Ltd 映像中の文字検索方法及び装置
JP4469905B2 (ja) * 2008-06-30 2010-06-02 株式会社東芝 テロップ収集装置およびテロップ収集方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003242446A (ja) 2002-02-18 2003-08-29 Fujitsu Ltd 文字列予測装置及び方法並びに当該方法を具現化するコンピュータ実行可能なプログラム
JP2004334699A (ja) 2003-05-09 2004-11-25 Ricoh Co Ltd テキスト評価装置、テキスト評価方法、プログラム及び記憶媒体

Also Published As

Publication number Publication date
JP5488077B2 (ja) 2014-05-14
US20110222789A1 (en) 2011-09-15
JP2011192094A (ja) 2011-09-29
CN102194101A (zh) 2011-09-21
CN102194101B (zh) 2013-11-06
KR20110103840A (ko) 2011-09-21

Similar Documents

Publication Publication Date Title
JP4918776B2 (ja) 電子文書比較プログラム、電子文書比較装置および電子文書比較方法
US10430663B2 (en) Method, electronic device and non-transitory computer readable storage medium for image annotation
US8160402B2 (en) Document image processing apparatus
US8750616B2 (en) Character image extracting apparatus and character image extracting method
KR101260594B1 (ko) 문자열 검지 장치, 문자 평가 장치, 화상 처리 장치, 문자열 검지 방법, 문자 평가 방법, 제어 프로그램 및 기록 매체
US8244738B2 (en) Data display apparatus, method, and program
CN109918513B (zh) 图像处理方法、装置、服务器及存储介质
JP2004234228A (ja) 画像検索装置、画像検索装置におけるキーワード付与方法、及びプログラム
US11449706B2 (en) Information processing method and information processing system
JP5146190B2 (ja) 文字認識装置、文字認識プログラム、および文字認識方法
US20090030882A1 (en) Document image processing apparatus and document image processing method
JP2007226536A (ja) 画像検索装置、画像検索方法、および、画像検索用プログラム
JP6003705B2 (ja) 情報処理装置及び情報処理プログラム
KR102373884B1 (ko) 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법
JP2013191104A (ja) キーワード検出装置、その制御方法および制御プログラム、並びに表示機器
KR100896336B1 (ko) 영상 정보 기반의 동영상 연관 검색 시스템 및 방법
US20110137896A1 (en) Information processing apparatus, predictive conversion method, and program
US20140023267A1 (en) Character string detection device, image processing device, character string detection method, control program and storage medium
KR101868936B1 (ko) 키워드 추출 및 정련 시스템과 그 방법
JP6247103B2 (ja) 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム
JP4447602B2 (ja) 信号検出方法,信号検出システム,信号検出処理プログラム及びそのプログラムを記録した記録媒体
US20110249873A1 (en) Finger/palm-print image processing apparatus, finger/palm-print image processing method, and recording medium in which finger/palm-print image processing program has been recorded
CN113806472A (zh) 一种对文字图片和图像型扫描件实现全文检索的方法及设备
KR100540735B1 (ko) 자막문자기반의 영상 인덱싱 방법
US20210295032A1 (en) Information processing device and non-transitory computer readable medium

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180403

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190328

Year of fee payment: 7