KR20120104379A - 해석 방법, 해석 장치 및 해석 프로그램 - Google Patents
해석 방법, 해석 장치 및 해석 프로그램 Download PDFInfo
- Publication number
- KR20120104379A KR20120104379A KR1020127018600A KR20127018600A KR20120104379A KR 20120104379 A KR20120104379 A KR 20120104379A KR 1020127018600 A KR1020127018600 A KR 1020127018600A KR 20127018600 A KR20127018600 A KR 20127018600A KR 20120104379 A KR20120104379 A KR 20120104379A
- Authority
- KR
- South Korea
- Prior art keywords
- item
- document
- information
- file
- data
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/197—Version control
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
해석의 작업 부담을 경감한다. 데이터 구조 해석 수단(12)은, 문서 데이터 기억 수단(11)으로부터 문서 데이터 A(11a)와 문서 데이터 B(11b)를 읽어내고, 문서간의 참조 관계를 해석하여 문서의 구조 정보를 생성한다. 또한, 항목간의 관계를 해석하여 항목간의 구조 정보를 생성한다. 변경 정보 해석 수단(13)은, 한쪽의 문서에밖에 존재하지 않는 미대응 파일과 미대응 항목을 검출한다. 정보 매칭 수단(14)은, 문서의 구조 정보에 기초하여 미대응 파일을 대응짓는다. 또한, 항목간의 구조 정보에 기초하여 미대응 항목을 대응짓는다.
Description
문서의 해석 방법, 문서의 해석 장치 및 문서의 해석 프로그램에 관한 것이다.
기업 등에서는, 문서 등의 정보의 대부분을 전자화하여 관리하고 있다. 또한, 최근에는, 법령으로 의무지어져 있는 서면에 대해서도, 종이에 의한 보존 대신에, 전자적 기록에 의한 보존이 인정되고 있다.
그러나, 단순히 문서를 전자화하는 것만으로는, 관리나 재이용이 용이하게는 되지 않는다. 따라서, 문서 데이터의 작성이나 유통, 재이용을 용이하게 하기 위해서, 각종 분야에서 전자화 정보의 표준화가 진행되고 있다. 표준화에 의해, 문서 데이터의 구성이나 정보 항목의 이름 또는 ID 등이 공통화된다. 공통화된 정보 항목명을 이용하면, 기존의 문서 데이터로부터 원하는 항목을 찾아낼 수 있다.
그런데, 문서 데이터는, 작성된 후에도, 법령의 개정 혹은 오류 정정을 위해서 등, 다양한 이유로 기술 내용이 변경되는 경우가 있다. 문서 데이터의 관리상, 변경 개소와 변경 내용은 파악해 둘 필요가 있어, 변경 전과 변경 후의 문서 데이터를 대조하여, 변경 개소와 변경 내용을 자동 해석하는 해석 방법이 요구되고 있다. 그러나, 문서 데이터를 단순히 대조하는 것만으로는, 이름이 상이하면, 의미적으로 동일한 것이 상이한 것으로서 검출되게 된다. 따라서, 데이터 매칭 전에, 읽어들인 문서를 미리 정해진 문자 혹은 기호로 변환하여 정규화하여, 매칭의 정밀도를 올리는 방법이 있다. 또한, 변경 내용의 분석에는, 변경 전의 데이터와 변경 후의 데이터를 대응지을 필요가 있지만, 단순한 매칭에 의해서는 대응짓기는 어렵다. 따라서, 문서 데이터에 포함되는 공통의 항목명이나 파일명을 이용하여 변경 전후의 데이터의 매칭을 행하여, 대응하는 데이터를 추출하는 해석 방법이 있다.
그러나, 종래의 해석에서는, 공통의 항목명이나 파일명이 설정되어 있지 않은 경우에는, 대응짓기를 할 수 없어, 변경의 해석이 어려웠었다. 또한, 항목명이나 파일명 등, 그 정보 데이터를 일의로 특정할 수 있는 정보를 식별자라고 부른다.
대상의 2개의 문서 데이터를 비교하고, 식별자가 일치하면, 이것은 동일한 항목 혹은 동종의 파일이라고 대응지을 수 있다. 그러나, 항목명은, 법 개정 등에 의해 변경해야만 하는 경우가 있다. 파일명에 대해서도 마찬가지이다. 이와 같이, 변경 등에 의해 동일한 항목이나 파일을 식별하기 위한 식별자가 변경되는 경우가 있지만, 단순한 매칭에 의해서는, 어느 정보가 삭제되고, 어느 정보가 추가된 것인지밖에 파악할 수 없다. 그러나, 변경의 해석에서 이용자가 가장 알고 싶은 정보는, 「정보 A의 식별자 및 데이터형이 변경되어, 정보 B로 되었다」고 하는 정보이다. 이를 위해서는, 문서 데이터의 어느 항목과 어느 항목이 대응지어지는 것인지를, 수작업에 의해 하나 하나 확인해야만 하여, 변경 내용의 해석에 방대한 시간이 걸리게 되었다. 또한, 항목의 대응짓기는, 이 문서의 내용을 이해하고 있는 사람이 아니면 어려운 경우도 많아, 작업자에게 많은 부담이 가해졌다.
이와 같은 점을 감안하여, 동일한 정보 데이터에 상이한 식별자가 설정되어 있어도 문서의 변경 해석이 가능한 해석 방법, 해석 장치 및 해석 프로그램을 제공하는 것을 목적으로 한다.
상기 과제를 해결하기 위해서, 문서를 비교하고, 문서간에서 일치하지 않는 변경 부분을 해석하는 해석 방법이 제공된다. 이 해석 방법에 따르면, 문서에 포함되는 항목의 값을 기술하는 항목값 파일과, 항목 및 항목간의 관계를 정의하는 정의 파일을 갖는 문서 데이터를 저장하는 기억 수단으로부터, 비교 대상의 제1 문서 데이터 및 제2 문서 데이터를 읽어낸다. 그리고, 정의 파일의 항목간의 관계를 해석하여 항목간의 구조 정보를 생성한다. 다음으로, 제1 문서 데이터에 정의되어 있는 항목의 식별자와, 제2 문서 데이터에 정의되어 있는 항목의 식별자를 비교하여, 제1 문서 데이터에만 존재하는 제1 미대응 항목 및 제2 문서 데이터에만 존재하는 제2 미대응 항목을 검출한다. 그리고, 항목간의 구조 정보에 기초하여, 제1 미대응 항목에 관련되는 항목간의 관계와 제2 미대응 항목에 관련되는 항목간의 관계를 비교하고, 항목간의 관계가 공통된다고 판정한 제1 미대응 항목과 제2 미대응 항목을 대응짓는다.
개시의 해석 방법, 해석 장치 및 해석 프로그램에 따르면, 동일한 정보 데이터에 상이한 식별자가 설정되어 있어도 해석이 가능하게 된다.
본 발명의 상기 및 다른 목적, 특징 및 이점은 본 발명의 예로서 바람직한 실시 형태를 나타내는 첨부의 도면과 관련된 이하의 설명에 의해 명백하게 될 것이다.
도 1은 제1 실시 형태의 해석 장치의 구성예를 도시한 도면이다.
도 2는 XBRL의 구조의 일례를 도시한 도면이다.
도 3은 제2 실시 형태의 해석 장치의 하드웨어 구성예를 도시한 블록도이다.
도 4는 해석 장치의 소프트웨어 구성예를 도시한 블록도이다.
도 5는 보고서의 인스턴스 문서의 일례를 도시한 도면이다.
도 6은 XBRL 데이터의 문서 참조 구조 정보의 일례를 도시한 도면이다.
도 7은 스키마로부터 추출한 항목ㆍ형 정보 일례를 도시한 도면이다.
도 8은 표시 링크 구조 정보의 일례를 도시한 도면이다.
도 9는 참조 링크 구조 정보의 일례를 도시한 도면이다.
도 10은 항목값 정보의 일례를 도시한 도면이다.
도 11은 변경 정보 해석 처리 후의 문서 참조 구조 비교 결과를 도시한 도면이다.
도 12는 변경 정보 해석 처리 후의 항목ㆍ형 정보 비교 결과를 도시한 도면이다.
도 13은 변경 정보 해석 처리 후의 항목값 비교 결과를 도시한 도면이다.
도 14는 정보 매칭 처리 후의 문서 참조 구조 비교 결과를 도시한 도면이다.
도 15는 정보 매칭 처리 후의 항목ㆍ형 정보 비교 결과를 도시한 도면이다.
도 16은 정보 매칭 처리 후의 항목값 비교 결과를 도시한 도면이다.
도 17은 매치하는 항목의 후보와 그 정확도를 도시한 도면이다.
도 18은 1회째의 학습 후의 정확도와 매치하는 항목의 후보와 그 정확도를 도시한 도면이다.
도 19는 2회째의 학습 후의 정확도와 매치하는 항목의 후보와 그 정확도를 도시한 도면이다.
도 20은 해석 장치의 처리 전체를 도시한 플로우차트이다.
도 21은 데이터 구조 해석 처리의 수순을 도시한 플로우차트이다.
도 22는 변경 개소 해석 처리의 수순을 도시한 플로우차트이다.
도 23은 매칭(문서의 등가성 해석) 처리의 수순을 도시한 플로우차트이다.
도 24는 매칭(항목의 등가성 해석) 처리의 수순을 도시한 플로우차트이다.
도 25는 매칭 학습 처리의 수순을 도시한 플로우차트이다.
도 2는 XBRL의 구조의 일례를 도시한 도면이다.
도 3은 제2 실시 형태의 해석 장치의 하드웨어 구성예를 도시한 블록도이다.
도 4는 해석 장치의 소프트웨어 구성예를 도시한 블록도이다.
도 5는 보고서의 인스턴스 문서의 일례를 도시한 도면이다.
도 6은 XBRL 데이터의 문서 참조 구조 정보의 일례를 도시한 도면이다.
도 7은 스키마로부터 추출한 항목ㆍ형 정보 일례를 도시한 도면이다.
도 8은 표시 링크 구조 정보의 일례를 도시한 도면이다.
도 9는 참조 링크 구조 정보의 일례를 도시한 도면이다.
도 10은 항목값 정보의 일례를 도시한 도면이다.
도 11은 변경 정보 해석 처리 후의 문서 참조 구조 비교 결과를 도시한 도면이다.
도 12는 변경 정보 해석 처리 후의 항목ㆍ형 정보 비교 결과를 도시한 도면이다.
도 13은 변경 정보 해석 처리 후의 항목값 비교 결과를 도시한 도면이다.
도 14는 정보 매칭 처리 후의 문서 참조 구조 비교 결과를 도시한 도면이다.
도 15는 정보 매칭 처리 후의 항목ㆍ형 정보 비교 결과를 도시한 도면이다.
도 16은 정보 매칭 처리 후의 항목값 비교 결과를 도시한 도면이다.
도 17은 매치하는 항목의 후보와 그 정확도를 도시한 도면이다.
도 18은 1회째의 학습 후의 정확도와 매치하는 항목의 후보와 그 정확도를 도시한 도면이다.
도 19는 2회째의 학습 후의 정확도와 매치하는 항목의 후보와 그 정확도를 도시한 도면이다.
도 20은 해석 장치의 처리 전체를 도시한 플로우차트이다.
도 21은 데이터 구조 해석 처리의 수순을 도시한 플로우차트이다.
도 22는 변경 개소 해석 처리의 수순을 도시한 플로우차트이다.
도 23은 매칭(문서의 등가성 해석) 처리의 수순을 도시한 플로우차트이다.
도 24는 매칭(항목의 등가성 해석) 처리의 수순을 도시한 플로우차트이다.
도 25는 매칭 학습 처리의 수순을 도시한 플로우차트이다.
이하, 실시 형태를 도면을 참조하여 설명한다.
도 1은 제1 실시 형태의 해석 장치의 구성예를 도시한 도면이다.
해석 장치(10)는, 문서 데이터 기억 수단(11), 데이터 구조 해석 수단(12), 변경 정보 해석 수단(13) 및 정보 매칭 수단(14)을 갖는다. 데이터 구조 해석 수단(12), 변경 정보 해석 수단(13) 및 정보 매칭 수단(14)은, 컴퓨터가 해석 프로그램을 실행함으로써, 그 처리 기능을 실현한다.
문서 데이터 기억 수단(11)은, 비교 대상의 문서를 기억하는 기억 장치이며, 문서 데이터 A(11a)와, 문서 데이터 B(11b)가 기억되어 있다. 문서 데이터 A(11a) 및 문서 데이터 B(11b)는, 문서에 포함되는 항목의 값을 기술하는 항목값 파일과, 이 항목 및 항목간의 관계 등을 정의한 정의 파일을 갖는다. 문서 데이터 A(11a)와 문서 데이터 B(11b)는, 미리 정해진 규격에 기초하여 작성되어 있다. 또한, 도 1에서는 문서 데이터 기억 수단(11)을 해석 장치(10) 내에 설치하고 있지만, 해석 장치(10)의 외부에 설치하는 것으로 해도 된다.
데이터 구조 해석 수단(12)은, 비교 대상의 문서 데이터의 지정 및 해석 지시를 입력하면, 처리를 개시한다. 문서 데이터 기억 수단(11)으로부터 대상의 문서 데이터 A(11a)와, 문서 데이터 B(11b)를 읽어내고, 각각의 데이터 구조를 해석한다. 변경 전과 변경 후의 파일과, 항목을 대응짓기 위해서, 데이터 구조로서, 문서 데이터를 구성하는 파일간의 참조 구조와, 문서 데이터에 포함되는 항목의 관계 구조를 해석한다. 예를 들면, 문서 데이터를 구성하는 파일간의 참조 관계를 해석하고, 참조 관계에 기초하는 파일 구조를 검출하여, 문서의 구조 정보를 생성한다. 또한, 정의 파일에 기술되어 있는 항목간의 관계를 해석하고, 항목간의 관계 구조를 검출하여, 항목간의 구조 정보를 생성한다. 파일간의 참조 관계는, 예를 들면, 파일1이 파일2를 참조하고 있는 경우, 파일1이 부모, 파일2가 자식이라고 하는 부모 자식 관계를 갖는다고 판단한다. 또한, 파일1이 파일2와 파일3을 참조하고 있는 경우, 파일2와 파일3은 형제 관계를 갖는다고 판단한다. 이와 같이, 파일의 참조 관계를 해석하고, 파일간의 부모 자식 관계 및 형제 관계를 검출한다. 검출한 문서 데이터의 파일간의 참조 관계에 기초하는 문서의 구조 정보를 생성하고, 기억 수단에 저장한다. 항목간의 관계는, 각각의 정의 파일을 해석하고, 표시상의 관계 혹은 의미적인 관계 등의 항목간의 관계를 파악한다. 예를 들면 항목 「a」는 항목 「b」의 아래에 표시된다고 하는 표시상의 부모 자식 관계를 추출하고, 항목간의 구조 정보로서 기록한다. 또한, 동시에, 문서에 포함되는 항목의 데이터의 형(型) 등의 특징을 추출한다. 항목을 정의하는 정의 파일을 해석하고, 예를 들면 항목 「a」가 존재하고, 그 형은 「십진수 수치형」이라고 하는 특징을 추출한다.
변경 정보 해석 수단(13)은, 문서 데이터 A(11a)와 문서 데이터 B(11b)에서 일치하지 않는 변경 부분을 해석하고, 변경 정보를 생성한다. 변경 정보 해석 수단(13)에서는, 변경 전후의 파일에서 동일하다고 간주할 수 있는 것을 대응짓는 파일의 등가성 해석과, 변경 전후의 항목에서 동일하다고 간주할 수 있는 것을 대응짓는 항목의 등가성 해석을 행한다. 파일의 등가성 해석에서는, 문서 데이터 A(11a)의 파일의 파일 식별자와, 문서 데이터 B(11b)의 파일의 파일 식별자를 비교하고, 공통되는 파일이라고 판정한 문서 데이터 A(11a)의 파일과 문서 데이터 B(11b)의 파일을 대응짓는다. 각각의 파일을 일의로 식별하는 파일 식별자를 비교하고, 파일 식별자의 전체 범위, 혹은 미리 정해진 일부 범위가 동일할 때에 일치로 판정한다. 예를 들면, 이름 공간 URI(Uniform Resource Identifier)에 의해 파일명에 부여되는 부분은, 비교 범위로부터 제외하는 것으로 해도 된다. 또한, 문서 데이터 A(11a) 또는 문서 데이터 B(11b) 중 어느 한쪽에만 존재하여, 대응짓기를 할 수 없었던 파일은, 미대응 파일로 해 둔다. 파일 대응표를 생성하고, 대응지어진 파일은 매치하는 정보의 란에 등록하고, 미대응 파일은 각각 문서 데이터 A에만 존재하는 파일, 문서 데이터 B에만 존재하는 파일의 란에 등록한다. 항목의 등가성 해석에 대해서도 마찬가지로, 문서 데이터 A(11a)에 포함되는 항목의 식별자와, 문서 데이터 B(11b)에 포함되는 항목의 식별자를 비교하고, 일치하는 것을 대응지어, 항목 대응표의 매치하는 정보에 등록한다. 문서 데이터 A(11a) 또는 문서 데이터 B(11b) 중 어느 한쪽에만 존재하는 항목은, 미대응 항목으로 하고, 항목 대응표의 각각의 문서의 미대응 항목의 란에 등록한다. 또한, 식별자에 의해 대응지어진 항목에 대해서는, 그 값을 항목값 파일로부터 추출해 둔다. 그리고, 정보 매칭 수단(14)에 의해 미대응 항목의 대응짓기가 행해진 후, 변경 내용의 해석을 행한다. 대응지어진 항목에 대하여, 그 값을 항목값 파일로부터 추출한다. 문서 데이터 A(11a)와 문서 데이터 B(11b)의 항목값 파일로부터 대응지어진 항목의 값을 추출한다. 그리고, 대응지어진 항목의 특징과, 항목값을 비교하고, 변경 내용을 해석한다. 변경 내용의 해석 결과, 파일 대응표, 항목 대응표는, 필요에 따라서 표시 장치(20)에 표시하고, 이용자에게 변경 개소와 변경 내용을 보고한다.
정보 매칭 수단(14)은, 문서의 구조 정보와, 파일 대응표에 기초하여, 문서 데이터 A(11a)와 문서 데이터 B(11b)의 미대응 파일의 대응짓기를 행한다. 또한, 항목간의 구조 정보 및 항목 대응표에 기초하여 문서 데이터 A(11a)와 문서 데이터 B(11b)에 포함되는 미대응 항목의 매칭 처리를 행한다. 매칭 처리란, 상이한 식별자가 부여된 동일한 정보 데이터를 대응짓는 처리를 가리킨다. 파일의 매칭 처리에서는, 문서의 구조 정보에 기초하여, 문서 데이터 A(11a)의 미대응 파일과 참조 관계를 갖는 파일과, 문서 데이터 B(11b)의 미대응 파일과 참조 관계를 갖는 파일을 비교하고, 공통된다고 판정한 것을 대응짓는다. 공통되어 있는지의 여부는, 참조 관계를 갖는 파일이 모두 일치, 또는 일치한 파일의 개수 혹은 비율이 기준값을 초과하고 있는지의 여부로 판단한다. 정보 매칭 수단(14)에 의해 대응지어진 문서 데이터 A(11a)와 문서 데이터 B(11b)의 파일은, 파일 대응표의 매치하는 정보의 란으로 이동한다. 항목의 매칭 처리에서는, 항목간의 구조 정보와 항목 대응표에 기초하여, 문서 데이터 A(11a)의 미대응 항목에 관련되는 항목간의 구조 정보와, 문서 데이터 B(11b)의 미대응 항목에 관련되는 항목간의 구조 정보의 내용을 비교하고, 항목간의 관계가 마찬가지인지의 여부를 판정한다. 예를 들면, 미대응의 항목의 전후에 표시되는 항목끼리를 비교하고, 모두 또는 어떤 비율 이상의 항목이 일치하고 있는 경우에는, 마찬가지라고 판정한다. 정보 매칭 수단(14)에 의해 대응지어진 문서 데이터 A(11a)와 문서 데이터 B(11b)의 파일 및 항목은, 매치하는 정보로서 등록한다. 그 후, 변경 정보 해석 수단(13)으로 처리를 되돌려, 새롭게 대응지어진 항목의 변경 내용의 해석 처리를 행한다.
이와 같은 구성의 해석 장치(10)의 동작 및 그 해석 방법의 처리 수순에 대하여 설명한다.
문서 데이터 기억 수단(11)에는, 문서에 포함되는 항목의 값을 기술하는 항목값 파일과, 이 항목을 특징짓는 항목 식별자, 형 및 항목간의 관계를 정의한 정의 파일을 갖는 문서 데이터 A(11a)와, 문서 데이터 B(11b)가 저장되어 있다.
해석 장치(10)는, 대상의 문서 데이터 A(11a) 및 문서 데이터 B(11b)를 지정받아 처리를 개시한다. 데이터 구조 해석 수단(12)은, 대상의 문서 데이터 A(11a) 및 문서 데이터 B(11b)를 문서 데이터 기억 수단(11)으로부터 읽어낸다. 그리고, 문서 데이터 A(11a)와 문서 데이터 B(11b)의 파일의 변경 해석과, 항목의 변경 해석을 행한다.
파일의 변경 해석에 대하여 설명한다. 데이터 구조 해석 수단(12)은, 읽어낸 문서 데이터 A(11a), 문서 데이터 B(11b) 각각의 문서 데이터에 속하는 파일의 참조 관계를 해석한다. 참조 관계에 기초하는 파일의 부모 자식 관계 혹은 형제 관계, 즉, 문서 데이터의 파일 구조를 검출한다. 검출한 문서 데이터의 파일 구조는, 문서 데이터 A(11a)의 문서의 구조 정보와, 문서 데이터 B(11b)의 문서의 구조 정보로서 기억 수단에 저장한다. 변경 정보 해석 수단(13)은, 문서 데이터 A(11a)의 파일의 파일 식별자와, 문서 데이터 B(11b)의 파일 식별자를 비교하고, 동일하다고 판정한 파일을 대응짓는다. 대응짓기를 할 수 있었던 파일은, 파일 대응표에 매치하는 정보로서 등록한다. 파일 식별자에 의한 대응짓기를 할 수 없었던 파일은, 미대응 파일로 한다. 정보 매칭 수단(14)에 의해서는, 문서의 구조 정보에 기초하여, 문서 데이터 A(11a)의 미대응 파일과, 문서 B(11b)의 미대응 파일의 매칭 처리를 행한다. 문서 데이터 A(11a)의 미대응 파일과 소정의 참조 관계를 갖는 파일과, 문서 데이터 B(11b)의 미대응 파일과 소정의 참조 관계를 갖는 파일을 비교한다. 예를 들면, 참조 관계에 기초하여, 문서 데이터 A(11a)의 미대응 파일의 부모에 상당하는 파일과, 문서 데이터 B(11b)의 미대응 파일의 부모에 상당하는 파일을 비교한다. 그리고, 부모에 상당하는 파일이 동일하다고 인정되었을 때는, 이 문서 데이터 A(11a)의 미대응 파일과, 문서 데이터 B(11b)의 미대응 파일을 대응짓는다. 대응지어진 파일은, 매치하는 정보로서, 파일 대응표에 등록한다.
다음으로, 항목의 변경 해석에 대하여 설명한다. 데이터 구조 해석 수단(12)은, 읽어낸 문서 데이터 A(11a), 문서 데이터 B(11b) 각각의 문서 데이터의 정의 파일을 해석한다. 그리고, 항목의 특징을 추출하여 항목 정보를 생성함과 함께, 항목간의 관계를 해석하여 항목간의 구조 정보를 생성한다. 변경 정보 해석 수단(13)은, 문서 데이터 A(11a)의 항목의 항목 식별자와, 문서 데이터 B(11b)의 항목의 항목 식별자를 비교하고, 동일하다고 판정한 항목을 대응짓는다. 대응짓기를 할 수 있었던 항목은, 항목 대응표에 매치하는 정보로서 등록한다. 항목 식별자에 의한 대응짓기를 할 수 없었던 항목은, 미대응 항목으로서 등록한다. 또한, 이때, 대응짓기를 할 수 있었던 항목에 대해서는, 문서 데이터 A(11a) 및 문서 데이터 B(11b)의 항목값 파일로부터 이 항목의 값을 추출하여 비교하고, 값이 변경되어 있는지의 여부를 조사하는 것으로 해도 된다. 정보 매칭 수단(14)은, 항목간의 구조 정보에 기초하여, 문서 데이터 A(11a)의 미대응 항목과, 문서 데이터 B(11b)의 미대응 항목의 대응짓기를 행한다. 그리고, 항목간의 구조 정보에 기초하여, 항목간의 관계가 공통되어 있다고 판정하였을 때는, 문서 데이터 A(11a)의 미대응 항목과, 문서 데이터 B(11b)의 미대응 항목을 대응짓는다. 대응지어진 항목은, 항목 대응표의 매치하는 정보에 등록한다. 다음으로, 변경 정보 해석 수단(13)은, 대응짓기한 항목에 대하여 변경 내용을 해석한다. 문서 데이터 A(11a) 및 문서 데이터 B(11b)의 항목값 파일로부터 이 항목의 값을 추출하여 비교하고, 값이 변경되어 있는지의 여부를 조사하는 변경 내용의 해석 처리를 행한다. 또한, 항목 식별자(항목명)가 변경되어 있는 경우에도, 항목 식별자가 변경된 것을 변경 내용으로서 기억해 둔다. 또한, 정보 매칭 수단(14)의 전에 이 변경 내용의 해석이 행해졌던 항목에 대해서는, 처리를 생략한다.
이렇게 하여 생성된 변경 내용의 해석 결과, 파일 대응표, 항목 대응표는, 필요에 따라서 표시 장치(20)에 표시하고, 이용자에게 변경 개소와 변경 내용을 통지한다.
또한, 상기의 설명에서는, 파일의 해석을 행한 후, 항목의 해석을 행하는 것으로 하였지만, 처리는 병렬로 행하는 것으로 해도 된다.
상기의 처리가 실행됨으로써, 비교 대상의 문서 데이터 A(11a)의 파일과 문서 데이터 B(11b)의 파일, 및 문서 데이터 A(11a)에 포함되는 항목과 문서 데이터 B(11b)에 포함되는 항목이 대응지어진다. 이때, 식별자가 변경되어 있어도, 파일간의 참조 관계, 항목간의 관계, 항목의 특징에 기초하여, 동일하다고 간주할 수 있는 정보 데이터를 검출하여 대응짓기가 행해진다. 이에 의해, 동일한 정보 데이터에 상이한 식별자가 설정되어 있어도 해석이 가능해져, 대응지어진 파일 또는 항목을 비교하여 변경 내용을 파악할 수 있다. 이 결과, 해석에 요하는 작업자의 부담을 경감하는 것이 가능하게 된다.
이하, 제2 실시 형태로서, 대상의 문서가 XBRL(eXtensible Business Reporting Language)에 의해 작성된 문서인 경우에 대하여 설명한다.
처음에 XBRL의 개요를 설명한다. XBRL은, 각종 재무 보고용의 정보를 작성ㆍ유통ㆍ활용할 수 있도록 표준화된 XML(eXtensible Markup Language) 베이스의 언어이다. XBRL의 표준화 작업이나 보급 활동은, 표준화 단체인 XBRL International이 행하고 있다. 또한, 일본에서는, XBRL Japan이 그 역할을 담당하고 있다. XBRL의 상세한 규격은, 예를 들면, 「XBRL Specifications[평성22년 1월 14일 검색], 인터넷 <URL:http://www.xbrl.org/Specifications/>」에 기재되어 있다. 마찬가지의 규격은, XBRL International로부터도 발행되어 있다.
도 2는 XBRL의 구조의 일례를 도시한 도면이다. 도 2는 XBRL2.1Specification에 기초하는 XBRL 구조의 일례이다.
XBRL에서는, 인스턴스와, 택소노미라고 하는 2종류의 문서로 재무 정보를 기술한다. 택소노미는, 스키마(220)와, 복수의 링크 베이스(231?235)의 집합이다.
인스턴스 문서(210), 스키마(220), 표시 링크(231), 계산 링크(232), 정의 링크(233), 명칭 링크(234) 및 참조 링크(235)는, 각각 다른 파일로서 작성되고, 파일을 일의로 특정하는 식별자(파일명)가 설정된다. 또한, 문서간의 참조 관계는, 도 2에 도시한 바와 같은 트리 구조를 취하고, 트리의 부모의 문서가, 자식의 문서를 참조하는 구성으로 되어 있다. 즉, 인스턴스 문서(210)가, 스키마(220)를 참조한다. 또한, 스키마(220)는, 표시 링크(231), 계산 링크(232), 정의 링크(233), 명칭 링크(234), 참조 링크(235)를 참조한다. 이하, 인스턴스 문서(210), 스키마(220), 표시 링크(231), 계산 링크(232), 정의 링크(233), 명칭 링크(234) 및 참조 링크(235)의 집합을 XBRL 데이터, XBRL 데이터 중의 1개의 파일을 XBRL 문서 또는 간단히 문서라고 부른다.
인스턴스 문서(210)는, 실제의 재무 정보를 기술한 XML 문서이고, 항목의 값, 텍스트 등의 실제 데이터가 기술된다. 이하, 수치나 텍스트 등, 문서 중에서 항목에 대하여 기술되어 있는 실제 데이터를 통합하여 항목값으로 한다. 인스턴스 문서는, 제1 실시 형태에서 설명한 항목값 파일과 마찬가지이다. 택소노미 문서는, 인스턴스 문서(210)의 내용ㆍ구조ㆍ취급 방법 등을 정의한다. 제1 실시 형태에서 설명한 정의 파일과 마찬가지이다. 스키마(220)는, 인스턴스 문서(210)에 기술되어 있는 항목의 이름 및 형의 정보 등을 정의하는 문서이다.
복수의 링크 베이스, 표시 링크(231), 계산 링크(232), 정의 링크(233), 명칭 링크(234), 참조 링크(235)는, 항목에 대한 링크를 기술하는 문서이다. 표시 링크(231)는, 항목의 표시의 순번이나 부모 자식 관계를 정의한다. 예를 들면, 「항목 "CurrentAsset"의 다음에, 항목 "NonCurrentAssets"를 표시한다」고 하는 바와 같은 표시의 순번을 정의한다. 계산 링크(232)는, 항목의 계산 관계를 정의한다. 예를 들면, 「"Assets"="CurrentAsset"+"NonCurrentAssets"」라고 하는 바와 같은 계산 관계를 정의한다. 정의 링크(233)는, 항목의 회계상의 의미적인 관계를 정의한다. 예를 들면, 「"NonCurrentAssets"와, "FixedAssets"는 동일한 개념이다」라고 하는 바와 같은 의미적인 관계를 정의한다. 명칭 링크(234)는, 항목의 라벨을 정의한다. 예를 들면, 「"Assets"의 라벨은 『자산』으로 한다」고 하는 바와 같은 라벨의 정보를 정의한다. 참조 링크(235)는, 항목의 정의의 근거로 된 문헌 정보를 정의한다. 예를 들면, 「"Assets"는, 재무제표 등 규칙, 양식 제A호에 기초한다」고 하는 바와 같은 문헌 정보를 정의한다. 이와 같이, 라벨, 문헌 정보 등, 링크에서 정의하는 항목의 부가 정보를 이하의 설명에서는 리소스라고 부른다.
일반적으로, XBRL 데이터는, 법령의 개정, 회계 기준의 변경, 및 기업이나 감독 기관의 재무 보고의 방침의 변경 등에 의해, 그 기술 내용(문서 구성, 항목의 값, 항목의 정의, 링크 등)이 변경된다. 또한, 오류의 수정을 위해서 기술 내용이 변경되는 경우도 있다. 변경은, 최저라도 연 1회, 많은 경우에는 수회 이상 행해진다. 이 때문에, XBRL 데이터의 작성, 이행, 관리, 분석, 비교 등의 처리를 위해서, 변경 개소뿐만 아니라 변경 내용에 대해서도 정확하게 파악할 필요가 있다. 물론, 수작업에 의한 정보의 매칭이나, 변경 시의 변경 이력 정보에 기초하여 변경 내용을 정확하게 파악하는 것은 불가능하지는 않다. 그러나, 현재 사용되고 있는 XBRL 데이터에는, 항목이 3000?10000개 정도 존재하기 때문에, 수작업에 의한 모든 변경 개소의 정보 매칭에는 방대한 시간이 걸리게 된다.
도 3은 제2 실시 형태의 해석 장치의 하드웨어 구성예를 도시한 블록도이다.
해석 장치(100)는, CPU(Central Processing Unit)(101)에 의해 장치 전체가 제어되고 있다. CPU(101)에는, 버스(107)를 통하여 RAM(Random Access Memory)(102), 하드디스크 드라이브(HDD : Hard Disk Drive)(103), 그래픽 처리 장치(104), 입력 인터페이스(105), 및 통신 인터페이스(106)가 접속되어 있다.
RAM(102)에는, CPU(101)에 실행시키는 OS(Operating System)의 프로그램이나 어플리케이션 프로그램의 적어도 일부가 일시적으로 저장된다. 또한, RAM(102)에는, CPU(101)에 의한 처리에 필요한 각종 데이터가 저장된다. HDD(103)에는, OS나 어플리케이션의 프로그램이 저장된다. 그래픽 처리 장치(104)에는, 모니터(21)가 접속되어 있어, CPU(101)로부터의 명령에 따라서 화상을 모니터(21)의 화면에 표시시킨다. 입력 인터페이스(105)에는, 키보드(22)나 마우스(23)가 접속되어 있어, 키보드(22)나 마우스(23)로부터 보내어져 오는 신호를, 버스(107)릍 통하여 CPU(101)에 송신한다. 통신 인터페이스(106)는, 네트워크(30)에 접속되어 있어, 네트워크(30)를 통하여 단말 장치(40)와의 사이에서 데이터의 송수신을 행하는 것으로 해도 된다.
이와 같은 하드웨어 구성에 의해, 해석 장치(100)의 처리 기능을 실현할 수 있다. 또한, 도 3에는, 해석 장치(100)의 하드웨어 구성을 도시하였지만, 단말 장치(40)의 하드웨어 구성도 마찬가지이다. 또한, 네트워크(30)를 통하여 접속하는 단말 장치(40)로부터 지시를 입력받고, 해석 결과를 단말 장치(40)의 모니터에 출력하는 것으로 해도 된다.
도 4는 해석 장치의 소프트웨어 구성예를 도시한 블록도이다.
해석 장치(100)는, XBRL 데이터의 데이터 구조를 해석하는 데이터 구조 해석부(120), 변경 개소 및 변경 내용을 해석하는 변경 정보 해석부(130), 미대응 정보 데이터의 매칭을 행하는 정보 매칭부(140) 및 기억부(150)를 갖고, 대상의 데이터를 저장하는 XBRL 데이터 기억 장치(110)와 접속하고, 대상의 해석을 행한다.
XBRL 데이터 기억 장치(110)에는, 비교 대상의 변경 전과 변경 후의 XBRL 데이터가 저장되어 있다. 또한, XBRL 데이터 기억 장치(110)는, 해석 장치(100) 내에 설치하는 것으로 해도 된다.
데이터 구조 해석부(120)는, 문서 참조 구조 해석부(121) 및 항목 해석부(122)를 갖고, 변경 전의 XBRL 데이터와, 변경 후의 XBRL 데이터를 XBRL 데이터 기억 장치(110)로부터 읽어내어, 문서간의 참조 구조의 해석과, 항목간의 링크 구조의 해석을 행한다. 문서 참조 구조 해석부(121)는, 비교 대상의 변경 전후의 XBRL 데이터 각각에 대하여, 문서간의 참조 관계에 기초하여, 문서 참조 구조를 해석한다. 예를 들면, 스키마(220)가 참조하고 있는 링크 베이스(231?235)를 검출하고, 부모 자식 관계를 파악한다. 이렇게 하여 검출한 문서간의 부모 자식ㆍ형제 관계에 기초하여 문서간의 계층 구조를 나타내는 문서 참조 구조 정보를 생성하고, 변경 정보 해석부(130)에 통지한다. 항목 해석부(122)는, 링크 베이스(231?235)를 해석하여, 항목간의 관계를 추출함과 함께, 스키마로부터 항목의 데이터형 등의 항목을 특징짓는 항목 정보를 추출한다. 링크 베이스에는, 항목간의 관계 혹은 항목과 관련 정보의 링크 정보가 기술되어 있다. 항목 해석부(122)는, 링크 베이스를 해석하여 항목간의 관계를 추출하고, 항목간의 관계를 나타내는 링크 구조 정보를 생성한다. 예를 들면, 표시 링크에 기초하여, 표시상의 항목간의 부모 자식ㆍ형제 관계를 추출하고, 표시 링크 구조 정보를 생성한다. 계산 링크에 기초하여, 항목의 계산 관계를 추출하고, 계산 링크 구조 정보를 생성한다. 정의 링크에 기초하여, 항목의 의미적인 관계를 추출하고, 정의 링크 구조 정보를 생성한다. 명칭 링크에 기초하여, 항목의 명칭을 추출하고, 명칭 링크 구조 정보를 생성한다. 참조 링크에 기초하여, 항목에 대응하는 리소스를 추출하고, 참조 링크 구조 정보를 생성한다. 또한, 모든 링크 베이스에 대하여 링크 구조 정보를 생성할 수도 있고, 몇 개의 링크 베이스를 선택하여 링크 구조를 생성하는 것으로 해도 된다. 또한, 스키마(220)로부터 항목에 관한 정보를 추출한다. 스키마(220)에는, 요소 선언(항목의 이름), 형 정의(형의 이름), 정의 내용 및 항목의 출현순 등이 기술되어 있다. 항목 해석부(122)는, 이들 정보를 항목의 특징으로서 추출하고, 항목ㆍ형 정보에 기록한다. 또한, 인스턴스 문서(210)에 정의되는 항목의 이름, 항목의 값, 출현순 등의 정보를 추출하고, 항목값 정보도 생성해 둔다. 각 링크 구조 정보, 항목ㆍ형 정보 및 항목값 정보는, 변경 정보 해석부(130)에 통지한다.
변경 정보 해석부(130)는, 문서 변경 개소 검출부(131) 및 항목 변경 개소 검출부(132)를 갖고, 변경 전과 변경 후의 문서 데이터를 비교하고, 차이로부터 변경 개소를 검출한다. 문서 변경 개소 검출부(131)는, 데이터 구조 해석부(120)가 생성한 변경 전의 문서 참조 구조 정보와, 변경 후의 문서 참조 구조 정보에 기초하여, 변경 전의 문서와 변경 후의 문서의 문서 식별자를 비교한다. 제2 실시 형태에서는, 문서 식별자는, 인스턴스 문서(210), 스키마(220), 링크 베이스(231?235)의 문서명(파일명)으로 된다. 변경 전과 변경 후에서도 문서 식별자가 일치하면, 이 문서를 대응짓고, 문서 참조 구조 비교 결과(151)의 매치하는 정보에 문서명을 등록한다. 변경 전의 XBRL 데이터에만 존재하는 문서명이 검출되면, 이 문서명을 문서 참조 구조 비교 결과(151)의 삭제된 정보에 등록한다. 변경 후의 XBRL 데이터에만 존재하는 문서명은, 문서 참조 구조 비교 결과(151)의 추가된 정보에 등록한다. 또한, 생성한 문서 참조 구조 비교 결과(151)는, 변경 전과 변경 후의 파일을 대응지은 제1 실시 형태의 파일 대응표와 마찬가지이다. 항목 변경 개소 검출부(132)는, 데이터 구조 해석부(120)가 생성한 변경 전의 항목ㆍ형 정보에 등록되어 있는 항목의 항목 식별자와, 변경 후의 항목ㆍ형 정보에 등록되어 있는 항목의 항목 식별자를 비교한다. 동일한 항목 식별자의 항목이 검출되었을 때는, 이것을 대응짓고, 항목ㆍ형 정보 비교 결과(152)의 매치하는 정보에 항목명을 등록한다. 변경 전의 XBRL 데이터에만 존재하는 항목이 검출되면, 이 항목을 항목ㆍ형 정보 비교 결과(152)의 삭제된 정보에 등록한다. 변경 후의 XBRL 데이터에만 존재하는 항목은, 항목ㆍ형 정보 비교 결과(152)의 추가된 정보에 등록한다. 또한, 변경 전의 항목값 정보에 등록되어 있는 항목의 항목 식별자와, 변경 후의 항목값 정보에 등록되어 있는 항목의 항목 식별자를 비교한다. 동일한 항목 식별자의 항목을 대응짓고, 항목값 비교 결과(153)의 매치하는 정보에 항목명을 등록하고, 변경 전의 항목값과 변경 후의 항목값을 추출하여 변경 내용으로서 기록한다. 변경 전의 XBRL 데이터에만 존재하는 항목이 검출되면, 이 항목을 항목값 비교 결과(153)의 삭제된 정보에 등록한다. 변경 후의 XBRL 데이터에만 존재하는 항목은, 항목값 비교 결과(153)의 추가된 정보에 등록한다. 또한, 생성한 항목ㆍ형 정보 비교 결과(152) 및 문서 참조 구조 비교 결과(153)는, 변경 전과 변경 후의 파일을 대응지은 제1 실시 형태의 항목 대응표와 마찬가지이다.
정보 매칭부(140)는, 문서 매칭부(141) 및 항목 매칭부(142)를 갖고, 변경 정보 해석부(130)에 의해 대응짓기를 할 수 없었던 미대응 문서 및 미대응 항목의 대응짓기를 행한다. 문서 매칭부(141)는, 변경 정보 해석부(130)에 의해, 문서 참조 구조 비교 결과(151)에 삭제된 정보로서 등록된 문서(이하, 삭제된 문서라고 함)와, 추가된 정보로서 등록된 문서(이하, 추가된 문서라고 함)의 대응짓기를 행한다. 삭제된 문서 및 추가된 문서 각각의 문서 참조 구조를 문서 참조 구조 정보로부터 추출한다. 예를 들면, 삭제된 문서와 부모 자식 관계ㆍ형제 관계를 갖는 문서명과, 추가된 문서와 부모 자식 관계ㆍ형제 관계를 갖는 문서명을 대조하여, 공통되는 문서명이 있는지의 여부를 판정한다. 대조한 문서명이 모두 일치하면, 부모가 공통된다고 판정하고, 삭제된 문서와 추가된 문서를 대응짓고, 문서 참조 구조 비교 결과(151)의 매치하는 정보에 기록한다. 또한, 삭제된 정보 및 추가된 정보로부터는, 이 문서의 등록을 삭제한다. 항목 매칭부(142)는, 항목ㆍ형 정보 비교 결과(152) 및 항목값 비교 결과(153)에, 삭제된 정보로서 등록된 항목(이하, 삭제된 항목이라고 함)과, 추가된 정보로서 등록된 항목(이하, 추가된 항목이라고 함)의 대응짓기를 행한다. 삭제된 항목 및 추가된 항목의 링크 구조 정보를 추출하고, 삭제된 항목의 링크의 부모 자식ㆍ형제 관계와, 추가된 항목의 부모 자식ㆍ형제 관계를 대조하여, 공통되는지의 여부를 판정한다. 공통된다고 판정된 경우에는, 삭제된 항목과 추가된 항목을 대응짓고, 항목ㆍ형 정보 비교 결과(152) 및 항목값 비교 결과(153)의 매치하는 정보에 기록한다. 또한, 삭제된 정보 및 추가된 정보로부터는, 이 항목의 등록을 삭제한다. 또한, XBRL 데이터에서는, 복수의 링크 구조가 존재한다. 예를 들면, 표시 링크, 계산 링크 및 정의 링크의 부모 자식 관계나 형제 관계에는 회계적인 의미가 존재하기 때문에, 항목간에 동일한 관계가 기술되어 있는 경우가 많다. 이 때문에, 표시 링크, 계산 링크 및 정의 링크에서 항목간의 관계가 일치하면, 대부분의 경우 항목이 일치한다고 간주할 수 있다. 또한, 복수의 링크 구조 각각에 대하여 매치하는 항목을 후보로서 검출해 놓고, 하나의 링크 구조에서 후보로 되었을 때를 정확도 10으로 하고, 각각의 후보에 대하여 정확도를 산출한다. 예를 들면, 표시 링크, 계산 링크 및 정의 링크에서 매치하는 항목의 후보로 되면, 정확도는 10+10+10으로 30으로 된다. 또한, 정확도는, 모든 링크 구조에서 동일한 값으로 해도 되고, 링크 구조의 종류에 따라서 변화시켜도 된다. 또한, 학습 기능을 설치하고, 링크 구조마다의 정확도를 적절히 변경해도 된다.
기억부(150)는, 변경 정보로서, 변경 전의 XBRL 데이터와, 변경 후의 XBRL 데이터를 비교한 비교 결과 정보가 저장된다. 문서 참조 구조 비교 결과(151)에는, 문서 변경 개소 검출부(131) 및 문서 매칭부(141)에 의해 검출된 변경 전과 변경 후의 문서의 대응 관계가 설정된다. 항목ㆍ형 정보 비교 결과(152)에는, 항목 변경 개소 검출부(132) 및 항목 매칭부(142)에 의해 검출된 변경 전과 변경 후의 항목의 대응 관계가 설정된다. 항목값 비교 결과(153)에는, 항목 변경 개소 검출부(132) 및 항목 매칭부(142)에 의해 검출된 변경 전과 변경 후의 항목의 대응 관계가 항목값과 함께 설정된다.
이와 같은 구성의 해석 장치(100)에 의한 해석 처리를 XBRL 데이터의 구체예를 이용하여 설명한다. 해석 장치(100)는, 키보드(22), 마우스(23), 혹은 네트워크(30)를 통하여 단말 장치(40)로부터 비교 대상의 문서의 지정을 입력한다. 비교 대상으로서, 변경 전과 변경 후의 인스턴스 문서 혹은 스키마가 지정된다. 여기서는, 변경 전의 문서로서 2007년도 보고서의 인스턴스 문서, 변경 후의 문서로서 2008년도 보고서의 인스턴스 문서가 지정되는 것으로 한다. 물론, 스키마이어도 된다. 또한, 링크 베이스가 지정되었을 때는, 문서 참조 구조 전체를 해석하고, 링크가 연결되어 있지 않은 스키마를 루트로서 검출하는 것으로 해도 된다.
도 5는 보고서의 인스턴스 문서의 일례를 도시한 도면이다. (A)는 2007년도 인스턴스 문서(instance2007.xbrl), (B)는 2008년도 인스턴스 문서(instance2008.xbrl)를 나타내고 있다. 또한, ( ) 내는, 인스턴스 문서의 파일명(문서명)으로 된다.
(A) 2007년도 인스턴스 문서(instance2007.xbrl)(400)에는, 3개의 항목과, 그 항목값이 기술되어 있다. 항목 "Assets"의 항목값에는 「100」, 항목 "CurrentAsset"의 항목값에는 「50」, 항목 "NonCurrentAssets"의 항목값에는 「50」이 설정되어 있다. (B) 2008년도 인스턴스 문서(instance2008.xbrl)(500)에는, 마찬가지로, 3개의 항목에 대하여, "Assets"에는 「200」, "CurrentAssets"에는 「100」, "NonCurrentAssets"에는 「100」이 설정되어 있다.
예를 들면, 단순한 매칭 처리를 행한 경우, 2007년도 인스턴스 문서(400)의 "Assets" 및 "NonCurrentAssets"와, 2008년도 인스턴스 문서(500)의 "Assets" 및 "NonCurrentAssets"는, 식별자가 동일하기 때문에 동일한 항목이라고 알 수 있다. 그러나, 2007년도 인스턴스 문서(400)의 "CurrentAsset"와, 2008년도 인스턴스 문서(500)의 "CurrentAssets"가 동일한 항목인지의 여부는 알 수 없다.
해석 장치(100)는, 2007년도의 보고서와, 2008년도의 보고서를 비교하여, 변경 개소와 변경 내용을 해석한다. 데이터 구조 해석부(120)는, 지정된 2007년도 인스턴스 문서(400)와, 이 인스턴스 문서(400)에 관련되는 택소노미 문서(스키마, 링크 베이스)를 XBRL 데이터 기억 장치(110)로부터 읽어낸다. 마찬가지로, 2008년도 인스턴스 문서(500)와, 이 인스턴스 문서(500)에 관련되는 택소노미 문서를 XBRL 데이터 기억 장치(110)로부터 읽어낸다.
문서 참조 구조 해석부(121)는, 읽어낸 2007년도 보고서의 문서간의 참조 관계와, 2008년도 보고서의 문서간의 참조 관계를 각각 해석하고, 문서간의 참조 구조를 검출한다. 예를 들면, 읽어낸 스키마를 해석하고, 스키마에서 참조하는 링크 베이스를, 스키마와 부모 자식 관계를 갖는 문서로서 검출한다. 또한, XBRL 데이터에는, 통상의 택소노미 외에, 확장 택소노미를 정의할 수 있다. 대상의 XBRL 데이터에 확장 택소노미가 포함되어 있는 경우에는, 확장 택소노미의 문서를 포함하여 문서간의 참조 구조를 해석한다. 이렇게 하여, 변경 전의 2007년도 보고서 및 변경 후의 2008년도 보고서 각각의 문서간의 참조 구조를 파악한다.
도 6은 XBRL 데이터의 문서 참조 구조 정보의 일례를 도시한 도면이다. (A)는 2007년도 보고서의 문서 참조 구조 정보, (B)는 2008년도 보고서의 문서 참조 구조 정보를 도시하고 있다. 또한, 도 6은 검출된 참조 관계의 트리 구조를 도시하고 있다. 또한, (B)의 문자 아래의 밑줄은, (A)의 기술과 상이한 부분을 나타내고 있는 것이며, 실제의 XBRL 데이터에는 포함되어 있지 않다. 이하의 도면에 대해서도, 마찬가지의 기호를 이용하는 것으로 한다.
(A) 2007년도 보고서의 문서 참조 구조 정보(410)는, 2007년도 보고서의 XBRL 데이터의 문서 구조를 나타낸다. 인스턴스 문서 "instance2007.xbrl"(400)에 대응지어져 있는 스키마 "schema2007.xsd"는, 택소노미 문서의 루트이다. 도 6은 인스턴스 문서 "instance2007.xbrl"이 참조 구조의 루트인 것을 나타내고 있다. 또한, 루트란, 다른 문서로부터 링크가 연결되어 있지 않은 문서이다. 스키마 "schema2007.xsd"는, 인스턴스 문서 "instance2007.xbrl"로부터 참조된다. 또한, 표시 링크 "presentation2007.xml" 및 참조 링크 "reference2007.xml"은, 스키마 "schema2007.xsd"로부터 참조된다고 하는 구조를 갖는다. (B) 2008년도 보고서의 문서 참조 구조 정보(510)는, 2008년도 보고서의 XBRL 데이터의 문서 구조를 나타낸다. 인스턴스 문서 "instance2008.xbrl"이 참조 구조의 루트이다. 또한, 스키마 "schema2008.xsd"는, 인스턴스 문서 "instance2008.xbrl"로부터 참조된다. 또한, 표시 링크 "presentation2008.xml" 및 참조 링크 "reference2007.xml"이 스키마 "schema2008.xsd"로부터 참조된다고 하는 구조이다. 문서 참조 구조 정보(410, 510)는, 변경 정보 해석부(130)에 통지한다. 또한, 변경 정보 해석부(130)를 통하여 모니터(21)에 문서 참조 구조를 표시하거나, 단말 장치(40)에 송신하여 단말 장치(40)에 표시시키거나 하여, 이용자에게 보고하는 것으로 해도 된다.
계속해서 데이터 구조 해석부(120)는, 각각의 XBRL 데이터의 스키마 및 링크 베이스를 해석하여, XBRL 데이터에 포함되는 항목의 항목 식별자와 형 정보, 항목값을 추출함과 함께, 이 항목과 다른 항목이나 정보 데이터를 대응짓는 링크 구조를 해석한다.
도 7은 스키마로부터 추출한 항목ㆍ형 정보의 일례를 도시한 도면이다. (A)는 2007년도 보고서의 항목ㆍ형 정보(schema2007.xsd), (B)는 2008년도 보고서의 항목ㆍ형 정보(schema2008.xsd)를 나타내고 있다. 또한, ( ) 내의 문서명은 참조한 스키마의 파일명이다.
스키마에는, XML 형식으로 항목의 식별자나 형이 정의되어 있다. 항목 해석부(122)는, 이것을 해석하여 항목ㆍ형 정보를 생성한다. (A) 2007년도 보고서의 항목ㆍ형 정보(schema2007.xsd)(420)에는, "Assets"의 형이 「금액형」, "CurrentAsset"의 형이 「10진수 수치형」, "NonCurrentAssets"의 형이 「10진수 수치형」이라고 하는 항목ㆍ형 정보가 등록되어 있다. (B) 2008년도 보고서의 항목ㆍ형 정보(schema2008.xsd)(520)에는, "Assets"의 형이 「금액형」, "CurrentAssets"의 형이 「금액형」, "NonCurrentAssets"의 형이 「금액형」이라고 하는 항목ㆍ형 정보가 등록되어 있다.
도 8은 표시 링크 구조 정보의 일례를 도시한 도면이다. (A)는 2007년도 보고서의 표시 링크 구조 정보(presentation2007.xml), (B)는 2008년도 보고서의 표시 링크 구조 정보(presentation2008.xml)를 나타내고 있다. 또한, ( ) 내의 문서명은 참조한 표시 링크의 파일명이다.
표시 링크에는, XML 형식으로 항목의 표시의 순번이나 부모 자식 관계가 정의되어 있다. 항목 해석부(122)는, 이것을 해석하여 표시 링크 구조 정보를 생성한다. (A) 2007년도 보고서의 표시 링크 구조 정보(presentation2007.xml)(430)에는, 표시상, "Assets"와, "CurrentAsset" 및 "NonCurrentAssets"가 부모 자식 관계에 있는 것을 나타내고 있다. 또한, "CurrentAsset"와 "NonCurrentAssets"에서는, "CurrentAsset"가 먼저 표시되는 것을 나타내고 있다. (B) 2008년도 보고서의 표시 링크 구조 정보(presentation2008.xml)(530)에는, 표시상, "Assets"와, "CurrentAssets" 및 "NonCurrentAssets"가 부모 자식 관계에 있는 것을 나타내고 있다. 또한, "CurrentAssets"와 "NonCurrentAssets"에서는, "CurrentAssets"가 먼저 표시되는 것을 나타내고 있다.
도 9는 참조 링크 구조 정보의 일례를 도시한 도면이다. (A)는 2007년도 보고서의 참조 링크 구조 정보(reference2007.xml), (B)는 2008년도 보고서의 참조 링크 구조 정보(reference2007.xml)를 나타내고 있다. 또한, ( ) 내의 문서명은, 참조한 참조 링크의 파일명이다.
참조 링크에는, 항목의 정의의 근거로 된 문헌 정보가 정의되어 있다. 항목 해석부(122)는, 이것을 해석하고, 표시 링크 구조 정보를 생성한다. (A) 2007년도 보고서의 참조 링크 구조 정보(reference2007.xml)(440)는, "Assets"의 참조 문헌은 「재무제표 등 규칙, 양식 제A호」, "CurrentAsset"의 참조 문헌은 「재무제표 등 규칙, 양식 제B호」, "NonCurrentAssets"의 참조 문헌은 「재무제표 등 규칙, 양식 제C호」인 것을 나타내고 있다. (B) 2008년도 보고서의 참조 링크 구조 정보(reference2007.xml)(540)는, "Assets"의 참조 문헌은 「재무제표 등 규칙, 양식 제A호」, "CurrentAssets"의 참조 문헌은 「재무제표 등 규칙, 양식 제B호」, "NonCurrentAssets"의 참조 문헌은 「재무제표 등 규칙, 양식 제C호」인 것을 나타내고 있다.
또한, 상기의 처리에서는, 표시 링크와 참조 링크에 대하여 설명하였지만, 계산 링크, 정의 링크 및 명칭 링크에 대해서도 마찬가지로 하여 링크 구조를 해석하고, 링크 구조 정보를 생성하는 것으로 해도 된다. 또한, 정확도가 높은 링크를 선택적으로 이용하여 링크 구조 정보를 생성하는 것으로 해도 된다. 정확도는, 항목의 대응짓기의 근거로서의 정확도를 의미하고, 정확도가 높을수록 대응지어진 항목이 동일한 항목일 가능성이 높다.
도 10은 항목값 정보의 일례를 도시한 도면이다. (A)는 2007년도 보고서의 항목값 정보(instance2007.xml), (B)는 2008년도 보고서의 항목값 정보(instance2008.xml)를 나타내고 있다. 또한, ( ) 내는 정보를 추출한 인스턴스 문서의 파일명이다.
인스턴스 문서(400, 500)에는, 항목의 값이 정의되어 있다. 항목 해석부(122)는, 항목의 값 등을 추출하고, 항목값 정보를 생성한다. (A) 2007년도 보고서의 항목값 정보(instance2007.xml)(450)는, "Assets"의 항목값은 「100」, "CurrentAsset"의 항목값은 「50」, "NonCurrentAssets"의 항목값은 「50」인 것을 나타내고 있다. (B) 2008년도 보고서의 항목값 정보(instance2008.xml)(550)는, "Assets"의 항목값은 「200」, "CurrentAssets"의 항목값은 「100」, "NonCurrentAssets"의 항목값은 「100」인 것을 나타내고 있다.
이렇게 해서 생성한 문서 참조 구조 정보(410, 510), 항목ㆍ형 정보(420, 520), 표시 링크 구조 정보(430, 530), 참조 링크 구조 정보(440, 540) 및 항목값 정보(450, 550)는, 변경 정보 해석부(130)에 보낸다.
변경 정보 해석부(130)는, 변경 전의 XBRL 데이터와 변경 후의 XBRL 데이터를 비교하여, 변경 개소와 변경 내용을 검출한다. 여기서는, 데이터 구조 해석부(120)로부터 취득한 문서 참조 구조 정보(410, 510), 항목ㆍ형 정보(420, 520), 표시 링크 구조 정보(430, 530), 참조 링크 구조 정보(440, 540) 및 항목값 정보(450, 550)를 이용하여 해석 처리를 행한다. 이하의 설명에서는, 간단하게 하기 위해서 2007년도 보고서를 변경 전, 2008년도 보고서를 변경 후로 표기한다.
문서 변경 개소 검출부(131)는, 문서 참조 구조 정보(410, 510)에 기초하여, 문서 식별자(파일명)를 비교한다. 비교 대상의 변경 전과 후의 인스턴스 문서 혹은 스키마는, 이용자가 지정한다. 그 결과, 지정된 변경 전후의 문서명 및 스키마의 이름 공간 URI는 매칭된다. 예를 들면, 변경 전의 스키마 "schema2007.xsd"와, 변경 후의 "schema2008.xsd"를 이용자가 지정하면, 그 문서명은 매치하는 정보로서 문서 참조 구조 비교 결과에 기록한다. 또한, 이름 공간 URI인 "/2007" 및 "/2008"도, 매치하는 정보로서 기록한다. 마찬가지로 하여, 변경 전의 인스턴스 문서 "instance2007.xbrl"과, 변경 후의 인스턴스 문서 "instance2008.xbrl"도 매치하는 정보로서 기록한다.
또한, 변경 전의 문서 참조 구조 정보(410)와, 변경 후의 문서 참조 구조 정보(510)를 데이터 구조에 따라서 순서대로 비교해 간다. 인스턴스 문서 및 스키마의 다음에는, 스키마로부터 참조되는 표시 링크를 비교한다. 표시 링크는, 변경 전이 "presentation2007.xml", 변경 후가 "presentation2008.xml"이며 매치하지만, 여기서는 설명을 위해서, 매치하지 않는다고 판정되는 것으로 한다. 다음의 참조 링크는, 변경 전도 변경 후도 함께 "reference2007.xml"이며, 매치하는 정보로 판정한다.
또한, 상기에서는 인스턴스 및 택소노미에 대하여 비교를 행하는 경우에서 설명하였지만, 택소노미만을 이용하여 비교를 행하는 것으로 해도 된다.
도 11은 변경 정보 해석 처리 후의 문서 참조 구조 비교 결과를 도시한 도면이다. 문서 참조 구조 비교 결과(151a)는, 문서 변경 개소 검출부(131)가, 문서 식별자에 기초하여 변경 전후의 문서를 비교한 비교 결과이다.
문서 참조 구조 비교 결과(151a)는, 삭제된 정보(1511), 추가된 정보(1512), 매치하는 정보(1513) 및 변경 내용(1514)의 정보를 기록한다. 삭제된 정보(1511)에는, 변경 전의 XBRL 데이터에는 존재하지만, 변경 후의 XBRL 데이터에는 존재하지 않는 정보의 이름(식별자)을 설정한다. 추가된 정보(1512)에는, 삭제된 정보(1511)와는 반대로, 변경 전의 XBRL 데이터에는 존재하지 않고, 변경 후의 XBRL 데이터에는 존재하는 정보의 이름(식별자)을 설정한다. 매치하는 정보(1513)에는, 변경 전의 XBRL 데이터와 변경 후의 XBRL 데이터의 양방에 존재하는 정보의 이름(식별자)을 설정한다. 변경 내용(1514)에는, 그 변경 내용을 설정한다. 문서 참조 구조 비교 결과(151a)에서는, 변경 전의 인스턴스 문서 "instance2007.xbrl"과 변경 후의 인스턴스 문서 "instance2008.xbrl", 변경 전의 스키마 "schema2007.xsd"와 변경 후의 "schema2008.xsd", 및 변경 전과 변경 후에서 동일한 참조 링크 "reference2007.xml"이 매치하는 정보(1513)에 등록되어 있다. 또한, 변경 내용(1514)에는, 인스턴스 문서 및 스키마의 문서명의 이름 변경 URI가 변경되어 있는 것이 기록되어 있다. 대응짓기를 할 수 없었던 표시 링크는, "presentation2007.xml"이 삭제된 정보(1511)에, "presentation2008.xml"이 추가된 정보(1512)에 등록되어 있다.
항목 변경 개소 검출부(132)는, 항목ㆍ형 정보(420, 520)에 기초하여, 변경 전의 XBRL 데이터와 변경 후의 XBRL 데이터의 항목 식별자(항목명)를 비교한다. 변경 전의 항목ㆍ형 정보(420)의 "Assets" 및 "NonCurrentAssets"는, 변경 후의 보고서의 항목ㆍ형 정보(520)에도 존재한다. 따라서, "Assets" 및 "NonCurrentAssets"는, 매치하는 정보로 판정한다. "CurrentAsset"는, 변경 전의 항목ㆍ형 정보(420)에만 존재하므로, 삭제된 정보로 한다. 또한, "CurrentAssets"는, 변경 후의 항목ㆍ형 정보(520)에만 존재하므로, 추가된 정보로 판정한다.
도 12는 변경 정보 해석 처리 후의 항목ㆍ형 정보 비교 결과를 도시한 도면이다. 항목ㆍ형 정보 비교 결과(152a)는, 항목 변경 개소 검출부(132)가, 항목 식별자에 기초하여 변경 전후의 항목ㆍ형 정보(420, 520)의 항목을 비교한 비교 결과이다.
항목ㆍ형 정보 비교 결과(152a)는, 삭제된 정보, 추가된 정보, 매치하는 정보 및 변경 내용의 등록란이 있다. 각각의 내용은, 도 11의 문서 참조 구조 비교 결과(151a)와 마찬가지이므로 설명은 생략한다. 상술한 바와 같이, 항목 변경 개소 검출부(132)에 의해, 변경 전의 XBRL 데이터와 변경 후의 XBRL 데이터 사이에서 항목의 식별자가 일치한다고 판정된 "Assets" 및 "NonCurrentAssets"는, 매치하는 정보(1523)에 등록한다. 또한, 매치하는 정보로서 등록한 항목에 대해서는, 스키마의 기술 내용이 변경되어 있지 않은지의 여부, 해석 처리를 행한다. "NonCurrentAssets"에 대해서는, 형이 「10진수 수치형」으로부터 「금액형」으로 변경되어 있으므로, 변경 내용(1524)에 「형」이 변경된 것을 기록한다. 또한, 변경 전의 항목ㆍ형 정보(420)에만 존재하는 "CurrentAsset"는, 삭제된 정보(1521)에 등록한다. 그리고, 변경 후의 항목ㆍ형 정보(520)에만 존재하는 "CurrentAssets"는, 추가된 정보(1522)에 등록한다.
항목 변경 개소 검출부(132)는, 또한, 항목값 정보(450, 550)에 대하여, 변경 전의 XBRL 데이터와 변경 후의 XBRL 데이터의 항목 식별자(항목명)를 비교한다. 변경 전의 항목값 정보(450)의 "Assets" 및 "NonCurrentAssets"는, 변경 후의 항목값 정보(550)에도 존재한다. 따라서, "Assets" 및 "NonCurrentAssets"는, 매치하는 정보로 판정한다. "CurrentAsset"는, 변경 전의 항목값 정보(450)에만 존재하므로, 삭제된 정보로 한다. 또한, "CurrentAssets"는, 변경 후의 항목값 정보(540)에만 존재하므로, 추가된 정보로 판정한다.
도 13은 변경 정보 해석 처리 후의 항목값 비교 결과를 도시한 도면이다. 항목값 비교 결과(153a)는, 항목 변경 개소 검출부(132)가, 항목 식별자에 기초하여 변경 전후의 항목값 정보(450, 550)의 항목을 비교한 비교 결과이다.
항목값 비교 결과(153a)는, 삭제된 정보, 추가된 정보, 매치하는 정보 및 변경 내용의 등록란이 있다. 각각의 내용은, 도 11의 문서 참조 구조 비교 결과(151a)와 마찬가지이므로 설명은 생략한다. 전술한 바와 같이, 항목 변경 개소 검출부(132)에 의해, 항목의 식별자가 일치한다고 판정된 "Assets" 및 "NonCurrentAssets"는, 매치하는 정보(1533)에 등록한다. 또한, 매치하는 정보로서 등록한 항목에 대해서는, 인스턴스 문서의 기술 내용이 변경되어 있지 않은지의 여부, 해석 처리를 행한다. "Assets"에 대해서는, 항목값이 「100」으로부터 「200」으로 변경되어 있으므로, 변경 내용(1534)에 변경 내용을 기록한다. "NonCurrentAssets"에 대해서는, 항목값이 「50」으로부터 「100」으로 변경되어 있으므로, 마찬가지로, 변경 내용(1534)에 변경 내용을 기록한다. 또한, 변경 전의 항목값 정보(450)에만 존재하는 "CurrentAsset"는, 삭제된 정보(1531)에 등록한다. 그리고, 변경 후의 항목값 정보(550)에만 존재하는 "CurrentAssets"는, 추가된 정보(1532)에 등록한다. 또한, 항목값 비교 결과(153a)의 삭제된 정보, 추가된 정보 및 매치하는 정보는, 항목ㆍ형 정보 비교 결과(152a)와 동일하게 된다. 따라서, 매치하는 정보의 변경 내용만 추출하고, 등록을 행하는 것으로 해도 된다.
이상의 처리 수순이 실행됨으로써, XBRL 문서 및 XBRL 문서의 항목이라고 하는 정보 데이터에 관하여, 각각의 식별자에 기초하여, 변경 전의 정보 데이터와 변경 후의 정보 데이터의 대응짓기가 행해진다. 그리고, 각각 변경 전의 XBRL 데이터에만 존재하는 삭제된 정보, 변경 후의 XBRL 데이터에만 존재하는 추가된 정보, 또는 변경 전과 변경 후의 XBRL 데이터에 존재하는 매치하는 정보 중 어느 하나로 분류된다. 또한, 변경 전과 변경 후에서 변하지 않는 매치하는 정보에 대해서는, 변경 전과 변경 후의 변경 내용의 해석 처리를 행하고, 변경 내용으로서 기록한다. 이렇게 해서 생성한 문서 참조 구조 비교 결과(151), 항목ㆍ형 정보 비교 결과(152) 및 항목값 비교 결과(153)는, 기억부(150)에 저장하고, 정보 매칭부(140)에 인계한다.
정보 매칭부(140)는, 문서 참조 구조 비교 결과(151), 항목ㆍ형 정보 비교 결과(152) 및 항목값 비교 결과(153)에 기초하여, 변경 정보 해석부(130)에서 대응짓기를 할 수 없었던 XBRL 문서 및 항목의 매칭 처리를 행한다.
문서 매칭부(141)는, 문서 참조 구조 비교 결과(151)에 기초하여, 대응짓기가 되어 있지 않은 변경 전의 XBRL 문서와 변경 후의 XBRL 문서를 대응짓는다. 도 11에 도시한 문서 참조 구조 비교 결과(151a)에서는, 삭제된 정보로서 표시 링크 "presentation2007.xml", 추가된 정보로서 표시 링크 "presentation2008.xml"이 대응지어지지 않고 남아 있다. 문서 매칭부(141)에서는, 문서 참조 구조 정보(410, 510)에 기초하여, "presentation2007.xml"과, "presentation2008.xml"의 등가성(동일한 것인 정확도)을 해석한다. 예를 들면, 문서 참조 구조 정보(410)에는, 변경 전의 스키마 "schema2007.xsd"가 표시 링크 "presentation2007.xml"을 참조하고 있는 것이 기술되어 있다. 마찬가지로, 문서 참조 구조 정보(510)에는, 변경 후의 스키마 "schema2008.xsd"가 표시 링크 "presentation2008.xml"을 참조하고 있는 것이 기술되어 있다. 양자 모두 표시 링크를 1개만 참조하고 있기 때문에, "presentation2007.xml"과, "presentation2008.xml"은 매치하는 정보로 추측한다. 또한, 이 대응 관계가 올바른지의 여부를 이용자에게 확인받는 것으로 할 수도 있다. 예를 들면, 모니터(21) 혹은 단말 장치(40)에 매치한 정보를 제시하여 이용자에게 보고하고, 이용자의 확인을 취득한다. 이용자가 올바르다고 확인하면, 매치하는 정보로서 문서 참조 구조 비교 결과(151a)에 등록한다. 이용자가 올바르지 않다고 확인하면, 매치하지 않는 정보로서, 문서 참조 구조 비교 결과(151a)의 삭제된 정보와 추가된 정보에 각각 등록한다. 또한, 매치하는 정보로서 이용자에게 보고한 후, 필요에 따라서 이용자에게 수정시키도록 할 수도 있다.
이용자에 의해 변경 전의 "presentation2007.xml"과, 변경 후의 "presentation2008.xml"의 대응짓기가 올바르다고 확인된 경우의 문서 참조 구조 비교 결과를 나타낸다. 도 14는 정보 매칭 처리 후의 문서 참조 구조 비교 결과를 도시한 도면이다.
문서 참조 구조 비교 결과(151b)에서는, 삭제된 정보에 등록되어 있던 변경 전의 "presentation2007.xml"과, 추가된 정보에 등록되어 있던 변경 후의 "presentation2008.xml"이, 매치하는 정보에 등록되어 있다. 또한, 매치하는 정보로서 새롭게 등록한 XBRL 문서에 대해서는, 변경 정보 해석부(130)가 변경 내용 해석 처리를 행한다. 변경 전의 "presentation2007.xml"과 변경 후의 "presentation2008.xml"에 대해서는, 문서명이 변경으로 되어 있으므로, 변경 내용에는 「문서명」을 등록한다.
이와 같이, XBRL 문서명이 변경된 경우라도, XBRL 문서간의 참조 관계에 기초하여 의미적으로 등가의 페어를 대응지음으로써, 이용자는, 변경 전의 XBRL 문서와 변경 후의 XBRL 문서를 파악할 수 있다. 이 결과, 다수 있는 XBRL 문서로부터 변경 전과 변경 후에서 매치하는 문서를 찾아내는 작업을 행할 필요가 없어져, 이용자의 작업 효율이 향상된다.
다음으로, 항목 매칭부(142)는, 항목ㆍ형 정보 비교 결과(152a) 및 항목값 비교 결과(153a)에 기초하여, 미대응의 항목의 등가성의 해석을 행한다. 항목 매칭부(142)에서는, 항목 해석부(122)가 검출한 링크 구조 정보에 기초하여 항목의 등가성을 해석한다.
여기서는, 도 8에 도시한 표시 링크 구조 정보(430, 530)에 기초하여, 항목ㆍ형 정보 비교 결과(152a)의 미대응 항목의 대응짓기를 행하는 경우를 예로 설명한다. 표시 링크ㆍ계산 링크ㆍ정의 링크에서는, 정의되어 있는 항목의 링크의 순번으로부터 항목을 매칭시키는 것이 가능하다. 예를 들면, 변경 전의 표시 링크 구조 정보(430)에서는, "Asset"의 자식으로서 "CurrentAsset", "NonCurrentAssets"의 순서로 항목이 링크되어 있다. 이 중, "CurrentAsset"가 삭제된 정보로 되어 있다. 한편, 변경 후의 표시 링크 구조 정보(530)에서는, "Asset"의 자식으로서 "CurrentAssets", "NonCurrentAssets"의 순서로 항목이 링크되어 있다. 따라서, 링크의 부모 자식ㆍ형제 관계로부터, "CurrentAsset"와, "CurrentAssets"는 매치하는 정보라고 추측할 수 있다. 또한, 계산 링크의 부모 자식ㆍ형제 관계 또는 정의 링크의 부모 자식ㆍ형제 관계에 기초하여, 마찬가지의 처리를 행하여, 항목을 대응지을 수도 있다. 전술한 바와 같이, 표시 링크ㆍ계산 링크 및 정의 링크의 부모 자식ㆍ형제 관계는 일치하는 경우가 많다. 따라서, 표시 링크뿐만 아니라, 계산 링크 및 정의 링크로부터 마찬가지의 대응짓기를 행할 수 있으면, 매치하는 정보인 정확도는 보다 높아진다.
또한, 명칭 링크 및 참조 링크에서 정의되어 있는 항목의 리소스의 내용으로부터 항목을 매치시키는 것도 가능하다. 예를 들면, 상기의 XBRL 데이터의 참조 링크로부터 생성한 참조 링크 구조 정보(440, 540)에 기초하여 매칭을 행하는 경우에 대하여 설명한다. 변경 전의 참조 링크 구조 정보(440)의 "CurrentAsset"에는, 참조 링크의 리소스로서 「재무제표 등 규칙, 양식 제B호」가 설정되어 있다. 마찬가지로, 변경 후의 참조 링크 구조 정보(540)의 "CurrentAssets"에도, 참조 링크의 리소스로서 「재무제표 등 규칙, 양식 제B호」가 설정되어 있다. 항목의 근거로 되는 리소스가 일치하고 있기 때문에, CurrentAsset"와, "CurrentAssets"는 매치하는 정보라고 추측할 수 있다. 명칭 링크 및 참조 링크는, 각각 항목의 명칭 및 항목의 근거로 되는 법률이나 문헌 등과 항목을 결부시키고 있다. 이 때문에, 이것이 일치한다고 하는 것은, 대부분의 경우, 항목이 일치하고 있는 것을 의미한다.
또한, 스키마에서 정의되어 있는 항목의 정의순으로부터 항목을 매치시키기 위한 보조적인 정보를 얻는 것도 가능하다. 예를 들면, 변경 전의 스키마에 "Asset", "CurrentAsset", "NonCurrentAssets"의 순으로 항목이 정의되어 있었던 것으로 한다. 마찬가지로, 변경 후의 스키마에 "Asset", "CurrentAssets", "NonCurrentAssets"의 순서로 항목이 정의되어 있는 것으로 한다. 이 경우, 그 정의순의 관계로부터, "CurrentAsset"와 "CurrentAssets"는 매치하는 정보라고 추측할 수 있다. 단, 일반적으로는, 변경에 의해 순번이 변하는 일은 없지만, 스키마의 항목의 정의순은 의미를 갖지 않기 때문에, 보조적인 정보로서 이용한다.
이와 같이, 항목의 대응짓기는, 정의 내용이 상이한 링크 베이스나 스키마의 정의순 등으로부터 추측할 수 있다. 따라서, 매치하는 정보로 추측한 항목의 페어 후보가 복수 발생하는 경우가 있다. 매치하는 정보의 후보가 복수 있는 경우에는, 링크 베이스의 종류 등에 따라서, 정확도에 가중치 부여를 행하여, 종합적인 정확도를 산출한다. 예를 들면, 표시 링크 구조, 계산 링크 구조, 및 정의 링크 구조에 기초하여 매치하는 정보로 추측한 경우의 정확도를 각각 「10」, 명칭 링크 구조 및 참조 링크 구조에 기초하는 경우의 정확도를 「20」으로 한다. 또한, 보조적인 스키마의 정의순에 기초하여 매치하는 정보로 추측한 경우의 정확도는 「1」로 한다. 그리고, 변경 전의 미대응 항목과 변경 후의 미대응 항목의 조합에 대하여, 표시 링크 구조, 계산 링크 구조, 정의 링크 구조, 명칭 링크 구조, 참조 링크 구조 및 스키마의 정의순으로 정확도를 계산하고, 합산한 값을 종합적인 정확도로 한다. 상세한 것은 후술한다.
이렇게 해서 검출한 매치하는 정보의 후보가 올바른지의 여부, 모니터(21) 혹은 단말 장치(40)에 매치하는 정보의 후보를 제시하여 이용자에게 보고하고, 이용자의 확인을 취득하도록 해도 된다. 후보가 1개이면, 이것을 이용자에게 제시하여 확인을 받는다. 이용자가 올바르다고 확인하면, 매치하는 정보로서 항목ㆍ형 정보 비교 결과(152b)에 등록한다. 이용자가 올바르지 않다고 확인하면, 매치하지 않는 정보로서, 항목ㆍ형 정보 비교 결과(152a)의 삭제된 정보와 추가된 정보의 등록을 유지한다. 후보가 복수이면, 정확도가 높은 순으로 매치하는 후보를 제시해 간다. 또한, 매치하는 정보로서 이용자에게 보고한 후, 필요에 따라서 이용자에게 수정시키도록 할 수도 있다.
이상의 항목 매칭 처리의 결과로서, 항목ㆍ형 정보 비교 결과를 갱신한다. 도 15는 정보 매칭 처리 후의 항목ㆍ형 정보 비교 결과를 도시한 도면이다.
항목ㆍ형 정보 비교 결과(152b)에서는, 항목 매칭부(142)에 의해 대응지어진 "CurrentAsset"와 "CurrentAssets"가, 매치하는 정보로서 기록된다. 또한, 변경 정보 해석부(130)에 의한 매치 후의 변경 내용 해석 결과가, 변경 내용에 반영된다. 「항목명」이 변경으로 된 것 외에, 변경 전의 항목ㆍ형 정보(420)와 변경 후의 항목ㆍ형 정보(520)의 대응하는 항목의 정의를 비교하고, 「형」이 변경으로 된 것을 변경 내용에 기록한다.
항목 매칭부(142)에서는, 항목값 비교 결과(153a)에 대해서도 마찬가지의 정보 매칭 처리를 행한다. 그리고, 변경 전의 항목값 정보(450)의 "CurrentAsset"와, 변경 후의 항목값 정보(550)의 "CurrentAssets"가, 매치하는 정보인 것을 검출한다. 또한, 정보 매칭 처리 후의 항목ㆍ형 정보 비교 결과(152b)를 반영하여, 항목값 비교 결과(153a)를 갱신하는 것으로 해도 된다. 도 16은 정보 매칭 처리 후의 항목값 비교 결과를 도시한 도면이다.
항목값 비교 결과(153b)에서는, 항목 매칭부(142)에 의해 대응지어진 "CurrentAsset"와 "CurrentAssets"가, 매치하는 정보로서 기록된다. 또한, 변경 정보 해석부(130)에 의해, 변경 내용에는, 변경 전의 항목값 정보(450)의 "CurrentAsset"의 항목값 「50」과, 변경 후의 항목값 정보(550)의 "CurrentAssets"의 항목값 「100」이 기록된다.
이와 같이, 변경 전후에서 식별자가 상이한 항목에 관해서도, 변경으로 된 항목의 대응짓기와, 그 항목의 변경 전후의 값의 비교를 자동으로 행하는 것이 가능하게 된다.
여기서, 매치하는 정보의 후보의 정확도 산출에 대하여 설명한다. 상술한 바와 같이, 항목의 정보 매칭 처리에서는, 링크의 종류에 따라서 매치하는 정보의 후보가 복수 검출되는 경우가 있다. 따라서, 링크의 종류 등에 따라서 정확도에 가중치 부여를 행하여 종합적인 정확도를 산출한다. 또한, 링크의 종류에 따른 정확도의 가중치 부여는 사전에 지정하거나, 과거의 이용자의 선택에 따른 학습에 의해 정의 변경해도 된다.
이하, 정확도의 학습에 대하여, 예를 들어 설명한다. 변경 전의 스키마에서, 항목 "A1", "B1", "C1"이 설정되고, 변경 후의 스키마에서 항목 "A2", "B2", "C2"가 설정되어 있었던 것으로 한다. 항목은, "A1"과 "A2", "B1"과 "B2", "C1"과 "C2"가 각각 대응한다. 또한, 이 예에서는, 스키마의 정의순에 대해서는 생략한다.
도 17은 매치하는 항목의 후보와 그 정확도를 도시한 도면이다. 각각의 표의 「 표시」, 「계산」, 「정의」, 「명칭」, 「참조」는, 후보의 근거로 된 링크를 나타내고 있다.
정확도의 증가량(초기값)(600)은, 후보로 된 근거(링크의 종류)와, 그 정확도의 증가량을 나타낸 도면이다.
"A1"에 매치하는 항목의 후보와 그 정확도(601)는, 링크의 종류마다 산출한, "A1"과, "A1"과 매칭을 행하는 변경 후의 항목 "A2", "B2", "C2"와의 사이의 매칭의 정확도를 나타내고 있다. "B1"에 매치하는 항목의 후보와 그 정확도(602) 및 "C1"에 매치하는 항목의 후보와 그 정확도(603)에 대해서도 마찬가지이다.
예를 들면, "A1"에 매치하는 항목의 후보와 그 정확도(601)에서는, 표시 링크에서는 "B2", 계산 링크에서는 "C2", 정의 링크에서는 "B2", 명칭 링크에서는 "C2", 참조 링크에서는 "A2"가 후보로서 선택되고, 각각에 정확도가 설정되어 있다. "B1"에 매치하는 항목의 후보와 그 정확도(602)에서는, 표시 링크에서는 "C2", 계산 링크에서는 "A2", 정의 링크에서는 "C2", 명칭 링크에서는 "A2", 참조 링크에서는 "B2"가 후보로서 선택되고, 각각에 정확도가 설정되어 있다. "C1"에 매치하는 항목의 후보와 그 정확도(603)에서는, 표시 링크에서는 "A2", 계산 링크에서는 "B2", 정의 링크에서는 "A2", 명칭 링크에서는 "B2", 참조 링크에서는 "C2"가 후보로서 선택되고, 각각에 정확도가 설정되어 있다.
여기서, "A1"에 매치하는 최유력의 후보는, 상기의 표로부터 합계값이 높은 "B2" 또는 "C2"로 되어, 이용자에게 후보가 제시된다. 그러나, 실제로는 "A2"가 매치하기 때문에, 이용자는, 매치하는 항목으로서 "A2"를 선택한다. 정보 매칭부(140)에는, 올바른 매치하는 항목으로서 "A2"가 보고된다. 따라서, 정보 매칭부(140)는, 올바른 매치하는 항목의 근거로 된 참조 링크의 정확도의 증가량을 10으로부터 20으로 증가시킨다. 여기서는, 참조 링크만이 근거로 되어 있으므로, 참조 링크만 정확도를 증가시키고 있다. 근거가 복수 있는 경우에는, 모두에 대하여 정확도의 증가량을 늘린다.
도 18은 1회째의 학습 후의 정확도와 매치하는 항목의 후보와 그 정확도를 도시한 도면이다. 1회째의 학습 후의 정확도의 증가량(610)에서는, 참조 링크의 정확도 증가량이 10으로부터 20으로 증가되어 있다. 그렇게 하면, "B1"에 매치하는 항목의 후보와 그 정확도(602)의 정확도의 값은, "B1"에 매치하는 항목의 후보와 그 정확도(612)와 같이 변경된다.
"B1"에 매치하는 최유력의 후보는, 상기의 표로부터 합계값이 높은 "B2", "C2" 또는 "A2"로 되어, 이용자에게 후보가 제시된다. 실제로는 "B2"가 매치하기 때문에, 이용자는, 매치하는 항목으로서 "B2"를 선택한다. 정보 매칭부(140)에는, 올바른 매치하는 항목으로서 "B2"가 보고된다. 따라서, 정보 매칭부(140)는, 올바른 매치하는 항목의 근거로 된 참조 링크의 정확도의 증가량을 20으로부터 30으로 증가시킨다.
도 19는 2회째의 학습 후의 정확도와 매치하는 항목의 후보와 그 정확도를 도시한 도면이다. 2회째의 학습 후의 정확도의 증가량(620)에서는, 참조 링크의 정확도 증가량이 20으로부터 30으로 증가되어 있다. 그렇게 하면, "C1"에 매치하는 항목의 후보와 그 정확도(603)의 정확도의 값은, "C1"에 매치하는 항목의 후보와 그 정확도(623)와 같이 변경된다. 이에 의해, "C1"에 매치하는 최유력의 후보는, 상기의 표로부터 합계값이 높은 "C2"만으로 되어, 실제로 대응하는 "C2"가 선택된다.
학습을 행하고 있지 않은 경우에는 "C2"는 최유력의 후보로는 되어 있지 않았지만, 학습에 의해 유일한 최유력 후보로 된다.
또한, 매치하는 항목이 이용자에게 선택된 경우에, 정확도의 증가량을 어느 정도 늘릴 것인지는, 시스템이나 데이터에 따라서 자유롭게 정한다. 또한, 매회 늘리는 것이 아니라, 선택 결과를 누적하여, 특정한 타이밍에서 늘려도 된다. 혹은, 이용자가 선택하지 않았던 후보의 근거에 대하여 정확도의 증가량을 줄여도 된다. 또한, 후보 중에 매치하는 항목이 없고, 또한 이용자가 선택 자체를 행하지 않았던 경우에는, 모든 후보의 근거에 대하여 정확도의 증가량을 줄여도 된다. 또한, 학습은 항상 행하고 있을 필요는 없고, 시스템이나 데이터의 상태 혹은 이용자의 요구에 따라서 학습의 정지와 재개를 제어해도 된다. 어떤 타이밍에서 정확도의 증가량을 초기화해도 되고, 증가량의 초기값은 임의로 설정할 수 있다.
이와 같이, 매칭의 학습을 행함으로써, XBRL 데이터의 종류나 변경의 경향에 따른 매칭 처리를 행할 수 있어, 정밀도가 높은 비교 결과를 얻을 수 있다.
그런데, XBRL의 특징 중의 하나로, 기존의 스키마나 링크 베이스에 변경을 가하지 않고, 택소노미를 확장할 수 있다고 하는 확장 택소노미 기능이 있다. 예를 들면, 도 5에 도시한 변경 전의 인스턴스 문서(400)의 항목 "CurrentAsset"의 표시 링크의 자식으로서 "Cash"라고 하는 항목을 가하고자 하는 것으로 한다. 이와 같은 경우, 확장 택소노미로서, 추가하는 항목의 정의를 행하는 확장 스키마(schema-ext.xsd)와, 항목의 표시 위치를 정의하는 확장 표시 링크(presentation-ext.xml)와, 항목의 명칭을 정의하는 확장 명칭 링크(label-ext.xml)를 생성한다. 확장 스키마(schema-ext.xsd)가, 기본으로 되는 베이스 택소노미의 스키마(schema2007.xsd)를 참조하는 구성으로 함으로써, 변경 전의 스키마의 내용을 변경하지 않고, 새로운 항목을 추가할 수 있다.
여기서, 변경 후의 인스턴스 문서(500)에서는, 동일한 의미를 갖는 항목이 "CurrentAssets"로 변경된다. 따라서, 확장 택소노미에서 정의되어 있는 "Cash"를 "CurrentAssets"의 자식으로 변경해야만 한다. 그러나, 종래의 처리에서는, 변경 전의 "CurrentAsset"와 대응하는 변경 후의 항목은 이용자가 찾아야만 하여, 번잡한 작업이 필요하였다. 해석 장치(100)에서는, 변경 전의 "CurrentAsset"와, 변경 후의 "CurrentAssets"가 매치하는 항목인 것을 자동적으로 검출하고, 이용자에게 보고한다. 이용자는, 이 정보를 확인하고, 확장 택소노미를 적절하게 수정할 수 있다. 이와 같이, 변경 내용에 대하여 해석을 행할 수 있기 때문에, 확장 택소노미가 참조하고 있는 베이스 택소노미의 항목의 이름이 변경되어도, 참조를 적절하게 수정할 수 있다. 또한, 비교 처리는, 확장 택소노미도 대상으로 된다. 따라서, 감사 업무 등에서, 재제출된 보고서에서 확장 택소노미의 항목의 이름이 변경되어 있었던 경우라도, 해석 장치(100)에 의해, 항목의 이름이 변경되었다라고 하는 사실 및 항목의 변경 내용을 파악할 수 있다. 또한, 택소노미 개발 등에서, 항목의 이름이 변경된 경우라도, 변경 전의 항목과 변경 후의 항목을 배열하여 표시할 수 있다. 이용자는, 표시에 의해 변경 내용을 확인할 수 있다.
이상과 같이, 해석 장치(100)에 의하면, 정보의 식별자가 변경되어 있어도, 의미적으로 등가의 정보의 페어를 자동적으로 검출하고, 그 변경 개소와 변경 내용을 해석하여 이용자에게 보고할 수 있다. 이에 의해, 이용자는, 관리 업무나 감사 업무, 택소노미의 개발 등, 다양한 장면에서, 변경 내용의 확인이 용이해져, 작업의 부담이 경감된다.
다음으로, 해석 장치(100)의 실행하는 처리 수순을, 플로우차트를 이용하여 설명한다.
도 20은 해석 장치의 처리 전체를 도시한 플로우차트이다.
[스텝 S01] 해석 장치(100)는, 키보드(22), 마우스(23)를 통하여 직접, 혹은 네트워크(30)를 통하여 단말 장치(40)로부터 해석의 대상의 문서명과, 해석 지시를 취득한다. 예를 들면, 비교 대상의 인스턴스 문서명 혹은, 스키마명을 취득한다.
[스텝 S02] 데이터 구조 해석부(120)는, 스텝 S01에서 취득한 대상 문서명에 기초하여, 비교 대상인 변경 전후의 XBRL 데이터를 XBRL 데이터 기억 장치(110)로부터 읽어들인다. 스텝 S01에서 링크 베이스가 지정되었을 때는, 문서간의 참조 관계를 해석하고, 스키마명을 특정한다.
[스텝 S03] 데이터 구조 해석부(120)는, 스텝 S02에서 읽어낸 변경 전후의 XBRL 데이터의 구조를 해석하고, 항목 관련 정보를 추출하는 데이터 구조 해석 처리를 행한다. 처리가 실행되면, 문서간의 참조 관계에 기초하는 문서 구조를 나타낸 문서 참조 구조 정보, 항목의 정의 정보를 추출한 항목ㆍ형 정보, 항목값을 추출한 항목값 정보 및 항목간의 링크 구조를 나타낸 링크 구조 정보가 생성된다. 처리의 상세 내용은 후술한다.
[스텝 S04] 변경 정보 해석부(130)는, 스텝 S03에서 생성된 정보를 이용하여 변경 개소의 해석 처리를 행한다. 이때, 대응짓기를 할 수 있었던 항목에 대해서는, 변경 내용의 해석도 행한다. 처리를 실행하면, 변경 전의 XBRL 데이터와 변경 후의 XBRL 데이터를 비교한 비교 결과가 생성된다. 여기서는, 문서 참조 구조 비교 결과(151), 항목ㆍ형 정보 비교 결과(152) 및 항목값 비교 결과(153)가 얻어진다. 처리의 상세 내용은 후술한다.
[스텝 S05] 정보 매칭부(140)는, 스텝 S04의 처리에서 검출된 변경 전후의 XBRL 데이터에서 대응짓기를 할 수 없었던 미대응 문서 및 미대응 항목에 대하여, 매칭 처리를 행한다. 처리를 실행하면, 변경 전의 미대응 문서와 변경 후의 미대응 문서, 변경 전의 미대응 항목과 변경 후의 미대응 항목이 각각 대응지어진다. 처리의 상세 내용은 후술한다.
[스텝 S06] 변경 정보 해석부(130)는, 스텝 S05에서 새롭게 대응지어진 항목에 대하여, 변경 내용을 해석한다.
[스텝 S07] 변경 정보 해석부(130)는, 상기의 처리 수순에 의해 검출한 변경 개소와 변경 내용에 관한 해석 결과를 모니터(21)에 표시하고, 이용자에게 결과를 보고한다. 또한, 네트워크(30)를 통하여 이용자의 단말 장치(40)에 송신하고, 단말 장치(40)가 이용자에게 결과를 보고하는 것으로 해도 된다. 해석의 결과, 변경 전에만 존재한 정보(문서 및 항목)는, 삭제된 정보로서 이용자에게 보고한다. 변경 후에만 존재한 정보는, 추가된 정보로서 이용자에게 보고한다. 변경의 전후에 존재한 정보는, 내용이 변경된 정보로서 이용자에게 보고한다. 또한, 매칭 처리에 의해 매치한 정보도, 내용이 변경된 정보로서 이용자에게 보고한다.
이상의 처리 수순이 실행됨으로써, 변경 전후에 정보의 식별자가 변경되어 있어도 의미적으로 등가의 정보의 페어를 자동적으로 검출하고, 대응지을 수 있다. 이에 의해, 변경 개소의 특정뿐만 아니라, 변경 내용에 대해서도 해석을 행하고, 해석 결과를 이용자에게 보고할 수 있다. 이 결과, 이용자는, 해석 장치(10)가 매치시킨 정보나 변경 내용의 확인만을 행하면 되어, 종래와 같이 다수 있는 정보로부터 매치하는 후보를 찾아내는 작업으로부터 해방된다.
이하, 데이터 구조 해석 처리(스텝 S03), 변경 개소 해석 처리(스텝 S04) 및 매칭 처리(스텝 S05)의 처리에 대하여 설명한다.
도 21은 데이터 구조 해석 처리의 수순을 도시한 플로우차트이다.
데이터 구조 해석부(120)에서는, 읽어들인 XBRL 데이터의 해석 처리를 행한다.
[스텝 S31] 문서 참조 구조 해석부(121)는, 읽어들인 대상의 XBRL 데이터에 포함되는 문서간의 참조 관계를 해석하고, 참조 관계에 기초하는 문서의 참조 구조를 검출한다. 그리고, 검출한 문서의 참조 구조에 관한 문서 참조 구조 정보(410, 510)를 생성한다. XBRL 데이터에 확장 택소노미가 포함되어 있었을 때는, 확장 택소노미를 포함하여 문서의 참조 구조를 해석한다. 그리고, 보고가 지정되어 있었을 때는, 생성한 문서 참조 구조 정보(410, 510)를 요구원의 장치에 송출한다. 요구원의 장치에서는, 취득한 문서 참조 구조 정보(410, 510)에 기초하는 화면을 표시하고, 이용자에게 해석 결과를 보고할 수 있다.
[스텝 S32] 항목 해석부(122)는, 읽어들인 XBRL 데이터에 포함되는 스키마로부터, 항목이나 형의 이름, 정의 내용, 출현순 등의 스키마에 정의되어 있는 항목의 관련 정보를 추출한다. 그리고, 추출한 정보를 항목ㆍ형 정보(420, 520)에 등록한다. 보고가 지정되어 있었을 때는, 요구원에 항목ㆍ형 정보(420, 520)를 송신하는 것으로 해도 된다.
[스텝 S33] 항목 해석부(122)는, 또한, 읽어들인 XBRL 데이터에 포함되는 각 링크 베이스로부터, 링크 베이스에 정의되는 링크 구조를 해석한다. 그리고, 해석 결과에 기초하여, 링크마다 링크 구조 정보를 생성한다. 예를 들면, 표시 링크이면, 표시 링크 구조 정보(430, 530), 참조 링크이면, 참조 링크 구조 정보(440, 540)를 생성한다. 필요에 따라서, 계산 링크, 정의 링크 및 명칭 링크에 대해서도 마찬가지로 링크 구조 정보를 생성한다. 보고가 지정되어 있었을 때는, 요구원에 링크 구조 정보를 송신하는 것으로 해도 된다.
[스텝 S34] 항목 해석부(122)는, 읽어들인 XBRL 데이터에 포함되는 인스턴스 문서로부터, 항목의 값, 참조하는 콘텍스트, 출현순 등을 추출한다. 그리고, 추출한 정보로부터 항목값 정보를 생성한다. 보고가 지정되어 있었을 때는, 요구원에 항목값 정보를 송신하는 것으로 해도 된다.
이상의 처리 수순이 실행됨으로써, 대상의 XBRL 데이터의 문서간의 참조 구조를 해석한 문서 참조 구조 정보가 생성된다. 또한, 링크 베이스에 기초하여 링크 구조를 해석한 링크 구조 정보가 생성됨과 함께, 각 항목의 정보를 추출한 항목ㆍ형 정보 및 항목값 정보가 생성된다.
도 22는 변경 개소 해석 처리의 수순을 도시한 플로우차트이다.
[스텝 S41] 변경 정보 해석부(130)는, 데이터 구조 해석부(120)가 생성한 변경 전과 변경 후의 데이터의 구조 정보를 취득한다. 예를 들면, 변경 전의 문서 참조 구조 정보(410), 항목ㆍ형 정보(420), 항목값 정보(450)와, 변경 후의 문서 참조 구조 정보(510), 항목ㆍ형 정보(520), 항목값 정보(550)를 취득한다.
[스텝 S42] 변경 정보 해석부(130)는, 스텝 S41에서 취득한 변경 전의 데이터의 구조 정보와, 변경 후의 데이터의 구조 정보를 비교한다. 변경 전의 문서 참조 구조 정보(410)와 변경 후의 문서 참조 구조 정보(510)는, 참조 구조에 기초하여, 문서의 문서 식별자(문서명)를 비교한다. 변경 전의 항목ㆍ형 정보(420)와 변경 후의 항목ㆍ형 정보(520)는, 항목의 식별자(항목명)를 비교한다. 변경 전의 항목값 정보(450)와 변경 후의 항목값 정보(550)는, 항목의 식별자(항목명)를 비교한다.
[스텝 S43] 변경 정보 해석부(130)는, 스텝 S42의 비교의 결과, 정보의 식별자가 변경 전에만 존재하고, 변경 후에는 존재하지 않는지의 여부를 판정한다. 정보의 식별자가 변경 전에만 존재할 때는, 처리를 스텝 S45로 진행시킨다. 그 이외는, 처리를 스텝 S44로 진행시킨다.
[스텝 S44] 변경 정보 해석부(130)는, 정보의 식별자가 변경 전에만 존재하는 것이 아닐 때는, 정보의 식별자가 변경 후에만 존재하지 않는지의 여부를 판정한다. 정보의 식별자가 변경 후에만 존재할 때는, 처리를 스텝 S46으로 진행시킨다. 그 이외는, 처리를 스텝 S47로 진행시킨다.
[스텝 S45] 변경 정보 해석부(130)는, 정보의 식별자가 변경 전에만 존재할 때는, 이 정보를 삭제된 정보로 판정하고, 비교 결과에 등록한다. 그 후, 처리를 스텝 S48로 진행시킨다.
[스텝 S46] 변경 정보 해석부(130)는, 정보의 식별자가 변경 후에만 존재할 때는, 이 정보를 추가된 정보로 판정하고, 비교 결과에 등록한다. 그 후, 처리를 스텝 S48로 진행시킨다.
[스텝 S47] 변경 정보 해석부(130)는, 정보의 식별자가 변경 전 및 변경 후에 존재할 때는, 이 정보를 내용이 변경된 정보로 판정하고, 비교 결과에 등록한다. 또한, 정보의 식별자가 일치한 정보에 대해서는, 변경 내용도 해석하고, 비교 결과에 등록한다.
[스텝 S48] 변경 정보 해석부(130)는, 전체 정보에 대하여 비교 처리가 종료되었는지의 여부를 판정한다. 종료되지 않았다고 판정하였을 때는, 스텝 S42로 되돌아가서, 다음 정보의 체크를 행한다. 종료되었다고 판정하였을 때는, 처리를 종료한다.
이상의 처리 수순이 변경 전의 문서 참조 구조 정보(410)와 변경 후의 문서 참조 구조 정보(510)에 적용되어, 문서 참조 구조 비교 결과(151)가 생성된다. 또한, 변경 전의 항목ㆍ형 정보(420)와 변경 후의 항목ㆍ형 정보(520)에 적용되어, 항목ㆍ형 정보 비교 결과(152)가 생성된다. 또한, 변경 전의 항목값 정보(450)와 변경 후의 항목값 정보(550)에 적용되어, 항목값 비교 결과(153)가 생성된다.
이하, 매칭 처리에 대하여 설명한다. 여기서는, 매칭 처리를, 문서의 등가성 해석과, 항목의 등가성 해석으로 나누어 설명한다.
도 23은 매칭(문서의 등가성 해석) 처리의 수순을 도시한 플로우차트이다.
[스텝 S501] 문서 매칭부(141)는, XBRL 데이터의 변경 전의 문서 참조 구조 정보(410) 및 변경 후의 문서 참조 구조 정보(510)와, 문서 참조 구조 비교 결과(151a)를 취득한다.
[스텝 S502] 문서 매칭부(141)는, 문서 참조 구조 비교 결과(151a)로부터, 추가된 정보에 등록되어 있는 문서명과, 삭제된 정보에 등록되어 있는 문서명을 1개씩 추출한다. 추출한 문서를 대상 문서로 한다.
[스텝 S503] 문서 매칭부(141)는, 문서 참조 구조 정보(410, 510)에 기초하여, 추출한 대상 문서 각각에 대하여, 참조 관계에서 부모로 되는 문서명 및 형제로 되는 문서명을 추출한다.
[스텝 S504] 문서 매칭부(141)는, 스텝 S503에서 추출한 대상 문서 쌍방의 부모의 문서명과, 형제의 문서명이 일치, 또는 소정의 매칭 조건을 충족시키는지의 여부를 확인한다. 매칭 조건으로서, 예를 들면, 일치하지 않는 문서가 확장 택소노미이면 되는 등, 매치한다고 간주하는 조건을 미리 정해 둔다. 매치한다고 판정하였을 때는, 처리를 스텝 S505로 진행시킨다. 매치하지 않는다고 판정하였을 때는, 처리를 스텝 S506으로 진행시킨다.
[스텝 S505] 문서 매칭부(141)는, 대상 문서가 매치한다고 판정하였을 때는, 변경 전후의 대상 문서를 매치하는 정보로서 보고한다. 대상 문서를 문서 참조 구조 비교 결과(151a)의 삭제된 정보 및 추가된 정보로부터 삭제하고, 매치하는 정보에 등록한다. 또한, 등록 전에, 이용자에게 매치한다고 판정한 문서를 제시하고, 매칭이 올바르게 행해졌는지의 여부를 확인받도록 해도 된다. 이용자에 의해 매치하지 않는다고 지시되었을 때는, 등록은 중지한다.
[스텝 S506] 문서 매칭부(141)는, 모든 문서에 대하여 매칭 처리를 종료하였는지의 여부를 판정한다. 종료되지 않았을 때는, 처리를 스텝 S502로 되돌려, 다음 대상 문서의 선택으로부터의 처리를 행한다. 종료되었을 때는, 문서의 매칭 처리를 종료한다.
이상의 처리 수순이 실행됨으로써, 식별자는 상이하지만 등가의 문서가 매칭되어, 비교 결과에 반영된다. 이렇게 하여, 문서 참조 구조 비교 결과(151b)가 얻어진다.
도 24는 매칭(항목의 등가성 해석) 처리의 수순을 도시한 플로우차트이다. 또한, 이하의 설명에서는, 간단하게 하기 위해서, 항목ㆍ형 정보 비교 결과(152a)의 매칭 처리에 대하여 설명한다. 항목값 비교 결과(153a)에서도 마찬가지의 처리를 행할 수 있다.
[스텝 S511] 항목 매칭부(142)는, XBRL 데이터의 변경 전의 데이터의 구조 정보 및 비교 결과와, 변경 후의 데이터의 구조 정보 및 비교 결과를 취득한다. 예를 들면, 데이터의 구조 정보로서, 변경 전의 표시 링크 구조 정보(430) 및 참조 링크 구조 정보(440)와, 변경 후의 표시 링크 구조 정보(530) 및 참조 링크 구조 정보(540)를 취득한다. 또한, 비교 결과로서, 항목ㆍ형 정보 비교 결과(152a)를 취득한다.
[스텝 S512] 항목 매칭부(142)는, 항목ㆍ형 정보 비교 결과(152a)로부터, 추가된 정보에 등록되어 있는 항목명과, 삭제된 정보에 등록되어 있는 항목명을 1개씩 추출한다. 추출한 항목을 대상 항목으로 한다.
[스텝 S513] 항목 매칭부(142)는, 표시 링크 구조 정보(430, 530)에 기초하여, 추출한 대상 항목 각각에 대하여, 부모로 되는 항목명 및 형제로 되는 항목명을 추출한다. 또한, 참조 링크 구조 정보(440, 540)에 기초하여, 대상 항목 각각의 리소스 정보를 추출한다.
[스텝 S514] 항목 매칭부(142)는, 스텝 S513에서 추출한 대상 항목 각각의 부모의 항목명과, 형제의 항목명을 대조하여, 부모ㆍ형제의 항목명이 일치, 또는 미리 정해진 매칭 조건을 충족시키는지의 여부를 판정하는 매칭 처리를 행한다. 매치한다고 판정하였을 때는, 이 대상 항목의 페어를 후보로 하고, 표시 링크에 설정되는 정확도의 증가량을 설정한다. 해당하는 링크가 많을수록, 정확도를 높게 설정한다. 매치하지 하지 않는다고 판정하였을 때는, 후보로 하지 않는다.
[스텝 S515] 항목 매칭부(142)는, 스텝 S513에서 추출한 대상 항목 각각의 리소스 정보 대조하여, 일치하는지의 여부를 판정하는 매칭 처리를 행한다. 매치한다고 판정하였을 때는, 이 대상 항목의 페어를 후보로 하고, 참조 링크에 설정되는 정확도의 증가량을 설정한다. 해당하는 링크가 많을수록, 정확도를 높게 설정한다. 매치하지 않는다고 판정하였을 때는, 후보로 하지 않는다.
[스텝 S516] 항목 매칭부(142)는, 스텝 S514 및 스텝 S515에서의 매칭 처리에서 후보로 된 대상 항목의 페어에 대하여, 다른 후보와 정확도를 비교한다. 대상 항목 외에 후보의 페어가 있는지의 여부, 있을 때는 대상 항목이 가장 정확도가 높은지의 여부를 판정한다. 다른 후보가 없거나, 대상 항목의 정확도가 가장 높을 때는, 처리를 스텝 S517로 진행시킨다. 그 이외일 때는, 처리를 스텝 S518로 진행시킨다.
[스텝 S517] 항목 매칭부(142)는, 대상 항목이 매치한다고 판정하였을 때는, 변경 전후의 대상 항목을 매치하는 정보로서 보고한다. 대상 항목을 항목ㆍ형 정보 비교 결과(152a)의 삭제된 정보 및 추가된 정보로부터 삭제하고, 매치하는 정보에 등록한다. 또한, 등록 전에, 이용자에게 매치한다고 판정한 항목을 제시하고, 매칭이 올바르게 행해졌는지의 여부를 확인받도록 해도 된다. 이용자에 의해 매치하지 않는다고 지시되었을 때는, 등록은 중지한다. 또한, 복수의 후보를 제시하고, 올바른 것을 선택하게 하도록 해도 된다. 올바른 항목의 페어가 지시되었을 때는, 지시에 따라서 항목ㆍ형 정보 비교 결과(152a)에 등록을 행한다.
[스텝 S518] 항목 매칭부(142)는, 모든 항목에 대하여 매칭 처리를 종료하였는지의 여부를 판정한다. 종료되지 않았을 때는, 처리를 스텝 S512로 되돌려, 다음 대상 항목의 선택으로부터의 처리를 행한다. 종료되었을 때는, 항목의 매칭 처리를 종료한다.
이상의 처리 수순이 실행됨으로써, 식별자는 상이하지만 등가의 항목이 매칭되어, 비교 결과에 반영된다. 이렇게 해서, 항목ㆍ형 정보 비교 결과(152b)가 얻어진다.
또한, 상기의 매칭 처리 수순에서는, 데이터 구조 해석 처리 및 변경 개소 해석 처리에서 생성된 구조 정보와 비교 결과 정보에 기초하여 매칭 처리를 행하는 것으로 하고 있지만, 매칭 처리의 결과를 이용하여 다시 매칭 처리를 행하는 것으로 해도 된다. 예를 들면, 비교원의 문서에 순서대로 A, B, C로 배열되는 항목과, 비교처의 문서에 순서대로 E, F, G로 배열되는 항목이 있고, 각각 식별자는 상이한 것으로 한다. 식별자가 상이하기 때문에, 각각의 항목을 식별자로 대응짓는 것은 할 수 없다. 그러나, 상기의 매칭 처리 수순을 이용하여, 링크 구조를 비교함으로써, 항목의 매칭을 행할 수 있다. 매칭 처리에 의해, 항목 A와 E, 항목 C와 G가 매치된다고 하는 비교 결과가 얻어진 것으로 한다. 이 비교 결과에 기초하여, 매칭 처리를 행하면, 항목 A와 E, 또한 항목 E와 G가 매치하고 있으므로, 항목 A와 C 사이에 끼워진 항목 B와, 항목 E와 항목 G 사이에 끼워진 항목 F는, 매치한다고 하는 판정이 가능하게 된다.
또한, 도 24에 도시한 매칭 처리 수순의 스텝 S517에서, 이용자로부터 올바른 항목의 페어를 취득하였을 때, 매칭의 학습을 행하는 것으로 해도 된다.
도 25는 매칭 학습 처리의 수순을 도시한 플로우차트이다.
[스텝 S81] 정보 매칭부(140)는, 항목의 매칭 처리에 의해, 매치하는 정보로서 검출한 후보를 추출한다.
[스텝 S82] 정보 매칭부(140)는, 후보가 존재하는지의 여부를 체크한다. 후보가 존재할 때는, 처리를 스텝 S83으로 진행시킨다. 후보가 존재하지 않을 때는, 처리를 종료한다.
[스텝 S83] 정보 매칭부(140)는, 후보가 존재할 때는, 그 후보를 모니터(21) 혹은 단말 장치(40)를 통하여 이용자에게 보고한다. 그리고, 이용자의 확인, 혹은 후보가 복수인 경우에는 선택을 기다리고, 지시를 취득한다.
[스텝 S84] 정보 매칭부(140)는, 스텝 S83에서 취득한 이용자의 지시에 기초하여, 이용자가 선택한 대상 항목의 근거로 되는 링크에 대하여, 정확도의 증가량을 늘린다. 혹은, 선택되지 않았던 대상 항목의 근거로 되는 링크에 대하여, 정확도의 증가량을 줄인다. 이렇게 해서, 링크마다의 정확도의 증가량을 조정한 후, 처리를 종료한다.
이상의 처리 수순이 실행됨으로써, 링크의 가중치 부여가 적절히 갱신되어, 올바른 선택의 근거로 된 링크의 정확도의 증가량이 커진다.
또한, 상기의 처리 기능은, 컴퓨터에 의해 실현할 수 있다. 그 경우, 해석 장치가 가져야 할 기능의 처리 내용을 기술한 프로그램이 제공된다. 그 프로그램을 컴퓨터에서 실행함으로써, 상기 처리 기능이 컴퓨터 상에서 실현된다. 처리 내용을 기술한 프로그램은, 컴퓨터에서 판독 가능한 기록 매체에 기록해 둘 수 있다.
프로그램을 유통시키는 경우에는, 예를 들면, 그 프로그램이 기록된 DVD(Digital Versatile Disc), CD-ROM(Compact Disc Read Only Memory) 등의 가반형 기록 매체가 판매된다. 또한, 프로그램을 서버 컴퓨터의 기억 장치에 저장해 놓고, 네트워크를 통하여, 서버 컴퓨터로부터 다른 컴퓨터에 그 프로그램을 전송할 수도 있다.
프로그램을 실행하는 컴퓨터는, 예를 들면, 가반형 기록 매체에 기록된 프로그램 혹은 서버 컴퓨터로부터 전송된 프로그램을, 자기의 기억 장치에 저장한다. 그리고, 컴퓨터는, 자기의 기억 장치로부터 프로그램을 판독하고, 프로그램에 따른 처리를 실행한다. 또한, 컴퓨터는, 가반형 기록 매체로부터 직접 프로그램을 판독하고, 그 프로그램에 따른 처리를 실행할 수도 있다. 또한, 컴퓨터는, 서버 컴퓨터로부터 프로그램이 전송될 때마다, 축차적으로 수취한 프로그램에 따른 처리를 실행할 수도 있다.
상기에 대해서는 간단히 본 발명의 원리를 나타내는 것이다. 또한, 다수의 변형, 변경이 당업자에게 있어서 가능하고, 본 발명은 상기에 나타내고, 설명한 정확한 구성 및 응용예에 한정되는 것은 아니고, 대응하는 모든 변형예 및 균등물은, 첨부의 청구항 및 그 균등물에 의한 본 발명의 범위로 간주된다.
10 : 해석 장치
11 : 문서 데이터 기억 수단
11a : 문서 데이터 A
11b : 문서 데이터 B
12 : 데이터 구조 해석 수단
13 : 변경 정보 해석 수단
14 : 정보 매칭 수단
20 : 표시 장치
11 : 문서 데이터 기억 수단
11a : 문서 데이터 A
11b : 문서 데이터 B
12 : 데이터 구조 해석 수단
13 : 변경 정보 해석 수단
14 : 정보 매칭 수단
20 : 표시 장치
Claims (16)
- 문서를 비교하고, 문서간에서 일치하지 않는 변경 부분을 해석하는 해석 방법에 있어서,
문서에 포함되는 항목의 값을 기술하는 항목값 파일과, 상기 항목 및 항목간의 관계를 정의하는 정의 파일을 갖는 문서 데이터를 저장하는 기억 수단으로부터, 비교 대상의 제1 문서 데이터 및 제2 문서 데이터를 읽어내고,
상기 정의 파일의 상기 항목간의 관계를 해석하여 항목간의 구조 정보를 생성하고,
상기 제1 문서 데이터에 정의되어 있는 항목의 식별자와, 상기 제2 문서 데이터에 정의되어 있는 항목의 식별자를 비교하여, 상기 제1 문서 데이터에만 존재하는 제1 미대응 항목 및 상기 제2 문서 데이터에만 존재하는 제2 미대응 항목을 검출하고,
상기 항목간의 구조 정보에 기초하여, 상기 제1 미대응 항목에 관련되는 항목간의 관계와 상기 제2 미대응 항목에 관련되는 항목간의 관계를 비교하고, 항목간의 관계가 공통된다고 판정한 상기 제1 미대응 항목과 상기 제2 미대응 항목을 대응짓는 것을 특징으로 하는 해석 방법. - 제1항에 있어서,
또한, 상기 제1 문서 데이터 및 상기 제2 문서 데이터 각각에 대하여, 상기 문서 데이터에 속하는 파일간의 참조 관계를 해석하여 문서의 구조 정보를 생성하고,
상기 제1 문서 데이터에 속하는 파일의 식별자와, 상기 제2 문서 데이터에 속하는 파일의 식별자를 비교하여, 상기 제1 문서 데이터에만 존재하는 제1 미대응 파일 및 상기 제2 문서 데이터에만 존재하는 제2 미대응 파일을 검출하고,
상기 문서의 구조 정보에 기초하여, 상기 제1 미대응 파일에 관련되는 파일간의 참조 관계와, 상기 제2 미대응 파일에 관련되는 파일간의 참조 관계를 비교하고, 파일간의 참조 관계가 공통된다고 판정한 상기 제1 미대응 파일과 상기 제2 미대응 파일을 대응짓는 것을 특징으로 하는 해석 방법. - 제2항에 있어서,
또한, 상기 제1 문서 데이터의 파일과, 상기 제2 문서 데이터의 파일의 대응 관계를 나타낸 파일 대응표에, 상기 파일의 식별자의 비교에 의해 대응지어진 상기 제1 문서 데이터에 속하는 파일과 상기 제2 문서 데이터에 속하는 파일을 등록함과 함께, 상기 문서의 구조 정보에 기초하여 대응지어진 상기 제1 미대응 파일과 상기 제2 미대응 파일을 등록하고, 상기 파일 대응표에 기초하여, 대응지어진 파일간의 차이를 해석하고, 해석 결과를 파일 변경 내용으로서 기록하고,
상기 제1 문서 데이터의 항목과, 상기 제2 문서 데이터의 항목의 대응 관계를 나타낸 항목 대응표에, 상기 항목의 식별자의 비교에 의해 대응지어진 상기 제1 문서 데이터의 항목과 상기 제2 문서 데이터의 항목을 등록함과 함께, 상기 항목간의 구조 정보에 기초하여 대응지어진 상기 제1 미대응 항목과 상기 제2 미대응 항목을 등록하고, 상기 항목 대응표에 기초하여 대응지어진 항목간의 차이를 해석하고, 해석 결과를 항목 변경 내용으로서 기록하는 것을 특징으로 하는 해석 방법. - 제3항에 있어서,
상기 제1 문서 데이터의 항목의 제1 항목값을 상기 제1 문서 데이터에 포함되는 상기 항목값 파일로부터 추출하고, 상기 제2 문서 데이터의 제2 항목값을 상기 제2 문서 데이터에 포함되는 상기 항목값 파일로부터 추출하고, 상기 항목 대응표에 기초하여, 상기 제1 항목값 또는 상기 제2 항목값 중 어느 한쪽을 상기 항목의 변경 전 데이터, 다른 쪽을 상기 항목의 변경 후 데이터로서 대응짓는 것을 특징으로 하는 해석 방법. - 제3항에 있어서,
상기 정의 파일에는, 상기 항목의 데이터의 형(型)을 포함하는 상기 항목의 특징이 정의되고,
상기 제1 문서 데이터의 항목의 특징을 상기 제1 문서 데이터에 포함되는 상기 정의 파일로부터 추출하고, 상기 제2 문서 데이터의 항목의 특징을 상기 제2 문서 데이터에 포함되는 상기 정의 파일로부터 추출하고, 상기 항목 대응표에 기초하여, 상기 제1 문서 데이터의 항목의 특징 또는 상기 제2 문서 데이터의 항목의 특징 중 어느 한쪽을 상기 항목의 변경 전의 특징, 다른 쪽을 상기 항목의 변경 후의 특징으로서 대응짓는 것을 특징으로 하는 해석 방법. - 제2항에 있어서,
상기 문서의 구조 정보에 기초하는 대응짓기에서는, 상기 문서의 구조 정보에 기초하여, 상기 제1 미대응 파일과 부모 자식 관계 또는 형제 관계에 있는 파일을 검출함과 함께, 상기 제2 미대응 파일과 부모 자식 관계 또는 형제 관계에 있는 파일을 검출하고, 상기 제1 미대응 파일과의 사이에서 부모 자식 관계를 갖는 파일의 식별자와, 상기 제2 미대응 파일과의 사이에서 부모 자식 관계를 갖는 파일의 식별자, 또는 상기 제1 미대응 파일과의 사이에서 형제 관계를 갖는 파일의 식별자와, 상기 제2 미대응 파일과의 사이에서 형제 관계를 갖는 파일의 식별자를 비교하고, 모두가 일치 또는 미리 정해진 매치 조건을 충족시키면, 상기 파일간의 참조 관계가 공통된다고 판정하고,
상기 항목간의 구조 정보에 기초하는 대응짓기에서는, 상기 항목간의 구조 정보에 기초하여, 상기 제1 미대응 항목과 부모 자식 관계 또는 형제 관계에 있는 항목을 검출함과 함께, 상기 제2 미대응 항목과 부모 자식 관계 또는 형제 관계에 있는 항목을 검출하고, 상기 제1 미대응 항목과의 사이에서 부모 자식 관계를 갖는 항목의 식별자와, 상기 제2 미대응 항목과의 사이에서 부모 자식 관계를 갖는 항목의 식별자, 또는 상기 제1 미대응 항목과의 사이에서 형제 관계를 갖는 항목의 식별자와, 상기 제2 미대응 항목과의 사이에서 형제 관계를 갖는 항목의 식별자를 비교하고,
모두가 일치 또는 미리 정해진 매치 조건을 충족시키면, 상기 항목간의 관계가 공통된다고 판정하는 것을 특징으로 하는 해석 방법. - 제1항에 있어서,
상기 정의 파일은, 상기 항목의 표시상의 관계, 의미적인 관계, 상기 항목의 관련 정보를 포함하는 상기 항목에 관한 복수의 정의 파일을 구비하고,
상기 항목간의 구조 정보를 상기 복수의 정의 파일 각각에 대응하여 작성하고,
상기 복수의 정의 파일 각각에 대하여 작성한 상기 항목간의 구조 정보마다, 그 항목간의 구조 정보에 기초하여 상기 제1 미대응 항목에 대응짓는 상기 제2 미대응 항목의 후보를 선택하고, 상기 복수의 정의 파일마다 설정되는 정확도의 증가량을 상기 후보의 정확도에 가산하는 수순을 반복하고, 모든 상기 항목간의 구조 정보에 기초하는 후보 선택이 종료된 시점에서 가장 정확도가 높은 상기 후보를, 상기 제1 미대응 항목에 대응짓는 최유력 후보로 하는 것을 특징으로 하는 해석 방법. - 제7항에 있어서,
상기 제1 미대응 항목에 대응짓는 상기 제2 미대응 항목의 최유력 후보를 포함하는 상기 후보를 이용자에게 제시하여 상기 이용자의 선택을 기다리고, 상기 이용자의 선택이 통지되었을 때는, 상기 통지에 기초하여 상기 이용자가 선택한 상기 제2 미대응 항목의 후보와, 상기 제1 미대응 항목을 대응지음과 함께, 상기 이용자가 선택한 상기 제2 미대응 항목의 후보로 된 상기 정의 파일에 설정되어 있는 상기 정확도의 증가량을 증가하고, 필요에 따라서 다른 상기 정의 파일에 설정되어 있는 상기 정확도의 증가량을 감소하여 상기 정의 파일에 설정되는 상기 정확도의 증가량을 조정하는 것을 특징으로 하는 해석 방법. - 제1항에 있어서,
상기 문서 데이터는, XBRL(eXtensible Business Reporting Language)에 기초하여 작성된 인스턴스 문서와, 스키마 및 링크 베이스로 이루어지는 택소노미 문서의 집합이고,
상기 링크 베이스에 정의되는 상기 항목간의 관계를 해석하여 링크 구조 정보를 생성하고,
제1 XBRL 데이터에만 존재하는 제1 미대응 항목 및 제2 XBRL 데이터에만 존재하는 제2 미대응 항목을 검출하고,
상기 링크 구조 정보에 기초하여, 상기 제1 미대응 항목에 관련되는 링크 구조와 상기 제2 미대응 항목에 관련되는 링크 구조를 비교하고, 상기 링크 구조가 공통된다고 판정한 상기 제1 미대응 항목과 상기 제2 미대응 항목을 대응짓는 것을 특징으로 하는 해석 방법. - 제9항에 있어서,
또한, 상기 XBRL 데이터를 저장하는 기억 수단으로부터, 비교 대상의 제1 XBRL 데이터 및 제2 XBRL 데이터를 읽어내고,
상기 제1 XBRL 데이터 및 상기 제2 XBRL 데이터에 대하여, 상기 인스턴스 문서, 상기 스키마 및 상기 링크 베이스의 참조 관계를 해석하고, 그 XBRL 데이터의 참조 구조를 검출하여 문서의 구조 정보를 생성하고,
상기 제1 XBRL 데이터에만 존재하는 제1 미대응 문서 및 상기 제2 XBRL 데이터에만 존재하는 제2 미대응 문서를 검출하고,
상기 문서의 구조 정보에 기초하여, 상기 제1 미대응 문서에 관련되는 문서간의 참조 관계와, 상기 제2 미대응 문서에 관련되는 문서간의 참조 관계를 비교하고, 상기 문서간의 참조 관계가 공통된다고 판정한 상기 제1 미대응 문서와 상기 제2 미대응 문서를 대응짓는 것을 특징으로 하는 해석 방법. - 제10항에 있어서,
상기 제1 XBRL 데이터의 문서와, 상기 제2 XBRL 데이터의 문서의 대응 관계를 나타낸 문서 대응표에, 상기 문서의 식별자의 비교에 의해 대응지어진 상기 제1 XBRL 데이터의 문서와 상기 제2 XBRL 데이터에 속하는 문서를 등록함과 함께, 상기 문서의 구조 정보에 기초하여 대응지어진 상기 제1 미대응 문서와 상기 제2 미대응 문서를 등록하고, 상기 문서 대응표에 기초하여, 대응지어진 문서간의 차이를 해석하고, 해석 결과를 파일 변경 내용으로서 기록하고,
상기 제1 XBRL 데이터의 항목과, 상기 제2 XBRL 데이터의 항목의 대응 관계를 나타낸 항목 대응표에, 상기 항목의 식별자의 비교에 의해 대응지어진 상기 제1 XBRL 데이터의 항목과 상기 제2 XBRL 데이터의 항목을 등록함과 함께, 상기 링크 구조 정보에 기초하여 대응지어진 상기 제1 미대응 항목과 상기 제2 미대응 항목을 등록하고, 상기 항목 대응표에 기초하여 대응지어진 항목간의 차이를 해석하고, 해석 결과를 항목 변경 내용으로서 기록하는 것을 특징으로 하는 해석 방법. - 제9항에 있어서,
상기 링크 베이스에 포함되는 표시 링크, 계산 링크, 정의 링크, 명칭 링크 및 참조 링크 중, 임의의 링크 베이스에 대하여 상기 링크 구조 정보를 작성하고,
각각의 상기 링크 베이스에 기초하여 작성한 상기 링크 구조 정보마다, 그 링크 구조 정보에 기초하여 상기 제1 미대응 항목에 대응짓는 상기 제2 미대응 항목의 후보를 선택하고, 상기 링크 베이스마다 설정되는 정확도의 증가량을 상기 후보의 정확도에 가산하는 수순을 반복하고, 모든 상기 링크 구조 정보에 기초하는 후보 선택이 종료된 시점에서 가장 정확도가 높은 상기 후보를, 상기 제1 미대응 항목에 대응짓는 최유력 후보로 하는 것을 특징으로 하는 해석 방법. - 문서를 비교하고, 문서간에서 일치하지 않는 변경 부분을 해석하는 해석 장치에 있어서,
문서에 포함되는 항목의 값을 기술하는 항목값 파일과, 상기 항목 및 항목간의 관계를 정의하는 정의 파일을 갖는 문서 데이터를 저장하는 기억 수단과,
상기 정의 파일의 상기 항목간의 관계를 해석하여 항목간의 구조 정보를 생성하는 데이터 구조 해석 수단과,
비교 대상의 제1 문서 데이터 및 제2 문서 데이터를 읽어내고, 상기 제1 문서 데이터에 정의되어 있는 상기 항목의 식별자와, 상기 제2 문서 데이터에 정의되어 있는 상기 항목의 식별자를 비교하여, 상기 제1 문서 데이터에만 존재하는 제1 미대응 항목 및 상기 제2 문서 데이터에만 존재하는 제2 미대응 항목을 검출하는 변경 정보 해석 수단과,
상기 항목간의 구조 정보에 기초하여, 상기 제1 미대응 항목에 관련되는 항목간의 관계와 상기 제2 미대응 항목에 관련되는 항목간의 관계를 비교하고, 항목간의 관계가 공통된다고 판정한 상기 제1 미대응 항목과 상기 제2 미대응 항목을 대응짓는 정보 매칭 수단을 갖는 것을 특징으로 하는 해석 장치. - 제13항에 있어서,
상기 데이터 구조 해석 수단은, 비교 대상의 제1 문서 데이터 및 제2 문서 데이터를 읽어내고, 상기 제1 문서 데이터 및 상기 제2 문서 데이터 각각에 대하여, 상기 문서 데이터에 속하는 파일간의 참조 관계를 해석하여 문서의 구조 정보를 생성하고,
상기 변경 정보 해석 수단은, 상기 제1 문서 데이터에 속하는 파일의 식별자와, 상기 제2 문서 데이터에 속하는 파일의 식별자를 비교하여, 상기 제1 문서 데이터에만 존재하는 제1 미대응 파일 및 상기 제2 문서 데이터에만 존재하는 제2 미대응 파일을 검출하고,
상기 정보 매칭 수단은, 상기 문서의 구조 정보에 기초하여, 상기 제1 미대응 파일에 관련되는 파일간의 참조 관계와, 상기 제2 미대응 파일에 관련되는 파일간의 참조 관계를 비교하고, 파일간의 참조 관계가 공통된다고 판정한 상기 제1 미대응 파일과 상기 제2 미대응 파일을 대응짓는 것을 특징으로 하는 해석 장치. - 문서를 비교하고, 문서간에서 일치하지 않는 변경 부분을 해석하는 처리를 위한 해석 프로그램에 있어서,
컴퓨터를,
문서에 포함되는 항목의 값을 기술하는 항목값 파일과, 상기 항목 및 항목간의 관계를 정의하는 정의 파일을 갖는 문서 데이터를 저장하는 기억 수단으로부터, 비교 대상의 제1 문서 데이터 및 제2 문서 데이터를 읽어내고, 상기 정의 파일의 상기 항목간의 관계를 해석하여 항목간의 구조 정보를 생성하는 데이터 구조 해석 수단,
상기 제1 문서 데이터에 정의되어 있는 항목의 식별자와, 상기 제2 문서 데이터에 정의되어 있는 항목의 식별자를 비교하여, 상기 제1 문서 데이터에만 존재하는 제1 미대응 항목 및 상기 제2 문서 데이터에만 존재하는 제2 미대응 항목을 검출하는 변경 정보 해석 수단,
상기 항목간의 구조 정보에 기초하여, 상기 제1 미대응 항목에 관련되는 항목간의 관계와 상기 제2 미대응 항목에 관련되는 항목간의 관계를 비교하고, 항목간의 관계가 공통된다고 판정한 상기 제1 미대응 항목과 상기 제2 미대응 항목을 대응짓는 정보 매칭 수단
으로서 기능시키는 것을 특징으로 하는 해석 프로그램. - 제15항에 있어서,
상기 컴퓨터를, 또한,
비교 대상의 제1 문서 데이터 및 제2 문서 데이터를 읽어내고, 상기 제1 문서 데이터 및 상기 제2 문서 데이터 각각에 대하여, 상기 문서 데이터에 속하는 파일간의 참조 관계를 해석하여 문서의 구조 정보를 생성하는 상기 데이터 구조 해석 수단,
상기 제1 문서 데이터에 속하는 파일의 식별자와, 상기 제2 문서 데이터에 속하는 파일의 식별자를 비교하여, 상기 제1 문서 데이터에만 존재하는 제1 미대응 파일 및 상기 제2 문서 데이터에만 존재하는 제2 미대응 파일을 검출하는 상기 변경 정보 해석 수단,
상기 문서의 구조 정보에 기초하여, 상기 제1 미대응 파일에 관련되는 파일간의 참조 관계와, 상기 제2 미대응 파일에 관련되는 파일간의 참조 관계를 비교하고, 상기 파일간의 참조 관계가 공통된다고 판정한 상기 제1 미대응 파일과 상기 제2 미대응 파일을 대응짓는 상기 정보 매칭 수단
으로서 기능시키는 것을 특징으로 하는 해석 프로그램.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2010/050522 WO2011089683A1 (ja) | 2010-01-19 | 2010-01-19 | 解析方法、解析装置及び解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120104379A true KR20120104379A (ko) | 2012-09-20 |
KR101384405B1 KR101384405B1 (ko) | 2014-04-10 |
Family
ID=44306507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127018600A KR101384405B1 (ko) | 2010-01-19 | 2010-01-19 | 해석 방법, 해석 장치 및 해석 프로그램 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20120278694A1 (ko) |
EP (1) | EP2527991B1 (ko) |
JP (1) | JP5494675B2 (ko) |
KR (1) | KR101384405B1 (ko) |
WO (1) | WO2011089683A1 (ko) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9473437B1 (en) | 2012-02-13 | 2016-10-18 | ZapFraud, Inc. | Tertiary classification of communications |
JP5880152B2 (ja) * | 2012-03-08 | 2016-03-08 | 富士ゼロックス株式会社 | 文書作成支援プログラム及び文書作成支援装置 |
US8825614B1 (en) * | 2012-04-27 | 2014-09-02 | WebFilings LLC | Systems and methods for automated taxonomy migration in an XBRL document |
WO2014010029A1 (ja) | 2012-07-10 | 2014-01-16 | 富士通株式会社 | プログラム、マッピング装置およびマッピング方法 |
JP6222923B2 (ja) * | 2012-12-28 | 2017-11-01 | 富士通株式会社 | ファイル管理プログラム、ファイル管理装置およびファイル管理方法 |
JP6114028B2 (ja) * | 2012-12-28 | 2017-04-12 | 富士通株式会社 | 情報管理プログラム、情報管理方法及び情報管理装置 |
US10277628B1 (en) | 2013-09-16 | 2019-04-30 | ZapFraud, Inc. | Detecting phishing attempts |
JP6332277B2 (ja) * | 2013-09-24 | 2018-05-30 | 日本電気株式会社 | ログ分析システム、障害原因分析システム、ログ分析方法、および、プログラムを記憶する記録媒体 |
US10694029B1 (en) | 2013-11-07 | 2020-06-23 | Rightquestion, Llc | Validating automatic number identification data |
JP2015162107A (ja) * | 2014-02-27 | 2015-09-07 | 株式会社エヌ・ティ・ティ・データ | 対応関係抽出装置、対応関係抽出方法、対応関係抽出プログラム |
EP3261025A4 (en) | 2015-02-20 | 2018-08-22 | Fujitsu Limited | Extraction program, extraction device, and extraction method |
JP6657920B2 (ja) * | 2015-12-18 | 2020-03-04 | 日本電気株式会社 | 文書検証支援装置、文書検証支援方法、及び、文書検証支援プログラム |
US10721195B2 (en) | 2016-01-26 | 2020-07-21 | ZapFraud, Inc. | Detection of business email compromise |
US10880322B1 (en) | 2016-09-26 | 2020-12-29 | Agari Data, Inc. | Automated tracking of interaction with a resource of a message |
US10805314B2 (en) | 2017-05-19 | 2020-10-13 | Agari Data, Inc. | Using message context to evaluate security of requested data |
US11936604B2 (en) | 2016-09-26 | 2024-03-19 | Agari Data, Inc. | Multi-level security analysis and intermediate delivery of an electronic message |
US9847973B1 (en) | 2016-09-26 | 2017-12-19 | Agari Data, Inc. | Mitigating communication risk by detecting similarity to a trusted message contact |
US11044267B2 (en) | 2016-11-30 | 2021-06-22 | Agari Data, Inc. | Using a measure of influence of sender in determining a security risk associated with an electronic message |
US11722513B2 (en) | 2016-11-30 | 2023-08-08 | Agari Data, Inc. | Using a measure of influence of sender in determining a security risk associated with an electronic message |
US10715543B2 (en) | 2016-11-30 | 2020-07-14 | Agari Data, Inc. | Detecting computer security risk based on previously observed communications |
US11019076B1 (en) | 2017-04-26 | 2021-05-25 | Agari Data, Inc. | Message security assessment using sender identity profiles |
US11102244B1 (en) | 2017-06-07 | 2021-08-24 | Agari Data, Inc. | Automated intelligence gathering |
US11757914B1 (en) | 2017-06-07 | 2023-09-12 | Agari Data, Inc. | Automated responsive message to determine a security risk of a message sender |
JP6714160B2 (ja) * | 2017-07-10 | 2020-06-24 | 株式会社日立製作所 | データリニエージ検出装置、データリニエージ検出方法、及びデータリニエージ検出プログラム |
JP2019028505A (ja) * | 2017-07-25 | 2019-02-21 | 富士通株式会社 | 情報処理プログラム、情報処理方法及び情報処理装置 |
JP7064128B2 (ja) * | 2017-12-08 | 2022-05-10 | 富士通株式会社 | 判定プログラム、判定装置及び判定方法 |
US10698937B2 (en) * | 2017-12-13 | 2020-06-30 | Microsoft Technology Licensing, Llc | Split mapping for dynamic rendering and maintaining consistency of data processed by applications |
JP7040536B2 (ja) * | 2018-01-31 | 2022-03-23 | 富士通株式会社 | 特定プログラム、情報処理装置および特定方法 |
EP3866050B1 (en) | 2018-10-11 | 2023-07-26 | Fujitsu Limited | Conversion method, conversion apparatus, and conversion program |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3724847B2 (ja) * | 1995-06-05 | 2005-12-07 | 株式会社日立製作所 | 構造化文書差分抽出方法および装置 |
US6502112B1 (en) * | 1999-08-27 | 2002-12-31 | Unisys Corporation | Method in a computing system for comparing XMI-based XML documents for identical contents |
WO2002013049A1 (en) * | 2000-08-04 | 2002-02-14 | Infoglide Corporation | System and method for comparing heterogeneous data sources |
US7058558B2 (en) * | 2001-05-25 | 2006-06-06 | The Boeing Company | Simulation system and method |
US7143343B2 (en) * | 2002-04-11 | 2006-11-28 | International Business Machines Corporation | Dynamic creation of an application's XML document type definition (DTD) |
US20070245228A9 (en) * | 2003-04-10 | 2007-10-18 | Andre Lavoie | Financial document change identifier |
JP2005301996A (ja) * | 2004-03-16 | 2005-10-27 | Canon Inc | 文書統合装置、文書統合装置の文書統合方法及びプログラム及び記録媒体 |
JP2005284987A (ja) * | 2004-03-30 | 2005-10-13 | Fujitsu Ltd | 文書構造編集プログラム、文書構造編集方法、文書構造編集装置、文書構造編集プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7254577B2 (en) * | 2004-06-29 | 2007-08-07 | International Business Machines Corporation | Methods, apparatus and computer programs for evaluating and using a resilient data representation |
US20060085738A1 (en) * | 2004-09-01 | 2006-04-20 | Frederic Chapus | Method and system for automatic audit trail |
WO2006051954A1 (ja) * | 2004-11-12 | 2006-05-18 | Justsystems Corporation | 文書処理装置及び文書処理方法 |
JP4682284B2 (ja) * | 2005-03-25 | 2011-05-11 | 成典 田中 | 文書差分検出装置 |
US20070055655A1 (en) * | 2005-09-08 | 2007-03-08 | Microsoft Corporation | Selective schema matching |
US20090030754A1 (en) * | 2006-04-25 | 2009-01-29 | Mcnamar Richard Timothy | Methods, systems and computer software utilizing xbrl to identify, capture, array, manage, transmit and display documents and data in litigation preparation, trial and regulatory filings and regulatory compliance |
WO2007132524A1 (ja) * | 2006-05-16 | 2007-11-22 | Fujitsu Limited | 差分抽出プログラム、方法及び装置 |
CN101529452B (zh) * | 2006-10-02 | 2016-01-20 | 富士通株式会社 | 文档的错误推断处理装置和处理方法 |
JP4399017B2 (ja) * | 2008-06-06 | 2010-01-13 | 株式会社エヌ・ティ・ティ・ドコモ | 構造化文書データ更新方法及び情報提供サーバ |
US8543619B2 (en) * | 2009-09-15 | 2013-09-24 | Oracle International Corporation | Merging XML documents automatically using attributes based comparison |
US8612489B2 (en) * | 2011-07-14 | 2013-12-17 | International Business Machines Corporation | LossLess transformation of XBRL instance to XML data model instance |
-
2010
- 2010-01-19 KR KR1020127018600A patent/KR101384405B1/ko active IP Right Grant
- 2010-01-19 WO PCT/JP2010/050522 patent/WO2011089683A1/ja active Application Filing
- 2010-01-19 JP JP2011550736A patent/JP5494675B2/ja active Active
- 2010-01-19 EP EP10843849.0A patent/EP2527991B1/en active Active
-
2012
- 2012-07-09 US US13/544,371 patent/US20120278694A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP2527991A1 (en) | 2012-11-28 |
JP5494675B2 (ja) | 2014-05-21 |
JPWO2011089683A1 (ja) | 2013-05-20 |
US20120278694A1 (en) | 2012-11-01 |
KR101384405B1 (ko) | 2014-04-10 |
EP2527991B1 (en) | 2018-12-26 |
EP2527991A4 (en) | 2017-01-11 |
WO2011089683A1 (ja) | 2011-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101384405B1 (ko) | 해석 방법, 해석 장치 및 해석 프로그램 | |
US10546351B2 (en) | System and method for automatic generation of reports based on electronic documents | |
CN101878461B (zh) | 分析用于匹配数据记录的系统的方法和系统 | |
US10095766B2 (en) | Automated refinement and validation of data warehouse star schemas | |
US10073919B2 (en) | System and method of search validation | |
US8615526B2 (en) | Markup language based query and file generation | |
US8095913B2 (en) | Computer readable storage medium that stores a test specifications creating program, test specifications creating apparatus and test specifications creating method | |
JP5251623B2 (ja) | フロー比較処理方法及び装置 | |
JP2010527067A (ja) | 文書を解析するためのシステムおよび方法 | |
US10360239B2 (en) | Automated definition of data warehouse star schemas | |
US20170116305A1 (en) | Input Gathering System and Method for Refining, Refining or Validating Star Schema for a Source Database | |
JPWO2007119567A1 (ja) | 文書処理装置および文書処理方法 | |
US20160162539A1 (en) | Computer executable method of generating analysis data and apparatus performing the same and storage medium for the same | |
US20140067444A1 (en) | Business process transformation recommendation generation | |
Király et al. | Evaluating data quality in europeana: Metrics for multilinguality | |
US7992126B2 (en) | Apparatus and method for quantitatively measuring the balance within a balanced scorecard | |
McCarthy et al. | A method for automated transformation and validation of online datasets | |
US20100250621A1 (en) | Financial-analysis support apparatus and financial-analysis support method | |
JP6703925B2 (ja) | 見積装置、プログラム | |
US10360243B2 (en) | Storage medium, information presentation method, and information presentation apparatus | |
McCarthy et al. | An automated etl for online datasets | |
Avogadro et al. | A Framework for Quality Assessment of Semantic Annotations of Tabular Data | |
US20230306070A1 (en) | Generation and optimization of output representation | |
JP2006172027A (ja) | 財務指標を用いた格付けシステム | |
US20240346068A1 (en) | Drawing search device, drawing database construction device, drawing search system, drawing search method, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20170302 Year of fee payment: 4 |