JP5511253B2 - Sentence analysis apparatus, sentence display apparatus, sentence analysis method, sentence display method, sentence analysis program, and sentence display program - Google Patents
Sentence analysis apparatus, sentence display apparatus, sentence analysis method, sentence display method, sentence analysis program, and sentence display program Download PDFInfo
- Publication number
- JP5511253B2 JP5511253B2 JP2009177113A JP2009177113A JP5511253B2 JP 5511253 B2 JP5511253 B2 JP 5511253B2 JP 2009177113 A JP2009177113 A JP 2009177113A JP 2009177113 A JP2009177113 A JP 2009177113A JP 5511253 B2 JP5511253 B2 JP 5511253B2
- Authority
- JP
- Japan
- Prior art keywords
- symbol
- parenthesis
- character string
- sentence
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
本発明は、文章の構造を解析、表示する文章解析装置、文章表示装置、文章解析方法、文章表示方法、文章解析プログラムおよび文章表示プログラムに関する。 The present invention relates to a sentence analysis apparatus, a sentence display apparatus, a sentence analysis method, a sentence display method, a sentence analysis program, and a sentence display program that analyze and display a sentence structure.
文章は短ければ短いほど読みやすく、意味内容も理解しやすいが、文章の長さは書き手の文章作成能力や説明する内容に依存するため、長文の文章も存在する。長文の文章は内容の理解がしづらいため、文章の理解を容易にしたり、文章の長文化を避けるために、文章中に括弧記号を用いることがある。この括弧記号を利用することで、文章中に補足説明をしたり、用語解説をしたり、例外的な内容を追加したりすることができる。 The shorter the sentence, the easier it is to read and understand the meaning, but the length of the sentence depends on the writing ability of the writer and the contents to be explained, so there are long sentences. Since long sentences are difficult to understand, parentheses are sometimes used in the sentences to facilitate understanding of the sentences and to avoid a long culture of sentences. By using these bracket symbols, you can give supplementary explanations, glossary terms, or add exceptional content in the text.
しかし、括弧記号を多用すると、文章の構造が何重にも入り組み、却って理解を困難にさせてしまう場合がある。このため、下記特許文献1では、括弧記号の解析を行っている。
However, if parentheses are used extensively, the structure of the sentence may be complicated, making it difficult to understand. For this reason, in the following
また、条文についても同様のことが言え、条文によっては内容を理解するのは困難である条文が存在する。このような条文の特徴として、制定条項の正確性を期すために括弧記号表記による説明が多用されるという特徴がある。結果、条文は括弧記号が何重にも入り組んだ構造となり、内容を理解するのに困難な状態になっていた。 The same can be said for the text, and there are texts that are difficult to understand depending on the text. As a feature of such a clause, there is a feature that explanations in parentheses are often used in order to ensure the accuracy of the enactment clause. As a result, the text has a structure in which parentheses are intricately complicated, making it difficult to understand the contents.
構造を理解するために、条文閲覧者は、手作業により、括弧記号内の文字列を括弧記号の階層ごとに異なる色で塗りつぶした後、初めに色が塗られていない文字列を確認することを行っていた。また、括弧記号内の文字列を階層ごとに異なる色で塗りつぶす機能を実装したプログラムも存在する(例えば非特許文献1を参照。)。 In order to understand the structure, the text viewer must manually check the uncolored text after filling the text in the brackets with a different color for each hierarchy of brackets. Had gone. There is also a program that implements a function of painting a character string in parentheses with a different color for each layer (see, for example, Non-Patent Document 1).
しかしながら、上述した従来技術では、着色を施しても依然文章中に括弧書きと呼ばれる括弧記号内の文章が存在する。括弧書きを除いた文章を読み手が読むためには、開始括弧記号の手前まで読み進んでから、終了括弧記号以降を読み始めるまでに、括弧記号内の文章を読み飛ばすことを強いられていた。したがって、括弧内文章を除いた素直な文章を理解しづらいという問題があった。 However, in the above-described prior art, even if coloring is performed, a sentence in parenthesis symbols called “brackets” still exists in the sentence. In order for the reader to read the text excluding the parentheses, the reader was forced to skip the text within the parenthesis symbols before reading the text after the end parenthesis symbol until reading the text after the end parenthesis symbol. Therefore, there was a problem that it was difficult to understand the straight text excluding the text in parentheses.
さらに、括弧記号が多重化している場合、現在読み進めている括弧内文章がどの終了括弧で文末となるのかが分かりづらく、誤った文章解釈をしてしまったり、誤りに気がついて何度も読み返さなければならないという問題があった。 In addition, when parenthesis symbols are multiplexed, it is difficult to understand which end bracket will end the sentence in the parenthesis that is currently being read, and it may be misinterpreted or read many times if you notice an error. There was a problem that had to be returned.
また、条文の場合、括弧書きには、用語の解説や、「〜を除く」といった例外規定が定義されている。用語の解説は、用語を理解する上で読み手が条文を理解できるまで条文中に残しておいた方がよく、例外規定は、原則を理解するまでは、読まない方が理解しやすい。 In addition, in the case of a clause, in parentheses, an explanation of terms and exception rules such as “excluding” are defined. The explanation of the term should be left in the text until the reader can understand the text to understand the term, and the exception rules are easier to understand unless the principle is understood.
このように、括弧書きには、読み手の理解度によって必要なものと不要なものが混在している。上述した非特許文献1では、括弧書きの性質にかかわらず、全ての括弧書きに着色を施しているため、読み手の理解に不要な括弧書きにも着色を施してしまい、条文の大筋の理解を得ることが困難であるという問題があった。
In this way, in parenthesis writing, what is necessary and what is not necessary are mixed depending on the degree of understanding of the reader. In the above-mentioned Non-Patent
また、特許文献1では、読み手の理解度にかかわらず、装置側であらかじめ設定されたアクション(無視する/無視しない)により、括弧書きを削除するため、読み手の理解度を無視している。したがって、読み手の意に反して括弧書きを削除してしまい、読み手の理解を困難にするという問題があった。特に、条文では、括弧書きは制定条項の正確性を期すために設けられており、これを削除すると読み手が括弧記号内の必要な記述を見落としてしまうという問題があった。
In
本発明は、上述した従来技術による問題点を解消するため、読み手の理解度に合わせて括弧書きを可視化できるように括弧書きを階層構造化することができる文章解析装置、文章解析方法、および文章解析プログラムを提供することを目的とする。また、読み手の理解度に合わせて括弧書きを可視化することができる文章表示装置、文章表示方法、および文章表示プログラムを提供することを目的とする。 In order to solve the above-described problems caused by the conventional technology, the present invention provides a sentence analysis apparatus, a sentence analysis method, and a sentence, in which parentheses can be hierarchically structured so that the parentheses can be visualized in accordance with the degree of understanding of the reader. The purpose is to provide an analysis program. It is another object of the present invention to provide a sentence display device, a sentence display method, and a sentence display program that can visualize parentheses in accordance with the reader's level of understanding.
この課題を解決するために、本発明の文章解析装置、文章解析方法、および文章解析プログラムは、文章を入力し、入力された文章の中から開始括弧記号と終了括弧記号とを検出し、検出された開始括弧記号と終了括弧記号とを同一階層の括弧記号ペアに決定し、決定された同一階層の括弧記号ペアの出現位置に同一の階層番号に関するタグを設定し、前記括弧記号ペア(以下、「第1の括弧記号ペア」という)が決定された場合、他の開始括弧記号群のうち、前記括弧記号ペアを構成する開始括弧記号を除いた末尾の開始括弧記号と、前記括弧記号ペアの終了括弧以降の後続の文字列で前記開始括弧記号が新たに出現することなく最初に検出された終了括弧記号とを、前記第1の括弧記号ペアとの上下関係を特定する第2の括弧記号ペアに決定することを特徴とする。 In order to solve this problem, the sentence analysis apparatus, the sentence analysis method, and the sentence analysis program of the present invention input a sentence, detect a start bracket symbol and an end bracket symbol from the input sentence, and detect The determined start bracket symbol and end bracket symbol are determined to be a pair of parenthesis symbol of the same hierarchy, a tag related to the same hierarchy number is set at the appearance position of the determined bracket symbol pair of the same hierarchy, , “The first parenthesis symbol pair”) is determined, among the other opening parenthesis symbol groups, the last opening parenthesis symbol excluding the opening parenthesis symbol constituting the parenthesis symbol pair, and the parenthesis symbol pair The second parenthesis that specifies the first parenthesis symbol that is first detected in the subsequent character string after the end parenthesis without the new parenthesis symbol and the first parenthesis symbol pair. Sign pair Characterized in that it constant.
この発明によれば、開始括弧記号と終了括弧記号との間の文字列が、文章中でどの階層にあるかを特定することができる。また、括弧記号による階層が複数存在しても、階層を段階的に設定することができる。 According to the present invention, it is possible to specify in which level the character string between the start bracket symbol and the end bracket symbol is located in the sentence. Even if there are a plurality of hierarchies with parenthesis symbols, the hierarchies can be set in stages.
また、上記発明において、開始括弧記号を検出した後に、新たな開始括弧記号を検出した場合に、新たな開始括弧記号と終了括弧記号とを同一階層の括弧記号ペアに決定することとしてもよい。 In the above invention, when a new start parenthesis symbol is detected after the start parenthesis symbol is detected, a new start parenthesis symbol and an end parenthesis symbol may be determined as a pair of parenthesis symbols in the same hierarchy.
この発明によれば、開始括弧記号と終了括弧記号との間の文字列中に出現した開始括弧記号と終了括弧記号との間の文字列が、文章中でどの階層にあるかを特定することができる。 According to the present invention, it is specified in which level the character string between the start bracket symbol and the end bracket symbol that appears in the character string between the start bracket symbol and the end bracket symbol is in the sentence. Can do.
また、上記発明において、第1の括弧記号ペアを構成する開始括弧記号の前方に、前記第2の括弧記号ペアを構成する終了括弧記号に設定されたタグを設定すると共に、前記第1の括弧記号ペアを構成する終了括弧記号の後方に、前記第2の括弧記号ペアを構成する開始括弧記号に設定されたタグを設定することを特徴とする。 Further, in the above invention, a tag set as an end parenthesis symbol constituting the second parenthesis symbol pair is set in front of a start parenthesis symbol constituting the first parenthesis symbol pair, and the first parenthesis symbol is set. A tag set to a start parenthesis symbol constituting the second parenthesis symbol pair is set behind the end parenthesis symbol constituting the symbol pair.
この発明によれば、第2の括弧記号ペアに階層が包含されている第1の括弧記号ペア内の文字列を、第2の括弧記号ペアの階層から除外することができる。 According to the present invention, the character string in the first parenthesis symbol pair whose hierarchy is included in the second parenthesis symbol pair can be excluded from the hierarchy of the second parenthesis symbol pair.
また、本発明の文章表示装置、文章表示方法、および文章表示プログラムは、開始括弧記号と終了括弧記号を含み、同一階層の階層番号に関するタグが付与された文章を記憶しておき、階層番号を指定し、階層番号に関するタグを文章の中から特定し、タグにより挟まれているタグ内文字列の表示状態に基づいて、前記タグ内文字列に対し表示切替処理を実行することを特徴とする。 The sentence display device, the sentence display method, and the sentence display program of the present invention store a sentence including a start parenthesis symbol and an end parenthesis symbol and a tag related to a hierarchy number in the same hierarchy, and stores the hierarchy number. A tag related to a hierarchy number is specified from sentences, and display switching processing is executed for the character string in the tag based on the display state of the character string in the tag sandwiched between the tags. .
この発明によれば、指定された階層番号の括弧記号ペア内の文字列が、文章中に視認可能な状態で存在したり存在しなくなったりする。 According to this invention, the character string in the parenthesis symbol pair of the designated hierarchy number exists or does not exist in the state which can be visually recognized in a sentence.
また、上記発明において、前記タグ内文字列の中に、別の階層番号に関するタグがある場合、別の階層番号に関するタグにより挟まれている文字列に対し表示切替処理を実行しないことを特徴とする。 Further, in the above invention, when there is a tag related to another hierarchy number in the character string in the tag, the display switching process is not executed for a character string sandwiched between tags related to another hierarchy number. To do.
この発明によれば、指定された階層の括弧記号ペアに包含されている別階層の括弧記号ペアが存在する場合、指定された階層の括弧記号ペア内の文字列のうち、別階層の括弧記号ペア内の文字列を除いた文字列が、文章中に視認可能な状態で存在したり存在しなくなったりする。 According to the present invention, when there is a parenthesis symbol pair in a different hierarchy included in a parenthesis symbol pair in a specified hierarchy, among the character strings in the parenthesis symbol pair in the specified hierarchy, The character string excluding the character string in the pair may or may not be visible in the sentence.
また、上記発明において、表示切替処理は、前記タグ内文字列が表示されている場合には非表示にし、前記タグ内文字列が表示されていない場合には表示させることを特徴とする。 In the above invention, the display switching process is characterized in that when the in-tag character string is displayed, it is hidden, and when the in-tag character string is not displayed, it is displayed.
この発明によれば、タグ内文字列を非表示にすることで、文章中からタグ内文字列の存在を消すことができる。したがって、読み手は、タグ内文字列を意識することなく、文章を読み進めることができる。また、非表示状態から表示させることで、タグ内文字列を復元することができる。したがって、読み手は、タグ内文字列を除いた文章を読み、内容を理解した上で、復元したタグ内文字列を読むことができる。このように、表示/非表示を切り替え自在にすることで、読み手の理解度に応じた表示状態を提供することができる。 According to this invention, the presence of the character string in the tag can be deleted from the sentence by hiding the character string in the tag. Therefore, the reader can read the sentence without being aware of the character string in the tag. Moreover, the character string in a tag can be decompress | restored by displaying from a non-display state. Therefore, the reader can read the sentence without the character string in the tag, understand the content, and read the restored character string in the tag. Thus, by making display / non-display switchable, it is possible to provide a display state corresponding to the reader's level of understanding.
また、上記発明において、表示切替処理は、前記タグ内文字列が表示されている場合には削除して前記開始括弧記号と前記終了括弧記号を連結し、前記タグ内文字列が削除されて前記開始括弧記号と前記終了括弧記号が連結されている場合には前記開始括弧記号と前記終了括弧記号との間に前記タグ内文字列を復元させることを特徴とする。 Also, in the above invention, the display switching process deletes the character string in the tag when it is displayed, connects the start parenthesis symbol and the end parenthesis symbol, deletes the character string in the tag, and When the start bracket symbol and the end bracket symbol are connected, the character string in the tag is restored between the start bracket symbol and the end bracket symbol.
この発明によれば、開始括弧記号の直前の文字と終了括弧記号の直後の文字と括弧記号ペアを介して連結することができる。したがって、読み手は、タグ内文字列を意識することなく、文章を読み進めることができると共に、開始括弧記号の直前の文字列に対して、括弧による補足説明があることを意識させることができる。 According to the present invention, it is possible to connect the character immediately before the start parenthesis symbol and the character immediately after the end parenthesis symbol via the parenthesis symbol pair. Therefore, the reader can read the sentence without being aware of the character string in the tag, and can be made aware that there is a supplementary explanation in parentheses for the character string immediately before the start parenthesis symbol.
また、上記発明において、表示切替処理は、前記タグ内文字列が表示されている場合には難視化を行い、前記タグ内文字列が難視化されている場合には、難視化を解除することを特徴とする。 Further, in the above invention, the display switching process is made obfuscated when the in-tag character string is displayed, and is obfuscated when the in-tag character string is obfuscated. It is characterized by releasing.
この発明によれば、タグ内文字列を読みづらくさせることで、文章中からタグ内文字列の存在を実質的に消すことができる。したがって、読み手は、タグ内文字列を意識することなく、文章を読み進めることができる。また、難視化を解除することで、タグ内文字列を復元することができる。したがって、読み手は、タグ内文字列を除いた文章を読み、内容を理解した上で、復元したタグ内文字列を読むことができる。このように、難視化とその解除を切り替え自在にすることで、読み手の理解度に応じた表示状態を提供することができる。 According to the present invention, the presence of the character string in the tag can be substantially eliminated from the sentence by making it difficult to read the character string in the tag. Therefore, the reader can read the sentence without being aware of the character string in the tag. Moreover, the character string in a tag can be decompress | restored by canceling obfuscation. Therefore, the reader can read the sentence without the character string in the tag, understand the content, and read the restored character string in the tag. In this way, the display state according to the degree of understanding of the reader can be provided by making it difficult to switch between obfuscation and its cancellation.
本発明によれば、読み手の理解度に合わせて括弧書きを可視化できるように括弧書きを階層構造化することができるという効果を奏する。また、読み手の理解度に合わせて括弧書きを可視化することができるという効果を奏する。 According to the present invention, there is an effect that parentheses can be hierarchically structured so that the parentheses can be visualized in accordance with the reader's understanding. In addition, there is an effect that the parenthesis can be visualized according to the degree of understanding of the reader.
まず、本発明の文章解析装置、文章表示装置、文章解析方法、文章表示方法、文章解析プログラムおよび文章表示プログラムの実施の形態について説明する。文章とは、所定の言語で記述された一まとまりの文字列であり、一または複数の文の集合である。たとえば、日本語の場合、文字の中には約物として句点以外に読点、括弧記号、中黒、感嘆符、疑問符、長音符、米印、ダッシュ等が含まれる。本実施の形態では、文章を括弧記号による階層ごとに非表示化/難視化することにある。その様子を図4から図10にて示す。 First, embodiments of a sentence analysis apparatus, a sentence display apparatus, a sentence analysis method, a sentence display method, a sentence analysis program, and a sentence display program according to the present invention will be described. A sentence is a group of character strings written in a predetermined language, and is a set of one or more sentences. For example, in the case of Japanese, characters include not only punctuation marks but also punctuation marks, parentheses, black marks, exclamation marks, question marks, long notes, American signs, dashes, and the like. In the present embodiment, the sentence is made to be hidden / obfuscated for each hierarchy with parenthesis symbols. This is shown in FIGS.
また、本実施の形態では、マークアップ言語でない文字列で、開始括弧記号と終了括弧記号が対になっている文章を解析の対象とする。開始括弧記号の説明文章など、括弧記号が本来の意味である他の部分と区別する記号として使用されていない文章には適さない。また、マークアップ言語であっても、後述するタグ付け規則、[[startN]]、[[endN]](Nは自然数)が本文中に使用されていなければ適用対象の文章とする。本実施の形態では、文章の一例として、条文を用いる。 In this embodiment, a sentence in which a start parenthesis symbol and an end parenthesis symbol are paired in a character string that is not a markup language is an analysis target. It is not suitable for text that is not used as a symbol to distinguish it from other parts where the parenthesis symbol is its original meaning, such as explanatory text of the opening parenthesis symbol. Even in a markup language, if a tagging rule, [[startN]] and [[endN]] (N is a natural number), which will be described later, is not used in the text, it is determined as an application target sentence. In the present embodiment, a text is used as an example of text.
図1は本発明の実施の形態にかかる文章解析装置および文章表示装置のハードウェア構成を示すブロック図である。文章解析装置101と文章表示装置111はインターネット、LAN、WANなどのネットワーク121で接続されている。本実施例では文章解析装置101と文章表示装置111との2つのハードウェアが存在するが、文章解析と文章表示とを行う1つのハードウェアであってもよい。
FIG. 1 is a block diagram showing a hardware configuration of a sentence analysis apparatus and a sentence display apparatus according to an embodiment of the present invention. The
文章解析装置101は図示するようにCPU(Central Processing Unit)102、バス103、ROM(Read Only Memory)104、RAM(Random Access Memory)105、HDD(Hard Disk Drive)106、ディスプレイ107、マウス108、キーボード109、I/F(InterFace)110で構成する。
As shown in the figure, the
CPU102はROM104、RAM105、HDD106のいずれかに保持しているプログラムを実行する。バス103はCPU102とそれ以外のデバイスとが情報を送受信する通信路である。
The
HDD106は記憶装置である。本発明においては図2で説明する各機能を実行するプログラムを記憶したり、解析結果を記憶したりする。また、I/F110を通じて文章表示装置111が接続する際に使用するWebサーバのプログラムを記憶する。
The
ディスプレイ107は本発明の出力結果を表示する。マウス108とキーボード109とは文章解析装置101に指示を与えるために使用する。I/F110は外部との通信に使用する。具体的なデバイスとしてはNIC(Network Interface Card)である。
The
文章表示装置111は典型的にはPC(Personal Computer)であり、図示するようにCPU112、バス113、ROM114、RAM115、HDD116、ディスプレイ117、マウス118、キーボード119、I/F120で構成する。
The
CPU112はROM114、RAM115、HDD116のいずれかに保持しているプログラムを実行する。バス113はCPU112とそれ以外のデバイスとが情報を送受信する通信路である。
The
HDD116は記憶装置である。本発明においては図2で説明する各機能を実行するプログラムを記憶したり、図2の記憶部207を担当したりする。また、I/F120を通じて文章解析装置101に接続する際に使用するWebブラウザのプログラムを記憶する。
The
ディスプレイ117は本発明の出力結果を表示する。マウス118とキーボード119とは文章表示装置111に指示を与えるために使用する。I/F120は外部との通信に使用する。具体的なデバイスとしてはNICである。
A
次に、文章解析装置101および文章表示装置111の機能的構成について説明する。
Next, functional configurations of the
図2は、本発明の実施の形態にかかる文章解析装置101および文章表示装置111の機能的構成を示すブロック図である。文章解析装置101は、入力部203、検出部204、決定部205、および設定部206を含む構成である。なお、上述した入力部203〜設定部206は、具体的には、例えば、図1に示した記憶装置に記憶されたプログラムをCPU102に実行させることにより、または、I/F110により、その機能を実現する。
FIG. 2 is a block diagram showing functional configurations of the
入力部203は、文章を文章解析装置101に入力する。具体的には、例えば、条文の電子データである。入力方法としては図1で説明したマウス108やキーボード109からでもよいし、I/F110からでもよい。条文の電子データとしては、例えば政府の法令データ提供システムが存在する。
The
検出部204は、入力部203によって入力された文章の中から開始括弧記号と終了括弧記号とを検出する。ここで、括弧記号とは、特定の文字・語句・文などを囲って他の部分と区別する記号であり、具体的には”(”、”)”、”{”、”}”、”[”、”]”、”「”、”」”等が存在する。また、括弧記号ではないが、”<”、”>”を使用してもよい。画面の例では図4の画面にて、1段階目に存在する文字列402に囲まれている枠の外側に存在する開始括弧記号と終了括弧記号と等である。
The
決定部205は、検出部204によって検出された開始括弧記号と終了括弧記号とを同一階層の括弧記号ペアに決定する。括弧記号は、特定の文字・語句・文などを囲い、他の部分と区別するために使用される。したがって、開始括弧記号は、他の区別との開始点を示しており、必ず他の区別との終了点である終了括弧記号が検出される。開始括弧記号検出後、以降の後続の文字列で開始括弧記号が新たに発見されることなく最初に終了括弧記号が検出された場合に、開始括弧記号と終了括弧記号とを同一階層番号の括弧記号ペアにする。具体的には、図9の画面にて、段階的マスク処理の2段階目マスクでマスクされた文字列903で囲まれている領域の外側に存在する開始括弧記号と終了括弧記号とが同一階層番号の括弧記号ペアとなる。
The
開始括弧記号検出後新たに開始括弧記号が検出された場合、決定部205は、開始括弧記号群の末尾の開始括弧記号と最初に検出した終了括弧記号とを同一階層番号の括弧記号ペアにする。具体的には、図9の画面にて段階的マスク処理の2段階目マスクでマスクされた文字列902の外側に存在する開始括弧記号「金銭以外の資産”(”」にて開始括弧記号が見つかった状態で、その後図8の段階的マスク処理の1段階目マスクでマスクされた文字列802の外側にある開始括弧記号「法第二十四条第二項”(”」が見つかった状態となる。この場合は、新しく見つかった開始括弧記号「法第二十四条第二項”(”」と、その後続の文字列から最初に検出した終了括弧記号「とみなす金額”)”」が同一階層番号の括弧記号ペアとなる。
When a new start parenthesis symbol is detected after the start parenthesis symbol is detected, the
また、括弧記号ペア(以下「第1の括弧記号ペア」という)が決定された場合に、開始括弧記号群のうち、第1の括弧記号ペアを構成する開始括弧記号を除いた末尾の開始括弧記号と、第1の括弧記号ペアの終了括弧記号以降の後続の文字列で開始括弧記号が新たに出現することなく最初に検出された終了括弧記号とを、第1の括弧記号ペアとの上下関係を特定する第2の括弧記号ペアに決定する。 Further, when a parenthesis symbol pair (hereinafter referred to as “first parenthesis symbol pair”) is determined, a start parenthesis at the end excluding a start parenthesis symbol constituting the first parenthesis symbol pair in the start parenthesis symbol group. The first parenthesis symbol and the end parenthesis symbol first detected without a new start parenthesis symbol appearing in the subsequent character string after the end parenthesis symbol of the first parenthesis symbol pair. Decide on the second pair of parenthesis symbols that identify the relationship.
具体的には、段階的マスク処理の1段階目マスクでマスクされた文字列802の外側同士にある開始括弧記号と終了括弧記号とが同一階層番号の括弧記号ペアとなり、開始括弧記号「金銭以外の資産”(”」と文字列802の外側にある終了括弧記号以降に存在する終了括弧記号「以下この号にて同じ。”)”」とが新たな括弧記号ペアとなる。そして、この新たな括弧記号ペアの階層と文字列802の外側にある括弧記号ペアの階層とは上下関係を特定するタグを持つ。 Specifically, the opening parenthesis symbol and the ending parenthesis symbol outside the character string 802 masked by the first-stage mask of the stepwise mask processing become a pair of parenthesis symbols having the same hierarchical number, and the opening parenthesis symbol “other than money” Asset "(" ") and the closing parenthesis symbol that exists after the closing parenthesis symbol outside the character string 802" the same applies in this issue, ")" "is a new parenthesis symbol pair. The new parenthesis symbol pair hierarchy and the parenthesis symbol pair hierarchy outside the character string 802 have tags that specify the vertical relationship.
設定部206は、決定部205によって決定された同一階層の括弧記号ペアの出現位置に同一の階層番号に関するタグを設定する。具体的には、図9の画面にて段階的マスク処理の2段階目マスクでマスクされた文字列903で囲まれている領域では、「[[start2]]適合合併の(中略)減算した金額[[end2]]」のようにタグ付けが行われる。
The
また、上述した第1の括弧記号ペアと、第1の括弧記号ペアと上下関係がある第2の括弧記号ペアが存在する場合は、第1の括弧記号ペアを構成する開始括弧記号の前方に、第2の開始括弧記号ペアを構成する終了括弧記号に設定されたタグをコピーし設定すると共に、第1の括弧記号ペアを構成する終了括弧記号の後方に、第2の括弧記号ペアを構成する開始括弧記号に設定されたタグをコピーし設定する。具体的には、図9の画面にて段階的マスク処理の2段階目マスクでマスクされた文字列902で囲まれている領域では、「[[start2]]当該株主等に(中略)法第二十四条第二項[[end2]](([[start1]]配当等の額とみなす金額[[end1]])[[start2]]に規定する(中略)以下この号において同じ。[[end2]]」のようにタグ付けが行われる。 In addition, when there is a first parenthesis symbol pair described above and a second parenthesis symbol pair that is vertically related to the first parenthesis symbol pair, the first parenthesis symbol pair that constitutes the first parenthesis symbol pair is preceded by Copy and set the tag set to the end bracket symbol constituting the second start bracket symbol pair, and configure the second bracket symbol pair behind the end bracket symbol constituting the first bracket symbol pair Copy and set the tag set to the opening bracket symbol. Specifically, in the area surrounded by the character string 902 masked by the second stage mask of the stepwise mask processing on the screen of FIG. 9, “[[start2]] Article 24, paragraph 2 [[end2]] (([[start1]] Amount to be regarded as amount of dividend [end1]]) [[start2]] (Omitted) The same shall apply in this item. Tagging is performed like [end2]] ”.
次に文章表示装置111について説明する。文章表示装置111では記憶部207、指定部208、特定部209、表示制御部210を構成する。表示制御部210は表示切替部211を内包する。
Next, the
記憶部207は、開始括弧記号と終了括弧記号を含み、前記開始括弧記号と当該開始括弧記号に対応する終了括弧記号とに対し同一階層の階層番号に関するタグが付与された文章を記憶する。また、上述した文章における階層数を最大括弧レベルとして記憶する。前述した2つの情報は設定済みテーブルに格納される。設定済みテーブルの具体例は図11に示す。
The
指定部208は、任意の階層番号を指定する。指定方法の一例としては図1のマウス118を使用して図3の条文段階的消去ボタン306を押下することである。
The
特定部209は、指定部208によって指定された階層番号に関するタグを記憶部207に記憶されている文章の中から特定する。具体的には、図4の状態で図3での条文段階的消去ボタン306がマウス118によって押下された場合、1段階目に存在する文字列402の領域が特定される。
The specifying
表示制御部210は、特定部209によって特定されたタグにより挟まれているタグ内文字列の表示状態に基づいて、タグ内文字列に対し表示切替部211を実行する。そのタグ内文字列の中に、指定部208によって指定されていない階層番号に関するタグがある場合、そのタグにより挟まれている文字列に対し表示切替部211を実行することもしないことも、どちらでも選択可能である。具体的には図4の1段階目に存在する文字列402が特定された状態で、図5では段階的消去処理の1段階目消去で消去された文字列503となり表示切替部211が実行され文字列402の領域は非表示になっている。また、図8では表示切替部211が実行され文字列402の領域は難視化になっている。
The display control unit 210 executes the
表示切替部211は、タグにより挟まれている文字列の状態によって以下4つの処理を行う。
1.文字列が表示されている場合、文字列を非表示にし、開始括弧記号と終了括弧記号とを連結する。
2.文字列が非表示にされており開始括弧記号と終了括弧記号とが連結されている場合、文字列を表示する。
3.文字列が表示されている場合、難視化する。
4.文字列が表示されており難視化されている場合、難視化を解除する。
文章表示装置111ではそれぞれ、段階的消去前進処理、段階的消去後退処理、段階的マスク前進処理、段階的マスク後退処理として処理を行う。また、段階的消去前進処理と段階的消去後退処理とをまとめて段階的消去処理とし、段階的マスク前進処理と段階的マスク後退処理とをまとめて段階的マスク処理とする。
The
1. When the character string is displayed, the character string is hidden and the start bracket symbol and the end bracket symbol are connected.
2. When the character string is hidden and the start bracket symbol and the end bracket symbol are connected, the character string is displayed.
3. When a character string is displayed, it becomes difficult to view.
4). When the character string is displayed and is obfuscated, the obfuscation is canceled.
In the
各処理の例として、文章表示装置111が段階的消去前進処理を実行すると図4から図5に遷移した状態になり、段階的消去後退処理を実行すると図5から図4に遷移した状態になり、段階的マスク前進処理を実行すると図4から図8に遷移した状態になり、段階的マスク後退処理を実行すると図8から図4に遷移した状態となる。
As an example of each process, when the
図3は、本発明の実施の形態にかかる段階的消去処理または段階的マスク処理を行う画面例のイメージ図である。タイトル領域301は、左側には現在表示している法令名等を表示する。条文選択領域302は、表示したい条文を選択する領域である。ガイドフィールド領域303では、読み手が括弧記号内の文字列の状態を状態文字列で確認する他、各ボタンで文字列の状態を変更する指示をする。条文表示領域304は、条文選択領域302で選択した条文を表示する。
FIG. 3 is an image diagram of a screen example for performing stepwise erasure processing or stepwise mask processing according to the embodiment of the present invention. The
条文全消去ボタン305は、図22で後述する段階的消去前進処理を現在の括弧レベルから最大括弧レベルまで繰り返す処理を行う。条文段階的消去ボタン306は、図22で後述する段階的消去前進処理を一度行う処理を行う。条文全マスクボタン307は、図24で後述する段階的マスク前進処理を現在の括弧レベルから最大括弧レベルまで繰り返す処理を行う。条文段階的マスクボタン308は、図24で後述する段階的マスク前進処理を一度行う処理を行う。
The full
状態文字列表示領域309は、文章の状態文字列を表示する。読み手が条文消去全ボタン305から条文段階的マスクボタン308までと条文段階的消去表示ボタン310と条文マスク全解除ボタン313までとのそれぞれのボタンを押下するごとに状態文字列が変化する。
The state character
条文段階的消去表示ボタン310は、図23で後述する段階的消去後退処理を一度行う処理を行う。条文消去全表示ボタン311は、図23で後述する段階的消去後退処理を現在の括弧レベルから0まで繰り返す処理を行う。条文段階的マスク解除ボタン312は、図25で後述する段階的マスク後退処理を一度行う処理を行う。条文マスク全解除ボタン313は、図25で後述する段階的マスク後退処理を現在の括弧レベルから0まで繰り返す処理を行う。
The text stepwise
図4から図10は、図3の状態から段階的消去処理および段階的マスク処理を行った際の画面の一部を示したイメージ図である。図4は初期状態を示す画面イメージ図である。図5から図7は、段階的消去処理の画面イメージ図である。図8から図10は、段階的マスク処理の画面イメージ図である。図4に示す文章は括弧記号による3段階の構造形態を有している。 4 to 10 are image diagrams showing a part of the screen when the stepwise erasure process and the stepwise mask process are performed from the state of FIG. FIG. 4 is a screen image diagram showing an initial state. 5 to 7 are screen image diagrams of the stepwise erasure process. 8 to 10 are screen image diagrams of the stepwise mask process. The sentence shown in FIG. 4 has a three-stage structure form by parentheses.
図4は、本発明の実施の形態にかかる段階的消去処理または段階的マスク処理の初期状態を示す画面イメージ図である。初期状態を示す状態文字列401は”(■”の個数で括弧記号の階層数を示しており、”(■”の■が□に置き換わることで括弧記号内文字列の消去を示しており、”(■”のフォント色の変更でマスク状態を示している。状態文字列401は階層が3段階存在し消去もマスクも行われていないことを示す。括弧記号の1段階目に位置する文字列は破線内にて示される文字列402である。1段階目の消去を行うと、図5の状態に遷移し、1段階目のマスクを行うと、図8の状態に遷移する。
FIG. 4 is a screen image diagram showing an initial state of the stepwise erasure process or the stepwise mask process according to the embodiment of the present invention. The
図5は、本発明の実施の形態にかかる段階的消去処理の1段階目消去を示す画面イメージ図である。状態文字列501内は1番右の”(■”が”(□”に置き換わっていることから1段階目の消去を行ったことを示す。文字列503は1段階目に存在する文字列402が消去された状態を示している。文字列503にて、括弧記号文字が残ることにより、ここに消去された文字列が存在していることを表している。括弧記号の2段階目に位置する文字列は、一点破線内にて示される文字列502、文字列504、文字列505、文字列506、文字列507である。2段階目の消去を行うと、図6の状態に遷移する。
FIG. 5 is a screen image diagram showing the first stage erase of the staged erase process according to the embodiment of the present invention. In the
図6は、本発明の実施の形態にかかる段階的消去処理の2段階目消去を示す画面イメージ図である。状態文字列601内の文字列は右から2番目の”(■”が”(□”に置き換わっていることから2段階目の消去を行ったことを示す。段階的消去処理の2段階目消去で消去された文字列605、文字列606、文字列608、文字列609、文字列610はそれぞれ文字列502、文字列504、文字列505、文字列506、文字列507が消去された状態を示している。括弧記号の3段階目に位置する文字列は、破線内にて示される文字列602、文字列603、文字列604、文字列607、文字列611である。3段階目の消去を行うと、図7の状態に遷移する。
FIG. 6 is a screen image diagram showing the second stage erase of the staged erase process according to the embodiment of the present invention. The character string in the
図7は、本発明の実施の形態にかかる段階的消去処理の3段階目消去を示す画面イメージ図である。状態文字列701内の文字列は右から3番目の”(■”が”(□”に置き換わっていることから3段階目の消去を行ったことを示す。段階的消去処理の3段階目消去で消去された文字列702、文字列703、文字列704、文字列705、文字列706はそれぞれ文字列602、文字列603、文字列604、文字列607、文字列611が消去された状態を示している。
FIG. 7 is a screen image diagram showing the third stage erase of the staged erase process according to the embodiment of the present invention. The character string in the
図8は、本発明の実施の形態にかかる段階的マスク処理の1段階目マスク状態を示す画面イメージ図である。状態文字列801内の文字列は1番右の”(■”のフォント色が変更されていることから1段階目の難視化を行ったことを示す。段階的マスク処理の1段階目マスクでマスクされた文字列802は文字属性が変化しており、難視化している状態である。図8では文字の背景色を白以外にすることで難視化しているが、他にも文字色を灰色にする等で、難視化してもよい。
FIG. 8 is a screen image diagram showing a first stage mask state of the stepwise mask processing according to the embodiment of the present invention. The character string in the
図9は、本発明の実施の形態にかかる段階的マスク処理の2段階目マスク状態を示す画面イメージ図である。状態文字列901内の文字列は右から2番目の”(■”のフォント色が変更されていることから2段階目のマスクを行ったことを示す。段階的マスク処理の2段階目マスクでマスクされた文字列902、文字列903、文字列904、文字列905、文字列906は文字属性が変化しており、難視化している状態である。
FIG. 9 is a screen image diagram showing a second stage mask state of the stepwise mask processing according to the embodiment of the present invention. The character string in the
図10は、本発明の実施の形態にかかる段階的マスク処理の3段階目マスク状態を示す画面イメージ図である。状態文字列1001内の文字列は右から3番目の”(■”のフォント色が変更されていることから3段階目のマスクを行ったことを示す。段階的マスク処理の3段階目マスクでマスクされた文字列1002、文字列1003、文字列1004、文字列1005、文字列1006は文字属性が変化しており、難視化している状態である。
FIG. 10 is a screen image diagram showing a third stage mask state of the stepwise mask processing according to the embodiment of the present invention. The character string in the
図4から図7までは段階的消去処理を、図8から図10では段階的マスク処理をそれぞれ実行しているが、段階的消去処理と段階的マスク処理を組み合わせて実行することも可能である。例えば図5のように段階的消去処理を1段階行った後で、段階的マスク処理を1段階行うという操作も可能である。 4 to 7, the stepwise erasing process is executed, and in FIGS. 8 to 10, the stepwise masking process is executed. However, the stepwise erasing process and the stepwise masking process can be executed in combination. . For example, as shown in FIG. 5, it is also possible to perform a stepwise mask process after one step and then a stepwise mask process.
次に本発明で使用するテーブル構造について説明する。本発明で使用するテーブルは2つあり、設定済みテーブルと括弧情報テーブルとである。括弧情報テーブルは決定部205にて設定され、設定部206にて使用されるテーブルである。
Next, the table structure used in the present invention will be described. There are two tables used in the present invention, a set table and a parenthesis information table. The parenthesis information table is a table that is set by the
図11は、本発明の実施の形態にかかる設定済みテーブルの例を示すイメージ図である。設定済みテーブルは図11で示すように、設定部206で作成したタグ付け後の文字列と、決定部205にて取得する最大括弧レベルとで構成する。この例では図3で示す文章が格納されている。
FIG. 11 is an image diagram showing an example of a set table according to the embodiment of the present invention. As shown in FIG. 11, the set table is composed of a character string after tagging created by the
図12は本発明の実施の形態にかかる図13のa)で示した入力文字列を図15のフローチャートの決定処理を行った際に作成される括弧情報テーブルの例を示すイメージ図である。括弧情報テーブルは括弧位置と括弧種別と括弧レベルとで構成する。図12は図13に示すa)に対して、文章解析装置101が決定処理まで処理を行った状態である。例えば行番号0番のレコードでは、括弧開始位置が4、括弧種別が開始、括弧レベルが1となり、さらに行番号1番のレコードでは括弧階層が1段階変化し括弧レベルが2となる。
FIG. 12 is an image diagram showing an example of a parenthesis information table created when the input character string shown in FIG. 13A according to the embodiment of the present invention is determined in the flowchart of FIG. The parenthesis information table includes a parenthesis position, a parenthesis type, and a parenthesis level. FIG. 12 shows a state in which the
図13は、本発明の実施の形態にかかる決定処理を行う前の入力文字列a)と、決定処理を行った後の入力文字列b)の例を示すイメージ図である。a)は設定前の文字列、b)は設定後の文字列を示している。図13の文字列の4文字目、7文字目、13文字目に開始括弧記号が存在し、10文字目、11文字目、14文字目に終了括弧記号が存在する。 FIG. 13 is an image diagram showing an example of an input character string a) before the determination process according to the embodiment of the present invention and an input character string b) after the determination process. a) shows a character string before setting, and b) shows a character string after setting. In the character string of FIG. 13, there are start parenthesis symbols at the fourth, seventh, and thirteenth characters, and there are end parenthesis symbols at the tenth, eleventh, and fourteenth characters.
図14は、本発明の実施の形態にかかる段階的消去処理の具体的な表示制御を行うためのHTMLの記述例とWebブラウザ画面での表示例とを示すイメージ図である。文章表示装置111では処理をWebブラウザで行うため、記述コードはHTMLとなる。例としてa)のHTML欄に表示されているコードとなり、これがWebブラウザ上ではa)のWebブラウザ画面にて表示している内容となる。この状態で、’kakko3’のク
ラスを持つ要素に対し、スタイルシート言語にて領域の非表示を行うことができる。その結果、b)のWebブラウザ画面の表示となる。具体的な変更方法については、図22のステップS2204等となる。
FIG. 14 is an image diagram showing an HTML description example and a display example on the Web browser screen for performing specific display control of the stepwise erasure processing according to the embodiment of the present invention. Since the
図15は、本発明の実施の形態にかかる文章解析装置101にて行うメインフローチャートである。文章解析装置101は解析の準備としてカーソル位置を入力文字列の先頭に設定する(ステップS1501)。次に括弧情報テーブルを用意し、レコードを空にする(ステップS1502)。括弧情報テーブルの詳細は、図12にて示した。
FIG. 15 is a main flowchart performed by the
文章解析装置101は、最大括弧レベル、現在の括弧レベルという2つの変数を用意し、共に0を設定する(ステップS1503、ステップS1504)。その後、図16で示す決定処理を行う(ステップS1505)。決定処理内部では開始括弧記号と終了括弧記号とを検出する。決定処理の終了後、文章解析装置101は設定処理を行う(ステップS1506)。その後、設定処理が終わった文字列と最大括弧レベルを設定済みテーブルに追加する(ステップS1507)。
The
追加後、文章解析装置101はカーソル位置を確認し、カーソル位置が入力文字列の終了位置に存在する場合は(ステップS1508:Yes)、処理を終了する。カーソル位置が入力文字列の終了位置に存在しない場合は(ステップS1508:No)まだ決定処理を行っていない文字列が存在するため、ステップS1503に戻る。
After the addition, the
図16は、本発明の実施の形態にかかる文章解析装置101にて行う決定処理を示すフローチャートである。文章解析装置101は入力文字列のカーソル位置から1文字読み込み(ステップS1601)、読込文字が改行文字以外であるかを確認する(ステップS1602)。読込文字が改行文字以外である場合は(ステップS1602:Yes)、引き続き読込文字が開始括弧記号に一致するかを確認する(ステップS1603)。読込文字が開始括弧記号であった場合は(ステップS1603:Yes)、ステップS1504で用意した現在の括弧レベルをインクリメントする(ステップS1604)。
FIG. 16 is a flowchart showing a determination process performed by the
文章解析装置101はステップS1503で用意した最大括弧レベルと現在の括弧レベルを比較し(ステップS1605)、最大括弧レベルが現在の括弧レベルより小さい場合には(ステップS1605:Yes)最大括弧レベルを現在の括弧レベルと同じ値に設定する(ステップS1606)。最大括弧レベルが現在の括弧レベル以上である場合には(ステップS1605:No)、最大括弧レベルの設定は行わない。
The
文章解析装置101は開始括弧記号を検出したため、括弧情報テーブルにレコードを追加する(ステップS1607)。追加するレコード内容は、括弧位置はカーソル位置、括弧種別は開始、括弧レベルは現在の括弧レベルをそれぞれ設定する。その後文章解析装置101はカーソル位置を1文字進め(ステップS1608)、再び入力文字列のカーソル位置から1文字読み込む(ステップS1601)。
Since the
文章解析装置101はステップS1603にて読込文字が開始括弧記号以外であった場合は(ステップS1603:No)、次に読込文字が終了括弧記号であるかを確認する(ステップS1609)。読込文字が終了括弧記号であった場合は(ステップS1609:Yes)、ステップS1610に進む。
If the read character is other than the start bracket symbol in step S1603 (step S1603: No), the
文章解析装置101は終了括弧記号を検出したため、括弧情報テーブルにレコードを追加する(ステップS1610)。追加するレコード内容は、括弧位置はカーソル位置、括弧種別は終了、括弧レベルは現在の括弧レベルをそれぞれ設定する。その後文章解析装置101は現在の括弧レベルをデクリメントし(ステップS1611)、カーソル位置を1文字進め(ステップS1608)、再び入力文字列のカーソル位置から1文字読み込む(ステップS1601)。
Since the
文章解析装置101はステップS1609にて読込文字が終了括弧記号以外である場合は(ステップS1609:No)、カーソル位置を1文字進め(ステップS1608)、再び入力文字列のカーソル位置から1文字読み込む(ステップS1601)。
If the read character is other than the end bracket symbol in step S1609 (step S1609: No), the
文章解析装置101はステップS1602にて読込文字が改行文字の場合は(ステップS1602:No)、読込文字の次の文字が改行文字以外であるかを確認する(ステップS1612)。改行文字以外である場合は(ステップS1612:Yes)、一度に表示する文章が続くと判断し、カーソル位置を1文字進め(ステップS1608)、再び入力文字列のカーソル位置から1文字読み込む(ステップS1601)。改行文字である場合は(ステップS1612:No)、一度に表示する文章が終了したと判断し決定処理の終了をする。
If the read character is a line feed character in step S1602 (step S1602: No), the
図17は、本発明の実施の形態にかかる文章解析装置101にて行う設定処理を示すフローチャートである。文章解析装置101は括弧情報テーブルのレコードが存在するかを確認する(ステップS1701)。存在しない場合は(ステップS1701:No)、タグを付ける文字列がないことになるため、処理を終了する。
FIG. 17 is a flowchart showing setting processing performed by the
括弧情報テーブルのレコードが存在する場合は(ステップS1701:Yes)、文章解析装置101は括弧情報テーブルの最後のレコードを取得する(ステップS1702)。文章解析装置101は設定処理で使用する変数M、Nを設定する(ステップS1703)。M、Nの計算式はそれぞれ、
M=(最大括弧レベル)−(取得レコードの括弧レベル)+2
N=(最大括弧レベル)−(取得レコードの括弧レベル)+1
となる。Mは括弧記号ペアの外側のタグに付与する数字、Nは括弧記号ペアの内側のタグに付与する数字となる。
If there is a record in the parenthesis information table (step S1701: Yes), the
M = (maximum parenthesis level) − (bracket level of acquired record) +2
N = (maximum parenthesis level)-(parenthesis level of the acquired record) +1
It becomes. M is a number assigned to a tag outside the bracket symbol pair, and N is a number assigned to a tag inside the bracket symbol pair.
文章解析装置101は取得レコードの括弧種別が開始か否かを確認し(ステップS1704)、開始であった場合には(ステップS1704:Yes)、取得レコードの括弧位置+1の位置にタグを挿入する(ステップS1705)。この位置は開始括弧記号の後方を意味している。タグの内容は[[startN]]となる。NとはステップS1703で求めた数値となる。
The
次に文章解析装置101は取得レコードの括弧レベルの値を確認し(ステップS1706)、2以上である場合には(ステップS1706:Yes)、取得レコードの括弧位置にタグを挿入する(ステップS1707)。この位置は開始括弧記号の前方を意味している。タグの内容は[[endM]]となる。MとはステップS1703で求めた数値となる。括弧レベルが2未満である場合には(ステップS1706:No)、開始括弧記号の前にタグを挿入しない。ステップS1702で取得したレコードに関するタグ付けを終了したため、文章解析装置101は括弧情報テーブルの最後のレコードを削除し(ステップS1708)、再び括弧情報テーブルのレコードが存在する限り処理を行う。
Next, the
ステップS1704にて、括弧種別が終了であった場合には(ステップS1704:No)、文章解析装置101は取得レコードの括弧レベルの値を確認し(ステップS1709)、2以上である場合には(ステップS1709:Yes)、取得レコードの括弧位置+1の位置にタグを挿入する(ステップS1710)。この位置は終了括弧記号の後ろを意味している。タグの内容は[[startM]]となる。MとはステップS1703で求めた数値となる。
In step S1704, when the parenthesis type is completed (step S1704: No), the
続けて、文章解析装置101は取得レコードの括弧位置にタグを挿入する(ステップS1711)。この位置は終了括弧記号の前を意味している。タグの内容は[[endN]]となる。NとはステップS1703で求めた数値となる。括弧レベルが2未満である場合には(ステップS1709:No)、終了括弧記号の後ろにタグを挿入しない。ステップS1702で取得したレコードに関するタグ付けを終了したため、文章解析装置101は括弧情報テーブルの最後のレコードを削除し(ステップS1708)、再び括弧情報テーブルのレコードが存在する限り処理を行う。
Subsequently, the
文章解析装置101のフローチャートと図2の機能構成との対応付けを行うと、入力部203はステップS1501に対応する。検出部204はステップS1505の決定処理内で、図16におけるステップS1603とステップ1609とに対応する。決定部205は決定処理を示すステップS1505に対応する。設定部206は設定処理を示すステップS1506とステップS1507とに対応する。
When the flowchart of the
以上の説明により本実施の形態にかかる文章解析装置101によれば、開始括弧記号と終了括弧記号との間の文字列が、文章中でどの階層にあるかを特定することができる。また、開始括弧記号と終了括弧記号との間の文字列中に出現した開始括弧記号と終了括弧記号との間の文字列が、文章中でどの階層にあるかを特定することができる。このように、文章解析装置101では、文章を読み込むだけで括弧書きの階層構造化を効率的に行うことができる。
As described above, according to the
また、括弧記号の種類(開始と終了)の出現パターンにより、括弧書きの上下関係を段階的に特定できるため、文章の書き手が意図したとおりに括弧書きの階層構造化を実現することができる。また、包含元の括弧書き内の文字列から包含先の括弧書き内の文字列を除外するようにも設定することができるため、括弧書きに包含関係がある場合にも階層別にカッコ内文字列を区別することができる。 Further, since the parenthesis upper and lower relations can be specified in a stepwise manner by the appearance patterns of the types of parenthesis symbols (start and end), the hierarchical structure of parenthesis writing can be realized as intended by the writer of the sentence. In addition, because it can be set to exclude the character string in the parentheses of the inclusion destination from the character string in the parentheses of the inclusion source, even if there is an inclusion relationship in the parenthesis writing, the character string in parentheses by hierarchy Can be distinguished.
図18は、本発明の実施の形態にかかる文章解析装置101にて行う表示準備処理のフローチャートである。文章解析装置101にて行う表示準備処理のフローチャートである。文章表示装置111が文章解析装置101に対して条文表示要求を行った際に、文章解析装置101にて行う処理である。文章解析装置101はタグ付けテーブルから要求のあった条文に対応するタグ付け後の文字列と最大括弧レベルを取得する(ステップS1801)。
FIG. 18 is a flowchart of the display preparation process performed by the
次に文章解析装置101は、文章表示装置111に存在するWebブラウザで表示できるようにするため、次の置換を行う(ステップS1802)。[[startN]]を<span class=’kakkoN’>に置換する。また、[[endN]]を</
span>に置換する。Nは自然数を示す。置換後文章解析装置101は、置換後の文字列と最大括弧レベルを文章表示装置111に送信する(ステップS1803)。
Next, the
Replace with span>. N represents a natural number. The post-substitution
図19は、本発明の実施の形態にかかる文章表示装置111にて行うメインフローチャートである。文章表示装置111は処理をWebブラウザにて行う。文章表示装置111はHTMLに置換後の文字列と括弧最大レベルとを文章解析装置101より取得する(ステップS1901)。取得後、文章表示装置111は文章状態を表す状態文字列の作成する文章状態文字列作成処理を行う(ステップS1902)。次に文章表示装置111はこのフロー内で使用する変数として括弧レベルを用意し0に設定する(ステップS1903)。ステップS1903までがメインフローの初期設定である。
FIG. 19 is a main flowchart performed by the
初期設定終了後、文章表示装置111は階層指定取得処理を行い(ステップS1904)、表示変更を行う階層番号と変更指示種別を取得する。変更指示が段階的消去である場合は(ステップS1905:Yes)、文章表示装置111は、消去を1段階前進して指定階層を非表示するかそれとも1段階後退して指定階層を表示するかを判断する。1段階前進する場合は(ステップS1906:Yes)、文章表示装置111は段階的消去前進処理を行う(ステップS1907)。1段階後退する場合は(ステップS1906:No)、文章表示装置111は段階的消去後退処理を行う(ステップS1908)。
After completion of the initial setting, the
変更指示が段階的マスクである場合は(ステップS1905:No)、文章表示装置111は、マスクを1段階前進して指定階層を難視化するかそれとも1段階後退して指定階層の難視化を復元するかを判断する。1段階前進する場合は(ステップS1909:Yes)、文章表示装置111は段階的マスク前進処理を行う(ステップS1910)。1段階後退する場合は(ステップS1909:No)、文章表示装置111は段階的マスク後退処理を行う(ステップS1911)。
When the change instruction is a stepped mask (step S1905: No), the
文章表示装置111は段階的消去前進処理、段階的消去後退処理、段階的マスク前進処理あるいは段階的マスク後退処理のいずれかの処理を行った後、ステップS1904に戻り再び階層指定取得処理を行う(ステップS1904)。
The
また、文章表示装置111上で動作するWebブラウザでの処理としては、段階的消去前進処理、段階的消去後退処理、段階的マスク前進処理、段階的マスク後退処理の各処理はステップS1904で取得する関数に値する。
Further, as processing in the Web browser that operates on the
図20は、本発明の実施の形態にかかる文章表示装置111にて行う文章の状態文字列作成を行うフローチャートである。文章表示装置111はこのフローで使用する変数としてiと状態文字列を用意し、それぞれ0、NULLに設定する(ステップS2001)。その後、文章表示装置111はi<最大括弧レベルを満たす間(ステップS2002:Yes)、状態文字列に括弧階層を示す文字列として例えば”(■”を追加し(ステップS2003)、i=i+1を実行する(ステップS2004)。i<最大括弧レベルを満たさなくなった時点で(ステップS2002:No)、文章表示装置111は状態文字列を出力する(ステップS2005)。
FIG. 20 is a flowchart for creating a state character string of a sentence performed by the
図21は、本発明の実施の形態にかかる文章表示装置111にて行う階層指定取得処理を行うフローチャートである。この実施例では指定できる階層番号は括弧レベルと、括弧レベル+1の階層番号となる。具体的には、現在1階層も非表示、難視化を行っていない初期状態では括弧レベルは0となり、指定できる階層は1階層目となる。もし1階層目を非表示にしていた場合は括弧レベルは1となり、指定できる階層としては2階層目もしくは1階層目となり、2階層目を非表示もしくは難視化するか、1階層目を表示するかのどちらかとなる。
FIG. 21 is a flowchart of the hierarchy designation acquisition process performed by the
文章表示装置111はマウスクリックされた座標を取得する(ステップS2101)。その取得した座標を元に、座標に対応するボタンが存在するかを確認する(ステップS2102)。存在しない場合は(ステップS2102:No)、マウスクリックされるまで待機する(ステップS2104)。存在する場合は(ステップS2102:Yes)、ボタンに割りつけられた関数を出力する(ステップS2103)。例として、<input type=”button” value=”消去” onClick=”EliminateByStages(1)”>)のようにボタンに割りつけられた関数があり、文章表示装置111はその関数を実行する。
The
図22は、本発明の実施の形態にかかる文章表示装置111にて行う段階的消去を1段階前進するフローチャートである。文章表示装置111はステップS1903で用意した括弧レベルとステップS1901で取得した括弧最大レベルとの大小を比較し(ステップS2201)、括弧レベルが最大括弧レベル以上であれば(ステップS2201:No)、処理を終了する。括弧レベルが最大括弧レベルより小さければ(ステップS2201:Yes)、括弧レベルをインクリメントし(ステップS2202)、括弧レベルに一致するクラス名がkakkoNの要素を全て取得する(ステップS2203)。
FIG. 22 is a flowchart in which the stepwise erasure performed by the
ここでNとは括弧レベルを示す自然数である。特定のクラス名に一致する要素群を取得する関数としては、HTML5で規定されている getElementsByClassNameメソッド等がある。(例えばHTML 5 differences from HTML 4、<http://www.w3.org/TR/2009/WD−html5−diff−20090423/>を参照)
Here, N is a natural number indicating a parenthesis level. As a function for acquiring an element group that matches a specific class name, there is a getElementsByClassName method defined in HTML5. (See, for example,
条件に当てはまる要素群を取得できたら、文章表示装置111は要素群のスタイルを変更し非表示にする(ステップS2204)。例としてはステップS2203でgetElementsByClassNameの戻り値をobjとした際に、obj[i].style.display = ”none”とし、iを0から取得数−1まで行うことで、要素群のスタイルを非表示にする。また、要素群に行った変更を状態文字列内の右から括弧レベル位置に位置する文字列にも適用する(ステップS2205)。しかし、状態文字列の対応する文字列を非表示にすると、対応文字列の文字数が変化し消去されている階層数と状態文字列との対応が分かりづらくなるため、例えば、”(■”を”(□”にすることで文字列の非表示を表す。
If the element group applicable to the conditions can be acquired, the
図23は、本発明の実施の形態にかかる文章表示装置111にて行う段階的消去を1段階後退するフローチャートである。文章表示装置111は括弧レベルが0以下であれば(ステップS2301:No)、処理を終了する。括弧レベルが0より大きければ(ステップS2301:Yes)、括弧レベルに一致するクラス名がkakkoNの要素を全て取得する(ステップS2302)。ここでNとは括弧レベルを示す自然数である。
FIG. 23 is a flowchart in which the stepwise erasure performed by the
条件に当てはまる要素群を取得できたら、文章表示装置111は要素群のスタイルを変更し表示にする(ステップS2303)。例としてはステップS2302でgetElementsByClassNameの戻り値をobjとした際に、obj[i].style.display = ”inline”とし、iを0から取得数−1まで行うことで、要素群のスタイルを表示にする。また、要素群に行った変更を状態文字列内の右から括弧レベル位置に位置する文字列にも適用する(ステップS2304)。ここではステップS2205で行った逆の操作、この例では例えば、”(□”を”(■”にすることで文字列の表示を表す。最後に括弧レベルをデクリメントし(ステップS2305)、処理を終了する。
If the element group applicable to the conditions can be acquired, the
図24は、本発明の実施の形態にかかる文章表示装置111にて行う段階的マスクを1段階前進するフローチャートである。段階的マスク前進処理のフローチャートである。文章表示装置111は括弧レベルと最大括弧レベルとの大小を比較し(ステップS2401)、括弧レベルが最大括弧レベル以上であれば(ステップS2401:No)、処理を終了する。括弧レベルが最大括弧レベルより小さければ(ステップS2401:Yes)、括弧レベルをインクリメントし(ステップS2402)、括弧レベルに一致するクラス名がkakkoNの要素を全て取得する(ステップS2403)。ここでNとは括弧レベルを示す自然数である。
FIG. 24 is a flowchart for advancing the stepwise mask performed by the
条件に当てはまる要素群を取得できたら、文章表示装置111は要素群のスタイルを変更し難視化にする(ステップS2404)。ここで難視化とは要素内の文字列を読むことは可能であるが、他の文字列と比較して文字が読みづらい状態である。難視化の効果は文字色属性と背景色属性との明度や色相を近づけることで得られる。具体的には背景色が白である場合に文字色を灰色にしたり、文字色が黒の場合に背景色を灰色にしたりすることで、難視化の効果を得ることができる。
If the element group applicable to the condition is acquired, the
このフローの例では文字色を灰色にすることで難視化を行っている。変更例としてはステップS2403でgetElementsByClassNameの戻り値をobjとした際に、obj[i].style.color = ”gray”とし、iを0から取得数−1まで行うことで、要素群の文字色を灰色にすることによって難視化する。また、要素群に行った変更を状態文字列内の右から括弧レベル位置に位置する文字列にも適用する(ステップS2405)。この例では”(■”の文字色を灰色にすることで文字列の難視化を表す。 In this flow example, the character color is grayed out to make it difficult to view. As an example of change, when the return value of getElementsByClassName is set to obj in step S2403, obj [i]. style. By making color = “gray” and performing i from 0 to the number of acquisitions−1, the character color of the element group is made gray to make it difficult to view. The change made to the element group is also applied to the character string located at the parenthesis level position from the right in the state character string (step S2405). In this example, the character color of “(■”) is grayed to indicate obfuscation of the character string.
図25は、本発明の実施の形態にかかる文章表示装置111にて行う段階的マスクを1段階後退するフローチャートである。文章表示装置111は括弧レベルが0以下であれば(ステップS2501:No)、処理を終了する。括弧レベルが0より大きければ(ステップS2501:Yes)、括弧レベルに一致するクラス名がkakkoNの要素を全て取得する(ステップS2502)。ここでNとは括弧レベルを示す自然数である。
FIG. 25 is a flowchart in which the stepwise mask performed by the
条件に当てはまる要素群を取得できたら、文章表示装置111は要素群のスタイルを変更し難視化を復元する(ステップS2503)。例としてはステップS2502でgetElementsByClassNameの戻り値をobjとした際に、obj[i].style.color = ”black”とし、iを0から取得数−1まで行うことで、要素群の文字色を黒色にすることによって難視化を復元する。また、要素群に行った変更を状態文字列内の右から括弧レベル位置に位置する文字列にも適用する(ステップS2504)。ここではステップS2405で行った逆の操作、この例では例えば、”(■”の文字色を黒色にすることで文字列の表示を表す。最後に括弧レベルをデクリメントし(ステップS2505)、処理を終了する。
If the element group applicable to the conditions can be acquired, the
文章表示装置111のフローチャートと図2の機能構成との対応付けを行うと、記憶部207はステップS1901に対応する。定部208はステップS1904に対応する。特定部209はWebブラウザの機能で行えるためフローには存在しない。具体的には「前略<span class=’kakkoN’>中略</span>後略」と記述され
ている際に、’kakkoN’を指定することで中略部分を特定する機能である。表示制
御部210はステップS1905、ステップS1906、ステップS1909に対応する。表示切替部211はステップS1907、ステップS1908、ステップS1910、ステップS1911が対応している。
When the flowchart of the
表示切替部211は、タグ内の文字列が表示されている場合、タグにより指定されたスタイルシート言語の表示属性を非表示に変更することで、文字列を非表示にする効果を得る(ステップS1907)。同様に、タグ内の文字列が非表示にされている場合、タグにより指定されたスタイルシート言語の表示属性を表示に変更することで、文字列を表示にする効果を得る(ステップS1908)。
When the character string in the tag is displayed, the
同様にタグ内の文字列が表示されている場合、タグにより指定されたスタイルシート言語の文字色属性と背景色属性との明度や色相を近づけることにより、文字列を難視化状態として、視認可能な状態ではあるが見づらくする効果を得る(ステップS1910)。同様にタグ内の文字列が難視化されている場合、タグにより指定されたスタイルシート言語の文字色属性と背景色属性との明度や色相を遠ざけることにより、文字列の難視化を解除する効果を得る(ステップS1911)。 Similarly, when the character string in the tag is displayed, the character string is made invisible by visually recognizing the brightness and hue of the character color attribute and the background color attribute of the style sheet language specified by the tag. Although it is possible, the effect of making it difficult to see is obtained (step S1910). Similarly, when the character string in the tag is obfuscated, the obfuscation of the character string is canceled by keeping the brightness and hue of the character color attribute and background color attribute of the style sheet language specified by the tag away from each other. Effect is obtained (step S1911).
以上の説明により本実施の形態にかかる文章表示装置111によれば、階層指定を与えることで、指定階層番号以上の階層の文章を表示し、指定階層よりも低い階層の文章を非表示(または難視化)することができるため、読み手が理解できる階層で括弧書きを可視化することができる。したがって、読み手は、表示されている文字列を目で追うだけで指定階層以上の階層の文章を理解することができる。また、簡単な操作で文章の理解を効率的に行うことができる。
As described above, according to the
また、括弧内文字列を非表示にする場合、括弧内文字列を画面上から消去して、括弧内文字列を挟む開始括弧記号と終了括弧記号と短絡させることで、指定階層以上の階層の文章をそのまま読み進めることでき、文章の理解の容易化を図ることができる。また、開始括弧記号と終了括弧記号を残存させておくことで、どの位置に括弧書きがあるかを読み手に意識させることができる。 In order to hide the character string in parentheses, delete the character string in parentheses from the screen and short-circuit the start and end parenthesis symbols that sandwich the character string in parentheses. The sentence can be read as it is, and the understanding of the sentence can be facilitated. In addition, by leaving the opening parenthesis symbol and the ending parenthesis symbol, it is possible to make the reader aware of where the parenthesis is written.
また、文章の削除状態、難視化状態の割合を状態文字列として表示することによって、文章の読み手は文章の理解度の進捗がおおよそ判断できる。例えば、括弧書きによる階層が3段階ある文章では、初めに文章の読み手は括弧内の文字列を全て消す。その状態では状態文字列は全て消去されたイメージとなり、理解度としてはおおよそ0〜25%の間であることが分かる。そして文章の読み手がその段階の文章が理解できると、1段階目の括弧内の文字列の表示をする。その時の状態文字列としては1段階目の表示が現れたようになるため、理解度としてはおおよそ25〜50%の間であることが分かる。このように理解度の進捗が判断でき、文章の読み手は文章の理解にかかる時間を従来より精密に管理することができる。 Further, by displaying the sentence deletion state and the obfuscation state ratio as a state character string, the reader of the sentence can roughly determine the progress of the understanding level of the sentence. For example, in a sentence with three levels of parenthesis writing, the reader of the sentence first erases all the character strings in the parentheses. In this state, all the state character strings are erased images, and it is understood that the understanding level is approximately 0 to 25%. When the reader of the sentence understands the sentence at that stage, a character string in parentheses at the first stage is displayed. As the state character string at that time, the first stage display appears, so that it is understood that the degree of understanding is approximately 25 to 50%. Thus, the progress of the understanding level can be determined, and the reader of the sentence can manage the time required for understanding the sentence more precisely than in the past.
なお、本実施の形態で説明した文章解析方法と文章表示方法とは、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。文章解析プログラムと文章表示プログラムとは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また文章解析プログラムと文章表示プログラムとは、インターネット等のネットワークを介して配布してもよい。 The sentence analysis method and the sentence display method described in this embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. The sentence analysis program and the sentence display program are recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and are executed by being read from the recording medium by the computer. The sentence analysis program and the sentence display program may be distributed through a network such as the Internet.
101 文章解析装置
111 文章表示装置
203 入力部
204 検出部
205 決定部
206 設定部
207 記憶部
208 指定部
209 特定部
210 表示制御部
211 表示切替部
DESCRIPTION OF
Claims (12)
前記入力手段によって入力された文章の中から開始括弧記号と終了括弧記号とを検出する検出手段と、
前記検出手段によって検出された開始括弧記号と当該開始括弧記号以降の後続の文字列で前記開始括弧記号が新たに出現することなく最初に検出された終了括弧記号とを同一階層の括弧記号ペアに決定する決定手段と、
前記決定手段によって決定された同一階層の括弧記号ペアの出現位置に同一の階層番号に関するタグを設定する設定手段と、
を備え、
前記決定手段は、
前記括弧記号ペア(以下、「第1の括弧記号ペア」という)が決定された場合、他の開始括弧記号群のうち、前記括弧記号ペアを構成する開始括弧記号を除いた末尾の開始括弧記号と、前記括弧記号ペアの終了括弧以降の後続の文字列で前記開始括弧記号が新たに出現することなく最初に検出された終了括弧記号とを、前記第1の括弧記号ペアとの上下関係を特定する第2の括弧記号ペアに決定することを特徴とする文章解析装置。 An input means for inputting sentences;
Detecting means for detecting a start bracket symbol and an end bracket symbol from the sentence input by the input means;
A parenthesis symbol pair detected in the same hierarchy is used as the first parenthesis symbol detected by the detecting means and the first parenthesis symbol detected without newly appearing in the subsequent character string after the start parenthesis symbol. A decision means to decide;
Setting means for setting a tag related to the same hierarchy number at the appearance position of the parenthesis symbol pair of the same hierarchy determined by the determination means;
Equipped with a,
The determining means includes
When the parenthesis symbol pair (hereinafter, referred to as “first parenthesis symbol pair”) is determined, the last opening parenthesis symbol excluding the opening parenthesis symbol constituting the parenthesis symbol pair among other starting bracket symbol pairs And an end parenthesis symbol that is first detected without a new appearance of the start parenthesis symbol in a subsequent character string after the end parenthesis of the parenthesis symbol pair, and a vertical relationship with the first parenthesis symbol pair. A sentence analyzing apparatus characterized in that the second bracket symbol pair to be identified is determined .
前記検出手段によって前記後続の文字列で前記開始括弧記号が新たに検出された場合、前記後続の文字列において前記最初に検出された終了括弧記号までの開始括弧記号群のうち末尾の開始括弧記号と前記最初に検出された終了括弧記号とを同一階層の括弧記号ペアに決定することを特徴とする請求項1に記載の文章解析装置。 The determining means includes
When the start parenthesis symbol is newly detected in the subsequent character string by the detecting means, the last start parenthesis symbol in the group of start parenthesis symbols up to the first end parenthesis symbol detected in the subsequent character string The sentence analysis apparatus according to claim 1, wherein the first detected end parenthesis symbol is determined to be a parenthesis symbol pair in the same hierarchy.
前記第1の括弧記号ペアを構成する開始括弧記号の前方に、前記第2の括弧記号ペアを構成する終了括弧記号に設定されたタグを設定すると共に、前記第1の括弧記号ペアを構成する終了括弧記号の後方に、前記第2の括弧記号ペアを構成する開始括弧記号に設定されたタグを設定することを特徴とする請求項1または2に記載の文章解析装置。 The setting means includes
A tag set as an end parenthesis symbol constituting the second parenthesis symbol pair is set in front of a start parenthesis symbol constituting the first parenthesis symbol pair, and the first parenthesis symbol pair is constituted. The sentence analysis apparatus according to claim 1 or 2 , wherein a tag set to a start bracket symbol constituting the second bracket symbol pair is set behind an end bracket symbol.
任意の階層番号を指定する指定手段と、
前記指定手段によって指定された階層番号に関するタグを前記記憶手段に記憶されている文章の中から特定する特定手段と、
前記特定手段によって特定されたタグにより挟まれているタグ内文字列の表示状態に基づいて、前記タグ内文字列に対し表示切替処理を実行する表示制御手段と、
を備えることを特徴とする文章表示装置。 Storage means for storing a sentence to which a tag related to a hierarchy number of the same hierarchy is assigned to the start bracket symbol and the end bracket symbol corresponding to the start bracket symbol, including a start bracket symbol and an end bracket symbol;
A designation means for designating an arbitrary hierarchy number;
A specifying means for specifying a tag related to the hierarchy number specified by the specifying means from the sentences stored in the storage means;
Display control means for executing display switching processing on the character string in the tag based on the display state of the character string in the tag sandwiched between the tags specified by the specifying means;
A sentence display device comprising:
前記タグ内文字列の中に、前記指定手段によって指定されていない階層番号に関するタグがある場合、前記指定されていない階層番号に関するタグにより挟まれているタグ内文字列に対し表示切替処理を実行しないことを特徴とする請求項4に記載の文章表示装置。 The display control means includes
When the tag character string includes a tag related to a hierarchical number not specified by the specifying means, display switching processing is executed for the character string in the tag sandwiched between the tags related to the non-specified hierarchical number. The sentence display device according to claim 4 , wherein the sentence display device is not.
前記入力手段により、文章を入力する入力工程と、
前記検出手段により、前記入力工程によって入力された文章の中から開始括弧記号と終了括弧記号とを検出する検出工程と、
前記決定手段により、前記検出工程によって検出された開始括弧記号と当該開始括弧記号以降の後続の文字列で前記開始括弧記号が新たに出現することなく最初に検出された終了括弧記号とを同一階層の括弧記号ペアに決定する決定工程と、
前記設定手段により、前記決定工程によって決定された同一階層の括弧記号ペアの出現位置に同一の階層番号に関するタグを設定する設定工程と、
を実行し、
前記決定工程は、
前記括弧記号ペア(以下、「第1の括弧記号ペア」という)が決定された場合、他の開始括弧記号群のうち、前記括弧記号ペアを構成する開始括弧記号を除いた末尾の開始括弧記号と、前記括弧記号ペアの終了括弧以降の後続の文字列で前記開始括弧記号が新たに出現することなく最初に検出された終了括弧記号とを、前記第1の括弧記号ペアとの上下関係を特定する第2の括弧記号ペアに決定することを特徴とする文章解析方法。 A computer comprising input means, detection means, determination means, and setting means,
An input step of inputting a sentence by the input means;
A detection step of detecting a start bracket symbol and an end bracket symbol from the sentence input by the input step by the detection means;
The determination means includes a start bracket symbol detected by the detection step and an end bracket symbol first detected without newly appearing in a subsequent character string after the start bracket symbol in the same hierarchy. A determination step of determining a pair of bracket symbols of
A setting step of setting a tag related to the same hierarchy number at the appearance position of the parenthesis symbol pair of the same hierarchy determined by the determination step by the setting means;
The execution,
The determination step includes
When the parenthesis symbol pair (hereinafter, referred to as “first parenthesis symbol pair”) is determined, the last opening parenthesis symbol excluding the opening parenthesis symbol constituting the parenthesis symbol pair among other starting bracket symbol pairs And an end parenthesis symbol that is first detected without a new appearance of the start parenthesis symbol in a subsequent character string after the end parenthesis of the parenthesis symbol pair, and a vertical relationship with the first parenthesis symbol pair. A sentence analysis method characterized by determining a second bracket symbol pair to be identified .
前記指定手段により、任意の階層番号を指定する指定工程と、
前記特定手段により、前記指定工程によって指定された階層番号に関するタグを前記記憶手段に記憶されている文章の中から特定する特定工程と、
前記表示制御手段により、前記特定工程によって特定されたタグにより挟まれているタグ内文字列の表示状態に基づいて、前記タグ内文字列に対し表示切替処理を実行する表示制御工程と、
を実行することを特徴とする文章表示方法。 A storage unit that stores a sentence including a start parenthesis symbol and an end parenthesis symbol, the first parenthesis symbol and the end parenthesis symbol corresponding to the start parenthesis symbol being assigned a tag related to a hierarchy number in the same hierarchy; and a designation unit; A computer comprising a specifying means and a display control means,
A designation step of designating an arbitrary hierarchy number by the designation means;
A specifying step of specifying a tag related to the hierarchy number specified in the specifying step from the sentences stored in the storage unit by the specifying unit;
A display control step of performing a display switching process on the character string in the tag based on the display state of the character string in the tag sandwiched between the tags specified in the specifying step by the display control unit;
The sentence display method characterized by performing.
文章を入力する入力手段、
前記入力手段によって入力された文章の中から開始括弧記号と終了括弧記号とを検出する検出手段、
前記検出手段によって検出された開始括弧記号と当該開始括弧記号以降の後続の文字列で前記開始括弧記号が新たに出現することなく最初に検出された終了括弧記号とを同一階層の括弧記号ペアに決定する決定手段、
前記決定手段によって決定された同一階層の括弧記号ペアの出現位置に同一の階層番号に関するタグを設定する設定手段、
として機能させ、
前記決定手段は、
前記括弧記号ペア(以下、「第1の括弧記号ペア」という)が決定された場合、他の開始括弧記号群のうち、前記括弧記号ペアを構成する開始括弧記号を除いた末尾の開始括弧記号と、前記括弧記号ペアの終了括弧以降の後続の文字列で前記開始括弧記号が新たに出現することなく最初に検出された終了括弧記号とを、前記第1の括弧記号ペアとの上下関係を特定する第2の括弧記号ペアに決定することを特徴とする文章解析プログラム。 Computer
Input means to input sentences,
Detecting means for detecting a start bracket symbol and an end bracket symbol from the text input by the input means;
A parenthesis symbol pair detected in the same hierarchy is used as the first parenthesis symbol detected by the detecting means and the first parenthesis symbol detected without newly appearing in the subsequent character string after the start parenthesis symbol. Decision means to decide,
Setting means for setting a tag relating to the same hierarchy number at the appearance position of the parenthesis symbol pair of the same hierarchy determined by the determination means;
To function as,
The determining means includes
When the parenthesis symbol pair (hereinafter, referred to as “first parenthesis symbol pair”) is determined, the last opening parenthesis symbol excluding the opening parenthesis symbol constituting the parenthesis symbol pair among other starting bracket symbol pairs And an end parenthesis symbol that is first detected without a new appearance of the start parenthesis symbol in a subsequent character string after the end parenthesis of the parenthesis symbol pair, and a vertical relationship with the first parenthesis symbol pair. A sentence analysis program for determining a second bracket symbol pair to be identified .
開始括弧記号と終了括弧記号を含み、前記開始括弧記号と当該開始括弧記号に対応する終了括弧記号とに対し同一階層の階層番号に関するタグが付与された文章を記憶する記憶手段、
任意の階層番号を指定する指定手段、
前記指定手段によって指定された階層番号に関するタグを前記記憶手段に記憶されている文章の中から特定する特定手段、
前記特定手段によって特定されたタグにより挟まれているタグ内文字列の表示状態に基づいて、前記タグ内文字列に対し表示切替処理を実行する表示制御手段、
として機能させることを特徴とする文章表示プログラム。 Computer
Storage means for storing a sentence including a start bracket symbol and an end bracket symbol, wherein the start bracket symbol and the end bracket symbol corresponding to the start bracket symbol are assigned a tag related to a hierarchy number in the same hierarchy;
A designation means for designating an arbitrary hierarchy number,
A specifying means for specifying a tag related to the hierarchy number specified by the specifying means from among sentences stored in the storage means;
Display control means for executing a display switching process on the character string in the tag based on the display state of the character string in the tag sandwiched between the tags specified by the specifying means;
A sentence display program characterized by functioning as
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009177113A JP5511253B2 (en) | 2009-07-29 | 2009-07-29 | Sentence analysis apparatus, sentence display apparatus, sentence analysis method, sentence display method, sentence analysis program, and sentence display program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009177113A JP5511253B2 (en) | 2009-07-29 | 2009-07-29 | Sentence analysis apparatus, sentence display apparatus, sentence analysis method, sentence display method, sentence analysis program, and sentence display program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011034153A JP2011034153A (en) | 2011-02-17 |
JP5511253B2 true JP5511253B2 (en) | 2014-06-04 |
Family
ID=43763194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009177113A Active JP5511253B2 (en) | 2009-07-29 | 2009-07-29 | Sentence analysis apparatus, sentence display apparatus, sentence analysis method, sentence display method, sentence analysis program, and sentence display program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5511253B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5491566B2 (en) * | 2012-04-20 | 2014-05-14 | 惇郎 奴田原 | Text display device |
JP6631035B2 (en) * | 2014-05-12 | 2020-01-15 | 日本精工株式会社 | Document masking system, document masking method and document masking program |
JP2016062284A (en) * | 2014-09-18 | 2016-04-25 | 日本精工株式会社 | Document masking system, document masking method, and document masking program |
JP6604007B2 (en) * | 2015-02-27 | 2019-11-13 | 日本精工株式会社 | Document masking system, document masking method, document masking program, and document browsing system |
JP6604006B2 (en) * | 2015-02-27 | 2019-11-13 | 日本精工株式会社 | Document management system, document management method, and document management program |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH082246A (en) * | 1994-06-21 | 1996-01-09 | Mitsubishi Heavy Ind Ltd | Cold/warm store for vehicle |
JPH096788A (en) * | 1995-06-15 | 1997-01-10 | Canon Inc | Method and device for analyzing language |
JP2770828B2 (en) * | 1997-03-21 | 1998-07-02 | 松下電器産業株式会社 | Document output device |
JP2001142684A (en) * | 1999-11-15 | 2001-05-25 | Fujitsu Ltd | Recording medium stored with program for analyzing source program |
JP2001154835A (en) * | 1999-11-30 | 2001-06-08 | Sharp Corp | Structure program compiling apparatus and recording medium recorded with structured program compiling program |
JP2006215679A (en) * | 2005-02-02 | 2006-08-17 | Haketa Bokushi | Information processor, information processing method, and recording medium |
JP2007011513A (en) * | 2005-06-28 | 2007-01-18 | Ricoh Co Ltd | Document display device, document display method, program and storage medium |
-
2009
- 2009-07-29 JP JP2009177113A patent/JP5511253B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011034153A (en) | 2011-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10901583B2 (en) | Systems and methods for visual definition of data associations | |
US20230367841A1 (en) | System and method for implementing containers which extract and apply semantic page knowledge | |
Heer et al. | Graphical histories for visualization: Supporting analysis, communication, and evaluation | |
US7313754B2 (en) | Method and expert system for deducing document structure in document conversion | |
US9747259B2 (en) | Searching, reviewing, comparing, modifying, and/or merging documents | |
KR100324456B1 (en) | Structured document searching display method and apparatus | |
US7716574B2 (en) | Methods and systems for providing direct style sheet editing | |
Eklundh et al. | A computer tool and framework for analyzing online revisions | |
CN109933796B (en) | Method and device for extracting key information of bulletin text | |
Yousef et al. | A survey of text alignment visualization | |
CA2500573A1 (en) | Advances in nspace - system and method for information analysis | |
JP5511253B2 (en) | Sentence analysis apparatus, sentence display apparatus, sentence analysis method, sentence display method, sentence analysis program, and sentence display program | |
US10049095B2 (en) | In-context editing of output presentations via automatic pattern detection | |
US20190147022A1 (en) | Method, program, recording medium, and device for assisting in creating homepage | |
CN105488113B (en) | Searching method, device and the search engine of paper | |
Pradhan et al. | Development and evaluation of a tool for assisting content creators in making pdf files more accessible | |
Bagley et al. | Creating reusable well-structured PDF as a sequence of component object graphic (COG) elements | |
Blessing et al. | An end-to-end environment for research question-driven entity extraction and network analysis | |
US8234563B1 (en) | Editing of customised documents | |
Pöckelmann et al. | LERA—an interactive platform for synoptical representations of multiple text witnesses | |
Shannon et al. | Deep Diffs: visually exploring the history of a document | |
Bourgonje | Shallow discourse parsing for German | |
KR20070067058A (en) | Method and apparatus of extracting title of web document | |
CN113297826B (en) | Method for marking on natural language text | |
JP2004318809A (en) | Information extraction rule generating apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140311 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5511253 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |