JP2006079385A - Software processor - Google Patents

Software processor Download PDF

Info

Publication number
JP2006079385A
JP2006079385A JP2004263212A JP2004263212A JP2006079385A JP 2006079385 A JP2006079385 A JP 2006079385A JP 2004263212 A JP2004263212 A JP 2004263212A JP 2004263212 A JP2004263212 A JP 2004263212A JP 2006079385 A JP2006079385 A JP 2006079385A
Authority
JP
Japan
Prior art keywords
license
data
software
matching
software processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004263212A
Other languages
Japanese (ja)
Inventor
Yasuo Saito
保夫 齋藤
Shinji Ota
真二 太田
Kenichi Ishida
健一 石田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004263212A priority Critical patent/JP2006079385A/en
Publication of JP2006079385A publication Critical patent/JP2006079385A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To effectively examine articles and terms with respect to the license of software in a software processor for examining the content of a software license which include data of sentences for regulating the license. <P>SOLUTION: A license article pattern dictionary 23 stores pattern data of articles of the license. A processing part 12 detects data of character strings coincident with the pattern data of the articles of the license which are stored in the license article pattern dictionary 23. An output part 14 outputs a detection result detected by the processing part 12. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、ソフトウエアのライセンスに関する条項や用語を効果的に調査するソフトウエア処理装置に関する。   The present invention relates to a software processing apparatus that effectively searches for terms and terms relating to software licenses.

従来では、ソフトウエアのパッケージのライセンスを調査する場合には、そのパッケージ中に含まれる各ファイルのライセンスを、全て、人間が手作業と目視で調査していた。このため、調査に莫大な工数が必要であり、調査結果に信頼性を保証するために何度も確認することなどが必要であった。
また、近年では、ソフトウエアの規模が大きくなっているため、このような作業の煩雑さは増大しており、更に、オープンソフトウエアの広がりにより、ライセンスを調査することの重要性がますます高まっている。
Conventionally, when investigating a license of a software package, all the licenses of each file included in the package have been manually and visually examined by a human. For this reason, enormous man-hours are required for the investigation, and it is necessary to confirm the investigation results many times in order to guarantee the reliability.
In recent years, the scale of software has increased, and the complexity of such work has increased. In addition, the importance of investigating licenses has increased due to the spread of open software. ing.

そこで、例えば、ライセンスの条項や用語を扱うために、文字列照合を利用することが考えられる。
文字列を照合する技術としては、或るファイルの行のうち、指定文字列に一致したものを抽出するgrepというツールがよく知られている。
また、一例として、従来では、文字列照合の際に、共通部分を削除して、差異を抽出する方法が提案されている(例えば、特許文献1参照。)。
しかしながら、このような技術だけでは、ライセンスの条項や用語を扱うには不十分であった。
Thus, for example, it is conceivable to use character string matching to handle license terms and terms.
As a technique for collating character strings, a tool called “grep” that extracts a line that matches a specified character string from lines in a certain file is well known.
As an example, conventionally, a method has been proposed in which a common part is deleted and a difference is extracted during character string matching (see, for example, Patent Document 1).
However, such technology alone was not sufficient to handle license terms and terms.

特開昭62−89134号公報JP-A-62-89134

上述のように、従来では、ソフトウエアのライセンスに関する条項や用語を調査するために十分な技術が開発されていなかった。
本発明は、このような従来の事情に鑑み為されたもので、ソフトウエアのライセンスに関する条項や用語を効果的に調査することができるソフトウエア処理装置を提供することを目的とする。
As described above, in the past, sufficient technology has not been developed to investigate terms and terms related to software licenses.
The present invention has been made in view of such conventional circumstances, and an object of the present invention is to provide a software processing apparatus capable of effectively examining clauses and terms relating to software licenses.

上記目的を達成するため、本発明に係るソフトウエア処理装置では、次のようにして、ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査する。
すなわち、ライセンス条項パターンデータ記憶手段が、ライセンスの条項のパターンのデータを記憶する。
一致文字列データ検出手段が、調査対象となるソフトウエアに含まれる文のデータから、前記ライセンス条項パターンデータ記憶手段に記憶されたライセンスの条項のパターンのデータと一致する文字列のデータを検出する。
一致文字列データ検出結果出力手段が、前記一致文字列データ検出手段による検出結果を出力する。
In order to achieve the above object, the software processing apparatus according to the present invention investigates the contents of the software license including the sentence data defining the license as follows.
That is, the license clause pattern data storage means stores license clause pattern data.
The matching character string data detection means detects character string data that matches the license clause pattern data stored in the license clause pattern data storage means from the sentence data included in the software to be investigated. .
The matching character string data detection result output means outputs the detection result by the matching character string data detection means.

従って、調査対象となるソフトウエアの文の中で、所定のライセンス条項パターンと一致する文字列が検出されて、当該検出結果が出力されるため、ソフトウエアのライセンスに関する条項(文字列)を効果的に調査することができる。   Therefore, the character string that matches the predetermined license clause pattern is detected in the text of the software to be investigated, and the detection result is output, so the clause (character string) related to the software license is effective. Can be investigated.

ここで、ライセンス内容の調査対象となるソフトウエアとしては、種々なものが用いられてもよく、例えば、パッケージに含まれるファイルなどを用いることができる。
また、ソフトウエアに含まれるライセンスを規定する文のデータとしては、例えば、ソースコードにおけるテキスト文のデータを用いることができる。
また、ソフトウエアには、例えば、プログラムのデータなども含まれる。
Here, various types of software may be used as the license content investigation target, and for example, a file included in a package may be used.
In addition, as text data defining the license included in the software, for example, text text data in the source code can be used.
The software includes program data, for example.

また、データを記憶する手段としては、例えば、メモリ(記憶装置)を用いて構成することができる。
また、ライセンスの条項のパターンとしては、種々なものが用いられてもよく、例えば、固定的な条項の文のパターンが用いられてもよく、或いは、特定の語句部分については所定の複数の語句のうちのいずれも許容するような条項の文のパターンが用いられてもよく、或いは、特定の部分については任意の語句を許容するような条項の文のパターンが用いられてもよい。
Moreover, as a means for storing data, for example, a memory (storage device) can be used.
Various license clause patterns may be used. For example, a fixed clause sentence pattern may be used. Alternatively, a specific plurality of phrases may be used for a specific phrase. A clause sentence pattern that allows any of the above may be used, or a clause sentence pattern that allows any word or phrase for a particular part.

また、ライセンス条項パターンと一致する文字列を検出した結果(検出結果)としては、種々な情報が出力されてもよく、例えば、一致した文字列(ライセンス条項パターン)や文書中における当該文字列の位置を出力するような態様を用いることができる。
また、検出結果を出力する態様としては、種々な態様が用いられてもよく、例えば、検出結果の情報を画面に表示出力する態様や、検出結果の情報をプリンタにより印刷出力する態様などを用いることができる。
Further, as a result (detection result) of detecting a character string that matches the license terms pattern, various information may be output. For example, a matching character string (license term pattern) or the character string in the document A mode of outputting the position can be used.
Various modes may be used for outputting the detection result. For example, a mode in which detection result information is displayed on a screen, a mode in which detection result information is printed out by a printer, or the like is used. be able to.

本発明に係るソフトウエア処理装置では、一構成例として、次のような構成とした。
すなわち、ライセンス用語パターンデータ記憶手段が、ライセンスの用語のパターンのデータを記憶する。
一致語句データ検出手段が、前記一致文字列データ検出手段により検出された文字列のデータを前記調査対象となるソフトウエアに含まれる文のデータから除いた部分について、前記ライセンス用語パターンデータ記憶手段に記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出する。
一致語句データ検出結果出力手段が、前記一致語句データ検出手段による検出結果を出力する。
The software processing apparatus according to the present invention has the following configuration as one configuration example.
That is, the license term pattern data storage means stores license term pattern data.
Matching phrase data detecting means stores the character string data detected by the matching character string data detecting means in the license term pattern data storing means for a portion obtained by removing the sentence data included in the software to be investigated. Data of a phrase that matches the stored license term pattern data is detected.
The matched phrase data detection result output means outputs the detection result by the matched phrase data detection means.

従って、調査対象となるソフトウエアの文の中で、所定のライセンス用語パターンと一致する語句が検出されて、当該検出結果が出力されるため、ソフトウエアのライセンスに関する用語(語句)を効果的に調査することができる。また、所定のライセンス条項パターンに一致する文字列が除かれた文書部分から、所定のライセンス用語パターンと一致する語句が検出されるため、例えば、既知なライセンス条項パターンに係るライセンス以外の未知なライセンスに関する用語(語句)を発見することが可能である。   Therefore, in the sentence of the software to be investigated, the phrase that matches the predetermined license term pattern is detected and the detection result is output, so the term (phrase) relating to the software license can be effectively used. Can be investigated. In addition, since a phrase that matches the predetermined license term pattern is detected from the document part from which the character string that matches the predetermined license clause pattern is removed, for example, an unknown license other than the license related to the known license clause pattern It is possible to find a term (phrase).

ここで、ライセンスの用語のパターンとしては、種々なものが用いられてもよく、例えば、固定的な用語(語句)のパターンが用いられてもよく、或いは、同様な意味を有するものについて品詞の違いや活用形の違いを許容するような用語(語句)のパターンが用いられてもよい。
また、ライセンス用語パターンと一致する語句を検出した結果(検出結果)としては、種々な情報が出力されてもよく、例えば、一致した語句(ライセンス用語パターン)や文書中における当該語句の位置や一致の度合いに関する情報を出力するような態様を用いることができる。
Here, various license term patterns may be used. For example, a fixed term (phrase) pattern may be used, or a part of speech with a similar meaning may be used. A pattern of terms (phrases) that allows a difference or a difference in utilization may be used.
In addition, various information may be output as a result (detection result) of detecting a phrase that matches the license term pattern, for example, the matched phrase (licensed term pattern), the position or match of the phrase in the document It is possible to use a mode in which information relating to the degree of output is output.

本発明に係るソフトウエア処理装置では、一構成例として、次のような構成とした。
すなわち、前記ライセンス用語パターンデータ記憶手段は、ライセンスの用語のパターンのデータと対応付けて、重要度を表す値のデータを記憶する。
前記一致語句データ検出結果出力手段は、前記ライセンス用語パターンデータ記憶手段に記憶されたデータを参照して、前記一致語句データ検出手段により検出された語句のデータについて前記重要度を表す値の総和値を算出し、当該総和値を前記一致語句データ検出手段による検出結果として出力する。
The software processing apparatus according to the present invention has the following configuration as one configuration example.
That is, the license term pattern data storage means stores data of values representing importance in association with license term pattern data.
The matched phrase data detection result output means refers to the data stored in the license term pattern data storage means, and the sum of values representing the importance of the phrase data detected by the matched phrase data detection means And the total value is output as a detection result by the matched phrase data detection means.

従って、調査対象となるソフトウエアから検出された所定のライセンス用語パターンに一致する1つ以上の語句について、対応する重要度を表す値が総和されて、当該総和値が出力されるため、調査対象となるソフトウエアに関して、所定のライセンス用語との関連度をユーザに通知することができる。なお、重要度を表す値の総和値が大きい(高い)方が、所定のライセンス用語との関連度が大きい(高い)とみなす。   Therefore, for one or more words that match the predetermined license term pattern detected from the software to be investigated, the values representing the corresponding importance levels are summed and the total value is output. The degree of relevance with a predetermined license term can be notified to the user. It should be noted that the larger (higher) sum of the values representing the importance is considered to have a higher (higher) degree of association with a predetermined license term.

ここで、それぞれのライセンス用語パターンについての重要度を表す値としては、種々な値が用いられてもよい。
また、同一のライセンス用語パターンに一致する語句が複数の箇所で検出された場合には、例えば、これら複数個分だけ重要度を表す値を加算してもよく、或いは、これらをまとめて1個分とみなして1個分の重要度を表す値を用いてもよい。
Here, various values may be used as values representing the importance of each license term pattern.
In addition, when a phrase that matches the same license term pattern is detected at a plurality of locations, for example, a value representing the importance may be added for the plurality of locations, or these may be added together. A value representing the importance of one piece may be used as a minute.

本発明に係るソフトウエア処理装置では、次のようにして、ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査する。
すなわち、ライセンス用語パターンデータ記憶手段が、ライセンスの用語のパターンのデータを記憶する。
一致語句データ検出手段が、調査対象となるソフトウエアに含まれる文のデータから、前記ライセンス用語パターンデータ記憶手段に記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出する。
一致語句データ検出結果出力手段が、前記一致語句データ検出手段による検出結果を出力する。
In the software processing apparatus according to the present invention, the license contents of the software including the sentence data defining the license are examined as follows.
That is, the license term pattern data storage means stores license term pattern data.
The matching phrase data detection means detects phrase data that matches the license term pattern data stored in the license term pattern data storage means from the sentence data included in the software to be investigated.
The matched phrase data detection result output means outputs the detection result by the matched phrase data detection means.

従って、調査対象となるソフトウエアの文の中で、所定のライセンス用語パターンと一致する語句が検出されて、当該検出結果が出力されるため、ソフトウエアのライセンスに関する用語(語句)を効果的に調査することができる。   Therefore, in the sentence of the software to be investigated, the phrase that matches the predetermined license term pattern is detected and the detection result is output, so the term (phrase) relating to the software license can be effectively used. Can be investigated.

本発明では、以上に示したような技術思想を方法の発明として提供することも可能である。
一例として、本発明に係るソフトウエア処理方法では、ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置において、次のような処理を行う。
すなわち、前記ソフトウエア処理装置の一致文字列データ検出手段が、調査対象となるソフトウエアに含まれる文のデータから、メモリに記憶されたライセンスの条項のパターンのデータと一致する文字列のデータを検出する。前記ソフトウエア処理装置の一致文字列データ検出結果出力手段が、前記一致文字列データ検出手段による検出結果を出力する。
In the present invention, the technical idea as described above can be provided as a method invention.
As an example, in the software processing method according to the present invention, the following processing is performed in a software processing apparatus that examines the contents of a software license including sentence data defining a license.
That is, the matching character string data detecting means of the software processing device obtains character string data that matches the license clause pattern data stored in the memory from the sentence data included in the software to be investigated. To detect. The matching character string data detection result output means of the software processing device outputs the detection result by the matching character string data detection means.

他の一例として、本発明に係るソフトウエア処理方法では、ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置において、次のような処理を行う。
すなわち、前記ソフトウエア処理装置の一致語句データ検出手段が、調査対象となるソフトウエアに含まれる文のデータから、メモリに記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出する。前記ソフトウエア処理装置の一致語句データ検出結果出力手段が、前記一致語句データ検出手段による検出結果を出力する。
As another example, in the software processing method according to the present invention, the following processing is performed in a software processing device that examines the contents of a software license that includes sentence data defining a license.
That is, the matching phrase data detection means of the software processing device detects phrase data that matches the license term pattern data stored in the memory from the sentence data included in the software to be investigated. . The matching phrase data detection result output means of the software processing device outputs the detection result by the matching phrase data detection means.

本発明では、以上に示したような技術思想をプログラムの発明として提供することも可能である。
一例として、本発明に係るプログラムは、ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置を構成するコンピュータに実行させるものであり、次のような機能を有する。
すなわち、調査対象となるソフトウエアに含まれる文のデータからメモリに記憶されたライセンスの条項のパターンのデータと一致する文字列のデータを検出する機能と、当該検出結果を出力する機能を、当該コンピュータにより実現する。
In the present invention, the technical idea as described above can be provided as a program invention.
As an example, a program according to the present invention is executed by a computer constituting a software processing device that checks the contents of a software license including sentence data defining a license, and has the following functions.
In other words, the function of detecting character string data that matches the license clause pattern data stored in the memory from the sentence data included in the software to be investigated, and the function of outputting the detection result are Realized by computer.

他の一例として、本発明に係るプログラムは、ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置を構成するコンピュータに実行させるものであり、次のような機能を有する。
すなわち、調査対象となるソフトウエアに含まれる文のデータからメモリに記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出する機能と、当該検出結果を出力する機能を、当該コンピュータにより実現する。
As another example, a program according to the present invention causes a computer that constitutes a software processing device that checks license contents of software including sentence data defining a license to execute the following functions. Have.
That is, a function for detecting phrase data matching the license term pattern data stored in the memory from sentence data included in the software to be investigated, and a function for outputting the detection result are provided for the computer. To achieve.

本発明では、以上に示したような技術思想をプログラムを記憶した記憶媒体の発明として提供することも可能である。
一例として、本発明に係る記憶媒体では、ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置を構成するコンピュータに実行させるプログラムを当該コンピュータの入力手段により読み取り可能に記憶したものである。
そして、当該プログラムは、調査対象となるソフトウエアに含まれる文のデータからメモリに記憶されたライセンスの条項のパターンのデータと一致する文字列のデータを検出する処理と、当該検出結果を出力する処理を、当該コンピュータに実行させる。
In the present invention, the technical idea as described above can be provided as an invention of a storage medium storing a program.
As an example, in the storage medium according to the present invention, a program to be executed by a computer constituting a software processing device that investigates the license contents of software including sentence data defining a license can be read by the input means of the computer. I remembered it.
Then, the program detects the character string data that matches the license clause pattern data stored in the memory from the sentence data included in the software to be investigated, and outputs the detection result. The process is executed by the computer.

他の一例として、本発明に係る記憶媒体では、ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置を構成するコンピュータに実行させるプログラムを当該コンピュータの入力手段により読み取り可能に記憶したものである。
そして、当該プログラムは、調査対象となるソフトウエアに含まれる文のデータからメモリに記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出する処理と、当該検出結果を出力する処理を、当該コンピュータに実行させる。
ここで、記憶媒体としては、例えば、フロッピー(登録商標)ディスクやCD−ROMやDVDなどのように、種々なものが用いられてもよい。
また、コンピュータの入力手段としては、例えば、各種の記憶媒体からデータ(ここでは、プログラム)を読み取り入力する読み取り部のように、種々なものが用いられてもよい。
As another example, in the storage medium according to the present invention, a program to be executed by a computer constituting a software processing device for examining the license contents of software including sentence data defining a license is read by the input means of the computer. It is memorized as possible.
Then, the program detects a phrase data matching the license term pattern data stored in the memory from the sentence data included in the software to be investigated, and outputs the detection result. Is executed by the computer.
Here, various storage media such as a floppy (registered trademark) disk, a CD-ROM, and a DVD may be used as the storage medium.
Further, as the input means of the computer, various devices such as a reading unit that reads and inputs data (here, a program) from various storage media may be used.

以上説明したように、本発明に係るソフトウエア処理装置によると、ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するに際して、調査対象となるソフトウエアに含まれる文のデータから記憶されたライセンスの条項のパターンのデータと一致する文字列のデータを検出し、当該検出結果を出力するようにしたため、ソフトウエアのライセンスに関する条項を効果的に調査することができる。
また、本発明に係るソフトウエア処理装置によると、ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するに際して、調査対象となるソフトウエアに含まれる文のデータから記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出し、当該検出結果を出力するようにしたため、ソフトウエアのライセンスに関する用語を効果的に調査することができる。
As described above, according to the software processing device of the present invention, when the license content of the software including the sentence data defining the license is investigated, the software is stored from the sentence data included in the software to be investigated. Since the data of the character string that matches the data on the license license pattern thus detected is detected and the detection result is output, the software license terms can be effectively investigated.
Further, according to the software processing apparatus of the present invention, when investigating the license contents of software including sentence data defining a license, the license stored from the sentence data contained in the software to be investigated is stored. Since the phrase data matching the term pattern data is detected and the detection result is output, the terms relating to the software license can be effectively investigated.

本発明に係る一実施例を図面を参照して説明する。
図1には、本発明に係るソフトウエア処理装置1の構成例を示してある。
本例のソフトウエア処理装置1は、例えばコンピュータから構成されており、記憶部11と、処理部12と、入力部13と、出力部14を備えている。
本例のソフトウエア処理装置1は、例えば、基本ソフトウエアとなるオペレーティングシステム(OS)やOS上で動作するアプリケーションソフトウエアなどのソフトウエアのライセンスを調査するために、作業者(ユーザ)により操作される。ユーザは、例えば千個以上といった多数のファイルを含むソフトウエアのパッケージについて、それぞれのファイル毎に、ソースコードを用いて、ライセンスの内容を調査する。
An embodiment according to the present invention will be described with reference to the drawings.
FIG. 1 shows a configuration example of a software processing apparatus 1 according to the present invention.
The software processing apparatus 1 of this example is composed of, for example, a computer, and includes a storage unit 11, a processing unit 12, an input unit 13, and an output unit 14.
The software processing apparatus 1 of this example is operated by an operator (user) in order to investigate a license of software such as an operating system (OS) serving as basic software and application software operating on the OS. Is done. For a software package including a large number of files, for example, a thousand or more, the user investigates the contents of the license using the source code for each file.

記憶部11は、例えば、データを記憶する記憶装置から構成されており、ソフトウエアのライセンスの調査を行うための処理を実行するライセンス調査用のソフトウエア21や、ライセンス調査の対象となるソフトウエア22や、ライセンス条項パターン辞書23や、ライセンス用語パターン辞書24などを記憶する。
ライセンス調査対象ソフトウエア22は、例えば、コンフィギュレーション対象ソフトウエアとして、コンフィギュレーション用ソフトウエアとの組として、それを売っているベンダーなどからソースコード(人が分かるプログラム)として入手して、ソフトウエア処理装置1の記憶部11へ格納される。通常、コンフィギュレーション用ソフトウエアは、コンフィギュレーション対象ソフトウエアに付随している。
なお、商品となるソフトウエアとしては、種々なものが用いられてもよく、例えば、プリンタや複合機などに関するソフトウエアなどを用いることができる。
The storage unit 11 includes, for example, a storage device that stores data, and includes a license investigation software 21 that executes a process for investigating software licenses, and software that is a subject of license investigations. 22, license terms pattern dictionary 23, license term pattern dictionary 24, and the like are stored.
The license investigation target software 22 is obtained as source code (a program that can be understood by a person) from a vendor or the like that sells the software as a configuration target software and a set of configuration software. It is stored in the storage unit 11 of the processing device 1. Usually, the configuration software is attached to the configuration target software.
Note that various software may be used as the product, and for example, software related to a printer, a multifunction peripheral, or the like may be used.

処理部12は、例えば、CPU(Central Processing Unit)やメインメモリなどから構成されており、各種の処理や制御を行う。本例では、処理部12は、ユーザからの指示に従って、ライセンス調査用ソフトウエア21によるライセンス調査の処理を実行して、ライセンス調査対象ソフトウエア22のライセンス調査を行う。
入力部13は、例えば、ユーザにより操作されるキーボードやマウスなどから構成されており、ライセンス調査に関する指示などをユーザから入力して処理部12へ渡す。
出力部14は、例えば、ユーザに対してデータを出力する表示画面やプリンタなどから構成されており、ライセンス調査の作業中のデータや、ライセンス調査の結果のデータなどを出力する。
The processing unit 12 includes, for example, a CPU (Central Processing Unit) and a main memory, and performs various processes and controls. In this example, the processing unit 12 performs a license survey process by the license survey software 21 in accordance with an instruction from the user, and performs a license survey of the license survey target software 22.
The input unit 13 includes, for example, a keyboard and a mouse operated by the user. The input unit 13 inputs an instruction related to a license check from the user and passes it to the processing unit 12.
The output unit 14 includes, for example, a display screen for outputting data to a user, a printer, and the like, and outputs data during license investigation work, data of license investigation results, and the like.

図2には、ライセンス条項パターン辞書23により保持されるデータの内容の一例を示してある。
ライセンス条項パターン辞書23は、ライセンス条項パターンのデータの集合を保持する。
図2の例では、ライセンス条項パターンとして、「The license of this software ・・・」というパターンや「If you want to redistribute this software, ・・・」というパターンなどを保持している。
ライセンス条項パターンの言語としては、ライセンス調査対象ソフトウエア22に含まれ得る任意の言語が用いられてもよく、例えば、日本語や、英語などを用いることができる。
FIG. 2 shows an example of the contents of data held by the license clause pattern dictionary 23.
The license clause pattern dictionary 23 holds a set of license clause pattern data.
In the example of FIG. 2, as a license clause pattern, a pattern “The license of this software...”, A pattern “If you want to redistribute this software,.
As the language of the license clause pattern, any language that can be included in the license research target software 22 may be used, and for example, Japanese or English may be used.

本例では、ライセンス条項パターンとしては、例えば、GNU GPL(General Public License)のライセンスやBSD(Berkeley Systems Distribution)のライセンスなどのように既知のライセンスに関して、一文のパターンや、二文のパターンや、或いは、三文以上のパターンを用いる。
一例として、日本語の場合、GPLのライセンスに関して「このソフトウエアは、GPLライセンスに従います」というテキスト文のパターンを用いることや、BSDライセンスに関して「このソフトウエアは、BSDライセンスに従います」というテキスト文のパターンを用いることなどができる。
In this example, the license clause pattern includes, for example, a one-sentence pattern, a two-sentence pattern, a known sentence such as a GNU GPL (General Public License) license or a BSD (Berkeley Systems Distribution) license, Alternatively, a pattern of three sentences or more is used.
For example, in the case of Japanese, the GPL license uses the text pattern “This software complies with the GPL license”, or the BSD license “This software complies with the BSD license” text. Can be used.

ライセンス条項パターンとしては、例えば、定型句のパターンや、或いは、定型句ながらも変化部分(バリエーション)が含められるパターンなどを用いることができる。
定型句を用いたライセンス条項パターンとしては、例えば、予め設定された語や、任意の語(いずれの語であってもよいもの)を用いた組み合わせのパターンなどを用いることができる。
また、定型句ながらもバリエーションが含められるパターンとしては、例えば、既知のライセンス条項と照合する場合にライセンス条項に含まれる多少の変化を吸収するために、ライセンス条項を正規表現などでパターン化したものを用いることができる。
As the license clause pattern, for example, a fixed phrase pattern or a pattern in which a change part (variation) is included in a fixed phrase can be used.
As the license clause pattern using the fixed phrase, for example, a preset word or a combination pattern using any word (which may be any word) can be used.
In addition, patterns that can include variations in boilerplate are, for example, patterns of license terms that are patterned with regular expressions to absorb some changes included in the license terms when matching with known license terms. Can be used.

正規表現としては、例えば、「M」及びそれより大きな「N」をそれぞれ或る数値として、「A」及び「B」をそれぞれ或る単語として、「単語Aと単語Bとの間に任意の単語がM語以上N語以内存在するパターン」などをライセンス条項パターンとして用いることができる。
また、正規表現としては、例えば、「A」、「B」、「C」、「X」、「Y」、「Z」をそれぞれ単語として、「ABCとXYZとの間にはアルファベットの小文字が3文字以上6文字以下である」という条件や、「或る特定の箇所に必ずスペースが配置されていなければならない」という条件や、「4桁の数字が(西暦として)含まれている」という条件などを単独で或いは組み合わせて用いて、種々なライセンス条項パターンを生成することができる。
As regular expressions, for example, “M” and “N” larger than that are each a certain numerical value, “A” and “B” are each a certain word, A pattern in which a word exists between M words and N words can be used as a license clause pattern.
In addition, as regular expressions, for example, “A”, “B”, “C”, “X”, “Y”, “Z” are used as words, respectively, and there is a small alphabet letter between “ABC” and “XYZ”. The condition that it is 3 or more characters and 6 characters or less, the condition that “a space must be arranged at a certain specific location”, or “a four-digit number is included (as the year)” Various license terms patterns can be generated using conditions or the like alone or in combination.

また、例えば、日本語を使用する場合に、「このソフトウエア」と「このライブラリ」と「このプログラム」という語のいずれであっても同一の類型のライセンス条項パターンに含まれることとすることができる。同様に、英語を使用する場合に、「this software」と「this library」と「this program」という語のいずれであっても同一の類型のライセンス条項パターンに含まれることとすることができる。これらでは、「この」や「this」の後に配置される語に揺らぎを持たせている。
このように、ライセンス条項パターンでは、同様な文に対して、変化部分(バリエーション)を有する幾つかの同様なパターンを設定しておくことにより、揺らぎを持った文を検出することができる。
Also, for example, when using Japanese, any of the terms “this software”, “this library”, and “this program” may be included in the same type of license terms pattern. it can. Similarly, when using English, any of the words “this software”, “this library”, and “this program” may be included in the same type of license clause pattern. In these words, the word placed after “this” or “this” is given fluctuation.
As described above, in the license clause pattern, it is possible to detect a sentence with fluctuation by setting several similar patterns having a change portion (variation) for a similar sentence.

そして、本例では、調査対象となるソフトウエアに含まれるライセンスを規定するテキスト部分の中で、ライセンス条項パターン辞書23に保持されたライセンス条項パターンと一致(マッチ)するテキスト文を検出した場合には、その旨或いは検出したテキスト文(ライセンス条項パターン)などを表すデータをユーザに対して表示出力などして通知する。
例えば、GPLのライセンスに関するライセンス条項パターンに一致するテキスト文を検出した場合に、「GPLライセンスに関するライセンス条項パターンがマッチしました」という内容のメッセージを出力することや、BSDのライセンスに関するライセンス条項パターンに一致するテキスト文を検出した場合に、「BSDライセンスに関するライセンス条項パターンがマッチしました」という内容のメッセージを出力することや、或いは、これら両方のライセンス条項パターンに一致するテキスト文を検出した場合に、その旨を出力することなどを行う。
In this example, when a text sentence that matches (matches) the license clause pattern held in the license clause pattern dictionary 23 is detected in the text portion that defines the license included in the software to be investigated. Notifies the user of such data or data representing the detected text sentence (license clause pattern) by display output or the like.
For example, if a text that matches the license terms pattern for a GPL license is detected, a message saying “The license terms pattern for a GPL license has matched” is output, or the license terms pattern for a BSD license is displayed. When a matching text sentence is detected, a message stating that “the license terms pattern for the BSD license has been matched” is output, or when a text statement that matches both of these license terms patterns is detected. , To that effect, etc.

図3には、ライセンス用語パターン辞書24により保持されるデータの内容の一例を示してある。
ライセンス用語パターン辞書24は、ライセンス用語パターンのデータと、重要度を表す点数(重要度点数)のデータとの組の集合を保持する。
図3の例では、ライセンス用語パターン及びその重要度点数の組として、「license」及び「30点」の組や、「legal」及び「20点」の組や、「permission」及び「10点」の組などのデータを保持している。
ライセンス用語パターンの言語としては、ライセンス調査対象ソフトウエア22に含まれ得る任意の言語が用いられてもよく、例えば、日本語や、英語などを用いることができる。
FIG. 3 shows an example of the contents of data held by the license term pattern dictionary 24.
The license term pattern dictionary 24 holds a set of sets of license term pattern data and score data representing importance (importance score) data.
In the example of FIG. 3, as a set of the license term pattern and its importance score, a set of “license” and “30 points”, a set of “legal” and “20 points”, “permission” and “10 points” It holds data such as a set.
As the language of the license term pattern, any language that can be included in the license survey target software 22 may be used. For example, Japanese, English, or the like may be used.

本例では、ライセンス用語パターンとしては、例えば、未知のライセンスを規定するテキスト文書に含まれる可能性があると考えられる語のパターンを用いている。
ライセンス用語パターンとしては、例えば、ライセンスに出現しやすい単語や句が用いられ、2つ以上の単語から構成されてもよく、ライセンス条項パターンと比較して短いものが用いられる。
In this example, as the license term pattern, for example, a word pattern that may be included in a text document that defines an unknown license is used.
As the license term pattern, for example, words and phrases that are likely to appear in the license are used, and the license term pattern may be composed of two or more words, and is shorter than the license term pattern.

また、ライセンス用語パターンとしては、定型的な語句や、或いは、ライセンス用語の多少の変化部分(バリエーション)を吸収するためにライセンス用語を正規表現などでパターン化したものなどを用いることができる。
例えば、多少の変化を吸収するパターンとして、「permit」や「permission」のように同様な意味を有する単語を同一の類型のライセンス用語パターンとして検出することにより、アルファベットの揺らぎを吸収することができる。
また、重要度点数としては、例えば、固定的な値が用いられる。
The license term pattern may be a fixed phrase or a pattern obtained by patterning the license term with a regular expression or the like in order to absorb some variation (variation) of the license term.
For example, as a pattern that absorbs some changes, alphabet fluctuations can be absorbed by detecting words having the same meaning, such as “permit” and “permission”, as license term patterns of the same type. .
For example, a fixed value is used as the importance score.

次に、本例のソフトウエア処理装置1によりソフトウエアのライセンスに関する条項や用語を調査する処理の具体例を示す。
本例では、ソフトウエアのパッケージの中には、何千個ものファイルが含まれており、1つ1つのファイルについてライセンスに関するテキスト部分の内容を調べる。
図4には、ライセンス調査対象ソフトウエア22に含まれる1つのファイルのデータを出力部14により画面に表示出力したものの一例を示してある。
図4に示される画面には、ライセンス調査の対象となる1つのファイルを構成するライセンスに関する部分のテキスト文が表示されている。
Next, a specific example of a process for investigating terms and terms relating to a software license by the software processing apparatus 1 of this example will be described.
In this example, the software package includes thousands of files, and the contents of the text portion relating to the license are examined for each file.
FIG. 4 shows an example in which data of one file included in the license investigation target software 22 is displayed and output on the screen by the output unit 14.
On the screen shown in FIG. 4, a text sentence of a portion related to the license that constitutes one file to be licensed is displayed.

ここで、ライセンスの条項は、ソフトウエア(本例では、ファイル)のソースコード上に、テキストで埋め込まれている。
また、ライセンスの条項は、例えば、プログラムの先頭又は後尾に配置されることが多いが、他の位置に配置されていてもよい。
また、ライセンスの条項は、種々な言語で生成されていてもよい。
また、ライセンスの条項は、一文であってもよいが、一般に、複数の文から構成されて、長い文章であることが多い。
Here, the license terms are embedded in text on the source code of the software (in this example, a file).
The license clause is often arranged at the beginning or tail of the program, for example, but may be arranged at another position.
Further, the license terms may be generated in various languages.
In addition, the license clause may be a single sentence, but is generally composed of a plurality of sentences and is often a long sentence.

利用者であるユーザにより操作されて、本例のソフトウエア処理装置1により行われる処理の手順(1)〜(6)の一例を示す。
(1)まず、ユーザは、ソフトウエア処理装置1に対して、ライセンス調査対象ソフトウエア22のパッケージに含まれるファイルの中から、ライセンスを調査する対象とするファイル群を指定する。なお、ファイル群としては、1つのファイルが指定されてもよく、或いは、複数のファイルが指定されてもよい。
(2)ソフトウエア処理装置1は、ユーザにより指定された調査対象となるファイル群の中の各ファイルに対して、次のような処理(3)〜(6)を行う。
An example of processing procedures (1) to (6) performed by the software processing apparatus 1 of this example when operated by a user who is a user will be shown.
(1) First, the user designates a file group for which a license is to be investigated from among the files included in the package of the license investigation target software 22 to the software processing apparatus 1. Note that one file may be designated as the file group, or a plurality of files may be designated.
(2) The software processing apparatus 1 performs the following processes (3) to (6) on each file in the file group to be investigated designated by the user.

(3)ソフトウエア処理装置1は、まず、該当するファイルに含まれるテキスト文について、ライセンス条項パターン辞書23中の各ライセンス条項パターンと一致する部分があるか否かを照合する。
(4)この結果、1つ以上のライセンス条項パターンについて一致(マッチ)するテキスト文を検出した場合には、当該一致した各ライセンス条項パターンをユーザに対して提示するとともに、各ライセンス条項パターンと一致した部分文字列をファイル全体の文字列からライセンス用語調査対象として除外する。
(3) First, the software processing apparatus 1 checks whether or not there is a portion that matches each license clause pattern in the license clause pattern dictionary 23 in the text sentence included in the corresponding file.
(4) As a result, when a text sentence that matches (matches) one or more license terms patterns is detected, the corresponding license terms pattern is presented to the user and matches the license terms pattern. Excluded partial character strings from the entire file character string as a license term investigation target.

図4の例では、「The license of this software ・・・」というライセンス条項パターンと「If you want to redistribute this software, ・・・」というライセンス条項パターンについて、一致する部分文字列がファイルのテキスト文中から検出されており、これら一致する部分文字列が枠に囲まれてユーザに通知されている。また、これらのようにライセンス条項パターンに一致する部分文字列は、ライセンス用語パターンとの照合では、除外される。なお、図4に示されるように、表示については、ライセンス条項パターンに一致する部分文字列も表示される。   In the example of FIG. 4, for the license clause pattern “The license of this software...” And the license clause pattern “If you want to redistribute this software,. These matching partial character strings are surrounded by a frame and notified to the user. In addition, such partial character strings that match the license terms pattern are excluded in matching with the license term pattern. Note that, as shown in FIG. 4, a partial character string that matches the license terms pattern is also displayed.

(5)ソフトウエア処理装置1は、ライセンス条項パターンに一致する部分文字列が除外された後におけるファイルのテキスト文(除外された残りの部分)について、ライセンス用語パターン辞書24中の各ライセンス用語パターンと一致する部分があるか否かを照合し、その結果をユーザに対して提示する。また、一致したライセンス用語パターンに対応した重要度点数を記憶部11などの記憶装置に記録する。
図4の例では、「license」というライセンス用語パターンと「legal」というライセンス用語パターンと「permission」というライセンス用語パターンについて、一致する部分文字列がファイルのテキスト文中から検出されており、これら一致する部分文字列が枠に囲まれてユーザに通知されている。
(5) The software processing apparatus 1 uses each license term pattern in the license term pattern dictionary 24 for the text sentence of the file after the partial character string that matches the license clause pattern (the remaining excluded portion). Whether or not there is a matching part and presents the result to the user. Also, the importance score corresponding to the matched license term pattern is recorded in a storage device such as the storage unit 11.
In the example of FIG. 4, for the license term pattern “license”, the license term pattern “legal”, and the license term pattern “permission”, matching partial character strings are detected from the text sentence of the file, and they match. The user is notified of the partial character string surrounded by a frame.

(6)ソフトウエア処理装置1は、ライセンス用語パターンと一致した部分文字列の全てについて、重要度点数を総和(累積的に加算)して、当該総和結果(合計結果)の値をライセンス用語マッチング度としてユーザに対して提示する。
なお、同一のライセンス用語パターンと一致する部分文字列が複数存在する場合には、これら複数分について重要度数を加算してもよく、或いは、これらをまとめて1つ分の重要度数のみを加算してもよい。例えば、重要度数が30点である「license」という部分文字列が3箇所に存在する場合には、これら複数分について重要度数を加算して90点としてもよく、或いは、これらをまとめて30点としてもよい。
図4の例では、表示画面の下方に、「ライセンス用語パターンとのマッチング度は60点です。」というメッセージが表示されてユーザに通知されている。
(6) The software processing apparatus 1 sums (adds cumulatively) the importance scores for all of the partial character strings that match the license term pattern, and the value of the sum result (sum result) is license term matching. Present to the user as a degree.
When there are a plurality of partial character strings that match the same license term pattern, the importance levels may be added to the plurality of partial character strings, or they may be added together to add only one importance level. May be. For example, when there are three partial character strings “license” having an importance level of 30 points, the importance levels may be added to the plurality of portions to obtain 90 points, or 30 points may be collected together. It is good.
In the example of FIG. 4, a message “The matching degree with the license term pattern is 60 points” is displayed at the bottom of the display screen to notify the user.

また、本例では、調査対象となる何千個のファイルについて、それぞれのライセンス用語マッチング度が検出される。
例えば、ライセンス用語マッチング度が検出された複数のファイルについて、検出されたライセンス用語マッチング度の値が大きい方からL個のファイルを選択して、選択したファイルについてその識別情報(例えば、ファイル名など)やライセンス用語マッチング度の値を表示出力などしてユーザに通知することが可能である。ここで、L個としては、例えば、10個や、100個などの種々な値を用いることができる。
また、例えば、ライセンス用語マッチング度が検出された複数のファイルについて、検出されたライセンス用語マッチング度の値が所定の閾値以上である(或いは、所定の閾値を超える)ファイルを選択して、選択したファイルについてその識別情報(例えば、ファイル名など)やライセンス用語マッチング度の値を表示出力などしてユーザに通知することが可能である。
In this example, the license term matching degree is detected for each of thousands of files to be investigated.
For example, for a plurality of files in which the license term matching degree is detected, L files are selected in descending order of the detected license term matching degree, and the identification information (for example, file name, etc.) is selected for the selected file. ) And the license term matching degree value can be displayed and output to the user. Here, as L, for example, various values such as 10 or 100 can be used.
Also, for example, for a plurality of files for which the license term matching degree is detected, a file having a detected license term matching degree value equal to or greater than a predetermined threshold (or exceeding a predetermined threshold) is selected and selected. It is possible to notify the user of the file by displaying the identification information (for example, the file name) and the value of the license term matching degree.

次に、ライセンス条項パターン辞書23に保持されるライセンス条項パターンのデータや、ライセンス用語パターン辞書24に保持されるライセンス用語パターンのデータを成長させる処理の例を示す。
本例では、調査対象となる複数のファイルについて、それぞれのライセンス用語マッチング度が検出される。ライセンス用語マッチング度は、ライセンス用語パターンとの一致(マッチング)の度合いを数値化したものである。
そして、ライセンス用語マッチング度の値が大きい(高い)ファイルの方が、ライセンス用語マッチング度の値が小さい(低い)ファイルと比べて、何らかのライセンスに関係がありそうであり、未知のライセンス条項が含まれている可能性が高いとみなすことが可能である。これにより、未知のライセンスに関する条項や用語を探すことができる。
Next, an example of processing for growing license term pattern data held in the license term pattern dictionary 23 and license term pattern data held in the license term pattern dictionary 24 will be described.
In this example, the license term matching degrees are detected for a plurality of files to be investigated. The license term matching degree is a numerical value of the degree of matching (matching) with the license term pattern.
And a file with a large (high) license term matching value is more likely to have some kind of license than a file with a low (low) license term matching value, and includes unknown license terms. It can be considered that there is a high possibility that This allows you to search for terms and terms related to unknown licenses.

例えば、ライセンス用語マッチング度の値が大きい方から所定の複数個のファイルを検査して、或いは、ライセンス用語マッチング度の値が所定の閾値以上である(或いは、所定の閾値を超える)複数個のファイルを検査して、ライセンス条項パターン辞書23に登録(保持)されていない同一の文或いは類似する文が所定数以上のファイル(全てのファイルという条件でもよい)に存在することを検出した場合には、このような文のパターンをライセンス条項パターンとして新たにライセンス条項パターン辞書23に登録する(保持させる)ことができる。   For example, a plurality of predetermined files having a larger license term matching degree value are inspected, or a plurality of license term matching degree values are equal to or greater than a predetermined threshold (or exceed a predetermined threshold). When the file is inspected and it is detected that the same sentence or a similar sentence that is not registered (held) in the license clause pattern dictionary 23 exists in a predetermined number or more files (may be all files) Can newly register (hold) such a sentence pattern as a license clause pattern in the license clause pattern dictionary 23.

また、例えば、ライセンス用語マッチング度の値が大きい方から所定の複数個のファイルを検査して、或いは、ライセンス用語マッチング度の値が所定の閾値以上である(或いは、所定の閾値を超える)複数個のファイルを検査して、ライセンス用語パターン辞書24に登録(保持)されていない同一の語句或いは類似する語句が所定数以上のファイル(全てのファイルという条件でもよい)に存在することを検出した場合には、このような語句のパターンをライセンス用語パターンとして新たにライセンス用語パターン辞書24に登録する(保持させる)ことができる。また、例えば、或る語句と組になって多く(例えば、所定数以上のファイルで)現れる語句のパターンをライセンス用語パターンとして新たにライセンス用語パターン辞書24に登録する(保持させる)ことができる。   In addition, for example, a plurality of predetermined files having a larger license term matching degree value are inspected, or a plurality of license term matching degree values are equal to or greater than a predetermined threshold (or exceed a predetermined threshold). A number of files were inspected, and it was detected that the same or similar words / phrases that are not registered (held) in the license term pattern dictionary 24 exist in more than a predetermined number of files (may be all files). In such a case, such a phrase pattern can be newly registered (held) in the license term pattern dictionary 24 as a license term pattern. In addition, for example, a pattern of words that appear in pairs with a certain word (for example, a predetermined number or more files) can be newly registered (held) in the license word pattern dictionary 24 as a license word pattern.

以上のように、本例のソフトウエア処理装置1では、ソースコードを含むソフトウエアやネットワークライブラリなどのパッケージについて、ライセンスに関する条項や用語を自動的に確実に調査することができ、ライセンスの調査にかかる工数を削減することができる。
例えば、本例のソフトウエア処理装置1では、ライセンス条項パターン辞書23に含まれる既知の各ライセンス条項パターンと一致する文が自動的に且つ確実に検出され、また、ライセンス用語パターン辞書24に登録されているライセンス用語パターンを用いて、ライセンス用語マッチング度が算出され、これにより、ライセンス条項パターン辞書23に含まれていない未知のライセンス条項パターンや、ライセンス用語パターン辞書23に含まれていない未知のライセンス用語パターンを発見することが可能となる。
As described above, the software processing apparatus 1 of the present example can automatically and reliably investigate the license terms and terms for the software including the source code and the package such as the network library. Such man-hours can be reduced.
For example, in the software processing apparatus 1 of this example, a sentence that matches each known license clause pattern included in the license clause pattern dictionary 23 is automatically and reliably detected, and is registered in the license term pattern dictionary 24. The license term matching degree is calculated using the license term pattern, and thus, an unknown license term pattern not included in the license term pattern dictionary 23 or an unknown license not included in the license term pattern dictionary 23 is calculated. It is possible to discover term patterns.

ここで、本例では、ライセンス条項パターン辞書23を用いてライセンス条項に関する調査を行う構成と、ライセンス用語パターン辞書24を用いてライセンス用語に関する調査を行う構成とを組み合わせた構成を示したが、例えば、いずれか一方の構成のみを実施することも可能である。   Here, in this example, a configuration in which a configuration for performing a survey on license terms using the license term pattern dictionary 23 and a configuration for performing a survey on license terms using the license term pattern dictionary 24 is shown. It is also possible to implement only one of the configurations.

なお、本例のソフトウエア処理装置1では、ライセンス条項パターン辞書23の機能によりライセンス条項パターンデータ記憶手段が構成されており、ライセンス用語パターン辞書24の機能によりライセンス用語パターンデータ記憶手段が構成されており、処理部12の機能により一致文字列データ検出手段や一致語句データ検出手段が構成されており、出力部14の機能により一致文字列データ検出結果出力手段や一致語句データ検出結果出力手段が構成されている。   In the software processing apparatus 1 of this example, the license term pattern data storage unit is configured by the function of the license term pattern dictionary 23, and the license term pattern data storage unit is configured by the function of the license term pattern dictionary 24. The function of the processing unit 12 constitutes a matched character string data detection means and a matched phrase data detection means, and the function of the output unit 14 constitutes a matched character string data detection result output means and a matched phrase data detection result output means. Has been.

ここで、本発明に係るソフトウエア処理装置などの構成としては、必ずしも以上に示したものに限られず、種々な構成が用いられてもよい。また、本発明は、例えば、本発明に係る処理を実行する方法或いは方式や、このような方法や方式を実現するためのプログラムや当該プログラムを記録(記憶)する記録媒体(記憶媒体)などとして提供することも可能であり、また、種々な装置やシステムとして提供することも可能である。
また、本発明の適用分野としては、必ずしも以上に示したものに限られず、本発明は、種々な分野に適用することが可能なものである。
Here, the configuration of the software processing apparatus according to the present invention is not necessarily limited to the above-described configuration, and various configurations may be used. Further, the present invention is, for example, a method or method for executing the processing according to the present invention, a program for realizing such a method or method, and a recording medium (storage medium) for recording (storing) the program. It can also be provided, and can also be provided as various devices and systems.
The application field of the present invention is not necessarily limited to the above-described fields, and the present invention can be applied to various fields.

また、本発明に係るソフトウエア処理装置などにおいて行われる各種の処理としては、例えばプロセッサやメモリ等を備えたハードウエア資源においてプロセッサがROM(Read Only Memory)に格納された制御プログラムを実行することにより制御される構成が用いられてもよく、また、例えば当該処理を実行するための各機能手段が独立したハードウエア回路として構成されてもよい。
また、本発明は上記の制御プログラムを格納したフロッピー(登録商標)ディスクやCD(Compact Disc)−ROM等のコンピュータにより読み取り可能な記録媒体や当該プログラム(自体)として把握することもでき、当該制御プログラムを当該記録媒体からコンピュータに入力してプロセッサに実行させることにより、本発明に係る処理を遂行させることができる。
In addition, as various processes performed in the software processing apparatus according to the present invention, for example, the processor executes a control program stored in a ROM (Read Only Memory) in a hardware resource including a processor, a memory, and the like. May be used, and for example, each functional unit for executing the processing may be configured as an independent hardware circuit.
The present invention can also be understood as a computer-readable recording medium such as a floppy (registered trademark) disk or a CD (Compact Disc) -ROM storing the control program, and the program (itself). The processing according to the present invention can be performed by inputting the program from the recording medium to the computer and causing the processor to execute the program.

本発明の一実施例に係るソフトウエア処理装置の構成例を示す図である。It is a figure which shows the structural example of the software processing apparatus which concerns on one Example of this invention. ライセンス条項パターン辞書の一例を示す図である。It is a figure which shows an example of a license clause pattern dictionary. ライセンス用語パターン辞書の一例を示す図である。It is a figure which shows an example of a license term pattern dictionary. ライセンス調査対象ファイルの表示の一例を示す図である。It is a figure which shows an example of a display of a license investigation object file.

符号の説明Explanation of symbols

1・・ソフトウエア処理装置、 11・・記憶部、 12・・処理部、 13・・入力部、 14・・出力部、 21・・ライセンス調査用ソフトウエア、 22・・ライセンス調査対象ソフトウエア、 23・・ライセンス条項パターン辞書、 24・・ライセンス用語パターン辞書、   1. Software processing device, 11. Storage unit, 12. Processing unit, 13. Input unit, 14. Output unit, 21. License survey software, 22. License survey target software, 23 ... License terms pattern dictionary, 24 ... License term pattern dictionary,

Claims (10)

ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置であって、
ライセンスの条項のパターンのデータを記憶するライセンス条項パターンデータ記憶手段と、
調査対象となるソフトウエアに含まれる文のデータから前記ライセンス条項パターンデータ記憶手段に記憶されたライセンスの条項のパターンのデータと一致する文字列のデータを検出する一致文字列データ検出手段と、
前記一致文字列データ検出手段による検出結果を出力する一致文字列データ検出結果出力手段と、
を備えたことを特徴とするソフトウエア処理装置。
A software processing device for investigating the contents of a software license including sentence data defining a license,
License clause pattern data storage means for storing license clause pattern data;
Matching character string data detecting means for detecting character string data that matches the license clause pattern data stored in the license clause pattern data storage means from sentence data included in the software to be investigated;
A matching character string data detection result output means for outputting a detection result by the matching character string data detection means;
A software processing apparatus comprising:
請求項1に記載のソフトウエア処理装置において、
ライセンスの用語のパターンのデータを記憶するライセンス用語パターンデータ記憶手段と、
前記一致文字列データ検出手段により検出された文字列のデータを前記調査対象となるソフトウエアに含まれる文のデータから除いた部分について、前記ライセンス用語パターンデータ記憶手段に記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出する一致語句データ検出手段と、
前記一致語句データ検出手段による検出結果を出力する一致語句データ検出結果出力手段と、
を備えたことを特徴とするソフトウエア処理装置。
The software processing device according to claim 1,
License term pattern data storage means for storing license term pattern data;
About the part of the character string data detected by the matching character string data detection means from the sentence data included in the software to be investigated, A matching phrase data detection means for detecting phrase data that matches the pattern data;
Matching phrase data detection result output means for outputting a detection result by the matching phrase data detection means;
A software processing apparatus comprising:
請求項2に記載のソフトウエア処理装置において、
前記ライセンス用語パターンデータ記憶手段は、ライセンスの用語のパターンのデータと対応付けて重要度を表す値のデータを記憶し、
前記一致語句データ検出結果出力手段は、前記ライセンス用語パターンデータ記憶手段に記憶されたデータを参照して、前記一致語句データ検出手段により検出された語句のデータについて前記重要度を表す値の総和値を算出し、当該総和値を前記一致語句データ検出手段による検出結果として出力する、
ことを特徴とするソフトウエア処理装置。
The software processing device according to claim 2,
The license term pattern data storage means stores value data representing importance in association with license term pattern data,
The matched phrase data detection result output means refers to the data stored in the license term pattern data storage means, and the sum of values representing the importance of the phrase data detected by the matched phrase data detection means And outputs the total value as a detection result by the matching phrase data detection means.
A software processing device.
ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置であって、
ライセンスの用語のパターンのデータを記憶するライセンス用語パターンデータ記憶手段と、
調査対象となるソフトウエアに含まれる文のデータから前記ライセンス用語パターンデータ記憶手段に記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出する一致語句データ検出手段と、
前記一致語句データ検出手段による検出結果を出力する一致語句データ検出結果出力手段と、
を備えたことを特徴とするソフトウエア処理装置。
A software processing device for investigating the contents of a software license including sentence data defining a license,
License term pattern data storage means for storing license term pattern data;
Matching phrase data detection means for detecting phrase data that matches the license term pattern data stored in the license term pattern data storage means from sentence data included in the software to be investigated;
Matching phrase data detection result output means for outputting a detection result by the matching phrase data detection means;
A software processing apparatus comprising:
ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置におけるソフトウエア処理方法であって、
前記ソフトウエア処理装置の一致文字列データ検出手段が、調査対象となるソフトウエアに含まれる文のデータからメモリに記憶されたライセンスの条項のパターンのデータと一致する文字列のデータを検出し、
前記ソフトウエア処理装置の一致文字列データ検出結果出力手段が、前記一致文字列データ検出手段による検出結果を出力する、
ことを特徴とするソフトウエア処理方法。
A software processing method in a software processing device for investigating software license contents including sentence data defining a license,
The matching character string data detection means of the software processing device detects character string data that matches the license clause pattern data stored in the memory from the sentence data included in the software to be investigated,
The matching character string data detection result output means of the software processing device outputs the detection result by the matching character string data detection means;
The software processing method characterized by the above-mentioned.
ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置におけるソフトウエア処理方法であって、
前記ソフトウエア処理装置の一致語句データ検出手段が、調査対象となるソフトウエアに含まれる文のデータからメモリに記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出し、
前記ソフトウエア処理装置の一致語句データ検出結果出力手段が、前記一致語句データ検出手段による検出結果を出力する、
ことを特徴とするソフトウエア処理方法。
A software processing method in a software processing device for investigating software license contents including sentence data defining a license,
The matched phrase data detection means of the software processing device detects phrase data that matches the license term pattern data stored in the memory from the sentence data included in the software to be investigated,
The matching phrase data detection result output means of the software processing device outputs the detection result by the matching phrase data detection means;
The software processing method characterized by the above-mentioned.
ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置を構成するコンピュータに実行させるプログラムであって、
調査対象となるソフトウエアに含まれる文のデータからメモリに記憶されたライセンスの条項のパターンのデータと一致する文字列のデータを検出する機能と、
当該検出結果を出力する機能を、当該コンピュータにより実現する、
ことを特徴とするプログラム。
A program to be executed by a computer constituting a software processing device for investigating software license contents including sentence data defining a license,
A function for detecting character string data that matches the license clause pattern data stored in the memory from sentence data included in the software to be investigated;
The function of outputting the detection result is realized by the computer.
A program characterized by that.
ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置を構成するコンピュータに実行させるプログラムであって、
調査対象となるソフトウエアに含まれる文のデータからメモリに記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出する機能と、
当該検出結果を出力する機能を、当該コンピュータにより実現する、
ことを特徴とするプログラム。
A program to be executed by a computer constituting a software processing device for investigating software license contents including sentence data defining a license,
A function to detect phrase data matching the license term pattern data stored in the memory from sentence data included in the software to be investigated;
The function of outputting the detection result is realized by the computer.
A program characterized by that.
ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置を構成するコンピュータに実行させるプログラムを当該コンピュータの入力手段により読み取り可能に記憶した記憶媒体であって、
当該プログラムは、調査対象となるソフトウエアに含まれる文のデータからメモリに記憶されたライセンスの条項のパターンのデータと一致する文字列のデータを検出する処理と、
当該検出結果を出力する処理を、当該コンピュータに実行させる、
ことを特徴とする記憶媒体。
A storage medium that stores a program to be executed by a computer constituting a software processing apparatus that checks license contents of software including sentence data defining a license in a manner that can be read by an input unit of the computer,
The program includes a process of detecting character string data that matches the license clause pattern data stored in the memory from sentence data included in the software to be investigated,
Causing the computer to execute a process of outputting the detection result;
A storage medium characterized by that.
ライセンスを規定する文のデータを含むソフトウエアのライセンス内容を調査するソフトウエア処理装置を構成するコンピュータに実行させるプログラムを当該コンピュータの入力手段により読み取り可能に記憶した記憶媒体であって、
当該プログラムは、調査対象となるソフトウエアに含まれる文のデータからメモリに記憶されたライセンスの用語のパターンのデータと一致する語句のデータを検出する処理と、
当該検出結果を出力する処理を、当該コンピュータに実行させる、
ことを特徴とする記憶媒体。
A storage medium that stores a program to be executed by a computer constituting a software processing apparatus that checks license contents of software including sentence data defining a license in a manner that can be read by an input unit of the computer,
The program includes a process of detecting phrase data matching the license term pattern data stored in the memory from sentence data included in the software to be investigated,
Causing the computer to execute a process of outputting the detection result;
A storage medium characterized by that.
JP2004263212A 2004-09-10 2004-09-10 Software processor Pending JP2006079385A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004263212A JP2006079385A (en) 2004-09-10 2004-09-10 Software processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004263212A JP2006079385A (en) 2004-09-10 2004-09-10 Software processor

Publications (1)

Publication Number Publication Date
JP2006079385A true JP2006079385A (en) 2006-03-23

Family

ID=36158784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004263212A Pending JP2006079385A (en) 2004-09-10 2004-09-10 Software processor

Country Status (1)

Country Link
JP (1) JP2006079385A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019101539A (en) * 2017-11-29 2019-06-24 Nttテクノクロス株式会社 Contract content evaluation device and contract content evaluation method and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019101539A (en) * 2017-11-29 2019-06-24 Nttテクノクロス株式会社 Contract content evaluation device and contract content evaluation method and program

Similar Documents

Publication Publication Date Title
JP4701292B2 (en) Computer system, method and computer program for creating term dictionary from specific expressions or technical terms contained in text data
JP4181577B2 (en) Character string processing method, apparatus, and program
JPH11110416A (en) Method and device for retrieving document from data base
Kawahara et al. Rapid development of a corpus with discourse annotations using two-stage crowdsourcing
JP2010506310A (en) Character position based password recovery
JP5314195B2 (en) Natural language processing apparatus, method, and program
JP2002117027A (en) Feeling information extracting method and recording medium for feeling information extracting program
Strobelt et al. LMdiff: A visual diff tool to compare language models
US7684975B2 (en) Morphological analyzer, natural language processor, morphological analysis method and program
JP2019179470A (en) Information processing program, information processing method, and information processing device
JP4361299B2 (en) Evaluation expression extraction apparatus, program, and storage medium
JP2006079385A (en) Software processor
JPH1139313A (en) Automatic document classification system, document classification oriented knowledge base creating method and record medium recording its program
JP2007122660A (en) Document data processor and document data processing program
JP2009169761A (en) Electronic dictionary system, display control method of electronic dictionary, computer program, and data storage medium
JP2006031143A (en) Document analysis device, document analysis method, and computer program
dos Santos Concept maps construction using natural language processing to support studies selection
JP6828812B2 (en) Information processing equipment, information processing methods and programs
JP2004152041A (en) Program, recording medium and apparatus for extracting key phrase
JP2005107793A (en) Keyword extracting device, keyword extracting method and computer program
JP2005228033A (en) Document search device and method
JP4206266B2 (en) Full-text search device, processing method, processing program, and recording medium
JP4294386B2 (en) Different notation normalization processing apparatus, different notation normalization processing program, and storage medium
JP2002366556A (en) Information retrieving method
JP2001034630A (en) System and method for document base retrieval