JP4214020B2 - 禁止用語を除外した文字列の生成装置 - Google Patents

禁止用語を除外した文字列の生成装置 Download PDF

Info

Publication number
JP4214020B2
JP4214020B2 JP2003282083A JP2003282083A JP4214020B2 JP 4214020 B2 JP4214020 B2 JP 4214020B2 JP 2003282083 A JP2003282083 A JP 2003282083A JP 2003282083 A JP2003282083 A JP 2003282083A JP 4214020 B2 JP4214020 B2 JP 4214020B2
Authority
JP
Japan
Prior art keywords
font
characters
character
character string
prohibited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003282083A
Other languages
English (en)
Other versions
JP2005050167A (ja
Inventor
憲生 中村
Original Assignee
グローバル・バリュー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グローバル・バリュー株式会社 filed Critical グローバル・バリュー株式会社
Priority to JP2003282083A priority Critical patent/JP4214020B2/ja
Publication of JP2005050167A publication Critical patent/JP2005050167A/ja
Application granted granted Critical
Publication of JP4214020B2 publication Critical patent/JP4214020B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、禁止用語を除外した文字列の生成装置に関するものである。
従来、文字や記号の組み合わせによって生成される文字列としてパスワードなどがある。本パスワードを登録するまでは、仮パスワードとして、10文字程度の任意のアルファベットを組み合わせた文字列をコンピュータ側で生成し、使用者に対して発行していた。アルファベットの場合では、10文字程度では、使用者が不快の思うような単語や、文章が生成される危険は低い。
しかし、生成される文字列が日本語の場合においては、2文字の組み合わせで使用者が不快になる公序良俗に違反するような言葉が生成されてしまう場合があった。
近年、キャンペーンとして商品に数値列が記載されたシールなどが貼られ販売されている。しかし、このように数値列の場合では、「0」〜「9」の10個の文字数となり、商品1個に対してユニークな数値を記載して販売する場合において、その販売される商品の量によっては、膨大な数値桁を必要とされ、使用者はその数値入力などを行う際に、誤入力する可能性が高く、また容易に他の番号を連想されやすいという欠点がある。また、特許出願人が発明した商品を購入した際に発行されるレシートに暗号となる文字列を印刷する技術が開示されている(例えば、特許文献1参照。)。
そこで、生成される文字列に平仮名を用いることによって、「あ」〜「ん」までの約46字を利用し、少ない桁で、表示されることが望まれていた。また、上述の通りに、使用者に対して不快になる公序良俗になる平仮名の組み合わせを除外した文字列生成方法が望まれていた。
特願2003−53908号公報
そこで、本発明は、上記従来技術の問題点に斯かる実情に鑑みなされたもので、数値情報を文字や記号の組み合わせによって生成される文字列に変換する場合において、生成された文字列に公序良俗に違反になるような文字列の組み合わせにならないように生成することを課題とする。
本発明は、数値情報に基づいて複数の文字からなる文字列コードを生成する生成装置において、禁止用語を記憶した記憶手段と、二つの文字を組合せした文字列からなる表を複数作成し、前記作成した全ての表から前記記憶手段に記憶さている二文字の禁止用語を除外すると共に、各表の除外されてない文字列を組合せした時に生じる禁止用語を除外する作表手段と、前記数値情報を前記表の内の一の表における除外されていない文字列の数で除算すると共に、前記除算の結果に基づいて前記作表手段で作成された前記一の表から、該計算結果で得られた数値に対応したn番目の文字列を抽出し、更に、前記計算結果に基づいて他の表について前記除算を繰り返すと共に、文字列の抽出も繰り返し行い、前記各表から抽出された各文字列を組合せることにより文字列コードを生成する文字列生成手段とを備えたことを特徴とする。
本発明によれば、数値情報を文字や記号の組み合わせによって生成される文字列に変換する方法において、生成された文字列に公序良俗に違反になるような文字列の組み合わせにならないように生成することができる。
また、2文字ずつ取り扱うことによって、より高速に文字列に変換することができる。
数値情報に基づいて複数の文字からなる文字列コードを生成する生成装置において、禁止用語を記憶した記憶手段と、二つの文字を組合せした文字列からなる表を複数作成し、前記作成した全ての表から前記記憶手段に記憶さている二文字の禁止用語を除外すると共に、各表の除外されてない文字列を組合せした時に生じる禁止用語を除外する作表手段と、前記数値情報を前記表の内の一の表における除外されていない文字列の数で除算すると共に、前記除算の結果に基づいて前記作表手段で作成された前記一の表から、該計算結果で得られた数値に対応したn番目の文字列を抽出し、更に、前記計算結果に基づいて他の表について前記除算を繰り返すと共に、文字列の抽出繰り返し行い、前記各表から抽出された各文字列を組合せることにより文字列コードを生成する文字列生成手段とを備えた。
図1は、フォント表から、2文字の禁止用語を除外した例である。図1(A)のフォント表は、平仮名2文字の組み合わせをひとまとまりにしたものである。平仮名46文字の2乗で、2116種類ある。禁止用語が存在しない場合2116種類から選択するようになる。図1(A)の「ああ」の右に「○」は使用可能であるという意味であり、ここに「×」である場合その文字は使用できないという意味を表している。図1(A)は、禁止用語を除外していないので全て使用できることを表している。
図1(B)のフォント表は、図1(A)のフォント表から2文字の禁止用語の例で、「かき」と「たち」を除外した例である。このように、禁止用語を除外して行くと、選択可能となる文字が少なくなり、2116種−2種を引いた2114種のフォントが使用可能となる。2文字の禁止用語が200種ある場合では、2116種−200種の1916種となる。
図2(A)は、例として禁止用語「かき」を除外して作成されたフォント表で、平仮名で16文字の文字列を作成する場合ではフォント表が8つ作られ、1フォント目表〜8フォント目表となる。それぞれ、2116種から「かき」という禁止用語を除外した種類が用意されている。
図2(B)は、1フォント目の選択で、禁止用語を除外したフォント表の中から、規定のアルゴリズムにより「あか」が選択された例である。
図3(A)では、1フォント目表と2フォント目表との組み合わせによって、発生する禁止用語の除外を行う。1フォント目で「あか」が選択された例で、2フォント目の表の「き」から始まるフォントを排除し使用できなくする。例では、「きあ」〜「きん」までの46種が使用できない。図3(B)で、2フォント目の選択を行うが、使用できないフォントを除外したフォント表の中から、規定のアルゴリズムにより使用可能である「かる」が選択された例である。
図4は、禁止用語の排除の流れを示す図である。まず1フォント目の決定が行われる。次に、2フォント目への連続の禁止用語の除外し、禁止フォントを削除する。次に、削除された2フォント目表から、2フォント目の決定を行う。2フォント目が決定すると、3フォント目への連続の禁止用語の除外し、禁止フォントを削除する。次に、禁止用語が削除された3フォント目表から、3フォント目の決定を行う。3フォント目が決定すると、4フォント目への連続の禁止用語の除外し、禁止フォントを削除する。次に、禁止用語が削除された4フォント目表から、4フォント目の決定を行う。と8フォント目が決定するまで同様に行われる。
図5は、禁止用語が2文字・3文字の場合での除外方法についての手法を説明する。2文字の場合では、フォント表が2文字で構成されている為に、該当する2文字のフォントは除外さる。また、前フォント目表と次フォント目表にまたがる場合、次フォント目表から、該当するフォントの削除が行われる。「かき」「たち」が例の場合では、「かき」及び「たち」は全てのフォント表から除外される。前フォントの文字が「?か」の部分のフォント「きあ」〜「きん」は利用できないので排除される。また同様に、前フォントが、「?た」の部分のフォント「ちあ」〜「ちん」は利用できないので排除される。
3文字の禁止用語の場合では、2文字で構成されたフォント表では直接除外されるフォントはないが、前フォントと次フォントの組み合わせによって、排除されるフォントが発生する。「なにぬ」が禁止用語の場合の例では、「?な」「にぬ」の組み合わせと、「?に」「ぬ?」の組み合わせが排除されるようになる。つまり、前フォントの文字が「?な」の部分のフォント「にぬ」は利用できないので排除され、また、前フォントの文字が「?に」の部分フォント「ぬあ」〜「ぬん」は利用できないようにして、排除される。このようにすることにより、3文字の禁止用語の除外を行うことが可能となる。
図6は、禁止用語が4文字・5文字の場合での除外方法についての手法を説明する。4文字の場合では、2文字で構成されたフォント表では直接除外されるフォントはないが、前フォントと次フォントの組み合わせによって、排除されるフォントが発生する。「はひふへ」が禁止用語の場合の例では、「?ひ」「ふへ」の組み合わせと、「?は」「ひふ」の組み合わせが排除されるようになる。実質3文字以上の文字を除外する場合禁止用語をフォント表が2文字単位で取り扱っている為に、禁止用語も2文字単位で取り扱うようになっている。また、4文字の禁止用語も、そのうちの、1字が違うだけで、禁止用語となりえないからである。前フォントの文字が「?ひ」の部分のフォント「ふへ」は利用できないので排除され、前フォントの文字が「?は」の部分フォント「ひふ」は利用できないので排除される。
5文字の場合では、4文字の場合と同様に2文字で構成されたフォント表では直接除外されるフォントはないが、前フォントと次フォントの組み合わせによって、排除されるフォントが発生する。「まみむめも」が禁止用語の場合の例では、「?み」「むめ」の組み合わせと、「?ま」「みむ」の組み合わせが排除されるようになる。実質3文字以上の文字を除外する場合禁止用語をフォント表が2文字単位で取り扱っている為に、禁止用語も2文字単位で取り扱うようになっている。また、4文字の禁止用語も、そのうちの、1文字が違うだけで、禁止用語となりえないからである。前フォントの文字が「?み」の部分のフォント「むめ」は利用できないので排除され、前フォントの文字が「?ま」の部分フォント「みむ」は利用できないので排除される。
このように、3文字は(2+1)文字または(1+2)文字で構成され、4文字以上は(2+2)文字で構成されることにより、禁止用語を排除することができるようになっている。
図7〜8を用いて、数値列より禁止用語を除外した文字列の生成の方法を説明する。この例では、1フォント目は、2文字の禁止用語を排除したフォント2000種類で、2フォント目は、2文字の禁止用語を排除し、「に」に続く禁止用語も排除したフォント1500種類で、3フォント目は、2文字の禁止用語を排除し、「て」に続く禁止用語も排除したフォント1650種の場合での説明である。数値列は、「123456789」の例である。
1フォント目の決定においては、前の文字が無い1フォント目の表から選択が行われ、数値列をそのフォントの種類数で除算を行いその余りに1を加算(余りが0の場合がある為))をして、フォントを選択する。例では、「123456789÷2000=61728余り789」となる。この789に1を加算し、790番目のフォントが選択される。実施の例では表示しないが、1フォント目表の790番目を参照し、実施の例では「まに」であり、このフォントに決定される。
次に2フォント目の決定においては、2フォント目表から選択が行われる。1フォント目の決定を行う際に、算出された商を2フォント目の種類数で除算を行い、その余りに1を加算をして、フォントを選択する。例では、「61728÷1500=41余り228」となる。この228に1を加算し、229番目のフォントが選択される。これにより、フォント表から229番目を参照し、実施の例では「かて」と決定される。
次に3フォント目の決定においては、2フォント目と同様に、2フォント目の決定を行う際に、算出された商を3フォント目の種類数で除算を行い、その余りに1を加算をして、フォントを選択する。例では、「41÷1650=0余り41」となる。この41に1を加算し、42番目のフォントが選択される。これにより、フォント表から42番目を参照し、実施の例では「えい」と決定される。この計算は商が0になるまで行われ、計算が1度行われる毎に、フォント表を増やし、平仮名へと変換されるようになっている。
このように、行うことによって、数値列「123456789」から禁止用語を除外した文字列コードとなる「まにかてえい」という平仮名文字列へと変換することができる。数値列では、9桁を使用であったが、同じ数値列を平仮名に変換すると6桁に減らすことが可能であると共に、禁止用語も除外した文字列を生成することが可能である。
図9を用いて、生成された平仮名を再び数値列へと変換する方法を説明する。基本的な条件は、平仮名への生成の場合と同様である。数値列=1番目フォントの余り+1番目フォントの種類×1番目フォントの商。1番目フォントの商=2番目フォントの余り+2番目フォントの種類×2番目フォントの商。2番目フォントの商=3番目フォントの余り+3番目フォントの種類×3番目フォントの商であるから、平仮名を2文字ずつ分解して、最初の2文字を1フォント目表を参照して、何番目であるかを確認する。次の2文字を2フォント目表を参照して何番目であるかを確認する。更に、次の2文字も同様に、確認を行う。
実施の例では、「まに」は790番目であるから、789で、「かて」は229番目であるから、228で、「えい」は、42番目であるから。41と確認できる。また、最後のフォントの商は「0」であるから、数値列は、789+2000×(228+1500×41)で、計算すると「123456789」が導きだせるようになっている。
禁止用語は、様々な文字列であって、放送禁止用語・差別用語・卑猥な用語など、様々な用語である。この禁止用語は、記憶手段に記憶され、禁止用語の追加を随時行うことが可能となっている。また、禁止用語に関しては、上述した用語の他に、「まずい」「おいしくない」などの使用者が不快に思うような言葉も使用される。または、企業名や、有名商標など様々な用語を加えることが可能であり、それらを除外した文字列を生成可能である。
禁止用語を除外した文字列の生成方法の構成について説明する。作表手段は、記憶手段に記憶されている禁止用語から、2文字で構成されたフォント表の作成を行うようになっている。フォント表は、1フォント目の表と2フォント目の表などと順番に生成を行い生成する平仮名の文字列の長さによって、生成される表数が異なるようになっている。
文字列生成手段は、数値列を計算し、作表手段で生成されたフォント表を参照して、計算結果に応じて、対応するフォント表から対応するフォントを決定し、平仮名文字列の生成を行うようになっている。
この方法は、主にコンピュータ上で処理されるようになっているが、電卓や、POSレジシステムなどに組み込みを行い処理するようにしても構わない。
また、禁止用語の増減が行われない場合においては、一度作表されたフォント表に基づいて、変換が行われることによって、より早く処理を行うことが可能となっている。禁止用語の増減が無い場合においては、事前に作表されたフォント表を記憶したROMなどに記憶させることによって、処理能力の低い機械においても生成を容易に行うことができる。
キャンペーンとして商品に少ない桁数で、文字列を表示することができ、生成された文字列に公序良俗となるような文字列の除外や、キャンペーンに不適となるような文字列を除外することが可能となる。例えば、飲食物に添付する際には、公序良俗となる文字列の他に、「まずい」や、「おいしくない」などの禁止用語として加えることにより、これらの文字列が含まれる文字列の生成がされないようにすることができる。
実施の例では、平仮名を例として記載したが、これに限定されることがなく、英語、中国語などの様々な言語に対して使用可能であると共に、近年みられる文字列の組み合わせによって表現される「(^_^)」などの記号の組み合わせや、携帯電話などで使用されている絵文字の組み合わせなどでも使用可能である。
本発明に係る発明に関するフォント表から、2文字の禁止用語を除外した例である。 本発明に係る発明に関するフォント表の作表の流れを表す図である。 本発明に係る発明に関するフォント表の作表の流れを表す図である。 本発明に係る発明に関するフォント表の作表の流れを表すフロー図である。 本発明に係る発明に関する禁止用語が2文字・3文字の場合での除外方法についての手法を示す図である。 本発明に係る発明に関する禁止用語が4文字・5文字の場合での除外方法についての手法を示す図である。 本発明に係る発明に関する数値列より禁止用語を除外した文字列の生成の流れを示す図である。 本発明に係る発明に関する数値列より禁止用語を除外した文字列の生成の流れを示す図である。 本発明に係る発明に関する生成された平仮名を再び数値列へと変換する流れを示す図である。

Claims (1)

  1. 数値情報に基づいて複数の文字からなる文字列コードを生成する生成装置において、
    禁止用語を記憶した記憶手段と、
    二つの文字を組合せした文字列からなる表を複数作成し、前記作成した全ての表から前記記憶手段に記憶さている二文字の禁止用語を除外すると共に、各表の除外されてない文字列を組合せした時に生じる禁止用語を除外する作表手段と、
    前記数値情報を前記表の内の一の表における除外されていない文字列の数で除算すると共に、前記除算の結果に基づいて前記作表手段で作成された前記一の表から、該計算結果で得られた数値に対応したn番目の文字列を抽出し、更に、前記計算結果に基づいて他の表について前記除算を繰り返すと共に、文字列の抽出も繰り返し行い、前記各表から抽出された各文字列を組合せることにより文字列コードを生成する文字列生成手段とを備えたことを特徴とした禁止用語を除外した文字列の生成装置。
JP2003282083A 2003-07-29 2003-07-29 禁止用語を除外した文字列の生成装置 Expired - Fee Related JP4214020B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003282083A JP4214020B2 (ja) 2003-07-29 2003-07-29 禁止用語を除外した文字列の生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003282083A JP4214020B2 (ja) 2003-07-29 2003-07-29 禁止用語を除外した文字列の生成装置

Publications (2)

Publication Number Publication Date
JP2005050167A JP2005050167A (ja) 2005-02-24
JP4214020B2 true JP4214020B2 (ja) 2009-01-28

Family

ID=34267403

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003282083A Expired - Fee Related JP4214020B2 (ja) 2003-07-29 2003-07-29 禁止用語を除外した文字列の生成装置

Country Status (1)

Country Link
JP (1) JP4214020B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006057069A1 (ja) * 2004-11-29 2006-06-01 Global Value Corporation 禁止用語を除外した文字列の生成方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63217418A (ja) * 1987-03-05 1988-09-09 Nec Corp 日本語テキストキ−ワ−ド抽出方式
JPH08153106A (ja) * 1994-11-25 1996-06-11 Dainippon Printing Co Ltd テキストデータ検査システム
JPH11203298A (ja) * 1998-01-08 1999-07-30 Nippon Telegr & Teleph Corp <Ntt> 投稿文字情報事前チェック方法及び装置及び投稿文字情報事前チェックプログラムを格納した記憶媒体
JP2003178057A (ja) * 2001-12-13 2003-06-27 Ntt Data Corp フレーズ生成装置、フレーズ生成方法、及びプログラム

Also Published As

Publication number Publication date
JP2005050167A (ja) 2005-02-24

Similar Documents

Publication Publication Date Title
CA2365473A1 (en) Context sensitive font generation
US20130026240A1 (en) Two-dimensional code, code generation system, program, and printed medium
Standard CS50
Shaker et al. Text steganography using extensions Kashida based on the moon and sun letters concept
JP4214020B2 (ja) 禁止用語を除外した文字列の生成装置
WO2006057069A1 (ja) 禁止用語を除外した文字列の生成方法
NL1009035C2 (nl) Werkwijze voor het coderen van een verplaatsing over een in discrete zones verdeeld oppervlak en inrichting voor het in een binaire code omzetten van een dergelijke verplaatsing.
KR102442109B1 (ko) 타일 소진 미션 게임 시스템
JP3817747B2 (ja) 書体情報設定装置
JP2013218628A (ja) 文字列類似度計算装置、方法、及びプログラム
KR100970901B1 (ko) 결합 테이블을 이용한 한글 문자 출력방법 및 이를 이용한 디바이스장치
KR101365855B1 (ko) 문자를 예측하여 표시하기 위한 동적으로 생성된 키패드
KR101737063B1 (ko) 한글을 이용한 숫자의 카운트 방법
Hendrickson The qrcode package: Quick Response code generation in LATEX
Munzi et al. Increasing the Capacity of Listega Based on Syllable Pattern Using Multicolumn and Bigram Mapping
McGugan Introducing Python
WO2011083384A2 (en) Method and system to create chinese language seeds from most frequently used characters and their applications
Bahls The Mathematical Muse: using math to construct poetry
US20030202269A1 (en) Method for storing or rescuing data or information
JPH0223871B2 (ja)
JP5070872B2 (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
Ferguson et al. Working with Strings
PJBXCYZQ Morse Code
JP2837497B2 (ja) 出力制御装置および出力制御方法
Ðoković Classification of base sequences BS (n+ 1, n)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070913

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080821

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080904

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081031

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

S202 Request for registration of non-exclusive licence

Free format text: JAPANESE INTERMEDIATE CODE: R315201

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

LAPS Cancellation because of no payment of annual fees