JP2007241900A - ネーミングシステム及びネーミング自動化方法 - Google Patents

ネーミングシステム及びネーミング自動化方法 Download PDF

Info

Publication number
JP2007241900A
JP2007241900A JP2006066714A JP2006066714A JP2007241900A JP 2007241900 A JP2007241900 A JP 2007241900A JP 2006066714 A JP2006066714 A JP 2006066714A JP 2006066714 A JP2006066714 A JP 2006066714A JP 2007241900 A JP2007241900 A JP 2007241900A
Authority
JP
Japan
Prior art keywords
naming
evaluation
word
keyword
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006066714A
Other languages
English (en)
Inventor
Atsushi Fujii
敦 藤井
Tetsuya Ishikawa
徹也 石川
Yoko Shibata
容子 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tsukuba NUC
Original Assignee
University of Tsukuba NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Tsukuba NUC filed Critical University of Tsukuba NUC
Priority to JP2006066714A priority Critical patent/JP2007241900A/ja
Publication of JP2007241900A publication Critical patent/JP2007241900A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】ネーミング対象に対してその特徴を簡潔に表すと共に良いイメージを生じさせる等の基本的条件を満たす名称案を自動的に選定してこれに優先順位を付して出力することが可能なネーミングシステムを提供する。
【解決手段】ネーミング対象の少なくともカテゴリ及び特徴テキストの入力を受けて、それに関連する複数の用語、人名、知識又は言葉等の関連用語を出力するデータベースと、前記データベースにアクセスして前記ネーミング対象のカテゴリと特徴テキスト及び前記関連用語に基づいて、当該ネーミング対象に関連する複数のキーワードを収集し作成するキーワード収集手段と、前記複数のキーワードに基づいて前記ネーミング対象の複数のネーミング案を生成するネーミング案生成手段と、予め設定された複数の評価モデルに基づいて前記複数のネーミング案の夫々を評価するネーミング案評価手段と、の各手段を有する。
【選択図】図1

Description

本発明は、商品又はサービス、企業又は団体若しくは施設又はイベント等の事物に対する名前付け(ネーミング)を支援及び自動化するネーミングシステムに関する。
世の中に存在するあらゆる商品又はサービス、個人、企業又は団体若しくは施設又はイベント等の事物にはそれを特定し又は識別するための標識たる何らかの名前を必要とする。商品又はサービス等は、多くの場合その識別名(商標)により、需要者又は取引者により他の商品又はサービスと識別され、当該識別名が繰り返し使用されることにより当該識別名に顧客吸引力や信用を蓄積し経済的価値を具備するようになる。また、このような識別名や名前は、それ自体が人々の口々やマスメディアに乗ることにより大いなる広告宣伝機能を発揮する。
従って、現代の高度に発達した情報化社会においては、事物に対するネーミングは極めて重要である。人々に対して良い印象を形成させるネーミングにより、商品やサービスの売れ行きが大きく増大したりイベント等が成功したりするからである。
このため、ある事物に対してネーミングしようとした場合、そのネーミング対象に付する名前が当該ネーミング対象の特徴を簡潔に示すと共に、親しみ易い、覚え易い、さらには、発音し易く聞き易い等の種々の観点から、なるべく多くの名前候補を選定し又は創作して、その中から最適な名前を選定する煩雑な作業が行われている。
一方、このような従来のネーミングに係る煩雑な作業を少しでも軽減するべくコンピュータを利用したネーミング発想支援システムが提案されている。特開平5−282357号公報は、事物の概念とこれに関連する1又は2以上の概念を結合した式を用いて、事物の命名例を保存する保存手段を有し、各命名例は、各事物の特徴に関する1又は2以上の保存特徴式と、その事物の名称に関する1又は2以上の保存名称式から構成され、各名称に関する少なくとも1の保存名称式は、その名称が由来する保存特徴式中の少なくとも1のキー概念を含み、ネーミングする事物の特徴に関する1又は2以上の対象特徴式を入力する入力手段と、対象特徴式の全部又は一部が、保存特徴式中の概念を含む対応式となる類似例を検索する検索手段と、類似例の保存名称式のキー概念を、対応式中でこれに対応する対応概念に置き換えた、対象名称式を呈示する呈示手段とを有するネーミング発想支援システムを開示している。
また、特開2000−76222号公報、特開2003−58178号公報及び特開2003−122390号公報は、所望のイメージに合致した音自体、音が持つ表情である音相、又は音相理論に基づいて人名、商品名等の名称を自動的に抽出する名称抽出装置を開示している。
特開平5−282357号公報 特開2000−76222号公報 特開2003−58178号公報 特開2003−122390号公報
このような従来のコンピュータを利用したネーミング支援システムの多くは、ネーミングの対象となる事物のキー概念に基づいて、従来において当該事物に付された多くの命名例類似のものを検索し出力するものであることから、結局は当該システムを操作する操作者の能力や手法に大きく依存している。また、このような従来のネーミング支援システムにおいては、従来の命名例の中からキー概念に基づいて類似のものを抽出するようにしていることから、これによって抽出される名称案は、従来の命名例の枠内に限定されてしまい、斬新で新鮮なイメージを生じさせるネーミングを行うことは困難であった。
また、ネーミングは、これに接する人々に概念等の多様なイメージを生じさせることから、音又は音相等の聴覚イメージのみをベースにしてネーミングをしても、総合的に優れたネーミングは困難であった。
本発明は、操作者の能力に依存することなく当該事物のネーミング例に拘束されることなく、ネーミング対象に対してその特徴を簡潔に表すと共に良いイメージを生じさせる名称であって、覚え易い、発音し易い、聞き易い等の基本的条件を満たす名称案を自動的に選定してこれに優先順位を付して出力することを可能とするネーミングシステムを提供することを目的とする。
このため、本発明は、商品又はサービス、企業又は団体若しくは施設又はイベント等のあらゆる事物のネーミングを支援及び自動化するネーミングシステムであって、ネーミング対象の少なくともカテゴリ及び特徴テキストを含む複数のデータ項目をそのデータ項目毎に分類してこれを格納しておく格納手段と、前記ネーミング対象の少なくとも前記カテゴリ及び特徴テキストの入力を受けて、それに関連する複数の用語、人名、知識又は言葉等の関連用語を出力するデータベースと、前記データベースにアクセスして前記ネーミング対象のカテゴリと特徴テキスト及び前記関連用語に基づいて、当該ネーミング対象に関連する複数のキーワードを収集し作成するキーワード収集手段と、前記複数のキーワードに基づいて前記ネーミング対象の複数のネーミング案を生成するネーミング案生成手段と、予め設定された複数の評価モデルに基づいて前記複数のネーミング案の夫々を評価するネーミング案評価手段と、の各手段を有することを特徴とするネーミングシステムを提供するものである。
このように本発明のネーミングシステムにおいては、ネーミング対象の多くの関連用語から先ずキーワード群を生成し、このキーワード群から複数のネーミング案を生成させるようにしているので、ネーミング案の特徴を簡潔に暗示しつつ斬新で新規なネーミング案の生成を可能にしたのである。
そして、前記データベースは、インターネットに接続されたウェブサーバと当該ウェブサーバと連携するデータベースサーバとにより構成され、前記データベースサーバは、インターネットウェブ上に用いられている前記関連用語を累積的に記憶する。これにより、ネーミング対象に係る関連用語をより多く収集可能にしたのである。
また、前記キーワード収集手段は、日本語による前記関連用語を英語及び他の周知の外国語に翻訳する翻訳手段を備えようにする。これにより、データ入力時に日本語を英訳して入力する煩雑性を軽減すると共に、日本語の枠にとらわれない英語及び周知の外国語のキーワードを収集することを可能にしたのである。
ところで、前記キーワード収集手段は、前記ネーミング対象のカテゴリに基づいて第1次キーワード群を収集し、当該第1次キーワード群を構成する各キーワードの概念に基づいて拡張された概念に係る第2次キーワード群を収集し、前記前記第1次キーワード群及び前記第2次キーワード群の中から、当該ネーミング対象に係る前記複数のキーワードを収集するようにしたので、ネーミング対象の単一のカテゴリにとらわれず、拡張された概念に係るキーワード群を収集することを可能にしたのである。
さらに、前記ネーミング案生成手段は、前記ネーミング対象に関連する複数のフレーズを生成するフレーズ生成手段と生成された前記複数のフレーズの頭字語を生成する頭字語生成手段とを含む。これにより、ネーミング対象に関連するフレーズの頭字語に係る多くのネーミング案を生成して、これをネーミング案の対象にしたのである。このため、前記複数のデータ項目は、前記ネーミング対象が属するカテゴリ及び前記ネーミング対象の特徴を記載した特徴テキストの他に、ネーミング対象のイメージを規定するイメージキーワードに関する項目と前記頭字語の形式を規定する項目とを含むようにする。
そして、前記ネーミング案評価手段における前記複数の評価モデルは、前記イメージキーワードが有する印象の観点に基づいて評価する印象評価モデルと、前記頭字語の発音の観点に基づいて評価する発音評価モデルと、前記頭字語が単語を形成する場合、当該単語の観点に基づいて評価する単語評価モデルと、前記フレーズがある意義を生じさせる場合に、当該フレーズの意義の観点に基づいて評価するフレーズ評価モデルと、前記フレーズがある意義を生じさせる場合に、ネーミング対象の特徴を表す程度を評価するコンセプト評価モデルと、の各評価モデルの中の何れか一つ又は複数の評価モデルにより構成することにより、印象性に優れ、言い易い、聞き易い及び覚え易い等のネーミングの基礎的基準を総合的に満足するネーミング案の絞込みを可能にしたのである。
ここで、前記ネーミング案評価手段は、前記複数の評価モデルにおいてスコアリングされたポイントの総合ポイントに基づいて前記複数のネーミング案の夫々を評価することにより、従来のコンピュータを利用したネーミング支援システムを超えて、ネーミングを自動化するシステムを実現したのである。
本発明は、さらに、商品又はサービス、企業又は団体若しくは施設又はイベント等のあらゆる事物に対するネーミングを自動化する方法であって、(a)ネーミング対象の少なくともカテゴリ及び特徴テキストを含む複数のデータ項目をそのデータ項目毎に分類してこれを予め格納しておくステップと、(b)前記ネーミング対象の少なくとも前記カテゴリ及び特徴テキストの入力を受けて、それに関連する複数の用語、人名、知識又は言葉等(以下、「関連用語」という)を出力するステップと、(c)前記データベースにアクセスして前記ネーミング対象のカテゴリと特徴テキスト及び前記関連用語に基づいて、当該ネーミング対象に関連する複数のキーワードを収集し作成するステップと、(d)前記複数のキーワードに基づいて前記ネーミング対象の複数のネーミング案を生成するステップと、(e)予め設定された複数の評価モデルに基づいて前記複数のネーミング案の夫々を評価するステップと、の各ステップを有することを特徴とするネーミング自動化方法を提供するものである。
このように、本発明においては、ネーミング対象の多くの関連用語から先ずキーワード群を生成し、このキーワード群から複数のネーミング案を生成させるようにしているので、ネーミング案の特徴を簡潔に暗示しつつ斬新で新規なネーミング案の生成を可能にしたと共に、ネーミング対象に係る関連用語をより多く収集可能にしたのである。
そして、ネーミング対象の拡張された概念に基づいて収集された多くのネーミング案を複数の評価モデルにより評価するようにしたことから、ネーミング対象の特徴を良く表し、印象性に優れ、言い易い、聞き易い及び覚え易い等のネーミングの基礎的基準を総合的に満足するネーミング案の絞込みを可能にし、この複数の評価モデルにおいてスコアリングされたポイントの総合ポイントに基づいて前記複数のネーミング案の夫々を評価することにより、従来のコンピュータを利用したネーミング支援システムを超えて、ネーミングを自動化するシステムを実現したのである。
以下、本発明に係るネーミングシステム及びネーミング自動化方法の詳細について説明する。
図1は、本発明のネーミングシステム10の構成機能ブロック図を示すものである。図1に示すように、本発明のネーミングシステム10は、ネーミング対象の少なくともカテゴリ及び特徴テキストを含む複数のデータ項目をそのデータ項目毎に分類してこれを予め格納しておく格納手段19を備える。本システムを構成するデータベースは、データベースサーバ15、ウェブサーバ16及びディスク装置による種々のデータ記憶部19乃至23及び25とにより構成される。
尚、図1に示したファイヤーウォール18は、WWWインターネット24からの不正な侵入を防ぐためのものである。また、データベースサーバ15又はウェブサーバ16は夫々、ベータベース管理システム(DBMS)を有し、当該DBMSの制御下において、所定の検索言語(例えばSQL)によりデータ要素が格納され、検索され加工されて出力されるのである。
データ記憶部19は、キーボード等の入力手段により入力されるネーミング対象のカテゴリと特徴テキスト等の入力データに基づいてデータベースサーバ14がアクセスする、関連する複数の用語、人名、知識又は言葉等の関連用語を格納する記憶装置である。そして、本ネーミングシステム10は、データベースにアクセスして入力されたネーミング対象のカテゴリと特徴テキスト、及び前記関連用語に基づいて、当該ネーミング対象に関連する複数のキーワードを収集し作成するキーワード収集手段12、前記複数のキーワードに基づいて前記ネーミング対象の複数のネーミング案を生成するネーミング案生成手段13及び予め設定された複数の評価モデルに基づいて前記複数のネーミング案の夫々を評価するネーミング案評価手段14を有する。
上述したように、本ネーミングシステム10におけるデータベースは、インターネットに接続されたウェブサーバ16を含む。これにより、インターネットウェブ24上に用いられているネーミング対象の関連用語を広く収集しておくことができる。
キーワード収集手段12は、日本語による前記関連用語を英語及び他の周知の外国語に翻訳する翻訳手段を備えるとよい。例えば、英語のみならず、化粧品等の名称は、フランス語的な語感を生じさせる用語、医薬品等の名称は、ドイツ語的な語感を生じさせる用語を収集することができる。
ネーミング案生成手段13は、ネーミング対象に関連する複数のフレーズを生成するフレーズ生成手段とこれによって生成された複数のフレーズの頭字語を生成する頭字語生成手段を有する。
そして、ネーミング案評価手段14は、イメージキーワードが有する印象の観点に基づいて評価する印象評価モデル、前記頭字語の発音の観点に基づいて評価する発音評価モデル、前記頭字語が単語を形成する場合、当該単語の観点に基づいて評価する単語評価モデル、前記フレーズがある意義を生じさせる場合に当該フレーズの意義の観点に基づいて評価するフレーズ評価モデル、フレーズがある意義を生じさせる場合にネーミング対象の特徴を表す程度を評価するコンセプト評価モデル等の複数の評価モデルに基づいてネーミング案を評価するのである。ここで、ネーミング案の評価は、これらの複数の評価モデルにおいてスコアリングされたポイントの総合ポイントに基づいて評価することにより、優先順位を付けることを可能としているのである。
図2は、本ネーミングシステムにおけるデータの入力からネーミング案の出力に至る処理フローの全体構成であって、頭字語ネーミングのシステム構成の例を示すものである。ここでは、頭字語による造語手法によってネーミング案を作成し、当該ネーミング案の妥当性を評価している。
本ネーミングシステムにおけるネーミング案の評価では、「フレーズ」に対して、「文法的正しさ」と「情報の凝縮」という観点に基づいて妥当性を定量化する。
「頭字語」に対して、「響きの良さ」、「読みやすさ」、「覚えやすさ」という観点に基づいて妥当性を定量化する。
「識別性の良さ」は、既存の商品名などを登録したデータベースが必要になるため本ネーミングシステムでは対象としない。「視覚的な明快さ」は、「覚えやすさ」について検討する上で参考にした。
フレーズに関する観点の「文法的正しさ」と「情報の凝縮」について評価するモデルを「フレーズモデル」と呼ぶ。頭字語の評価モデルについて、「響きの良さ」に関する観点は「音素の持つイメージの良さ」を定量化することから「印象モデル」と呼ぶ。読みやすさに関するモデルを「発音モデル」と呼び、覚えやすさに関するモデルを「単語モデル」と呼ぶ。
図2は、提案したモデルを計算機上のシステムとして実装する場合の構成を示す。以下、図2に基づいて処理手順を説明する。
まず、ネーミング対象の特性を記述したテキストを入力する。具体的には、「特徴テキスト」、「カテゴリ」、「イメージキーワード」、「頭字語の形式」の4つを入力とする。
「特徴テキスト」はネーミング対象の特徴を英語か日本語で記述したテキストである。「カテゴリ」として、5種類の対象カテゴリ(表1)の中から、ネーミング対象に相応しいカテゴリを指定する。「イメージキーワード」として、13のイメージキーワードから名前に反映させたいイメージキーワードを指定する。「カテゴリ」と「イメージキーワード」は人手によるネーミングにおける「ネーミングコンセプト」である。
「頭字語の形式」として、頭字語が既存の語になるべきかどうかを指定する。さらに頭字語のアルファベットを、「一文字ずつ読む」か「綴り読みをする」のどちらかを指定する。「頭字語の形式」は、人手によるネーミングではユーザが考える必要はない。しかし、本システムではユーザが指定できるようにした。特徴テキストは入力として必須であり、それ以外の入力は任意である。本システムの出力はネーミング案の順位付リストである。
以下、提案モデルの各部について説明する。
図3は、「キーワード収集部」の構成を示す。「キーワード抽出」では、特徴テキストからキーワードとして用いない不要語を削除し、活用形を原形に復元するなどの語尾処理を行いながらキーワードを抽出する。また、「カテゴリ」によってネーミング対象に相応しいキーワードを追加する。抽出したキーワード群とカテゴリによって追加されたキーワード群を「一次キーワード群」とする。「キーワード拡張」では、同義語データベースを用いて一次キーワード群の各キーワードについて同義語を検索し、キーワードとする。これらを「二次キーワード群」として使用する。
図4は、「ネーミング案生成部」の構成を示す。「フレーズ生成」では、一次キーワード群と二次キーワード群を用いて、3〜5個のキーワードによる順列をフレーズとして生成する。「頭字語生成」で各フレーズについて、そのフレーズの各単語の頭文字を抽出して頭字語を生成する。
図5は、「ネーミング案評価部」の構成を示す。ネーミング案の評価部では、ネーミング案のフレーズに「フレーズモデル」と「コンセプトモデル」を用いてスコアを付け、頭字語に「印象モデル」、「発音モデル」、「記憶モデル」を用いてスコアを付ける。
各モデルで計算されるスコアは全て0以上1以下の連続値をとる。これら5つのスコアを掛け合わせて、各ネーミング案のスコアを計算する。なお、モデルの重要度に応じて、各モデルで計算されるスコアの重みを変更することもできる。
スコアによってネーミング案をソートし、ユーザが最初に指定した「イメージキーワード」と「頭字語の形式」に合ったネーミング案を上位から順番に提示する。
A.キーワード収集部12の説明
(1)キーワード抽出
まず、ユーザが入力した特徴テキストから、造語に用いるキーワードを抽出する。特徴テキストが日本語の場合は既存の機械翻訳システムを用いて英語に翻訳する、特徴テキストが英語の場合はそのまま用いる。
本システムでは、単語の原形と活用形の対応を示した「原形辞書」、冠詞、代名詞、数詞、接続詞などの「不要語リスト」、単語と品詞の対応を示した「品詞辞書」、単語からその語の同義語を引くことが出来る「同義語辞書」を用いる。以上のデータはWordNet(http://wordnet.princeton.edu/)から収集した。ここで、WordNetとは、電子化された英語のシソーラスであり、単語155,327件、同義語のグループ(synset)117,597件、単語と概念の組を207,016件収録が収録されている。
英語には「文頭の語の頭文字が大文字になる」、「分かち書きをする」、「文の切れ目に記号を挿入する」など表記上の規則がある。また、文脈にあわせて単語は活用する。そこで、キーワード抽出のために、特徴テキストから「,」、「.」、「:」、「?」、「!」といった記号を削除し、大文字から小文字へ変換する。空白によって特徴テキストを単語に分割し、原形辞書を用いて活用形・複数形を原形に復元する。
ここで、冠詞、数詞、代名詞、接続詞などはネーミング対象の特徴を表す語として使用される可能性が低いことから、不要語リストを用いて削除する。また、「名詞」はネーミング対象そのものを、「形容詞」と「副詞」はネーミング対象の特徴を表す語として用いられることが多いことから、名詞、形容詞、副詞をキーワード収集の対象とする。そこで、品詞辞書を用いて名詞、形容詞、副詞を抽出する。以上の処理で抽出された単語の集合を「一次キーワード群」とする。また、ユーザが指定した「カテゴリ」に登録されているキーワード(表1)を一次キーワード群に追加する。
Figure 2007241900
表1の「フレーズ末の語」は、既存の頭字語を「組織、団体」、「会議」、「学会」、「活動、運動」のカテゴリに分け、各カテゴリに分類された頭字語と対になるフレーズのフレーズ末に頻出する単語を人手によって収集した結果である。
一次キーワード群の各単語に対して、品詞、特徴テキスト内における出現頻度に関するタグを自動的に付与する。品詞はフレーズ生成において品詞の並びが文法的に不適切なフレーズを排除するために用いる。特徴テキスト内における出現頻度はフレーズモデルにおいてフレーズがネーミング対象をどれだけ反映しているかを判断する際に用いる。
(2)キーワード拡張
一次キーワード群の各単語に関して、同義語辞書から同義語を検索し、一次キーワードと重複しない単語の集合を「二次キーワード群」とする。WordNetでは同義語のグループを「synset」として体系化している。WordNetの同義語辞書では複数のsynsetに属する単語について、その語から各synsetへの参照が示されている。複数のsynsetに属する単語は、複数の意味を持つ多義語である。そこで、特徴テキストにおいて多義語がどのような意味で使われているのかを特定する必要がある。この処理を「多義性解消(Word Sense Disambiguation)」と呼ぶ。本来は本システムにおいて多義性解消が必要である。しかし、多義性解消の精度は100%でないため、本システムでは使用しない。その代わりに、N個の意味を持つ単語の各意味は等確率で使用されると仮定する。すなわち、多義語から二次キーワードを拡張する場合は、各sysnsetの出現確率を1/Nとする。
英語で記述された「ポカリスエット」(登録商標)の紹介文(http://www.otsuka.co.jp/;図6)を特徴テキストとした場合について、キーワード収集結果の一部を表2に示す。
Figure 2007241900
表2では、「amount」、「average」、「component」などの一次キーワードについて同義語による二次キーワードが追加されている。例えば、「amount」は4つのsynsetに属していることから、「amount」から拡張された各二次キーワードの出現確率は、拡張元の単語である「amount」の出現確率の1/4となっている。
B.ネーミング案生成部13の説明
(1)フレーズ生成
一次キーワード群と二次キーワード群を用いて、3〜5語の順列によってフレーズを生成する。フレーズ生成の際に、各キーワードに付与された品詞タグを参照して、文法的に不適な語の並びを削除する。複数の品詞を持つ多品詞キーワードの場合は、禁止する並びに当てはまらない品詞が1つでもあればよい。キーワード収集の対象にしたのは名詞、形容詞、副詞の3つである。例えば、副詞「sweetly(魅惑的に)」、形容詞「operatic(オペラ風の)」、名詞「mood(雰囲気)」の3語があった場合、これらの語順について不適切な語順は以下の場合である。
・副詞、名詞の語順になる場合
「operatic sweetly mood」、「sweetly mood operatic」
・副詞がフレーズ末になる場合
「operatic mood sweetly」、「mood operatic sweetly」
・形容詞がフレーズ末になる場合
「mood sweetly operatic」、「sweetly mood operatic」
それぞれ下線部が文法的に不適切であり、この3語の場合、適切な語順は「sweetly operatic mood(魅惑的にオペラ風の雰囲気)」だけである。
(3)頭字語生成
生成された各フレーズから頭字語を生成する。フレーズが3〜5語で構成されていることから、頭字語は3〜5文字の文字列となる。頭字語の形式には以下に示すような種類がある。
1.既存の語と表記も発音も同じ
例:Web-based Inquiry Science Environment → WISE(ワイズ)
2.既存の語と表記は同じで、アルファベットを一文字ずつ読む
例:World Health Organization → WHO(ダブリューエイチオー)
3.既存の語ではなく、アルファベットを一文字ずつ読む
例:Japan Railways → JR(ジェイアール)
4.既存の語ではなく、単語として綴り読みをする
例:Japan Air Lines → JAL(ジャル)
5.頭文字以外の文字で構成する
例:eXtensible Markup Language → XML
6.単語の先頭から二文字以上を用いる
例:Automated MEteorological Data Acquisition System → AMEDAS
7.文字の繰り返しを数字で表記する
例:World Wide Web Consortium → W3C
本ネーミングシステムでは、「2.既存の語と表記は同じで、アルファベットを一文字ずつ読む」、「3.既存の語ではなく、アルファベットを一文字ずつ読む」、「4.既存の語ではなく、単語として綴り読みをする」、「5.頭文字以外の文字で構成する」を対象とする。
対象としない形式について、「1.既存の語と表記も発音も同じ」は既存の語の発音に関するデータが必要になるため扱わない。「7.単語の先頭から二文字以上を用いる」と「6.文字の繰り返しを数字で表記する」は、ネーミング案の数が多くなりすぎるため、対象外とした。
「5.頭文字以外の文字で構成する」は頭字語の生成方法に特徴がある。「5.頭文字以外の一文字をとる」に関して、「exciting」や「extensible」など「ex」で始まる語を含むフレーズについては、頭文字の「e」を用いた頭字語と先頭から二番目の文字である「x」を用いた頭字語を生成する。そこで、「ex」で始まる語を含むフレーズには二種類の頭字語が生成される。例えば、「Extensible Markup Language」というフレーズについて、「extensible」から頭文字の「e」をとった「EML」と、先頭から二番目の文字である「x」をとった「XML」という頭字語が生成される。
また、「2.既存の語と表記は同じで、アルファベットを一文字ずつ読む」、「3.既存の語ではなく、アルファベットを一文字ずつ読む」、「4.既存の語ではなく、単語として綴り読みをする」に関して、1つの頭字語に二通りの読みを付与する。まず、1.と2.は「A」を「エー」、「X」を「エックス」のように、アルファベットを一文字ずつ読む場合である。この読みを以降で「アルファベット読み」とし、生成された頭字語に、読みをヘボン式ローマ字で綴った「音素綴り」を表3に従って付与する。
Figure 2007241900
次に、「4.既存の語ではなく、単語として綴り読みをする」は、「PA」を「パ」、「fa」を「ファ」のように「綴り読み」する場合である。生成された頭字語が綴り読み可能かどうか、頭字語の先頭から表4〜表6内に一致する頭字語綴りがあるかどうかを確認する。全体が綴り読み可能な頭字語に対しては、読みをヘボン式ローマ字で綴った「音素綴り」を各表に従って付与する。頭字語末の文字のみ綴り読みできない場合は、「d」を「ド」、「r」を「ル」のように読み替えて読みを付与する。このように読み替えが必要な綴りを「不完全な綴り」と呼び、表7に従って読み替える。
Figure 2007241900
Figure 2007241900
Figure 2007241900
Figure 2007241900
「ポカリスエット」(登録商標)紹介文を特徴テキストとした場合について、ネーミング案としてフレーズ、頭字語を生成した結果の一部を、表8に示す。
Figure 2007241900
C.ネーミング案評価部14の説明
(1)フレーズモデル
フレーズの評価に用いる観点は「文法的な正しさ」と「情報の凝縮」である。「文法的な正しさ」は文法規則によって検査しているので、ここではNグラムモデルを用いたフレーズの生起確率によるスコア付けを行う。Nグラムモデルとは確率的言語モデルで、ある単語の生起確率が直前のN個にある単語にのみ依存する言語モデルである。具体的には単語列(数1)
Figure 2007241900
に対し、その生起確率(数2)
Figure 2007241900
を数3で計算する。
Figure 2007241900
通常はN=3とした単語のトライグラムモデルを用いる。単語のトライグラムモデルはNTCLRテストコレクションの英語論文抄録32万件から、高頻度語10万語を用いて学習した。
提案モデルによって生成されるネーミング案はキーワード数の増加に伴って組合せ的に増加する。そのため処理時間が非常に大きくなる。そこでフレーズ案の「枝刈り」を行う。具体的には、予備実験を通して閾値を経験的に設定し、閾値を下回るスコアを持つフレーズを削除する。表9に実行環境と「枝刈り有り」、「枝刈り無し」のそれぞれの場合について生成されたキーワード数、フレーズ数、頭字語数、実行時間を示す。この例では、枝刈りによって、実行時間が7時間23分から21分に短縮された。
Figure 2007241900
「ポカリスエット」の紹介文を特徴テキストとして生成したネーミング案のフレーズに対し、フレーズモデルによるスコア付けを行った結果を表10に示す。指定したカテゴリは「飲み物」である。
Figure 2007241900
(2)コンセプトモデル
「ネーミング対象の特徴を表すかどうか」を評価するために、特徴テキストを用いてフレーズの生起確率を計算する。各フレーズ構成語の特徴テキストにおける生起確率を掛け合わせた値をフレーズの生起確率とする。数5によってフレーズ(数4)
Figure 2007241900
の生起確率を計算する。
Figure 2007241900
また、ユーザが任意で指定できる項目として「優先したい語」と「重要度」がある。例えば、「wを優先、重要度を3倍」と指定した場合は、wの出現頻度を3倍してP(w)を求める。
また、ネーミング対象のカテゴリを指定することができる。そのカテゴリに相応しいフレーズパターンと一致しているかどうかを検査し、一致した場合は1、一致しない場合は0.5をフレーズの生起確率に掛ける。カテゴリとフレーズパターンの対応を表1に示す。
(3)印象モデル
印象モデルは、頭字語の評価における「響きの良さ」という観点をモデル化する。本ネーミングシステムでは「音の持つイメージの良さ」に限定して、母音・子音などの音素とイメージキーワードの対応表(表11と表12)を用いる(非特許文献1)。本ネーミングシステムで用いる「イメージキーワード」とは「明るい」、「強い」、「大きい」、「重い」、「軽い」、「鋭い」、「柔らかい」、「元気」、「男性的」、「女性的」、「格調ある」、「知的」、「情感ある」の13イメージキーワードである。
Figure 2007241900
Figure 2007241900
表11と表12において、行が音素、列がイメージキーワードを表している。母音の対応表(表11)にあるイメージキーワード「格調ある」、「知的」、「情感ある」は子音の対応表にはなく、子音の対応表(表12)にあるイメージキーワード「元気」、「男性的」、「女性的」は母音の対応表にはない。しかし、これらの表はネーミングに携わる専門家によって経験的に導き出された知識である。そこで、この表を信頼して、空欄はそのままにした。
例えば、「GIGA」という文字列を綴り読みすると「ギガ」となり、音素綴りは「giga」である。「giga」について「重い」というイメージのスコアを求める場合、音素ごとに「重い」というイメージ列のスコアを参照し、全ての音素のスコアを足す。このスコアを「giga」の音素数4で割った値をイメージスコアとする。
表13に7つの文字列をそれぞれ綴り読みをした場合の音素綴りについて、「明るい」、「強い」、「重い」、「軽い」というイメージスコアをそれぞれ求めた結果を示す。これらの中では、「明るい」イメージを求めるなら「PETA(peta)」、「重い」イメージを求めるなら「GIGA(giga)」、「軽い」イメージを求めるなら「PICO(piko)」が優先される。
Figure 2007241900
(4)発音モデル
発音モデルは、頭字語の「呼びやすさ」をモデル化する。筆者が知る限り「呼びやすさ」の度合いを数値的に測ることを試みた先行研究はない。
本ネーミングシステムではNグラムモデルを用いた音素の生起確率による「呼びやすさ」の評価方法を提案する。具体的には、ローマ字表記のカタカナ語110,521語を用いて学習した音素のトライグラムモデルを作成した。カタカナ語を用いる理由は、源言語の発音を簡略化したカタカナのまま日本語に移入された語に頻出する音素配列は発音しやすいという仮説に基づいている。
発音モデルが評価対象とするのは、頭字語に付与した、「アルファベット読み」と「綴り読み」の音素綴りである。発音モデルによるスコア付けを行った結果を表14に示す。
Figure 2007241900
(5)単語モデル
単語モデルは、頭字語の評価における「覚えやすさ」という観点をモデル化する。本ネーミングシステムでは「覚えやすい語」を「既存の語または既存の語と類似する語」と定義した。これは、「有意味語は無意味語より記憶に残りやすい」という仮定に基づいている。そこで、WordNetを有意味語の知識ベースとして、頭字語の既存の語との一致を真(1)又は偽(0)でスコア付けする。ただし、既存の頭字語(図7)は既存の語として扱わない。既存の語との一致や類似を用いる利点は、頭字語にフレーズの省略形として以上の意味を込めることができることである。それに対して、既存の頭字語と一致しても、新たな頭字語としての面白みに欠ける。
図7は、WordNetの同義語リストから「大文字のみで表記されている」かつ「小文字表記で同綴りの語が存在しない」頭字語を抽出した結果である。
また、頭字語が既存の語と一致しない場合は既存の語との類似度を計算する。頭字語と既存の語との類似度計算には既存の検索モデルを用い、検索によって得られた最も高い類似度を頭字語のスコアとする。頭字語がどの語と類似したかは考慮しない。頭字語を検索質問(クエリ)として、Nグラム検索によって既存の単語集合から類似する単語を検索する。Nグラム検索では2つの文字列をN文字単位で比較し類似度を求める。本ネーミングシステムではN=2とする。検索モデルとしてOkapi BM 25(非特許文献2)を使用する。
具体的には、既存の語をバイグラムに分割し、索引付けしておく。そこで、例えば、索引「mi」によって「mild」や「academic」を検索することができる。「esthis」に類似する既存の語を検索する場合、「es」、「st」、「th」、「hi」の様な索引によって類似する語候補を検索し、バイグラムの一致数による類似度が計算される。また、文字列の長さによって類似度を正規化することで、より文字数差の少ない既存の語との類似度を高くする。
単語モデルによって「既存の語との一致と類似」を判定した結果を表15に示す。
Figure 2007241900
D.本ネーミングシステムの実行例の説明
(1)英語で記述された特徴テキストの場合
「WHO:World Health Organization」の説明文(http://www.who.int/en/;図8)を特徴テキストとした場合の実行結果を示す。
ネーミング対象のカテゴリは「組織」、イメージキーワードは「大きい」、頭字語の形式は「既存の語」と「アルファベット読み」とした。表16はキーワード抽出、ネーミング案生成結果によって得られたキーワード、フレーズ、頭字語の件数である。得られたネーミング案の順位付リスト上位20件を表17に示す。
Figure 2007241900
Figure 2007241900
「main objective organization:MOO(メイン 目的 組織:「モー」 牛の鳴き声)」、「world health
organization:WHO(世界 健康 組織:誰)」、「level established organization:LEO(レベル 確立された 組織:獅子座)」のように、フレーズと頭字語の両方に意味のあるネーミング案が上位にある。
20位以内には入らなかったネーミング案について、123位に「state level objective policy:SLOP(状態 レベル 目的 方針:汚水)」や、206位「main
object disease:MOD(メイン 目的 病気:前衛的な)」と言ったネーミング案がある。4位は「world health organization:WHO」に実際の名称と一致している。
(2)日本語で記述された特徴テキストの場合
日本語で記述された「エネルゲン(登録商標)」(http://www.otsuka.co.jp/)の説明文(図9)を特徴テキストとする場合について実行結果を示す。特徴テキストをPAT−Transer(http://www.crosslanguage.co.jp/)を用いて英語に機械翻訳した結果は図10である。「エネルゲン」という固有名詞は辞書に登録されておらず、そのため翻訳されなかった。ネーミング対象のカテゴリは「食品(飲み物)」、イメージキーワードは「元気」と「軽い」、頭字語の形式は「既存の語でない」と「綴り読み」とした。表18はキーワード抽出、ネーミング案生成結果によって得られたキーワード、フレーズ、頭字語の件数である。得られたネーミング案の順位付リスト上位20件を表19に示す。
Figure 2007241900
Figure 2007241900
「water」で終わるフレーズが上位20件中2件、「drink」で終わるフレーズは0件などネーミング対象のカテゴリが反映されていない。13位の「energy efficiency
water:EEW(エネルギー 効率 水:意味無し)」というフレーズは特徴テキスト(図9)に記述されたネーミング対象の特徴をよく表している。頭字語に意味はない。20位以内に出現しなかったネーミング案については、155位に「purpose
energy efficiency electrolyte:PEEE(目的 エネルギー 効率 電解質:意味無し)」の様なフレーズが生成された。頭字語に意味はない。
E.本ネーミングシステムの評価実験
以下、本ネーミングシステムにおける発音モデルと単語モデルの評価実験について説明する。
(1)発音モデルの評価実験
a)実験方法
発音モデルは対象文字列の音素綴りに対して、音素のトライグラムモデルによって「呼びやすさ」を定量化する。発音モデルの評価実験では、発音モデルが呼びやすい音素配列を人間と同じように判定できるかどうかを検証した。
実験には被験者を用いて、アルファベットの文字列に付与した「読み」に対してその読みやすさを判定した。被験者は日本語を母語とする大学院生2名である。この2名に対し同一のデータを与えた。
実験に用いるデータとして、アルファベット26文字をランダムに3〜5文字組み合わせた文字列を作成し、各文字列にカタカナ表記のアルファベット読みを付与した。この読みに対して被験者が「呼びやすさ」を判定した。各文字数につき同数のデータを得ることで、文字数による判定結果の比較を行った。
被験者は、各文字列の読みを音読し、呼びやすいかどうかを判定した。判定は「呼びやすい」、「やや呼びやすい」、「呼びにくい」の3段階である。
被験者が判定した同一のデータについて、発音モデルを用いてスコアを付け、スコアの降順でソートして順位を付けた。モデルの判定対象は被験者が判定した読みの音素綴りである。表20に実際に使用したデータの一部を示す。
Figure 2007241900
表20における「V」と「Z」の読みと音素綴りが、それぞれ「ブイ(bui)」と「ゼット(zetto)」となっており、表3の「ヴィー(bii)」「ズィー(zuii)」とは異なっている。これは、発音モデルの被験者からの意見を取り入れ、実験後に変更したからである。ただし、被験者が「ゼット」という読みで判定し、モデルが「zetto」という音素綴りで判定している限り、読みと音素綴りの対応関係に変化はなく、この変更は評価実験結果には影響しない。
b)実験結果
2名の被験者をそれぞれ被験者A、被験者Bとし、各被験者の実験結果に関するグラフを図11と図12に示す。各被験者につき、8つの観点でグラフを作成した。左側のグラフは、モデル適用前の結果である。上から、全文字数、3文字の文字列、4文字の文字列、5文字の文字列に対する結果である。右側のグラフは、発音モデルを適用して文字列をソートした結果である。左右で隣に並んでいる同士のグラフは同じデータに関するモデル適用前と適用後の結果を表している。
3〜5文字を総合した結果を見ると、どちらの被験者の場合も上位に行くほど「呼びやすい」という判定が多くなった。この傾向は、被験者Bにおいて顕著であった。
各被験者の文字数ごとの結果を比較すると、3文字の場合には「呼びやすい」の判定が多く、5文字の場合には「呼びにくい」の判定が多いことがわかる。しかし、同一文字数における判定の分布は、モデル適用前に比べると上位に行くほど「呼びやすい」が多くなった。
以上の結果から、音素トライグラムに基づく発音モデルは、「呼びにくい」文字列よりも「呼びやすい」文字列を上位にソートすることが分かった。すなわち、本ネーミングシステムで提案した発音モデルの有効性が確認された。
(2)単語モデルの評価実験
a)実験方法
単語モデルの評価実験では、有意味語と無意味語の違いが人間の記憶に与える影響について、被験者を用いた認知心理学的手法で実験する。
認知心理学的手法とは、「覚える材料(刺激)を学習して覚え(記銘)、そしてそれらを一定の時間覚えておき(保持)、後に記憶テストを行って刺激を思い出す(再生)」という手法である。
本ネーミングシステムの単語モデルは、「有意味語は無意味語より記憶に残りやすい」という仮説に基づいている。そこで、無意味語と有意味語が記憶に与える影響を比較する必要がある。日本語を母語とする被験者を対象として英語の有意味語と無意味語を比較した研究は無い。Gathercole(非特許文献3)は、英語における「無意味語」と「有意味語らしい言葉(有意味語に似ている無意味語)」を音声言語として聞かせることで、人間の記憶に関する実験を行った。しかし、被験者は英語を母語とする児童であり、単語を目で見た場合の記憶については実験していない。そこで、今回新たに実験方法を提案し、単語モデルの評価に用いた。
アルファベット大文字表記による3文字または4文字で構成された「綴り読みできない無意味語」、「綴り読み可能な語」、「有意味語」の3種類を記憶対象として用いる。「有意味」と「無意味」とは、英語としての意味が有るか無いかである。
「綴り読みできない無意味語」とは「SXW」、「GHV」、「RGPL」、「TWHB」のように、母音を含まず、かつ意味を持たない語である。「綴り読み可能な無意味語」とは、「YOA」や「DEBE」のように母音と子音が必ず組で出現する語である。また、「ENZ」や「NOAF」の末尾字「Z」、「F」のように、不完全な頭字語綴りと音素綴りの対応表(表7)で読み替え可能な、意味を持たない語である。
被験者は日本語を母語とする大学生5名なので、「有意味語」として中学と高校レベルの語から筆者が平易であると感じたものを選んだ。例えば、「HOP(跳ぶ)」、「SIT(座る)」、「MONK(僧)」、「DROP(雫)」などである。一般の人間が使用しない専門用語などは被験者の知識による影響を受け、有意味語としての働きを確認するには相応しくないため使用しなかった。これら3種類の語を「無意味語」、「綴り読み語」、「有意味語」と呼ぶ。各語を以下の組み合わせで被験者に提示した。
・無意味語のみ3語
・綴り読み語のみ3語
・有意味語のみ3語
・無意味語、綴り読み語、有意味語の3種類による順列組み合わせの3語(6通り)
以上の単語組を用いて次の手順で実験を行った。図13は、各手順で被験者へ提示する画面の例を示す。
1.文字列が表示される中心部分の点を注視する。ただし、2秒で自動的に次の画面へ替わる。
2.被験者は提示された単語組を記憶する。ただし、3文字の場合は3秒、4文字の場合は6秒で自動的に次の画面へ替わる。
3.文字列の残像を消すための画面を表示し、被験者に記憶を保持させる。1秒で自動的に次の画面へ替わる。
4.被験者に記憶した文字列を紙に書き取らせる。書き取りが終わったら被験者が自分で画面を切り替える。
画面の切り替え時間について、手順2.で単語組を記憶する時間は筆者が何度か予備実験を試行して設定した。被験者は、以上の作業を各単語組について連続して2回、計18回繰り返し行った。これを実験の「1セット」とし、各被験者が3文字の場合、4文字の場合について1セットずつ行った。また、使用する語は、無意味語、綴り読み語、有意味語の3文字、4文字の場合、それぞれについて36語の計108語である。ただし、実験中に同じ語が複数回出現することは無いようにした。
実験後、被験者らにインタビューし、実験に使用した言葉を全て提示して「意味を知っていた語はあるか」を調査した。筆者が有意味として実験に使用した語が被験者の未知語であった場合は、その被験者に対する結果では有意味語として扱わない。綴り読みできる場合には綴り読み語として、出来ない場合には無意味語として扱った。これは、各被験者の記憶に対して、有意味語と無意味語がどのように影響しているかを調べるためである。
b)実験結果
「無意味語」、「綴り読み語」、「有意味語」、「全記憶対象語」のそれぞれについて、被験者5名から得られた平均正解数、平均語数、正解率を表21に示す。表中の「無」、「綴」、「有」は、それぞれ「無意味語」、「綴り読み語」、「有意味語」を表す。この表記は、被験者に対して一度に提示される3語の語順を表している。
実験に用いた各評価対象語は同数である。しかし、実験に用いた有意味語の意味を被験者が知らなかった場合には、その語を無意味語または綴り読み語として扱うため、平均語数として表に示した。
Figure 2007241900
例えば、「有意味語のみ」の単語組に関して被験者1名が記憶した12語の内、「IRON(鉄)」の意味を知らないと答えた。そのため、「有意味語のみ」の単語組における有意味語の平均単語数は11.8語となり、「IRON」は綴り読みできることから綴り読み語として扱い、綴り読み語の平均語数が0.2語となっている。
正解率を見ると、無意味語の場合が0.29、綴り読み語が0.64、有意味語の場合が0.76となっており、有意味語の正解率が最も高くなった。これは有意味語がより記憶に残りやすいことを示している。また、綴り読みできる場合については無意味語のほぼ倍の正解率である。
以上の結果により、有意味語ほど覚えやすいことがわかった。すなわち、本ネーミングシステムの単語モデルが名前の覚えやすさを定量化できることが示された。また、綴り読みできる単語はそうでない単語より覚えやすいことが分かった。
以上詳しく説明したように、本発明に係るネーミングシステムにおいては、ネーミング対象の少なくともカテゴリ及び特徴テキストを含む複数のデータ項目をそのデータ項目毎に分類してこれを格納しておく格納手段と、前記ネーミング対象の少なくとも前記カテゴリ及び特徴テキストの入力を受けて、それに関連する複数の用語、人名、知識又は言葉等の関連用語を出力するデータベースと、前記データベースにアクセスして前記ネーミング対象のカテゴリと特徴テキスト及び前記関連用語に基づいて、当該ネーミング対象に関連する複数のキーワードを収集し作成するキーワード収集手段と、前記複数のキーワードに基づいて前記ネーミング対象の複数のネーミング案を生成するネーミング案生成手段と、予め設定された複数の評価モデルに基づいて前記複数のネーミング案の夫々を評価するネーミング案評価手段との各手段を有する。
ここで、ネーミング案生成手段は、前記ネーミング対象に関連する複数のフレーズを生成するフレーズ生成手段と生成された前記複数のフレーズの頭字語を生成する頭字語生成手段とを含む。これにより、ネーミング対象に関連するフレーズの頭字語に係る多くのネーミング案を生成して、これをネーミング案の対象にした。
そして、前記ネーミング案評価手段における前記複数の評価モデルは、前記イメージキーワードが有する印象の観点に基づいて評価する印象評価モデルと、前記頭字語の発音の観点に基づいて評価する発音評価モデルと、前記頭字語が単語を形成する場合、当該単語の観点に基づいて評価する単語評価モデルと、前記フレーズがある意義を生じさせる場合に、当該フレーズの意義の観点に基づいて評価するフレーズ評価モデルと、前記フレーズがある意義を生じさせる場合に、ネーミング対象の特徴を表す程度を評価するコンセプト評価モデル等の各評価モデルの中の何れか一つ又は複数の評価モデルにより構成することにより、ネーミング対象の特徴を良く表し、印象性に優れ、言い易い、聞き易い及び覚え易い等のネーミングの基礎的基準を総合的に満足するネーミング案の絞込みを可能にしたのである。
本発明は、操作者の能力に依存することなく当該事物のネーミング例に拘束されることなく、ネーミング対象に対してその特徴を簡潔に表すと共に良いイメージを生じさせる名称であって、覚え易い、発音し易い、聞き易い等の基本的条件を満たす名称案を自動的に選定してこれに優先順位を付して出力することを可能とするネーミングシステムに関するものであり、産業上の利用可能性を有するものである。
本発明のネーミングシステム10の構成機能ブロック図を示す。 本ネーミングシステムにおけるデータの入力からネーミング案の出力に至る処理フローの全体構成であって、頭字語ネーミングのシステム構成の例を示す。 キーワード収集手段の構成例を示す。 ネーミング案生成手段の構成例を示す。 ネーミング案評価手段の構成例を示す。 キーワード群を含む英文の例を示す。 WordNetに定義された頭字語の例を示す。 特徴テキスト「WHO」の説明文の例を示す。 日本語による特徴テキストの例を示す。 英語による特徴テキストの例を示す。 本ネーミングシステムにおける発音モデルの評価実験の第1の例を示す。 本ネーミングシステムにおける発音モデルの評価実験の第2の例を示す。 本ネーミングシステムにおける単語モデルの評価実験において提示する画面の例を示す。
符号の説明
10:本ネーミングシステム
11:入力手段
12:キーワード収集手段
13:ネーミング案生成手段
14:ネーミング案評価手段
15:データベースサーバ
16:ウェブサーバ
17:ゲートウェイサーバ
18:ファイヤーウォール
19:データ項目データ記憶部
20:印象モデル記憶部
21:発音モデル記憶部
22:単語モデル記憶部
23:フレーズモデル
24:WWWインターネット
25:コンセプト評価モデル

Claims (14)

  1. 商品又はサービス、企業又は団体若しくは施設又はイベント等のあらゆる事物に対する名前付け(以下、「ネーミング」という)を支援及び自動化するネーミングシステムであって、
    ネーミング対象の少なくともカテゴリ及び特徴テキストを含む複数のデータ項目をそのデータ項目毎に分類してこれを格納しておく格納手段と、
    前記ネーミング対象の少なくとも前記カテゴリ及び特徴テキストの入力を受けて、それに関連する複数の用語、人名、知識又は言葉等(以下、「関連用語」という)を出力するデータベースと、
    前記データベースにアクセスして前記ネーミング対象のカテゴリと特徴テキスト及び前記関連用語に基づいて、当該ネーミング対象に関連する複数のキーワードを収集し作成するキーワード収集手段と、
    前記複数のキーワードに基づいて前記ネーミング対象の複数のネーミング案を生成するネーミング案生成手段と、
    予め設定された複数の評価モデルに基づいて前記複数のネーミング案の夫々を評価するネーミング案評価手段と、
    の各手段を有することを特徴とするネーミングシステム。
  2. 前記データベースは、インターネットに接続されたウェブサーバと当該ウェブサーバと連携するデータベースサーバとにより構成され、前記データベースサーバは、インターネットウェブ上に用いられている前記関連用語を累積的に記憶するようにしたことを特徴とする請求項1に記載のネーミングシステム。
  3. 前記キーワード収集手段は、日本語による前記関連用語を英語及び他の周知の外国語に翻訳する翻訳手段を備えることを特徴とする請求項1に記載のネーミングシステム。
  4. 前記キーワード収集手段は、前記ネーミング対象のカテゴリに基づいて第1次キーワード群を収集し、当該第1次キーワード群を構成する各キーワードの概念に基づいて拡張された概念に係る第2次キーワード群を収集し、前記前記第1次キーワード群及び前記第2次キーワード群の中から、当該ネーミング対象に係る前記複数のキーワードを収集することを特徴とする請求項1に記載のネーミングシステム。
  5. 前記ネーミング案生成手段は、
    前記ネーミング対象に関連する複数のフレーズを生成するフレーズ生成手段と、
    生成された前記複数のフレーズの頭字語を生成する頭字語生成手段と、
    を含むことを特徴とする請求項1又は4に記載のネーミングシステム。
  6. 前記複数のデータ項目は、前記ネーミング対象が属するカテゴリ及び前記ネーミング対象の特徴を記載した特徴テキストの他に、ネーミング対象のイメージを規定するイメージキーワードに関する項目と前記頭字語の形式を規定する項目とを含むことを特徴とする請求項5に記載のネーミングシステム。
  7. 前記ネーミング案評価手段における前記複数の評価モデルは、
    前記イメージキーワードが有する印象の観点に基づいて評価する印象評価モデルと、
    前記頭字語の発音の観点に基づいて評価する発音評価モデルと、
    前記頭字語が単語を形成する場合、当該単語の観点に基づいて評価する単語評価モデルと、
    前記フレーズがある意義を生じさせる場合に、当該フレーズの意義の観点に基づいて評価するフレーズ評価モデルと、
    前記フレーズがある意義を生じさせる場合に、ネーミング対象の特徴を表す程度を評価するコンセプト評価モデルと、
    の各評価モデルの中の何れか一つ又は複数の評価モデルにより構成されていることを特徴とする請求項6に記載のネーミングシステム。
  8. 前記ネーミング案評価手段は、前記複数の評価モデルにおいてスコアリングされたポイントの総合ポイントに基づいて、前記複数のネーミング案の夫々を評価するようにした請求項7に記載のネーミングシステム。
  9. 商品又はサービス、企業又は団体若しくは施設又はイベント等のあらゆる事物に対するネーミングを自動化する方法であって、
    (a)ネーミング対象の少なくともカテゴリ及び特徴テキストを含む複数のデータ項目をそのデータ項目毎に分類してこれを予め格納しておくステップと、
    (b)前記ネーミング対象の少なくとも前記カテゴリ及び特徴テキストの入力を受けて、それに関連する複数の用語、人名、知識又は言葉等(以下、「関連用語」という)を出力するステップと、
    (c)前記データベースにアクセスして前記ネーミング対象のカテゴリと特徴テキスト及び前記関連用語に基づいて、当該ネーミング対象に関連する複数のキーワードを収集し作成するステップと、
    (d)前記複数のキーワードに基づいて前記ネーミング対象の複数のネーミング案を生成するステップと、
    (e)予め設定された複数の評価モデルに基づいて前記複数のネーミング案の夫々を評価するステップと、
    の各ステップを有することを特徴とするネーミング自動化方法。
  10. 前記ステップ(c)は、
    (c−1)前記ネーミング対象のカテゴリに基づいて第1次キーワード群を収集するステップと、
    (c−2)当該第1次キーワード群を構成する各キーワードの概念に基づいて拡張された概念に係る第2次キーワード群を収集するステップと、
    (c−3)前記前記第1次キーワード群及び前記第2次キーワード群の中から、当該ネーミング対象に係る前記複数のキーワードを収集するステップと、
    の各ステップとを有することを特徴とする請求項9に記載のネーミング自動化方法。
  11. 前記ステップ(d)は、
    (d−1)前記ネーミング対象に関連する複数のフレーズを生成するステップと、
    (d−2)前記生成された前記複数のフレーズの頭字語を生成するステップと、頭字語生成手段を、
    の各ステップとを有することを特徴とする請求項9又は10に記載のネーミング自動化方法。
  12. 前記複数のデータ項目は、前記ネーミング対象が属するカテゴリ及び前記ネーミング対象の特徴を記載した特徴テキストの他に、ネーミング対象のイメージを規定するイメージキーワードに関する項目と前記頭字語の形式を規定する項目とを含むことを特徴とする請求項11に記載のネーミング自動化方法。
  13. 前記複数の評価モデルは、
    前記イメージキーワードが有する印象の観点に基づいて評価する印象評価モデルと、
    前記頭字語の発音の観点に基づいて評価する発音評価モデルと、
    前記頭字語が単語を形成する場合、当該単語の観点に基づいて評価する単語評価モデルと、
    前記フレーズがある意義を生じさせる場合に、当該フレーズの意義の観点に基づいて評価するフレーズ評価モデルと、
    前記フレーズがある意義を生じさせる場合に、ネーミング対象の特徴を表す程度を評価するコンセプト評価モデルと、
    の各評価モデルの中の何れか一つ又は複数の評価モデルにより構成されていることを特徴とする請求項12に記載のネーミング自動化方法。
  14. 前記ステップ(e)は、前記複数の評価モデルにおいてスコアリングされたポイントの総合ポイントに基づいて前記複数のネーミング案の夫々を評価するようにした請求項13に記載のネーミング自動化システム。
JP2006066714A 2006-03-10 2006-03-10 ネーミングシステム及びネーミング自動化方法 Pending JP2007241900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006066714A JP2007241900A (ja) 2006-03-10 2006-03-10 ネーミングシステム及びネーミング自動化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006066714A JP2007241900A (ja) 2006-03-10 2006-03-10 ネーミングシステム及びネーミング自動化方法

Publications (1)

Publication Number Publication Date
JP2007241900A true JP2007241900A (ja) 2007-09-20

Family

ID=38587340

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006066714A Pending JP2007241900A (ja) 2006-03-10 2006-03-10 ネーミングシステム及びネーミング自動化方法

Country Status (1)

Country Link
JP (1) JP2007241900A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020222515A1 (ko) * 2019-04-30 2020-11-05 정철환 작명을 지원하는 전자 장치, 방법, 및 컴퓨터 프로그램
KR102282636B1 (ko) * 2021-02-17 2021-07-28 조민정 인공지능을 이용하여 브랜드 네임을 생성하는 방법 및 장치
KR20240068215A (ko) * 2022-11-10 2024-05-17 (주)비엔에스브랜딩 상표 제작 서비스 제공 방법, 장치 및 컴퓨터-판독가능 기록매체

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020222515A1 (ko) * 2019-04-30 2020-11-05 정철환 작명을 지원하는 전자 장치, 방법, 및 컴퓨터 프로그램
US11481556B2 (en) 2019-04-30 2022-10-25 Chul Hwan Jung Electronic device, method, and computer program which support naming
KR102282636B1 (ko) * 2021-02-17 2021-07-28 조민정 인공지능을 이용하여 브랜드 네임을 생성하는 방법 및 장치
KR20240068215A (ko) * 2022-11-10 2024-05-17 (주)비엔에스브랜딩 상표 제작 서비스 제공 방법, 장치 및 컴퓨터-판독가능 기록매체
KR102671016B1 (ko) * 2022-11-10 2024-05-31 (주)비엔에스브랜딩 상표 제작 서비스 제공 방법, 장치 및 컴퓨터-판독가능 기록매체

Similar Documents

Publication Publication Date Title
Schroeder et al. childLex: A lexical database of German read by children
Baker Glossary of corpus linguistics
Rayson Matrix: A statistical method and software tool for linguistic analysis through corpus comparison
Heilman Automatic factual question generation from text
Benajiba et al. Arabic named entity recognition: A feature-driven study
CA2938064C (en) Method for automatically detecting meaning and measuring the univocality of text
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
Sawalha Open-source resources and standards for Arabic word structure analysis: Fine grained morphological analysis of Arabic text corpora
WO2007105202A2 (en) Automatic reusable definitions identification (rdi) method
Mohammed Using machine learning to build POS tagger for under-resourced language: the case of Somali
KR101333485B1 (ko) 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치
Shukla et al. Natural Language Processing: Unlocking the Power of Text and Speech Data
Malhar et al. Deep learning based Answering Questions using T5 and Structured Question Generation System’
Lahbari et al. A rule-based method for Arabic question classification
JP2007241900A (ja) ネーミングシステム及びネーミング自動化方法
Mohamed Morphological segmentation and part-of-speech tagging for the arabic heritage
Hirpassa Information extraction system for Amharic text
Asahiah Development of a Standard Yorùbá digital text automatic diacritic restoration system
Asker et al. Applying machine learning to Amharic text classification
Luong et al. Assessing vietnamese text readability using multi-level linguistic features
Kuo The Handbook of NLP with Gensim: Leverage topic modeling to uncover hidden patterns, themes, and valuable insights within textual data
Pinney et al. Incorporating Word-level Phonemic Decoding into Readability Assessment
Reddy et al. Text Summarization of Telugu Scripts
Abdelkader et al. How Existing NLP Tools of Arabic Language Can Serve Hadith Processing
Algarni Light morphology and arabic information retrieval.

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090901

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091102

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091124

A072 Dismissal of procedure

Free format text: JAPANESE INTERMEDIATE CODE: A072

Effective date: 20100303

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100326