WO2022259513A1 - 単語評価値取得方法、装置及びプログラム - Google Patents

単語評価値取得方法、装置及びプログラム Download PDF

Info

Publication number
WO2022259513A1
WO2022259513A1 PCT/JP2021/022265 JP2021022265W WO2022259513A1 WO 2022259513 A1 WO2022259513 A1 WO 2022259513A1 JP 2021022265 W JP2021022265 W JP 2021022265W WO 2022259513 A1 WO2022259513 A1 WO 2022259513A1
Authority
WO
WIPO (PCT)
Prior art keywords
word
evaluation
document
words
evaluation value
Prior art date
Application number
PCT/JP2021/022265
Other languages
English (en)
French (fr)
Inventor
良成 白井
泰恵 岸野
早苗 藤田
哲生 小林
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to PCT/JP2021/022265 priority Critical patent/WO2022259513A1/ja
Priority to JP2023526797A priority patent/JPWO2022259513A1/ja
Publication of WO2022259513A1 publication Critical patent/WO2022259513A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

単語評価値取得方法は、評価対象の各単語について、単語に対する指標についての予め定めた複数の指標値の何れに該当するかの評価結果を利用者から取得するための単語評価値取得方法であって、表示部300が、複数の文により構成される文書を表示する文書表示ステップと、入力部200が、文書に含まれる単語の選択を受け付ける単語選択受付ステップと、入力部200が、単語選択受付ステップで選択を受け付けた単語である選択単語について、複数の指標値の何れであるかの評価結果を受け付ける単語評価受付ステップと、表示部300が、単語評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた装飾を、選択単語と、文書中に含まれる選択単語と同じ綴りの単語と、に付与する装飾付与ステップと、を有する。

Description

単語評価値取得方法、装置及びプログラム
 本発明は、単語に対する指標の値である単語評価値を取得する技術に関する。
 単語に対する指標のひとつとして、単語親密度が知られている。単語親密度とは、単語に対する主観的ななじみの程度に基づく尺度である(例えば、非特許文献1参照。)。単語親密度は、例えば1から7までの数値によって表現される。例えば、1に近いほどなじみがなく、7に近いほどなじみがある単語を示す。
 各単語の単語親密度は、被験者実験によって決定されていた。被験者実験では、各被験者に対し音声または文字で単語を提示し、各被験者に1から7までの数値のうちの当該単語の主観的ななじみの程度を表す数値を評価値として付与してもらう。被験者とする対象は、一定以上の語彙力を持った人である。各単語に対して40人程度が付与した評価値の平均が、その各単語の単語親密度の値とされる。
藤田早苗、小林哲生、"単語親密度の再調査と過去のデータとの比較"、言語処理学会、第26回年次大会、2020年3月
 しかし、単語は複数の意味を持つことが多く、被験者が提示された単語のどの意味を思い浮かべたかによって、付与される評価値は異なってしまう可能性があった。
 例えば、「天井」という単語に対して、ある人は部屋の上部の板を張った部分を思い浮かべるが、株取引に慣れ親しむ人は物価や相場の最高値を思い浮かべるかもしれない。そして、後者の人は、物価や相場の最高値としての天井という単語は、自分たち株取引をする人にとっては良く知られているものの、一般にはあまり馴染みがないと考えて、低い評価値を付ける可能性があった。
 このように、多義性を持つ単語に関しては、被験者個々が思い描く単語の意味に依存して付与される評価値が大きく異なる可能性があった。その結果として、複数の被験者が付けた評価値の分散が大きくなり、複数の評価値を平均化して算出された単語親密度が、世の中の多くの人が思い描くなじみの度合いを正しく表したものではなくなってしまう可能性があった。
 本発明は、多義性への依存度合いの低い単語評価値を取得するための取得装置、方法及びプログラムを提供することを目的とする。
 この発明の一態様による単語評価値取得方法によれば、評価対象の各単語について、単語に対する指標についての予め定めた複数の指標値の何れに該当するかの評価結果を利用者から取得するための単語評価値取得方法であって、複数の指標値には、それぞれ異なる装飾が割り当てられており、表示部が、複数の文により構成される文書を表示する文書表示ステップと、入力部が、文書に含まれる単語の選択を受け付ける単語選択受付ステップと、入力部が、単語選択受付ステップで選択を受け付けた単語である選択単語について、複数の指標値の何れであるかの評価結果を受け付ける単語評価受付ステップと、表示部が、単語評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた装飾を、選択単語と、文書中に含まれる選択単語と同じ綴りの単語と、に付与する装飾付与ステップと、を有し、文書に含まれる複数の単語について、単語選択受付ステップと単語評価受付ステップと装飾付与ステップが実行可能とされている。
 新聞記事等の複数の文で構成された文書を用いて、文書に現れる単語の単語評価値を利用者から取得する。この場合、前後の文脈により単語の意味は限定されるため、取得される単語評価値は特定の意味を有する単語の単語評価値となる。よって、多義性への依存度合いの低い単語評価値を取得することができる。
図1は、単語評価値取得装置の機能構成の例を示す図である。 図2は、単語評価値取得方法の処理手続きの例を示す図である。 図3は、文書表示ステップの処理の例を説明するための図である。 図4は、単語評価受付ステップの処理の例を説明するための図である。 図5は、装飾付与ステップの処理の例を説明するための図である。 図6は、単語再評価受付ステップの処理の例を説明するための図である。 図7は、装飾再付与ステップの処理の例を説明するための図である。 図8は、第二変形例を説明するための図である。 図9は、コンピュータの機能構成例を示す図である。
 以下、本発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
 [単語評価値取得装置及び方法]
 単語評価値取得装置は、図1に示すように、例えば、文書記憶部10、文書生成部11、文書データベース12、処理部100、入力部200、表示部300および評価値記憶部400を例えば備えている。後述するように、単語評価値取得装置は、文書生成部11および文書データベース12を備えていなくてもよい。このため、図1では、文書生成部11および文書データベース12を破線で示している。
 単語評価値取得方法は、単語評価値取得装置の各構成部が、以下に説明する及び図2に示すステップS0からステップS4の処理を行うことにより例えば実現される。後述するように、ステップS0の処理は行われなくてもよい。このため、図2では、ステップS0の処理を破線で示している。
 処理部100は、後述するように、例えば、CPU(central processing unit)等のプロセッサ(ハードウェア・プロセッサ)およびRAM(random-access memory),ROM(read-only memory),ハードディスク等の記憶装置等を備える汎用または専用のコンピュータが所定のプログラムを実行することで構成される。処理部100は、文書記憶部10から文書を読み込む処理、入力部200による入力を受け付ける処理、表示部300に表示させる処理、評価値記憶部400に評価値を記憶させる処理等の所定の処理を行う。
 入力部200は、利用者による情報入力を受け付けるユーザインタフェースである。入力部200の例は、マウス、タッチセンサ、タッチパッド等のポインティングデバイス、キーボードなどである。後述するように、入力部200は、文書に含まれる単語の選択を受け付け、選択を受け付けた単語である選択単語について、複数の指標値の何れであるかの評価結果である評価値を受け付ける。
 表示部300は、利用者に対する情報表示を行うユーザインタフェースである。表示部300の例は、液晶ディスプレイ、投影装置などである。後述するように、表示部300は、複数の文により構成される文書を表示し、入力部200で受け付けた評価値に割り当てられた装飾を、選択単語と、文書中に含まれる選択単語と同じ綴りの単語と、に付与する。
 単語評価値取得装置の例は、マウスと液晶ディスプレイなどを備えたデスクトップ型パーソナルコンピュータ(PC)、タッチパッドと液晶ディスプレイなどを備えたノート型PC、タッチスクリーン(タッチセンサと液晶ディスプレイとを1つのハードウェアで実装したもの)を備えたタブレット型PC、スマートフォン、などであるが、専用端末装置等であってもよい。
 以下、本実施形態の単語評価値取得装置の動作について説明する。
 単語評価値取得装置は、利用者による起動操作を契機に動作を開始する。起動操作とは、例えば、単語評価値取得装置が専用端末装置である場合には電源ボタンが押下される操作などであり、単語評価値取得装置がPCである場合には、プログラムアイコンが押下される操作やURLが指定される操作などである。プログラムアイコンは、Webブラウザに拡張機能としてインストールされているプログラムのアイコンであってもよい。
 <文書生成ステップ>
 文書生成部11は、複数の文書のテキストが記憶されている文書データベース12から、処理対象となる文書のテキストを選択し、選択した文書のテキストを単語に分割する(ステップS0)。文書生成部11は、文書のテキストを単語に分割する。文書のテキストが、英語等の単語間がスペースで区切られている文書のテキストである場合には、文書生成部11は、スペースで区切ることにより、文書のテキストを単語に分割する。文書のテキストが、日本語等の単語間にスペースがない文書のテキストである場合には、文書生成部11は、例えば、文書のテキストを所定の形態素解析エンジンを用いて形態素解析を行い、文書のテキストを単語に分割する。
 文書生成部11により生成された単語に分割された文書の情報は、文書記憶部10に記憶される。
 文書のテキストは、新聞記事等の文書のテキストであり、複数の文により構成されている。
 なお、文書生成部11は、文書データベース12からではなく、インターネット等のネットワークから文書のテキストを選択してもよい。例えば、単語評価取得装置及び方法が、Webブラウザに拡張機能としてインストールされているプログラムとして実装されている場合には、Webブラウザ上のプログラムのアイコンをクリックすると、現在Webブラウザに表示されている文書のテキストが文書生成部11により選択されてもよい。これが、インターネット等のネットワークから文書のテキストを選択する場合の一例である。
 以下、単に「文書」と言う場合には、この文書生成部11により生成された単語に分割された文書の情報のことを意味するとする。
 なお、文書生成部11は、文書のテキストに含まれるすべての単語を評価対象の単語するのではなく、文書のテキストに含まれる一部の単語を評価対象の単語として決定してもよい。例えば、文書生成部11は、数字、固有名詞、冠詞など、評価値を得る必要のない単語を評価対象の単語から除外してもよい。この場合、文書生成部11により生成された単語に分割された文書の情報には、各単語について、評価対象の単語についての情報が含まれていてもよい。
 文書生成ステップの処理は、後述する文書表示ステップの処理の直前にリアルタイムに行われてもよいし、文書表示ステップの処理の前に予め行われていてもよい。文書生成ステップの処理が、文書表示ステップの処理の前に予め行われている場合には、単語評価取得装置は、文書生成部11および文書データベース12を備えていなくてもよい。言い換えれば、単語評価取得方法に、文書生成ステップ(ステップS0)の処理が含まれていなくてもよい。この場合、文書生成部11により生成された単語に分割された文書の情報が、文書記憶部10に記憶されているとする。
 <文書表示ステップ>
 単語評価値取得装置は、動作を開始すると、まず処理部100が文書記憶部10から読み込んだ文書を表示部300に表示させる制御を行い、その制御に従って表示部300は文書を表示する(ステップS1)。
 表示部300により表示される文書の例を図3に示す。図3では、文書として、英語の文書を例に挙げている。もちろん、文書は、日本語等の英語以外の言語により記載された文書であってもよい。
 本発明では、単語単体ではなく、文書全文が、被験者である利用者に提示される。そして、利用者は、以下に説明するステップS2以降の処理で、提示されている文書中の評価対象の各単語に対して、予め定めた複数の指標値の何れかを評価値として付与していく。
 予め定めた複数の指標値は、単語に対する指標の程度を表す値であり、例えば単語親密度の値である。単語親密度は、単語に対する主観的ななじみの程度に基づく尺度である。以下では、予め定めた複数の指標値および利用者が付与する評価値が単語親密度の値である場合を例に挙げて説明する。
 図3の例では、文書の右側に、利用者が評価値を付与した単語が表示される一覧表示ウィンドウが表示されている。このように、表示部300は、利用者が評価値を付与した単語を、各指標値に対応する単語の一覧として表示してもよい。
 なお、表示部300は、文書中の評価対象の単語に特定の装飾を施してもよい。表示部300は、例えば、評価対象の単語の背景色をグレーとしてもよい。評価対象の単語に特定の装飾を付与することで、利用者は、評価対象の単語、すなわち自身が選択可能な単語、を容易に識別可能となり、利便性が増す。文書中の評価対象の単語は、文書生成部11により生成された評価対象の単語についての情報に基づいて決定することができる。
 <単語選択受付ステップ>
 入力部200が、文書に含まれる単語の選択を受け付ける(ステップS2)。
 例えば、入力部200がポインティングデバイスである場合には、利用者は評価値を付与したい単語にカーソルを合わせてクリックすることでその単語を選択することができる。このようにして、入力部200により、単語の選択が受け付けられる。
 以下、ステップS2である単語選択受付ステップで選択を受け付けた単語を、選択単語と呼ぶことにする。
 入力部200で選択を受け付けた選択単語についての情報は、処理部100に入力される。
 <単語評価受付ステップ>
 入力部200が、選択単語について、複数の指標値の何れであるかの評価結果を評価値として受け付ける(ステップS3)。
 例えば、ステップS2の単語選択受付ステップで単語の選択を受け付けると、選択単語の評価値を入力するための選択表示ウィンドウがポップアップする。選択表示ウィンドウの例を、図4に示す。図4の例では、”new”が選択単語とされており、選択表示ウィンドウには、「newの評価値は?」というどの単語の評価値を選択すべきであるのかを示す文言と、1から7の指標値(すなわち、評価値の候補値)と、指標値が大きい方がより「知っている」ということを意味し、指標値が小さい方がより「知らない」ということを意味することを示すための文言と、選択表示ウィンドウを閉じるための「×」が表示されている。
 例えば、入力部200がポインティングデバイスである場合には、利用者は適切であると考える指標値(すなわち、評価値の候補値)にカーソルを合わせてクリックすることでその指標値を評価値として選択することができる。また、例えば、入力部200がキーボードである場合には、利用者は適切であると考える指標値(すなわち、評価値の候補値)を打鍵により評価値として選択することができる。
 このようにして、入力部200により、複数の指標値の何れであるかの評価結果を受け付けられる。
 入力部200で受け付けた評価値についての情報は、処理部100に入力される。
 処理部100は、入力部200から入力された情報に基づいて、以下に説明する装飾付与ステップの表示を表示部300にさせる処理を行う。
 <装飾付与ステップ>
 表示部300が、各指標値に割り当てられた装飾のうちの単語評価受付ステップで受け付けた評価値に対応する装飾(すなわち、評価値と同じ値の指標値に割り当てられた装飾)を、選択単語と、文書中に含まれる選択単語と同じ綴りの単語と、に付与する(ステップS4)。
 すなわち、表示部300は、単語評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた装飾を、選択単語と、文書中に含まれる選択単語と同じ綴りの単語と、に付与する。
 複数の指標値には、複数の装飾のうちのそれぞれ異なる装飾が割り当てられている。割り当てられる装飾は、単語の文字の色等の単語自体の装飾であってもよいし、単語の背景色、単語の背景パターン等の単語自体ではないが単語に関連する装飾であってもよい。
 すなわち、複数の指標値それぞれに割り当てられている異なる装飾は、複数の指標値それぞれに割り当てられている異なる色を単語の文字に与える装飾であってもよいし、複数の指標値それぞれに割り当てられている異なる色を単語の背景色とする装飾であってもよい。
 単語の背景色として、表示部300を見た利用者が各単語に付与した評価値の区別をしやすいものが用いられてもよい。例えば、予め定めた指標値の個数が7(すなわち、評価値が7通り)である場合には、指標値が大きいものから順に、赤、黄、緑、水色、青、紫、黒の背景色が割り当てられてもよい。
 単語の背景色として、各単語に付与した評価値の順序が表示部300を見た利用者にとって直感的にわかりやすいものが用いられてもよい。例えば、指標値が大きいほど波長が長い色の背景色が割り当てられていてもよい。例えば、指標値の個数が7である場合には、指標値が大きいものから順に、赤、橙、黄、緑、青、藍、紫の背景色が割り当てられてもよい。なお、逆に、指標値が小さいほど波長が長い可視光線の発光色の背景色が割り当てられていてもよい。
 以下、7の指標値に濃いドットの背景パターンの装飾、6の指標値には薄いドットの背景パターンの装飾、5の指標値には右下がりの対角ストライプの背景パターンの装飾、4の指標値には右上がりの対角ストライプの背景パターンの装飾、3の指標値にはひし形グリッドの背景パターンの装飾、2の指標値には大きい格子の背景パターンの装飾、1の指標値には小さい格子の背景パターンの装飾が割り当てられている場合を例に挙げて説明する。
 このように装飾が割り当てられている場合であって、図4の例において選択単語”new”の評価値として7の指標値が選択された場合、表示部300の表示は図5のようになる。
 図5の例では、選択単語”new”だけではなく、文書中に含まれる、選択単語”new”と同じ綴りの単語である”NEW”についても、7の評価値に対応する(7の指標値に割り当てられた)濃いドットの背景パターンの装飾が付与されている。このように、選択単語と同じ綴りの単語は、選択単語を構成する文字の少なくとも1つを大文字又は小文字に変換した単語であってもよい。
 なお、選択単語と同じ綴りの単語は、選択単語を構成する文字の並びと同じ文字の並びの単語であればよい。例えば、選択単語と同じ綴りの単語は、選択単語を構成する文字の少なくとも1つを半角又は全角に変換した単語であってもよいし、選択単語を構成する文字の少なくとも1つのフォントを異なるフォントに変えた単語であってもよいし、選択単語を構成する文字の少なくとも1つを当該単語が属する言語における異なる表記に変えた単語であってもよい。選択単語を構成する文字の少なくとも1つを当該単語が属する言語における異なる表記に変えた単語の例は、中国語の簡体で表記された選択単語を構成する文字の少なくとも1つを中国語の繁体の表記に変えた単語である。
 単語評価受付ステップで受け付けた評価値に対応する装飾(すなわち、評価値と同じ値の指標値に割り当てられた装飾)を、選択単語と、文書中に含まれる選択単語と同じ綴りの単語と、に付与することで、利用者が文書中の選択単語と同じ単語を再度選択し評価値を選択する作業が不要になるという点において、利用者の負担を軽減することができる。
 なお、文書に含まれる複数の評価対象の単語のそれぞれについて、上記説明した、単語選択受付ステップ(ステップS2)、単語評価受付ステップ(ステップS3)、装飾付与ステップ(ステップS4)が実行可能とされている。
 このため、利用者は、上記説明した、単語選択受付ステップ(ステップS2)、単語評価受付ステップ(ステップS3)、装飾付与ステップ(ステップS4)を繰り返すことで、文書に含まれる複数の評価対象の単語のそれぞれについて、評価値を選択し、装飾を付与することができる。
 利用者により選択された各単語の評価値は、処理部100により評価値記憶部400に記憶される。
 このように、複数の文で構成された文書を用いて、文書に現れる単語の単語評価値を利用者から取得する。この場合、前後の文脈により単語の意味は特定されるため、取得される単語評価値は特定の意味を有する単語の単語評価値となる。よって、多義性への依存度合いの低い単語評価値を取得することができる。
 なお、本発明は、従来の単語親密度の付与手法が誤っていると主張するものではない。単語親密度とは、単語に複数の意味があることも含めて人々がどのぐらいなじみを感じているかを示した指標であり、従来の手法により平均によって算出された単語親密度値は、その単語の単語親密度を正しく示していると捉える考え方ももちろんあり得るためである。
 利用者が選択した評価値に応じた装飾を、選択単語と、文書中に含まれる選択単語と同じ綴りの単語と、に付与することで、また、利用者が選択した各評価値に対応する単語の一覧を表示することで、利用者が選択した単語の評価値が可視化される。このため、ある単語の評価値を決める際に、これまでに付けた評価値を振り返ることができる。
 なお、利用者は、必ずしも文書の先頭から単語の評価値を選択していく必要はない。例えば、利用者は、まず評価値が7であると感じた単語について7の評価値を選択していき、次に評価値が6であると感じた単語について6の評価値を選択していくこともできる。
 取得される単語評価値は特定の意味を有する単語の単語評価値であるが、別の意味で使われている単語の単語評価値を収集する必要があれば、単語がその別の意味として使われている文書に対して上記の単語評価値取得装置及び方法により利用者に単語評価値を付与してもらえばよい。
 前述のように単語は複数の意味を持つ場合がある。もし文書中に同じ単語が別の意味で使われている場合には、その文書は利用しなくてもよい。または、その単語は、評価値の選択の対象から外す処理を行ってもよい。
 [第一変形例]
 上記の単語評価値取得装置及び方法において、以下に説明する単語の再選択と、単語の再評価の受付と、装飾の再付与とが可能であってもよい。
 <単語再選択受付ステップ>
 入力部200が、単語選択受付ステップと単語評価受付ステップと装飾付与ステップが既に実行された選択単語または同単語の選択を受け付ける。
 例えば、入力部200がポインティングデバイスである場合には、利用者は評価値を再付与したい単語にカーソルを合わせてクリックすることでその単語を再選択することができる。このようにして、入力部200により、単語の再選択が受け付けられる。
 同単語とは、文書中の、単語選択受付ステップ(ステップS2)で選択された選択単語と同じ綴りの単語のことである。
 以下、単語再選択受付ステップで選択を受け付けた単語を、再選択単語と呼ぶことにする。
 なお、文書の右側にされた、利用者が評価値を選択した単語が表示される一覧表示ウィンドウで、単語の再選択を受け付けてもよい。例えば、入力部200がポインティングデバイスである場合には、利用者は、一覧表示ウィンドウ上の単語であって評価値を再付与したい単語にカーソルを合わせてクリックすることでその単語を再選択することができる。
 <単語再評価受付ステップ>
 入力部200が、単語再選択受付ステップで選択を受け付けた単語である再選択単語について、複数の指標値の何れであるかの評価結果を再評価の評価値として受け付ける。
 例えば、単語再選択受付ステップで単語の選択を受け付けると、再選択単語の再評価の評価値を入力するための選択表示ウィンドウがポップアップする。この選択表示ウィンドウは、単語評価受付ステップ(ステップS3)でポップアップしたものと同じであってもよい。
 選択表示ウィンドウの例を、図6に示す。図6の例では、既に、”new”と同じ綴りの単語に7の評価値に対応する濃いドットの背景パターンの装飾が付与され、”coronavirus”と同じ綴りの単語に7の評価値に対応する濃いドットの背景パターンの装飾が付与されており、”coronavirus”が再選択単語とされている。図6の例では、選択表示ウィンドウには、「coronavirusの評価値は?」というどの単語の再評価の評価値を選択すべきであるのかを示す文言と、1から7の指標値(すなわち、評価値の候補値)と、指標値が大きい方がより「知っている」ということを意味し、指標値が小さい方がより「知らない」ということを意味することを示すための文言と、選択表示ウィンドウを閉じるための「×」が表示されている。
 例えば、入力部200がポインティングデバイスである場合には、利用者はより適切であると考える指標値(すなわち、評価値の候補値)にカーソルを合わせてクリックすることでその指標値(すなわち、評価値の候補値)を再評価の評価値として選択することができる。また、例えば、入力部200がキーボードである場合には、利用者はより適切であると考える指標値(すなわち、評価値の候補値)を打鍵により再評価の評価値として選択することができる。
 なお、入力部200がポインティングデバイスであり、文書の右側にされた、利用者が評価値を選択した単語が表示される一覧表示ウィンドウで、単語の再選択を受け付けた場合には、利用者はクリックにより選択した再選択単語をより適切であると考える評価値の単語が表示される枠(すなわち、より適切であると考える指標値に対応する枠)にドラック&ドロップすることで再評価の評価値を選択することができる。
 <装飾再付与ステップ>
 表示部300が、再選択単語と、文書中に含まれる再選択単語と同じ綴りの単語と、に付与される装飾を、単語再評価受付ステップで受け付けた評価値に対応する装飾(すなわち、評価値と同じ値の指標値に割り当てられた装飾)に更新する。
 すなわち、表示部300は、再選択単語と、文書中に含まれる再選択単語と同じ綴りの単語と、に付与される装飾を、単語再評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた装飾に更新する。
 装飾再付与ステップの処理は、「選択単語」を「再選択単語」に読み替えた以外は、装飾付与ステップ(ステップS4)の処理と同じである。
 図6の例において、再選択単語”coronavirus”の評価値として6の評価値が選択された場合、表示部300の表示は図7のようになる。図7の例では、選択単語”coronavirus”だけではなく、文書中に含まれる、選択単語”coronavirus”と同じ綴りの単語である”coronavirus”, ”CORONAVIRUS”についても、6の評価値に対応する(6の指標値に割り当てられた)薄いドットの背景パターンの装飾に更新されている。
 このように、選択単語と同じ綴りの単語と同様に、再選択単語と同じ綴りの単語は、再選択単語を構成する文字の少なくとも1つを大文字又は小文字に変換した単語であってもよい。また、選択単語と同じ綴りの単語と同様に、再選択単語と同じ綴りの単語は、再選択単語を構成する文字の並びと同じ文字の並びの単語であればよい。例えば、再選択単語と同じ綴りの単語は、再選択単語を構成する文字の少なくとも1つを半角又は全角に変換した単語であってもよいし、再選択単語を構成する文字の少なくとも1つのフォントを異なるフォントに変えた単語であってもよいし、再選択単語を構成する文字の少なくとも1つを当該単語が属する言語における異なる表記に変えた単語であってもよい。再選択単語を構成する文字の少なくとも1つを当該単語が属する言語における異なる表記に変えた単語の例は、中国語の簡体で表記された再選択単語を構成する文字の少なくとも1つを中国語の繁体の表記に変えた単語である。
 利用者により再選択された単語の評価値は、処理部100により評価値記憶部400に記憶される。
 第一変形例により、利用者は評価値を見直すことができ、評価値の修正を容易に行うことができる。
 例えば、文書で最初に「飛行機」という単語が出てきた際には、7の評価値を選択したが、文書を読み進め2番目、3番目と「飛行機」が出現した際に、7の評価値に対応する濃いドットの背景パターンの装飾が付与されている「飛行機」を見て、7の評価値は高すぎると思えば、その場で、変形例1の単語再選択受付ステップ、単語再評価受付ステップ、装飾再付与ステップの処理により、「飛行機」を例えば6の評価値に変更することができる。
 利用者は、単語の様々な使われ方を考慮して評価値を選択する。このため、利用者が最初に選択した評価値は必ずしも絶対ではなく、利用者が文書を読み進めていき、単語の様々な使われ方を考慮して決定した最終的な評価値の方が適切な評価値である可能性がある。
 このため、第一変形例により、より適切な評価値を取得することできると言える。
 [第二変形例]
 上記の単語評価値取得装置及び方法および第一変形例において、装飾付与ステップで、文書中に含まれる、選択単語の語形変化に該当する単語、および/または、、選択単語に対応する単語であって選択単語の品詞とは異なる品詞に対応する単語にも、単語評価受付ステップで受け付けた評価値に対応する装飾(すなわち、評価値と同じ値の指標値に割り当てられた装飾)が付与されてもよい。
 すなわち、文書中に含まれる、選択単語の語形変化に該当する単語、および/または、選択単語に対応する単語であって選択単語の品詞とは異なる品詞に対応する単語にも、単語評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた装飾が付与されてもよい。
 また、上記の単語評価値取得装置及び方法および第一変形例において、装飾再付与ステップで、文書中に含まれる、再選択単語の語形変化に該当する単語、および/または、再選択単語に対応する単語であって再選択単語の品詞とは異なる品詞に対応する単語に付与される装飾も、単語再評価受付ステップで受け付けた評価値に対応する装飾(すなわち、評価値と同じ値の指標値に割り当てられた装飾)に更新されてもよい。
 すなわち、文書中に含まれる再選択単語の語形変化に該当する単語、および/または、再選択単語に対応する単語であって再選択単語の品詞とは異なる品詞に対応する単語に付与される装飾も、単語再評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた装飾に更新されてもよい。
 例えば、選択単語が”infected”であり、単語評価受付ステップで5の評価値が選択されたとする。このとき、表示部300の表示は図8のようになる。図8では、選択単語”infected”と、文書中に含まれる選択単語”infected”と同じ綴りの単語だけではなく、選択単語”infected”に対応する単語であって選択単語”infected”の品詞とは異なる品詞に対応する単語である”infection”についても、5の評価値に対応する(5の指標値に割り当てられた)右下がりの対角ストライプの背景パターンの装飾が付与されている。
 (再)選択単語の語形変化に該当する単語の例は、(再)選択単語が現在形”lie”である場合には、(再)選択単語”lie”の過去形に該当する単語”lay”である。この例では、語形変化は、過去形である。語形変化は、原形、現在進行形、過去分詞形等の過去形以外の活用形であってもよいし、名詞の複数形、動詞の三人称単数現在形、形容詞や形容動詞の比較級や最上級などであってもよい。
 また、(再)選択単語が日本語の動詞の単語である場合には、活用形の例は、未然形、連用形、終止形、連体形、仮定形、命令形である。
 このように、(再)選択単語のみならず、(再)選択単語の語形変化に該当する単語、および/または、(再)選択単語に対応する単語であって(再)選択単語の品詞とは異なる品詞に対応する単語にも、単語評価受付ステップで受け付けた評価値に対応する装飾(すなわち、評価値と同じ値の指標値に割り当てられた装飾)を付与することで、利用者の負担を軽減することができ、より効率的に単語の評価値を取得することができる。
 [第三変形例]
 上記の単語評価値取得装置及び方法および第一変形例および第二変形例において、文書のテキストに含まれる熟語については、熟語を構成する各単語を評価対象として扱うではなく、熟語そのものを評価対象として扱うようにしてもよい。例えば、文書中に含まれる「天下統一」を、「天下」という単語と「統一」という単語として扱うのではなく、そのまま「天下統一」という熟語として扱ってもよい。同様に、文書中に含まれる”take care of”をそのまま熟語として扱ってもよい。
 この場合には、文書生成部11は、上述したステップS0に代えて、複数の文書のテキストが記憶されている文書データベース12から、処理対象となる文書のテキストを選択し、選択した文書のテキストを熟語と熟語以外の単語に分割する(ステップS0’)。文書生成部11は、例えば、熟語を優先する形態素解析エンジンを用いて文書のテキストの形態素解析を行うことで、文書のテキストを熟語と熟語以外の単語に分割する。単語評価値取得装置は、単語ではなく熟語も上記の単語評価値取得装置及び方法および第一変形例における単語として扱って、上記の単語評価値取得装置及び方法のステップS1以降の処理および第一変形例の処理を行う。この場合には、上述した選択単語や再選択単語に相当するのは単語ではなく熟語であることもあるので、上述した選択単語に相当する単語や熟語のことを「選択語」とよび、上述した再選択単語に相当する単語や熟語のことを「再選択語」とよんでもよい。
 第三変形例においても第二変形例と同様に、装飾付与ステップで、文書中に含まれる、選択語に含まれるいずれかの単語についての語形変化に該当する単語を含む語にも、単語評価受付ステップで受け付けた評価値に対応する装飾(すなわち、評価値と同じ値の指標値に割り当てられた装飾)が付与されてもよい。同様に、装飾再付与ステップで、文書中に含まれる、再選択語に含まれるいずれかの単語についての語形変化に該当する単語を含む語に付与される装飾も、単語再評価受付ステップで受け付けた評価値に対応する装飾(すなわち、評価値と同じ値の指標値に割り当てられた装飾)に更新されてもよい。
 [他の変形例]
 以上、本発明の実施の形態について説明したが、具体的な構成は、これらの実施の形態に限られるものではなく、本発明の趣旨を逸脱しない範囲で適宜設計の変更等があっても、本発明に含まれることはいうまでもない。
 例えば、指標値は、単語親密度以外の単語に対する指標であってもよい。例えば、指標値は、単語の意味に対応するイメージの思い浮かべやすさに関する指標である単語心像性、単語の難しさに関する指標である単語難易度であってもよい。
 実施の形態において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
 例えば、単語評価値取得装置の構成部間のデータのやり取りは直接行われてもよいし、図示していない記憶部を介して行われてもよい。
 [プログラム、記録媒体]
 上述した単語評価値取得装置の処理をコンピュータにより実現する場合は、単語評価値取得置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムを図9に示すコンピュータ1000の記憶部1020に読み込ませ、演算処理部1010、入力部1030、出力部1040、表示部1060などに動作させることにより、上記各装置における各種の処理機能がコンピュータ上で実現される。演算処理部1010が処理部100に対応し、入力部1030が入力部200に対応し、表示部1060が表示部300に対応している。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体は、例えば、非一時的な記録媒体であり、具体的には、磁気記録装置、光ディスク、等である。
 また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
 このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の非一時的な記憶装置である補助記録部1050に格納する。そして、処理の実行時、このコンピュータは、自己の非一時的な記憶装置である補助記録部1050に格納されたプログラムを記憶部1020に読み込み、読み込んだプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを記憶部1020に読み込み、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
 また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
 その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

Claims (8)

  1. 評価対象の各単語について、単語に対する指標についての予め定めた複数の指標値の何れに該当するかの評価結果を利用者から取得するための単語評価値取得方法であって、
    前記複数の指標値には、それぞれ異なる装飾が割り当てられており、
    表示部が、複数の文により構成される文書を表示する文書表示ステップと、
    入力部が、前記文書に含まれる単語の選択を受け付ける単語選択受付ステップと、
    入力部が、前記単語選択受付ステップで選択を受け付けた単語である選択単語について、前記複数の前記指標値の何れであるかの評価結果を受け付ける単語評価受付ステップと、
    表示部が、前記単語評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた装飾を、前記選択単語と、前記文書中に含まれる前記選択単語と同じ綴りの単語と、に付与する装飾付与ステップと、
    を含み、
    前記文書に含まれる複数の単語について、前記単語選択受付ステップと前記単語評価受付ステップと前記装飾付与ステップが実行可能とされている
    ことを特徴とする単語評価値取得方法。
  2. 請求項1に記載の単語評価値取得方法であって、
    前記複数の指標値それぞれに割り当てられている異なる装飾は、
    前記複数の指標値それぞれに割り当てられている異なる色を単語の文字に与える装飾、
    または、
    前記複数の指標値それぞれに割り当てられている異なる色を単語の背景色とする装飾、
    である
    ことを特徴とする単語評価値取得方法。
  3. 請求項1または2に記載の単語評価値取得方法であって、
    前記単語に対する指標は単語親密度であり、
    前記複数の前記指標値は、単語親密度についての複数の指標値である
    ことを特徴とする単語評価値取得方法。
  4. 請求項1から3のいずれかに記載の単語評価値取得方法であって、
    入力部が、前記単語選択受付ステップと前記単語評価受付ステップと前記装飾付与ステップが既に実行された前記選択単語または同単語の選択を受け付ける単語再選択受付ステップと、
    入力部が、単語再選択受付ステップで選択を受け付けた単語である再選択単語について、前記複数の前記指標値の何れであるかの評価結果を受け付ける単語再評価受付ステップと、
    表示部が、前記再選択単語と、前記文書中に含まれる前記再選択単語と同じ綴りの単語と、に付与される装飾を、前記単語再評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた前記装飾に更新する装飾再付与ステップと、
    を更に含むことを特徴とする単語評価値取得方法。
  5. 請求項1から3のいずれかに記載の単語評価値取得方法であって、
    前記装飾付与ステップでは、
    前記文書中に含まれる、前記選択単語の語形変化に該当する単語、および/または、前記選択単語に対応する単語であって前記選択単語の品詞とは異なる品詞に対応する単語にも、前記単語評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた装飾が付与されることを特徴とする単語評価値取得方法。
  6. 請求項4に記載の単語評価値取得方法であって、
    前記装飾付与ステップでは、
    前記文書中に含まれる、前記選択単語の語形変化に該当する単語、および/または、前記選択単語に対応する単語であって前記選択単語の品詞とは異なる品詞に対応する単語にも、前記単語評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた装飾が付与され、
    前記装飾再付与ステップでは、
    前記文書中に含まれる前記再選択単語の語形変化に該当する単語、および/または、前記再選択単語に対応する単語であって前記再選択単語の品詞とは異なる品詞に対応する単語に付与される装飾も、前記単語再評価受付ステップで受け付けた評価結果に対応する指標値に割り当てられた前記装飾に更新される
    ことを特徴とする単語評価値取得方法。
  7. 評価対象の各単語について、単語に対する指標についての予め定めた複数の指標値の何れに該当するかの評価結果を利用者から取得するための単語評価値取得装置であって、
    前記複数の指標値には、それぞれ異なる装飾が割り当てられており、
    複数の文により構成される文書を表示する表示部と、
    前記文書に含まれる単語の選択を受け付け、前記選択を受け付けた単語である選択単語について、前記複数の前記指標値の何れであるかの評価結果を受け付ける入力部と、
    を含み、
    前記表示部は、前記入力部で受け付けた評価結果に対応する指標値に割り当てられた装飾を、前記選択単語と、前記文書中に含まれる前記選択単語と同じ綴りの単語と、に付与し、
    前記文書に含まれる複数の単語について、前記入力部による単語の選択を受け付ける処理と、前記入力部による評価結果を受け付ける処理と、前記表示部による装飾を付与する処理とが実行可能とされている
    ことを特徴とする単語評価値取得装置。
  8.  請求項1から6の何れかの単語評価値取得方法の各ステップをコンピュータに実行させるためのプログラム。
PCT/JP2021/022265 2021-06-11 2021-06-11 単語評価値取得方法、装置及びプログラム WO2022259513A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2021/022265 WO2022259513A1 (ja) 2021-06-11 2021-06-11 単語評価値取得方法、装置及びプログラム
JP2023526797A JPWO2022259513A1 (ja) 2021-06-11 2021-06-11

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/022265 WO2022259513A1 (ja) 2021-06-11 2021-06-11 単語評価値取得方法、装置及びプログラム

Publications (1)

Publication Number Publication Date
WO2022259513A1 true WO2022259513A1 (ja) 2022-12-15

Family

ID=84425141

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/022265 WO2022259513A1 (ja) 2021-06-11 2021-06-11 単語評価値取得方法、装置及びプログラム

Country Status (2)

Country Link
JP (1) JPWO2022259513A1 (ja)
WO (1) WO2022259513A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009521026A (ja) * 2005-12-22 2009-05-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 探索および置換入力の派生を活用する探索および置換機能でテキストを編集するための方法およびシステム
JP2011013811A (ja) * 2009-06-30 2011-01-20 Konan Gakuen 単語レベル判定装置、単語レベル判定システム、単語レベル判定方法、制御プログラム、および、記録媒体
JP2020160515A (ja) * 2019-03-25 2020-10-01 日本電信電話株式会社 指標値付与装置、指標値付与方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009521026A (ja) * 2005-12-22 2009-05-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 探索および置換入力の派生を活用する探索および置換機能でテキストを編集するための方法およびシステム
JP2011013811A (ja) * 2009-06-30 2011-01-20 Konan Gakuen 単語レベル判定装置、単語レベル判定システム、単語レベル判定方法、制御プログラム、および、記録媒体
JP2020160515A (ja) * 2019-03-25 2020-10-01 日本電信電話株式会社 指標値付与装置、指標値付与方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TOMOKO KANASUGI, KANAME KASAHARA, NOZOMU INAGO, SHIGEAKI AMANO: "Selection of a Basic Vocabulary Based on Word Familiarity Ratings", IPSJ SIG TECHNICAL REPORTS, vol. 2002, no. 66 (2002-NL-150), 16 July 2002 (2002-07-16), JP, pages 119 - 124, XP009542174 *

Also Published As

Publication number Publication date
JPWO2022259513A1 (ja) 2022-12-15

Similar Documents

Publication Publication Date Title
Postma et al. How to improve scenario analysis as a strategic management tool?
US9965443B2 (en) Method for determining a sentiment from a text
CN109426658A (zh) 使用基于文本分析的智能特征建议进行文档美化
Vinot et al. Legible, are you sure? an experimentation-based typographical design in safety-critical context
Chen et al. Reading patterns and cognitive processing in an eye-tracking study of note-reading in consecutive interpreting
JP2018010532A (ja) 情報処理装置、プログラム及び情報処理方法
KR20090016055A (ko) 감성 기반의 색채 팔레트 제공 방법
Menold et al. On the relationship between item stem formulation and criterion validity of multiple-component measuring instruments
WO2022259513A1 (ja) 単語評価値取得方法、装置及びプログラム
Petroff Accessible color sequences for data visualization
Ruma et al. Transformer based answer-aware bengali question generation
Shahin et al. A study of gender discussions in mobile apps
Hall Software internationalization architectures for decision support systems
Liginlal et al. Metaphorical expressions in e-commerce: A study of arabic language websites
Wang et al. Investigating differences in gaze and typing behavior across writing genres
Singh et al. The influence of romanizing a non-alphabetic L1 on L2 reading: the case of Hindi-English visual word recognition
Minacapilli A Heuristic Evaluation of Multilingual Lom Ba Rdy: Museums’ Web Sites
JP2008171164A (ja) 分類付与支援装置及び方法及びプログラム
Lan et al. The chart excites me! exploring how data visualization design influences affective arousal
Scolari et al. Searching for Signs: Developing a handshape taxonomy based on visual similarity
KR102353381B1 (ko) 작명을 지원하는 전자 장치, 방법, 및 컴퓨터 프로그램
JP7333377B2 (ja) 情報処理装置、情報処理方法およびプログラム
KR20190014195A (ko) 검색을 통한 폰트 제시 시스템 및 방법
Matsdotter et al. Typographical trust issues: The impact of font types on trust in the context of online banking websites
Keller et al. Cultural issues and opportunities in computing education

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21944448

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023526797

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE