JP7273442B1 - 情報処理システム、情報処理方法及びプログラム - Google Patents

情報処理システム、情報処理方法及びプログラム Download PDF

Info

Publication number
JP7273442B1
JP7273442B1 JP2022162127A JP2022162127A JP7273442B1 JP 7273442 B1 JP7273442 B1 JP 7273442B1 JP 2022162127 A JP2022162127 A JP 2022162127A JP 2022162127 A JP2022162127 A JP 2022162127A JP 7273442 B1 JP7273442 B1 JP 7273442B1
Authority
JP
Japan
Prior art keywords
word
information
words
unit
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022162127A
Other languages
English (en)
Other versions
JP2024055308A (ja
Inventor
一成 渡部
遼 眞下
Original Assignee
Dcアーキテクト株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dcアーキテクト株式会社 filed Critical Dcアーキテクト株式会社
Priority to JP2022162127A priority Critical patent/JP7273442B1/ja
Priority to JP2023069408A priority patent/JP2024055744A/ja
Application granted granted Critical
Publication of JP7273442B1 publication Critical patent/JP7273442B1/ja
Publication of JP2024055308A publication Critical patent/JP2024055308A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Machine Translation (AREA)

Abstract

【課題】文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かを判断することができる情報処理システム、情報処理方法及びプログラムを提供する。【解決手段】情報処理システムを構成する情報処理装置において、制御部33は、ユーザ端末から文章情報を受け付ける受付部331と、文章情報に不当な表示を規制する法令類の下で使用が不可能な単語が含まれているか否かを判定する判定部332と、文章情報に不当な表示を規制する法令類の下で使用が不可能な単語が含まれていると判定された場合に、不当な表示を規制する法令類の下で使用が不可能な単語の前後に隣接する単語を抽出する抽出部333と、抽出された単語が予め記憶された参照情報に基づいて、所定の単語に該当する場合に不当な表示を規制する法令類の下で使用が不可能な単語を文章情報の中に含まれる他の単語よりも強調させる強調表示を付与する付与部334と、を備える。【選択図】図3

Description

本発明は、情報処理システム、情報処理方法及びプログラムに関する。
ウェブサイト中に記載されている薬事用語を効率的に照合することができる薬事用語照合システムが開示されている(例えば、特許文献1参照)。
特開2008-181172号公報
しかしながら、特許文献1にかかる薬事用語照合システムでは、ウェブサイト中に記載されている各用語とデータベース部に記録されている薬事用語とを照合し、照合の結果、ウェブサイト中の薬事用語にチェックを付けるものである。このため、文章情報に含まれる単語が、単に、薬事用語に該当するか否かのみを判断しているだけで、文章情報全体の内容を考慮して、当該単語が使用可能か否かについて判断するものではなかった。
すなわち、文章情報に含まれる単語が薬事用語等に該当する場合であって、文章情報全体の内容を考慮すれば使用が可能と判断される場合があるが、これらを考慮するものではなかった。
本発明は、上述の問題に鑑みてなされたものであって、その目的は、ユーザが文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かを判断することができる、情報処理システム、情報処理方法及びプログラムを提供することを目的とする。
本発明の一態様によれば、情報処理システムが提供される。この情報処理システムは受付部、判定部、抽出部、付与部、表示部とを備える。受付部はユーザ端末から文章情報を受け付ける。判定部は、前記受付部で受け付けた前記文章情報に、不当な表示を規制する法令類の下で使用が不可能な単語が含まれているか否かを判定する。抽出部は、前記判定部により、不当な表示を規制する法令類の下で使用が不可能な単語が含まれていると判定された場合に、前記不当な表示を規制する法令類の下で使用が不可能な単語の前後に隣接する単語を抽出する。付与部は前記抽出部により、抽出された単語が、予め記憶された参照情報に基づいて、所定の単語に該当する場合に、前記不当な表示を規制する法令類の下で使用が不可能な単語を、他の単語よりも強調させる強調表示を付与する。表示部は前記文章情報を前記ユーザ端末に表示する。
本開示によれば、ユーザが文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かを判断することができる。
図1は、情報処理システム1のシステム構成の一例を示す図である。 図2は、情報処理装置3のハードウェア構成を示すブロック図である。 図3は、情報処理装置3の機能を示す機能ブロック図である。 図4は、チェックワードに関するデータベースの一例を示す図である。 図5は、薬事関連ワードデータベースの一例を示す図である。 図6は、情報処理装置3による情報処理の一例を示すフローチャートである。 図7は、ユーザ端末2に表示されるGUIの一例を示す図である。 図8は、ユーザ端末2に表示されるGUIの一例を示す図である。
以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。
ところで、本実施形態に登場するソフトウェアを実現するためのプログラムは、コンピュータが読み取り可能な非一時的な記録媒体(Non-Transitory Computer-Readable Medium)として提供されてもよいし、外部のサーバからダウンロード可能に提供されてもよいし、外部のコンピュータで当該プログラムを起動させてクライアント端末でその機能を実現(いわゆるクラウドコンピューティング)するように提供されてもよい。
また、本実施形態において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェアの情報処理とを合わせたものも含みうる。また、本実施形態においては様々な情報を取り扱うが、これら情報は、例えば電圧・電流を表す信号値の物理的な値、0または1で構成される2進数のビット集合体としての信号値の高低、または量子的な重ね合わせ(いわゆる量子ビット)によって表され、広義の回路上で通信・演算が実行されうる。
また、広義の回路とは、回路(Circuit)、回路類(Circuitry)、プロセッサ(Processor)、およびメモリ(Memory)等を少なくとも適当に組み合わせることによって実現される回路である。すなわち、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、およびフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等を含むものである。
1. ハードウェア構成
本節では、本実施形態に係る情報処理システム1のハードウェア構成について説明する。図1は、情報処理システム1の全体構成を示す図である。
1.1 情報処理システム1
図1に示すように、情報処理システム1は、ユーザ端末2と、情報処理装置3とを備え、これらが電気通信回線を通じて通信可能に構成される。これらの構成要素についてさらに説明する。
1.2 ユーザ端末2
ユーザ端末2はユーザが操作するものであり、スマートフォン、タブレット端末、コンピュータ、その他電気通信回線を通じて情報処理装置3にアクセス可能なものであれば、その形態を問わない。
ユーザ端末2は、表示部と、入力部と、通信部と、記憶部と、制御部とを有し、これらの構成要素がユーザ端末2の内部において通信バスを介して電気的に接続されている。
表示部は、例えば、ユーザ端末2の筐体に含まれるものであってもよいし、外付けされるものであってもよい。表示部は、ユーザが操作可能なグラフィカルユーザインターフェース(Graphical User Interface:GUI)の画面を表示する。このような表示部は、例えば、CRTディスプレイ、液晶ディスプレイ、有機ELディスプレイおよびプラズマディスプレイ等の表示デバイスを、ユーザ端末2の種類に応じて使い分けて実施されることが好ましい。ここでは、表示部は、ユーザ端末2の筐体に含まれるものとして説明する。
入力部は、ユーザ端末2の筐体に含まれるものであってもよいし、外付けされるものであってもよい。例えば、入力部は、表示部と一体となってタッチパネルとして実施されてもよい。タッチパネルであれば、ユーザは、タップ操作、スワイプ操作等を入力することができる。もちろん、タッチパネルに代えて、スイッチボタン、マウス、QWERTYキーボード等を採用してもよい。すなわち、入力部35が、ユーザによってなされた操作入力を受け付ける。当該入力が、命令信号として、通信バスを介して制御部に転送され、制御部が、必要に応じて、所定の制御及び/又は演算を実行し得る。
ユーザ端末2の通信部、記憶部及び制御部は、情報処理装置3と略同様のハードウェア構成を備える。ハードウェア構成は、次に説明する情報処理装置3における通信部31、記憶部32及び制御部33の記載を参照されたい。
1.3 情報処理装置3
図2は、情報処理装置3のハードウェア構成を示すブロック図である。情報処理装置3は、通信部31と、記憶部32と、制御部33を備え、これらの構成要素が情報処理装置3の内部において通信バス30を介して電気的に接続されている。各構成要素についてさらに説明する。
(通信部31)
通信部31は、USB、IEEE1394、Thunderbolt、有線LANネットワーク通信等といった有線型の通信手段が好ましいものの、無線LANネットワーク通信、LTE/3G等のモバイル通信、Bluetooth(登録商標)通信等を必要に応じて含めてもよい。すなわち、これら複数の通信手段の集合として実施することがより好ましい。
(記憶部32)
記憶部32は、前述の記載により定義される様々な情報を記憶する。これは、例えば、制御部33によって実行される情報処理装置3に係る種々のプログラム等を記憶するソリッドステートドライブ(Solid State Drive:SSD)等のストレージデバイスとして、あるいは、プログラムの演算に係る一時的に必要な情報(引数、配列等)を記憶するランダムアクセスメモリ(Random Access Memory:RAM)等のメモリとして実施されうる。また、これらの組合せであってもよい。
(制御部33)
制御部33は、情報処理装置3に関連する全体動作の処理・制御を行う。制御部33は、例えば不図示の中央処理装置(Central Processing Unit:CPU)である。制御部33は、記憶部32に記憶された所定のプログラムを読み出すことによって、情報処理装置3に係る種々の機能を実現する。すなわち、ソフトウェア(記憶部32に記憶されている)による情報処理がハードウェア(制御部33)によって具体的に実現されることで、制御部33に含まれる各機能部(図3参照)として実行されうる。これらについては、次節においてさらに詳述する。なお、制御部33は単一であることに限定されず、機能ごとに複数の制御部33を有するように実施してもよい。またそれらの組合せであってもよい。
本実施形態に係る情報処理システム1は、文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かを判断することができるシステムである。
本明細書でいう「文書情報」には、文字によって表現される情報であって、言語としての意味を持った情報のことである。「文書情報」には、例えば、単語、キーワード、文等が含まれる。また、文章情報は、例えば、テキスト、PDF(Portable Documet Format)、Word(登録商標)ファイル、Excel(登録商標)ファイル、画像ファイル、ウェブページを構成するHTMLファイル等を含み得る。PDF及び/又は画像ファイルでテキストデータがない場合はOCR(Optical Character Recognition)を用いてテキスト情報を抽出し、それを利用しても良い。文章情報は、音声又は動画などからテキスト情報を抽出し、それを利用しても良い。
本明細書でいう「不当な表示を規制する法令類」(本明細書では「法令類」という場合がある。)とは、例えば、医薬品、医療機器等の品質、有効性及び安全性の確保等に関する法律(以下、薬機法という。)、不当景品類及び不当表示防止法(以下、景表法と略す。)、薬事法等の法令(法律、政令、省令を含む。以下、薬事法と略す。)、健康増進法(以下、健増法と略す。)、特定商取引法(以下、特商法と略す。)、及びこれらに関する運用、ガイドライン等が含まれる。
また、以下、法令類の下で使用が不可能な単語を「使用不可能単語」、法令類の下で使用が可能な単語を、「使用可能単語」という場合がある。
2.機能構成
本節では、本実施形態の機能構成について説明する。図3は、情報処理装置3の機能を示す機能ブロック図である。前述の通り、ソフトウェア(記憶部32に記憶されている)による情報処理がハードウェア(制御部33)によって具体的に実現されることで、制御部33に含まれる各機能部として実行されうる。
具体的には、情報処理装置3(制御部33)は、各機能部として、受付部331と、判定部332と、抽出部333と、付与部334と、出力部335とを備える。
(受付部331)
受付部331はユーザ端末2から文章情報を受け付ける。受付部331は、通信部31又は記憶部32を介して情報を受け付け、これを作業メモリに読出可能に構成される。特に、受付部331は、ユーザ端末2からネットワーク及び通信部31を介して種々の情報を受け付けるように構成される。本実施形態では、受付部331が受け付けた種々の情報は、記憶部32に記憶されるものとして説明する。特に、受付部331は、ユーザ端末2から文章情報を受け付ける。
(判定部332)
判定部332は、受付部331で受け付けた文章情報に、法令類の下で使用が不可能な単語(使用不可能単語)が含まれているか否かを判定する。具体的には、判定部332はチェックワードデータベースを参照し、当該単語が、チェックワードデータベースのチェックワードに記録されている場合には使用不可能単語だと判定する。一方、判定部332は、チェックワードデータベースを参照し、当該単語が、チェックワードデータベースのチェックワードに記録されていない場合には、法令類の下で使用が可能な単語(使用可能単語)であると判定する。
同じ内容のチェックワードか否かの判定は、チェックワードの表記が一致したときにのみ「同じ内容である」と判定しても良いが、表記にかかわらず、意味内容が同じ場合に「同じ内容である」と判定するのが好ましい。一方、読みは同じであるが意味内容が異なるため、「同じ内容である」とは判定しない。
図4は、チェックワードに関するデータべースの一例を示す。チェックワードデータベースは、ID41とチェックワード42の項目を有する。ID41はレコードの識別情報である。チェックワード42には不当な表示を規制する法令類の下で使用が不可能な単語(使用不可能単語)が記憶されている。
チェックワードデータベースのチェックワード42の項目に記憶する内容は、例えば、法令類を所管する行政機関(例えば、景品表示法を所管する消費者庁)が公表している情報(例えば、景品表示法関係ガイドライン等)から取得しても良い。また、これらのAPIを利用して自動的に取得しても、管理者が登録しても良い。
(抽出部333)
抽出部333は、判定部332により、不当な表示を規制する法令類の下で使用が不可能な単語(使用不可能単語)が含まれていると判定された場合に、当該不当な表示を規制する法令類の下で使用が不可能な単語(使用不可能単語)の前後に隣接する単語を抽出する。
抽出部333は、文章情報を、形態素解析等を実行することにより、チェックワードの前後に隣接する単語を抽出する。一例を示すと、「あごのラインをマスクでカバーする。」の文章情報において、ラインがチェックワードだとすると、抽出部333は、形態素解析を実行することにより、「あご」「の」「を」「マスク」「で」「カバー」「する」「。」の単語を抽出する。「ライン」はチェックワードであるため除外され、その前後に存在する単語のみが抽出される。
チェックワードの前後に隣接する単語か否かは、例えば、文、文章又は段落ごとに判断する。好ましくは、文ごとに判断するのが良い。
(付与部334)
付与部334は強調表示を付与する。強調表示は不当な表示を規制する法令類の下で使用が不可能な単語(使用不可能単語)を、文章情報の中に含まれる、他の単語よりも強調させる表示である(強調表示という場合がある。)。
強調表示は、例えば、下線、太文字、斜体、着色、サイズ(フォントサイズ)、又は背景色のいずれかを変更する表示である。すなわち、付与部334は、使用不可能単語を、下線、太文字、斜体、着色、サイズ、又は背景色のいずれかを変更することで、文章情報の中に含まれる、他の単語よりも強調させる。
付与部334は、抽出部333により、抽出された単語が、予め記憶された参照情報(薬事関係ワードデータベース)に基づいて、所定の単語に該当する場合に、強調表示を行う。所定の単語に該当するか否かは判定部332が行うが、付与部334で行っても良い。具体的に付与部334は参照情報(薬事関係ワードデータベース)を参照し、当該単語が、当該参照情報(薬事関係ワードデータベース)の薬事関連ワードに記録されている場合には強調表示を行い、記録されていない場合には強調表示を行わない。
当該単語は表記にかかわらず、意味内容が同じ場合に「同じ内容である」と判定するのが好ましい。一方、読みは同じであるが意味内容が異なるため、「同じ内容である」とは判定しない。
参照情報は、例えば、薬事関連ワードに関するデータべースである。図5は、薬事関連ワードに関するデータベースの一例を示す。当該データベースは、ID45と薬事関連ワード46とスコア47との項目を有する。
薬事関連ワードデータべースには薬事関連ワード46とスコア47が記録されているが、データベースに記録されている薬事関連ワードは、例えば、複数のサンプルデータ文書に対して形態素解析を行い、さらに各単語の出現頻度を表すスコアが、所定の閾値以上(例えば、0.3)の単語である。スコアの算出には、例えば、TF-IDF(Term Frequency-Inverse Document Frequency)等、各単語をスコアリングするアルゴリズムを利用できる。
サンプルデータ文書は、例えば、化粧品、医薬部外品、薬用化粧品、健康食品、一般食品、機能性表示食品、雑貨、医療、施術サービス等の分野における広告および容器包装等の文章を利用できる。
(出力部)
出力部335は文章情報をユーザ端末2の表示部34に表示する。また、出力部335は所望のテキスト情報なども表示する機能も有する。
3.情報処理の詳細
次に、図6のフローチャートを用いて、情報処理システム10の動作を説明する。
ユーザ端末2を所有するユーザは、ユーザ端末2を操作して文章情報を入力する(S101)。文章情報を入力すると、情報処理システム1の受付部331が文章情報を受け付け、判定部332がチェックワードデータベースを参照し、文章情報に含まれている単語がチェックワードに記録されているか否かを判定する(S102)。
文章情報に含まれた単語がチェックワードデータベースのチェックワードに該当する場合に、判定部332は文章情報に含まれている単語がチェックワードに記録されていると判定する(S103)。
次に、文章情報に含まれている単語がチェックワードに該当する場合に、抽出部333は、当該文章情報に対して形態素解析を実行し(S104)、当該チェックワードの前後に隣接する単語を抽出する(S105)。
判定部332は、薬事関連ワードデータベース(参照情報)に基づいて、抽出部333で抽出された各単語が薬事関連ワードに該当するか否かを判定する(S106)。各単語の少なくとも1つが薬事関連ワードに含まれている場合、付与部334は、文章情報のチェックワードに該当する箇所に強調表示を付与する(S107)。
次に、出力部335は、強調表示が付与された文章情報をユーザ端末2の表示部34に表示する(S108)。一方、チェックワードデータベースにチェックワードが含まれていない場合(S103)、又は隣接する単語が薬事関連ワードに含まれていない場合(S106)は、付与部334は強調表示を付与しない。そして、出力部335は、強調表示を付与されていない文章情報を、ユーザ端末2の表示部34に表示する(S103、S106、S108)。
ここでユーザ端末2に表示されるGUIの一例について説明する。図7の(A)は処理事項前の表示であり、図7の(B)は処理実行後の表示である。
図7の(A)に示すように、処理前において表示画面50は、文章情報入力領域51と実行ボタン54とを有する。図7の(B)に示すように、処理後においては、表示が変化し、表示画面50は文章情報表示領域52とコピーボタン55を有する。
文章情報入力領域51は、文章情報61の入力を受ける領域である。文章情報入力領域51は横長長方形状であり、当該領域の内側に文章情報61の入力を受け付ける。文章情報表示領域52は処理後の文章情報62を表示するための領域である。文章情報表示領域52は横長長方形状であり、当該領域の内側に文章情報62を表示する。実行ボタン54は処理を実行するためのボタンである。実行ボタン54は文章情報入力領域51の下方に配置されている。コピーボタン55は処理後の文章情報61をコピーするためのボタンである。コピーボタン55は文章情報表示領域52の下方に配置されている。
ユーザは、ユーザ端末2の入力部35を通じて文章情報入力領域51に文章情報61を入力することができる。入力された文章情報61は受付部331を通じて受け付けられる(S101)。その後、ユーザがユーザ端末2を通じて実行ボタン54を押下すると、制御部は処理を実行する(S102~S108)。図7の(B)に示すように、処理が実行されると、文章情報表示領域52にはチェックワードに該当する箇所に強調表示が付与された文章情報62が表示される。
具体的にはユーザは、「あごのラインをマスクでカバーする。」の文章情報を文章情報入力領域51に入力し、実行ボタン54を入力すると、「ライン」の部分に下線が付与された文章情報62が文章情報表示領域52表示される。
ここで一例を示すと、「あごのラインをマスクでカバーする。」の文章情報では、「ライン」という単語がチェックワードに含まれているため、当該「ライン」の単語の前後に隣接する単語である「あご」「の」「を」「マスク」「で」「カバー」「する」「。」が抽出される。
そして、抽出されたこれらの単語のうち「あご」の単語は薬事関連ワードに含まれるため、チェックワードの「ライン」の単語に強調表示(ここでは下線)が付与される。その後、「ライン」の単語に下線が付与された「あごのラインをマスクでカバーする。」の文章情報62がユーザ端末2の表示部34に表示される。
その状態で、ユーザがコピーボタン55を押下すると、文章情報表示領域52の文章情報62(テキスト情報)をコピーすることができる。コピーした文章情報62は他の文章ファイル等で利用できる。例えば、ユーザが、コピーボタン55を押下すると「あごのラインをマスクでカバーする。」の一連のテキストデータがコピーされる。
(変形例)
上記実施形態は、本発明の様々な実施形態の一つに過ぎない。実施形態は、本発明の目的を達成できれば、設計等に応じて種々の変更が可能である。以下、実施形態の変形例を列挙する。以下に説明する変形例は、適宜組み合わせて適用可能である。
(変形例1)
変形例1を説明すると、上述した実施形態において付与部334は、強調表示として下線等を付与するとした。しかし、強調表示は、当該文字が他の文字よりも強調されるようにすれば良い。例えば、強調表示は、当該文字(使用不可能単語)の周囲に、文字、記号、図形、枠線、イラスト、又は画像のいずれかが付与されることで当該文字を強調しても良い。これにより、ユーザが容易に確認しなければならない単語を把握することができ、チェックミスを低減できる。
一例を示すと、図8の(A)に示すように、付与部334は、強調表示として、チェックワードの周囲に矢印(記号)を付与してチェックワードである「ライン」を強調しても良い。これにより、ユーザが容易に確認しなければならない単語を把握することができ、チェックミスを低減できる。
(変形例2)
付与部334は強調表示を付与するとして説明した。しかし、付与部334は当該強調表示の周囲に、当該強調表示された文字の順番、総数又はリスク度合いを表す文字又は数字等を付与しても良い。図8の(A)に示すように、強調表示として当該文字の周囲に矢印(記号)を付与しているが、図8の(B)(C)に示すように、付与部334は、さらにその矢印(記号)の周囲に、文字又は数字等を付与して、強調表示された文字の順番、総数又はリスク度合いを表しても良い。
強調表示された文字の順番とは、例えば、処理実行後、文章情報に3つの強調表示(矢印)が付与されたとすると、それぞれの矢印(記号)の周囲に、1、2、3・・・と通し番号が付与されることである。通し番号はA,B,C等の文字で表しても良い。
これにより、ユーザが確認しなければならない単語の総数を容易に把握することができるとともに、通し番号となっていることで、他のユーザとの情報共有の際にどこの文字をチェックすればよいか容易に把握できる。
強調表示された文字の総数とは、例えば、処理実行後、文章情報に3つの強調表示(矢印)が付与されたとすると、それぞれの矢印(記号)の周囲に、3という総数が付与されることである。
これにより、ユーザが確認しなければならない単語の総数を容易に把握することができるとともに、総数を把握できることで、他のユーザとの情報共有の際にチェックしなければならない総数を容易に把握できる。
強調表示された文字のリスク度合いとは、例えば、処理実行後、矢印(記号)の周囲に、A、B、C・・・と文字を付与して、リスク度合いを表すことである。リスク度合いは、AからCに行くにしたがってリスク度合いが高く又は低くなるように設定されていても良い。
これにより、ユーザがその単語を使用することでのリスク度合いを容易に認識できる。
(変形例3)
付与部334は、抽出部333により、抽出された単語が、予め記憶された参照情報(薬事関連ワードデータベース)に基づいて、所定の単語に該当する場合に、不当な表示を規制する法令類の下で使用が不可能な単語を、他の単語よりも強調させる強調表示を付与するとした。
しかし、本発明はこれに限定されるものではなく、例えば、チェックワードデータベース及び薬事関連ワードデータベースには、それぞれ不当な表示を規制する法令類の分野(例えば、薬機法、景表法、薬事法、健増法又は特商法などの関連する分野)が更に記録されている。そして、これらの分野が一致している場合に、付与部334は、前記不当な表示を規制する法令類の下で使用が不可能な単語(使用不可能単語)を、文章情報の中に含まれる他の単語よりも強調させる強調表示を付与するとしても良い。
これにより、ユーザは、文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かを、更に精度よく判断することができる。
(変形例4)
抽出部333は、形態素解析等を実行することにより単語を抽出するとした。しかし、本発明はこれに限定されるものではなく、例えば、抽出する単語は名詞、動詞のみであっても良い。
(変形例4)
変形例4を説明する。上述した実施形態及び変形例では情報処理システムが処理を行うものとして説明した。しかしながら、複数の装置(例えば、サーバ装置とPC又は複数のサーバ装置)から構成されてもよいし、単体の装置(例えば、サーバ装置又はPC)から構成されてもよい。また、複数のサーバ装置から構成される情報処理システムがそれぞれのサーバ装置の記憶部に記憶されたプログラムに基づき処理を実行することでも実現されても良い。
変形例4によっても上述した効果を奏することができる。
例えば、上述のプログラムを記憶する、コンピュータ読み取り可能な非一時的な記憶媒体として提供してもよい。
また、上述した実施形態及び変形例を任意に組み合わせて実施するようにしてもよい。
(まとめ)
以上説明したように、第1の態様に係る情報処理システムは、受付部331と判定部332と抽出部333と付与部334と表示部とを備える。受付部331はユーザ端末2から文章情報を受け付ける。判定部332は受付部331で受け付けた文章情報に、不当な表示を規制する法令類の下で使用が不可能な単語が含まれているか否かを判定する。抽出部333は判定部により、不当な表示を規制する法令類の下で使用が不可能な単語が含まれていると判定された場合に、不当な表示を規制する法令類の下で使用が不可能な単語の前後に、隣接する単語を抽出する。付与部334は抽出部333により、抽出された単語が、予め記憶された参照情報に基づいて、所定の単語に該当する場合に、不当な表示を規制する法令類の下で使用が不可能な単語を、文章情報の中に含まれる他の単語よりも強調させる強調表示を付与する。表示部34は文章情報を前記ユーザ端末2に表示する。
この態様によれば、ユーザが文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かを判断することができる。
第2の態様に係る情報処理システムでは、第1の態様において、強調表示は、例えば、下線、太文字、斜体、着色、サイズ(フォントサイズ)、又は背景色のいずれかを変更する表示である。
この態様によれば、ユーザが文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かを判断することができるとともに、当該単語の存在を容易に把握できる。
第3の態様に係る情報処理システムでは、第1の態様において、強調表示は、不当な表示を規制する法令類の下で使用が不可能な単語の周囲に与された文字、記号、図形、枠線、イラスト、又は画像のいずれかである。
この態様によれば、ユーザが文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かを判断することができるとともに、当該単語の存在を容易に把握できる。
第4の態様に係る情報処理システムでは、第1の態様において、付与部は、強調表示の周囲に、強調表示された文字の順番、総数又はリスク度合いを表す文字又は数字を付与する。
この態様によれば、ユーザが確認しなければならない単語を容易に把握できる。
第5の態様に係る情報処理システムでは、第1~4のいずれか1つの態様において、参照情報は、所定分野における出現頻度を表すスコアが所定の閾値以上の単語を含む情報が記録されているデータベースである。
この態様によれば、ユーザが文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かをより精度よく判断することができる。
第6の態様に係る情報処理方法では、受付ステップと判定ステップと抽出ステップと、付与ステップと、表示ステップとを備える。受付ステップはユーザ端末から文章情報を受け付ける。判定ステップは受付ステップで受け付けた文章情報に、不当な表示を規制する法令類の下で使用が不可能な単語が含まれているか否かを判定する。抽出ステップは判定ステップにより、不当な表示を規制する法令類の下で使用が不可能な単語が含まれていると判定された場合に、不当な表示を規制する法令類の下で使用が不可能な単語の前後に隣接する単語を抽出する。付与ステップは抽出ステップにより、抽出された単語が、予め記憶された参照情報に基づいて、所定の単語に該当する場合に、不当な表示を規制する法令類の下で使用が不可能な単語を、文章情報の中に含まれる他の単語よりも強調させる強調表示を付与する。表示ステップは文章情報を前記ユーザ端末に表示させる。
この態様によれば、ユーザが文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かを判断することができる。
第7の態様に係るプログラムは、態様6に記載の情報処理方法の各ステップを、制御部に実行させるためのプログラムである。
この態様によれば、ユーザが文章情報全体の内容を考慮して、文章情報に含まれる単語が使用可能か否かを判断することができる。
最後に、本発明に係る種々の実施形態を説明したが、これらは、例として提示したものであり、発明の範囲を限定することは意図していない。新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。実施形態及びその変形は、発明の範囲及び要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
情報処理システム 1
ユーザ端末 2
情報処理装置 3
通信部 31
記憶部 32
制御部 33
受付部 331
判定部 332
抽出部 333
付与部 334
出力部 335
表示部 34


Claims (6)

  1. 情報処理システムであって、
    ユーザ端末から文章情報を受け付ける受付部と、
    前記受付部で受け付けた前記文章情報に、不当な表示を規制する法令類の下で使用が不可能な使用不可能単語が含まれているか否かを判定する判定部と、
    前記判定部により、前記使用不可能単語が含まれていると判定された場合に、前記使用不可能単語の前後に、隣接する単語を抽出する抽出部と、
    前記抽出部により、抽出された単語が、予め記憶された参照情報に基づいて、所定の単語に該当する場合に、前記使用不可能単語を、前記文章情報の中に含まれる他の単語よりも強調させる強調表示を付与する付与部と、
    前記文章情報を前記ユーザ端末に表示する表示部とを含み、
    前記参照情報は、複数のサンプルデータ文章に対して形態素解析を行い、前記形態素解析により得られた複数の単語の情報と、前記複数のサンプルデータ文章における単語の出現頻度を表すスコアの情報とを含むデータベースであって、
    前記サンプルデータ文章は所定分野の文章で用いられた文章であり、
    前記参照情報に記録された単語は、前記複数のサンプルデータ文章における単語の出現頻度を表すスコアが所定の閾値以上の単語である、
    情報処理システム。
  2. 前記強調表示は、下線、太文字、斜体、着色、サイズ、又は背景色のいずれかを変更する表示である、
    請求項1に記載の情報処理システム。
  3. 前記強調表示は、前記不当な表示を規制する法令類の下で使用が不可能な単語の周囲に与された文字、記号、図形、枠線、イラスト、又は画像のいずれかである、
    請求項1に記載の情報処理システム。
  4. 前記付与部は、前記強調表示の周囲に、前記強調表示された文字の順番、総数又はリスク度合いを表す文字又は数字を付与する、
    請求項1に記載の情報処理システム。
  5. 情報処理システムが実行する情報処理方法であって、
    ユーザ端末から文章情報を受け付ける受付ステップと、
    前記受付ステップで受け付けた前記文章情報に、不当な表示を規制する法令類の下で使用が不可能な使用不可能単語が含まれているか否かを判定する判定ステップと、
    前記判定ステップにより、前記使用不可能単語が含まれていると判定された場合に、前記使用不可能単語の前後に隣接する単語を抽出する抽出ステップと、
    前記抽出ステップにより、抽出された単語が、予め記憶された参照情報に基づいて、所定の単語に該当する場合に、前記使用不可能単語を、前記文章情報の中に含まれる他の単語よりも強調させる強調表示を付与する付与ステップと、
    前記文章情報を前記ユーザ端末に表示させる表示ステップとを含み、
    前記参照情報は、複数のサンプルデータ文章に対して形態素解析を行い、前記形態素解析により得られた複数の単語の情報と、前記複数のサンプルデータ文章における単語の出現頻度を表すスコアの情報とを含むデータベースであって、
    前記サンプルデータ文章は所定分野の文章で用いられた文章であり、
    前記参照情報に記録された単語は、前記複数のサンプルデータ文章における単語の出現頻度を表すスコアが所定の閾値以上の単語である、
    情報処理方法。
  6. コンピュータを、請求項1から請求項4までのいずれかに1項に記載の情報処理システムの制御部として機能させるためのプログラム
JP2022162127A 2022-10-07 2022-10-07 情報処理システム、情報処理方法及びプログラム Active JP7273442B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022162127A JP7273442B1 (ja) 2022-10-07 2022-10-07 情報処理システム、情報処理方法及びプログラム
JP2023069408A JP2024055744A (ja) 2022-10-07 2023-04-20 情報処理システム、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022162127A JP7273442B1 (ja) 2022-10-07 2022-10-07 情報処理システム、情報処理方法及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023069408A Division JP2024055744A (ja) 2022-10-07 2023-04-20 情報処理システム、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP7273442B1 true JP7273442B1 (ja) 2023-05-15
JP2024055308A JP2024055308A (ja) 2024-04-18

Family

ID=86321988

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022162127A Active JP7273442B1 (ja) 2022-10-07 2022-10-07 情報処理システム、情報処理方法及びプログラム
JP2023069408A Pending JP2024055744A (ja) 2022-10-07 2023-04-20 情報処理システム、情報処理方法及びプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023069408A Pending JP2024055744A (ja) 2022-10-07 2023-04-20 情報処理システム、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (2) JP7273442B1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128774A (ja) 2008-11-27 2010-06-10 Nippon Telegr & Teleph Corp <Ntt> 固有表現抽出装置、その方法およびプログラム
JP2011186762A (ja) 2010-03-08 2011-09-22 Arches Co Ltd 文書評価付与方法、プログラム及び装置
JP2014137722A (ja) 2013-01-17 2014-07-28 Kddi Corp 規則生成装置及び抽出装置
JP2019028937A (ja) 2017-08-03 2019-02-21 株式会社 資生堂 説明文評価方法、説明文評価装置及び説明文評価プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128774A (ja) 2008-11-27 2010-06-10 Nippon Telegr & Teleph Corp <Ntt> 固有表現抽出装置、その方法およびプログラム
JP2011186762A (ja) 2010-03-08 2011-09-22 Arches Co Ltd 文書評価付与方法、プログラム及び装置
JP2014137722A (ja) 2013-01-17 2014-07-28 Kddi Corp 規則生成装置及び抽出装置
JP2019028937A (ja) 2017-08-03 2019-02-21 株式会社 資生堂 説明文評価方法、説明文評価装置及び説明文評価プログラム

Also Published As

Publication number Publication date
JP2024055308A (ja) 2024-04-18
JP2024055744A (ja) 2024-04-18

Similar Documents

Publication Publication Date Title
US20240078276A1 (en) Display Device Displaying a Keyword for Selecting a Next Slide During Presentation
Gygax et al. The masculine form and its competing interpretations in French: When linking grammatically masculine role names to female referents is difficult
CN105183761B (zh) 敏感词替换方法和装置
CN109637642B (zh) 医疗机构透析水平的考核方法、装置、设备及存储介质
US12026184B2 (en) Search document information storage device
JP2021056614A (ja) 文書審査支援装置、文書審査支援方法及びコンピュータプログラム
Rupa et al. Medicine drug name detection based object recognition using augmented reality
CN112242198B (zh) 基于大数据的失语症个性化治疗方案推荐方法及系统
US11803796B2 (en) System, method, electronic device, and storage medium for identifying risk event based on social information
JP7273442B1 (ja) 情報処理システム、情報処理方法及びプログラム
US20180046683A1 (en) Search word list providing device and method using same
JP6917400B2 (ja) 文書審査支援方法、文書審査支援装置及びコンピュータプログラム
WO2015162464A1 (en) Method and system for generating a definition of a word from multiple sources
JP6621095B1 (ja) 表示情報判定装置
CN107908792B (zh) 信息推送方法和装置
Aleman et al. Two Methodologies Applied to the Author Profiling Task.
CN108228573A (zh) 文本情感分析方法、装置及电子设备
JP6842789B1 (ja) 介護に関する計画書の作成を支援する装置、方法及びプログラム
JP7416665B2 (ja) 対話システム、及び対話システムの制御方法
US10970583B2 (en) Information processing apparatus, and non-transitory computer readable medium
JP7273439B1 (ja) 情報処理システム、情報処理方法及びプログラム
Long COVID-19: Science versus politics
CN113536169B (zh) 一种网页的文字排版方法、装置、设备和存储介质
US20230186012A1 (en) Document Processing Method, and Information Processing Device
JP6996190B2 (ja) 複合語生成装置、プログラム及び複合語生成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221007

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221206

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230421

R150 Certificate of patent or registration of utility model

Ref document number: 7273442

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150