WO2019031503A1

WO2019031503A1 - タイヤ画像の認識方法及びタイヤ画像の認識装置

Info

Publication number: WO2019031503A1
Application number: PCT/JP2018/029613
Authority: WO
Inventors: 雅之西井; 大澤　靖雄; 泰通若尾
Original assignee: 株式会社ブリヂストン
Priority date: 2017-08-10
Filing date: 2018-08-07
Publication date: 2019-02-14
Also published as: EP3667286A1; EP3667286A4; US11176408B2; JP2019035626A; JP7132701B2; US20200125887A1; CN110945337A

Abstract

品種もしくはタイヤ状態のいずれか一方もしくは両方の異なる複数のタイヤ画像を取得して、これを教師用画像とし、これらの教師用画像を一定の画素数のサイズへ変換した後、変換した複数の教師用画像データを学習用画像として、畳み込みニューラルネットワークで学習してネットワークのパラメータを設定し、しかる後に、認識対象のタイヤのタイヤ画像を取得し、これを教師用画像と同じサイズへ変換してから畳み込みニューラルネットワークに入力して、対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別するようにした。

Description

タイヤ画像の認識方法及びタイヤ画像の認識装置

　本発明は、タイヤ画像の認識方法とその装置に関する。

　タイヤは、摩耗によるトレッドゴムの減少や外傷や劣化による損傷が発生した場合に、タイヤ性能と安全性を担保するために、新品タイヤへ交換することが推奨されている。その判断のための情報取得は、主に、目視による外観観察によりなされている。
　摩耗量の判別においては、それがタイヤの走行性能や安全性能に対して重要であるにも関わらず、運転者による点検が日常的に必要な頻度で実施されているとは言い難い。
　そこで、人による目視ではなく、カメラのような機械による画像から摩耗量などのタイヤ情報を認識できれば、点検の省力化が実現できるだけでなく、管理コストの低減も期待できる。
　近年、画像処理、画像認識の技術が大きく進歩しており、例えば、タイヤのトレッドパターンを撮影し、そのアスペクト比やトレッド溝深さを解析してタイヤ摩耗量を特定するなど、タイヤの点検への活用が検討され始めている（例えば、特許文献１参照）。

ＵＳ　２０１６／０３４３１２６

　しかしながら、上記特許文献１では、トレッドパターンのエッジやラインといった特徴的な幾何学情報である特徴量を、事前に開発者などの人間が介在して設定しているため、解析パラメータが個別のケースに限定されるだけでなく、大量のタイヤを解析するには多大な時間がかかってしまうといった問題点があった。
　更に、用いる画像の明るさや角度、大きさといった個別の画像状態に解析精度が左右されてしまっていた。

　本発明は、従来の問題点に鑑みてなされたもので、タイヤの画像からタイヤ種や摩耗状態などを容易にかつ確実に認識できる方法とその装置を提供することを目的とする。

　本発明は、タイヤ画像の認識方法であって、品種もしくはタイヤ状態のいずれか一方もしくは両方の異なる複数のタイヤ画像を取得して、これを教師用画像とするステップと、前記教師用画像を、それぞれ、一定の画素数のサイズへ変換するステップと、前記変換した複数の教師用画像データを学習用画像として、畳み込み層とプーリング層とを備えた畳み込みニューラルネットワーク（CNN；Convolutional Neural Network）で学習し、前記ニューラルネットワークのパラメータを設定するステップと、認識対象のタイヤのタイヤ画像を取得し、これを前記教師用画像と同じサイズへ変換するステップと、前記変換された認識対象のタイヤのタイヤ画像を前記畳み込みニューラルネットワークに入力し、前記対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別するステップとを備えることを特徴とする。

　また、本発明は、タイヤ画像を認識する装置であって、品種もしくはタイヤ状態のいずれか一方もしくは両方の異なる複数の教師用画像と認識対象となる認識用画像とを撮影するタイヤ画像撮影手段と、前記教師用画像と前記認識用画像とを一定の画素数のサイズへ変換する画像データ変換手段と、前記画像データ変換手段で変換された画像の特徴量を抽出する特徴量抽出手段と、前記認識用画像の特徴量と教師用画像の特徴量とを比較して、前記対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別する判別手段とを備え、前記特徴量抽出手段が、前記教師用画像を学習用画像として構築した畳み込みニューラルネットワークの畳み込み層とプーリング層であり、前記判別手段が、前記畳み込みニューラルネットワークの全結合層であることを特徴とする。

　なお、前記発明の概要は、本発明の必要な全ての特徴を列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となり得る。

本発明の実施の形態に係わるタイヤ画像の認識装置を示す図である。変換画像の切り出し方法を示す図である。畳み込み層の動作を説明するための図である。プーリング層の動作を説明するための図である。全結合層の動作を説明するための図である。深層学習によるタイヤ画像の認識方法を示すフローチャートである。実施例１（摩耗識別１）のタイヤ画像と学習用画像を示す図である。実施例２（摩耗識別２）のタイヤ画像と学習用画像を示す図である。実施例４（タイヤ種識別）のタイヤ画像と学習用画像を示す図である。実施例５（トレッドパターン識別）のタイヤ画像と学習用画像の一例を示す図である。

　図１は、タイヤ画像の認識装置１０の構成を示す機能ブロック図である。
　本例のタイヤ画像の認識装置１０は、タイヤ画像撮影手段１１と、画像データ変換手段１２と、画像格納手段１３と、タイヤ認識・判別手段１４と、表示手段１５とを備え、撮影されたタイヤの画像から、当該タイヤの摩耗状態を判別する。
　タイヤ画像撮影手段１１としては、例えば、デジタルカメラやスマートフォンなどの撮影装置が用いられ、表示手段１５は、ディスプレイ等から構成される。なお、ビデオなどの動画を撮影して、その静止画を用いてもよい。
　また、画像データ変換手段１２～タイヤ認識・判別手段１４までの各手段は、ＲＯＭやＲＡＭなどの記憶装置とマイクロコンピュータのプログラムとから構成される。
　タイヤ画像撮影手段１１は、タイヤ２０の表面の画像を撮影してタイヤ画像を取得する。具体的には、タイヤ２０の周の複数の位置（例えば、６か所）を撮影して複数の画像を取得する。
　色調は、グレースケール、ＲＧＢのいずれでもよいが、タイヤは黒色なので、本例では、グレースケール画像を用いた。これにより、チャンネル数が１つで済むので、画像情報量を少なくすることができる。なお、画像階調としては、グレースケール２２５階調を０～１の範囲に規格化した画像を使用した。
　タイヤ画像撮影手段１１は、畳み込みニューラルネットワークの学習用データを取得するための、摩耗量が異なる複数の基準タイヤと、摩耗量を認識・判別するため認識用タイヤとを撮影する。
　本例では、基準タイヤの画像数を６枚、認識用タイヤの画像数を２枚とした。
　また、画像のサイズや画素数も特に限定しないが、本例では、撮影画像のサイズを、４８０×６４０ピクセルとした。また、画像範囲も特に限定しないが、画像全体にトレッドのいずれかの部分が収まっていることが望ましい。もし、画像に、風景や車両などのタイヤ２０以外の物体が写っている場合には、タイヤ部分を抽出して、これを新たにタイヤ画像とすることが望ましい。

　画像データ変換手段１２は、撮影した画像一定サイズの画像に変換する。
　具体的には、図２に示すように、撮影したタイヤ画像Ｇ₀から、矩形もしくは正方形の範囲で、タイヤ画像Ｇ₀よりもサイズが小さい複数の画像Ｇ₁～Ｇ_nを切り出し、これらを変換画像とする。このとき、変換画像Ｇ₁～Ｇ_nの各画像内には、トレッドパターンを構成する最小周期のパターンが最低でも１個収まっていることが望ましい。　
　本例では、タイヤ画像Ｇ₀のサイズを４８０×６４０ピクセルとし、変換画像Ｇ₁～Ｇ_nのサイズを２５６×２５６ピクセルとし、１枚のタイヤ画像Ｇ₀から６枚の変換画像Ｇ₁～Ｇ₆を切り出した。変換画像の個数は３６枚となる。
　画像格納手段１３は、　画像データ変換手段１２で変換された、学習用データの変換画像Ｇ_L1～Ｇ_Lnと、認識用データの変換画像Ｇ_S1～Ｇ_Snとを収納する。なお、学習用データの変換画像Ｇ_L1～Ｇ_Lnは、後述する畳み込み層やプーリング層のフィルタや全結合層のパラメータなどを決定するための教師データＧ_L1～Ｇ_Lmと、畳み込みニューラルネットワークの判別精度を確認するためのテストデータＧ_Lm+1～Ｇ_Lnとに分けて収納される。教師データの個数ｍとしては、学習用データの総数ｎの２/３以上とすることが好ましい。
　本例では、水準数を２とし、ｍを２７とした。すなわち、３６×２枚の学習用画像のうちの２７×２枚を教師画像とし、残りの９×２枚をテスト画像とした。

　タイヤ認識・判別手段１４は、特徴量抽出部１４Ａと認識・判別部１４Ｂとを備える。
　特徴量抽出部１４Ａは、畳み込み用フィルタＦ₁（ここでは、Ｆ₁₁，Ｆ₁₂）を備えた畳み込み層と、矩形フィルタＦ₂（ここでは、Ｆ₂₁，Ｆ₂₂）を備えたプーリング層とを備え、画像データ変換手段１２で変換された認識用データの変換画像Ｇ_S（Ｇ_S1～Ｇ_Sn）から認識する対象となるタイヤの画像である認識用画像の特徴量を抽出した後、各ピクセルの値を一次元に展開して認識・判別部１４Ｂに送る。
　認識・判別部１４Ｂは、入力層、隠れ層、出力層の３つの全結合層を備え、認識用画像の特徴量と教師用画像の特徴量とを比較して、対象となるタイヤの摩耗状態を認識・判別し、判別結果を「確率」の形で出力層から表示手段１５に出力する。
　全結合層は、それぞれが、図１の丸印で示す、１つ１つがある関数を有する複数個のユニット（ニューロンともいう）から構成され、かつ、前の全結合層の全てのユニットと結合されている。出力層のユニット数は、摩耗状態の水準数に等しい。
　ここでは、摩耗状態の水準数を、新品（摩耗量０ｍｍ）と摩耗量大（摩耗量１１ｍｍ）の２水準とした。
　なお、全結合層の数は２層であってもよいし、４層以上であってもよい。
　また、上記の畳み込み用フィルタＦ₁₁，Ｆ₁₂と矩形フィルタＦ₂₁，Ｆ₂₂、及び、全結合層のユニット同士を結合するパラメータ（重み、もしくは、weight）は、教師データＧ_L1～Ｇ_Lkを用いた深層学習（Deep Learning）により求められる。
　畳み込みニューラルネットワークの詳細と深層学習については後述する。
　表示手段１５は、タイヤ認識・判別手段１４の判定結果を表示画面１５Ｇに表示する。

　次に、畳み込みニューラルネットワークについて説明する。
　畳み込みニューラルネットワークは、入力画像に対してフィルタを用いた畳み込み処理を行って特徴画像を出力する畳み込み層（Convolution layer）と、抽出された特徴の位置感度を低下させることで位置変化に対する認識能力を向上させるプーリング層（Pooling layer）とを組み合わせたフィードフォワード型のニューラルネットワークで、畳み込み層とプーリング層とを何回か繰り返した後に、全結合層（fully connected layer）が配置される構成となっている。なお、畳み込み層とプーリング層とは必ずしもペアで有る必要なく、例えば、畳み込み層－畳み込み層－プーリング層としてもよい。
　畳み込み層は、入力画像に対してフィルタをかける（畳み込む）層で、入力画像の特徴を的確に捉えるためには、フィルタを複数個使うことが好ましい。
　なお、畳み込み用のフィルタは、適当な大きさの領域に含まれる各画素値を重みづけして足し合わせるもので、４次元テンソルで表せる。
　一方、プーリング層は、矩形のフィルタを入力画像内でずらして行き矩形内の最大値を取出して新しい画像を出力する（ＭＡＸプーリング）ことで抽出された特徴の位置感度を低下させる。なお、矩形内の値の平均値を採る平均値プーリングを行ってもよい。

　次に、畳み込み層の動作について、認識用画像Ｇ_kを、第１の畳み込み層にて畳み込み処理して、第１の畳み込み画像Ｇ_k（Ｆ₁₁）を得るまでを例にとって説明する。
　畳み込み用フィルタＦ₁₁としては、一般には、サイズがｐ×ｐの正方形のフィルタが用いられる。畳み込み用フィルタＦ₁₁の升目の大きさは認識用画像Ｇ_kのピクセルに相当し、升目内の数字（フィルタ値）ａ_1,1～ａ_p,pが学習により更新可能なパラメータとなっている。すなわち、学習の過程で、画像の特徴量が抽出できるように、パラメータａ_1,1～ａ_p,pが更新される。
　図３に示すように、入力画像である認識用画像Ｇ_kに、畳み込み用フィルタＦ₁₁を所定のスライド幅で掛けて、第１の畳み込み画像Ｇ_k（Ｆ₁₁）を得る。この第１の畳み込み画像Ｇ_k（Ｆ₁₁）の画素値は、畳み込み用フィルタＦ₁₁が掛けられたｐ×ｐの正方形内の認識用画像Ｇ_kの画素値とフィルタ値との内積で与えられる。なお上記の畳み込み処理より、第１の畳み込み画像Ｇ_k（Ｆ₁₁）のサイズは、認識用画像Ｇ_kのサイズよりも小さくなる。
　なお、畳み込み用フィルタＦ₁₂を用いて、後述する第２のプーリング画像Ｇ_k（Ｆ₂₁）から第２の畳み込み画像Ｇ_k（Ｆ₁₂）を得る動作も同様である。
　畳み込み用フィルタＦ₁₁，Ｆ₁₂としては、横方向のエッジを検出する横方向微分フィルタや縦方向のエッジを検出する縦方向微分フィルタなどが用いられる。

　次に、プーリング層の動作について、第１の畳み込み画像Ｇ_k（Ｆ₁₁）を、第１のプーリング層にてプーリング処理して、出力画像である第１プーリング画像を得るまでを例にとって説明する。
　本例では、図４に示すように、入力画像である第１の畳み込み画像Ｇ_k（Ｆ₁₁）内で、ｑ×ｑの矩形フィルタＦ₂₁を、所定のスライド幅でずらして行き、畳み込み用フィルタＦ₂₁が掛けられたｑ×ｑの正方形内の第１の畳み込み画像Ｇ_k（Ｆ₁₁）の画素値のうちの最大の値を取出して新しい画像である第１のプーリング画像Ｇ_k（Ｆ₂₁）を出力するMAXプーリングを行った。プーリング処理でも、第１のプーリング画像Ｇ_k（Ｆ₂₁）のサイズは、第１の畳み込み画像Ｇ_k（Ｆ₁₁）のサイズよりも小さくなる。
　矩形フィルタＦ₂₂を用いて、第２の畳み込み画像Ｇ_k（Ｆ₁₁）から第２のプーリング画像Ｇ_k（Ｆ₂₂）を得る動作も同様である。
　なお、プーリング処理では、学習の過程で更新されるパラメータは存在しない。

　全結合層は、それぞれが複数のユニットから成る入力層と隠れ層と出力層とを有するニューラルネットワークで、２次元画像である第２のプーリング画像Ｇ_k（Ｆ₂₂）を１次元のベクトルに変換したものを入力データに対してパターン分類を行う。
　図５に示すように、同図の白丸で示す全結合層の各ユニットは、前の層及び次の層の全てのユニットと、学習により更新可能なパラメータにより結合されている。
　入力層及び隠れ層のユニット数をそれぞれＮ₁、Ｎ₂、入力層の上からｍ番目（ｍ＝１～Ｎ₂）のユニットと隠れ層の上からｎ番目のユニットとの結合パラメータである重みをＷ_m,n、入力層の各ユニットの値をｕ_1,k（ｋ＝１～Ｎ₁）とすると、隠れ層の上からｎ番目のユニットへの入力値ｕ_2,mは、ｕ_2,m＝Ｗ_1,m×ｕ_1,1＋Ｗ_2,m×ｕ_1,2＋……＋Ｗ_N1,m×ｕ_1,N1となる。実際には、この入力値ｕ_2,nにバイアスｂ_2,nが加わる。バイアスｂ_2,nも、学習により更新可能なパラメータである。
　ニューラルネットワークでは、このようにして得られた入力値ｕ_2,nに、更に重み活性化関数（activation function）を通して出力することで、非線形性を高めて分類の判別精度を向上させる。
　隠れ層が複数ある場合、及び、隠れ層と出力層との関係も、同様である。
　重み活性化関数としては、tanhやジグモイド（Sigmoid）関数などが用いられるが、本例では、tanhよりも高速でかつ高性能なReLU（Rectified Linear Unit）関数を用いた。
　なお、出力層では、重み活性化関数としてSoftmax関数を用いる。
　Softmax関数は、出力層のみに用いられる特別な活性化関数で、出力層の出力値の組み合わせを確率に変換する。すなわち、出力値が０～１、出力値の総和が１（１００％）になるように出力層の出力値を変換する。

　次に、教師用画像を用いてフィルタ値ａ_1,1～ａ_p,pや重みＷ_m,nなどのパラメータを自己更新する方法について説明する。
　まず、各水準の出力値についての「正答」の出力値と、教師用画像を入力して得られた出力値との差を、誤差関数（loss function）により数値化する。本例では、教師用画像が２７×２枚であるので、５４枚のデータを畳み込みネットワークに通した時の誤差の合計が最小になるように上記のパラメータを更新する。本例では、誤差関数として交差エントロピー関数（cross-entropy loss function）を用いた。
　また、本例では、誤差を小さくする方法として、確率的勾配下降法（SGD; Stochastic Gradient Descent method）を用いるとともに、誤差関数の勾配の修正に、誤差逆伝搬法（back propagation）のアルゴリズムを用いた。
　確率的勾配下降法は、全データの中から、ミニバッチ単位で少数のサンプルだけを抜き出し、このサンプルでの全体と見做してパラメータを更新する。
　また、誤差逆伝搬法は、勾配を直接計算するのではなく、出力から入力にかけて勾配を順次求めることで、勾配を高速に求めることができる。
　なお、データ数が多い場合には、全結合層の計算を行う際に、一部のユニットをないものとして計算するDropoutの手法を用いれば、過学習を防ぐことができる。
　また、学習回数については特に限定しないが、最低１０回以上行うことが好ましい。学習が正しく行われていれば、誤差関数の値が学習を経る後に減少する。

　次に、タイヤ画像の認識方法について図６のフローチャートを参照して説明する。
　まず、ＣＮＮ（畳み込みニューラルネットワーク）の学習が終了しているか否かを確認する（ステップＳ１０）。
　学習が終了していない場合にはステップＳ１１に進み、学習が終了している場合にはステップＳ２１に進む。
　ステップＳ１１では、摩耗量が異なる複数の基準タイヤの表面を撮影して、基準タイヤの画像を取得する。
　次に、取得した基準タイヤの画像を一定サイズの大きさの複数の画像に変換（ステップＳ１２）した後、この変換された画像を複数の教師用画像とテスト用画像とに分ける（ステップＳ１３）。
　そして、これら複数の教師用画像を用いて、深層学習し、畳み込み層やプーリング層のフィルタ値、及び、全結合層の重みなどのＣＮＮのパラメータを自己更新して、学習パラメータを求め（ステップＳ１４）、これら求められた学習済みのパラメータを用いて、図１のタイヤ認識・判別手段に相当する摩耗量判別装置を構築する（ステップＳ１５）。
　そして、学習が完了した時点で、テスト用画像を用いて、摩耗量判別装置の判別精度を確認する（ステップＳ１６）。
　判別精度の確認後には、ステップＳ２１に進んで、摩耗量を認識・判別する対象となるタイヤの表面を撮影して、認識用タイヤの画像を取得する。
　次に、取得した認識用タイヤの画像を一定サイズの大きさの複数の画像に変換する（ステップＳ２２）。
　そして、これら変換された画像のデータを、前記ステップＳ１５で構築した摩耗量判別装置に入力して、認識用タイヤを認識・判別（ステップＳ２３）した後、その判別結果をディスプレイ等の表示画面に表示（ステップＳ２４）して、本処理を終了する。
　なお、次のタイヤの認識・判別を行う場合には、ステップＳ２１～ステップＳ２４の処理を行えばよい。

　以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は前記実施の形態に記載の範囲には限定されない。前記実施の形態に、多様な変更または改良を加えることが可能であることが当業者にも明らかである。そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲から明らかである。

　例えば、前記実施形態では、ここでは、摩耗状態の水準数を、新品（摩耗量０ｍｍ）と摩耗量大（摩耗量１１ｍｍ）の２水準としたが、３水準以上としてもよい。
　例えば、摩耗状態に代えて、摩耗量を判別したい場合には、教師データとして、１～２ｍｍ刻みで摩耗した複数水準のタイヤ画像を摩耗量の水準数だけラベリングして学習させておき、そのパラメータを用いて実際の判別したいタイヤの摩耗量を判別するようにすればよい。
　また、前記実施形態では、タイヤ状態をトレッド摩耗量としたが、サイドトレッドにひび割れがあるか否かなどについても、正常品と不良品とを認識して判別することも可能である。
　また、トレッドパターンから品種を特定したい場合には、品種の数をラベルとして学習させ、判別に用いればよい。
　なお、出力された判別結果は、サーバーやクラウドなどに格納しておけば、結果の情報を現場ユーザーへ告知したり、結果によってはタイヤの交換を推奨するといったサービスに用いることができる。

［実施例１］
　同一品種のタイヤにおいて、タイヤ摩耗量を、新品及び摩耗量大の２水準とした場合の識別結果について説明する。
　なお、識別方法については、図６に示したフローチャートによる。
　タイヤの仕様を下記に示す。
　・タイヤ１
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；０ｍｍ（新品のタイヤ）
　・タイヤ２
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；１１ｍｍ
　・撮影画像
　　写真はスマートフォンのカメラで、各タイヤの周長を無作為に６枚ずつ撮影した。
　　図７（ａ）がタイヤ１の画像で、図７（ｂ）がタイヤ２の画像である。
　　画像のサイズは、いずれも、４８０×６４０ピクセルである。
　・画像階調
　　グレースケール２５５階調を０～１の範囲に規格化した。
　　データ変換後の画像を図７（ｃ），（ｄ）に示す。
　　データ変換後の画像のサイズは、２５６×２５６ピクセルである。
　　２種類のタイヤに対して、それぞれ、以下のようにデータを振り分けた。
　　　Pic0,1.jpeg～Pic4,3.jpeg；教師画像２７枚
　　　Pic4,4.jpeg～Pic5,6.jpeg；テスト画像９枚
・深層学習条件
　　畳み込みの数；２
　　　フィルターサイズ；それぞれ、１６，６
　　プーリングの数；２
　　　プーリング領域；それぞれ、７，３
　　全結合層のサイズ
　　　第１層（入力層）；４００×１×２７
　　　第２層（隠れ層）；５０×１×２７
　　　第３層（出力層）；２×１×２７
　　第１層から第２層への計算では、ドロップアウト手法を適用。
　　出力値は、ソフトマックス関数で確率要素に変換。
　　誤差関数としてクロスエントロピー関数を用い、教師データとの誤差を見積もった。
　　勾配逆伝搬法で、フィルタと重み関数とを更新。
　　以上の学習サイクルを１０回繰り返し、学習パラメータを得た。
・結果
　得られた学習パラメータをテスト画像の識別テストに用いた結果を以下の表１に示す。　　　

　表１に示すように、学習回数を重ねるにつれて誤差がゼロに近付き、学習が進んでいることが確認された。
　また、判別正答率は１００％であった。
　すなわち、テスト用タイヤ１の９画像とテスト用タイヤ２の９画像の合計１８枚を、全て正しく認識・分類した。

［実施例２］
　タイヤ摩耗量が大のタイヤ２と摩耗量が中のタイヤ３とを識別した
　・タイヤ２
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；１１ｍｍ
　・タイヤ３
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；８ｍｍ
　図８（ａ），（ｂ）は、タイヤ２とタイヤ３の撮影画像で、図８（ｃ），（ｄ）は、データ変換後の画像である。
・実施条件は、実施例１に順ずる。
・結果
　判別正答率は９６％であった。
　すなわち、テスト用タイヤ２の９画像とテスト用タイヤ３の９画像の合計１８枚のうち、１７枚を正しく認識・分類した。

［実施例３］
　新品タイヤ１とタイヤ摩耗量が大のタイヤ２と摩耗量が中のタイヤ３とを識別した。
　・タイヤ１
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；０ｍｍ（新品のタイヤ）
　・タイヤ２
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；１１ｍｍ
　・タイヤ３
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；８ｍｍ
　なお、タイヤ１～タイヤ３の撮影画像とデータ変換後の画像は、図７及び図８に示したものと同じである。
　・実施条件は、実施例１に順ずる。
・結果
　判別正答率は９６％であった。
　すなわち、テスト用タイヤ１の９画像とテスト用タイヤ２の９画像とテスト用タイヤ３の９画像の合計２７枚のうち、２６枚を正しく認識・分類した。

［実施例４］
　品種の異なるタイヤ１とタイヤ４とを識別した。
　・タイヤ１
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；０ｍｍ（新品のタイヤ）
　・タイヤ４
　　　サイズ；２０５/６５Ｒ１５
　　　パターン；Ｂ
　　　摩耗量；０ｍｍ（新品のタイヤ）　
　図９（ａ），（ｂ）は、タイヤ１とタイヤ４の撮影画像で、図９（ｃ），（ｄ）は、データ変換後の画像である。
・実施条件は、実施例１に順ずる。
・結果
　判別正答率は１００％であった。
　すなわち、テスト用タイヤ１の９画像とテスト用タイヤ４の９画像の合計１８枚を、全て正しく認識・分類した。

［実施例５］
　トレッドパターンの異なるタイヤ４とタイヤ５とを識別した。
　・タイヤ４
　　　サイズ；２０５/６５Ｒ１５
　　　パターン；Ｂ
　　　摩耗量；０ｍｍ（新品のタイヤ）
　・タイヤ５
　　　サイズ；２０５/６５Ｒ１５
　　　パターン；Ｃ
　　　摩耗量；０ｍｍ（新品のタイヤ）
　図１０（ａ），（ｂ）は、タイヤ４とタイヤ５の撮影画像で、図１０（ｃ），（ｄ）は、データ変換後の画像である。
・画像に関する実施条件は、実施例１と同様である。
・深層学習条件
　　畳み込みの数；４
　　　フィルターサイズ；それぞれ、８，５，４，４
　　プーリングの数；４
　　　プーリング領域；それぞれ、５，４，４，４
　　全結合層のサイズ
　　　第１層（入力層）；２３０４×１×２７
　　　第２層（隠れ層）；なし
　　　第３層（出力層）；２×１×２７
　　他の学習条件は実施例１に順ずる。
・結果
　判別正答率は１００％であった。
　すなわち、テスト用タイヤ４の９画像とテスト用タイヤ５の９画像の合計１８枚を、全て正しく認識・分類した。

［比較例］
　畳み込み構造を持たないタイヤ識別装置にて、新品タイヤ１とタイヤ摩耗量が大のタイヤ２と摩耗量が中のタイヤ３とを識別した。
　・タイヤ１
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；０ｍｍ（新品のタイヤ）
　・タイヤ２
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；１１ｍｍ
　・タイヤ３
　　　サイズ；２４５/７０Ｒ１９．５
　　　パターン；Ａ
　　　摩耗量；８ｍｍ
・画像に関する実施条件は、実施例１と同様である。
・深層学習条件
　　畳み込み；なし
　　全結合層のサイズ
　　　第１層（入力層）；６５５３６×１×２７
　　　第２層（隠れ層）；５０×１×２７
　　　第３層（出力層）；２×１×２７
　　他の学習条件は実施例１に順ずる。
・結果
　判別正答率は５９％であった。
　すなわち、テスト用タイヤ１の９画像とテスト用タイヤ２の９画像とテスト用タイヤ３の９画像の合計２７枚のうち、１６枚しか正しく認識・分類できなかった。

　　以上まとめると、次のように記述することもできる。すなわち、本発明は、タイヤ画像の認識方法であって、品種もしくはタイヤ状態のいずれか一方もしくは両方の異なる複数のタイヤ画像を取得して、これを教師用画像とするステップと、教師用画像を、それぞれ、一定の画素数のサイズへ変換するステップと、変換した複数の教師用画像データを学習用画像として、畳み込み層とプーリング層とを備えた畳み込みニューラルネットワーク（CNN；Convolutional Neural Network）で学習し、ニューラルネットワークのパラメータを設定するステップと、認識対象のタイヤのタイヤ画像を取得し、これを前記教師用画像と同じサイズへ変換するステップと、変換された認識対象のタイヤのタイヤ画像を畳み込みニューラルネットワークに入力し、対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別するステップとを備えることを特徴とする。
　このように、タイヤ画像を認識する際に、畳み込み層とプーリング層により入力したタイヤ画像データから特徴量を抽出した後、全結合層（従来のニューラルネットワーク）にて判別する畳み込みニューラルネットワークを用いたので、ニューラルネットワーク内のパラメータが大幅に削減されて計算速度を速めることができるだけでなく、トレッドパターンのエッジやラインといった特徴的な幾何学情報を設定することなく、品種や摩耗量などのタイヤ情報を精度よく認識・判別することができる。
　また、畳み込みニューラルネットワークでは、学習時は、教師用画像データのセットに対する誤差を、勾配急降下法（GD）や確率的勾配急降下法（SGD）などを用いて誤差逆伝搬法により最小化するように、ニューラルネットワークのパラメータを更新して最適化しているので、認識対象のタイヤの判別精度を大幅に向上させることができる。
　また、前記タイヤ品種もしくはタイヤ状態が、トレッドパターン、トレッド摩耗量、ビードの傷、サイドトレッドのひび割れ、のいずれかとしたので、タイヤ交換に必要なタイヤ情報を精度よく認識・判別できる。
　また、前記教師用画像及び認識対象のタイヤのタイヤ画像に、少なくとも１つのパターン周期構造が写っているようにしたので、少ない画像情報量でタイヤ情報を正確に認識・判別できる。
　また、前記教師用画像及び認識対象のタイヤのタイヤ画像をグレースケールに変換し、前記グレースケールの階調を０～１の範囲に規格化したので、画像情報量を少なくして計算時間を短縮できる。
　また、本発明は、タイヤ画像を認識する装置であって、品種もしくはタイヤ状態のいずれか一方もしくは両方の異なる複数の教師用画像と認識対象となる認識用画像とを撮影するタイヤ画像撮影手段と、前記教師用画像と前記認識用画像とを一定の画素数のサイズへ変換する画像データ変換手段と、前記画像データ変換手段で変換された画像の特徴量を抽出する特徴量抽出手段と、前記認識用画像の特徴量と教師用画像の特徴量とを比較して、前記対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別する判別手段とを備え、前記特徴量抽出手段が、前記教師用画像を学習用画像として構築した畳み込みニューラルネットワークの畳み込み層とプーリング層であり、前記判別手段が、前記畳み込みニューラルネットワークの全結合層であることを特徴とする。
　このような構成を採ることにより、品種や摩耗量などのタイヤ情報を精度よく認識・判別することのできるタイヤ画像の認識装置を実現できる。

　１０　タイヤ画像の認識装置、１１　タイヤ画像撮影手段、
１２　画像データ変換手段、１３　画像格納手段、
１４　タイヤ認識・判別手段、１４Ａ　特徴量抽出部、
１４Ｂ　認識・判別部、１５　表示手段、２０　タイヤ。

Claims

　タイヤ画像を認識する方法であって、
品種もしくはタイヤ状態のいずれか一方もしくは両方の異なる複数のタイヤ画像を取得して、これを教師用画像とするステップと、
前記教師用画像を、それぞれ、一定の画素数のサイズへ変換するステップと、
前記変換した複数の教師用画像データを学習用画像として、畳み込みニューラルネットワークで学習し、前記ニューラルネットワークのパラメータを設定するステップと、
認識対象のタイヤのタイヤ画像を取得し、これを前記教師用画像と同じサイズへ変換するステップと、
前記変換された認識対象のタイヤのタイヤ画像を前記畳み込みニューラルネットワークに入力し、前記対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別するステップとを備えることを特徴とするタイヤ画像の認識方法。
　前記品種もしくはタイヤ状態が、トレッドパターン、トレッド摩耗量、サイドトレッドのひび割れ、のいずれかであることを特徴とする請求項１に記載のタイヤ画像の認識方法。
　前記教師用画像及び認識対象のタイヤのタイヤ画像には、少なくとも１つのパターン周期構造が写っていることを特徴とする請求項１または請求項２に記載のタイヤ画像の認識方法。
　前記教師用画像及び認識対象のタイヤのタイヤ画像をグレースケールに変換し、前記グレースケールの階調を０～１の範囲に規格化したことを特徴とする請求項１～請求項３にいずれかに記載のタイヤ画像の認識方法。
　タイヤ画像を認識する装置であって、
品種もしくはタイヤ状態のいずれか一方もしくは両方の異なる複数の教師用画像と認識対象となる認識用画像とを撮影するタイヤ画像撮影手段と、
前記教師用画像と前記認識用画像とを一定の画素数のサイズへ変換する画像データ変換手段と、
前記画像データ変換手段で変換された画像の特徴量を抽出する特徴量抽出手段と、
前記認識用画像の特徴量と教師用画像の特徴量とを比較して、前記対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別する判別手段とを備え、
前記特徴量抽出手段が、
前記教師用画像を学習用画像として構築した畳み込みニューラルネットワークの畳み込み層とプーリング層であり、
前記判別手段が、
前記畳み込みニューラルネットワークの全結合層であることを特徴とするタイヤ画像の認識装置。