WO2022030274A1

WO2022030274A1 - 振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ

Info

Publication number: WO2022030274A1
Application number: PCT/JP2021/027461
Authority: WO
Inventors: 潤住岡
Original assignee: キヤノン株式会社
Priority date: 2020-08-05
Filing date: 2021-07-26
Publication date: 2022-02-10
Also published as: JP2022031178A; US20230147581A1

Abstract

振動子に発生した振動によって、前記振動子と接触する接触体を前記振動子に対して相対的に移動させる振動型アクチュエータの制御装置であって、前記接触体を前記振動子に対して相対的に移動させるための第１の速度が指令された場合に、前記接触体を前記振動子に対して相対的に移動させるための第１の制御量を出力するよう機械学習された学習済モデルを有する制御量出力部を有することを特徴とする振動型アクチュエータの制御装置であることを特徴とする。

Description

振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ

　本発明は、振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージなどに関するものである。

　振動型アクチュエータ（超音波モータ）は、弾性体に結合された、圧電素子などの電気－機械エネルギー変換素子に交流電圧を印加することで、該電気－機械エネルギー変換素子に高周波振動を発生させる。そして、その振動エネルギーを連続的な機械運動として取り出すように構成された、非電磁駆動式のアクチュエータである。

　振動型アクチュエータは、電磁駆動式のアクチュエータと比較して、小型軽量、高精度、低速駆動時に高トルクといった優れたアクチュエータ性能（モータ性能）を有する。その一方で、非線形のアクチュエータ特性（モータ特性）を有しているので、モデル化は難しく、駆動条件や温度環境に応じて制御性が変化するので、制御系に工夫が必要となる。また、周波数、位相差、電圧振幅といった制御パラメータも多く、調整も複雑となる。

　図４５Ａは、従来の一般的なＰＩＤ制御による振動型駆動装置の制御ブロック図である（特許文献１参照）。

　後述する制御量が入力された駆動回路からは２相（Ａ相、Ｂ相）の交流電圧（交流信号）が出力される。駆動回路から出力される２相の交流電圧の、周波数（１／周期）、位相差、電圧振幅（図４５Ｂ参照）、を制御することで、振動型アクチュエータの相対速度（以下、単に「速度」ともいう）を制御することができる。尚、電圧振幅は、後述する、ＰＩＤ制御器から駆動回路へ入力されるパルス幅によって可変である。また、図４５Ｂの（１）、（２）、（３）はそれぞれ、駆動回路から出力される２相の交流電圧の周期、位相差、電圧振幅を表す。

　位置指令部によって生成された目標位置と、位置検出部によって検出された、振動型モータの相対位置と、の差分（目標位置－相対位置）である位置偏差が、ＰＩＤ制御器（制御量出力部）に入力される。そして、ＰＩＤ制御器に入力された位置偏差に応じてＰＩＤ演算された制御量（周波数、位相差、及びパルス幅）が、ＰＩＤ制御器から制御サンプリング周期毎に逐次出力される。ＰＩＤ制御器から出力された制御量が駆動回路に入力される。そして、制御量が入力された駆動回路からは２相の交流電圧が出力され、駆動回路から出力された２相の交流電圧により振動型アクチュエータの速度が制御される。そして、それらにより、位置フィードバック制御が行われる。

　図４５Ｃは、振動型アクチュエータの周波数－速度特性を模式的に示した図である。図４５Ｃには、具体的には、高速域（低周波数範囲）の周波数（ｆ１）では周波数－速度特性の傾きが大きく低速域（高周波数範囲）の周波数（ｆ２）では周波数－速度特性の傾きが小さい様子が示されている。

　図４５Ｄは、振動型アクチュエータの位相差－速度特性を模式的に示した図であり、低速域の周波数（ｆ２）と高速域の周波数（ｆ１）での位相差－速度特性を比較した図である。

　図４５Ｃや図４５Ｄに示したように、振動型アクチュエータは、使用する速度域によって周波数－速度特性の傾きや位相差－速度特性が異なるので、位相差によって制御性能が変化してしまう。

　また、環境温度による変化、例えば、常温から低温に変化した場合は圧電素子の温度特性に基づき共振周波数が高周波数側にシフトする。その場合、同じ周波数で駆動した場合の速度と傾きが異なるので、環境温度によっても制御性能が変化してしまう。

　また、振動型アクチュエータの個体差によっても速度と傾きが異なるので、個体によっても制御性能が変化してしまう。また、経時変化によっても制御性能が変化してしまう。

　これら全ての変化要因を考慮してＰＩＤ制御ゲイン（ＰＩＤ制御の比例、積分、微分ゲイン）を調整し、ゲイン余裕と位相余裕を確保するように設計する必要がある。

特開２０１６－１４４２６２号公報

　そこで、従来のＰＩＤ制御器とは異なる制御量出力部を主たる制御量出力部として有する振動型アクチュエータの制御装置などが求められていた。本発明は、従来のＰＩＤ制御器とは異なる制御量出力部を主たる制御量出力部として有する振動型アクチュエータの制御装置などを提供することを目的とする。

　本発明の一様態は、振動子に発生した振動によって、前記振動子と接触する接触体を前記振動子に対して相対的に移動させる振動型アクチュエータの制御装置であって、前記接触体を前記振動子に対して相対的に移動させるための目標速度が入力された場合に、前記接触体を前記振動子に対して相対的に移動させるための制御量を出力するように機械学習された学習済モデルを有する制御量出力部を備えることを特徴とする振動型アクチュエータの制御装置であることを特徴とする。

　本発明によれば、従来のＰＩＤ制御器とは異なる制御量出力部を主たる制御量出力部として有する振動型アクチュエータの制御装置などを提供することができる。

第１の実施形態の振動型駆動装置の制御ブロック図である。第１の実施形態の学習モデル及び学習済モデルが有するニューラルネットワーク構成を示す図である。第１の実施形態の学習モデル及び学習済モデルが有するニューラルネットワーク構成を示す図である。第１の実施形態の学習モデル及び学習済モデルが有するニューラルネットワーク構成を示す図である。リニア駆動型の振動型アクチュエータの駆動原理を説明する図である。リニア駆動型の振動型アクチュエータの駆動原理を説明する図である。リニア駆動型の振動型アクチュエータの駆動原理を説明する図である。リニア駆動型の振動型アクチュエータの駆動原理を説明する図である。レンズ鏡筒のレンズの駆動機構を説明する斜視図である。第１の実施形態の振動型駆動装置の制御ブロック図（目標偏差に代えて速度偏差を学習済モデル１０６への入力とした場合）である。第１の実施形態での、機械学習と学習済モデルによる制御のフローチャートである。学習部における、バッチ学習とオンライン学習を説明するタイミングチャートである。ニューラルネットワークのパラメータの最適化手法としてＡｄａｍを用いた場合の説明図である。ニューラルネットワークのパラメータの最適化手法としてＡｄａｍを用いた場合の説明図である。ニューラルネットワークのパラメータの最適化手法としてＡｄａｍを用いた場合の説明図である。第１の実施形態の学習モデルと実測して得た学習データを用いて、Ａｄａｍ、ＲＭＳｐｒｏｐ、Ｍｏｍｅｎｔｕｍ、ＳＧＤの演算結果を比較したものである。Ａｄａｍによる制御量（位相差）の学習例である。従来のＰＩＤ制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。本発明の制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。本発明の制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。本発明の制御装置におけるロバスト性を示す結果である。本発明の制御装置におけるロバスト性を示す結果である。第２の実施形態（ＰＩＤ制御器の制御結果を学習データとして用いる場合）の振動型駆動装置の制御ブロック図である。第３の実施形態（オープン駆動での制御結果を学習データとして用いる場合）の振動型駆動装置の制御ブロック図である。第４の実施形態（学習済モデルとＰＩＤ制御器を併用した場合）の振動型駆動装置の制御ブロック図である。第４の実施形態（学習済モデルとＰＩＤ制御器を併用した場合であって、ＰＩＤ制御器からの出力を、学習済モデルへの入力とすると共に、学習済モデルからの出力へ加算する場合）の振動型駆動装置の制御ブロック図である。第５の実施形態（学習済モデルとＰＩＤ制御器を併用した場合）の振動型駆動装置の制御ブロック図である。第６の実施形態（位相差、周波数、パルス幅を制御量として機械学習を行った学習済モデルを用いた制御を行う場合）の振動型駆動装置の制御ブロック図である。位相差、周波数、及びパルス幅を出力とするニューラルネットワーク構成を示す図である。第７の実施形態の振動型駆動装置の制御ブロック図である。第７の実施形態の学習モデル及び学習済モデル制御部が有するＮＮ構成を示す図である。第７の実施形態の学習モデル及び学習済モデル制御部が有するＮＮ構成を示す図である。第７の実施形態の学習モデル及び学習済モデル制御部が有するＮＮ構成を示す図である。第８の振動型駆動装置の制御ブロック図である。第８の実施形態の学習モデル及び学習済モデル制御部が有するＮＮ構成を示す図である。第８の実施形態の学習モデル及び学習済モデル制御部が有するＮＮ構成を示す図である。第８の実施形態の学習モデル及び学習済モデル制御部が有するＮＮ構成を示す図である。第９の実施形態の振動型駆動装置の制御ブロック図である。第９の実施形態の学習モデル及び学習済モデルが有するＨ層回帰型リカレントニューラルネットワーク構造を示す図である。第９の実施形態の学習モデル及び学習済モデルが有するＨ層回帰型リカレントニューラルネットワーク構造を示す図である。第９の実施形態の学習モデル及び学習済モデルが有するＨ層回帰型リカレントニューラルネットワーク構造を示す図である。リカレントニューラルネットワークのパラメータの最適化アルゴリズムとしてＡｄａｍを用いた場合のフローチャートなどである。従来のＰＩＤ制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。本発明の制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。本発明の制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。本発明の振動型アクチュエータの制御装置における高周波の応答性を示すシミュレーション結果である。本発明の振動型アクチュエータの制御装置における高周波の応答性を示すシミュレーション結果である。ニューラルネットワーク構造の展開図を示す図である。Ｈ層回帰型リカレントニューラルネットワーク構造の展開図を示す図である。Ｚ層回帰型リカレントニューラルネットワーク構造の展開図を示す図である。本発明の振動型アクチュエータの制御装置におけるロバスト性を示す結果である。本発明の振動型アクチュエータの制御装置におけるロバスト性を示す結果である。第１０の実施形態（ＰＩＤ制御器の制御結果を学習データとして用いる場合）の振動型駆動装置の制御ブロック図である。第１１の実施形態（オープン駆動での制御結果を学習データとして用いる場合）の振動型駆動装置の制御ブロック図である。第１２の実施形態（学習済モデルとＰＩＤ制御器を併用した場合）の振動型駆動装置の制御ブロック図である。第１３の実施形態（学習済モデルとＰＩＤ制御器を併用した場合）の振動型駆動装置の制御ブロック図である。第１４の実施形態（位相差、周波数、及びパルス幅を制御量として機械学習を行った学習済モデルを用いた制御を行う場合）の振動型駆動装置の制御ブロック図である。第１４の実施形態の学習モデル及び学習済モデルが有するＨ層回帰型リカレントニューラルネットワーク構造を示す図である。第１５の実施形態（位相差及び周波数を制御量として機械学習を行った学習済モデルを用いた制御を行う場合）の学習モデル及び学習済モデルが有するＺ層回帰型リカレントニューラルネットワーク構造を示す図である。第１５の実施形態（位相差及び周波数を制御量として機械学習を行った学習済モデルを用いた制御を行う場合）の学習モデル及び学習済モデルが有するＺ層回帰型リカレントニューラルネットワーク構造を示す図である。第１５の実施形態（位相差及び周波数を制御量として機械学習を行った学習済モデルを用いた制御を行う場合）の学習モデル及び学習済モデルが有するＺ層回帰型リカレントニューラルネットワーク構造を示す図である。第１６の実施形態の振動型駆動装置の制御ブロック図である。第１６の実施形態の振動型駆動装置のＨ層回帰型リカレントニューラルネットワーク構造を示す図である。第１７の実施形態の振動型駆動装置の制御ブロック図である。第１７の実施形態の振動型駆動装置のＨ層回帰型リカレントニューラルネットワーク構造を示す図である。第１９の実施形態の振動型駆動装置の制御ブロック図である。第２０の実施形態（学習モデルにＬＳＴＭを適用した場合）のＨ層回帰型リカレントニューラルネットワーク構造を示す図である。第２０の実施形態（学習モデルにＬＳＴＭを適用した場合）のＨ層回帰型リカレントニューラルネットワーク構造を示す図である。第２１の実施形態の振動型アクチュエータの制御装置の適用例である撮像装置の、外観を示す平面図である。第２１の実施形態の振動型アクチュエータの制御装置の適用例である撮像装置の、内部構成の概略図である。第２１の実施形態の振動型アクチュエータの制御装置の適用例である顕微鏡の外観を示す斜視図である。従来の一般的なＰＩＤ制御による振動型駆動装置の説明図である。従来の一般的なＰＩＤ制御による振動型駆動装置の説明図である。従来の一般的なＰＩＤ制御による振動型駆動装置の説明図である。従来の一般的なＰＩＤ制御による振動型駆動装置の説明図である。

　（第１の実施形態）
　図１は、本実施形態の振動型駆動装置の制御ブロック図である。振動型駆動装置１７は、制御装置１５及び振動型モータ１３（振動型アクチュエータ）を有する。図１においては、振動型駆動装置１７から振動型アクチュエータ１３を除いたものが、制御装置１５である。

　制御装置１５は、振動型アクチュエータを制御する学習済モデル制御部１０（制御部）と、駆動部１１と、速度検出部１６（速度検出手段）及び学習モデル１０６を有する機械学習部１２（学習部）と、位置検出部１４（位置検出手段）と、を有する。駆動部１１は、交流信号生成部１０４（交流信号生成手段）及び昇圧回路１０５を有する。

　振動型アクチュエータ１３は、振動子１３１及び被駆動体１３２（接触体）を有する。速度検出部１６は、振動子１３１と接触体１３２の振動子１３１に対する相対的な速度（以下、「相対速度」という）を検出する。位置検出部１４は、接触体１３２の振動子１３１に対する相対的な位置（以下、「相対位置」ともいう）を検出する。位置検出部としては、いわゆるアブソリュート・エンコーダやインクリメント・エンコーダなどが用いられるがこれらに限られない。位置検出部としては、位置情報を検出できるものであればよいからである。速度検出部１６としては、速度情報を直接的に検出するもの（速度センサ）に限られず、位置情報を演算すること等により速度情報を間接的に検出するものであってもよい。速度検出部としては、速度情報を検出できるものであればよいからである。

　制御部１０は、振動子１３１の駆動（接触体１３２の振動子１３１に対する相対的な移動）を制御する信号を生成できるよう構成される。すなわち、目標速度（第１の速度）と位置偏差とを学習済モデルに入力し、出力された位相差と周波数を振動型アクチュエータ１３の制御量（第１の制御量）として用いる。目標速度（第１の速度）とは、接触体１３２を振動子１３１に対して相対的に移動させる際に、相対速度（第２の速度、検出速度）が追従するように設定される速度である。位置偏差とは、目標位置（第１の位置）と相対位置（第２の位置、検出位置）との差である。目標位置（第１の位置）とは、接触体１３２を振動子１３１に対して相対的に移動させる際に、相対位置（第２の位置、検出位置）が追従するように設定される位置である。尚、第１の制御量として、電圧振幅を変更するためのパルス幅を用いても良い。

　制御部１０は、目標速度を生成する速度指令部１０１（速度指令手段、速度生成手段）、目標位置を生成する位置指令部１０２（位置指令手段、位置生成手段）を有する。また、制御部１０は、目標速度と位置偏差とが入力され、位相差と周波数とを出力する学習済モデル１０３（制御量出力部、制御量出力装置）を有する。

　速度指令部１０１によって、単位時間毎の目標速度が生成される。また、位置指令部１０２によって、単位時間毎の目標位置が生成される。そして、位置検出部１４によって検出された、位置指令部１０２によって生成された単位時間毎の目標位置と、速度検出部１６によって検出された単位時間毎の相対位置と、の単位時間毎の差分が位置偏差として演算される。当該差分は、単位時間毎の相対位置－単位時間毎の目標位置、である。

　ここで、目標速度及び目標位置は、例えば、単位時間としての制御サンプリング周期毎に生成される。具体的には、目標速度を表す１つの指令値が、制御サンプリング周期毎に速度指令部１０１から出力され、目標位置を表す１つの指令値が、制御サンプリング周期毎に位置指令部１０２から出力される。指令値は、目標速度自体ではなく、目標速度に対応付けられたものでもよい。制御サンプリング周期とは、図１における位置偏差の取得から、制御量の出力、振動子への交流電圧の印加、相対速度（第２の速度、検出速度）や相対位置（第２の位置、検出位置）の検出を経て、位置偏差の取得が始まる直前までの１サイクルのことをいう。前記サイクルで、振動型アクチュエータの位置又は速度がフィードバック制御される。尚、目標速度は、目標位置を単位時間毎に微分することで生成しても良い。逆に、目標速度を積分することで目標位置を生成しても良い。

　目標速度と位置偏差を用いて、学習済モデル１０３で制御量（位相差、周波数）が演算され、出力される。学習済モデル１０３は、図２に示すニューラルネットワーク（以下、「ＮＮ」ともいう）構成を有する。ＮＮは、入力層のＸ層、隠れ層のＨ層、出力層のＺ層から成る。本実施形態では、入力データとして目標速度を入力ｘ１、位置偏差を入力ｘ２に設定し、出力データとして位相差を出力ｚ１、周波数を出力ｚ２に設定した。

　入力層は２個のニューロン（Ｘ１、Ｘ２）、隠れ層は７個のニューロン（Ｈ１、Ｈ２、・・・、Ｈ７）、出力層は２個のニューロン（Ｚ１、Ｚ２）を有し、活性化関数として一般的なシグモイド関数（図２Ｂ）を用いた。隠れ層のニューロンは７個に限られないが、３～２０個の範囲が好ましい。隠れ層のニューロンの数が少ないほど学習精度は低下するが学習が速く収束し（学習速度が速くなり）、隠れ層のニューロンの数が多いほど学習精度は向上するが学習速度が遅くなり、学習精度と学習速度はトレードオフの関係にあるからである。また、出力層の活性化関数は、一般的にはシグモイド関数やＲｅＬＵ（ランプ関数）が用いられるが、制御量である位相差のマイナス符号にも対応させる為、線形関数（図２Ｃ）を用いた。

　入力層のニューロン（第１のニューロン）と隠れ層のニューロン（第２のニューロン）を結ぶ重み（第１の重み）をｗｈとした。また、隠れ層のニューロン（第２のニューロン）の閾値をθｈとした。また、隠れ層のニューロン（第２のニューロン）と出力層のニューロン（第３のニューロン）を結ぶ重みをｗｏとした。また、出力層のニューロン（第３のニューロン）の閾値をθｏとした。重みと閾値は、後述の機械学習部１２によって学習された値が適用される。学習済みのＮＮは、振動型アクチュエータの相対速度と制御量の時系列データから共通する特徴パターンを抽出した集合体と捉えることができる。したがって、出力は、重みと閾値を変数（パラメータ）とする関数によって得られる値となる。

　ＮＮから出力された制御量（位相差、周波数）は、交流信号生成部１０４に入力され、振動型アクチュエータの速度、駆動方向が制御される。交流信号生成部１０４では、位相差、周波数、及びパルス幅に基づいて、２相の交流信号が生成される。

　昇圧回路１０５は、例えば、コイルやトランスなどを有し、昇圧回路１０５によって所望の駆動電圧に昇圧された交流信号（交流電圧）は、振動子１３１の圧電素子に印加され、接触体１３２を駆動する。

　本発明を適用できる振動型アクチュエータの一例について、図面を参照しながら説明する。本発明を適用できる振動型アクチュエータは、振動子、及び接触体を有する。図３は、振動型アクチュエータの一例であるチップ型の振動子を用いるリニア駆動型（直動型）の振動型アクチュエータの駆動原理を説明する図である。図３Ａに示す振動型アクチュエータ１３は、弾性体２０３、及び弾性体２０３に接着された電気－機械エネルギー変換素子である圧電素子２０４を有する振動子１３１と、振動子１３１によって駆動される接触体１３２を有する。圧電素子２０４に交流電圧を印加することによって、図３Ｃ、図３Ｄに示すような２つの振動モードを発生させ、突起部２０２に加圧接触する接触体１３２を矢印方向に移動させる。尚、本発明を適用できる振動型アクチュエータはチップ型の振動子を用いるリニア駆動型（直動型）の振動型アクチュエータに限られず、様々な形態の振動型アクチュエータに適用できる。たとえば、チップ型の振動子を用いるリング型（回動型）の振動型アクチュエータなどにも適用できる。また、リング型の振動子を用いる円環型（回動型）の振動型アクチュエータなどにも適用できる。振動型アクチュエータとしては、電気－機械エネルギー変換素子に電圧を印加することによって振動子に発生させた振動によって、振動子と接触体を相対的に移動させることができるものであればよいからである。

　図３Ｂは、圧電素子２０４の電極パターンを示す図であり、例えば、振動子１３１の圧電素子２０４には、長手方向で２等分された電極領域が形成されている。また、各電極領域における分極方向は、同一方向（＋）となっている。圧電素子２０４の２つの電極領域のうち図３Ｂの右側に位置する電極領域には交流電圧（ＶＢ）が印加され、左側に位置する電極領域には交流電圧（ＶＡ）が印加される。

　ＶＢおよびＶＡを第１の振動モードの共振周波数付近の周波数で、かつ同位相の交流電圧とすると、圧電素子２０４の全体（２つの電極領域）がある瞬間には伸び、また別の瞬間には縮むことになる。この結果、振動子１３１には図３Ｃに示す第１の振動モードの振動（以下、突上げ振動）が発生することになる。これによって、突起部２０２には、突上げ方向（Ｚ方向）の変位が生じる。

　また、ＶＢおよびＶＡを第２の振動モードの共振周波数付近の周波数で、かつ位相が１８０°ずれた交流電圧とすると、ある瞬間には、圧電素子２０４の右側の電極領域が縮むとともに、左側の電極領域が伸びる。また、別の瞬間には逆の関係となる。この結果、振動子１３１には図３Ｄに示す第２の振動モードの振動（以下、送り振動）が発生することになる。これによって、突起部２０２には、駆動方向（送り方向、Ｘ方向）の変位が生じる。

　したがって、第１及び第２の振動モードの共振周波数付近の周波数を有する交流電圧を圧電素子２０４の電極に印加することで、第１及び第２の振動モードが合成された振動を励起することができる。

　このように、２つの振動モードを合成することによって、突起部２０２は、図３ＤにおけるＹ方向（Ｘ方向及びＺ方向と垂直な方向）に垂直な断面において、楕円運動を行う。該楕円運動によって、接触体１３２が図３Ａの矢印方向に駆動される。この接触体１３２と振動子１３１が相対移動する方向、すなわち振動子１３１によって接触体１３２が駆動される方向（ここではＸ方向）を、駆動方向と示す。

　また、第２の振動モードの第１の振動モードに対する振幅比Ｒ（送り振動振幅／突上げ振動振幅）は、２等分された電極へ入力する２相の交流電圧の位相差を変えることによって変更可能である。この振動型アクチュエータでは、振動の振幅比を変えることによって接触体の速度を変更させることが可能となる。

　尚、上記説明では、振動子１３１が静止し（固定され）、接触体１３２が移動する（駆動される）場合を例として説明したが、本発明はこの形態に限定されない。接触体と振動子は、互いの接触部の位置が相対的に変わっていればよい。例えば、接触体が静止し（固定され）、振動子が移動しても（駆動されても）良い。すなわち、本発明において、「駆動する」とは、接触体の振動子に対する相対的な位置を変化させることを意味し、必ずしも、接触体の絶対位置（例えば、接触体と振動子とを内包する筐体の位置を基準とした場合の接触体の位置）が変化することを要しない。

　尚、上記説明では、リニア駆動型（直動型）の振動型アクチュエータを例として説明した。つまり、振動子１３１又は接触体１３２が直線方向に移動する（駆動される）場合を例として説明したが、本発明はこの形態に限定されない。接触体と振動子は、互いの接触部の位置が相対的に変わっていればよい。例えば、振動子と接触体が回転方向に移動してもよい。振動子と接触体が回転方向に移動する振動型アクチュエータとしては、リング形状の振動子を有するリング型（回動型）の振動型アクチュエータなどがある。

　振動型アクチュエータは、例えば、カメラのオートフォーカス駆動などに用いられている。

　図４は、レンズ鏡筒のレンズの駆動機構を説明する斜視図である。振動型アクチュエータによるレンズホルダの駆動機構は、振動子と、レンズホルダと、このレンズホルダを摺動自在に保持する、平行に配された第１ガイドバー及び第２ガイドバーとを備えている。本実施形態において、第２ガイドバーが接触体であり、第２ガイドバーは固定され、振動子とレンズホルダが一体となって移動する場合について説明する。

　振動子は、電気－機械エネルギー変換素子に対する駆動電圧の印加によって生成された振動子の突起部の楕円運動によって、振動子と弾性体の突起部と接触する第２ガイドバーとの間に相対移動力を発生させる。これによって、振動子と一体に固定されたレンズホルダを第１及び第２ガイドバーに沿って移動可能に構成されている。

　具体的には、接触体の駆動機構３００は、主にレンズ保持部材であるレンズホルダ３０２、レンズ３０６、フレキシブルプリント基板が結合された振動子１３１、加圧磁石３０５、２つのガイドバー３０３、３０４及び不図示の基体を有する。ここでは、振動子として振動子１３１を例に説明する。

　第１のガイドバー３０３、第２ガイドバー３０４は、互いに平行に配置されるようにそれらの各ガイドバーの両端が、不図示の基体によって保持固定されている。レンズホルダ３０２は、円筒状のホルダ部３０２ａ、振動子１３１及び加圧磁石３０５を保持固定する保持部３０２ｂ、第１ガイドバー３０３と嵌合してガイドの作用をなす第１のガイド部３０２ｃを有する。

　加圧部を構成するための加圧磁石３０５は、永久磁石及び永久磁石の両端に配置される２つのヨークを有する。加圧磁石３０５と第２ガイドバー３０４との間に磁気回路が形成され、これら部材間に吸引力が発生する。加圧磁石３０５は第２ガイドバー３０４とは間隔を設けて配置されており、第２ガイドバー３０４は振動子１３１と接するように配置されている。

　前記の吸引力によって第２ガイドバー３０４と振動子１３１との間に加圧力が与えられる。弾性体の２箇所の突起部が第２ガイドバー３０４と加圧接触して第２のガイド部を形成する。第２のガイド部は磁気による吸引力を利用してガイド機構を形成しており、外力を受けるなどによって振動子１３１と第２ガイドバー３０４が引き離される状態が生じるが、これに対しては、つぎのように対処されている。

　すなわち、レンズホルダ３０２に備えられる脱落防止部３０２ｄが第２ガイドバー３０４に当たることで、レンズホルダ３０２が所望の位置に戻るように対応が施されている。振動子１３１に所望の交流電圧（交流信号）を与えることで振動子１３１と第２ガイドバー３０４との間に駆動力が発生し、この駆動力によってレンズホルダの駆動が行われる。

　接触体１３２または振動子１３１に取り付けられた不図示の位置センサによって、相対位置及び相対速度が検出される。相対位置は、制御部１０に位置偏差としてフィードバックされることで、単位時間毎の目標位置に追従するように振動型アクチュエータはフィードバック制御される。相対速度は、機械学習部１２に入力されて、制御部１０から出力される制御量（位相差、周波数）と共に学習データとして使用される。学習データとは、入力データ及び出力データ（正解データ）のペアで構成されるデータのことである。本実施形態では、入力データとしての相対速度及び出力データ（正解データ）としての制御量（位相差、周波数）のペアで構成されるデータが学習データである。尚、本実施形態は、電気－機械エネルギー変換素子である圧電素子を２相に分けて駆動する２相駆動の制御装置を例にとり説明するが、本発明は２相駆動に限定されるものではなく、２相以上の振動型アクチュエータにも適用できる。

　次に、機械学習部１２を詳細に説明する。学習モデル１０６は、速度検出部１６からの相対速度と目標偏差を入力とし、位相差及び周波数を出力とするＮＮ構成（図２参照）を有する。目標偏差とは、接触体１３２を振動子１３１に対して相対的に移動させる際に、位置偏差が追従するように設定される値である。目標偏差は、ここでは、位置偏差と同じ次元（データ形式）の値である。目標偏差は、例えば、ゼロと設定されるが、メカ系のガタを補償するようにオフセット値を与えても良い。また、学習モデル１０６は、目標偏差に代えて、目標速度と検出速度との差分である速度偏差を入力としても良い（図５参照）。速度偏差を与えた場合、従来では取得できなかったモータ特性を副次的に学習できる事を発見した。具体的には、速度偏差に含まれる多様な振動成分と制御量の関係に基づき振動型アクチュエータの周波数応答（所謂、伝達特性）に相当する特徴が学習されており、入力とする位置偏差に係るＮＮの重み値と閾値は適切な値に学習され、制御系を補償することができる。

　制御部１０から出力される制御量（位相差、周波数）は正解データとして用いられ、未学習または学習中の学習モデル１０６から出力される制御量と比較し、誤差が算出される。尚、本例は位相差と周波数を制御量としたが、これ以外にも、パルス幅と周波数、パルス幅と位相差、の組み合わせも制御量とすることができる。また、ＮＮの出力層のニューロンを１つとしても良く、制御量として、位相差、周波数、及びパルス幅のうちのいずれかを選択するよう設計しても良い。

　図６は、本実施形態での、機械学習と学習済モデルによる制御のフローチャートである。ステップ１（Ｓ１）で、制御部の学習モデル１０３の重みと閾値に初期値がランダム関数に基づいて設定される（未学習状態）。ステップ２（Ｓ２）で、前記未学習モデル（未学習のＮＮ）によって振動型アクチュエータの制御が行われる。

　ステップ３（Ｓ３）で、振動型アクチュエータの駆動中に未学習モデルから出力された制御量（位相差、周波数）と、速度検出部１６によって検出された相対速度と、の時系列データが、学習データとして取得される。

　ステップ４（Ｓ４）で、前記学習データの制御量を正解データとして、学習モデル１０６を用いた機械学習による最適化演算が行われる。最適化とは、ＮＮへの入力によるＮＮからの出力が、学習データに近づくように、ＮＮのパラメータを調整することであり、ＮＮへの入力によるＮＮからの出力が、学習データと一致するように、ＮＮのパラメータを調整することに限られない。尚、学習モデル１０６は、制御に用いる学習済モデル１０３と同じＮＮ構成を有する。機械学習によってＮＮの重みと閾値が最適化され、制御部の学習済モデル１０３のパラメータが更新される。

　ステップ５（Ｓ５）で、重みと閾値が更新された学習済モデル１０３によって振動型アクチュエータの制御が行われる。機械学習部１２は、これらステップを不図示のコンピュータに実行させるプログラムを有している。

　制御後は、駆動条件や温度環境の変化に対応するため、ステップ３（Ｓ３）に戻り、学習データの取得が行われる。学習データの取得方法として、駆動停止中に学習を行うバッチ学習や、駆動中に逐次学習を行うオンライン学習などが実施される。

　図７は、機械学習部１２における、バッチ学習とオンライン学習（振動型アクチュエータの制御装置の製造方法）を説明するタイミングチャートである。横軸は時間を示し、縦軸は振動型アクチュエータをフィードバック制御するために指令値として与える目標位置パターンを示す。

　図７（ａ）は、駆動停止中（接触体を振動子に対して相対的に移動させる場合以外の場合）に学習を行うバッチ学習の例を示す。本例は、振動型アクチュエータの駆動期間において検出した相対速度と制御量の時系列データを学習データとして取得し、停止期間を利用して機械学習とＮＮのパラメータを更新（重み、閾値）するものである。尚、停止期間毎に必ずしも機械学習を行う必要はなく、例えば、温度環境や駆動条件の変化を検知した場合のみ学習する方法も可能である。

　図７（ｂ）は、駆動中（接触体を振動子に対して相対的に移動させる場合）に逐次学習を行うオンライン学習の例を示す。本例は、振動型アクチュエータ駆動期間と併行してオンラインで機械学習を行い、駆動期間中にＮＮのパラメータを更新するものである。オンライン学習の適用によって、バッチ学習では対応することができない、駆動期間中に生じる負荷変動にも対応することが可能となる。

　前述のステップ４（Ｓ４）の機械学習について、図８Ａ以下を用いて更に説明する。図８Ａは、ＮＮのパラメータの最適化手法（最適化アルゴリズム）としてＡｄａｍを用いた場合のフローチャートなどである。

　ステップ１～ステップ２（Ｓ１～Ｓ２）は、前述の図６で説明した通りである。

　ステップ３（Ｓ３）で、図８Ｂに示す時系列の学習データである制御量（ｎ）と検出速度（ｎ）を取得する。制御量（ｎ）と検出速度（ｎ）は、未学習モデルによって振動型アクチュエータ１３を制御した場合の測定データであり、制御量（ｎ）によって振動型アクチュエータ１３が駆動されたときに速度検出部１６によって検出された速度が検出速度（ｎ）である。制御量（位相差）と検出速度の各サンプル数ｎは３４００個である。これは、制御サンプリングレート（１／制御サンプリング周期）１０ｋＨｚで０．３４ｓｅｃ駆動した場合の実測データである。

　尚、学習データは必ずしも制御サンプリングレートで取得する必要はなく、間引くことでメモリの節約と学習時間の短縮が可能である。本発明は、検出速度（ｎ）を学習モデル１０６の入力とし、学習モデル１０６によって演算（導出）され出力された結果である出力ｚ（ｎ）を、学習データの正解データにあたるｔ（ｎ）と比較して、誤差ｅ（ｎ）を算出する。具体的には、誤差ｅ（ｎ）は、誤差ｅ（ｎ）＝（ｔ（ｎ）－ｚ（ｎ））^２とした。

　ステップ４（Ｓ４）で、３４００個分の誤差Ｅ（＝Σｅ（ｎ）＝Σ（ｔ（ｎ）－ｚ（ｎ））^２）が１回目のループで算出され、重み（ｗｈ、ｗｏ）と閾値（θｈ、θｏ）の誤差勾配∇Ｅがそれぞれ演算される。

　次に、誤差勾配∇Ｅを用いて、最適化演算手法（最適化アルゴリズム）の１つであるＡｄａｍを用いて下記のようにパラメータの最適化が行われる。

　ｗ_ｔはパラメータ更新量、∇Ｅは誤差勾配、ｖ_ｔは誤差勾配の移動平均、ｓ_ｔは誤差勾配の二乗の移動平均、ηは学習率、εはゼロ割防止定数である。各パラメータ、はη＝０．００１、β_１＝０．９、β_２＝０．９９９、ε＝１０ｅ－１２を用いた。最適化演算を繰り返す毎に重みと閾値が更新され、学習モデルの出力ｚ（ｎ）は、正解データにあたるｔ（ｎ）に近づいていくので、誤差Ｅは小さくなっていく。

　最後に、ステップ５（Ｓ５）で、重みと閾値が更新された学習済ＮＮによって振動型アクチュエータの制御が行われる。

　図８Ｃは、演算ループ回数に基づく誤差Ｅの推移を示したものである。尚、最適化手法（最適化アルゴリズム）として、これ以外の手法（アルゴリズム）を用いても良い。

　図９Ａは、本実施形態の学習モデル１０６と実測して得た学習データを用いて、Ａｄａｍ、ＲＭＳｐｒｏｐ、Ｍｏｍｅｎｔｕｍ、ＳＧＤによる演算結果を比較したものである。演算回数と安定性、最終的な誤差、の観点から、Ａｄａｍで最も優秀な結果が得られた。

　図９Ｂは、Ａｄａｍによる制御量（位相差）の学習例である。ループ１回目の学習モデルの出力ｚは、正解データの制御量ｔと大きく異なる様子がわかる。演算を繰り返し、ループ５０００回目の学習モデルの出力ｚは、正解データの制御量ｔとほぼ一致している。本学習例は、ループ回数を５０００回として最適化を行ったが、収束率に応じて、回数は適宜調整するのが望ましい。

　以上が本発明の制御装置の構成である。尚、制御部１０と機械学習部１２は、例えば、ＣＰＵ、ＰＬＤ（ＡＳＩＣを含む）などのデジタルデバイスや、Ａ／Ｄ変換器などの素子から構成される。また、駆動部１１の交流信号生成部１０４は、例えば、ＣＰＵや関数発生器とスイッチング回路を有し、駆動部１１の昇圧回路１０５は、例えば、コイルや、トランス、コンデンサから構成される。尚、制御部１０、機械学習部１２及び駆動部１１は、１つの素子や回路から構成されるだけではなく、複数の素子や回路から構成されていてもよい。また、制御部１０、機械学習部１２及び駆動部１１における各処理を、いずれの素子や回路が実行してもよい。

　図１０Ａ、図１０Ｂ及び図１０Ｃは、従来のＰＩＤ制御と本発明の学習済モデルによる制御とにおいて、所定の目標位置パターンでフィードバック制御を行った場合の結果を比較したものである。目標速度は最大５０ｍｍ／ｓの台形駆動で、位置決め動作を含む５ｍｍストロークの往復動作を行うパターンである。横軸は時間（ｓｅｃ）、縦軸は上から順に位相差制御量（ｄｅｇ）、検出速度（ｍｍ／ｓ）と速度偏差（ｍｍ／ｓ）、目標位置（エンコーダパルス数：１ｍｍあたり８０００ｐｌｓ）と位置偏差（μｍ）を示す。

　図１０Ａは、従来のＰＩＤ制御器を用いた振動型アクチュエータの制御装置（図４７Ａ参照）による結果である。従来のＰＩＤ制御による制御では、振動型アクチュエータ１３に印加する交流電圧の周波数（駆動周波数）は９３ｋＨｚに固定した。また、振動型アクチュエータ１３を、位相差のみで制御した。

　速度偏差及び位置偏差のうち、特に位置偏差が加減速領域で大きくなる傾向にある。これは、振動型アクチュエータが駆動する被駆動体のイナーシャ（慣性）が影響する為である。また、停止整定するまでに（目標位置が変化しなくなってから実位置が変化しなくなるまでに）長時間を要している様子が分かる。尚、ＰＩＤ制御ゲインを更に大きくすれば位置偏差を低減することは可能だが、駆動条件（使用する周波数範囲９１ｋＨｚ～９５ｋＨｚ）や環境温度の変化に対するロバスト性を確保するため、一定のゲイン余裕と位相余裕を有するＰＩＤ制御ゲインを適用した。

　図１０Ｂは、本発明の学習済モデルを用いた振動型アクチュエータの制御装置による制御結果である。同様に、駆動周波数は９３ｋＨｚに固定し、位相差のみで制御した。本発明の適用によって、位置偏差は加減速及び停止整定時の全ての領域において改善することが分かった。

　図１０Ｃは、学習済モデルを用いた振動型アクチュエータの制御装置による制御結果である。駆動周波数は９３ｋＨｚを起点とし、位相差と併行して周波数が操作され、それによって、駆動周波数が操作される。尚、周波数は符号なし絶対値であり、駆動周波数は常に９３ｋＨｚを基準として低周波数側に操作される。本例のように、制御量が複数ある場合、機械学習において所定の速度が得られる制御量の組み合わせは無数に考えられる。従って、学習データを取得する時点で制御量の関係性を規定しておく必要がある。

　本実施形態では、周波数と位相差の比を規定することで学習を行った。これ以外にも、例えば、ＮＮのパラメータをランダム関数で設定し、複数の学習結果を比較することで、位置偏差や電力が最も良好な結果を示すパラメータで規定するのも良い。制御量を位相差と周波数を用いることによって、振動型アクチュエータの速度レンジを拡大することができ、速度偏差、位置偏差はＰＩＤ制御より改善することが分かった。尚、図１０Ｂと図１０Ｃにおいて、仮想的なＰＩＤ制御の位相差の変化を表示している（最上段の図）。これは、振動型アクチュエータの制御には直接使用されないが、位置偏差に基づき観測器としてＰＩＤ演算を行った制御量の出力である。

　このＰＩＤ制御量を利用することで、学習済モデルの制御の異常検知を行うことができる。すなわち、学習済モデルが出力する制御量とＰＩＤ制御量を比較することで、所定の範囲から大きくずれることがあればＮＮのパラメータが正常値から外れていることを予測でき、パラメータをリセットする事ができる。本機能は本発明の効果を得る上で必須の構成ではないが、学習済モデルによる制御の性能保証という観点で信頼性を上げることができる。図１１は、本発明の制御装置におけるロバスト性を示す結果である。所定の目標位置パターンでフィードバック制御を行い、目標速度は最大５０ｍｍ／ｓの台形駆動で、位置決め動作を含む５ｍｍストロークの往復動作を行うパターンである。横軸は時間（ｓｅｃ）、縦軸はエンコーダのパルス単位での目標位置（左軸）、μｍ単位での位置偏差（右軸）を示す。

　図１１Ａは、周波数９５ｋＨｚで機械学習を行った学習済モデルによる制御結果、図１１Ｂは、周波数９１ｋＨｚで機械学習を行った学習済モデルによる制御結果を示す。図４５Ａ、図４５Ｂ、図４５Ｃ、図４５Ｄを用いて説明した前述のように、異なる周波数で制御を行うと振動型アクチュエータの非線形特性によって速度の傾きが変化するので、従来のＰＩＤ制御では対応が難しかった。

　本発明は、機械学習によって速度カーブの傾き変化に対応した学習済モデルを生成することができるので、異なる周波数においても良好な制御性を得ることができる。

　（第２の実施形態）
　本発明の機械学習の他の実施形態について説明する。図１２は、ＰＩＤ制御での制御結果を学習データとして用いる場合の振動型駆動装置の制御ブロック図である。図１２においては、振動型アクチュエータ１３を除いたものが、制御装置である。本制御ブロックにおいて、振動型アクチュエータ１３の位置フィードバック制御は、ＰＩＤ制御器９０１を用いて行われる。ＰＩＤ制御器９０１には位置偏差が入力され、ＰＩＤ制御器９０１からはＰＩＤ演算された制御量としての位相差と周波数が出力される。尚、制御器としてはＰＩＤ制御器以外の構成でも良く、例えば、Ｐ制御器、ＰＩ制御器、ＰＤ制御器なども適用できる。

　機械学習部１２において速度検出部１６によって検出された相対速度（検出速度）と、ＰＩＤ制御器９０１から出力された制御量（位相差、周波数）と、を用いて学習モデル１０６の機械学習が行われる。本実施形態の特徴としては、ＰＩＤ制御器による制御結果と、ＰＩＤ制御器の制御量を正解データとして機械学習を行った学習済モデルによる制御結果を比較できることである。ＰＩＤ制御器との比較によって、学習が上手く出来たかどうかを判定することができ、学習済モデルの信頼性を保証することができる。

　（第３の実施形態）
　本発明の機械学習の他の実施形態について説明する。図１３は、オープン駆動での制御結果を学習データとして用いる場合の振動型駆動装置の制御ブロック図である。図１３においては、振動型アクチュエータ１３を除いたものが、制御装置である。本制御ブロックの特徴として、振動型アクチュエータ１３のフィードバック制御は行われない。

　駆動パターン生成部１００１（駆動パターン指令部）によって生成された任意のパターン波形がオープン駆動部１００２から交流信号生成部１１１に出力（指令）される。例えば、ＳＩＮ波パターンや矩形パターンの繰り返し信号が用いられる。

　本実施形態では、同一周波数の位相差と周波数のＳＩＮ波パターンを各々出力する。尚、各ＳＩＮ波の振幅の比率を調整することで、学習済モデルの制御性能を調整することができる。本例では、位相差のＳＩＮ波振幅を９０ｄｅｇ、周波数のＳＩＮ波振幅を１ｋＨｚとした。

　機械学習部１２において速度検出部１６によって検出された相対速度と、オープン駆動部１００２から出力された制御量（位相差、周波数）と、を用いて学習モデル１０６の機械学習が行われる。本実施形態の特徴としては、オープン駆動部による制御結果と、オープン駆動部の制御量を正解データとして機械学習を行った学習済モデルによる制御結果を比較できることである。オープン駆動部との比較によって、学習が上手く出来たかどうかを判定することができ、学習済モデルの信頼性を保証することができる。

　（第４の実施形態）
　図１で示した、第１の実施形態における制御部１０の他の実施形態について説明する。図１４は、学習済モデルとＰＩＤ制御器を併用した場合の振動型駆動装置の制御ブロック図である。図１４においては、振動型アクチュエータ１３を除いたものが、制御装置である。本制御ブロックにおいて、振動型アクチュエータ１３の位置フィードバック制御は、ＰＩＤ制御器１４０１（第１のＰＩＤ制御器）と学習済モデル１０３とを用いて行われる。

　第１のＰＩＤ制御器１４０１には位置偏差が入力され、第１のＰＩＤ制御器１４０１からはＰＩＤ演算された位置偏差が出力される。尚、ＰＩＤ制御器以外の構成でも良く、例えば、Ｐ制御器、ＰＩ制御器、ＰＤ制御器なども適用できる。

　学習済モデル１０３には、目標速度と、ＰＩＤ演算された位置偏差と、が入力される。同様に、機械学習部１２において速度検出部１６によって検出された相対速度と、学習済モデル１０３から出力された制御量（位相差、周波数）と、を用いて学習モデル１０６の機械学習が行われる。尚、ＰＩＤ演算された位置偏差を、学習済モデル１０３への入力とすると共に、後述する第５の実施形態のように、学習済モデル１０３からの出力（制御量）へ加算してもよい（図１５参照）。これは、位置偏差のＰＩＤ演算量を学習済モデル１０３に対して直列且つ、並列に機能させる為である。直列成分によって位置偏差の効きを大幅に高めることができ（応答性が高まる）、更に並列成分によって制御系を安定化させる効果が得らえる。本発明の学習済モデル１０３は、このようにＰＩＤ演算器を直列且かつ並列に構成することもでき、自由度の高い制御系を構築できる。

　本実施形態を適用することによって、学習済モデルに入力する位置偏差のゲイン調整を行うことができるので、より細かな制御系の調整を行うことができる。

　（第５の実施形態）
　図１で示した、第１の実施形態における制御部１０の他の実施形態について説明する。図１６は、学習済モデルとＰＩＤ制御器を併用した場合の振動型駆動装置の制御ブロック図である。図１６においては、振動型アクチュエータ１３を除いたものが、制御装置である。本制御ブロックにおいて、振動型アクチュエータ１３の位置フィードバック制御は、ＰＩＤ制御器１５０１（第２のＰＩＤ制御器）から出力された制御量と、学習済モデル１０３から出力された制御量と、を加算して行われる。

　第２のＰＩＤ制御器１５０１には位置偏差が入力され、ＰＩＤ演算された位相差と周波数が出力される。尚、ＰＩＤ制御器以外の構成でも良く、例えば、Ｐ制御器、ＰＩ制御器、ＰＤ制御器なども適用できる。また、ＰＩＤ制御器の後段に位相補償器を配しても良い。学習済モデル１０３には、目標速度と位置偏差とが入力されるが、位置偏差はゼロとしても良い。

　学習済モデル１０３から位相差と周波数が出力され、第２のＰＩＤ制御器１５０１から出力された位相差と周波数が各々加算される。加算された制御量と、速度検出部１６によって検出された相対速度と、は機械学習部１２に入力され、学習モデル１０６の機械学習が行われる。

　（第６の実施形態）
　図１で示した、第１の実施形態における制御部１０の他の実施形態について説明する。図１７は、位相差、周波数、及びパルス幅を制御量として機械学習を行った学習済モデルを用いた制御を行う場合の振動型駆動装置の制御ブロック図である。図１７においては、振動型アクチュエータ１３を除いたものが、制御装置である。本制御ブロックにおいて、振動型アクチュエータ１３の位置フィードバック制御は、学習済モデル１６０１から出力される各制御量（位相差、周波数、及びパルス幅）によって行われる。

　学習済モデル１６０１には、目標速度と位置偏差が入力され、ＮＮで演算された位相差、周波数、及びパルス幅が駆動部１１に出力されて振動型アクチュエータ１３は制御される。機械学習部１２では、学習済モデル１６０１から出力された３つの制御量と、速度検出部１６によって検出された相対速度を学習データとして取得し、学習モデル１６０２による機械学習が行われる。図１８は、位相差、周波数、及びパルス幅を出力とするニューラルネットワーク構成を示す図である。学習済モデル１６０１と学習モデル１０６２は目標速度と位置偏差を入力とし、３つの制御量を出力とするＮＮ構成を有する。機械学習に用いる学習データは、前述のように学習済モデルによる制御の測定データを用いても良いし、ランダム関数でパラメータを設定した未学習モデルによって振動型アクチュエータを制御した場合の測定データでも良い。それ以外にも、オープン駆動による測定データ、ＰＩＤ制御による測定データを用いても良い。

　尚、ＮＮの重みと閾値を決定する際、複数の学習データから位置偏差や消費電力などの観点で最適な条件のパラメータを選定しても良い。これは、振動型アクチュエータの所定の速度が得られる条件、すなわち位相差、周波数、パルス幅の組み合わせは無数に存在する為である。

　本実施形態を適用することによって、振動型アクチュエータを操作するパラメータが増えるので、適切な機械学習を行うことで細かな制御性能の調整を行うことができる。

　（第７の実施形態）
　図１で示した、第１の実施形態における制御部１０の他の実施形態について説明する。図１９は、図１の振動型駆動装置から、位置指令部１０２、位置検出部１４などを除いた場合の振動型駆動装置の制御ブロック図に相当する。図１９においては、振動型アクチュエータ１３を除いたものが、制御装置である。図２０は、図１９で使用される学習モデル及び学習済モデル制御部が有するＮＮ構成を示す図である。

　このような形態においても、これまでの実施形態と同様に、学習済モデルを生成することができる。

　図１で示した、第１の実施形態における制御部１０の他の実施形態について説明する。図２１は、図１の振動型駆動装置から、位置指令部１０２、位置検出部１４などを除き、位置偏差によるフィードバックループ制御に代え、速度偏差によるフィードバック制御を行う場合の振動型駆動装置の制御ブロック図に相当する。図２１においては、振動型アクチュエータ１３を除いたものが、制御装置である。図２２は、図２１で使用される学習モデル及び学習済モデル制御部が有するＮＮ構成を示す図である。

　（第８の実施形態）
　これまでの実施形態において、第１の速度が指令された場合に、第１の制御量を出力するよう機械学習された学習済モデルを有する制御量出力部を制御装置が有しているならば、制御装置から学習部を除いても良い。このような制御装置では学習済モデルは再び機械学習ができないというデメリットが存在するものの、再び機械学習を行う必要性が低い振動型駆動装置においては、学習部が除かれた分、構成が簡素になるというメリットがある。

　これまでの実施形態において、学習済モデルが有していたパラメータ（第１の重み、第２の重み、第２のニューロンの閾値、及び第３のニューロンの閾値）を記憶する記憶部を有するようにしてもよい。そして、学習済モデルは、記憶部が記憶するパラメータによって、学習済モデルが有するパラメータが置換されることによって機械学習されてもよい。記憶部には、ＲＯＭなどのメモリが用いられるがこれに限られない。記憶部としては、学習済モデルが有していたパラメータを記憶できるものであればよいからである。

　また、これまでの実施形態において、環境状態を検知する環境センサを有するようにしてもよい。そして、学習済モデルは、前記環境センサによって環境の変化を検知した場合に、機械学習されてもよい。環境センサは、温度センサ及び湿度センサのうちの少なくとも１つであるようにしてもよい。

　（第９の実施形態）
　図２３は、本実施形態の振動型駆動装置の制御ブロック図である。振動型駆動装置１７は、制御装置１５及び振動型アクチュエータ１３を有する。図２３においては、振動型駆動装置１７から振動型アクチュエータ１３を除いたものが、制御装置１５である。

　制御装置１５は、振動型アクチュエータを制御する学習済モデル制御部１０（制御部）と、駆動部１１と、学習モデル１１６を有する機械学習部１２と、位置検出部１４と、を有する。駆動部１１は、交流信号生成部１０４及び昇圧回路１０５を有する。

　振動型アクチュエータ１３は、振動子１３１及び接触体１３２を有する。速度検出部１６は、接触体１３２の振動子１３１に対する相対的な速度（相対速度）を検出する。位置検出部１４は、接触体１３２の振動子１３１に対する相対的な位置（相対位置）を検出する。位置検出部としては、いわゆるアブソリュート・エンコーダやインクリメント・エンコーダなどが用いられるがこれらに限られない。速度検出部１６としては、直接速度情報を検出するもの（速度センサ）に限られず、位置情報を演算することにより速度情報を間接的に検出するものであってもよい。

　制御部１０は、振動子１３１の駆動（接触体１３２の振動子１３１に対する相対的な移動）を制御する信号を生成できるよう構成される。すなわち、目標速度と位置偏差とを学習済モデルに入力し、出力された位相差と周波数を振動型アクチュエータ１３の制御量（第１の制御量）として用いる。目標速度とは、接触体１３２を振動子１３１に対して相対的に移動させる際に、実速度（検出速度）が追従するように設定される速度である。位置偏差とは、目標位置と実位置（検出位置）との差である。目標位置とは、接触体１３２を振動子１３１に対して相対的に移動させる際に、実位置（検出位置）が追従するように設定される位置である。尚、制御量として電圧振幅を変更するためのパルス幅を用いても良い。

　制御部１０は、目標速度を指令する速度指令部１０１、目標位置を指令する位置指令部１０２を有する。また、制御部１０は、目標速度と位置偏差とが入力され、位相差と周波数とを出力する学習済モデルを有する制御量出力部１１３を有する。尚、以下では、「学習済モデルを有する制御量出力部」を、単に、「学習済モデル」ともいう。

　駆動部１１は、交流信号生成部１０４及び昇圧回路１０５を有する。

　速度指令部１０１によって、単位時間毎の目標速度が生成され指令される。また、位置指令部１０２によって、単位時間毎の目標位置が生成され指令される。そして、目標位置と、位置検出部１４によって検出された検出位置と、の単位時間毎の差が、位置偏差として演算される。当該差は、単位時間毎の検出位置－単位時間毎の目標位置、である。

　ここで、目標速度及び目標位置は、例えば、単位時間としての制御サンプリング周期毎に生成される。具体的には、目標速度を表す１つの指令値が、制御サンプリング周期毎に速度指令部１０１から出力され、目標位置を表す１つの指令値が、制御サンプリング周期毎に位置指令部１０２から出力される。指令値は、目標速度自体ではなく、目標速度に対応付けられたものでもよい。

　制御サンプリング周期とは、図２３における位置偏差の取得から、制御量の出力、振動子への交流電圧の印加、実速度（検出速度）や実位置（検出位置）の検出を経て、位置偏差の取得が始まる直前までの１サイクルのことをいう。前記サイクルで、振動型アクチュエータの位置又は速度がフィードバック制御される。尚、目標速度は、目標位置を単位時間毎に微分することで生成しても良い。逆に、目標速度を積分することで目標位置を生成しても良い。

　目標速度と位置偏差を用いて、学習済モデル１１３で制御量（位相差、及び周波数）が演算され、出力される。学習済モデル１１３は、図２４Ａ、図２４Ｂ、図２４Ｃに示すリカレントニューラルネットワーク（以下、「ＲＮＮ」ともいう）構造を有する。ＲＮＮは、入力層のＸ層、隠れ層のＨ層、出力層のＺ層、そして状態層のＣ層から成り、いわゆるディープラーニング構造を有する。時系列情報を記憶しながら機械学習を行っていくＲＮＮの特徴を活かし、振動型アクチュエータのフィードバック制御に応用したのが本発明の特徴である。本実施形態では、入力データとして目標速度を入力ｘ１、位置偏差を入力ｘ２に設定し、出力データとして位相差を出力ｚ１、周波数を出力ｚ２に設定した。

　入力層は２個のニューロン（Ｘ１、Ｘ２）、隠れ層は７個のニューロン（Ｈ１、Ｈ２、・・・、Ｈ７）、出力層は２個のニューロン（Ｚ１、Ｚ２）を有し、活性化関数として一般的なシグモイド関数（図２４Ｂ）を用いた。隠れ層のニューロンは７個に限られないが、３～２０個の範囲が好ましい。隠れ層のニューロンの数が少ないほど学習精度は低下するが学習が速く収束し（学習速度が速くなり）、隠れ層のニューロンの数が多いほど学習精度は向上するが学習速度が遅くなり、学習精度と学習速度はトレードオフの関係にあるからである。また、出力層の活性化関数は、一般的にはシグモイド関数やＲｅＬＵ（ランプ関数）が用いられるが、制御量である位相差のマイナス符号にも対応させる為、線形関数（図２４Ｃ）を用いた。

　状態層は７個のニューロン（Ｃ１、Ｃ２、・・・、Ｃ７）を有し、隠れ層の出力は状態層の各ニューロンに保持される。つまり、時系列データの１制御サンプリング前のデータが保持されていることになる。状態層に保持されたデータは、次の制御サンプリング時に状態層に回帰される。従って、隠れ層には、入力層からのデータ（速度、位置偏差）と状態層からの保持データとが、重みが乗算された上で入力されることになる。その結果、過去の時系列データ情報が記憶された上で、出力データ（位相差、及び周波数）が演算される。

　入力層のニューロン（第１のニューロン）と隠れ層のニューロン（第２のニューロン）を結ぶ重み（第１の重み）をｗｈとした。また、隠れ層のニューロン（第２のニューロン）の閾値をθｈとした。また、隠れ層のニューロン（第２のニューロン）と出力層のニューロン（第３のニューロン）を結ぶ重みをｗｏとした。また、出力層のニューロン（第３のニューロン）の閾値をθｏとした。状態層のニューロン（第４のニューロン）と隠れ層のニューロン（第２のニューロン）を結ぶ重みをｗｃとした。重みと閾値は、後述の機械学習部１２によって学習された値が適用される。学習済みのＲＮＮは、振動型アクチュエータの実速度（検出速度）と制御量の時系列データから共通する特徴パターンを抽出した集合体と捉えることができる。したがって、出力は、重みと閾値を変数（パラメータ）とする関数によって得られる値となる。

　ＮＮから出力された制御量（位相差、及び周波数）は、交流信号生成部１０４に入力され、振動型アクチュエータの速度、駆動方向が制御される。交流信号生成部１０４では、位相差、周波数、及びパルス幅に基づいて、２相の交流信号が生成される。

　前述のステップ４（Ｓ４）の機械学習について、図２５を用いて更に説明する。図２５は、ＲＮＮのパラメータの最適化手法（最適化アルゴリズム）としてＡｄａｍを用いた場合のフローチャートなどである。ステップ１～ステップ５の内容は、演算され用いられる誤差勾配が、重み（ｗｈ、ｗｃ、ｗｏ）と閾値（θｈ、θｏ）の誤差勾配∇Ｅである点以外は、上述した、図８Ａ以下を用いた説明と同様である。

　図２６Ａ、図２６Ｂ、図２６Ｃは、従来のＰＩＤ制御と本発明の学習済モデルによる制御とにおいて、所定の目標位置パターンでフィードバック制御を行った場合の制御結果を比較したものである。目標速度は最大５０ｍｍ／ｓの台形駆動で、位置決め動作を含む５ｍｍストロークの往復動作を行うパターンである。横軸は時間（ｓｅｃ）、縦軸は上から順に位相差制御量（ｄｅｇ）、検出速度（ｍｍ／ｓ）と速度偏差（ｍｍ／ｓ）、目標位置（エンコーダパルス数：１ｍｍあたり８０００ｐｌｓ）と位置偏差（μｍ）を示す。

　図２６Ａは、従来のＰＩＤ制御器を用いた振動型アクチュエータの制御装置（図４５Ａ参照）による制御結果である。従来のＰＩＤ制御による制御では、振動型アクチュエータ１３に印加する交流電圧の周波数（駆動周波数）は９３ｋＨｚに固定した。また、振動型アクチュエータ１３を、位相差のみで制御した。

　図２６Ｂは、本発明の学習済モデル（Ｈ層回帰型リカレントニューラルネットワーク構造の学習済モデル）を用いた振動型アクチュエータの制御装置（図２３の制御装置１５）による制御結果である。Ｈ層回帰型リカレントニューラルネットワークとは、Ｈ層（隠れ層）の出力をＣ層（状態層）に格納し、Ｈ層（隠れ層）に回帰させるニューラルネットワークである。図２４Ａ、図２４Ｂ、図２４Ｃは、Ｈ層回帰型リカレントニューラルネットワーク構造を示したものである。

　本発明の学習済モデルを用いた振動型アクチュエータの制御装置１５による制御では、駆動周波数を固定し、位相差を変化させることにより制御した。具体的には、駆動周波数（図２３における「周波数」、図２４Ａにおける出力ｚ２）は９３ｋＨｚに固定し、振動型アクチュエータ１３を、位相差（図２３における位相差、図２４Ａにおけるｚ１）を変化させることにより制御した。本発明のＨ層回帰型ＲＮＮを適用することにより、位置偏差は、加減速及び停止整定時の全ての領域において改善することが分かった。

　図２６Ｃは、本発明の学習済モデル（Ｚ層回帰型リカレントニューラルネットワーク構造の学習済モデル）を用いた振動型アクチュエータの制御装置（図２３の制御装置１５において、学習済モデル及び学習モデルを、Ｈ層回帰型ＲＮＮからＺ層回帰型ＲＮＮに置き換えたもの）による制御結果である。Ｚ層回帰型リカレントニューラルネットワークとは、Ｚ層（出力層）の出力をＣ層（状態層）に格納し、Ｈ層（隠れ層）に回帰させるニューラルネットワークである。図３６Ａ、図３６Ｂ、図３６Ｃは、Ｚ層回帰型リカレントニューラルネットワーク構造を示したものである。

　本発明の学習済モデルを用いた振動型アクチュエータの制御装置１５による制御では、駆動周波数を固定し、位相差を変化させることにより制御した。具体的には、駆動周波数（図２３における「周波数」、図３６Ａにおける出力ｚ２）は９３ｋＨｚに固定し、振動型アクチュエータ１３を、位相差（図２３における位相差、図３６Ａにおけるｚ１）を変化させることにより制御した。本発明のＺ層回帰型ＲＮＮを適用することにより、位置偏差は、加減速及び停止整定時の全ての領域において改善することが分かった。

　本実施形態では、入力データとして、目標速度をｘ１、位置偏差をｘ２に設定し、出力データとして、位相差をｚ１に設定した。

　説明上、制御量として位相差と周波数を使用する例を図に示したが、出力を１つとして位相差のみ、あるいは駆動周波数（図２３における「周波数」）のみ、としても良い。また、パルス幅を用いても良い。

　隠れ層は７個のニューロンで形成し、活性化関数はシグモイド関数（図３６Ｂ）を用いた。出力層の活性化関数は、線形関数（図３６Ｃ）を用いた。状態層は２個のニューロンで形成し、出力層の出力は状態層の各ニューロンに保持される。つまり、時系列データの１制御サンプリング前のデータが保持されていることになる。状態層に保持されたデータは、次の制御サンプリング時に隠れ層に回帰される。従って、隠れ層には、入力層からのデータ（速度、位置偏差）と状態層からの保持データ（位相差、及び周波数）とが、重みが乗算された上で入力されることになる。その結果、過去の時系列データ情報が記憶された上で、出力データ（位相差、及び周波数）が演算される。

　入力層と隠れ層の各ニューロンを結ぶ重みをｗｈ、状態層と隠れ層の各ニューロンを結ぶ重みをｗｃ、隠れ層のニューロンの閾値をθｈ、隠れ層と出力層の各ニューロンを結ぶ重みをｗｏ、出力層のニューロンの閾値をθｏとした。全ての重みと閾値は、機械学習部１２によって学習された値が適用される。

　本発明の適用により、位置偏差は加減速及び停止整定時の全ての領域において改善することが分かった。

　尚、図２６Ｂ及び図２６Ｃにおいて、仮想的なＰＩＤ制御の位相差の変化を表示している（最上段の図）。これは、振動型アクチュエータの制御には直接使用されないが、位置偏差に基づき観測器としてＰＩＤ演算を行った制御量の出力である。このＰＩＤ制御量を利用することで、学習済モデルの制御の異常検出を行うことができる。すなわち、学習済モデルが出力する制御量とＰＩＤ制御量を比較することで、所定の範囲から大きくずれることがあればＮＮのパラメータが正常値から外れていることを予測でき、パラメータをリセットする事ができる。本機能は本発明の効果を得る上で必須の構成ではないが、学習済モデルによる制御の性能保証という観点で信頼性を上げることができる。

　図２７Ａ、図２７Ｂは、本発明の振動型アクチュエータの制御装置における高周波の応答性を示すシミュレーション結果である。実線のＳＩＮ波で示された、所定の目標位置パターン（位置指令値）でフィードバック制御を行い、目標速度は最大３０ｍｍ／ｓのＳＩＮ波駆動で、微小な距離（５０～１００μｍ）を高周波（１００Ｈｚ、２００Ｈｚ）で往復動作を行うパターンである。横軸は時間（ｍｓ）、縦軸は位置（ｍｍ）を示す。図２７Ａは、１００Ｈｚの位置指令値による制御結果、図２７Ｂは、２００Ｈｚの目標位置パターンによる制御結果を示す。ＰＩＤ制御は、目標位置パターンに対して位相が大きく遅れており、十分な追従性能が得られていない様子が分かる。これは、目標位置パターンが高周波になるほど顕著である。これに対して本発明のＲＮＮ制御（制御部にＲＮＮを用いた制御）は、目標位置パターンへの追従性が良いことが分かる。つまり、目標位置パターンに対する時間的な位相の遅れ（目標位置パターンに対する時間軸方向の位相の遅れ）が、ＰＩＤ制御よりも、本発明のＲＮＮ制御の方が小さいことが分かる。この理由は、ＲＮＮは過去の時系列情報を記憶しているので、加減速時の制御量の予測精度が向上する為だと考えられる。具体的には、以下の通りである。

　振動型アクチュエータを目標速度に追従するように駆動する場合、目標速度に対して、実速度（検出速度）は必然的にずれる（検出速度に追従遅れが生じる）。この追従遅れを縮めるためには、目標速度を予測した上で制御量を出力する必要がある。ＮＮ制御（制御部にＮＮを用いた制御）では、速度指令としては目標速度（入力層からの出力）のみに基づき制御量を出力するので、目標速度を予測しない（図２８Ａ参照）。

　しかし、ＲＮＮ制御（Ｈ層回帰型ＲＮＮ制御）では、隠れ層に、目標速度（入力層からの出力）と共に、状態層からの出力（過去の、隠れ層からの出力）が入力（加算）されることにより、目標速度を予測する。つまり、状態層からの出力は、過去の目標速度の履歴に基づく（過去の目標速度の履歴の情報を有する）ものであり、このような状態層からの出力を、現在の目標速度に加算することにより、将来の目標速度を予測した上で制御量を出力する（図２８Ｂ参照）。尚、図２８Ｂでは、図を簡略化するため、隠れ層Ｈのニューロンの数を２つにしたが、隠れ層のニューロンの数を３つ以上の場合も同様である。

　また、ＲＮＮ制御（Ｚ層回帰型ＲＮＮ制御）では、隠れ層に、目標速度（入力層からの出力）と共に、状態層からの出力（過去の、出力層のからの出力）が入力（加算）されることにより、目標速度を予測する。つまり、状態層からの出力は、過去の目標速度の履歴に基づく（過去の目標速度の履歴の情報を有する）ものであり、このような状態層からの出力を、現在の目標速度に加算することにより、将来の目標速度を予測した上で制御量を出力する（図２８Ｃ参照）。尚、図２８Ｃでは、図を簡略化するため、隠れ層Ｈのニューロンの数を２つにしたが、隠れ層のニューロンの数を３つ以上の場合も同様である。

　図２９Ａ、図２９Ｂは、本発明の制御装置におけるロバスト性を示す結果である。所定の目標位置パターンでフィードバック制御を行い、目標速度は最大５０ｍｍ／ｓの台形駆動で、位置決め動作を含む５ｍｍストロークの往復動作を行うパターンである。横軸は時間（ｓｅｃ）、縦軸はエンコーダのパルス単位での目標位置（左軸）、μｍ単位での位置偏差（右軸）を示す。

　図２９Ａは起動周波数９５ｋＨｚで機械学習を行った学習済モデルによる制御結果、図２９Ｂは起動周波数９１ｋＨｚで機械学習を行った学習済モデルによる制御結果を示す。図４５Ａ、図４５Ｂ、図４５Ｃ、図４５Ｄを用いて説明した前述のように、異なる起動周波数で制御を行うと振動型アクチュエータの非線形特性によって速度の傾きが変化するので従来のＰＩＤ制御では対応が難しかった。本発明は、機械学習によって速度カーブの傾き変化に対応した学習済モデルを生成することができるので、異なる起動周波数においても良好な制御性を得ることができる。

　（第１０の実施形態）
　本発明の機械学習の他の実施形態について説明する。

　図３０は、ＰＩＤ制御器を用いた振動型アクチュエータの制御装置による制御結果を学習データとして用いる場合の制御ブロック図である。本制御ブロックにおいて、振動型アクチュエータ１３の位置フィードバック制御は、ＰＩＤ制御器９０１を用いて行われる。ＰＩＤ制御器９０１には位置偏差が入力され、ＰＩＤ演算された制御量の位相差と周波数が出力される。尚、ＰＩＤ制御器以外の構成でも良く、例えば、Ｐ制御、ＰＩ制御、ＰＤ制御なども適用できる。

　第９の実施形態と同様に、機械学習部１２において速度検出部１６で検出された検出速度と、ＰＩＤ制御器から出力された制御量を用いて学習モデル１１６の機械学習が行われる。本実施形態の特徴としては、ＰＩＤ制御器による制御結果と、その学習済モデルによる制御結果を比較できることである。ＰＩＤ制御器との比較により、学習が上手く出来たかどうかを判定することができ、学習済モデルの信頼性を保証することができる。

　（第１１の実施形態）
　本発明の機械学習の他の実施形態について説明する。

　図３１は、オープン駆動での制御結果（オープン駆動部を用いた振動型アクチュエータの制御装置による制御結果）を学習データとして用いる場合の制御ブロック図である。本制御ブロックの特徴として、振動型アクチュエータ１３のフィードバック制御は行われない。駆動パターン生成部１００１で生成された任意のパターン波形がオープン駆動部１００２から交流信号生成部１１１に出力される。例えば、ＳＩＮ波パターンや矩形パターンの繰り返し信号が用いられる。本実施形態では、同一周波数の位相差と周波数のＳＩＮ波パターンを各々出力する。尚、各ＳＩＮ波の振幅の比率を調整することで、学習済モデルの制御性能を調整することができる。本例では、位相差のＳＩＮ波振幅を９０ｄｅｇ、周波数のＳＩＮ波振幅を１ｋＨｚとした。

　第９の実施形態と同様に、機械学習部１２において速度検出部１６で検出された検出速度と、オープン駆動部１００２から出力された制御量を用いて学習モデル１１６の機械学習が行われる。本発明は、オープン駆動時の結果を学習データに用いることもでき、同様の効果を得ることができる。

　（第１２の実施形態）
　図２３で示した、第９の実施形態における制御部１０の他の実施形態について説明する。

　図３２は、学習済モデルとＰＩＤ制御器を併用した場合の制御ブロック図である。本制御ブロックにおいて、振動型アクチュエータ１３の位置フィードバック制御は、ＰＩＤ制御器１４０１と学習済モデル１１３とを用いて行われる。ＰＩＤ制御器１４０１には位置偏差が入力され、ＰＩＤ演算されて出力される。尚、ＰＩＤ制御器以外の構成でも良く、例えば、Ｐ制御、ＰＩ制御、ＰＤ制御なども適用できる。学習済モデル１１３には、目標速度とＰＩＤ演算された位置偏差とが入力される。同様に、機械学習部１２において速度検出部１６で検出された検出速度と、学習済モデル１１３から出力された制御量を用いて学習モデル１１６の機械学習が行われる。

　本実施形態を適用することにより、学習済モデルに入力する位置偏差のゲイン調整を行うことができるので、より細かな制御系の調整（制御量の調整）を行うことができる。

　（第１３の実施形態）
　図２３で示した、第９の実施形態における制御部１０の他の実施形態について説明する。

　図３３は、学習済モデルとＰＩＤ制御器を併用した場合の制御ブロック図である。本制御ブロックにおいて、振動型アクチュエータ１３の位置フィードバック制御は、ＰＩＤ制御器１５０１と学習済モデル１１３の各制御量を加算して行われる。ＰＩＤ制御器１５０１には位置偏差が入力され、ＰＩＤ演算された位相差と周波数が出力される。尚、ＰＩＤ制御器以外の構成でも良く、例えば、Ｐ制御、ＰＩ制御、ＰＤ制御なども適用できる。また、ＰＩＤ制御器の後段に位相補償器を配しても良い。学習済モデル１１３には、目標速度と位置偏差とが入力されるが、位置偏差はゼロとしても良い。学習済モデル１１３から位相差と周波数が出力され、ＰＩＤ演算器１５０１から出力された位相差と周波数が各々加算される。加算された制御量と、速度検出部１６で検出された検出速度は機械学習部１２に入力され、学習モデル１１６の機械学習が行われる。

　本実施形態を適用することにより、位置偏差のゲイン調整を行うことができるので、より細かな制御系の調整（制御量の調整）を行うことができる。

　（第１４の実施形態）
　図２３で示した、第９の実施形態における制御部１０の他の実施形態について説明する。

　図３４は、位相差、周波数、及びパルス幅を制御量として機械学習を行った学習済モデルを用いた制御を行うための制御ブロック図である。本制御ブロックにおいて、振動型アクチュエータ１３の位置フィードバック制御は、学習済モデル１６０１から出力される各制御量（位相差、周波数、及びパルス幅）によって行われる。学習済モデル１６０１には目標速度と位置偏差が入力され、リカレントニューラルネットワークで演算された位相差、周波数、及びパルス幅が駆動部１１に出力されて振動型アクチュエータ１３は制御される。機械学習部１２では、学習済モデル１６０１から出力された３つの制御量と、速度検出部１６で検出された検出速度を学習データとして取得し、学習モデル１６０２による機械学習が行われる。

　図３５は、位相差、周波数、及びパルス幅を出力とする学習モデルのＨ層回帰型リカレントニューラルネットワーク構造を示すものである。図３４の学習済モデル１６１１と学習モデル１６１２は目標速度と位置偏差を入力とし、３つの制御量を出力とするＨ層回帰型ＲＮＮ構造を有する。機械学習に用いる学習データは、前述のように学習済モデルによる制御の測定データを用いても良いし、ランダム関数でパラメータを設定した未学習モデルによる制御の測定データでも良い。それ以外にも、オープン駆動による測定データ、ＰＩＤ制御による測定データを用いても良い。尚、ＲＮＮの重みと閾値を決定する際、複数の学習データから位置偏差や消費電力などの観点で最適な条件のパラメータを選定しても良い。これは、振動型アクチュエータの所定の速度が得られる条件、すなわち、位相差、周波数、及びパルス幅の組み合わせは無数に存在する為である。

　本実施形態を適用することにより、振動型アクチュエータを操作するパラメータが増えるので、適切な機械学習を行うことで、より細かな制御性能の調整を行うことができる。

　（第１５の実施形態）
　図２３で示した、第９の実施形態における制御部１０の他の実施形態について説明する。

　図３６Ａ、図３６Ｂ、図３６Ｃは、位相差、及び周波数を出力とする学習モデルのＺ層回帰型リカレントニューラルネットワーク構造を示すものである。図２３の学習済モデル１１３と学習モデル１１６は目標速度と位置偏差を入力とし、２つの制御量を出力とするＺ層回帰型ＲＮＮ構造を有しても良い。機械学習に用いる学習データは、前述のように学習済モデルによる制御の測定データを用いても良いし、ランダム関数でパラメータを設定した未学習モデルによる制御の測定データでも良い。それ以外にも、オープン駆動による測定データ、ＰＩＤ制御による測定データを用いても良い。尚、ＲＮＮの重みと閾値を決定する際、複数の学習データから位置偏差や消費電力などの観点で最適な条件のパラメータを選定しても良い。これは、振動型アクチュエータの所定の速度が得られる条件、すなわち、位相差、及び周波数の組み合わせは無数に存在する為である。

　本実施形態（Ｚ層回帰型ＲＮＮ）を適用することにより、図２６Ｃに示したように、位置偏差は、加減速及び停止整定時の全ての領域において改善することができる。

　（第１６の実施形態）
　図２３で示した、第９の実施形態における制御部１０の他の実施形態について説明する。

　図３７は、図２３の振動型駆動装置から、位置指令部１０２、位置検出部１４などを除いた場合の振動型駆動装置の制御ブロック図に相当する。図３７においては、振動型アクチュエータ１３を除いたものが、制御装置である。図３８は、図３７で使用される学習モデル及び学習済モデル制御部が有するＲＮＮ構造を示す図である。

　（第１７の実施形態）
　図２３で示した、第９の実施形態における制御部１０の他の実施形態について説明する。

　図３９は、図２３の振動型駆動装置から、位置指令部１０２、位置検出部１４などを除き、位置偏差によるフィードバックループ制御に代え、速度偏差によるフィードバック制御を行う場合の振動型駆動装置の制御ブロック図に相当する。図３９においては、振動型アクチュエータ１３を除いたものが、制御装置である。図４０は、図３９で使用される学習モデル及び学習済モデル制御部が有するＲＮＮ構造を示す図である。

　（第１８の実施形態）
　これまでの実施形態において、第１の速度が指令された場合に、第１の制御量を出力するよう機械学習された学習済モデルを有する制御量出力部を制御装置が有しているならば、制御装置から学習部を除いても良い。このような制御装置では学習済モデルは再び機械学習ができないというデメリットが存在するものの、再び機械学習を行う必要性が低い振動型駆動装置においては、学習部が除かれた分、構成が簡素になるというメリットがある。

　これまでの実施形態において、学習済モデルが有していたパラメータ（第１の重み、第２の重み、第３の重み、第２のニューロンの閾値、及び第３のニューロンの閾値）を記憶する記憶部を有するようにしてもよい。そして、学習済モデルは、記憶部が記憶するパラメータによって、学習済モデルが有するパラメータが置換されることによって機械学習されてもよい。記憶部には、ＲＯＭなどのメモリが用いられるがこれに限られない。記憶部としては、学習済モデルが有していたパラメータを記憶できるものであればよいからである。

　（第１９の実施形態）
　図２３で示した、第９の実施形態における制御部１０の他の実施形態について説明する。

　図４１は、本発明の他の形態における振動型アクチュエータの制御装置であり、リカレントニューラルネットワークを用いた適応制御を示す図である。尚、機械学習部は不図示であり、本例では必ずしも必要としない。制御部１０は、第１の学習済モデル１６１１、第２の学習済モデル１６１２、適応制御部１０８を有する。前記２つの学習済モデルは同じＲＮＮ構造を有し、第１の学習済モデルには目標速度と位置偏差が入力され、第２の学習済モデルには検出した検出速度と目標偏差（ゼロ）が入力される。

　制御サンプリング周期毎に、２つの学習済モデルから各々出力される制御量の誤差データに基づいて適応学習部１０８で誤差勾配が算出される。ＳＧＤ（確率的勾配降下法）を用いてＲＮＮの重みと閾値のパラメータが更新され、２つの学習済モデルに反映される。つまり、サンプリング周期間のデータを学習データとして用いるのである。

　この制御サンプリング周期毎の演算が駆動中に繰り返されることで、第１の学習済モデルから出力される制御量（位相差、及び周波数）と第２の学習済モデルから出力される制御量とは誤差が最小となるように収束していく。その結果、目標速度に追従し、位置偏差はゼロに近づくようにフィードバック制御を行うことができる。

　このように、本発明のリカレントニューラルネットワークを用いた学習モデルは、駆動中にアクチュエータの特性変化を補償する適応制御にも適用することが可能である。

　（第２０の実施形態）
　本発明の学習モデルに用いるニューラルネットワークの他の実施形態について説明する。

　図４２Ａ、図４２Ｂは、本発明の他の形態における振動型アクチュエータの制御装置であり、ＬＳＴＭ（Ｌｏｎｇ　ｓｈｏｒｔ－ｔｅｒｍ　ｍｅｍｏｒｙ）を用いた学習モデルの構造を示す図である。ＬＳＴＭはＲＮＮ（リカレントニューラルネットワーク）の派生のネットワークであり、内部にループを持ち、情報を持続させることができる。これにより、過去の重み付けを踏まえて未来の重み付けが行われる。ＬＳＴＭはＲＮＮの内部にループを持つという構造に加えて、忘却ゲート、入力ゲート、出力ゲートを設けられている。特に、忘却ゲートを設けることで、ＲＮＮでは出来なかった、長期の連続データの学習が行えるようになる。

　図４２Ａに本発明の学習モデルにＬＳＴＭを適用した場合の構成を示す。入力層からＸｔと、隠れ層の前時刻ｔ－１の出力Ｈｔ－１とがＬＳＴＭに入力され、Ｈｔが出力層Ｚに出力される。ＬＳＴＭの内部には記憶セルが設けられ、内部状態が各時刻で保持される。

　図４２ＢはＬＳＴＭの内部構成を示すブロック図である。忘却ゲート、入力ゲート、出力ゲートはそれぞれシグモイド関数である。忘却ゲートは過去の情報をどれだけ保持するかを決め、入力ゲートはどの値を更新するかを判定するものである。また、記憶セルの更新はｔａｎｈ関数を用いて行われる。これは、記憶セルに加えられる新たな候補値を作成するものである。出力ゲートは、記憶セル候補の要素を選択し次の時刻にどの程度の情報を伝えるか選択する。

　尚、上述したＬＳＴＭのモデルは基本形であるため、ここで示したネットワークに限らない。ネットワーク間の結合を変更してもよい。ＬＳＴＭではなく、ＱＲＮＮ（Ｑｕａｓｉ　Ｒｅｃｕｒｒｅｎｔ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）を用いてもよい。

　（第２１の実施形態）
　第１の実施形態では、振動型アクチュエータの制御装置は、撮像装置のオートフォーカス用のレンズ駆動に用いる例を説明したが、本発明の適用例はこれに限定されない。例えば、図４３Ａ、図４３Ｂに示すように、手ぶれ補正時のレンズや撮像素子の駆動に用いることもできる。図４３Ａは、撮像装置６０の外観を示す平面図（上面図）である。また、図４３Ｂは、撮像装置６０の内部構成の概略図である。

　撮像装置６０は、大略的に、本体６１と、本体６１に対して着脱自在なレンズ鏡筒６２とで構成されている。本体６１は、レンズ鏡筒６２を通過した光が結像した光学像を画像信号に変換するＣＣＤセンサやＣＭＯＳセンサなどの撮像素子６３と、撮像装置６０の全体的な動作を制御するカメラ制御マイコン６４を備える。

　レンズ鏡筒６２には、フォーカスレンズやズームレンズなどの複数のレンズＬが所定位置に配置されている。また、レンズ鏡筒６２には、像ぶれ補正装置５０が内蔵されており、像ぶれ補正装置５０は、円板部材５６、円板部材５６に設けられた振動子１３１を有し、円板部材５６の中央に形成されている穴部に、像ぶれ補正レンズ６５が配置されている。

　像ぶれ補正装置５０は、レンズ鏡筒６２の光軸と直交する面内で像ぶれ補正レンズ６５を移動させることができるように配置される。この場合、本発明の制御装置１２を用いて振動子１３１を駆動することで、鏡筒に固定されている接触体１３２に対し、振動子１３１や円板部材５６が相対移動し、補正レンズが駆動される。

　また、本願発明の制御装置は、ズーム用レンズの移動のためのレンズホルダの駆動に用いることもできる。したがって、本願発明の制御装置は、レンズ駆動用に、撮像装置に加えて、交換用レンズにも搭載することができる。

　また、第１の実施形態に示した、振動型アクチュエータの制御装置は、自動ステージの駆動にも用いることができる。例えば、図４４の斜視図に外観を示すように、顕微鏡の自動ステージの駆動に用いることができる。

　図４４の顕微鏡は、撮像素子と光学系を内蔵する撮像部７０と、基台上に設けられ、振動型アクチュエータによって移動されるステージ７２を有する自動ステージ７１と、を有する。被観察物をステージ７２上に置いて、拡大画像を撮像部７０で撮影する。観察範囲が広範囲に有る場合には、第１または第２の実施形態の制御装置１２を用いて振動型駆アクチュエータを駆動することで、ステージ７２を移動させる。

　これによって、被観察物を図中のＸ方向やＹ方向に移動させて、多数の撮影画像を取得する。不図示のコンピュータにて、撮影画像を結合し、観察範囲が広範囲で、かつ、高精細な１枚の画像を取得できる。

　以上、本発明をその好適な実施形態に基づいて詳述してきた。しかし、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。さらに、上述した各実施形態は本発明の一実施形態を示すものにすぎず、各実施形態を適宜組み合わせることも可能である。

　本発明は上記実施の形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために以下の請求項を添付する。

　本願は、２０２０年８月５日提出の日本国特許出願特願２０２０－１３３２１９と２０２０年１１月３０日提出の日本国特許出願特願２０２０－１９８２８２を基礎として優先権を主張するものであり、その記載内容の全てをここに援用する。

Claims

　振動子に発生した振動によって、前記振動子と接触する接触体を前記振動子に対して相対的に移動させる振動型アクチュエータの制御装置であって、
　前記接触体を前記振動子に対して相対的に移動させるための目標速度が入力された場合に、前記接触体を前記振動子に対して相対的に移動させるための制御量を出力するように機械学習された学習済モデルを有する制御量出力部を備えることを特徴とする振動型アクチュエータの制御装置。
　前記学習済モデルは、前記制御量によって前記接触体が前記振動子に対して相対的に移動された場合に検出された検出速度を入力とし、前記制御量を出力とする学習データを使用して機械学習されたことを特徴とする請求項１に記載の振動型アクチュエータの制御装置。
　前記学習済モデルには、前記目標速度が指令された場合に、前記目標速度と、前記目標速度と前記検出速度との差分である速度偏差と、が入力されることを特徴とする請求項１又は２に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、前記検出速度と、前記目標速度と前記検出速度との差分である速度偏差と同じデータ形式の値と、を入力とし、前記制御量を出力とする学習データを使用して機械学習されたことを特徴とする請求項３に記載の振動型アクチュエータの制御装置。
　前記学習済モデルには、前記目標速度が指令された場合に、前記目標速度と、前記接触体を前記振動子に対して相対的に移動させるために指令された目標位置と、前記制御量によって前記接触体が前記振動子に対して相対的に移動された場合に検出された検出位置と、の差分である位置偏差と、が入力されることを特徴とする請求項１又は２に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、前記検出速度と、前記目標位置と前記検出位置との差分である位置偏差と同じデータ形式の値と、を入力とし、前記制御量を出力とする学習データを使用して機械学習されたことを特徴とする請求項５に記載の振動型アクチュエータの制御装置。
　ＰＩＤ制御器を有し、
　前記学習済モデルには、前記目標速度が指令された場合に、前記目標速度と、前記ＰＩＤ制御器に前記位置偏差が入力された場合の出力と、が入力されることを特徴とする請求項５又は６に記載の振動型アクチュエータの制御装置。
　ＰＩＤ制御器を有し、
　前記学習済モデルは、前記ＰＩＤ制御器に前記位置偏差が入力された場合の出力を前記制御量に加算した制御量としての第２の制御量によって前記接触体が前記振動子に対して相対的に移動された場合に検出された検出速度を入力とし、前記第２の制御量を出力とする学習データを使用して機械学習されたことを特徴とする請求項５又は６に記載の振動型アクチュエータの制御装置。
　前記制御量は、位相差、周波数、及びパルス幅のうちの少なくともいずれか１つであることを特徴とする請求項１乃至８のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　前記制御量は、位相差であることを特徴とする請求項１乃至８のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　前記制御量は、位相差及び周波数であることを特徴とする請求項１乃至８のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　前記制御量は、位相差、周波数、及びパルス幅であることを特徴とする請求項１乃至８のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、１つ又は複数の第１のニューロンを有する入力層と、複数の第２のニューロンを有する隠れ層と、及び１つ又は複数の第３のニューロンを有する出力層と、を有するニューラルネットワーク構成を有し、
　前記ニューラルネットワーク構成は、前記第１のニューロンと前記第２のニューロンを結ぶ複数の第１の重みと、前記第２のニューロンと前記第３のニューロンを結ぶ複数の第２の重みと、前記第２のニューロンの閾値と、前記第３のニューロンの閾値と、を有することを特徴とする請求項１乃至１２のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、前記第１の重み、前記第２の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値が最適化されたことを特徴とする請求項１３に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、ランダム関数で設定された前記第１の重み、前記第２の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値が最適化アルゴリズムに基づいて機械学習されることによって最適化されたことを特徴とする請求項１４に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、最適化アルゴリズムに基づいて機械学習された前記第１の重み、前記第２の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値が最適化されることによって機械学習されたことを特徴とする請求項１４に記載の振動型アクチュエータの制御装置。
　前記学習済モデルが有していた前記第１の重み、前記第２の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値を記憶する記憶部を有し、
　前記学習済モデルは、前記記憶部が記憶する前記第１の重み、前記第２の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値によって、前記学習済モデルが有する前記第１の重み、前記第２の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値が置換されることによって機械学習されたことを特徴とする請求項１３に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、入力層、隠れ層、出力層、及び、前記隠れ層又は前記出力層からの出力を記憶して、記憶した前記隠れ層又は前記出力層からの出力を前記隠れ層へ出力する状態層を有するリカレントニューラルネットワーク構造を有することを特徴とする請求項１乃至１２のいずれか１項に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、前記リカレントニューラルネットワーク構造として、１つ又は複数の第１のニューロンを有する入力層と、複数の第２のニューロンを有する隠れ層と、１つ又は複数の第３のニューロンを有する出力層と、前記複数の第２のニューロンからの複数の出力又は前記複数の第３のニューロンからの複数の出力を記憶する複数の第４のニューロンを有する状態層と、を有し、
　前記リカレントニューラルネットワーク構造におけるパラメータとして、前記１つ又は複数の第１のニューロンから前記複数の第２のニューロンへの複数の出力に付された複数の第１の重みと、前記複数の第２のニューロンから前記１つ又は複数の第３のニューロンへの複数の出力に付された複数の第２の重みと、前記複数の第４のニューロンからの前記複数の第２のニューロンへの複数の出力に付された第３の重みと、前記第２のニューロンの閾値と、前記第３のニューロンの閾値と、を有することを特徴とする請求項１８に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、前記第１の重み、前記第２の重み、前記第３の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値が最適化されたことを特徴とする請求項１９に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、ランダム関数で設定された前記第１の重み、前記第２の重み、前記第３の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値が最適化アルゴリズムに基づいて機械学習されることによって最適化されたことを特徴とする請求項２０に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、最適化アルゴリズムに基づいて機械学習された前記第１の重み、前記第２の重み、前記第３の重み、前記第２のニューロンの閾値、前記第３のニューロンの閾値が最適化アルゴリズムに基づいて機械学習されることによって最適化されたことを特徴とする請求項２０に記載の振動型アクチュエータの制御装置。
　前記学習済モデルが有していた前記第１の重み、前記第２の重み、前記第３の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値を記憶する記憶部を有し、
　前記学習済モデルは、前記記憶部が記憶する前記第１の重み、前記第２の重み、前記第３の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値によって、前記学習済モデルが有する前記第１の重み、前記第２の重み、前記第３の重み、前記第２のニューロンの閾値、及び前記第３のニューロンの閾値が置換されることによって最適化されたことを特徴とする請求項２０に記載の振動型アクチュエータの制御装置。
　前記隠れ層は、ＬＳＴＭ（Ｌｏｎｇ　ｓｈｏｒｔ－ｔｅｒｍ　ｍｅｍｏｒｙ）構造を有することを特徴とする請求項１８乃至２３のいずれか１項に記載の振動型アクチュエータの制御装置。
　前記最適化アルゴリズムは、Ａｄａｍ、Ｍｏｍｅｎｔｕｍ、ＲＭＳｐｒｏｐ、及びＳＧＤのいずれか１つであることを特徴とする請求項１５、１６、２１及び２２のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、前記接触体を前記振動子に対して相対的に移動させる場合以外の場合に、機械学習されたことを特徴とする請求項１乃至２５のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　前記学習済モデルは、前記接触体を前記振動子に対して相対的に移動させる場合に、機械学習されたことを特徴とする請求項１乃至２５のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　環境状態を検知する環境センサを有し、
　前記学習済モデルは、前記環境センサによって前記環境の変化を検知した場合に、機械学習されたことを特徴とする請求項１乃至２５のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　前記環境センサは、温度センサ及び湿度センサのうちの少なくとも１つであることを特徴とする請求項２８に記載の振動型アクチュエータの制御装置。
　前記第１の速度を指令する速度指令部と、
　前記第２の速度を検知する速度検出部と、を有することを特徴とする請求項１乃至２９のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　前記第１の位置を指令する位置指令部と、
　前記第２の位置を検出する位置検出部と、を有することを特徴とする請求項５乃至８のうちのいずれか１項に記載の振動型アクチュエータの制御装置。
　振動子に発生した振動によって、前記振動子と接触する接触体を前記振動子に対して相対的に移動させる振動型アクチュエータと、
　請求項１乃至３１のうちのいずれか１項に記載の振動型アクチュエータの制御装置と、を有することを特徴とする振動型駆動装置。
　請求項３２に記載の振動型駆動装置と、
　前記接触体を前記振動子に対して相対的に移動させることによって駆動されるレンズと、を有することを特徴とする交換用レンズ。
　請求項３２に記載の振動型駆動装置と、
　前記接触体を前記振動子に対して相対的に移動させることによって駆動される撮像素子と、を有することを特徴とする撮像装置。
　請求項３２に記載の振動型駆動装置と、
　前記接触体を前記振動子に対して相対的に移動させることによって駆動されるステージと、を有することを特徴とする自動ステージ。
　振動子に発生した振動によって、前記振動子と接触する接触体を前記振動子に対して相対的に移動させる振動型アクチュエータの制御量出力方法であって、
　前記接触体を前記振動子に対して相対的に移動させるための第１の速度が指令された場合に、前記接触体を前記振動子に対して相対的に移動させるための第１の制御量によって前記接触体が前記振動子に対して相対的に移動された場合に検知された第２の速度を入力とし、前記第１の制御量を出力とする学習データを使用して機械学習するステップを有することを特徴とする振動型アクチュエータの制御装置の製造方法。
　請求項３６に記載の振動型アクチュエータの制御装置の製造方法をコンピュータに実行させるプログラム。