JP2020142566A - Evaluation device, control system, notification system, generation method for learning model, computer program and storage medium - Google Patents

Evaluation device, control system, notification system, generation method for learning model, computer program and storage medium Download PDF

Info

Publication number
JP2020142566A
JP2020142566A JP2019038893A JP2019038893A JP2020142566A JP 2020142566 A JP2020142566 A JP 2020142566A JP 2019038893 A JP2019038893 A JP 2019038893A JP 2019038893 A JP2019038893 A JP 2019038893A JP 2020142566 A JP2020142566 A JP 2020142566A
Authority
JP
Japan
Prior art keywords
control
human
powered vehicle
evaluation
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019038893A
Other languages
Japanese (ja)
Inventor
和也 桑山
Kazuya Kuwayama
和也 桑山
博之 石▲崎▼
Hiroyuki Ishizaki
博之 石▲崎▼
謝花 聡
Satoshi Shaka
聡 謝花
山本 貴士
Takashi Yamamoto
貴士 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimano Inc
Original Assignee
Shimano Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimano Inc filed Critical Shimano Inc
Priority to JP2019038893A priority Critical patent/JP2020142566A/en
Publication of JP2020142566A publication Critical patent/JP2020142566A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

To provide an evaluation device, a control system, a notification system, a generation method for learning model, computer program and storage medium, used for a bicycle including an electrically-driven component.SOLUTION: The evaluation device evaluates the favorability of control for components of a human-power drive vehicle using a learning model according to travel information concerning travel of the human-power drive vehicle. The evaluation device highly evaluates such control that the traction of the human-power drive vehicle becomes better and evaluates low such control that traction loss is estimated.SELECTED DRAWING: Figure 4

Description

本発明は、評価装置、制御システム、報知システム、学習モデルの生成方法、コンピュータプログラム、および、記憶媒体に関する。 The present invention relates to an evaluation device, a control system, a notification system, a learning model generation method, a computer program, and a storage medium.

電動コンポーネントを含む自転車の制御システムが知られている。例えば、特許文献1には、操作装置、制御装置、および、電動コンポーネントが無線接続された制御システムが開示されている。 Bicycle control systems, including electric components, are known. For example, Patent Document 1 discloses a control system in which an operation device, a control device, and an electric component are wirelessly connected.

特開2016−165991号公報Japanese Unexamined Patent Publication No. 2016-16591

現在、自転車の制御システムにおいて、制御を評価することが求められている。 Currently, it is required to evaluate the control in the control system of the bicycle.

本発明は、人力駆動車のコンポーネントに対する制御の好ましさを評価する評価装置、制御システム、報知システム、学習モデルの生成方法、コンピュータプログラム、および、記憶媒体を提供することを目的とする。 An object of the present invention is to provide an evaluation device, a control system, a notification system, a learning model generation method, a computer program, and a storage medium for evaluating the preference of control for a component of a human-powered vehicle.

本発明の第1側面に係る評価装置は、人力駆動車の走行に関する走行情報に従って、前記人力駆動車のコンポーネントに対する制御の好ましさを、学習モデルを用いて評価する。 The evaluation device according to the first aspect of the present invention evaluates the preference of control for the components of the human-powered vehicle by using a learning model according to the traveling information regarding the traveling of the human-powered vehicle.

この評価装置によれば、学習モデルを用いることによって、人力駆動車の走行情報に従い、コンポーネントに対する制御の好ましさを評価できる。ここで、制御の好ましさとは、コンポーネントを制御した際の人力駆動車の状態の良し悪しを示唆する情報である。制御の好ましさは、例えば、人力駆動車のトラクションの良し悪しにより評価される。したがって、評価装置は、人力駆動車のトラクションが良好となる制御を高く評価し、トラクションが失われると推定される制御を低く評価する。 According to this evaluation device, by using the learning model, it is possible to evaluate the preference of control for the component according to the driving information of the human-powered vehicle. Here, the preference of control is information suggesting whether the state of the human-powered vehicle is good or bad when the component is controlled. The preference of control is evaluated, for example, by the quality of traction of a human-powered vehicle. Therefore, the evaluation device highly evaluates the control that improves the traction of the human-powered vehicle, and evaluates the control that is presumed to lose traction.

本発明の第1側面に係る第2側面の評価装置は、前記好ましさの評価結果と、前記評価結果に応じた前記コンポーネントの制御結果と、に応じて前記学習モデルを再学習させる。 The evaluation device of the second aspect according to the first aspect of the present invention retrains the learning model according to the evaluation result of the preference and the control result of the component according to the evaluation result.

この評価装置によれば、評価装置の評価結果と、コンポーネントの制御結果とに応じて、学習モデルを再学習させるので、学習が進行するにつれて、より好ましい制御状態を実現できる。 According to this evaluation device, the learning model is retrained according to the evaluation result of the evaluation device and the control result of the component, so that a more preferable control state can be realized as the learning progresses.

本発明の第1または第2側面に係る第3側面の評価装置は、前記走行情報は、速度、加速度、姿勢、荷重、駆動力、ケイデンス、変速比、操作装置への操作入力、前記操作入力と前記コンポーネントの制御結果の履歴、回生量、傾斜、路面状況、位置、天候、および、車両情報のうちの少なくとも1つに関する情報を含む。 In the evaluation device of the third aspect according to the first or second aspect of the present invention, the traveling information includes speed, acceleration, attitude, load, driving force, cadence, gear ratio, operation input to the operation device, and the operation input. And information about at least one of the history of control results of the component, regeneration amount, slope, road surface condition, position, weather, and vehicle information.

この評価装置によれば、速度、加速度、姿勢、荷重、駆動力、ケイデンス、変速比、操作装置への操作入力、操作入力とコンポーネントの制御結果の履歴、回生量、傾斜、路面状況、位置、天候、および、車両情報のうちの少なくとも1つに従って、コンポーネントに対する制御の好ましさを評価できる。 According to this evaluation device, speed, acceleration, attitude, load, driving force, cadence, gear ratio, operation input to the operation device, history of operation input and component control result, regeneration amount, inclination, road surface condition, position, The preference for control over the component can be assessed according to the weather and at least one of the vehicle information.

本発明の第1または第2側面に係る第4側面の評価装置は、前記人力駆動車の走行情報は、前記人力駆動車のトラクションに関する情報を含む。 In the evaluation device of the fourth aspect according to the first or second aspect of the present invention, the traveling information of the manpower-driven vehicle includes information regarding the traction of the man-powered vehicle.

この評価装置によれば、人力駆動車のトラクションに関する情報に従って、コンポーネントに対する制御の好ましさを評価できる。 According to this evaluation device, it is possible to evaluate the preference of control for the component according to the information regarding the traction of the man-powered vehicle.

本発明の第5側面に係る制御システムは、第1から第4側面のいずれか1つに係る評価装置と、前記評価装置の評価結果に基づいて前記コンポーネントを制御する制御装置と、を備える。 The control system according to the fifth aspect of the present invention includes an evaluation device according to any one of the first to fourth aspects, and a control device that controls the component based on the evaluation result of the evaluation device.

この制御システムによれば、評価装置の評価結果に基づき、制御装置がコンポーネントを制御するので、ライダーの操作に依らずに、より好ましい制御状態を実現できる。 According to this control system, since the control device controls the components based on the evaluation result of the evaluation device, a more preferable control state can be realized without depending on the operation of the rider.

本発明の第5側面に係る第6側面の制御システムは、前記コンポーネントは、補助駆動力を出力する電動駆動ユニットを有するアシスト装置を含む。 In the control system of the sixth aspect according to the fifth aspect of the present invention, the component includes an assist device including an electric drive unit that outputs an auxiliary driving force.

この制御システムによれば、制御装置は、補助駆動力を出力するアシスト装置を制御するので、補助駆動制御に関して、より好ましい制御状態を実現できる。 According to this control system, since the control device controls the assist device that outputs the auxiliary driving force, a more preferable control state can be realized with respect to the auxiliary drive control.

本発明の第5または第6側面に係る第7側面の制御システムは、前記コンポーネントは、電動駆動ユニットを有するブレーキ装置を含む。 In the control system of the seventh aspect according to the fifth or sixth aspect of the present invention, the component includes a braking device including an electric drive unit.

この制御システムによれば、制御装置は、ブレーキ装置を制御するので、ブレーキ制御に関して、より好ましい制御状態を実現できる。 According to this control system, since the control device controls the brake device, a more preferable control state can be realized with respect to the brake control.

本発明の第5から第7側面のいずれか1つに係る第8側面の制御システムは、前記コンポーネントは、電動駆動ユニットを有するアンチロックブレーキ装置を含む。 In the control system of the eighth aspect according to any one of the fifth to seventh aspects of the present invention, the component includes an antilock braking device including an electric drive unit.

この制御システムによれば、制御装置は、アンチロックブレーキ装置を制御するので、アンチロックブレーキ制御に関して、より好ましい制御状態を実現できる。 According to this control system, the control device controls the antilock brake device, so that a more preferable control state can be realized with respect to the antilock brake control.

本発明の第5から第8側面のいずれか1つに係る第9側面の制御システムは、前記コンポーネントは、電動駆動ユニットを有するサスペンション装置を含む。 In the control system of the ninth aspect according to any one of the fifth to eighth aspects of the present invention, the component includes a suspension device including an electric drive unit.

この制御システムによれば、制御装置は、サスペンション装置を制御するので、サスペンション制御に関して、より好ましい制御状態を実現できる。 According to this control system, since the control device controls the suspension device, a more preferable control state can be realized with respect to the suspension control.

本発明の第10側面に係る報知システムは、第1から第4側面のいずれか1つに係る評価装置と、前記評価装置の評価結果に関する情報を報知する報知装置と、を備える。 The notification system according to the tenth aspect of the present invention includes an evaluation device according to any one of the first to fourth aspects and a notification device for notifying information on the evaluation result of the evaluation device.

この報知システムによれば、評価結果に関する情報を報知する報知装置を備えるので、ライダーは人力駆動車の制御状態の良否を把握できる。 According to this notification system, since a notification device for notifying information on the evaluation result is provided, the rider can grasp the quality of the control state of the human-powered vehicle.

本発明の第10側面に係る第11側面の報知システムは、前記評価結果に関する情報は、前記コンポーネントの制御状態に関する情報を含む。 In the notification system of the eleventh aspect according to the tenth aspect of the present invention, the information regarding the evaluation result includes the information regarding the control state of the component.

この報知システムによれば、評価結果に関する情報は、コンポーネントの制御状態に関する情報を含むので、ライダーはコンポーネントの制御状態の良否を把握できる。 According to this notification system, the information regarding the evaluation result includes the information regarding the control state of the component, so that the rider can grasp the quality of the control state of the component.

本発明の第12側面に係る学習モデルの生成方法は、コンピュータを用いて、人力駆動車の走行に関する走行情報に従って、前記人力駆動車のコンポーネントに対する制御の好ましさを、関数を用いて評価し、前記好ましさの評価結果と、前記評価結果に応じた前記コンポーネントの制御結果と、に応じて前記関数を更新することによって学習モデルを生成する。 In the method of generating the learning model according to the twelfth aspect of the present invention, the preference of control for the components of the human-powered vehicle is evaluated by using a function according to the driving information regarding the running of the human-powered vehicle using a computer. , The learning model is generated by updating the function according to the evaluation result of the preference and the control result of the component according to the evaluation result.

この学習モデルの生成方法によれば、人力駆動車の走行情報を収集することによって、コンポーネントの制御に対する好ましさを評価するための学習モデルを生成できる。 According to this learning model generation method, it is possible to generate a learning model for evaluating the preference for controlling the components by collecting the driving information of the human-powered vehicle.

本発明の第13側面に係るコンピュータプログラムは、コンピュータに、人力駆動車の走行に関する走行情報に従って、前記人力駆動車のコンポーネントに対する制御の好ましさを、学習モデルを用いて評価する処理を実行させるためのコンピュータプログラムである。 The computer program according to the thirteenth aspect of the present invention causes a computer to execute a process of evaluating the preference for control of the components of the human-powered vehicle by using a learning model according to the traveling information regarding the running of the human-powered vehicle. Is a computer program for.

このコンピュータプログラムによれば、人力駆動車の走行情報に従ってコンポーネントに対する制御野好ましさを評価する実行環境を、コンピュータによって実現できる。 According to this computer program, an execution environment for evaluating the control ambition for the components according to the driving information of the human-powered vehicle can be realized by the computer.

本発明の第14側面に係る記憶媒体は、第13側面に係るコンピュータプログラムが記憶される。 The storage medium according to the 14th aspect of the present invention stores the computer program according to the 13th aspect.

この記憶媒体によれば、記憶媒体に記憶されているコンピュータプログラムをコンピュータにインストールすることによって、人力駆動車の走行情報に従ってコンポーネントに対する制御野好ましさを評価する実行環境を、コンピュータによって実現できる。 According to this storage medium, by installing a computer program stored in the storage medium in the computer, it is possible to realize an execution environment in which the control ambition for the component is evaluated according to the driving information of the human-powered vehicle.

本願によれば、人力駆動車のコンポーネントに対する制御の好ましさを評価できる。 According to the present application, it is possible to evaluate the preference for control over the components of a human-powered vehicle.

第1実施形態の評価装置が適用される人力駆動車の側面図である。It is a side view of the human-powered vehicle to which the evaluation device of 1st Embodiment is applied. 第1実施形態に係る評価装置の内部構成を示すブロック図である。It is a block diagram which shows the internal structure of the evaluation apparatus which concerns on 1st Embodiment. 学習モデルの実装例を示す模式図である。It is a schematic diagram which shows the implementation example of the learning model. 学習モデルの学習手順を説明するフローチャートである。It is a flowchart explaining the learning procedure of a learning model. 第2実施形態に係る制御システムを説明するブロック図である。It is a block diagram explaining the control system which concerns on 2nd Embodiment. 制御装置が実行する処理の手順を説明するフローチャートである。It is a flowchart explaining the procedure of the process executed by a control device. 学習モデルの生成手順を説明するフローチャートである。It is a flowchart explaining the generation procedure of a learning model. 学習モデルの再学習手順を説明するフローチャートである。It is a flowchart explaining the re-learning procedure of a learning model. 第5実施形態に係る報知システムを説明するブロック図である。It is a block diagram explaining the notification system which concerns on 5th Embodiment.

以下、本発明をその実施の形態を示す図面に基づいて具体的に説明する。
(第1実施形態)
図1は第1実施形態の評価装置100が適用される人力駆動車1の側面図である。人力駆動車1は、走行のための原動力に関して、少なくとも部分的に人力を用いる車両である。内燃機関または電動機のみを原動力に用いる車両は、本実施形態の人力駆動車1から除外される。人力駆動車1は、例えば、マウンテンバイク、ロードバイク、クロスバイク、シティサイクル等を含む自転車である。
Hereinafter, the present invention will be specifically described with reference to the drawings showing the embodiments thereof.
(First Embodiment)
FIG. 1 is a side view of the human-powered vehicle 1 to which the evaluation device 100 of the first embodiment is applied. The human-powered vehicle 1 is a vehicle that uses human power at least partially with respect to the driving force for traveling. A vehicle that uses only an internal combustion engine or an electric motor as a driving force is excluded from the human-powered vehicle 1 of the present embodiment. The human-powered vehicle 1 is, for example, a bicycle including a mountain bike, a road bike, a cross bike, a city cycle, and the like.

人力駆動車1は、車両本体10、前輪12、後輪14、ハンドルバー16、シート18、および、駆動機構20を備える。以下の説明において、前後、左右、および、上下の各方向を表す用語は、ライダーが人力駆動車1のシート18に着座した状態における方向を基準として用いられる。 The human-powered vehicle 1 includes a vehicle body 10, front wheels 12, rear wheels 14, handlebars 16, seats 18, and a drive mechanism 20. In the following description, the terms representing the front-rear, left-right, and up-down directions are used with reference to the direction in which the rider is seated on the seat 18 of the human-powered vehicle 1.

車両本体10は、フレーム10Aおよびフロントフォーク10Bを備える。前輪12は、フロントフォーク10Bに回転可能に支持される。後輪14は、フレーム10Aに回転可能に支持される。ハンドルバー16は、前輪12の進行方向を変更できるように、フレーム10Aに支持される。 The vehicle body 10 includes a frame 10A and a front fork 10B. The front wheel 12 is rotatably supported by the front fork 10B. The rear wheel 14 is rotatably supported by the frame 10A. The handlebar 16 is supported by the frame 10A so that the traveling direction of the front wheels 12 can be changed.

駆動機構20は、人力駆動力を後輪14へ伝達する。駆動機構20は、クランク22、フロントスプロケットアセンブリ24A、リアスプロケットアセンブリ24B、チェーン26、および、一対のペダル28,28を含む。駆動機構20は、更に、チェーン26が外れることを抑制するためのチェーンデバイスを備えてもよい。 The drive mechanism 20 transmits a human-powered driving force to the rear wheels 14. The drive mechanism 20 includes a crank 22, a front sprocket assembly 24A, a rear sprocket assembly 24B, a chain 26, and a pair of pedals 28, 28. The drive mechanism 20 may further include a chain device for suppressing the chain 26 from coming off.

クランク22は、右クランク22A、左クランク22B、および、クランク軸22Cを含む。クランク軸22Cは、フレーム10Aに回転可能に支持される。右クランク22Aおよび左クランク22Bは、それぞれクランク軸22Cに連結される。一対のペダル28,28の一方は右クランク22Aに回転可能に支持され、他方は左クランク22Bに回転可能に支持される。 The crank 22 includes a right crank 22A, a left crank 22B, and a crankshaft 22C. The crankshaft 22C is rotatably supported by the frame 10A. The right crank 22A and the left crank 22B are respectively connected to the crankshaft 22C. One of the pair of pedals 28, 28 is rotatably supported by the right crank 22A and the other is rotatably supported by the left crank 22B.

フロントスプロケットアセンブリ24Aは、クランク軸22Cに連結されており、クランク軸22Cと一体的に回転する。フロントスプロケットアセンブリ24Aは、一例では、外径が異なる複数のフロントスプロケットを含む。複数のフロントスプロケットの外径は、クランク軸22の回転軸心と平行な方向において、車両本体10の中心面から外側に向かって大きくなる。 The front sprocket assembly 24A is connected to the crankshaft 22C and rotates integrally with the crankshaft 22C. The front sprocket assembly 24A includes, for example, a plurality of front sprockets having different outer diameters. The outer diameters of the plurality of front sprockets increase outward from the central surface of the vehicle body 10 in a direction parallel to the rotation axis of the crankshaft 22.

リアスプロケットアセンブリ24Bは、後輪14のハブ(図示略)に回転可能に支持される。リアスプロケットアセンブリ24Bは、一例では、外径が異なる複数のリアスプロケットを含む。複数のリアスプロケットの外径は、ハブアセンブリの回転軸心と平行な方向において、車両本体10の中心面から外側に向かって小さくなる。 The rear sprocket assembly 24B is rotatably supported by a hub (not shown) of the rear wheel 14. The rear sprocket assembly 24B includes, for example, a plurality of rear sprockets having different outer diameters. The outer diameters of the plurality of rear sprockets decrease from the central surface of the vehicle body 10 toward the outside in a direction parallel to the rotation axis of the hub assembly.

チェーン26は、フロントスプロケットアセンブリ24Aおよびリアスプロケットアセンブリ24Bに巻き掛けられる。ペダル28,28に加えられる人力駆動力によってクランク22が前転すると、フロントスプロケットアセンブリ24Aがクランク22と共に前転する。フロントスプロケットアセンブリ24Aの回転は、チェーン26を介してリアスプロケットアセンブリ24Bに伝達し、後輪14を回転させる。チェーン26の代わりに、ベルトまたはシャフトを用いてもよい。 The chain 26 is wound around the front sprocket assembly 24A and the rear sprocket assembly 24B. When the crank 22 rolls forward due to the human-powered driving force applied to the pedals 28 and 28, the front sprocket assembly 24A rolls forward together with the crank 22. The rotation of the front sprocket assembly 24A is transmitted to the rear sprocket assembly 24B via the chain 26 to rotate the rear wheels 14. A belt or shaft may be used instead of the chain 26.

人力駆動車1は、更に、操作装置30、変速装置32および33、アシスト装置34、ブレーキ装置36、アンチロックブレーキ装置38、サスペンション装置40、および、バッテリユニット42を備える。 The human-powered vehicle 1 further includes an operating device 30, transmissions 32 and 33, an assisting device 34, a braking device 36, an antilock braking device 38, a suspension device 40, and a battery unit 42.

操作装置30は、例えばハンドルバー16に設けられる。操作スイッチ30は、ライダーの指によって操作される操作スイッチ30A,30Bを備える。操作スイッチ30A,30Bは、変速装置32、アシスト装置34、ブレーキ装置36、アンチロックブレーキ装置38、および、サスペンション装置40の少なくとも1つを制御するためのスイッチである。 The operating device 30 is provided on, for example, the handlebar 16. The operation switch 30 includes operation switches 30A and 30B operated by a rider's finger. The operation switches 30A and 30B are switches for controlling at least one of the transmission 32, the assist device 34, the brake device 36, the antilock brake device 38, and the suspension device 40.

人力駆動車1に搭載される操作装置30の数は1つである必要はなく、複数であってもよい。図1に示した例では、操作装置30が2つの操作スイッチ30A,30Bを備える構成としたが、1つまたは3つ以上の操作スイッチを備える構成であってもよい。操作装置30は、スイッチを備える構成に限定されず、操作レバーまたは操作ダイヤル等を備える構成であってもよい。 The number of operating devices 30 mounted on the human-powered vehicle 1 does not have to be one, and may be plural. In the example shown in FIG. 1, the operation device 30 is configured to include two operation switches 30A and 30B, but may be configured to include one or three or more operation switches. The operation device 30 is not limited to the configuration including the switch, and may be configured to include an operation lever, an operation dial, and the like.

操作装置30は、操作スイッチ30Aまたは操作スイッチ30Bの操作に応じた制御信号を制御対象のコンポーネントへ送信できるように、各コンポーネントに接続される。一例では、操作装置30は、通信線またはPLC(Power Line Communication)が可能な電線によって制御対象のコンポーネントに接続される。制御対象のコンポーネントは、変速装置32、アシスト装置34、ブレーキ装置36、アンチロックブレーキ装置38、および、サスペンション装置40の少なくとも1つである。他の例では、操作装置30は、無線通信が可能な無線通信ユニットによって制御対象のコンポーネントに接続される。操作装置30は、更に、操作入力に関する情報を評価装置100へ出力してもよい。 The operation device 30 is connected to each component so that a control signal corresponding to the operation of the operation switch 30A or the operation switch 30B can be transmitted to the component to be controlled. In one example, the operating device 30 is connected to a controlled component by a communication line or an electric wire capable of PLC (Power Line Communication). The component to be controlled is at least one of the transmission 32, the assist device 34, the brake device 36, the antilock brake device 38, and the suspension device 40. In another example, the operating device 30 is connected to a controlled component by a wireless communication unit capable of wireless communication. The operation device 30 may further output information regarding the operation input to the evaluation device 100.

変速装置32は、操作装置30から送信される制御信号に応じて動作が制御される人力駆動車1のコンポーネントの1つである。変速装置32は、電動アクチュエータ32Aおよびチェーンガイド32Bを備える。電動アクチュエータ32Aの一例は、電動モータである。変速装置32は、電動アクチュエータ32Aを駆動し、チェーンガイド32を動作させることによって、チェーン26が巻き掛けられるリアスプロケットを変更し、人力駆動車1の変速比を切り替える。 The transmission 32 is one of the components of the human-powered vehicle 1 whose operation is controlled according to the control signal transmitted from the operation device 30. The transmission 32 includes an electric actuator 32A and a chain guide 32B. An example of the electric actuator 32A is an electric motor. The transmission 32 drives the electric actuator 32A and operates the chain guide 32 to change the rear sprocket around which the chain 26 is wound and switch the gear ratio of the human-powered vehicle 1.

変速装置32の一例は外装変速機である。変速装置32が外装変速機である場合、リアスプロケットアセンブリ24Bは、外径が異なる複数のリアスプロケットを含む。変速装置32は、シフトアップを指示する制御信号を操作装置30から受信した場合、チェーン26が巻き掛けられるリアスプロケットを、現在のリアスプロケットよりも外径が小さいリアスプロケットに変更するように、電動アクチュエータ32Aによってチェーンガイド32Bを動作させる。変速装置32は、シフトダウンを指示する制御信号を操作装置30から受信した場合、チェーン26が巻き掛けられるリアスプロケットを、現在のリアスプロケットよりも外径が大きいリアスプロケットに変更するように、電動アクチュエータ32Aによってチェーンガイド32Bを動作させる。 An example of the transmission 32 is an external transmission. When the transmission 32 is an external transmission, the rear sprocket assembly 24B includes a plurality of rear sprockets having different outer diameters. When the transmission 32 receives a control signal instructing upshifting from the operation device 30, the transmission 32 is electrically operated so as to change the rear sprocket around which the chain 26 is wound to a rear sprocket having an outer diameter smaller than that of the current rear sprocket. The chain guide 32B is operated by the actuator 32A. When the transmission 32 receives a control signal instructing downshifting from the operation device 30, the transmission 32 is electrically operated so as to change the rear sprocket around which the chain 26 is wound to a rear sprocket having an outer diameter larger than that of the current rear sprocket. The chain guide 32B is operated by the actuator 32A.

変速装置33は、操作装置30から送信される制御信号に応じて動作が制御される人力駆動車1のコンポーネントの1つである。変速装置33は、電動アクチュエータ33Aおよびチェーンガイド33Bを備える。電動アクチュエータ33Aの一例は、電動モータである。変速装置33は、電動アクチュエータ33Aの駆動によって、チェーンガイド33Bを動作させることで、チェーン26が巻き掛けられるフロントスプロケットを変更し、人力駆動車1の変速比を切り替える。 The transmission 33 is one of the components of the human-powered vehicle 1 whose operation is controlled according to the control signal transmitted from the operation device 30. The transmission 33 includes an electric actuator 33A and a chain guide 33B. An example of the electric actuator 33A is an electric motor. The transmission 33 operates the chain guide 33B by driving the electric actuator 33A to change the front sprocket around which the chain 26 is wound and switches the gear ratio of the human-powered vehicle 1.

変速装置33の一例は外装変速機である。変速装置33が外装変速機である場合、フロントスプロケットアセンブリ24Aは、外径が異なる複数のフロントスプロケットを含む。本実施形態において、変速装置33は、シフトアップを指示する制御信号を操作装置30から受信した場合、チェーン26が巻き掛けられるフロントスプロケットを、現在のスプロケットよりも外径が大きいスプロケットに変更するように電動アクチュエータ33Aによってチェーンガイド33Bを動作させる。変速装置33は、シフトダウンを指示する制御信号を操作装置30から受信した場合、例えば、チェーン26が巻き掛けられるフロントスプロケットを、現在のフロントスプロケットよりも外径が小さいフロントスプロケットに変更するように、電動アクチュエータ33Aによってチェーンガイド33Bを動作させる。 An example of the transmission 33 is an external transmission. When the transmission 33 is an external transmission, the front sprocket assembly 24A includes a plurality of front sprockets having different outer diameters. In the present embodiment, when the transmission 33 receives the control signal instructing the shift up from the operation device 30, the front sprocket around which the chain 26 is wound is changed to a sprocket having an outer diameter larger than that of the current sprocket. The chain guide 33B is operated by the electric actuator 33A. When the transmission 33 receives a control signal instructing downshifting from the operation device 30, for example, the front sprocket around which the chain 26 is wound is changed to a front sprocket having an outer diameter smaller than that of the current front sprocket. , The chain guide 33B is operated by the electric actuator 33A.

変速装置32および33は内装変速機であってもよい。例えば、変速装置32が内装変速機である場合、変速装置32は例えば後輪14のハブに設けられ、リアスプロケットアセンブリ24Bに入力された回転を変速して後輪14に伝達する。このとき、リアスプロケットアセンブリ24Bに含まれるリアスプロケットは単一である。変速装置32および33の少なくとも1つは、無段変速機であってもよい。 The transmissions 32 and 33 may be internal transmissions. For example, when the transmission 32 is an internal transmission, the transmission 32 is provided, for example, on the hub of the rear wheel 14, and the rotation input to the rear sprocket assembly 24B is changed and transmitted to the rear wheel 14. At this time, the rear sprocket assembly 24B contains a single rear sprocket. At least one of the transmissions 32 and 33 may be a continuously variable transmission.

アシスト装置34は、駆動機構20に対して設けられる。アシスト装置34は、電動駆動ユニット34Aを有する。電動駆動ユニット34Aは、駆動回路、メモリ、電動モータ等を含み、駆動回路が電動モータを作動させることによって補助駆動力を出力し、人力駆動車1の走行を補助する。本実施の形態において、アシスト装置34は、後述の制御装置200によって自動制御されるコンポーネントの1つである。制御装置200は、図5に示される。アシスト装置34は、操作装置30から出力される制御信号に応じて制御されてもよい。アシスト装置34の制御状態は、補助駆動力が異なる複数の制御状態を含む。アシスト装置34における制御状態はアシストレベルともいう。アシスト装置34は、例えばクランク22に作用する人力駆動力に応じて、アシストレベルを変更する。アシストレベルは、たとえば4段階設けられる場合、強アシストレベル、中アシストレベル、弱アシストレベル、およびゼロアシストレベルを含む。ゼロアシストレベルでは、モータユニット34を駆動せず、アシストが行われない。 The assist device 34 is provided for the drive mechanism 20. The assist device 34 has an electric drive unit 34A. The electric drive unit 34A includes a drive circuit, a memory, an electric motor, and the like, and the drive circuit operates the electric motor to output an auxiliary driving force to assist the traveling of the human-powered vehicle 1. In the present embodiment, the assist device 34 is one of the components automatically controlled by the control device 200 described later. The control device 200 is shown in FIG. The assist device 34 may be controlled according to a control signal output from the operation device 30. The control state of the assist device 34 includes a plurality of control states having different auxiliary driving forces. The control state in the assist device 34 is also referred to as an assist level. The assist device 34 changes the assist level according to, for example, a human-powered driving force acting on the crank 22. The assist level includes, for example, a strong assist level, a medium assist level, a weak assist level, and a zero assist level when four levels are provided. At the zero assist level, the motor unit 34 is not driven and assist is not performed.

なお、アシスト装置34は、人力駆動車1を制動する回生ブレーキ装置としても機能するように構成されてもよい。回生量を含むアシスト装置34の制御結果は、評価装置100へ出力され、評価装置100の記憶部106に履歴として記憶されてもよい。評価装置100の記憶部106は、図2において示される。 The assist device 34 may also be configured to function as a regenerative braking device for braking the human-powered vehicle 1. The control result of the assist device 34 including the regeneration amount may be output to the evaluation device 100 and stored as a history in the storage unit 106 of the evaluation device 100. The storage unit 106 of the evaluation device 100 is shown in FIG.

ブレーキ装置36は、前輪12および後輪14に対して設けられる。前輪12に設けられるブレーキ装置36は、電動駆動ユニット36Aと、前輪12のホイールに接触可能なブレーキパッドを含むキャリパ36Bとを備える、リムブレーキである。ブレーキ装置36の電動駆動ユニット36Aは、駆動回路、および、電動モータを含む。ブレーキ装置36は、制御装置200によって自動制御されるコンポーネントの1つである。ブレーキ装置36は、ハンドルバー16に設けられるブレーキ操作装置36Cに接続されてもよい。制御装置200からの制御信号、または、ブレーキ操作装置36Cの操作に応じて、電動駆動ユニット36Aの駆動回路は、電動モータによってキャリパ36Bを作動させ、ブレーキパッドを前輪12のホイールに接触させることによって、前輪12の回転力を減衰させる。ブレーキ装置36は、制動力が異なる複数の制御状態にて動作可能である。ブレーキ装置36の制御結果は、評価装置100へ出力され、評価装置100の記憶部106に履歴として記憶されてもよい。ブレーキ装置36は、ブレーキ操作装置36Cへの操作入力に関する情報を、評価装置100へ出力してもよい。操作入力に関する情報には、例えば、ブレーキ操作の仕方、操作量、および、左右いずれのブレーキ装置36の操作であるのかを示す情報が含まれる。 The braking device 36 is provided for the front wheels 12 and the rear wheels 14. The brake device 36 provided on the front wheel 12 is a rim brake including an electric drive unit 36A and a caliper 36B including a brake pad that can contact the wheels of the front wheel 12. The electric drive unit 36A of the brake device 36 includes a drive circuit and an electric motor. The brake device 36 is one of the components automatically controlled by the control device 200. The brake device 36 may be connected to the brake operating device 36C provided on the handlebar 16. In response to the control signal from the control device 200 or the operation of the brake operating device 36C, the drive circuit of the electric drive unit 36A operates the caliper 36B by the electric motor to bring the brake pads into contact with the wheels of the front wheels 12. , The rotational force of the front wheel 12 is attenuated. The brake device 36 can operate in a plurality of control states having different braking forces. The control result of the brake device 36 may be output to the evaluation device 100 and stored as a history in the storage unit 106 of the evaluation device 100. The brake device 36 may output information regarding an operation input to the brake operation device 36C to the evaluation device 100. The information regarding the operation input includes, for example, a method of operating the brake, an operation amount, and information indicating which of the left and right brake devices 36 is the operation.

後輪14に設けられるブレーキ装置36は、電動駆動ユニット36Aと、後輪14のホイールに接触可能なブレーキパッドを含むキャリパ36Bとを備える、リムブレーキである。ブレーキ装置36の電動駆動ユニット36Aは、駆動回路、および、電動モータを含む。ブレーキ装置36は、制御装置200によって自動制御されるコンポーネントの1つである。ブレーキ装置36は、ハンドルバー16に設けられるブレーキ操作装置36Cに接続されてもよい。制御装置200からの制御信号、または、ブレーキ操作装置36Cの操作に応じて、電動駆動ユニット36Aの駆動回路は、電動モータによってキャリパ36Bを作動させ、ブレーキパッドを後輪14のホイールに接触させることによって、後輪14の回転力を減衰させる。ブレーキ装置36は、制動力が異なる複数の制御状態にて動作可能である。ブレーキ装置36の制御結果は、評価装置100へ出力され、評価装置100の記憶部106に履歴として記憶されてもよい。ブレーキ装置36は、ブレーキ操作装置36Cへの操作入力に関する情報を、評価装置100へ出力してもよい。 The brake device 36 provided on the rear wheel 14 is a rim brake including an electric drive unit 36A and a caliper 36B including a brake pad that can contact the wheels of the rear wheel 14. The electric drive unit 36A of the brake device 36 includes a drive circuit and an electric motor. The brake device 36 is one of the components automatically controlled by the control device 200. The brake device 36 may be connected to the brake operating device 36C provided on the handlebar 16. In response to the control signal from the control device 200 or the operation of the brake operating device 36C, the drive circuit of the electric drive unit 36A operates the caliper 36B by the electric motor to bring the brake pads into contact with the wheels of the rear wheels 14. Attenuates the rotational force of the rear wheels 14. The brake device 36 can operate in a plurality of control states having different braking forces. The control result of the brake device 36 may be output to the evaluation device 100 and stored as a history in the storage unit 106 of the evaluation device 100. The brake device 36 may output information regarding an operation input to the brake operation device 36C to the evaluation device 100.

ブレーキ装置36は、前輪12のハブおよび後輪14のハブに取り付けられる回転体に接触可能なブレーキパッドを含むディスクブレーキであってもよい。ディスクブレーキでは、例えば、電動モータによって流体を制御してブレーキパッドを移動させ、ブレーキパッドを回転体(ディスクブレーキロータ)に押し当てることによって、前輪12または後輪14の回転力を減衰させる。または、ディスクブレーキは、電動モータによって直接的にブレーキパッドを移動させ、ブレーキパッドを回転体に押し当てることによって、前輪12または後輪14の回転力を減衰させる。 The braking device 36 may be a disc brake including a brake pad that can come into contact with a rotating body attached to the hub of the front wheel 12 and the hub of the rear wheel 14. In a disc brake, for example, a fluid is controlled by an electric motor to move a brake pad, and the brake pad is pressed against a rotating body (disc brake rotor) to attenuate the rotational force of the front wheels 12 or the rear wheels 14. Alternatively, the disc brake directly moves the brake pads by the electric motor and presses the brake pads against the rotating body to attenuate the rotational force of the front wheels 12 or the rear wheels 14.

アンチロックブレーキ装置38は、ブレーキ装置36に対して設けられる。アンチロックブレーキ装置38は、駆動回路を含む電動駆動ユニット38A、作動油を溜めるリザーバ、作動油を供給し、キャリパ36Bに油圧を与えるポンプ、ブレーキ装置36のキャリパ36Bに与えられる油圧を調節するバルブ等を備える。電動駆動ユニット38Aは、バルブの開閉を制御し、キャリパ36Bに与える油圧を調節することによって、キャリパ36Bから前輪12または後輪14に与える制動力を制御する。アンチロックブレーキ装置38は、制御装置200によって自動制御されるコンポーネントの1つである。アンチロックブレーキ装置38は、キャリパ36Bに与える油圧の大きさが異なる複数の制御状態にて動作可能である。アンチロックブレーキ装置38の制御結果は、評価装置100へ出力され、評価装置100の記憶部106に履歴として記憶される。 The anti-lock braking device 38 is provided for the braking device 36. The anti-lock braking device 38 includes an electric drive unit 38A including a drive circuit, a reservoir for storing hydraulic oil, a pump for supplying hydraulic oil to the caliper 36B, and a valve for adjusting the hydraulic pressure given to the caliper 36B of the braking device 36. Etc. are provided. The electric drive unit 38A controls the opening and closing of the valve and adjusts the hydraulic pressure applied to the caliper 36B to control the braking force applied from the caliper 36B to the front wheels 12 or the rear wheels 14. The antilock brake device 38 is one of the components automatically controlled by the control device 200. The antilock brake device 38 can operate in a plurality of control states in which the magnitude of the hydraulic pressure applied to the caliper 36B is different. The control result of the antilock brake device 38 is output to the evaluation device 100 and stored as a history in the storage unit 106 of the evaluation device 100.

サスペンション装置40は、一例では、フロントフォーク10Bに設けられ、前輪12に加えられた衝撃を減衰するフロントサスペンションである。他の例では、サスペンション装置40は、後輪14に加えられた衝撃を減衰するリアサスペンションである。サスペンション装置40は、電動駆動ユニット40Aを備える。電動駆動ユニット40Aは、駆動回路、および、電動モータを含む。サスペンション装置40は、動作パラメータとして、例えば、減衰率、反発力、ストローク量、およびロックアウト状態を設定することによって制御される。サスペンション装置40は、制御装置200によって自動制御されるコンポーネントの1つである。サスペンション装置40は、緩衝性が異なる複数の制御状態にて動作可能である。サスペンション装置40の制御結果は、評価装置100へ出力され、評価装置100の記憶部106に履歴として記憶される。 The suspension device 40 is, for example, a front suspension provided on the front fork 10B to attenuate the impact applied to the front wheels 12. In another example, the suspension device 40 is a rear suspension that damps the impact applied to the rear wheels 14. The suspension device 40 includes an electric drive unit 40A. The electric drive unit 40A includes a drive circuit and an electric motor. The suspension device 40 is controlled by setting, for example, a damping factor, a repulsive force, a stroke amount, and a lockout state as operating parameters. The suspension device 40 is one of the components automatically controlled by the control device 200. The suspension device 40 can operate in a plurality of control states having different cushioning properties. The control result of the suspension device 40 is output to the evaluation device 100 and stored as a history in the storage unit 106 of the evaluation device 100.

バッテリユニット42は、バッテリ42Aおよびバッテリホルダ42Bを含む。バッテリ42Aは、1または複数のバッテリセルを含む蓄電池である。バッテリホルダ42Bは、人力駆動車1のフレーム10Aに固定される。バッテリ42Aは、バッテリホルダ42Bに、着脱可能に取り付けられる。バッテリ42Aは、変速装置32、アシスト装置34、ブレーキ装置36、アンチロックブレーキ装置38、サスペンション装置40などにそれぞれ電気的に接続される。 The battery unit 42 includes a battery 42A and a battery holder 42B. Battery 42A is a storage battery that includes one or more battery cells. The battery holder 42B is fixed to the frame 10A of the human-powered vehicle 1. The battery 42A is detachably attached to the battery holder 42B. The battery 42A is electrically connected to the transmission 32, the assist device 34, the brake device 36, the antilock brake device 38, the suspension device 40, and the like.

人力駆動車1は、更に、車速センサS1、加速度センサS2、姿勢センサS3、荷重センサS4、トルクセンサS5、ケイデンスセンサS6、傾斜センサS7、撮像センサS8、位置センサS9、および、気象センサS10の少なくとも1つを備えてもよい。以下の説明において、それぞれを個別に説明する必要がない場合、センサS1〜S10とも記載する。 The human-powered vehicle 1 further includes a vehicle speed sensor S1, an acceleration sensor S2, an attitude sensor S3, a load sensor S4, a torque sensor S5, a cadence sensor S6, an inclination sensor S7, an image sensor S8, a position sensor S9, and a weather sensor S10. At least one may be provided. In the following description, when it is not necessary to explain each of them individually, the sensors S1 to S10 are also described.

車速センサS1は、人力駆動車1の速度に応じた信号を出力するセンサである。車速センサS1は、フレーム10Aまたはフロントフォーク10Bに取り付けられる。車速センサS1は、例えばホール素子を含み、前輪12または後輪14に設けられる磁石(図示略)を検出することによって、前輪12または後輪14の回転速度を計測する。一例では、車速センサS1は、前輪12または後輪14の回転速度を示す信号を出力する。他の例では、車速センサS1は、計測した前輪12または後輪14の回転速度に基づき、人力駆動車1の速度を算出し、算出した速度を示す信号を出力する。 The vehicle speed sensor S1 is a sensor that outputs a signal corresponding to the speed of the human-powered vehicle 1. The vehicle speed sensor S1 is attached to the frame 10A or the front fork 10B. The vehicle speed sensor S1 includes, for example, a Hall element, and measures the rotational speed of the front wheels 12 or the rear wheels 14 by detecting magnets (not shown) provided on the front wheels 12 or the rear wheels 14. In one example, the vehicle speed sensor S1 outputs a signal indicating the rotational speed of the front wheels 12 or the rear wheels 14. In another example, the vehicle speed sensor S1 calculates the speed of the human-powered vehicle 1 based on the measured rotation speeds of the front wheels 12 or the rear wheels 14, and outputs a signal indicating the calculated speed.

加速度センサS2は、人力駆動車1の前後方向の加速度に応じた信号を出力するセンサである。加速度センサS2は、例えば、フレーム10Aに設けられ、前後方向の加速度が加えられた場合における錘の変位を静電容量または抵抗値の変化として検出することによって加速度を計測する。加速度センサS2は、人力駆動車1のヨー方向、ロール方向、および、ピッチ方向の加速度を計測するモーションセンサであってもよい。 The acceleration sensor S2 is a sensor that outputs a signal corresponding to the acceleration in the front-rear direction of the human-powered vehicle 1. The acceleration sensor S2 is provided on the frame 10A, for example, and measures the acceleration by detecting the displacement of the weight when the acceleration in the front-rear direction is applied as a change in capacitance or resistance value. The acceleration sensor S2 may be a motion sensor that measures the acceleration in the yaw direction, the roll direction, and the pitch direction of the human-powered vehicle 1.

姿勢センサS3は、ライダーの姿勢に応じた信号を出力するセンサである。姿勢センサS3の一例は圧電センサであり、ライダーの体重が掛かる人力駆動車1の複数箇所に設けられる。例えば、姿勢センサS3は、ハンドルバー16が備えるグリップ、シート18の表面、ペダル28等の1または複数箇所に設けられる。姿勢センサS3は、ライダーに装着されるウェアラブル端末に内蔵されるモーションセンサであってもよい。 The posture sensor S3 is a sensor that outputs a signal according to the posture of the rider. An example of the posture sensor S3 is a piezoelectric sensor, which is provided at a plurality of locations of the human-powered vehicle 1 on which the weight of the rider is applied. For example, the posture sensor S3 is provided at one or a plurality of locations such as the grip provided on the handlebar 16, the surface of the seat 18, and the pedal 28. The posture sensor S3 may be a motion sensor built in a wearable terminal mounted on the rider.

荷重センサS4は、人力駆動車1に加えられる荷重に応じた信号を出力するセンサである。荷重センサS4の一例は、歪みゲージ式のロードセルである。荷重センサS4は、前輪12または後輪14の車軸、ハンドルバー16、シート18、ペダル28等の人力駆動車1の一箇所または復数箇所に設けられる。荷重センサS4は、前輪12および後輪14の接地荷重を計測するセンサであってもよく、人力駆動車1の荷重バランスを計測するセンサであってもよい。姿勢センサS3および荷重センサS4の少なくとも一部を共通化してもよい。 The load sensor S4 is a sensor that outputs a signal corresponding to the load applied to the human-powered vehicle 1. An example of the load sensor S4 is a strain gauge type load cell. The load sensor S4 is provided at one location or several locations of the human-powered vehicle 1 such as the axle of the front wheel 12 or the rear wheel 14, the handlebar 16, the seat 18, and the pedal 28. The load sensor S4 may be a sensor that measures the ground contact load of the front wheels 12 and the rear wheels 14, or may be a sensor that measures the load balance of the human-powered vehicle 1. At least a part of the attitude sensor S3 and the load sensor S4 may be shared.

トルクセンサS5は、クランク22に加えられるトルクに応じた信号を出力するセンサである。トルクセンサS5は、右クランク22A、左クランク22B、クランク軸22C、フロントスプロケットアセンブリ24A、または、クランク軸22Cからフロントスプロケットアセンブリ24Aまでの駆動経路のいずれかに設けられる。トルクセンサS5は、歪みセンサ、磁歪センサ、光センサ、または、圧力センサ等を含み、クランク22に加えられるトルクを検出する。 The torque sensor S5 is a sensor that outputs a signal corresponding to the torque applied to the crank 22. The torque sensor S5 is provided in either the right crank 22A, the left crank 22B, the crankshaft 22C, the front sprocket assembly 24A, or the drive path from the crankshaft 22C to the front sprocket assembly 24A. The torque sensor S5 includes a strain sensor, a magnetostriction sensor, an optical sensor, a pressure sensor, and the like, and detects the torque applied to the crank 22.

ケイデンスセンサS6は、ケイデンスを示す信号を出力するセンサである。ケイデンスセンサS6は、フレーム10Aに取り付けられる。ケイデンスセンサS6は、例えばホール素子を含み、右クランク22Aまたは左クランク22Bに設けられる磁石(図示略)を検出することによって、クランク軸22Cの単位時間当たりの回転数を計測する。 The cadence sensor S6 is a sensor that outputs a signal indicating cadence. The cadence sensor S6 is attached to the frame 10A. The cadence sensor S6 includes, for example, a Hall element, and measures the number of rotations of the crankshaft 22C per unit time by detecting a magnet (not shown) provided on the right crank 22A or the left crank 22B.

評価装置100は、トルクセンサS5によって検出されるクランク22に加えられるトルクと、ケイデンスセンサS6によって検出されるクランク軸22Cの単位時間当たりの回転数と、に基づき、人力駆動車100に加えられるパワーを算出することができる。 The evaluation device 100 applies power to the human-powered vehicle 100 based on the torque applied to the crank 22 detected by the torque sensor S5 and the rotation speed of the crankshaft 22C detected by the cadence sensor S6 per unit time. Can be calculated.

傾斜センサS7は、人力駆動車1の傾斜角度に応じた信号を出力するセンサである。傾斜センサS7が検出する傾斜角度は、例えば、人力駆動車1の左右方向に沿うピッチ軸まわりの回転角度である。傾斜センサS7は、一例として、ピッチ角度の角速度を検出するセンサを含み、ピッチ軸まわりの角速度を積分した値をピッチ角度として算出する。傾斜センサS7は、人力駆動車1の前後方向に沿うロール軸まわりの回転角度、および、人力駆動車1の上下方向に沿うヨー軸まわりの回転速度を併せて計測する構成であってもよい。 The tilt sensor S7 is a sensor that outputs a signal according to the tilt angle of the human-powered vehicle 1. The tilt angle detected by the tilt sensor S7 is, for example, a rotation angle around the pitch axis along the left-right direction of the human-powered vehicle 1. As an example, the tilt sensor S7 includes a sensor that detects the angular velocity of the pitch angle, and calculates a value obtained by integrating the angular velocity around the pitch axis as the pitch angle. The tilt sensor S7 may be configured to measure the rotation angle around the roll axis along the front-rear direction of the human-powered vehicle 1 and the rotation speed around the yaw axis along the vertical direction of the human-powered vehicle 1.

撮像センサS8は、人力駆動車1の周囲を撮像することによって得られる映像信号を出力するセンサである。撮像センサS8は、例えば、撮像範囲内に路面が含まれるようにフレーム10Aまたはハンドルバー16の適宜箇所に設けられる。撮像センサS8はライダーに装着されるウェアラブルカメラであってもよい。 The image sensor S8 is a sensor that outputs a video signal obtained by photographing the surroundings of the human-powered vehicle 1. The image sensor S8 is provided at an appropriate position on the frame 10A or the handlebar 16 so that the road surface is included in the image pickup range, for example. The image sensor S8 may be a wearable camera mounted on the rider.

位置センサS9は、人力駆動車1の現在位置を示す信号を出力するセンサである。位置センサS9は、フレーム10Aまたはハンドルバー16に取り付けられる。位置センサS9は、例えばGPS(Global Positioning System)通信機を含み、GPS衛星からの電波を受信することによって、人力駆動車1の現在位置を測位する。位置センサS9は、測位した位置情報を逐次記録するメモリを備え、メモリに記録した位置情報に基づき、人力駆動車1が走行した走行路の情報を出力する構成であってもよい。 The position sensor S9 is a sensor that outputs a signal indicating the current position of the human-powered vehicle 1. The position sensor S9 is attached to the frame 10A or the handlebar 16. The position sensor S9 includes, for example, a GPS (Global Positioning System) communication device, and positions the current position of the human-powered vehicle 1 by receiving radio waves from GPS satellites. The position sensor S9 may be provided with a memory for sequentially recording the positioned position information, and may be configured to output information on the travel path on which the human-powered vehicle 1 has traveled based on the position information recorded in the memory.

気象センサS10は、人力駆動車1の周囲の気象を計測し、計測結果に応じた信号を出力するセンサである。気象センサS10は、フレーム10Aに取り付けられ、風向、風速、外気の温度、および、外気の湿度のうちの少なくとも1つを計測する。気象センサS10は、外部の気象サーバ(図示略)と通信し、気象サーバから、人力駆動車1の周囲の風向、風速、外気の温度、および、外気の湿度のうちの少なくとも1つの情報を取得する構成であってもよい。 The weather sensor S10 is a sensor that measures the weather around the human-powered vehicle 1 and outputs a signal according to the measurement result. The weather sensor S10 is attached to the frame 10A and measures at least one of the wind direction, the wind speed, the temperature of the outside air, and the humidity of the outside air. The meteorological sensor S10 communicates with an external meteorological server (not shown) and acquires at least one of the wind direction, wind speed, outside air temperature, and outside air humidity around the human-powered vehicle 1 from the meteorological server. It may be configured to be used.

評価装置100は、コンピュータの一種である。一例では、評価装置100は、人力駆動車1に設けられるサイクルコンピュータなどの専用端末である。評価装置100は、他の例では、人力駆動車1のライダーが所持するスマートフォン、タブレット端末、ウェアラブル端末などの汎用端末である。 The evaluation device 100 is a kind of computer. In one example, the evaluation device 100 is a dedicated terminal such as a cycle computer provided in the human-powered vehicle 1. In another example, the evaluation device 100 is a general-purpose terminal such as a smartphone, a tablet terminal, or a wearable terminal possessed by the rider of the human-powered vehicle 1.

評価装置100は、人力駆動車1の走行に関する走行情報を取得する。評価装置100が取得する走行情報は、速度、加速度、姿勢、荷重、駆動力、ケイデンス、変速比、操作装置30への操作入力、操作入力とコンポーネントの制御結果の履歴、回生量、傾斜、路面状況、位置、天候、および、車両情報のうちの少なくとも1つに関する情報を含む。走行情報は、人力駆動車1のトラクションに関する情報を含んでもよい。評価装置100は、人力駆動車1に搭載されるセンサS1〜S10またはコンポーネントから走行情報を取得できる。評価装置100が取得する走行情報は、センサS1〜S10またはコンポーネントから直接的に得られる情報だけでなく、演算によって導出される情報を含んでもよく、評価装置100の記憶部106に記憶される情報を含んでもよい。例えば、記憶部106に記憶される走行情報は、ブレーキ操作装置36Cへの操作入力に対する制動距離の情報を含んでもよく、フレーム寸法、人力駆動車1の重量、タイヤ径などの車両情報を含んでもよい。 The evaluation device 100 acquires travel information regarding the travel of the human-powered vehicle 1. The traveling information acquired by the evaluation device 100 includes speed, acceleration, attitude, load, driving force, cadence, gear ratio, operation input to the operation device 30, history of operation input and component control results, regeneration amount, inclination, and road surface. Includes information about the situation, location, weather, and at least one of the vehicle information. The traveling information may include information on the traction of the human-powered vehicle 1. The evaluation device 100 can acquire travel information from sensors S1 to S10 or components mounted on the human-powered vehicle 1. The traveling information acquired by the evaluation device 100 may include not only the information directly obtained from the sensors S1 to S10 or the components but also the information derived by calculation, and the information stored in the storage unit 106 of the evaluation device 100. May include. For example, the traveling information stored in the storage unit 106 may include information on the braking distance with respect to the operation input to the brake operating device 36C, and may include vehicle information such as the frame size, the weight of the human-powered vehicle 1, and the tire diameter. Good.

評価装置100は、人力駆動車1の走行に関する走行情報に従って、人力駆動車1のコンポーネントに対する制御の好ましさを、学習モデル120を用いて評価する。ここで、制御の好ましさは、コンポーネントに対する制御を実行した際の人力駆動車1の状態の良し悪しを示唆する情報である。評価装置100は、例えば、人力駆動車1のトラクションの良し悪しによって制御の好ましさを評価できる。評価装置100は、人力駆動車1のトラクションが良好となる制御を高く評価し、トラクションが低減することが推定される制御を低く評価してもよい。評価装置100がコンポーネントに対する制御の好ましさを評価する際に用いる学習モデル120については、図3を用いて詳述することとする。 The evaluation device 100 evaluates the preference of control for the components of the human-powered vehicle 1 by using the learning model 120 according to the travel information regarding the traveling of the human-powered vehicle 1. Here, the preference of control is information suggesting whether the state of the human-powered vehicle 1 is good or bad when the control for the component is executed. The evaluation device 100 can evaluate the preference of control based on, for example, the quality of traction of the human-powered vehicle 1. The evaluation device 100 may highly evaluate the control that improves the traction of the human-powered vehicle 1, and may underestimate the control that is estimated to reduce the traction. The learning model 120 used by the evaluation device 100 to evaluate the preference for control over the components will be described in detail with reference to FIG.

図2は第1実施形態に係る評価装置100の内部構成を示すブロック図である。評価装置100は、入力部102、演算処理部104、記憶部106、および、出力部108を備える。 FIG. 2 is a block diagram showing an internal configuration of the evaluation device 100 according to the first embodiment. The evaluation device 100 includes an input unit 102, an arithmetic processing unit 104, a storage unit 106, and an output unit 108.

入力部102は、操作装置30、変速装置32、アシスト装置34、ブレーキ装置36、アンチロックブレーキ(ABS:Anti-lock Brake System)装置38、サスペンション装置40、および、センサS1〜S10の少なくとも1つを接続するインタフェースを備える。入力部102が備えるインタフェースは、例えば有線のインタフェースであり、操作装置30等を、通信ケーブルを介して接続する。入力部102を通じて入力される信号に基づく情報は記憶部106に一時的に記憶される。入力部102が備えるインタフェースは、無線インタフェースであってもよい。無線インタフェースとして、Bluetooth(登録商標) 、WiFi(登録商標)、ZigBee(登録商標)、LTE(Long Term Evolution)、および、その他の無線LAN(Local Area Network)を含む通信規格に準じた通信インタフェースを用いることができる。 The input unit 102 is at least one of an operating device 30, a transmission 32, an assist device 34, a braking device 36, an anti-lock braking system (ABS) device 38, a suspension device 40, and sensors S1 to S10. It has an interface to connect to. The interface included in the input unit 102 is, for example, a wired interface, and the operation device 30 and the like are connected via a communication cable. Information based on the signal input through the input unit 102 is temporarily stored in the storage unit 106. The interface included in the input unit 102 may be a wireless interface. As a wireless interface, a communication interface conforming to a communication standard including Bluetooth (registered trademark), WiFi (registered trademark), ZigBee (registered trademark), LTE (Long Term Evolution), and other wireless LAN (Local Area Network). Can be used.

演算処理部104は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを備える。演算処理部104が備えるROMには、評価装置100が備えるハードウェア各部の動作を制御するためのコンピュータプログラム等が記憶される。演算処理部104内のCPUは、ROMまたは記憶部106に記憶されるコンピュータプログラムを実行し、ハードウェア各部の動作を制御することによって、人力駆動車1の走行に関する走行情報に従って、人力駆動車1のコンポーネントに対する制御の好ましさを、学習モデル120を用いて評価する処理を実現する。演算処理部104が備えるRAMには、演算の実行中に利用されるデータが一時的に記憶される。 The arithmetic processing unit 104 includes a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), and the like. The ROM included in the arithmetic processing unit 104 stores a computer program or the like for controlling the operation of each hardware unit included in the evaluation device 100. The CPU in the arithmetic processing unit 104 executes a computer program stored in the ROM or the storage unit 106 to control the operation of each hardware unit, and thereby according to the traveling information regarding the traveling of the human-powered vehicle 1, the human-powered vehicle 1 A process of evaluating the preference of control for the components of the above using the learning model 120 is realized. Data used during execution of the calculation is temporarily stored in the RAM included in the calculation processing unit 104.

演算処理部104は、CPU、ROMおよびRAMを備える構成としたが、GPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)、DSP(Digital Signal Processor)、量子プロセッサ、揮発性または不揮発性のメモリ等を備える1または複数の演算回路であってもよい。 The arithmetic processing unit 104 is configured to include a CPU, ROM, and RAM, but is a GPU (Graphics Processing Unit), FPGA (Field Programmable Gate Array), DSP (Digital Signal Processor), quantum processor, volatile or non-volatile memory. It may be one or a plurality of arithmetic circuits including the above.

記憶部106は、EEPROM(Electronically Erasable Programmable Read Only Memory)、SRAM(Static Random Access Memory)などのメモリを備える。記憶部106は、演算処理部104によって実行される評価処理プログラム110を含む各種コンピュータプログラム、および、後述する学習モデル120等を記憶する。 The storage unit 106 includes a memory such as an EEPROM (Electronically Erasable Programmable Read Only Memory) and a SRAM (Static Random Access Memory). The storage unit 106 stores various computer programs including the evaluation processing program 110 executed by the arithmetic processing unit 104, a learning model 120 and the like, which will be described later.

評価処理プログラム110は、コンピュータに、人力駆動車1の走行に関する走行情報に従って、人力駆動車1のコンポーネントに対する制御の好ましさを、学習モデル120を用いて評価する処理を実行させるためのコンピュータプログラムである。演算処理部104は、評価処理プログラム110を実行することによって、人力駆動車1の走行情報に従って、人力駆動車1のコンポーネントに対する制御の好ましさを、学習モデル120を用いて評価する。 The evaluation processing program 110 is a computer program for causing a computer to execute a process of evaluating the preference of control for the components of the human-powered vehicle 1 by using the learning model 120 according to the traveling information regarding the traveling of the human-powered vehicle 1. Is. By executing the evaluation processing program 110, the arithmetic processing unit 104 evaluates the preference for control of the components of the human-powered vehicle 1 according to the traveling information of the human-powered vehicle 1 by using the learning model 120.

評価処理プログラム110を含む各種コンピュータプログラムは、コンピュータプログラムが記憶される記憶媒体Mによって提供され得る。記憶媒体Mは、例えば、CD−ROM、USBメモリ、SD(Secure Digital)カード、マイクロSDカード、コンパクトフラッシュ(登録商標)などの可搬型メモリである。本実施形態において、記憶媒体Mは、評価処理プログラム110を含む各種コンピュータプログラムを読み取り可能に記憶する非一時的な記憶媒体である。演算処理部104は、読取装置を用いて記憶媒体Mから各種コンピュータプログラムを読み取り、読み取った各種コンピュータプログラムを記憶部106にインストールする。 Various computer programs including the evaluation processing program 110 may be provided by the storage medium M in which the computer program is stored. The storage medium M is, for example, a portable memory such as a CD-ROM, a USB memory, an SD (Secure Digital) card, a micro SD card, and a compact flash (registered trademark). In the present embodiment, the storage medium M is a non-temporary storage medium that readablely stores various computer programs including the evaluation processing program 110. The arithmetic processing unit 104 reads various computer programs from the storage medium M using a reading device, and installs the read various computer programs in the storage unit 106.

記憶部106に記憶される学習モデル120は、その定義情報によって記述される。学習モデル120の定義情報は、学習モデル120の構造情報、学習モデル120で用いられるノード間の重みおよびバイアスなどの各種パラメータ等を含む。本実施形態における学習モデル120は、人力駆動車1の走行に関する走行情報に従って、人力駆動車1のコンポーネントに対する制御の好ましさを評価するために用いられる。学習モデル120は、一例では、DQN(Deep Q-Network)を用いて構築される学習モデルである。学習モデル120は、DQNに限らず、DDQN(Double DQN)、CDQN(Continuous DQN)などを用いて構築される学習モデルであってもよい。 The learning model 120 stored in the storage unit 106 is described by the definition information thereof. The definition information of the learning model 120 includes structural information of the learning model 120, various parameters such as weights and biases between nodes used in the learning model 120, and the like. The learning model 120 in the present embodiment is used to evaluate the preference of control for the components of the human-powered vehicle 1 according to the travel information regarding the traveling of the human-powered vehicle 1. The learning model 120 is, for example, a learning model constructed by using DQN (Deep Q-Network). The learning model 120 is not limited to DQN, and may be a learning model constructed using DDQN (Double DQN), CDQN (Continuous DQN), or the like.

出力部108は、演算処理部104による評価結果を出力する出力インタフェースを備える。評価結果の出力形式は任意である。一例では、出力部108は、液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイ等の表示デバイスを備える。この場合、出力部108は、制御の好ましさに関する評価結果を文字情報または画像情報として表示デバイスに表示してもよい。他の例では、出力部108は、スピーカ等の音声出力デバイスを備える。この場合、出力部108は、制御の好ましさに関する評価結果を音声出力デバイスから音声として出力してもよい。更に他の例では、出力部108は、通信インタフェースを備える。この場合、出力部108は、制御の好ましさに関する評価結果を通信インタフェースに接続された外部機器へ出力してもよい。 The output unit 108 includes an output interface that outputs an evaluation result by the arithmetic processing unit 104. The output format of the evaluation result is arbitrary. In one example, the output unit 108 includes a display device such as a liquid crystal display or an organic EL (Electro-Luminescence) display. In this case, the output unit 108 may display the evaluation result regarding the preference of control on the display device as character information or image information. In another example, the output unit 108 includes an audio output device such as a speaker. In this case, the output unit 108 may output the evaluation result regarding the preference of control as voice from the voice output device. In yet another example, the output unit 108 includes a communication interface. In this case, the output unit 108 may output the evaluation result regarding the preference of control to an external device connected to the communication interface.

図3は学習モデル120の実装例を示す模式図である。学習モデル120は、例えばDQNによって構築される学習モデルである。DQNでは、状態sを入力とし、選択し得る行動aに対応した数の行動価値関数Q(s,a)の値を出力とする多層ニューラルネットワークが用いられる。以下の説明において、行動価値関数Q(s,a)の値をQ値とも記載される。学習モデル120を構成する多層ニューラルネットワークは、例えば、入力層122、中間層124、および、出力層126を含む。 FIG. 3 is a schematic diagram showing an implementation example of the learning model 120. The learning model 120 is, for example, a learning model constructed by DQN. In DQN, a multi-layer neural network is used in which the state s is input and the value of the action value function Q (s, a) corresponding to the selectable action a is output. In the following description, the value of the action value function Q (s, a) is also described as the Q value. The multi-layer neural network constituting the learning model 120 includes, for example, an input layer 122, an intermediate layer 124, and an output layer 126.

入力層122は複数のノードを備える。入力層122のノードは、入力すべき状態sの数だけ用意される。本実施形態において、状態sは、人力駆動車1の走行に関する走行情報である。走行情報は、速度、加速度、姿勢、荷重、駆動力、ケイデンス、変速比、操作装置30への操作入力、操作入力とコンポーネントの制御結果の履歴、回生量、傾斜、路面状況、位置、天候、および、車両情報のうちの少なくとも1つによって区別される状態である。 The input layer 122 includes a plurality of nodes. The number of nodes of the input layer 122 is prepared as many as the number of states to be input. In the present embodiment, the state s is travel information regarding the travel of the human-powered vehicle 1. The driving information includes speed, acceleration, attitude, load, driving force, cadence, gear ratio, operation input to the operation device 30, history of operation input and component control result, regeneration amount, inclination, road surface condition, position, weather, And, it is a state distinguished by at least one of the vehicle information.

中間層124は、複数の層により構成される。中間層124の各層は、複数のノードを備える。中間層124における各層のノードは、前後の層に存在するノードと一方向に所望の重みとバイアスとによって結合される。ノード間の結合状態を特徴付ける重みおよびバイアスは学習によって更新される。中間層124は、各ノードを用いて演算して演算結果を出力層126へ出力する。 The intermediate layer 124 is composed of a plurality of layers. Each layer of the intermediate layer 124 includes a plurality of nodes. The nodes of each layer in the intermediate layer 124 are connected to the nodes existing in the preceding and following layers by a desired weight and bias in one direction. The weights and biases that characterize the connection state between nodes are updated by learning. The intermediate layer 124 calculates using each node and outputs the calculation result to the output layer 126.

出力層126は、複数のノードを備える。出力層126のノードは区別すべき行動aの数だけ用意される。本実施形態において、行動aは、人力駆動車1が備える1つまたは複数のコンポーネントの制御状態によって区別される。例えば、行動aは、人力駆動車1のブレーキ装置36が作動している状態であるか否かに応じて区別される。更に、行動aは、左右いずれのブレーキ装置36が作動したのか、どの程度の力または速度でブレーキ操作装置36Cを操作したのか等に応じて区別される。行動aは、ブレーキ装置36の制御状態に限らず、アシスト装置34、アンチロックブレーキ装置38、または、サスペンション装置40の制御状態によって区別されてもよい。 The output layer 126 includes a plurality of nodes. The number of nodes of the output layer 126 is prepared as many as the number of actions a to be distinguished. In this embodiment, the action a is distinguished by the control state of one or more components included in the human-powered vehicle 1. For example, the action a is distinguished according to whether or not the brake device 36 of the human-powered vehicle 1 is operating. Further, the action a is distinguished according to whether the left or right brake device 36 is operated, the force or speed at which the brake operation device 36C is operated, or the like. The action a is not limited to the control state of the brake device 36, and may be distinguished by the control state of the assist device 34, the antilock brake device 38, or the suspension device 40.

出力層126の各ノードは、各行動aに対するQ値を出力する。Q値は、状態sが示す状態において行動aを取った場合における、将来にわたって得られる収益の期待値である。学習モデル120は、人力駆動車1のトラクションが良好となるような制御状態においてQ値が高くなり、人力駆動車1のトラクションが失われるような制御状態においてQ値が低くなるように学習される。 Each node of the output layer 126 outputs a Q value for each action a. The Q value is an expected value of profits obtained in the future when the action a is taken in the state indicated by the state s. The learning model 120 is learned so that the Q value becomes high in the control state where the traction of the human-powered vehicle 1 is good, and the Q value becomes low in the control state where the traction of the human-powered vehicle 1 is lost. ..

次に、学習モデル120を用いた評価手順について説明する。
図4は学習モデル120の学習手順を説明するフローチャートである。ステップS101において、評価装置100の演算処理部104は、走行情報を取得する。具体的には、演算処理部104は、入力部102を通じて、速度、加速度、姿勢、荷重、駆動力、ケイデンス、変速比、操作装置30への操作入力、操作入力とコンポーネントの制御結果の履歴、回生量、傾斜、路面状況、位置、天候、および、車両情報のうちの少なくとも1つを含む走行情報を取得する。演算処理部104が取得する走行情報は、人力駆動車1のトラクションに関する情報であってもよい。走行情報は、各種センサS1〜S10によって得られる情報だけでなく、演算処理部104によって演算される情報であってもよく、記憶部106に記憶されている情報であってもよい。
Next, the evaluation procedure using the learning model 120 will be described.
FIG. 4 is a flowchart illustrating a learning procedure of the learning model 120. In step S101, the arithmetic processing unit 104 of the evaluation device 100 acquires the traveling information. Specifically, the arithmetic processing unit 104, through the input unit 102, speed, acceleration, attitude, load, driving force, cadence, gear ratio, operation input to the operation device 30, history of operation input and component control result, Acquire driving information including at least one of regeneration amount, inclination, road surface condition, position, weather, and vehicle information. The traveling information acquired by the arithmetic processing unit 104 may be information related to the traction of the human-powered vehicle 1. The traveling information may be not only the information obtained by the various sensors S1 to S10 but also the information calculated by the arithmetic processing unit 104 or the information stored in the storage unit 106.

ステップS102において、演算処理部104は、入力部102等から取得した走行情報を学習モデル120の入力層122に入力することによって、学習モデル120による演算を実行する。入力層122に入力される走行情報は、DQNによって構築される学習モデル120において、状態sを表す。入力層122に入力された走行情報は中間層124に与えられる。中間層124では、各ノードにおいて直前の層からの入力に対する重みの乗算、バイアスの加算、活性化関数を用いた演算が行われ、演算結果が出力層126へ出力される。出力層126は、各ノードを通じて、Q値を出力する。 In step S102, the arithmetic processing unit 104 executes the arithmetic by the learning model 120 by inputting the traveling information acquired from the input unit 102 or the like into the input layer 122 of the learning model 120. The travel information input to the input layer 122 represents the state s in the learning model 120 constructed by DQN. The traveling information input to the input layer 122 is given to the intermediate layer 124. In the intermediate layer 124, each node performs an operation using weight multiplication, bias addition, and activation function on the input from the immediately preceding layer, and the operation result is output to the output layer 126. The output layer 126 outputs a Q value through each node.

ステップS103において、演算処理部104は、学習モデル120の演算結果として得られるQ値を出力層126から取得する。 In step S103, the arithmetic processing unit 104 acquires the Q value obtained as the arithmetic result of the learning model 120 from the output layer 126.

ステップS104において、演算処理部104は、人力駆動車1のコンポーネントに対する制御の好ましさを評価する。学習モデル120は、出力層126が備える各ノードから、コンポーネントの制御状態に対応する行動aのそれぞれについてQ値を出力する。演算処理部104は、出力層126の各ノードから出力されるQ値を参照することによって、コンポーネントに対する制御の好ましさを評価する。例えば、演算処理部104は、出力層126の各ノードから出力されるQ値のうち、最も高い値を示す行動aに対応した制御状態を、最も好ましい制御と評価できる。 In step S104, the arithmetic processing unit 104 evaluates the preference for control of the components of the human-powered vehicle 1. The learning model 120 outputs a Q value for each of the actions a corresponding to the control state of the component from each node included in the output layer 126. The arithmetic processing unit 104 evaluates the preference of control for the component by referring to the Q value output from each node of the output layer 126. For example, the arithmetic processing unit 104 can evaluate the control state corresponding to the action a showing the highest value among the Q values output from each node of the output layer 126 as the most preferable control.

以上のように、第1実施形態における評価装置100は、学習モデル120を用いることによって、人力駆動車1の走行に関する走行情報に従って、人力駆動車1のコンポーネントに対する制御の好ましさを評価できる。 As described above, the evaluation device 100 in the first embodiment can evaluate the preference of control for the components of the human-powered vehicle 1 according to the travel information regarding the traveling of the human-powered vehicle 1 by using the learning model 120.

(第2実施形態)
第2実施形態では、評価装置100による評価結果に基づき、人力駆動車1のコンポーネントを制御する制御システムについて説明する。
(Second Embodiment)
In the second embodiment, the control system that controls the components of the human-powered vehicle 1 will be described based on the evaluation result by the evaluation device 100.

図5は第2実施形態に係る制御システムを説明するブロック図である。第2実施形態に係る制御システムは、評価装置100と、評価装置100による評価結果に基づき、人力駆動車1のコンポーネントを制御する制御装置200とを備える。制御装置200は、独立した装置として設けられてもよく、制御対象のコンポーネント内に設けられてもよい。図5に示した例では、評価装置100と制御装置200とを別体として記載したが、評価装置100と制御装置200とが一体となった構成であってもよい。 FIG. 5 is a block diagram illustrating a control system according to the second embodiment. The control system according to the second embodiment includes an evaluation device 100 and a control device 200 that controls the components of the human-powered vehicle 1 based on the evaluation result by the evaluation device 100. The control device 200 may be provided as an independent device, or may be provided within a component to be controlled. In the example shown in FIG. 5, the evaluation device 100 and the control device 200 are described as separate bodies, but the evaluation device 100 and the control device 200 may be integrated.

制御装置200は、制御部202、記憶部204、入力部206、および、出力部208を備える。制御部202は、例えば、CPU、ROM、RAMなどを備える。制御部202が備えるROMには、制御装置200が備えるハードウェア各部の動作を制御するための制御プログラム等が記憶される。制御部202内のCPUは、ROMに記憶された制御プログラム、および、記憶部204に記憶された各種プログラムを実行し、ハードウェア各部の動作を制御することによって、本願の制御装置を実現する。具体的には、制御部202は、入力部206を通じて入力される評価装置100からの判定結果に基づき、人力駆動車1のコンポーネントを制御する制御信号を生成し、生成した制御信号を出力部208から出力する。 The control device 200 includes a control unit 202, a storage unit 204, an input unit 206, and an output unit 208. The control unit 202 includes, for example, a CPU, a ROM, a RAM, and the like. The ROM included in the control unit 202 stores a control program or the like for controlling the operation of each hardware unit included in the control device 200. The CPU in the control unit 202 executes the control program stored in the ROM and various programs stored in the storage unit 204 to control the operation of each hardware unit, thereby realizing the control device of the present application. Specifically, the control unit 202 generates a control signal for controlling the components of the human-powered vehicle 1 based on the determination result from the evaluation device 100 input through the input unit 206, and outputs the generated control signal to the output unit 208. Output from.

制御部202は上述の構成に限定されない。制御部202は、シングルコアCPU、マルチコアCPU、FPGA、揮発性または不揮発性のメモリ等を含む1または複数の制御回路であればよい。また、制御部202は、日時情報を出力するクロック、計測開始指示を与えてから計測終了指示を与えるまでの経過時間を計測するタイマ、数をカウントするカウンタ等の機能を備えていてもよい。 The control unit 202 is not limited to the above configuration. The control unit 202 may be one or more control circuits including a single-core CPU, a multi-core CPU, an FPGA, a volatile or non-volatile memory, and the like. Further, the control unit 202 may have functions such as a clock for outputting date and time information, a timer for measuring the elapsed time from giving the measurement start instruction to giving the measurement end instruction, and a counter for counting the number.

記憶部204は、EEPROM、SRAMなどのメモリを備える。記憶部204には、制御部202によって実行されるコンピュータプログラム、および、このコンピュータプログラムが用いるデータ等が記憶される。 The storage unit 204 includes memories such as EEPROM and SRAM. The storage unit 204 stores a computer program executed by the control unit 202, data used by the computer program, and the like.

入力部206は、ケーブルを介して評価装置100を接続するインタフェースを備える。入力部206には、評価装置100から出力される評価結果が入力される。入力部206に入力される評価結果は、人力駆動車1のコンポーネントに対する制御の好ましさを表す。入力部206は、入力された評価結果を制御部202へ出力する。本実施形態では、ケーブルを介して評価装置100を接続する構成としたが、無線通信のインタフェースを介して、評価装置100と制御装置200との間でデータを送受信できるように構成してもよい。無線通信では、Bluetooth 、WiFi、ZigBee、LTE、その他の無線LAN等の通信規格に準じた無線通信方式が利用できる。 The input unit 206 includes an interface for connecting the evaluation device 100 via a cable. The evaluation result output from the evaluation device 100 is input to the input unit 206. The evaluation result input to the input unit 206 represents the preference for control over the components of the human-powered vehicle 1. The input unit 206 outputs the input evaluation result to the control unit 202. In the present embodiment, the evaluation device 100 is connected via a cable, but data may be transmitted and received between the evaluation device 100 and the control device 200 via a wireless communication interface. .. In wireless communication, a wireless communication method conforming to communication standards such as Bluetooth, WiFi, ZigBee, LTE, and other wireless LANs can be used.

出力部208は、ケーブルを介して制御対象のコンポーネントを接続するインタフェースを備える。コンポーネントは、補助駆動力を出力する電動駆動ユニット34Aを有するアシスト装置34を含んでいてよい。また、コンポーネントは、電動駆動ユニット36Aを有するブレーキ装置36を含んでいてよい。また、コンポーネントは、電動駆動ユニット38Aを有するアンチロックブレーキ装置38を含んでいてよい。また、コンポーネントは、電動駆動ユニット40Aを有するサスペンション装置40を含んでいてよい。本実施形態において、制御装置200には、アシスト装置34、ブレーキ装置36、アンチロックブレーキ装置38、および、サスペンション装置40が接続される。出力部208は、制御部202から出力される制御信号を制御対象のコンポーネントへ出力する。本実施形態では、ケーブルを介して人力駆動車1のコンポーネントを接続する構成としたが、無線通信のインタフェースを介して、制御装置200と人力駆動車1のコンポーネントとの間でデータを送受信できるように構成してもよい。無線通信では、上述した各種の通信規格に準拠した無線通信方式が利用できる。 The output unit 208 includes an interface for connecting the components to be controlled via a cable. The component may include an assist device 34 having an electric drive unit 34A that outputs an auxiliary drive force. The component may also include a braking device 36 having an electric drive unit 36A. The component may also include an antilock brake device 38 having an electric drive unit 38A. The component may also include a suspension device 40 having an electric drive unit 40A. In the present embodiment, the control device 200 is connected to the assist device 34, the brake device 36, the antilock brake device 38, and the suspension device 40. The output unit 208 outputs the control signal output from the control unit 202 to the component to be controlled. In the present embodiment, the components of the human-powered vehicle 1 are connected via a cable, but data can be transmitted and received between the control device 200 and the components of the human-powered vehicle 1 via a wireless communication interface. It may be configured as. In wireless communication, a wireless communication method compliant with the above-mentioned various communication standards can be used.

以下、評価装置100の評価結果に基づき、制御装置200が人力駆動車1のコンポーネントを制御する制御手順について説明する。 Hereinafter, a control procedure in which the control device 200 controls the components of the human-powered vehicle 1 based on the evaluation result of the evaluation device 100 will be described.

図6は制御装置200が実行する処理の手順を説明するフローチャートである。ステップS201において、制御装置200の制御部202は、評価装置100による評価結果を取得する。評価結果は、Q値が最も高い行動の情報を含む。 FIG. 6 is a flowchart illustrating a procedure of processing executed by the control device 200. In step S201, the control unit 202 of the control device 200 acquires the evaluation result by the evaluation device 100. The evaluation result includes information on the behavior having the highest Q value.

ステップS202において、制御部202は、乱数を生成する。制御部202は、公知の手法を用いて、乱数を生成することができる。制御部202が生成する乱数は、0以上、1以下の乱数である。 In step S202, the control unit 202 generates a random number. The control unit 202 can generate a random number by using a known method. The random number generated by the control unit 202 is a random number of 0 or more and 1 or less.

ステップS203において、制御部202は、ステップS202において生成した乱数をεと比較し、乱数がεより大きいか否かを判断する。ここで、εは、Q値を利用すべきか、ランダムに行動を選択すべきかを決定するためのパラメータである。εは、0以上、1以下の値であり、予め設定される固定値であってもよく、経過時間に応じて1から0まで減少する変動値であってもよい。 In step S203, the control unit 202 compares the random number generated in step S202 with ε, and determines whether or not the random number is larger than ε. Here, ε is a parameter for determining whether the Q value should be used or the action should be randomly selected. ε is a value of 0 or more and 1 or less, may be a fixed value set in advance, or may be a variable value that decreases from 1 to 0 according to the elapsed time.

制御部202は、乱数がεより大きいと判断した場合、ステップS204において、Q値が最も高い行動を選択する。 When the control unit 202 determines that the random number is larger than ε, the control unit 202 selects the action having the highest Q value in step S204.

制御部202は、乱数がε以下と判断した場合、ステップS205において、ランダムに行動を選択する。 When the control unit 202 determines that the random number is ε or less, the control unit 202 randomly selects an action in step S205.

ステップS206において、制御部202は、ステップS204またはステップS205において選択した行動に応じて、人力駆動車1のコンポーネントを制御する。制御対象のコンポーネントは、評価装置100の評価結果に応じて、選択されてもよい。 In step S206, the control unit 202 controls the components of the human-powered vehicle 1 according to the action selected in step S204 or step S205. The component to be controlled may be selected according to the evaluation result of the evaluation device 100.

制御対象のコンポーネントがアシスト装置34である場合、制御部202は、アシスト装置34へ制御信号を出力する。例えば、制御前のアシストレベルが弱アシストレベルであり、ステップS204またはステップS205において選択した行動に対応するアシストレベルが強アシストレベルである場合、制御部202は、アシストレベルを弱アシストレベルから強アシストレベルに遷移させる制御信号をアシスト装置34へ出力する。制御前のアシストレベルと、ステップS204またはステップS205において選択した行動に対応するアシストレベルとが同一である場合、制御部202は、アシスト装置34に対する制御を行わない。 When the component to be controlled is the assist device 34, the control unit 202 outputs a control signal to the assist device 34. For example, when the assist level before control is the weak assist level and the assist level corresponding to the action selected in step S204 or step S205 is the strong assist level, the control unit 202 sets the assist level from the weak assist level to the strong assist level. The control signal for transitioning to the level is output to the assist device 34. When the assist level before control and the assist level corresponding to the action selected in step S204 or step S205 are the same, the control unit 202 does not control the assist device 34.

制御対象のコンポーネントがブレーキ装置36である場合、制御部202は、ブレーキ装置36への制御信号を出力する。例えば、制御前の制御状態が第1制動力に対応し、ステップS204またはステップS205において選択した行動が第2制動力に対応する場合、制御部202は、ブレーキ装置36の制動力を第1制動力から第2制動力へ遷移させる制御信号を出力する。制御前の制動力と、ステップS204またはステップS205において選択した行動に対応する制動力とが同一である場合、制御部202は、ブレーキ装置36に対する制御を行わない。 When the component to be controlled is the brake device 36, the control unit 202 outputs a control signal to the brake device 36. For example, when the control state before control corresponds to the first braking force and the action selected in step S204 or step S205 corresponds to the second braking force, the control unit 202 first controls the braking force of the braking device 36. A control signal for transitioning from power to the second braking force is output. When the braking force before control and the braking force corresponding to the action selected in step S204 or step S205 are the same, the control unit 202 does not control the braking device 36.

制御対象のコンポーネントがアンチロックブレーキ装置38である場合、制御部202は、アンチロックブレーキ装置38へ制御信号を出力する。例えば、制御前の制御状態が第1油圧力に対応し、ステップS204またはステップS205において選択した行動が第2油圧力に対応する場合、制御部202は、アンチロックブレーキ装置38の油圧力を第1油圧力から第2油圧力へ遷移させる制御信号を出力する。制御前の油圧力と、ステップS204またはステップS205において選択した行動に対応する油圧力とが同一である場合、制御部202は、アンチロックブレーキ装置38に対する制御を行わない。 When the component to be controlled is the antilock brake device 38, the control unit 202 outputs a control signal to the antilock brake device 38. For example, when the control state before control corresponds to the first oil pressure and the action selected in step S204 or step S205 corresponds to the second oil pressure, the control unit 202 sets the oil pressure of the anti-lock brake device 38. A control signal for transitioning from the 1st hydraulic pressure to the 2nd hydraulic pressure is output. When the oil pressure before control and the oil pressure corresponding to the action selected in step S204 or step S205 are the same, the control unit 202 does not control the antilock braking device 38.

制御対象のコンポーネントがサスペンション装置40である場合、制御部202は、サスペンション装置40へ制御信号を出力する。例えば、制御前の制御状態が第1の緩衝性を示し、ステップS204またはステップS205において選択した行動が第2の緩衝性を示す場合、制御部202は、サスペンション装置40の緩衝性を第1の緩衝性から第2の緩衝性へ遷移させる制御信号を出力する。制御前の緩衝性と、ステップS204またはステップS205において選択した行動に対応する緩衝性とが同一である場合、制御部202は、サスペンション装置40に対する制御を行わない。 When the component to be controlled is the suspension device 40, the control unit 202 outputs a control signal to the suspension device 40. For example, when the control state before control shows the first buffering property and the action selected in step S204 or step S205 shows the second cushioning property, the control unit 202 sets the cushioning property of the suspension device 40 to the first. A control signal for transitioning from the cushioning property to the second buffering property is output. When the cushioning property before control and the buffering property corresponding to the action selected in step S204 or step S205 are the same, the control unit 202 does not control the suspension device 40.

本実施形態では、εというパラメータを用いて、Q値を利用すべきか、ランダムに行動を選択すべきかを決定するε−greedy法によって行動を選択する構成としたが、ε−greedy法とは異なるアルゴリズムによって行動を選択してもよい。 In the present embodiment, the action is selected by the ε-greedy method that determines whether the Q value should be used or the action should be randomly selected using the parameter ε, but this is different from the ε-greedy method. Actions may be selected by an algorithm.

(第3実施形態)
第3実施形態では、学習モデル120の生成方法について説明する。
(Third Embodiment)
In the third embodiment, a method of generating the learning model 120 will be described.

評価装置100は、コンピュータを用いて、人力駆動車1の走行に関する走行情報に従って、人力駆動車1のコンポーネントに対する制御の好ましさを、関数を用いて評価し、好ましさの評価結果と、評価結果に応じたコンポーネントの制御結果と、に応じて関数を更新することによって学習モデル120を生成する。より具体的には、評価装置100は、次式に基づいて行動価値関数Q(s,a)を更新し、学習モデル120を特徴付けるパラメータを改善することによって、学習モデル120を生成する。
Q(st ,at )←Q(st ,at )+α(rt+1 +γmaxa'Q(st+1 , a’)−Q(st ,at ))…式(1)
The evaluation device 100 uses a computer to evaluate the preference of control for the components of the human-powered vehicle 1 according to the traveling information regarding the running of the human-powered vehicle 1, using a function, and evaluates the preference and the evaluation result of the preference. The learning model 120 is generated by updating the control result of the component according to the evaluation result and the function according to the control result. More specifically, the evaluation device 100 generates the learning model 120 by updating the behavioral value function Q (s, a) based on the following equation and improving the parameters that characterize the learning model 120.
Q (s t, a t) ← Q (s t, a t) + α (r t + 1 + γmax a 'Q (s t + 1, a') - Q (s t, a t)) ... formula (1 )

行動価値関数Q(s,a)は、状態sにおいて行動aを取った場合において、将来にわたって得られる収益の期待値である。rは報酬である。状態s、行動a、報酬rの添え字tは、時系列に繰り返す思考過程における1回分のステップを示す番号である。添え字tは、試行番号とも呼ばれる。行動決定後に状態が変化すると試行番号がインクリメントされる。したがって、式(1)における報酬rt+1 は、状態st において行動atが選択され、状態がst+1 になった場合に得られる報酬である。αは学習率、γは割引率である。行動a’は、状態st+1 において取り得る行動at+1 のうち、行動価値関数Q(st+1 ,at+1 )を最大化する行動である。maxa'Q(st+1 , a’)は、行動a’が選択されたことによって最大化された行動価値関数である。 The action value function Q (s, a) is the expected value of the profit obtained in the future when the action a is taken in the state s. r is the reward. The subscript t of the state s, the action a, and the reward r is a number indicating one step in the thinking process that repeats in time series. The subscript t is also called a trial number. If the state changes after the action is decided, the trial number is incremented. Thus, reward r t + 1 in the formula (1) may act a t in state s t is selected, a reward condition is obtained when it becomes s t + 1. α is the learning rate and γ is the discount rate. The action a'is an action that maximizes the action value function Q (s t + 1 , at + 1 ) among the actions a t + 1 that can be taken in the state st + 1 . max a 'Q (s t + 1, a') is a maximized action value function by the action a 'is selected.

図7は学習モデル120の生成手順を説明するフローチャートである。ステップS301において、評価装置100の演算処理部104は、学習モデル120の定義情報を初期化する。学習モデル120の定義情報は、学習モデル120の構造情報、学習モデル120で用いられるノード間の重みおよびバイアスなどの各種パラメータ等を含む。以下では、学習モデル120の定義情報に含まれる各種パラメータを便宜的にパラメータθと記述する。 FIG. 7 is a flowchart illustrating a procedure for generating the learning model 120. In step S301, the arithmetic processing unit 104 of the evaluation device 100 initializes the definition information of the learning model 120. The definition information of the learning model 120 includes structural information of the learning model 120, various parameters such as weights and biases between nodes used in the learning model 120, and the like. In the following, various parameters included in the definition information of the learning model 120 will be described as parameter θ for convenience.

ステップS302において、評価装置100の演算処理部104は、走行情報を取得する。走行情報は、センサS1〜S10等によって観測される。演算処理部104は、走行情報として、速度、加速度、姿勢、荷重、駆動力、ケイデンス、変速比、操作装置30への操作入力、操作入力とコンポーネントの制御結果の履歴、回生量、傾斜、路面状況、位置、天候、および、車両情報のうちの少なくとも1つを取得する。演算処理部104が取得する走行情報は、人力駆動車1のトラクションに関する情報であってもよい。走行情報は、各種センサS1〜S10によって観測される情報だけでなく、演算処理部104によって演算される情報であってもよく、記憶部106に予め記憶される情報であってもよい。 In step S302, the arithmetic processing unit 104 of the evaluation device 100 acquires the traveling information. The traveling information is observed by sensors S1 to S10 and the like. The arithmetic processing unit 104 uses speed, acceleration, attitude, load, driving force, cadence, gear ratio, operation input to the operation device 30, history of operation input and component control results, regeneration amount, inclination, and road surface as travel information. Get at least one of the status, location, weather, and vehicle information. The traveling information acquired by the arithmetic processing unit 104 may be information related to the traction of the human-powered vehicle 1. The traveling information may be not only the information observed by the various sensors S1 to S10 but also the information calculated by the arithmetic processing unit 104 or the information stored in advance in the storage unit 106.

ステップS303において、演算処理部104は、入力部102等から取得した走行情報を学習モデル120の入力層122へ入力し、学習モデル120による演算を実行することによって、Q値を算出する。入力層122に入力された走行情報は中間層124に与えられる。中間層124では、各ノードにおいて直前の層からの入力に対する重みの乗算、バイアスの加算、活性化関数を用いた演算が行われ、演算結果が出力層126へ出力される。出力層126は、各ノードを通じてQ値を出力する。演算処理部104は、算出した各行動のQ値を制御装置200へ出力する。 In step S303, the calculation processing unit 104 inputs the traveling information acquired from the input unit 102 or the like to the input layer 122 of the learning model 120, and executes the calculation by the learning model 120 to calculate the Q value. The traveling information input to the input layer 122 is given to the intermediate layer 124. In the intermediate layer 124, each node performs an operation using weight multiplication, bias addition, and activation function on the input from the immediately preceding layer, and the operation result is output to the output layer 126. The output layer 126 outputs a Q value through each node. The arithmetic processing unit 104 outputs the calculated Q value of each action to the control device 200.

ステップS304において、制御装置200の制御部202は、人力駆動車1が取るべき行動を選択する。制御部202は、例えばε−greedy法を用いて、Q値を利用して行動を選択すべきか、ランダムに行動を選択すべきかを決定する。 In step S304, the control unit 202 of the control device 200 selects an action to be taken by the human-powered vehicle 1. The control unit 202 uses, for example, the ε-greedy method to determine whether an action should be selected using the Q value or a random action.

ステップS305において、制御部202は、選択した行動を人力駆動車1に取らせるべく、人力駆動車1のコンポーネントを制御する。 In step S305, the control unit 202 controls the components of the human-powered vehicle 1 so that the human-powered vehicle 1 takes the selected action.

ステップS306において、評価装置100の演算処理部104は、コンポーネントが制御された後の走行情報を取得する。演算処理部104が取得する走行情報は、ステップS302において取得する走行情報と同様である。 In step S306, the arithmetic processing unit 104 of the evaluation device 100 acquires the traveling information after the components are controlled. The travel information acquired by the arithmetic processing unit 104 is the same as the travel information acquired in step S302.

ステップS307において、演算処理部104は、報酬を評価する。本実施形態において、報酬は、人力駆動車1の走行状態に基づいて決定される。例えば、人力駆動車1のトラクションが低下することなく走行できた場合、正の報酬が付与され、人力駆動車1のトラクションが低下した場合、または、人力駆動車1が転倒した場合、負の報酬が付与される。現在の試行番号がtである場合、ステップS307において付与される報酬は、式(1)におけるrt+1 である。 In step S307, the arithmetic processing unit 104 evaluates the reward. In the present embodiment, the reward is determined based on the running state of the human-powered vehicle 1. For example, if the traction of the human-powered vehicle 1 can be driven without being reduced, a positive reward is given, and if the traction of the human-powered vehicle 1 is reduced, or if the human-powered vehicle 1 falls, a negative reward is given. Is given. If the current trial number is t, the reward given in step S307 is r t + 1 in equation (1).

ステップS308において、演算処理部104は、目的関数の値を算出する。行動価値関数Q(s,a)を適切に更新するためには、行動価値関数Q(s,a)を出力する学習モデル120の最適化が必要である。学習が完了していない段階では、行動価値関数Q(s,a)の知見がなく、ターゲットとなる教師データを設定することは困難である。そこで、本実施形態では、式(1)の第2項に示される、TD(Temporal Difference)誤差を最小化する目的関数によって、学習モデル120を特徴付けるパラメータθを改善する。 In step S308, the arithmetic processing unit 104 calculates the value of the objective function. In order to properly update the behavioral value function Q (s, a), it is necessary to optimize the learning model 120 that outputs the behavioral value function Q (s, a). At the stage where the learning is not completed, it is difficult to set the target teacher data because the behavioral value function Q (s, a) is not known. Therefore, in the present embodiment, the parameter θ that characterizes the learning model 120 is improved by the objective function that minimizes the TD (Temporal Difference) error shown in the second term of the equation (1).

ステップS309において、演算処理部104は、学習が終了したか否かを判断する。本実施形態では、TD誤差が充分に小さいか否かを判定するための閾値が予め定められており、目的関数の値が閾値以下である場合、演算処理部104は、学習が終了したと判断する。 In step S309, the arithmetic processing unit 104 determines whether or not the learning is completed. In the present embodiment, a threshold value for determining whether or not the TD error is sufficiently small is predetermined, and when the value of the objective function is equal to or less than the threshold value, the arithmetic processing unit 104 determines that learning has been completed. To do.

演算処理部104は、ステップS309において学習が終了していないと判断した場合、ステップS310において、行動価値関数Q(s,a)を更新する。例えば、演算処理部104は、TD誤差のパラメータθによる偏微分に基づいて目的関数を小さくするパラメータθの変化方向を特定し、パラメータθを変化させる。パラメータθの変化方向の特定は、TD誤差のパラメータθによる偏微分に限らず、各種の勾配降下法を用いることができる。以上の処理により、行動価値関数Q(s,a)がターゲットに近づくようにパラメータθを変化させることができる。行動価値関数Q(s,a)を更新した後、演算処理部104は、処理をステップS303へ戻す。 When the arithmetic processing unit 104 determines in step S309 that the learning has not been completed, the arithmetic processing unit 104 updates the action value function Q (s, a) in step S310. For example, the arithmetic processing unit 104 specifies the changing direction of the parameter θ that reduces the objective function based on the partial differential due to the parameter θ of the TD error, and changes the parameter θ. The specification of the change direction of the parameter θ is not limited to the partial differentiation based on the parameter θ of the TD error, and various gradient descent methods can be used. By the above processing, the parameter θ can be changed so that the action value function Q (s, a) approaches the target. After updating the action value function Q (s, a), the arithmetic processing unit 104 returns the processing to step S303.

演算処理部104は、ステップS309において学習が終了したと判断した場合、ステップS311において、学習モデル120の定義情報を更新する。演算処理部104は、学習によって得られたθを、人力駆動車1の制御の好ましさを評価する際に参照されるべき学習モデル120の定義情報として記憶部106に記憶させる。 When the arithmetic processing unit 104 determines that the learning is completed in step S309, the arithmetic processing unit 104 updates the definition information of the learning model 120 in step S311. The arithmetic processing unit 104 stores the θ obtained by learning in the storage unit 106 as definition information of the learning model 120 to be referred to when evaluating the preference of control of the human-powered vehicle 1.

以上のように、本実施形態では、行動価値関数(s,a)の値を最大化する行動aを選択する処理と、選択した行動aに基づき人力駆動車1を制御する処理とを繰り返しながら、行動価値関数(s,a)を最適化することによって、学習モデル120を生成できる。 As described above, in the present embodiment, the process of selecting the action a that maximizes the value of the action value function (s, a) and the process of controlling the human-powered vehicle 1 based on the selected action a are repeated. , The learning model 120 can be generated by optimizing the behavioral value function (s, a).

本実施の形態では、人力駆動車1の評価装置100において学習モデル120を生成する構成としたが、外部サーバにおいて学習モデル120を生成する構成としてもよい。この場合、外部サーバと通信可能な通信装置(不図示)が評価装置100に接続される。または、外部サーバと通信可能な通信装置が評価装置100に内蔵される。評価装置100は、センサS1〜S10等から取得する走行情報を、通信装置を通じて、外部サーバへアップロードする。外部サーバでは、行動価値関数Q(s,a)に基づき、行動価値関数(s,a)の値を最大化する行動aを選択し、選択した行動aの情報を人力駆動車1に通知する。人力駆動車1の制御装置200は、外部サーバによって選択された行動aの情報に基づき、コンポーネントの制御を行う。このように、行動価値関数(s,a)の値を最大化する行動aを選択する外部サーバの処理と、選択した行動aに基づき人力駆動車1を制御する制御装置200の処理とを繰り返しながら、外部サーバにおいて行動価値関数(s,a)を最適化し、学習モデル120を生成する。 In the present embodiment, the evaluation device 100 of the human-powered vehicle 1 is configured to generate the learning model 120, but the external server may be configured to generate the learning model 120. In this case, a communication device (not shown) capable of communicating with the external server is connected to the evaluation device 100. Alternatively, a communication device capable of communicating with an external server is built in the evaluation device 100. The evaluation device 100 uploads the traveling information acquired from the sensors S1 to S10 and the like to an external server through the communication device. The external server selects the action a that maximizes the value of the action value function (s, a) based on the action value function Q (s, a), and notifies the human-powered vehicle 1 of the information of the selected action a. .. The control device 200 of the human-powered vehicle 1 controls the components based on the information of the action a selected by the external server. In this way, the processing of the external server that selects the action a that maximizes the value of the action value function (s, a) and the processing of the control device 200 that controls the human-powered vehicle 1 based on the selected action a are repeated. At the same time, the action value function (s, a) is optimized on the external server to generate the learning model 120.

(第4実施形態)
第4実施形態では、学習モデル120を再学習する構成について説明する。
(Fourth Embodiment)
In the fourth embodiment, a configuration for re-learning the learning model 120 will be described.

図8は学習モデル120の再学習手順を説明するフローチャートである。ステップS401において、評価装置100の演算処理部104は、記憶部106に記憶されている学習モデル120の定義情報を読み出す。 FIG. 8 is a flowchart illustrating a re-learning procedure of the learning model 120. In step S401, the arithmetic processing unit 104 of the evaluation device 100 reads out the definition information of the learning model 120 stored in the storage unit 106.

ステップS402において、評価装置100の演算処理部104は、走行情報を取得する。演算処理部104が取得する走行情報は実施形態3と同様である。 In step S402, the arithmetic processing unit 104 of the evaluation device 100 acquires the traveling information. The traveling information acquired by the arithmetic processing unit 104 is the same as that in the third embodiment.

ステップS403において、演算処理部104は、入力部102等から取得した走行情報を学習モデル120の入力層122へ入力し、学習モデル120による演算を実行することによってQ値を算出する。 In step S403, the arithmetic processing unit 104 inputs the traveling information acquired from the input unit 102 or the like to the input layer 122 of the learning model 120, and calculates the Q value by executing the arithmetic by the learning model 120.

ステップS404において、制御装置200の制御部202は、人力駆動車1が取るべき行動を選択する。制御部202は、例えばε−greedy法を用いて、Q値を利用して行動を選択すべきか、ランダムに行動を選択すべきかを決定する。 In step S404, the control unit 202 of the control device 200 selects an action to be taken by the human-powered vehicle 1. The control unit 202 uses, for example, the ε-greedy method to determine whether an action should be selected using the Q value or a random action.

ステップS405において、制御部202は、選択した行動を人力駆動車1に取らせるべく、人力駆動車1のコンポーネントを制御する。 In step S405, the control unit 202 controls the components of the human-powered vehicle 1 so that the human-powered vehicle 1 takes the selected action.

ステップS406において、評価装置100の演算処理部104は、コンポーネントが制御された後の走行情報を取得する。演算処理部104が取得する走行情報は、ステップS402において取得する走行情報と同様である。 In step S406, the arithmetic processing unit 104 of the evaluation device 100 acquires the traveling information after the components are controlled. The travel information acquired by the arithmetic processing unit 104 is the same as the travel information acquired in step S402.

ステップS407において、演算処理部104は、報酬を評価する。本実施形態において、報酬は、人力駆動車1の走行状態に基づいて決定される。例えば、人力駆動車1のトラクションが低下することなく走行できた場合、正の報酬が付与され、人力駆動車1のトラクションが低下した場合、または、人力駆動車1が転倒した場合、負の報酬が付与される。 In step S407, the arithmetic processing unit 104 evaluates the reward. In the present embodiment, the reward is determined based on the running state of the human-powered vehicle 1. For example, if the traction of the human-powered vehicle 1 can be driven without being reduced, a positive reward is given, and if the traction of the human-powered vehicle 1 is reduced, or if the human-powered vehicle 1 falls, a negative reward is given. Is given.

ステップS408において、演算処理部104は、目的関数の値を算出する。本実施形態では、式(1)の第2項に示される、TD誤差を最小化する目的関数によって、学習モデル120を特徴付けるパラメータθを改善する。 In step S408, the arithmetic processing unit 104 calculates the value of the objective function. In the present embodiment, the parameter θ that characterizes the learning model 120 is improved by the objective function that minimizes the TD error, which is shown in the second term of the equation (1).

ステップS409において、演算処理部104は、学習が終了したか否かを判断する。本実施形態では、TD誤差が充分に小さいか否かを判定するための閾値が予め定められており、目的関数の値が閾値以下である場合、演算処理部104は、学習が終了したと判断する。 In step S409, the arithmetic processing unit 104 determines whether or not the learning is completed. In the present embodiment, a threshold value for determining whether or not the TD error is sufficiently small is predetermined, and when the value of the objective function is equal to or less than the threshold value, the arithmetic processing unit 104 determines that learning has been completed. To do.

演算処理部104は、ステップS409において学習が終了していないと判断した場合、ステップS410において、行動価値関数Q(s,a)を更新する。例えば、演算処理部104は、TD誤差のパラメータθによる偏微分に基づいて目的関数を小さくするパラメータθの変化方向を特定し、パラメータθを変化させる。パラメータθの変化方向の特定は、TD誤差のパラメータθによる偏微分に限らず、各種の勾配降下法を用いることができる。以上の処理により、行動価値関数Q(s,a)がターゲットに近づくようにパラメータθを変化させることができる。行動価値関数Q(s,a)を更新した後、演算処理部104は、処理をステップS403へ戻す。 When the arithmetic processing unit 104 determines in step S409 that the learning has not been completed, the arithmetic processing unit 104 updates the action value function Q (s, a) in step S410. For example, the arithmetic processing unit 104 specifies the changing direction of the parameter θ that reduces the objective function based on the partial differential due to the parameter θ of the TD error, and changes the parameter θ. The specification of the change direction of the parameter θ is not limited to the partial differentiation based on the parameter θ of the TD error, and various gradient descent methods can be used. By the above processing, the parameter θ can be changed so that the action value function Q (s, a) approaches the target. After updating the action value function Q (s, a), the arithmetic processing unit 104 returns the processing to step S403.

演算処理部104は、ステップS409において学習が終了したと判断した場合、ステップS411において、学習モデル120の定義情報を更新する。更新された学習モデル120の定義情報は記憶部106に記憶される。 When the arithmetic processing unit 104 determines that the learning is completed in step S409, the arithmetic processing unit 104 updates the definition information of the learning model 120 in step S411. The updated definition information of the learning model 120 is stored in the storage unit 106.

以上のように、本実施形態では、評価装置100は、好ましさの評価結果と、評価結果に応じたコンポーネントの制御結果と、に応じて学習モデル120を再学習させる。すなわち、本実施形態では、行動価値関数(s,a)の値を最大化する行動aを選択する処理と、選択した行動aに基づき人力駆動車1を制御する処理とを繰り返しながら、行動価値関数(s,a)を最適化することによって、学習モデル120を再学習できる。 As described above, in the present embodiment, the evaluation device 100 relearns the learning model 120 according to the evaluation result of the preference and the control result of the component according to the evaluation result. That is, in the present embodiment, the action value is repeated while repeating the process of selecting the action a that maximizes the value of the action value function (s, a) and the process of controlling the human-powered vehicle 1 based on the selected action a. The learning model 120 can be retrained by optimizing the function (s, a).

(第5実施形態)
第5実施形態では、評価装置100の評価結果を報知する報知システムについて説明する。
(Fifth Embodiment)
In the fifth embodiment, a notification system for notifying the evaluation result of the evaluation device 100 will be described.

図9は第5実施形態に係る報知システムを説明するブロック図である。第5実施形態に係る報知システムは、評価装置100と、評価装置100による評価結果を報知する報知装置300とを備える。報知装置300が報知する評価結果は、コンポーネントの制御状態に関する情報を含んでもよい。図9に示した例では、評価装置100と報知装置300とを別体として記載したが、評価装置100と報知装置300とが一体となった構成であってもよい。 FIG. 9 is a block diagram illustrating a notification system according to a fifth embodiment. The notification system according to the fifth embodiment includes an evaluation device 100 and a notification device 300 that notifies the evaluation result by the evaluation device 100. The evaluation result notified by the notification device 300 may include information regarding the control state of the component. In the example shown in FIG. 9, the evaluation device 100 and the notification device 300 are described as separate bodies, but the evaluation device 100 and the notification device 300 may be integrated.

報知装置300は、例えば、液晶ディスプレイ、有機ELディスプレイ等の表示デバイスである。報知装置300は、評価装置100の評価結果に応じて、文字情報または画像情報を表示デバイスに表示することによって、評価結果に関する情報をライダーに報知できる。 The notification device 300 is, for example, a display device such as a liquid crystal display or an organic EL display. The notification device 300 can notify the rider of information regarding the evaluation result by displaying character information or image information on the display device according to the evaluation result of the evaluation device 100.

報知装置300は、LEDなどの発光素子であってもよい。報知装置300は、評価装置100の評価結果に応じて、発光素子を点灯、点滅、または消灯することによって、評価結果に関する情報をライダーに報知できる。 The notification device 300 may be a light emitting element such as an LED. The notification device 300 can notify the rider of information regarding the evaluation result by turning on, blinking, or turning off the light emitting element according to the evaluation result of the evaluation device 100.

報知装置300は、スピーカなどの音声出力デバイスであってもよい。報知装置300は、評価装置100の評価結果に応じて、音声出力デバイスから音声を出力することによって、評価結果に関する情報をライダーに報知できる。 The notification device 300 may be an audio output device such as a speaker. The notification device 300 can notify the rider of information regarding the evaluation result by outputting voice from the voice output device according to the evaluation result of the evaluation device 100.

報知装置300は、通信デバイスであってもよい。報知装置300は、評価装置100の評価結果に応じて、文字情報または画像情報を外部の通信装置へ送信することによって、評価結果に関する情報をライダーに報知できる。外部の通信装置は、例えば、ライダーが携帯するスマートフォン、タブレット、ウェアラブル端末である。 The notification device 300 may be a communication device. The notification device 300 can notify the rider of information regarding the evaluation result by transmitting character information or image information to an external communication device according to the evaluation result of the evaluation device 100. The external communication device is, for example, a smartphone, a tablet, or a wearable terminal carried by the rider.

報知装置300は、バイブレータなどの振動デバイスであってもよい。報知装置300は、評価装置100の評価結果に応じて、振動デバイスを振動させることによって、評価結果に関する情報をライダーに報知できる。 The notification device 300 may be a vibration device such as a vibrator. The notification device 300 can notify the rider of information regarding the evaluation result by vibrating the vibrating device according to the evaluation result of the evaluation device 100.

報知装置300は、評価装置100の評価結果を常時報知する必要はなく、特定の条件下において、評価結果に関する情報を報知してもよい。例えば、報知装置300は、ブレーキ操作装置36Cの操作入力に比して、人力駆動車1の減速度が所定よりも低くなった場合に、評価結果に関する情報を報知してもよい。 The notification device 300 does not need to constantly notify the evaluation result of the evaluation device 100, and may notify information about the evaluation result under specific conditions. For example, the notification device 300 may notify information about the evaluation result when the deceleration of the human-powered vehicle 1 becomes lower than a predetermined value as compared with the operation input of the brake operation device 36C.

以上のように、本実施形態では、評価装置100の評価結果を報知装置300によってライダーに報知できる。 As described above, in the present embodiment, the evaluation result of the evaluation device 100 can be notified to the rider by the notification device 300.

今回開示された実施形態は、全ての点において例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内での全ての変更が含まれることが意図される。 The embodiments disclosed this time should be considered as exemplary in all respects and not restrictive. The scope of the present invention is indicated by the scope of claims, not the above-mentioned meaning, and is intended to include all modifications within the meaning and scope equivalent to the scope of claims.

1…人力駆動車、30…操作装置、32,33…変速装置、34…アシスト装置、36…ブレーキ装置、38…アンチロックブレーキ装置、40…サスペンション装置、42…バッテリユニット、100…評価装置、102…入力部、104…演算処理部、106…記憶部、108…出力部、110…評価処理プログラム、120…学習モデル、200…制御装置、202…制御部、204…記憶部、206…入力部、208…出力部、300…報知装置 1 ... Human-powered vehicle, 30 ... Operation device, 32, 33 ... Transmission device, 34 ... Assist device, 36 ... Brake device, 38 ... Anti-lock braking device, 40 ... Suspension device, 42 ... Battery unit, 100 ... Evaluation device, 102 ... Input unit, 104 ... Arithmetic processing unit, 106 ... Storage unit, 108 ... Output unit, 110 ... Evaluation processing program, 120 ... Learning model, 200 ... Control device, 202 ... Control unit, 204 ... Storage unit, 206 ... Input Unit, 208 ... Output unit, 300 ... Notification device

Claims (14)

人力駆動車の走行に関する走行情報に従って、前記人力駆動車のコンポーネントに対する制御の好ましさを、学習モデルを用いて評価する、評価装置。 An evaluation device that evaluates the preference of control over the components of the human-powered vehicle by using a learning model according to the traveling information regarding the running of the human-powered vehicle. 前記好ましさの評価結果と、前記評価結果に応じた前記コンポーネントの制御結果と、に応じて前記学習モデルを再学習させる、請求項1に記載の評価装置。 The evaluation device according to claim 1, wherein the learning model is retrained according to the evaluation result of the preference and the control result of the component according to the evaluation result. 前記走行情報は、速度、加速度、姿勢、荷重、駆動力、ケイデンス、変速比、操作装置への操作入力、前記操作入力と前記コンポーネントの制御結果の履歴、回生量、傾斜、路面状況、位置、天候、および、車両情報のうちの少なくとも1つに関する情報を含む、請求項1または2に記載の評価装置。 The traveling information includes speed, acceleration, attitude, load, driving force, cadence, gear ratio, operation input to the operation device, history of the operation input and control result of the component, regeneration amount, inclination, road surface condition, position, The evaluation device according to claim 1 or 2, which includes information on the weather and at least one of the vehicle information. 前記人力駆動車の走行情報は、前記人力駆動車のトラクションに関する情報を含む、請求項1または2に記載の評価装置。 The evaluation device according to claim 1 or 2, wherein the traveling information of the human-powered vehicle includes information regarding traction of the human-powered vehicle. 請求項1〜4のいずれか一項に記載の評価装置と、
前記評価装置の評価結果に基づいて前記コンポーネントを制御する制御装置と、を備える制御システム。
The evaluation device according to any one of claims 1 to 4,
A control system including a control device that controls the component based on the evaluation result of the evaluation device.
前記コンポーネントは、補助駆動力を出力する電動駆動ユニットを有するアシスト装置を含む、請求項5に記載の制御システム。 The control system according to claim 5, wherein the component includes an assist device having an electric drive unit that outputs an auxiliary driving force. 前記コンポーネントは、電動駆動ユニットを有するブレーキ装置を含む、請求項5または6に記載の制御システム。 The control system according to claim 5 or 6, wherein the component includes a braking device having an electric drive unit. 前記コンポーネントは、電動駆動ユニットを有するアンチロックブレーキ装置を含む、請求項5から7のいずれか一項に記載の制御システム。 The control system according to any one of claims 5 to 7, wherein the component includes an antilock braking device including an electric drive unit. 前記コンポーネントは、電動駆動ユニットを有するサスペンション装置を含む、請求項5から8のいずれか一項に記載の制御システム。 The control system according to any one of claims 5 to 8, wherein the component includes a suspension device including an electric drive unit. 請求項1〜4のいずれか一項に記載の評価装置と、
前記評価装置の評価結果に関する情報を報知する報知装置と、を備える報知システム。
The evaluation device according to any one of claims 1 to 4,
A notification system including a notification device that notifies information regarding an evaluation result of the evaluation device.
前記評価結果に関する情報は、前記コンポーネントの制御状態に関する情報を含む、請求項10に記載の報知システム。 The notification system according to claim 10, wherein the information regarding the evaluation result includes information regarding the control state of the component. コンピュータを用いて、
人力駆動車の走行に関する走行情報に従って、前記人力駆動車のコンポーネントに対する制御の好ましさを、関数を用いて評価し、
前記好ましさの評価結果と、前記評価結果に応じた前記コンポーネントの制御結果と、に応じて前記関数を更新することによって学習モデルを生成する、学習モデルの生成方法。
Using a computer
According to the driving information regarding the driving of the human-powered vehicle, the preference for control over the components of the human-powered vehicle is evaluated by using a function.
A method of generating a learning model, which generates a learning model by updating the function according to the evaluation result of the preference and the control result of the component according to the evaluation result.
コンピュータに、
人力駆動車の走行に関する走行情報に従って、前記人力駆動車のコンポーネントに対する制御の好ましさを、学習モデルを用いて評価する
処理を実行させるためのコンピュータプログラム。
On the computer
A computer program for executing a process of evaluating the preference of control for a component of the human-powered vehicle by using a learning model according to driving information related to the running of the human-powered vehicle.
請求項13に記載のコンピュータプログラムが記憶される記憶媒体。 A storage medium in which the computer program according to claim 13 is stored.
JP2019038893A 2019-03-04 2019-03-04 Evaluation device, control system, notification system, generation method for learning model, computer program and storage medium Pending JP2020142566A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019038893A JP2020142566A (en) 2019-03-04 2019-03-04 Evaluation device, control system, notification system, generation method for learning model, computer program and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019038893A JP2020142566A (en) 2019-03-04 2019-03-04 Evaluation device, control system, notification system, generation method for learning model, computer program and storage medium

Publications (1)

Publication Number Publication Date
JP2020142566A true JP2020142566A (en) 2020-09-10

Family

ID=72355151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019038893A Pending JP2020142566A (en) 2019-03-04 2019-03-04 Evaluation device, control system, notification system, generation method for learning model, computer program and storage medium

Country Status (1)

Country Link
JP (1) JP2020142566A (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11294230A (en) * 1998-04-09 1999-10-26 Yamaha Motor Co Ltd Fuel injection control device for engine
JP2000100477A (en) * 1998-09-18 2000-04-07 Yamaha Motor Co Ltd Battery state display device for electric vehicle
JP2007230411A (en) * 2006-03-02 2007-09-13 Matsushita Electric Ind Co Ltd Vehicle with auxiliary power
JP2014069689A (en) * 2012-09-28 2014-04-21 Honda Motor Co Ltd Assist power control device for power-assisted bicycle
JP2014196096A (en) * 2013-03-29 2014-10-16 ヤマハ発動機株式会社 Antiskid device, vehicle, and two-wheeled motor vehicle
US20150197308A1 (en) * 2012-08-21 2015-07-16 Befra Electronic, S.R.O Electronically Controlled Suspension System, Method for Controlling a Suspension System and Computer Program
US20180362114A1 (en) * 2017-06-14 2018-12-20 Wen-Sung Lee Control system of learning applications for electric bikes

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11294230A (en) * 1998-04-09 1999-10-26 Yamaha Motor Co Ltd Fuel injection control device for engine
JP2000100477A (en) * 1998-09-18 2000-04-07 Yamaha Motor Co Ltd Battery state display device for electric vehicle
JP2007230411A (en) * 2006-03-02 2007-09-13 Matsushita Electric Ind Co Ltd Vehicle with auxiliary power
US20150197308A1 (en) * 2012-08-21 2015-07-16 Befra Electronic, S.R.O Electronically Controlled Suspension System, Method for Controlling a Suspension System and Computer Program
JP2014069689A (en) * 2012-09-28 2014-04-21 Honda Motor Co Ltd Assist power control device for power-assisted bicycle
JP2014196096A (en) * 2013-03-29 2014-10-16 ヤマハ発動機株式会社 Antiskid device, vehicle, and two-wheeled motor vehicle
US20180362114A1 (en) * 2017-06-14 2018-12-20 Wen-Sung Lee Control system of learning applications for electric bikes

Similar Documents

Publication Publication Date Title
JP7324632B2 (en) Output device, learning model generation method, and computer program
US9845133B2 (en) Electric bike motor using sensed air speed
JP6817113B2 (en) Bicycle controller and bicycle drive including this controller
JP7048388B2 (en) Control device for human-powered vehicles
TWI594915B (en) Slope calculation device
CN104340324B (en) Bicycle control
CN105408197A (en) Device and method for regulating the assistance power of an electric power-assisted bicycle
JP2023091087A (en) Control device, learning method of learning model, learning model, computer program, and storage medium
US11527981B2 (en) Human-powered vehicle control device, electronic device, and human-powered vehicle control system
TWI823965B (en) Variable speed control system for human-driven vehicles
US11527980B2 (en) Electronic device and human-powered vehicle system
US11459050B2 (en) Connected component platform
US11597470B2 (en) Human-powered vehicle component, mobile electronic device, and equipment for human-powered vehicle
JP2019166911A (en) Human-powered vehicular control device
JP2024009328A (en) Control device for human-powered vehicle
JP7193332B2 (en) Electronics and systems for human powered vehicles
US20200012964A1 (en) Control data creation device, component control device, control data creation method, component control method and computer program
JP2020142566A (en) Evaluation device, control system, notification system, generation method for learning model, computer program and storage medium
TW201515929A (en) Slope calculation device
JP2020138700A (en) Estimation device, control system, learning model, learning model creating method, computer program, and storage medium
JP6355822B2 (en) Method and apparatus for generating gradient values
JP7356230B2 (en) control system
JP2023151357A (en) Control device for man-power drive vehicle, learning method, control method for man-power drive vehicle, and computer program
JP7457458B2 (en) Output device, computer program, and storage medium
US11161562B2 (en) Controlling device, indicating system, and controlling method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230221

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230731

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230808

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20231013