JP2022107229A

JP2022107229A - 情報処理装置、制御方法及び制御プログラム

Info

Publication number: JP2022107229A
Application number: JP2021002051A
Authority: JP
Inventors: 宗則前田; Munenori Maeda
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2021-01-08
Filing date: 2021-01-08
Publication date: 2022-07-21
Also published as: US20220221991A1; US11640246B2

Abstract

【課題】信頼性を確保しつつＩＯ処理の性能を向上させる情報処理装置、制御方法及び制御プログラムを提供する。
【解決手段】リクエストキュー１３１は、ＩＯ処理のリクエストを格納する。レスポンスキュー１３２は、ＩＯ処理の完了を通知するレスポンスを格納する。高速ＩＯデバイス１００は、リクエストキュー１３１からリクエストを取得して、ＩＯ処理を実行し、ＩＯ処理の完了後にレスポンスをレスポンスキュー１３２に格納する。ＩＯ待ちスレッド１０２は、コンテキストを退避させた後に、リクエストキュー１３１へのリクエストの書き込みを行う。ＩＯ完了通知スレッド１０３は、レスポンスキュー１３２に対してポーリングを行い、レスポンスキュー１３２へのレスポンスの格納を検出し、レスポンスキュー１３２からレスポンスを取得して、ＩＯ待ちスレッド１０２にＩＯ処理の完了を通知する。
【選択図】図３

Description

本発明は、情報処理装置、制御方法及び制御プログラムに関する。

大規模な企業向けのサーバであるエンタープライズサーバでは、高性能であることが重要な価値である。そのため、エンタープライズサーバでは、通信機器やストレージといった高速ＩＯ（Input Output）向け高速ＩＯデバイスの性能を、ハードウェア性能を限界まで引き出すことが求められる。代表的な高速ＩＯデバイスとしては、InfiniBand、Non-Volatile Memory Express（ＮＶＭｅ）、Intel（登録商標） I/O Acceleration Technology（ＯＡＴ）及びIntel Quick Assist Technology（ＱＡＴ）などがある。

高速ＩＯデバイスは、一般的に、リクエストキューとレスポンスキューを有する。リクエストキューは、ＩＯ要求をリクエストとして格納するバッファである。レスポンスキューは、各リクエストに対する応答を格納するバッファである。リクエストキュー及びレスポンスキューには、コア別リクエストキューとコア別レスポンスキューとの組み合わせ、コア別リクエストキューとコア間供給レスポンスキューとの組み合わせなどいくつかの構成が存在する。ここでは、リクエストキュー及びレスポンスキューの組み合わせについては特に制限はない。

そして、高速ＩＯデバイスのハードウェア性能を引き出すための技術として、カーネルバイパス技術と呼ばれるＯＳ（Operating System）の介在を減らす技術が有力とみられている。従来のカーネルバイパス技術では、アプリケーション層における同期ＩＯ処理が一般的である。例えば、カーネルバイパス技術では、ストレージへの書き込みなどのＩＯ操作を行ったスレッドはＩＯ処理の完了までサスペンドして待機し、ＩＯ処理の完了後に復帰して処理を再開する。ここで、実行中のプログラムはプロセスと呼ばれ、プロセスは１つ以上のスレッドを有する。各スレッドは、ＣＰＵ（Central Processing Unit）のいずれかのコアに割り当てられて実行される。すなわち、スレッドとは、プロセス内で命令を逐次実行する部分であり、ＣＰＵコアを利用する単位である。

このような高速ＩＯデバイスの処理を向上させるため、様々な従来技術が提案されている。例えば、マルチＣＰＵでリクエストキューへの書き込みと、レスポンスキューのポーリングとを並列実行することで、ＩＯスループットの向上及びレスポンスの遅延時間の改善を両立するＩＯポーリングと呼ばれる技術が存在する。

他にも、協調型マルチスレッドと呼ばれる技術が存在する。この技術は、スレッドスケジューラの方式の１つであり、割り込みでスレッドを切り替えるのではなく、スレッド自らが制御をスケジューラに渡すことで、処理を実行するスレッドを同時実行中の別のスレッドに切り替えさせる技術である。この切り替えはコンテキストスイッチと呼ばれる場合がある。

コンテキストとは、スレッドの実行を停止させて、その後に再開するときに用いる最小限のデータセットであり、スレッドについてＣＰＵが最後に実行した状態を表す情報である。協調型マルチスレッド処理では、プリエンプションを考慮しなくてもよく、関数の入り口で用いるデータセットに限定されるため、コンテキストは以下のようなものになる。すなわち、協調型マルチスレッド処理におけるコンテキストには、スタック、命令カウンタ、スタックポインタ、及び、ＯＳ毎にＡＢＩ（Application Binary Interface）として規定されている汎用レジスタのサブセットであるCallee-savedレジスタが含まれる。命令カウンタとは、スレッドが次に実行するメモリのアドレスを示す情報である。また、スタックポインタとは、スタックの領域におけるプロセッサの次に使用する位置を示すポインタである。

ただし、ＩＯ待ちスレッドとＩＯ完了通知スレッドとが異なるコアで動作するマルチプロセッサ環境では、異常事態が発生するおそれがある。例えば、以下のような状況が考えられる。ＩＯリクエストを発行したＩＯ待ちスレッドがリクエストキューにリクエストを書き込む時点では、未だ送信スレッドはコンテキストを退避させていない。高速ＩＯデバイスが、動作してＩＯリクエストを処理し、それとともにレスポンスキューに完了通知を書き込む。ＩＯ処理の完了を通知するＩＯ完了通知スレッドが、ＩＯ待ちスレッドとは異なるコアで動作して、通知にあるリクエストｆｄ（file descriptor）から送信スレッドの復帰のための処理を行う。この時点でＩＯ待ちスレッドがコンテキストの退避を行っていない状態が考えられる。この場合、コンテキスト情報は不当な値になっているため、ＩＯ待ちスレッドの復帰が失敗する。その後、ＩＯ待ちスレッドがコンテキストを退避させてサスペンドの状態に移行する。この場合、ＩＯ待ちスレッドを復帰させることが困難となり、送信完了タイムアウトやシステムデッドロックといった異常事態が発生する。このように、単にＩＯ待ちスレッドとＩＯ完了通知スレッドとを異なるマルチプロセッサ環境で動作させた場合、信頼性を確保することが困難である。

このような異常事態の発生を回避するためにいくつかの方法が考えられる。１つはシステムコールによるカーネル内実行である。これは、ＩＯ待ちスレッドの処理の主要部分であるリクエストｆｄ獲得とリクエストｆｄリリースとを除いた処理をシステムコールとしてカーネル内部で実行する方法である。この方法であれば、システムコールからカーネルに移動した時点で、ＩＯ待ちスレッドのコンテキストは退避される。そのため、コンテキスト退避とＩＯ待ちスレッドの復帰とのすれ違いは発生しない。ただし、協調型マルチスレッド環境でのカーネルバイパス技術を用いる場合、ＩＯ処理へのシステムコールの導入は困難である。

そこで、カーネルバイパス技術の仕組みにおいて、ＩＯ待ちスレッドとＩＯ完了通知スレッドとが異なるマルチプロセッサ環境では、ロックによる排他制御が行われることが一般的である。これは、ＩＯ待ちスレッドがＩＯリクエストキューに書き込む前に、リクエストｆｄ内のコンテキスト領域をロックし、コンテキストの退避が完了した後にＩＯ待ちスレッドの動作の最後にロックが解除されるといった処理である。より詳しく説明すると、ＩＯ完了通知スレッドがコンテキスト領域にアクセスする際に、コンテキスト領域をロックする。既にロックがかかっている場合、ＩＯ待ちスレッドは、ＩＯ完了通知が行われるまで待ち合わせを行なう。この結果、コンテキスト退避とＩＯ待ちスレッドの復帰とのすれ違いは発生しない。

なお、リクエストキューに関する技術として、以下のような技術が存在する。デバイスのリクエストキューに格納された順にリクエストを読み出し連番で順序番号を割り当て、読み出したコア毎にリクエストを読み出し順に並べたリストを作成してリクエストを順序番号順に並び替えて取得してリクエストキューに格納する技術がある。また、ユーザ要求をユーザ空間のリストに順次追加し、カーネル空間ではそのリストをたどり要求を処理し、既にカーネル空間がリスト末尾の情報を保持しているかによりリストの次の要素が有効か無効かを判定して処理を行う技術がある。

特開２０１８－１８０９８５号公報特開２００１－００５７６７号公報

しかしながら、コンテキスト領域にロックをかけた場合、その間はＩＯ待ちスレッドが待機することになり、ＩＯ処理の遅延時間が大きく性能が悪くなる。そもそも、排他制御は、アトミック命令によりメモリトランザクションをシリアライズするため、処理が重く大きなＩＯ処理に遅延が発生するおそれがありＩＯ処理の性能が悪化するおそれがある。例えば、排他制御を行った場合、数１０マイクロ秒の遅延が発生する場合がある。

また、読み出し順に順序番号を割り当てたリクエストをリストにしたがってリクエストキューに格納する技術やユーザ要求の順番に応じて処理を行う技術では、コンテキストの格納タイミングについては考慮されていない。そのため、デッドロックなどの異常発生を軽減することは難しく、信頼性を確保することが困難である。

開示の技術は、上記に鑑みてなされたものであって、信頼性を確保しつつＩＯ処理の性能を向上させる情報処理装置、制御方法及び制御プログラムを提供することを目的とする。

本願の開示する情報処理装置、リクエストキューは、ＩＯ処理のリクエストを格納する。レスポンスキューは、前記ＩＯ処理の完了を通知するレスポンスを格納する。ＩＯデバイスは、前記リクエストキューから前記リクエストを取得して、取得した前記リクエストで指示された前記ＩＯ処理を実行し、前記ＩＯ処理の完了後に前記レスポンスを前記レスポンスキューに格納する。第１処理部は、自己の動作状態を表す情報であるコンテキストを退避させた後に、前記リクエストキューへのリクエストの書き込みを行う。第２処理部は、前記レスポンスキューに対してポーリングを行い、前記レスポンスキューへの前記レスポンスの格納を検出して、前記レスポンスキューから前記レスポンスを取得して、前記第１処理部に前記ＩＯ処理の完了を通知する。

１つの側面では、本発明は、信頼性を確保しつつＩＯ処理の性能を向上させることができる。

図１は、コンピュータシステムのハードウェア構成図である。図２は、プロセッサと高速ＩＯデバイスとの間におけるリクエストを用いたＩＯ処理を説明するための図である。図３は、ＩＯ処理の実行に関するブロック図である。図４は、リクエスト発行に伴う各スレッドの処理の詳細を説明するための図である。図５は、実施例１に係る情報処理装置におけるＩＯ処理のフローチャートである。図６は、スレッド切り替え関数及びリクエスト書き込み関数を説明するための第１の図である。図７は、スレッド切り替え関数及びリクエスト書き込み関数を説明するための第２の図である。図８は、スレッド切り替え関数及びリクエスト書き込み関数を説明するための第３の図である。図９は、スレッド切り替え関数及びリクエスト書き込み関数を説明するための第４の図である。図１０は、実施例２に係る情報処理装置におけるＩＯ処理のフローチャートである。図１１は、実施例３に係る情報処理装置におけるＩＯ処理のフローチャートである。

以下に、本願の開示する情報処理装置、制御方法及び制御プログラムの実施例を図面に基づいて詳細に説明する。なお、以下の実施例により本願の開示する情報処理装置、制御方法及び制御プログラムが限定されるものではない。

図１は、コンピュータシステムのハードウェア構成図である。コンピュータシステム１は、情報処理装置１０、ドライブ装置２０及び表示装置３３０を有する。

情報処理装置１０は、プロセッサ１１及び１２、メモリ１３、ネットワークＩＯデバイス１４、ストレージＩＯデバイス１５、ＳＳＤ（Solid State Drive）、並びに、ＨＤＤ（Hard Disk Drive）を有する。プロセッサ１１及び１２、メモリ１３、ネットワークＩＯデバイス１４、ストレージＩＯデバイス１５、ドライブ装置２０、並びに、表示装置３０は、バス４０により相互に接続される。

また、プロセッサ１１及び１２は、それぞれ複数のコアを有する。プロセッサ１１及び１２は、プログラムをメモリ１３上に展開して実行する。プログラムを実行するにあたり、プログラムに含まれるスレッドをプロセッサ１１及び１２のそれぞれのコアが実行する。

プロセッサ１１及び１２は、プログラムを実行することでアプリケーションを動作させる。そして、プロセッサ１１及び１２は、アプリケーションを動作させることで、ネットワークＩＯデバイス１４によりネットワークスイッチ２を介して外部との通信を行わせる。また、プロセッサ１１及び１２は、アプリケーションを動作させることで、ストレージＩＯデバイス１５によりＳＳＤ１６及びＨＤＤ１７に対するデータの読み書きを行う。本実施例における、プロセッサ１１及び１２による、ネットワークＩＯデバイス１４又はストレージＩＯデバイス１５を用いたデータのＩＯ処理については後で詳細に説明する。ここで、図１では、プロセッサ１１及び１２を記載したが、プロセッサの数に特に制限はない。

ネットワークＩＯデバイス１４は、InfiniBandなどの高速ＩＯデバイスである。ネットワークＩＯデバイス１４は、ネットワークスイッチ２と接続される。ネットワークＩＯデバイス１４は、プロセッサ１１又は１２からの指示を受けて、ネットワークスイッチ２を介して外部装置との間でデータの送受信を行う。

ＳＳＤ１６及びＨＤＤ１７は、大容量の補助記憶装置である。ＳＳＤ１６及びＨＤＤ１７は、各種プログラムやデータを格納する。

ストレージＩＯデバイス１５は、ＮＶＭｅなどの高速ＩＯデバイスである。ストレージＩＯデバイス１５は、ＳＳＤ１６及びＨＤＤ１７に接続される。ストレージＩＯデバイス１５は、プロセッサ１１又は１２からの指示を受けて、ＳＳＤ１６及びＨＤＤ１７に対するデータの読み出し及び書き込みを実行する。

ドライブ装置２０は、例えば磁気ディスクや光ディスク等の着脱可能な可搬型記憶媒体２１が挿入され、挿入された可搬型記憶媒体２１に対してデータの書き込みや読み出しを行なう。

表示装置３０は、プロセッサ１１及び１２から送信された画像を表示する。利用者は、表示装置３０を確認することで、情報を受け取ることが可能である。

図２は、プロセッサと高速ＩＯデバイスとの間におけるリクエストを用いたＩＯ処理を説明するための図である。次に、図２を参照して、プロセッサ１１及び１２によるＩＯ処理の概要を説明する。ここでは、ネットワークＩＯデバイス１４及びストレージＩＯデバイス１５をまとめて高速ＩＯデバイス１００として説明する。また、プロセッサ１１は、アプリケーションを動作させてＩＯリクエストの発行を行なうＩＯ待ちスレッドを動作させる。また、プロセッサ１２は、高速ＩＯデバイスによるＩＯ処理が完了したか否かの判定を行う完了通知スレッドを動作させる。また、メモリ１３には、リクエストキュー１３１及びレスポンスキュー１３２が配置される。

プロセッサ１１により実行されるＩＯ待ちスレッドは、高速ＩＯデバイス１００にＩＯ処理を行わせる場合、ＩＯ処理の実行を指示するリクエストを生成する。次に、プロセッサ１１により実行されるＩＯ待ちスレッドは、ＩＯ処理を要求するリクエストのリクエストキュー１３１への書き込みを行う。その後、プロセッサ１１により実行されるＩＯ待ちスレッドは、発行したリクエストに対するレスポンスが返ってくるまで待機する。そして、プロセッサ１２により実行される完了通知スレッドによりレスポンスが検出されると、プロセッサ１１により実行されるＩＯ待ちスレッドは、処理実行を再開する。

高速ＩＯデバイス１００は、リクエストキュー１３１に格納されたリクエストを読み出す。そして、高速ＩＯデバイス１００は、リクエストで指示されたＩＯ処理を行う。その後、高速ＩＯデバイス１００は、実行したＩＯ処理の結果を格納したレスポンスをレスポンスキュー１３２に格納する。

プロセッサ１１により実行されるＩＯ完了通知スレッドは、レスポンスキュー１３２に対してポーリングを行いレスポンスの格納を監視する。ＩＯ完了通知スレッドは、高速ＩＯデバイス１００によりレスポンスキュー１３２へ格納されたレスポンスを取得してＩＯ処理の完了を確認する。そして、プロセッサ１２により実行されるＩＯ完了通知スレッドは、ＩＯ待ちスレッドを再開させる。

次に、図３を参照して、本実施例に係るＩＯ待ちスレッド１０２とＩＯ完了通知スレッド１０３のＩＯ処理時の動作について詳細に説明する。図３は、ＩＯ処理の実行に関するブロック図である。以下では、情報処理装置１０におけるＩＯ処理実行時の動作を説明する。ＩＯ待ちスレッド１０２が、「第１処理部」及び「第１スレッド」の一例にあたり、ＩＯ完了通知スレッド１０３が、「第２処理部」及び「第２スレッド」の一例にあたる。

情報処理装置１０は、プロセッサ１１及び１２により実現されるスレッドスケジューラ１０１、ＩＯ待ちスレッド１０２及びＩＯ完了通知スレッド１０３を有する。また、情報処理装置１０は、メモリ１３内にコンテキスト格納部１０４、リクエストキュー１３１及びレスポンスキュー１３２を有する。

スレッドスケジューラ１０１は、ＩＯ待ちスレッド１０２及びＩＯ完了通知スレッド１０３の処理実行のスケジュールを管理する。スレッドスケジューラ１０１は、ＩＯ待ちスレッド１０２及びＩＯ完了通知スレッド１０３などのスレッドから切り替えの依頼を受けて、処理を実行するスレッドを切り替える。スレッドスケジューラ１０１もスレッドにより動作される。スレッドスケジューラ１０１を動作させるスレッドを以下では、スケジューラスレッドと呼ぶ。

スレッドスケジューラ１０１は、実行状態への移行待ちのスレッドの情報を格納するウェイティングキューを管理する。スレッドスケジューラ１０１は、ウェイティングキューに格納されたスレッドを順番に取得して、処理実行の状態に遷移させて処理を行わせる。例えば、スレッドスケジューラ１０１は、ＩＯ処理のリクエストを発行して待機状態にあるＩＯ待ちスレッド１０２がウェイティングキューに格納された場合、順番が来るとＩＯ待ちスレッド１０２をウェイティングキューから取得する。そして、スレッドスケジューラ１０１は、ＩＯ待ちスレッド１０２をランニングスレッドにして処理の実行状態に復帰させて処理を再開させる。

ＩＯ待ちスレッド１０２は、実行中のアプリケーションの処理に関してＩＯ処理を高速ＩＯデバイス１００に実行させることを決定する。そして、ＩＯ待ちスレッド１０２は、リクエストの処理の実行待ち中のスレッドであることを表すリクエストｆｄを取得する。

次に、ＩＯ待ちスレッド１０２は、リクエストの書き込み機能付きスレッド切り替え関数を実行することで、以下の処理を実行する。ＩＯ待ちスレッド１０２は、コンテキスト格納部１０４におけるリクエストｆｄを表すＦｄ番号に対応する領域に自己のコンテキストを退避させる。また、ＩＯ待ちスレッド１０２は、スレッドスケジューラ１０１のスケジューラスレッド専用のＦｄ番号を自己のスタックに退避させる。次に、ＩＯ待ちスレッド１０２は、リクエストキュー１３１へのリクエストの書き込みを行う。その後、ＩＯ待ちスレッド１０２は、スレッドの切り替えをスレッドスケジューラ１０１に依頼する。

ここで、リクエストの書き込み機能付きスレッド切り替え関数は、ＡＢＩ規約にしたがった関数であり、関数読み出し前後でCallee-savedジスタを保持することができる。そして、リクエストの書き込み機能付きスレッド切り替え関数は、以下のパラメータを有する。パラメータは、例えば、書き込み先のリクエストキュー１３１の名前又はメモリアドレスや、ＩＯコマンド、コマンドパラメータ及びＦｄ番号の情報を含むリクエストなどを含む。他にも、パラメータは、リクエストを行なうＩＯ待ちスレッド１０２に割り当てられたＦｄ番号や、スケジューラスレッド専用のＦｄ番号などを含む。

ＩＯ待ちスレッド１０２は、リクエストキュー１３１に格納したリクエストに対するレスポンスが返ってくるまで待機する。その後、ＩＯ待ちスレッド１０２は、ＩＯ完了通知スレッド１０３によりレスポンスが検出されＩＯ処理の完了通知が出力された後に、処理を実行するランニングスレッドとして選ばれる順番を待つ。そして、スレッドスケジューラ１０１によるスレッドの切り替えが行われることで、ＩＯ待ちスレッド１０２は、処理を実行する状態に復帰する。この、リクエストキュー１３１にリクエストを格納してから処理を実行する状態に復帰するまでの状態が、「ＩＯ処理の完了を待機する状態」の一例にあたる。その後、ＩＯ待ちスレッド１０２は、リクエスト待ちのためのリクエストｆｄをリリースして、アプリケーション処理の実行を再開して継続する。

以上のように、本実施例に係る情報処理装置１０では、ＩＯ待ちスレッド１０２は、リクエストの発行時に、コンテキストの退避、リクエストキュー１３１へのリクエストの書き込み、スレッドの切り替えの順で処理を実行する。これにより、リクエストキュー１３１へのリクエストの書き込み時には、確実にＩＯ待ちスレッド１０２のコンテキストが退避されており、同期のすれ違いによる異常発生を回避して、ＩＯ待ちスレッド１０２を確実に処理実行の状態へ復帰させることができる。

また、本実施例に係るＩＯ待ちスレッド１０２は、ＡＢＩ規約にしたがった関数をリクエストの書き込み機能付きスレッド切り替え関数として用いる。この関数を使用することで、ＩＯ待ちスレッド１０２は、スレッド切り替えの引数としてスケジューラスレッド専用のＦｄ番号を取得している場合、スケジューラスレッド専用のＦｄ番号をＩＯ待ちスレッド１０２のスタックに退避させる。これにより、ＩＯ待ちスレッド１０２は、スケジューラスレッド専用のＦｄ番号のリクエストの書き込み関数の読み出しによる破壊を防止する。そして、リクエストの書き込み実行後に、ＩＯ待ちスレッド１０２は、スタックからスケジューラスレッド専用のＦｄ番号を復元してスレッド切り替えを確実に行うことが可能となる。

また、本実施例に係るＩＯ待ちスレッド１０２は、コンテキスト退避、リクエストキュー１３１へのリクエストの書き込み及びスレッドの切り替え依頼の３つの処理を順次行う１つのリクエストの書き込み機能付きスレッド切り替え関数を使用する。これにより、３つの処理の順序が確実に守られる。ただし、３つの処理の順序が守られるのであれば、ＩＯ待ちスレッド１０２は、それぞれの処理の実行に別の関数を用いてもよいし、２つの処理をまとめた関数を使用してもよい。

図３に戻って説明を続ける。ＩＯ完了通知スレッド１０３は、レスポンスキュー１３２に対してポーリングを行う。そして、ＩＯ完了通知スレッド１０３は、レスポンスキュー１３２に格納されたリクエストを取得してＩＯ完了を確認する。次に、ＩＯ完了通知スレッド１０３は、取得した応答からリクエストｆｄを特定する。次に、ＩＯ完了通知スレッド１０３は、特定したリクエストｆｄを用いてＩＯ待ちスレッド１０２のコンテキストを取得する。その後、ＩＯ完了通知スレッド１０３は、ウェイティングキューへのＩＯ待ちスレッド１０２の挿入をスレッドスケジューラ１０１へ依頼する。

図４は、リクエスト発行に伴う各スレッドの処理の詳細を説明するための図である。次に、図４を使用して、本実施例に係るＩＯ待ちスレッド１０２によるリクエスト書き込み時の状態遷移をさらに詳細に説明する。

図４は、プロセッサ１１及び１２がメモリ１３上にプログラムを展開してアプリケーションを実行した状態を表す。メモリ１３には、スレッドの処理実行のスケジュールを管理するスケジューラレイヤ１１０及びアプリケーションにおける各スレッドが動作するユーザスレッドレイヤ１２０が展開される。

スケジューラレイヤ１１０では、スケジューラスレッド１１１によりスレッドスケジューラ１０１が動作する。また、スケジューラレイヤ１１０には、その時点で処理の実行を行なうランニングスレッド１２１を示すポインタであるランニングスレッド情報１１２が存在する。さらに、スケジューラレイヤ１１０には、実行可能な状態で待機するスレッドであるウェイティングスレッド１２２を表すウェイティングキュー１１３が存在する。

ユーザスレッドレイヤ１２０は、処理実行中のスレッドであるランニングスレッド１２１が動作する。また、ユーザスレッドレイヤ１２０には、実行可能な状態で待機するスレッドであるウェイティングスレッド１２２が存在する。図４では、ウェイティングスレッド１２２として、スレッド２２１～２２３が存在する場合を記載した。また、ユーザスレッドレイヤ１２０には、リクエストを行ったＩＯ処理の完了を待つなどの実行可能な状態への遷移を待機するスレッドであるサスペンデッドスレッド１２３が存在する。図４では、サスペンデッドスレッド１２３として、スレッド２３１～２３３が存在する場合を記載した。さらに、ユーザスレッドレイヤ１２０には、各スレッドに割り当てられたスタック２１１～２１５が存在する。例えば、ランニングスレッド１２１には、スタック２１１が割り当てられる。また、スレッド２２１にはスタック２１２が割り当てられ、スレッド２２２にはスタック２１３が割り当てられる。また、スケジューラスレッド１０１には、スタック２１４が割り当てられる。また、スレッド２３１には、スタック２１５が割り当てられる。図４では以上の割り当てが行われたスタック２１１～２１５を表示したが、他のスレッドにも同様にスタックが割り当てられる。

ここで、データ構造について説明する。スレッドは、それぞれに割り当てられた識別子であるスレッドＩＤ（Identifier）で識別される。そして、スレッドＩＤからそのスレッド用のスレッド構造体を検索することが可能である。スレッド構造体は、スレッドの状態を表すステート情報、そのスレッドを実行中のプロセッサ１１又は１２を表すＣＰＵ番号、コンテキスト構造体を含む。コンテキスト構造体には、スタック、命令カウンタ、スタックポインタ、及び、ＯＳ毎にＡＢＩとして規定されている汎用レジスタのサブセットであるCallee-savedレジスタが含まれる。すなわち、スレッド構造体が図３におけるコンテキスト格納部１０４にあたる。また、リクエスト待ちは、リクエストｆｄにより区別される。リクエストｆｄを用いることで、そのリクエスト用のリクエスト待ち構造体を検索することが可能である。リクエスト待ち構造体の中にスレッドＩＤの値であるｔｉｄが含まれる。

ランニングスレッド１２１がＩＯ待ちスレッド１０２であり、高速ＩＯデバイス１００に対してＩＯ処理のリクエストを行なう場合について説明する。ランニングスレッド１２１であるＩＯ待ちスレッド１０２は、リクエスト待ちのリクエストｆｄを取得する。そして、ＩＯ待ちスレッド１０２は、自己を実行するＣＰＵ番号をｔｉｄで表されるスレッド構造体にＣＰＵ番号として格納する。次に、ＩＯ待ちスレッド１０２は、自己のコンテキストをｔｉｄで表されるスレッド構造体が有するコンテキスト構造体に格納する。そして、スレッドＩＤがｔｉｄである実行中のＩＯ待ちスレッド１０２がＩＯ処理のリクエストを実行する。次に、ＩＯ待ちスレッド１０２は、スレッドの状態をｔｉｄで示されるスレッド構造体に登録されたスレッドの状態をサスペンドに変更する。次に、ＩＯ待ちスレッド１０２は、ｔｉｄで示されるスレッド構造体が有するコンテキスト構造体の情報を、スケジューラスレッド１１１が使用するスレッド構造体のコンテキスト構造体の情報をコンテキストにセットしてスレッドスケジューラ１０１を再開させる。これにより、ランニングスレッド１２１であったＩＯ待ちスレッド１０２は、サスペンデッドスレッド１２３に遷移する。

ＩＯ完了通知スレッド１０３は、ポーリングによりＩＯ応答を読み出してレスポンスキュー１３２からレスポンスを取得する。次に、ＩＯ完了通知スレッド１０３は、レスポンスのデータに含まれるリクエストｆｄを読み込む。そして、ＩＯ完了通知スレッド１０３は、取得したリクエストｆｄからリクエスト待ち構造体を検索して特定する。次に、ＩＯ完了通知スレッド１０３は、特定したリクエスト待ち構造体からスレッドＩＤの値であるｔｉｄを取得する。次に、ＩＯ完了通知スレッド１０３は、取得したｔｉｄで示されるスレッド構造体を特定する。次に、ＩＯ完了通知スレッド１０３は、特定したスレッド構造体からＣＰＵ番号を取得する。次に、ＩＯ完了通知スレッド１０３は、ｔｉｄで示されるスレッド構造体に登録されたスレッドの状態をウェイティングに変更する。そして、ＩＯ完了通知スレッド１０３は、ｔｉｄで示されるスレッド構造体に格納されたＣＰＵ番号を取得し、そのＣＰＵ番号を有するプロセッサ１１又は１２が管理するウェイティングキュー１１３にｔｉｄで表されるスレッドＩＤを登録する。これにより、例えばｔｉｄで示されるスレッド構造体に対応するスレッドがＩＯ待ちスレッド１０２であれば、サスペンデッドスレッド１２３であったＩＯ待ちスレッド１０２は、ウェイティングスレッド１２２に遷移する。ＩＯ完了通知スレッド１０３は、以上の処理を繰り返す。

スレッドスケジューラ１０１は、ウェイティングキュー１１３を監視する。ウェイティングキュー１１３が空であれば、スレッドスケジューラ１０１は、ウェイティングキュー１１３にウェイティングスレッド１２２のスレッドＩＤが登録されるまで待機する。ウェイティングキュー１１３にスレッドＩＤが登録されている場合、スレッドスケジューラ１０１は、ウェイティングキュー１１３からスレッドＩＤを取得する。そして、スレッドスケジューラ１０１は、取得したスレッドＩＤをｔｉｄとする。次に、スレッドスケジューラ１０１は、ｔｉｄで示されるスレッド構造体を特定する。次に、スレッドスケジューラ１０１は、ｔｉｄで示されるスレッド構造体に登録されたスレッドの状態をランニングに変更する。次に、スレッドスケジューラ１０１は、自己を実行するプロセッサ１１又は１２のＣＰＵ番号を取得する。そして、スレッドスケジューラ１０１は、取得したＣＰＵ番号のプロセッサが実行するスレッドスケジューラ１０１に割り当てられたスレッド構造体のコンテキスト構造体に、自己のコンテキストを保存する。その後、スレッドスケジューラ１０１は、ｔｉｄで示されるスレッド構造体に含まれるコンテキスト構造体の情報をコンテキストにセットして、ＩＯ待ちスレッド１０２を処理の実行状態に復帰させる。これにより、ウェイティングスレッド１２２であったＩＯ待ちスレッド１０２は、ランニングスレッド１２１に遷移する。ＩＯ待ちスレッド１０２は、ＩＯ完了通知スレッド１０３がＩＯ処理の完了の通知を出力すると、コンテキストを用いて動作を再開するといえる。

次に、図５を参照して本実施例に係る情報処理装置１０におけるＩＯ処理の流れについて説明する。図５は、実施例１に係る情報処理装置におけるＩＯ処理のフローチャートである。

ＩＯ待ちスレッド１０２は、リクエスト待ちのリクエストｆｄを取得する（ステップＳ１０１）。

次に、ＩＯ待ちスレッド１０２は、取得したリクエストｆｄに対応するコンテキスト格納部１０４の領域に自己のコンテキストを退避させる（ステップＳ１０２）。

次に、ＩＯ待ちスレッド１０２は、リクエストキュー１３１へリクエストを書き込む（ステップＳ１０３）。

次に、ＩＯ待ちスレッド１０２は、ランニングスレッド１２１をスケジューラスレッド１１１に切り替える（ステップＳ１０４）。

ＩＯ完了通知スレッド１０３は、レスポンスキュー１３２に対するポーリングを常に行う（ステップＳ２０１）。

そして、ＩＯ完了通知スレッド１０３は、レスポンスキュー１３２からレスポンスを取得することでＩＯ完了を受信してリクエスト待ちのリクエストｆｄを特定する（ステップＳ２０２）。

次に、ＩＯ完了通知スレッド１０３は、取得したリクエストｆｄを用いて、ＩＯ待ちスレッド１０２のコンテキストを取得する（ステップＳ２０３）。

次に、ＩＯ完了通知スレッド１０３は、取得したコンテキストを用いて、ＩＯ待ちスレッド１０２をウェイティングキュー１１３に挿入する（ステップＳ２０４）。

スレッドスケジューラ１０１によりウェイティングキュー１１３から取得されランニングスレッド１２１に遷移することで、ＩＯ待ちスレッド１０２は、処理実行の状態に復帰する（ステップＳ１０５）。

その後、ＩＯ待ちスレッド１０２は、リクエストｆｄをリリースする（ステップＳ１０６）。

以上に説明したように、本実施例に係る情報処理装置は、ＩＯ待ちスレッドが、リクエストの発行時に、コンテキストの退避、リクエストキューへのリクエストの書き込み、スレッドの切り替えの順で処理を実行する。これにより、リクエストキューへのリクエストの書き込み時には、確実にＩＯ待ちスレッドのコンテキストが退避されていることになり、同期のすれ違いによる異常発生を回避できる。すなわち、ＩＯ待ちスレッドを確実に処理実行の状態へ復帰させることができる。したがって、デッドロックなどの異常発生を抑制して信頼性を確保しつつ、カーネルバイパス技術を用いてシステムコール無しでＩＯ制御を行うことができ、ＩＯ処理の性能を向上させることが可能となる。

次に実施例２について説明する。本実施例に係る情報処理装置も、図１～３で表される。本実施例に係る情報処理装置１０は、コンテキスト退避、スレッド切り替え、リクエストキュー１３１へのリクエストの書き込みの順でＩＯ待ちスレッド１０２が処理を行うことが実施例１と異なる。以下の説明では実施例１と同様の各部の動作については説明を省略する。

図３を参照して、本実施例に係るＩＯ待ちスレッドとＩＯ完了通知スレッドのＩＯ処理時の動作について詳細に説明する。

ＩＯ待ちスレッド１０２は、アプリケーション処理実行中にＩＯ処理を高速ＩＯデバイス１００に実行させることを決定する。そして、ＩＯ待ちスレッド１０２は、リクエストの処理の実行待ち中のスレッドであることを表すリクエストｆｄを取得する。

次に、本実施例に係るＩＯ待ちスレッド１０２は、リクエストの書き込み機能付きスレッド切り替え関数を実行することで、以下の処理を実行する。ＩＯ待ちスレッド１０２は、コンテキスト格納部１０４におけるリクエストｆｄを表すＦｄ番号に対応する領域に自己のコンテキストを退避させる。また、ＩＯ待ちスレッド１０２は、スレッドスケジューラ１０１のスレッドであるスケジューラスレッド１１０の専用のＦｄ番号を自己のスタックに退避させる。次に、ＩＯ待ちスレッド１０２は、スレッドの切り替えをスレッドスケジューラ１０１に依頼する。その後、ＩＯ待ちスレッド１０２は、リクエストキュー１３１へのリクエストの書き込みを行う。

本実施例に係るリクエストの書き込み機能付きスレッド切り替え関数も、ＡＢＩ規約にしたがった関数である。この関数を使用することで、ＩＯ待ちスレッド１０２は、リクエストキュー１３１の書き込みに用いる情報を、スケジューラスレッド１１１への切り替え後に可能となるように、スケジューラスレッド１１１のスタック２１４に退避させる。リクエストキュー１３１の書き込みに用いる情報とは、関数アドレスやパラメータリストなどである。これにより、ＩＯ待ちスレッド１０２は、リクエストキュー１３１の書き込みに用いる情報のスレッド切り替えによる破壊を防止できる。そして、スレッドの切り替え完了後に、ＩＯ待ちスレッド１０２は、リクエストキュー１３１の書き込みに用いる情報をスタック２１４から復元してリクエストキュー１３１へのリクエストの書き込みを確実に行うことが可能となる。

ここで、リクエストキュー１３１の書き込みに用いる情報のスレッド切り替えによる破壊を防止についてさらに詳細に説明する。まず、従来のように、リクエストキュー１３１へのリクエストの書き込み、コンテキスト退避、スレッドの切り替えの順で処理を行う場合について説明する。この手順では、リクエストキュー１３１へのリクエストの書き込みは、ＩＯ待ちスレッド１０２が行い、且つ、コンテキスト退避前である。そのため、リクエストキュー１３１へのリクエストの書き込みでは、ＩＯ待ちスレッド１０２により通常の関数呼び出しが行われる。通常の関数においては、コンテキストについて意識しなくてもよい。これに対して、本実施例に係る手順の場合以下のようなことが考えられる。

スレッドとは、論理的もしくは仮想的なプロセッサであり、コンテキストと呼ばれる本来は物理的なプロセッサ１１などが有するプログラムカウンタや汎用レジスタといったレジスタ集合を、スレッド毎に有する。

スレッドの切り替えでは、その時点で実行中のＩＯ待ちスレッド１０２からスケジューラスレッド１１１にランニングスレッド１２１が切り替わる。スレッド切り替えが完了した時点で、物理的なプロセッサ１１ではそのプロセッサ１１において以前にスレッドスケジューラ１０１が保存したコンテキストつまりレジスタ集合に置き換わり、スレッドスケジューラ１０１は、コンテキストの保存の直後から実行が再開したと把握する。

リクエストキュー１３１へのリクエストの書き込みは、スレッドスケジューラ１０１が実行するが、これはＩＯ待ちスレッド１０２から差し込まれた処理であり、本来のスレッドスケジューラ１０１が再開直後に実行する処理ではない。したがって、ＩＯ待ちスレッド１０２は、スレッドスケジューラ１０１が再開直後に実行する処理に支障が生じないように、リクエストキュー１３１へのリクエストの書き込みの処理を行うことが好ましい。言い換えれば、ＩＯ待ちスレッド１０２は、スレッド切り替え実行後のレジスタ集合と、リクエストキュー１３１へのリクエストの書き込み実行後のレジスタ集合とが変化しないようにリクエストキュー１３１へのリクエストの書き込みの処理を行うことが好ましい。

ここで、本実施例ではリクエストの書き込み機能付きスレッド切り替え関数を使用することで、ＩＯ待ちスレッド１０２は、リクエストキュー１３１の書き込みに用いる情報を、スケジューラスレッド１１１のスタック２１４に退避させる。これにより、スケジューラスレッド１１１への切り替え後に、ＩＯ待ちスレッド１０２は、リクエストキュー１３１の書き込みに用いる情報にアクセス可能となる。リクエストキュー１３１の書き込みに用いる情報は、ＩＯ待ちスレッド１０２は当然把握する情報であるが、スレッドスケジューラ１０１は、知らない情報である。したがって、リクエストキュー１３１の書き込みに用いる情報の受け渡しを行わなければ、スレッドの切り替え後に情報はなくなってしまい、スレッドスケジューラ１０１は、リクエストキュー１３１の書き込みに用いる情報の取得が困難となる。

なお、ＩＯ待ちスレッド１０２からスレッドスケジューラ１０１のコンテキストにアクセス可能である。このアクセスには、スレッドスケジューラ１０１に割り当てられたスタック２１４へのアクセスも含まれるため、ＩＯ待ちスレッド１０２は、リクエストキュー１３１の書き込みに用いる情報を、スケジューラスレッド１１１のスタック２１４に退避させることができる。

図６は、スレッド切り替え関数及びリクエスト書き込み関数を説明するための第１の図である。図７は、スレッド切り替え関数及びリクエスト書き込み関数を説明するための第２の図である。図８は、スレッド切り替え関数及びリクエスト書き込み関数を説明するための第３の図である。図９は、スレッド切り替え関数及びリクエスト書き込み関数を説明するための第４の図である。次に、図６～９を参照して、スレッド切り替え関数とＩＯリクエスト書き込み関数とについてさらに説明する。

ここでは、アセンブラコードを用いて説明する。スレッド切り替え関数は、アセンブラで記述され、その内部でＩＯリクエスト書き込み関数を呼び出す。図６におけるアセンブラコード３１３は、一例であるスレッド切り替え関数の一部である。アセンブラコード３１３は、スレッド切り替え関数におけるリクエスト書き込み関数の呼び出し後、戻り命令であるｒｅｔを呼び出す部分にあたる。ＩＯ待ちスレッド１０２は、アセンブラコード３１３を通常の関数実行と同様に実行する。

また、ここでは、リクエスト書き込み関数がパラメータを２つもつ場合で説明する。ただし、リクエスト書き込み関数のパラメータは、０以上でよい。パラメータが０個の場合は、パラメータを渡す際に用いるレジスタは０個であり、レジスタの退避復元は、考慮しなくてよい。リクエスト書き込み関数は、ＡＢＩにしたがうものであればよく、ここでは、Ｃ言語で記述されたものとする。

図６における状態３０１は、スレッド切り替え前の状態を表す。また、状態３０２は、スレッド切り替えが行われる直前の状態を表す。

スレッド切り替え前は、スケジューラスレッド１１１のコンテキスト構造体３１１は、ＡＢＩ関連レジスタに状態３０１に示す情報を保持する。そして、コンテキスト構造体３１１が保持するスタックポインタｓｐが、スケジューラスレッド１１１のスタック２１４に戻り番地として登録される。この戻り番地は、スケジューラスレッド１１１の再開位置を示す情報である。また、スタック２１４は、ＡＢＩ関連レジスタを有する。

そして、スレッド切り替えの直前には、ＩＯ待ちスレッド１０２は、スレッド切り替え関数を実行する。アセンブラコード３１３におけるシンタックス３１４は、リクエスト書き込み関数の呼び出しパラメータをレジスタに設定する処理と、その処理で実行されるレジスタを事前に退避する処理を表す。これにより、状態３０２に示すように、プロセッサ１１のレジスタセット３１２に、スケジューラスレッド１１１のコンテキスト構造体３１１の情報がコピーされる。レジスタセット３１２にコピーされたスタックポインタｓｐにより、スケジューラスレッド１１１のスタック２１４が指定される。そして、スタック２１４には、スケジューラスレッド１１１のコンテキスト構造体３１１に登録されていた情報が退避される。さらに、スタック２１４には、ＩＯリクエスト関数用のパラメータであるパラメータｐ１及びｐ２が格納される。そして、レジスタセット３１２におけるプログラムカウンタは、アセンブラコード３１３におけるリクエスト書き込み関数の呼び出しの行を指す。

次に、図７の状態３０３は、スレッド切り替え中の状態を表す。ＩＯ待ちスレッド１０２は、リクエスト書き込み関数を実行する。プロセッサ１１のレジスタセット３１２のスタックポインタｓｐは、スケジューラスレッド１１１のスタック２１４を指定する。さらに、レジスタセット３１２のプログラムカウンタは、リクエスト関数のアセンブラコード３１６を示す。スタック２１４の戻り番地は、アセンブラコード３１３におけるシンタックス３１５の先頭を示す。シンタックス３１５は、変更されたレジスタを復元する処理を表す。

図８の状態３０４は、スレッド切り替え中でＩＯ待ちスレッド１０２が復帰命令を受ける前の状態を表す。プロセッサ１１のレジスタセット３１２は、スタックポインタｓｐは、スケジューラスレッド１１１のスタック２１４を指定する。また、レジスタセット３１２のプログラムカウンタは、戻り命令であるｒｅｔの行を指す。

図９の状態３０５は、スレッド切り替えが完了してＩＯ待ちスレッド１０２が処理の実行状態に復帰した後の状態を表す。この時、スケジューラスレッド１１１のスタック２１４に格納された情報がプロセッサ１１のレジスタセット３１２にコピーされる。この場合のレジスタセット３１２のプログラムカウンタは、スケジューラスレッド１１１の再開位置を示す。

次に、図１０を参照して本実施例に係る情報処理装置１０におけるＩＯ処理の流れについて説明する。図１０は、実施例２に係る情報処理装置におけるＩＯ処理のフローチャートである。

ＩＯ待ちスレッド１０２は、リクエスト待ちのリクエストｆｄを取得する（ステップＳ１１１）。

次に、ＩＯ待ちスレッド１０２は、取得したリクエストｆｄに対応するコンテキスト格納部１０４の領域に自己のコンテキストを退避させる（ステップＳ１１２）。

次に、ＩＯ待ちスレッド１０２は、ランニングスレッド１２１をスケジューラスレッド１１１に切り替える（ステップＳ１１３）。

次に、ＩＯ待ちスレッド１０２は、リクエストキュー１３１へリクエストを書き込む（ステップＳ１１４）。

ＩＯ完了通知スレッド１０３は、レスポンスキュー１３２に対するポーリングを常に行う（ステップＳ２１１）。

そして、ＩＯ完了通知スレッド１０３は、レスポンスキュー１３２からレスポンスを取得することでＩＯ完了を受信してリクエスト待ちのリクエストｆｄを特定する（ステップＳ２１２）。

次に、ＩＯ完了通知スレッド１０３は、取得したリクエストｆｄを用いて、ＩＯ待ちスレッド１０２のコンテキストを取得する（ステップＳ２１３）。

次に、ＩＯ完了通知スレッド１０３は、取得したコンテキストを用いて、ＩＯ待ちスレッド１０２をウェイティングキュー１１３に挿入する（ステップＳ２１４）。

スレッドスケジューラ１０１によりウェイティングキュー１１３から取得されランニングスレッド１２１に遷移することで、ＩＯ待ちスレッド１０２は、処理実行の状態に復帰する（ステップＳ１１５）。

その後、ＩＯ待ちスレッド１０２は、リクエストｆｄをリリースする（ステップＳ１１６）。

以上に説明したように、本実施例に係る情報処理装置は、ＩＯ待ちスレッドが、リクエストの発行時に、コンテキストの退避、スレッドの切り替え、リクエストキュー１３１へのリクエストの書き込みの順で処理を実行する。この順番で処理を行っても、リクエストキューへのリクエストの書き込み時には、確実にＩＯ待ちスレッドのコンテキストが退避されていることになり、同期のすれ違いによる異常発生を回避できる。すなわち、ＩＯ待ちスレッドを確実に処理実行の状態へ復帰させることができる。したがって、デッドロックなどの異常発生を軽減して信頼性を確保しつつ、カーネルバイパス技術を用いてＩＯ処理の性能を向上させることが可能となる。

次に実施例３について説明する。本実施例に係る情報処理装置も、図１～３で表される。本実施例に係る情報処理装置１０は、ＩＯリクエスト書き込み処理を汎用化して差し替え可能にしたことが実施例１と異なる。以下の説明では、実施例１と同様の各部の動作については説明を省略する。

本実施例に係るＩＯ待ちスレッド１０２は、Ｆｄ番号で示される領域に自己のコンテキストを退避する処理、間接関数の呼び出し処理及びスレッド切り替え処理をこの順番で実行する間接関数呼び出し機能付きスレッド切り替え関数を有する。

次に、本実施例に係るＩＯ待ちスレッド１０２は、関数オブジェクト用領域を確保して、関数オブジェクトに関数オブジェクトに、リクエスト書き込み関数、リクエストキュー１３１の名前やメモリアドレスといった識別情報、ＩＯコマンド及びＩＯパラメータを設定する。この情報を用いて、間接関数を実行することで、リクエストキュー１３１へのリクエストの挿入が行われる。

次に、ＩＯ待ちスレッド１０２は、間接関数呼び出し機能付きスレッド切り替え関数を実行することで、以下の処理を実行する。ＩＯ待ちスレッド１０２は、コンテキスト格納部１０４におけるリクエストｆｄを表すＦｄ番号に対応する領域に自己のコンテキストを退避させる。また、ＩＯ待ちスレッド１０２は、スレッドスケジューラ１０１のスケジューラスレッド専用のＦｄ番号を自己のスタックに退避させる。次に、ＩＯ待ちスレッド１０２は、スレッドスケジューラ１０１に対して間接関数を呼び出し、関数オブジェクトを用いて間接関数を実行させることで、リクエストキュー１３１へのリクエストの書き込みを行う。その後、ＩＯ待ちスレッド１０２は、スレッドの切り替えをスレッドスケジューラ１０１に依頼する。

次に、図１１を参照して本実施例に係る情報処理装置１０におけるＩＯ処理の流れについて説明する。図１１は、実施例３に係る情報処理装置におけるＩＯ処理のフローチャートである。

ＩＯ待ちスレッド１０２は、リクエスト待ちのリクエストｆｄを取得する（ステップＳ１２１）。

ＩＯ待ちスレッド１０２は、関数オブジェクト用領域を確保して、関数ポインタ及びパラメータを設定する（ステップＳ１２２）。

次に、ＩＯ待ちスレッド１０２は、取得したリクエストｆｄに対応するコンテキスト格納部１０４の領域に自己のコンテキストを退避させる（ステップＳ１２３）。

次に、ＩＯ待ちスレッド１０２は、間接関数を呼び出して、関数オブジェクトを用いて実行し、リクエストキュー１３１へリクエストを書き込む（ステップＳ１２４）。

次に、ＩＯ待ちスレッド１０２は、ランニングスレッド１２１をスケジューラスレッド１１１に切り替える（ステップＳ１２５）。

ＩＯ完了通知スレッド１０３は、レスポンスキュー１３２に対するポーリングを常に行う（ステップＳ２２１）。

そして、ＩＯ完了通知スレッド１０３は、レスポンスキュー１３２からレスポンスを取得することでＩＯ完了を受信してリクエスト待ちのリクエストｆｄを特定する（ステップＳ２２２）。

次に、ＩＯ完了通知スレッド１０３は、取得したリクエストｆｄを用いて、ＩＯ待ちスレッド１０２のコンテキストを取得する（ステップＳ２２３）。

次に、ＩＯ完了通知スレッド１０３は、取得したコンテキストを用いて、ＩＯ待ちスレッド１０２をウェイティングキュー１１３に挿入する（ステップＳ２２４）。

スレッドスケジューラ１０１によりウェイティングキュー１１３から取得されランニングスレッド１２１に遷移することで、ＩＯ待ちスレッド１０２は、処理実行の状態に復帰する（ステップＳ１２６）。

その後、ＩＯ待ちスレッド１０２は、リクエストｆｄをリリースする（ステップＳ１２７）。

以上に説明したように、本実施例に係る情報処理装置は、間接関数を呼び出してリクエストキューへのリクエストの書き込みを行う。これにより、ＩＯ処理におけるコンテキストスイッチ全般に対して、リクエストキューへのリクエストのオーバーヘッドがかからず、コンテキストスイッチのオーバーヘッドに制限することができる。また、本実施例においても、情報処理装置は、ＩＯ待ちスレッドが、リクエストの発行時に、コンテキストの退避、リクエストキューへのリクエストの書き込み、スレッドの切り替えの順で処理を実行する。これにより、デッドロックなどの異常発生を軽減して信頼性を確保しつつ、カーネルバイパス技術を用いてＩＯ処理の性能を向上させることが可能となる。

１コンピュータシステム
２ネットワークスイッチ
１０情報処理装置
１１，１２プロセッサ
１３メモリ
１４ネットワークＩＯデバイス
１５ストレージＩＯデバイス
１６ＳＳＤ
１７ＨＤＤ
２０ドライブ装置
２１可搬型記憶媒体
３０表示装置
１００高速ＩＯデバイス
１０１スレッドスケジューラ
１０２ＩＯ待ちスレッド
１０３ＩＯ完了通知スレッド
１０４コンテキスト格納部
１１０スケジューラレイヤ
１１１スケジューラスレッド
１１２ランニングスレッド情報
１１３ウェイティングキュー
１２０ユーザスレッドレイヤ
１２１ランニングスレッド
１２２ウェイティングスレッド
１２３サスペンデッドスレッド
１３１リクエストキュー
１３２レスポンスキュー
２１１～２１５スタック
２２１～２２３，２３１～２３３スレッド

Claims

ＩＯ処理のリクエストを格納するリクエストキューと、
前記ＩＯ処理の完了を通知するレスポンスを格納するレスポンスキューと、
前記リクエストキューから前記リクエストを取得して、取得した前記リクエストで指示された前記ＩＯ処理を実行し、前記ＩＯ処理の完了後に前記レスポンスを前記レスポンスキューに格納するＩＯデバイスと、
自己の動作状態を表す情報であるコンテキストを退避させた後に、前記リクエストキューへのリクエストの書き込みを行う第１処理部と、
前記レスポンスキューに対してポーリングを行い、前記レスポンスキューへの前記レスポンスの格納を検出し、前記レスポンスキューから前記レスポンスを取得して、前記第１処理部に前記ＩＯ処理の完了を通知する第２処理部と
を備えたことを特徴とする情報処理装置。
前記第１処理部は、前記第２処理部が前記ＩＯ処理の完了の通知を出力すると、前記コンテキストを用いて動作を再開することを特徴とする請求項１に記載の情報処理装置。
前記第１処理部は、前記コンテキストを退避させて、前記リクエストキューへの前記リクエストの書き込みを行い、前記ＩＯ処理の完了を待機する状態に遷移することを特徴とする請求項１又は２に記載の情報処理装置。
前記第１処理部は、前記コンテキストを退避させて、前記ＩＯ処理の完了を待機する状態に遷移し、前記リクエストキューへの前記リクエストの書き込みを行うことを特徴とする請求項１又は２に記載の情報処理装置。
前記第１処理部は、前記コンテキストの退避処理、前記リクエストキューへの前記リクエストの書き込みを処理及び前記ＩＯ処理の完了を待機する状態に遷移する処理を実行する１つの関数を用いることを特徴とする請求項３又は４に記載の情報処理装置。
前記関数は、Application Binary Interface（ＡＢＩ）規約にしたがった関数であることを特徴とする請求項５に記載の情報処理装置。
前記第１処理部は、前記レスポンスキューへの前記レスポンスの格納を行なう間接関数を呼び出して実行することを特徴とする請求項１～６のいずれか一つに記載の情報処理装置。
ＩＯ処理のリクエストを格納するリクエストキューと、
前記ＩＯ処理の完了を通知するレスポンスを格納するレスポンスキューと、
前記リクエストキューから前記リクエストを取得して、取得した前記リクエストで指示された前記ＩＯ処理を実行し、前記ＩＯ処理の完了後に前記レスポンスを前記レスポンスキューに格納するＩＯデバイスとを有する情報処理装置の制御プログラムであって、
自己の動作状態を表す情報であるコンテキストを退避させた後に、前記リクエストキューへのリクエストの書き込みを第１スレッドに行わせ、
前記レスポンスキューに対してポーリングを行い、前記レスポンスキューへの前記レスポンスの格納を検出し、前記レスポンスキューから前記レスポンスを取得して、前記ＩＯ処理の完了を前記第１スレッドに通知する処理を第２スレッドに行わせる
ことを特徴とする制御方法。
ＩＯ処理のリクエストを格納するリクエストキューと、
前記ＩＯ処理の完了を通知するレスポンスを格納するレスポンスキューと、
前記リクエストキューから前記リクエストを取得して、取得した前記リクエストで指示された前記ＩＯ処理を実行し、前記ＩＯ処理の完了後に前記レスポンスを前記レスポンスキューに格納するＩＯデバイスとを有する情報処理装置の制御プログラムであって、
自己の動作状態を表す情報であるコンテキストを退避させた後に、前記リクエストキューへのリクエストの書き込みを第１スレッドに行わせ、
前記レスポンスキューに対してポーリングを行い、前記レスポンスキューへの前記レスポンスの格納を検出し、前記レスポンスキューから前記レスポンスを取得して、前記ＩＯ処理の完了を前記第１スレッドに通知する処理を第２スレッドに行わせる
処理をコンピュータに実行させることを特徴とする制御プログラム。