(深層学習向けマシンのインフラ) GPUの冷却方式を説明します

インフラ整備しています大石と、その補佐の土屋です。GPUの冷却方式、マルチGPUの時の注意点や使用してみてわかったことなどを書きます。

ブロワーファンのGPUであるASUS TURBO モデルのRTX 2080tiを4台購入しました。うち2台を同時期に届いたAMD EPYCのワークステーションに入れました。ワークステーションについてはまた記事を書きます。

GPUの冷却方式

GPUの冷却方式は4種類ほどあります。

一つ目はパッシブクーリングです。サーバなどでよく使われます。外部のファンからGPUに風を送り冷やします。GPUにファンがないので可動部品を減らすことができます。外排気なためマルチGPUに向いています。

二つ目はブロワーファンの外排気モデルです。外排気の特徴は、内部に熱がこもらないため、ケースの内部の温度を低く抑えることができます。また、複数GPUを隣接させても静圧が強いのであまり問題になりません。ただ、風量が少ないため温度が少し高めになってしまうみたいです。あと同じ風量でも少しうるさいです。

三つめはプロペラファンです。内排気の特徴はケース内に素早く熱を逃がすことができ、比較的静かなのでよくゲーミングGPUに搭載されています。1台~2台のGPU程度で、3slot以上の間隔を確保し、ケース内のフローを確保すればあまり問題にはなりませんが、GPUを2スロットで隣接したり、多数のGPUを載せると急激に温度が上がりパフォーマンスが大きく低下してしまいます。

四つ目は水冷です。水冷枕を買って取り付けることで最大限の冷却性能、静音を実現できます。2スロット隣接したり、複数のGPUを差すこともできます。ただし水を使うので設置方法に制約があったり水漏れのリスクがあります。また、定期的に補水などメンテナンスが必要です。

実際に使ってみて

外排気のGPUは、温度が全体的に高めになりますが、おそらく正常だと思います。外気が30度近くでも88度くらいで安定していて、ファンの回転数も60%くらいで推移しています。おそらくslow downの温度設定は90度程度で設定されていると思います。NvidiaのGPUの性質としては温度が高いとクロックはターボの増分が少なくなってしまいます。さらに上がるとslow downの温度設定を上回らないように性能が制限されてしまいます。

消費電力は、TDP250Wなのでその付近を前後しています。温度が少し高いせいか、あまりブーストがかからないので消費電力は抑え目ですが、マルチGPUを使う分にはそこまで問題にはならないと思います

まとめ

GPUの冷却方式についてとマルチGPUのマシンの注意点をまとめました。

結論としてはマルチGPUをするときはなるべく外排気モデルを使いましょう。プロペラファンのモデルの場合はスロットをなるべく離し、ケースのエアフローを考えましょう。

関連記事

PAGE TOP