資料をダウンロードする () の 20

GenAI データセンターのホワイトスペース技術ソリューションの概要

生成 AI(GenAI)データセンターのホワイトスペース設計には、人工知能や機械学習の使用方法と同じくらい多くのバリエーションがあります。GenAI 環境に最適なソリューションを設計する際には、考慮すべき重要な要素がいくつかあります。データセンターごとにソリューションを完全にカスタマイズすることにより、ネットワークの効率性と途切れのない稼働時間を確保することができます。

ラックの前面

GenAI ラックの処理能力は、標準の高密度 IT ラックの 2 倍にもなります。多くの AI 技術、コンピュータ処理、電力、熱が 1 つの場所に凝縮されているため、ラック内の残りの機器にサーバーと同様の注意を払う必要があります。そうしないと、パフォーマンスと信頼性が低下します。 

アクティブ光ケーブルと直接接続ケーブル

AI アプリケーションでは、送信されるデータの量が急増しています。高速で効率的にデータを送信する上で、アクティブ光ケーブル(AOCs)とダイレクトアタッチ銅ケーブル(DAC)の両方が重要な役割を果たします。AOC は、取り付けが簡単なプラグアンドプレイ技術を提供しています。これにより、コンピュータハードウェアからの電気信号を、工場出荷時に取り付けられた光ファイバーケーブルを介して光信号に変換します。AOC は、最大 100 m の範囲で、最大 400 GB の速度で送信します。データセンター内のラック間で AI サーバーをリンクするのに最適です。 

短距離送信の場合は、銅線 DAC が AOC に代わるコスト効率の高い代替手段となります。多くの場合、同じラック内のサーバーを接続するために使用されます。DAC の利点は遅延がなく、(光トランシーバと比較して)コネクタで生成される熱が少ないことです。これは高密度ラックの重要な考慮事項です。 

 

ファイバーネットワークソリューション

高性能コンピューティングの世界では、変わらないものが 1 つだけあります。それは、データの量は増え続けるため、その需要に正面から取り組まなければならないということです。変化する GenAI 環境に対応できるようデータセンターを適切に準備し、将来のビジネスに備えるためには、ニーズに合った適切なネットワークケーブルを選択する必要があります。ファイバーケーブルを利用することで、大量のデータ処理や GenAI ワークロードのサポートに極めて重要な、遅延を最小限に抑えた高速データ転送が可能になります。端子付きケーブルを使用すると、データセンターのオペレータは設置時の時間を節約し、接続不良を低減できます。モジュール式カセットと高密度パッチパネルを組み合わせた当社のファイバーソリューションは、ラックの設置面積を節約するとともに、物理的な設置を簡素化するため、ビジネスの成長に合わせてネットワークを容易に拡張できます。 

660495303

パッチパネルとブレークアウトカセット

AI ツールに関連付けられたデジタルデータの量の増加に伴い、データへの高速アクセスの需要が高まっており、帯域幅を広げる必要性が出てきています。接続密度、柔軟性、拡張性に加え、既存および新しい高速ネットワーク規格との互換性を最大限に高めるように設計されたモジュール式パッチパネルを利用することで、現在の接続ニーズに対応しながら、将来的に投資することが可能になります。モジュール式パッチパネルソリューションは、ネットワークの計画、導入、アップグレードをサポートし、増大する帯域幅と高速化の需要に対応します。

ブレークアウトカセットは、高密度光ファイバーケーブルを個々のコネクタに分割します。これにより、ネットワークデバイスの管理と接続が容易になるため、狭い場所で複数の接続を行うのに最適です。ネットワークの需要が増えても、新しい設置を行わずに、ブレークアウトカセットをモジュール式パッチパネルに簡単に追加できます。

トランシーバ

 GenAI  の導入の準備を行う際、トランシーバがデータ通信において極めて重要な役割を果たし、高速かつ低レイテンシの接続をサポートします。光通信は銅線ベースのネットワークと比較して、より長い距離間でのより高速な通信速度を実現します。トランシーバをファイバーケーブルと併用することで、AI などのデータ集約型の運用に必要な高帯域幅の通信を提供できます。

SFP トランシーバは、光信号を電気信号に変換する機能を持ち、1GB~400GB に対応しています。これは、マルチソース契約(MSA)規格に準拠した OEM ブランドと互換性があるため、柔軟性に優れ、さまざまなベンダーとの相互運用が可能になります。また、トランシーバは、温度や通信速度などの機能の幅広いデジタル診断モニタリング(DDM)もサポートしているため、ネットワーク内で 24 時間 365 日稼働させることができます。これらのコンポーネントを組み合わせることで、スペースの使用率を最適化し、セキュリティを強化するとともに、現代のデータセンターの需要増加に対応できます。

ネットワークスイッチ

 GenAI を活用する最新のデータセンターでは、サーバー間で、可能な限り遅延を抑えながら、大規模なデータセットを送受信することが求められています。 データセットの増加に伴い、ストレージデバイスの増加が必要になり、ネットワークはますます複雑になっていきます。このような環境の中、複数層のネットワークスイッチを導入することで、中断を最小限に抑えながらデータを目的地に確実に届けることができます。

ネットワークスイッチは、デバイスをローカルエリアネットワーク(LAN)に接続し、サーバーがネットワーク経由で通信できるようにする役目を果たします。ネットワークスイッチを使用することで、データを受信するように指定されたデバイスにのみ送信し、ネットワークの効率と潜在的なスループットを向上させることができます。ローカルネットワークスイッチは、ラック内のデバイスの相互接続をサポートし、マネージドスイッチは、ラック間の通信のための豊富な制御および構成オプションを提供します。マネージドスイッチを使用すると、ネットワークを設定および監視できます。これは、パフォーマンスの最適化や問題のトラブルシューティングに役立ちます。VLAN(仮想LAN)、QoS(サービス品質)、SNMP(簡易ネットワーク管理プロトコル)などの高度な機能により、ネットワークトラフィックの管理と効率的なデータフローの確保が可能になります。

KVM

アプリケーション内のサーバーに応じて、複数の管理オプションがあります。サーバーベンダー独自のリモート管理システムを使用していない場合は、IP 経由の KVM が、ネットワーク経由でローカルおよびリモートでサーバーを監視および管理するために必要なアクセスと可視性を提供します。リモートアクセスができれば、オンサイトでサーバーにアクセスして制御する必要がなくなります。つまりユーザーは、隣の部屋からでも、施設内のどこからでも、または世界中からサーバーを管理できます。ローカルレベルでは、引き出し式 LCD コンソール搭載のモデルに備わるローカルのオンスクリーンディスプレイにより、ラックの利便性を高めることができます。Eaton モデルはブランドに依存せず、あらゆるサーバーの組み合わせを使用してアプリケーションにシームレスに統合できるため、アプリケーションの表示、BIOS およびフルシステムログへのアクセス、ファームウェアのアップロードが可能です。 

image4-kvm-switches.jpg

モジュールアクセス制御システム

データセンターの拡大とサーバーの増加に伴い、機器のセキュリティを確保する必要性と、送信する機密データの重要性がかつてないほど高まっています。GenAI  サーバーが詰め込まれた高密度のラック筐体は、多額の金銭的投資および運用上の投資となるため、そのセキュリティは計画と実装の最重要事項に掲げる必要があります。シンプルでありながら効果的なセキュリティ対策は、 EatonのTANLOCK ドアハンドルです。これにより、IT ラック筐体に最適なモジュールアクセス制御システム(MACS)を提供し、必要なセキュリティを確保します。7 種類の認証技術を備えた TANLOCK  は、PIN パッドアクセス、指紋スキャン、タッチディスプレイ、リモート制御によるリモートアクセスなど、ラックの筐体を効果的に保護するための柔軟なオプションを提供します。 さまざまな設置オプションに加えて、TANLOCK は MS Active Directory、LDAP、RESTful API、Web API、または SNMP を介して、あらゆるシステムにシームレスに統合されるため、独自のダッシュボードを持つユーザーでもそのセキュリティを活用できます。Eaton  の Brightlayer ソフトウェアと併用すると、管理者がリモートで権限を付与できるため、ユーザーは必要に応じてラックにアクセスできるようになります。 

ラックの背面

サーバーラックは、メーカーを問わず、サーバーやスイッチなどのラックマウント型 IT 機器の取り付け、整理、セキュリティ保護を目的として設計されています。また、サーバーラックには、小型デスクトップユニットから大規模なフロアスタンドモデルまで、さまざまなサイズと構成のものがあります。ほとんどのネットワークラックには、効率的なホットアイル/コールドアイル構成をサポートする、前面から背面へのエアーフローが備わります。サーバーメーカーのエアフロー要件を上回ることで、機器の動作の信頼性を高めています。冷却効率を最適化するために、ルーフおよびパネルファンも用意されています。ケーブル管理のための内蔵・アドオンの装備により、散乱を防ぎ、接続精度が向上し、エアフローが最適化されるため、運用効率が向上し、機器の寿命が延びます。汎用性の高いラックは、増え続ける装置の密度と重量に対応します。高度な冷却ソリューションと互換性があると、ラックは狭いスペースでより多くの電力と熱を供給し続けるため、将来のデータセンターにも対応できます。

サーバーラック

従来の IT ラックでは、ラックユニット(U スペース)あたり 100  ポンド(約 45 kg) を超える GenAI サーバーの重量に対応できず、キャビネットの配置やケーブル配線に必要な奥行きも足りていませんでした。Eaton のヘビーデューティ SmartRack  の筐体は、最大 5,000 ポンド(約 2,270 kg)の重量および 44 ~ 54 インチ(約 112 ~ 137 cm)の奥行きをサポートするように設計されており、GenAI サーバーに十分なスペースを提供します。

この新しい GenAI ラックは、冷却水分配ユニット(CDU)およびダイレクトチップ冷却ユニットと互換性があります。背面スペースが広くなっているため、デュアル PDU とデュアル CDU を簡単に取り付けることができるうえ、適切なケーブル曲げ半径と整備性を確保するためのスペースも確保できます。GenAI サーバーは、コンピュータ処理量の増加に伴い、奥行きがこれからも長くなっていくことが予想されるため、奥行きの長いラックに投資することで、スペースの拡大が可能になります。また、このラックは白色であり、光を吸収してサーバーと区別がつかない全体が黒色のラックとは異なり、装置のサービス時やラックへの設置時に、明暗により視認性が高くなります。 

配電ユニット(PDU)

高密度ラックには、ラックマウント PDU からのより多くの電力と機能が必要になります。ここで重要なことは、PDU には、ラック内のすべての機器に電力を供給し、電力要件を満たすための十分な数のコンセントが必要であるとともに、場合によっては最大 46 kW の電力供給能力が求められることです。また、ネットワークに接続されたマネージド PDU を活用すれば、コンセントレベルのリモート監視と接続されたデバイスの制御により、時間を節約し、可視性を高め、オンサイト訪問の必要性を低減することもできます。 

ラック内の PDU を将来にわたって使用するには、それ以上の要件が必要です。柔軟な PDU を導入することで、装置の耐用年数を延ばすことができます。Eaton の PDU G4 プラットフォームには、C14 プラグと C20 プラグの両方に対応する汎用的な C39 コンセントが備わるなど、柔軟性があります。特定のコンセント構成に制限されないようにすることで、ラックのアップグレードや再構成が大幅に容易になります。ユニバーサル入力ラック PDU(UPDU)G4 は、世界中で使用されている業界標準に適合しているため、単一の PDU シャーシをグローバルに調達し、各送信先の電圧および容量要件に応じた幅広い入力ケーブルと組み合わせることができます。Eaton PDU は、世界で製造されており、地域工場の ETO/CTO 対応能力と、ボリューム管理のための拡張容量を備えています。

統合型ギガビットネットワークモジュール(GNM)は、UL 2900-1 および IEC 62443-4-2 のサイバーセキュリティ認証を取得しており、ゼロタッチプロビジョニングにより PDU G4をリモートで管理および監視できます。カスケード接続を使用すると、最大 32 台の PDU でデータセンター内の同じ物理ネットワーク接続を共有できるため、関連するネットワークインフラストラクチャコストを削減できます。カスケード接続された各 PDU には、独自の固有の IP アドレスが割り当てられます。

ネットワーク管理機能の詳細については、ネットワークカードの項を参照してください。

電源コード

電源ケーブルは、C20 および C21 接続を必要とする最新の GenAI 構成を備えた GenAI およびデータセンターのホワイトスペース構成に不可欠なコンポーネントです。GenAI は多くの熱を発生させるため、使用するケーブルは高温用に設計されている必要があります。現在、多くの電源コードには、高温用途向けに設計された C21 コネクタが装備されています。この電源コードは、それぞれの PDU に合わせてさまざまな色と長さでカスタマイズ可能で、設置とメンテナンスにかかる時間を節約しながら、ラック全体の通気性も向上します。ラック内のスペースを節約し、誤って外れないようにするために必要な長さとコードの曲げ半径を考慮することが重要です。これが、カスタマイズ可能なコードが役立つ理由です。

垂直ケーブルマネージャー

垂直ケーブルマネージャーは、Eaton のヘビーデューティ SmartRack 筐体と互換性があります。これにより、ラック内の電源、ネットワーク、およびその他のケーブル配線を整理できます。特に装置を追加すると、対応するケーブル要件が増加します。 

次世代の冷却互換性

高度な冷却は、膨大な電力を必要とする高密度ラックサーバーが搭載された GenAI データセンターに不可欠です。電力が大きいほど、より多くの熱が発生して、繊細な装置に損傷を与える可能性があるため、ダウンタイムを防止するために監視の必要性が高くなります。新しいヘビーデューティ SmartRack 筐体は、冷却分配ユニット(CDU)、ダイレクトチップ冷却、リアドア熱交換器(最大 40 kVA)など、複数の先進的な冷却方法に対応しています。

電力密度の高い環境では、CDU は空気冷却の代わりに液体冷却を使用します。これは、空気よりも液体の方が熱伝導率が高いためです。ダイレクトチップ冷却は、システム内のホットスポットをターゲットにして、主要な熱発生コンポーネントの真上に配置されたコールドプレートを通じてラック全体に液体を循環させます。新しいヘビーデューティ SmartRack 筐体は、ハイパースケールデータセンターで GenAI を有効にする場合でも、中規模データセンターで機械学習をサポートする場合でも、ラックの冷却を特定の用途に合わせてカスタマイズできる複数のオプションを提供します。

重要な注意: CDU は、UPS バッテリーバックアップで保護する必要があります。適切なバックアップがないと、CDU がわずか数秒間停止しただけで GenAI サーバーが故障し、コストのかかるダウンタイムが発生する可能性があります。 

ブランキングパネルとプッシュスルーブラシガード

データセンター内の効率的なエアフローと温度管理を維持するには、ブランキングパネルとプッシュスルーブラシガードが不可欠です。ブランキングパネルは、サーバーラックの空のスペースを埋め、高温の空気が本来の排気エアフローから外れてラックの前面に流れるのを防ぐことで、暖かい空気の再循環を防ぎます。ブランキングパネルを使用すると、冷却コストを削減し、効率を高め、装置の寿命を延長しながら、組織化も促進できます。ブラシガードは、ブランキングパネルに似ていますが、ケーブルだけを通して、周囲の空気を遮断することができます。また、空気の封じ込めに加え、ラックにほこりやごみが侵入したり、重要な機器が損傷したりするのも防ぎます。

サイバーセキュリティネットワーク管理カード

セキュリティネットワーク管理カードを使用して装置を強化すると、IT インフラストラクチャと IT が処理する機密情報のセキュリティが強化されると同時に、リモート監視機能も提供されます。ギガビットネットワークカード(ネットワーク-M3)は、独立機関(UL 2900-1 および IEC 62443-4-2)によるサイバーセキュリティ認証を取得し、ゼロタッチプロビジョニングと Brightlayer Data Centers スイートソフトウェアの統合を実現しています。これにより、IT マネージャーは、UPS システムのギガビットネットワークカードと、ラック PDU G4 の内蔵型ネットワークインターフェースの監視と管理が可能になります。また、正常なシャットダウンや仮想 マシンの再割り当てなど、 電源のイベント中にリモートの自動化アクションを実行して、データを保護し、ビジネス継続性を維持することもできます。REST API サポートにより、組織はネットワークカードをネイティブシステムに簡単に統合し、M2M インタラクションを自動化できるようになります。

環境監視プローブ

AI システムの稼働を維持するために必要な消費電力の増加に伴い、そのすべての電力によって発生する熱を監視するシステムを配置することは不可欠です。 ギガビットネットワークカードと連携して動作する環境監視プローブ(EMP)Gen 2 は、熱、湿度、水/煙のアラームと、ドアの開きを監視し、設定可能なアラートを電子メールで通知します。これは、筐体内に簡単に取り付けて、ラック PDU または UPS ネットワーク カードに接続できます。また、EMP を Eaton の Brightlayer Data Center スイートと組み合わせて使用すると、環境通知を受信し、自動化アクションを設定できます。最大 3 台の EMP をデイジーチェーン接続して、ラック筐体の上部、中央、下部の温度と湿度レベルを監視することもできます。 

データセンターインフラ管理(DCIM)ソフトウェア

データセンターの消費電力が増加し続ける中、必要な情報に必要なときにアクセスできることは、稼働時間を維持し、パフォーマンスを最適化するために不可欠です。Eaton データセンターパフォーマンス管理(DCPM)ソフトウェアのデータセンターインフラ管理(DCIM)機能を使用すると、スタッフと業務の大幅な効率化を実現できます。Web ベースの直感的なユーザーインターフェイス(UI)により、エントリポイントから IT デバイスの電源に至るまでのエンドツーエンドの電力チェーンを監視および管理できます。これにより、資産の場所、保証、サービス履歴、環境条件の追跡、トレンドや異常に関するリアルタイムデータおよび履歴データの表示、予期しない問題が発生した場合のカスタマイズされたアラートの受信が可能になります。

しかし、DCPM は従来の DCIM にとどまらず、データセンターのパフォーマンスを次レベルに引き上げるためのツール、レポート、視覚化機能を備えています。これを使用することで、温度と湿度、電力使用率、重要な電力チェーンなどについて、ユーザー定義の 2D および 3D デジタルツイン表現を構築できるため、迫り来る問題を事前に特定して、予期しないダウンタイムを軽減できます。また、90 種類以上の標準レポートにアクセスできるほか、ユーザー定義レポートツールや柔軟な可視化に対応したビジネスインテリジェンスダッシュボード(オプション)も利用できます。さらに、電力使用効率(PUE)や容量使用率などの主要パフォーマンス指標にもすばやくアクセスできるため、持続可能性の指標を追跡し、データセンターが期待どおりに稼働しているかを確認できます。

DCPM は、Eaton のエネルギーパフォーマンス管理システム(EPMS)ソフトウェアと併用することで、資産管理、IT およびオペレーショナルテクノロジー(OT)デバイス監視、電力品質指標、高度な電気監視を 1 つのアプリケーションに統合できます。これにより、お客様は 1 つの UI で単一のネイティブアプリケーションを活用して、メーカーに関係なく、さまざまなインフラストラクチャ資産を管理、監視、制御できるようになると同時に、他のソフトウェアとのシームレスな統合を実現したり、ニーズの拡大に合わせてソフトウェア機能を簡単に拡張したりできるようになります。EPMS を追加することで、データセンターの電力システムをリアルタイムおよび履歴で可視化できるため、予期しない問題の根本原因を迅速に特定・解決したり、施設での水・空気・ガス・電気・蒸気(WAGES)の使用状況を把握して運用コストを削減したり、持続可能性目標を達成したりできます。

DCPM や EPMS を建物管理システム(BMS)に統合すると、デバイス固有の包括的なレポートおよびインサイトにアクセスできます。この情報を得ることで、予期しないイベントへの迅速な対応が可能になり、データセンター全体の効率性と電力使用量管理機能が向上します。 

Eaton の設計エンジニアチームは、ソフトウェアに加え、最高のサービスとケアを優先事項にしており、当社のソフトウェアが、他社製の資産も含めた、お客様のデータセンターの既存の製品やシステムとシームレスに統合されるようにしています。 

Eaton DCPM 3D visualization tool
Eaton DCPM Battery health dashbaord

ラックの外側

コンピュータ処理はラック内で行われますが、データはラックの最上部に達しても停止しません。ラックの周囲(特に後上部)で行われるすべてのことは、データセンターの運用に影響を与えます。 

封じ込めおよび搬送システム

データセンター設計の今までのトレンドでは、ケーブル搬送システムと、温風/冷風封じ込めシステムは別物とされてきました。しかし、ハイパースケールの  GenAI  データセンターでは、封じ込めと搬送が 1 つのシステムで行われています。

Eaton の構造スチール独立保持 システム(ICS)などのホットアイルコンテインメント(HAC)システムは、ケーブル搬送用のカンチレバーまたはトラピーズアームを統合しており、一般的になりつつあります。床下配線システムは、配線が乱雑になりがちでした。GenAI アプリケーションでは、床面の重量が増加するとともに、テクノロジーが変化したり、環境の拡張が必要になったりした場合にケーブルを再構成する必要があるため、床下配線はもはや理想的ではありません。床置き型または天井取り付け型の HAC システムは、キャビネットマウントシステムよりも迅速に導入できます。また、時間のかかる取り外し作業や現場でのカスタマイズを行わずに、キャビネットの交換が簡単に行えるため、将来的な拡張の余地も生まれ、変化に対応できます。 

床置き型 HAC の垂直面にある鋼構造に直接取り付けているのは、カンチレバーアームです。一方、天井取り付け型アルミニウム製 HAC では、トラピーズアームが天井から吊り下げられますが、HAC には直接取り付けられません。これらのアームは、長さ、高さ、サポートバーの数をカスタマイズでき、すべてのケーブル搬送システムを支える役割を果たします。ファイバールーティングトレイとワイヤーメッシュバスケットは、これらのアームに直接取り付けられるため、床下配線よりも設置とメンテナンスが容易です。これらのアームはバスウェイを支持することもできます。バスウェイは通常、ラックに最も近い最下層のアームに配置されます。

 RapidPod  HAC システムでは、ラック背面からの熱風が通気孔のある天井まで送られます。パネルの温度制御が改善されるため、側面を通る温度移動が少なくなり、冷却システムの効率維持に役立ちます。GenAI のような高密度コンピューティング環境では、熱の量が消費電力とともに増加しているため、高温の空気を機器から離して効果的に封じ込め、換気することが最重要課題となってます。 

Data center inside hot aisle containment EORDs

バスウェイ

ラック内の装置に供給するのに十分な電力を供給することは、バスウェイ製品だけでは処理できない大きな仕事です。Eaton Powerwave 2 などのトラックバスは、ホワイトスペース用途に適しています。これを使用すると、最終フィードとタップオフボックスで請求グレードの正確な測定をして、電力使用量を完全に可視化し、通路全体の消費電力と各ラック内の接続装置を確認できます。ラック内の管理されたラックマウント PDU に接続すると、あらゆるレベルの電力使用量をエンドツーエンドで可視化でき、即時のアラートと迅速な問題対応が可能になります。 

エンドオブローおよびファシリティ UPS システム

GenAI データセンターは、標準的なデータセンターの最大 2 倍の電力を必要とするため、このような環境に導入された UPS システムには、そのペースに対応できる能力が求められます。

UPS は一般的にはグレースペースに設置されますが、一部の AI アプリケーションでは、ネットワーキング機器と一緒にホワイトスペースに設置する場合があります。この場合、Eaton 93PM などのエンドオブロー UPS が優れた選択肢となります。この床置き型三相 UPS は、標準の IT ラックと同じ床面積に収まり、床置き型または天井取り付け型の HAC システムに簡単に統合でき、最大 400 kW まで対応できます。93PM はリチウムイオン電池と互換性があり、並列バッテリーキャビネットに配置できます。リチウムイオン電池は、設置面積が小さく、充電時間が短く、交換前の放電限界が高いため、GenAI データセンターに最適です。従来の VRLA バッテリーよりも、貴重な設置面積を節約することができるため、より多くのネットワーキング機器を収納することが可能になります。

グレースペース内のファシリティ電源用には、Eaton 9395XC UPS などの大型 UPS が最適です。この一体型 UPS は、最大1500 kW まで対応可能で、市場で最小の設置面積と最高クラスの電力密度を実現しているため、グレースペースの効率を最大限に高めるのに最適です。また、この UPS はリチウムイオンバッテリーにも対応しており、スペース効率の高い設計にさらに貢献しています。 

GenAI ホワイトスペースについてご質問がありますか?

当社の専門家のエンジニアが、ベストプラクティスやデータセンターの詳細についての質問にお答えします。