Retiring — and shredding — the Alpine storage system
ORNL スタッフは、研究所の次の世界をリードするスーパーコンピューターの構築に備えて、アルパインの高性能ストレージ システムに属する 32,000 台以上のハードドライブを取り外し、リサイクルしました。クレジット: Angela Gosnell/ORNL、米国エネルギー省

大規模なスーパーコンピューティング システムが引退したらどうなるか考えたことはありますか?驚いたことに、データに関しては、古い文書を処分するのとあまり変わりません。そのままシュレッダーにかけ、リサイクルに回します。

エネルギー省のオークリッジ国立研究所にある、かつては世界最強だったサミット スーパーコンピューターは、2023 年末に、同研究所の次の世界トップクラスのスーパーコンピューターの構築に備えて廃止および解体される予定でした。しかし、この機械の多大な生産性により、Summit を 2024 年まで運用し続けることが決定されました。

ただし、SummitPLUS プログラムによる追加の割り当てでは、故障した古い高性能ストレージ システム Alpine を Alpine2 に置き換える必要がありました。乗組員は夏の間、アルパインの貯蔵システムの解体を開始した。

「サミットは超新星や核融合炉に関する大規模なシミュレーションを実行するために設計された」とORNL国立計算科学センターのインフラ運用グループリーダー、ポール・アブストン氏は語る。「Amazon、Google、Microsoft 以外に、当社よりも多くのハードドライブを備えている場所を見つけるのは難しいでしょう。したがって、Alpine を分解するのは大仕事であり、もちろん安全性とセキュリティが第一です。」

2018 年に発売された Summit スーパーコンピューターは、現在、世界で最も強力なスーパーコンピューターの TOP500 リストで第 9 位にランクされています。Alpine は、DOE 科学省のユーザー施設である Oak Ridge Leadership Computing Facility によって管理されている IBM Spectrum Scale 並列ファイル システムであり、Summit や、​​事前のコンピューティング クラスターである Andes を含むその他のサポート システムからのデータを一時的に保存するために使用されます。Summit シミュレーション データの後処理。

Alpine システムは、約 1,400 平方フィートの床面積を占める 40 台のキャビネットで構成されています。Alpine の 250 ペタバイトのディスク領域は、32,494 台のハード ドライブによって提供されます。各ドライブは長さ約 6 インチ、幅 4 インチで、重さは 1 ポンドを少し超えます。

「これら 32,000 個を超えるドライブは、一度に 1 つずつ手作業で物理的に取り外さなければなりません。これは、約 20 トンのハードウェアを処理しなければならないことになります」とアブストン氏は述べています。

ハードドライブに残っているデータを確実に保護するために、ハードドライブはキャビネットから取り出された後、施錠された箱に置かれ、物理的に破壊される安全な場所に運ばれます。そこでシュレッダーの出番です。

「ウッドチッパーによく似ていますね」

このシュレッダーは、テネシー州東部の中小企業であるシュレッドプロ セキュアによって供給および運営されており、幅約 4 フィート、腰の高さの可動式ユニットです。ハードドライブは技術者によって機械の上部にある開口部に送り込まれ、そこで逆回転する金属の歯がドライブを引き裂き、サイズが数インチの小さな不規則なストリップに縮小します。このモバイル シュレッダーは、10 秒ごとに 1 台のハード ドライブを細断でき、理論上は 1 日に最大 3,500 台のハード ドライブを処理できます。

「これはウッドチッパーによく似ています。シュレッダーの歯がドライブを細かく引き裂き、機能するドライブに再構築することが不可能になります」とアブストン氏は語った。「たとえ私たちが機密データを扱っていなくても、データは依然としてユーザーのものであり、私たちにはそれが確実に保護されるようにする責任があります。」

ドライブが細断された後、ベルトコンベアが材料を集めてゴミ箱に廃棄物を置き、その後、より大きなコンテナに移されて、ORNL の金属リサイクル プログラムを通じてリサイクルされます。

「私たちがリサイクルした金属はすべて、そのお金がオークリッジ国立研究所の予算に直接返還されます。つまり、これは環境に優しいアプローチであるだけでなく、予算にも優しいのです」とアブストン氏は語った。

貯蓄を継承する

主要なコンピューティング システムの廃止は、アブストンと彼のチームが長年にわたって洗練してきた進化するプロセスです。

Alpine のようなシステムを最後に廃止したのは、2019 年の Atlas ストレージ システムでした。約 20,000 台のハード ドライブを備えた Atlas の規模は、Alpine の約 3 分の 2 でした。いずれにせよ、すべてを社内で行うには、チームが仕事を完了するまでに 9 か月かかり、コストも大幅に高かったとアブストン氏は回想しました。

外部ベンダーと協力することで、チームは追加のドライブを処理できるようになりました。Alpine を超え、作業負荷が約 10,000 ハードドライブ増加します。その結果、以前は 9 か月かかったタスクを 2 か月以内に 2 倍の作業量で完了し、コストも大幅に削減されました。

さらに、その経験がもたらしたのは、研究室は、将来のプロジェクトで使用するために独自のシュレッダーを購入する必要があります。これにより、ORNL はさらに節約し、データのセキュリティを向上させることができます。

「私たちの施設で現場で破砕するということは、長期的にははるかに安価な処理をして納税者のお金を節約することを意味する」とアブストン氏は語った。

以前に Alpine に保存されていたユーザー データは、他の OLCF ストレージ システムに転送されました。Summit は 2024 年 11 月 1 日まで運用を継続します。11 月 19 日に、Alpine2 は Summit に対して読み取り専用に切り替えられ、その後、他の OLCF データ機能をサポートするニアライン ストレージ システムに再構成されます。

引用:国立研究所が大規模なコンピューティング リソースをどのように廃止し、細断するか (2024 年 9 月 19 日)2024 年 9 月 20 日に取得https://techxplore.com/news/2024-09-national-lab-shreds-large-resources.html より

この文書は著作権の対象です。個人的な研究や研究を目的とした公正な取引を除き、書面による許可なく一部を複製することができます。コンテンツは情報提供のみを目的として提供されています。