VMware Aria Operations, sanal ve fiziksel altyapıların performans, kapasite ve sağlık durumlarını merkezi olarak izlemek ve analiz etmek için kullanılan gelişmiş bir operasyonel yönetim platformudur.

Özellikle vSphere, GPU destekli hostlar, AI/ML iş yükleri ve özel bulut (Private Cloud) ortamlarında, kaynakların verimli kullanılması ve olası sorunların önceden tespit edilmesi açısından kritik bir rol oynar.

VMware Aria Operations 8.18 sürümü ile birlikte, GPU ve Private AI iş yükleri için hazır gelen dashboard’lar sayesinde GPU izleme artık çok daha görünür ve yönetilebilir hale gelmiştir.

Resim-1

Private AI (GPU) dashboard’ları, özellikle AI/ML, GPU hızlandırmalı uygulamalar ve yüksek performans gerektiren iş yükleri için aşağıdaki konularda görünürlük sağlar:

GPU compute (işlem) kullanımı

GPU bellek (memory) kullanımı

Cluster, host ve GPU bazında detaylı analiz

Atıl (idle) veya düşük kullanılan GPU’ların tespiti

Aşırı ısınan veya anormal davranış gösteren GPU’ların belirlenmesi

Bu sayede hem operasyonel sorunlar hızlıca tespit edilir hem de kapasite planlama daha sağlıklı yapılır.

 

🔹 GPU Equipped Clusters

Bu dashboard, GPU bulunan cluster’lar için genel bir bakış sunar.

Sağladığı bilgiler:

Cluster seviyesinde GPU kullanım oranları

Host bazında GPU compute ve bellek kullanımı

Fiziksel GPU’ların genel durumu

Özellikle GPU dağılımının doğru yapılıp yapılmadığını görmek için idealdir.

🔹 GPU Overview

GPU Overview dashboard’u, ortam genelindeki GPU’ların sağlık ve kullanım durumunu özetler.

Bu dashboard ile:

Yüksek sıcaklığa sahip GPU’lar

Düşük veya sıfıra yakın kullanılan GPU’lar

Compute ve bellek bazlı kapasite analizleri

tek bir ekranda görüntülenebilir.

VMware Aria Operations 8.18 ile gelen Private AI (GPU) dashboard’ları, GPU tabanlı altyapıların yönetimini büyük ölçüde kolaylaştırmaktadır.