GPU Compute Engineer
Kategori: Low-level & domain-heavy
Memprogram GPU untuk workload general-purpose โ ML training, simulasi sains, dan data processing โ memeras throughput maksimal dari hardware paralel.
Sehari-hari
Menulis kernel CUDA atau ROCm, melakukan profiling memory bandwidth dan compute utilization, mengoptimalkan data layout untuk coalesced access, serta mengintegrasikan GPU kernel ke training framework.
Skill inti
- CUDA/ROCm
- GPU architecture
- kernel optimization
- parallel algorithms
- C++