|
🔥 Fame PyTorch ROCm Build Notes |
|
Stand: April 2025 |
|
|
|
📦 Umgebung |
|
|
|
Komponente Version |
|
Betriebssystem Ubuntu 24.10 (6.11 Kernel) |
|
Python 3.12.7 (venv: rocm_env) |
|
Compiler gcc/g++ 14.2.0 |
|
CMake 4.0.0 |
|
Ninja installed (lokal via pip) |
|
ROCm 6.2 Nightly (gfx1100 support) |
|
micro als Editor (micro) |
|
🔥 Relevante Einstellungen |
|
|
|
Variable Wert |
|
USE_ROCM 1 (aktiviert) |
|
USE_CUDA 0 (deaktiviert) |
|
CMAKE_ARGS -DROCM_ARCH=gfx1100 |
|
USE_NUMPY 1 (aktiviert) |
|
USE_NCCL 0 (abgeschaltet, no clone) |
|
USE_MKL 0 (no Intel MKL) |
|
USE_BLAS 0 (Fallback Eigen) |
|
USE_OPENMP 1 (aktiv) |
|
USE_MPI 0 (kein MPI) |
|
USE_MAGMA 0 (kein MAGMA) |
|
🔨 Submodule Handling |
|
Submodules nicht vollständig geclont (manuelle Rescue: SSH Clone von wichtigsten Modulen). |
|
|
|
Einige Submodules wurden bewusst ignoriert (DCGM, civetweb, manche TensorPipe-Tiefmodule). |
|
|
|
Keine Abhängigkeit mehr von rekursivem HTTPS/SSH Git beim Build. |
|
|
|
PeachPy Submodule (NNPACK) braucht six (manuell installiert: pip install six). |
|
|
|
🗃️ Probleme, die gefixt wurden |
|
|
|
Problem Lösung |
|
Git Submodule SSH/HTTPS-Konflikte Global Patch auf git@github.com: |
|
NCCL Zwangs-Clone checkout_nccl() Funktion disabled |
|
PeachPy Dependency (six) fehlt pip install six |
|
BLAS fallback auf Eigen automatisch von Build erkannt |
|
📌 Tarballs / Snapshots |
|
|
|
Backup Status |
|
fame-pytorch-full-backup.tar.gz Erstellt |
|
🏁 Status |
|
python setup.py bdist_wheel läuft aktiv. |
|
|
|
Erwartete Build-Dauer: 60–120 Minuten (abhängig von CPU/GPU). |
|
|
|
Wheel wird erzeugt: |
|
/home/horscht/build-fame-pytorch/pytorch/dist/torch-2.8.0a0+gitc402b3b-*.whl |
|
|