fame-pytorch-kit / PyTorch_ROCm_Build_Notes.md
sbeierle's picture
Upload folder using huggingface_hub
5ba1de3 verified
🔥 Fame PyTorch ROCm Build Notes
Stand: April 2025
📦 Umgebung
Komponente Version
Betriebssystem Ubuntu 24.10 (6.11 Kernel)
Python 3.12.7 (venv: rocm_env)
Compiler gcc/g++ 14.2.0
CMake 4.0.0
Ninja installed (lokal via pip)
ROCm 6.2 Nightly (gfx1100 support)
micro als Editor (micro)
🔥 Relevante Einstellungen
Variable Wert
USE_ROCM 1 (aktiviert)
USE_CUDA 0 (deaktiviert)
CMAKE_ARGS -DROCM_ARCH=gfx1100
USE_NUMPY 1 (aktiviert)
USE_NCCL 0 (abgeschaltet, no clone)
USE_MKL 0 (no Intel MKL)
USE_BLAS 0 (Fallback Eigen)
USE_OPENMP 1 (aktiv)
USE_MPI 0 (kein MPI)
USE_MAGMA 0 (kein MAGMA)
🔨 Submodule Handling
Submodules nicht vollständig geclont (manuelle Rescue: SSH Clone von wichtigsten Modulen).
Einige Submodules wurden bewusst ignoriert (DCGM, civetweb, manche TensorPipe-Tiefmodule).
Keine Abhängigkeit mehr von rekursivem HTTPS/SSH Git beim Build.
PeachPy Submodule (NNPACK) braucht six (manuell installiert: pip install six).
🗃️ Probleme, die gefixt wurden
Problem Lösung
Git Submodule SSH/HTTPS-Konflikte Global Patch auf git@github.com:
NCCL Zwangs-Clone checkout_nccl() Funktion disabled
PeachPy Dependency (six) fehlt pip install six
BLAS fallback auf Eigen automatisch von Build erkannt
📌 Tarballs / Snapshots
Backup Status
fame-pytorch-full-backup.tar.gz Erstellt
🏁 Status
python setup.py bdist_wheel läuft aktiv.
Erwartete Build-Dauer: 60–120 Minuten (abhängig von CPU/GPU).
Wheel wird erzeugt:
/home/horscht/build-fame-pytorch/pytorch/dist/torch-2.8.0a0+gitc402b3b-*.whl