🔄 Live Migration of GPU‑P Devices – Kompletny przewodnik
1. Co to jest Live Migration GPU‑P?
Live migration GPU‑P to zdolność systemu Windows do przenoszenia wirtualizowanych GPU (GPU‑P), NPU lub akceleratorów w ruchu bez przerywania działania maszyn wirtualnych (VM). Funkcja jest częścią WDDM 3.2, dostępną od wydania Windows 11 24H2, i umożliwia przesunięcie działającej maszyny między hostami z minimalnym downtime ([turn0search0]).
2. Dlaczego to jest ważne?
- Wcześniej migracja GPU w VM była możliwa jedynie przez wyłączenie GPU lub całkowite zatrzymanie VM.
- Teraz zdolność do przenoszenia GPU‑P w trybie live oznacza, że gry, sesje AI lub obciążenia graficzne mogą być kontynuowane przy minimalnym lub nawet zerowym interwencyjnym anulowaniu pracy ([turn0search0], [turn0search3]).
- W środowiskach chmurowych i korporacyjnych daje to korzyści takie jak:
- Redukcja czasu przestoju,
- Stała jakość usług,
- Sprawniejsze zarządzanie zasobami sprzętowymi.
3. Jak działa technicznie?
3.1 Wymagania komponentowe:
- GPU‑P: GPU z partycjonowaniem przez WDDM lub MCDM (SR‑IOV).
- KMD support: kartą jest obsługiwane
Caps.LiveMigrationw strukturze DXGK_GPUPCAPS ([turn0search1]). - WDDM 3.2: Windows 11 24H2 musi rozpoznać live migration przez
DxgkQueryAdapterInfo.
3.2 Proces migracji:
- UMD i KMD współpracują w sekwencji PrepareMigration, zbierając stan sterownika i VRAM.
- Live migration wspiera iteracyjne kopiowanie: przenoszone są dane, przy minimalnym zatrzymaniu GPU‑P ([turn0search6]).
- Dzięki wsparciu Dirty Bit Tracking, przenosi się tylko zmodyfikowane strony VRAM, co redukuje przerwy w działaniu VM ([turn0search2], [turn0search3]).
- Feature wspiera również triage events, ułatwiające diagnozę błędów podczas migracji.
3.3 Typy migracji wspierane:
- Quick migration: żądająca zapis stanu i zakończenie GPU‑P → Restore.
- Live migration: iteracyjne kopiowanie, bez zatrzymania pracy VM, przeniesienie GPU‑P w tle ([turn0search0]).

4. Efekty — korzyści dla użytkowników i wdrożeń
- 🎮 Gaming / Remote GPU: przeniesienie gry między serwerami bez lagi, minimalne opóźnienie („minimizes game interruptions”) ([turn0search3]).
- 🤖 AI / NPU: płynne migracje obciążeń obliczeniowych bez potrzeby restartu lub zatrzymania modeli ([turn0search3], [turn0search2]).
- 🏢 Chmura i wirtualizacja: niższe „brownouty” i „blackouty”, stabilność usług, wydajność zgodna z SLA.
- 💾 Zarządzanie zasobami: hosty mogą być serwisowane bez wpływu na obciążone zadania.
5. Wymagania i konfiguracja środowiskowa
A) Systemy operacyjne:
- Windows 11 24H2, ewentualnie Windows Server 2025 / Hyper‑V wspierający GPU‑P ([turn0search0], [turn0search10]).
B) Sprzęt & sterowniki:
- GPU obsługujące SR‑IOV i GPU‑P (np. enterprise‑grade NVIDIA, AMD), z odpowiednim sterownikiem WHQL/WDDM 3.2.
- BIOS/firmware umożliwiające partycjonowanie GPU‑P.
- KMD z flagą LiveMigration (
Caps.LiveMigration) aktywnie ustawioną ([turn0search1]).
C) Hypervisor (np. Hyper‑V):
- Włączona partycja GPU‑P.
- Zaktualizowane sterowniki na poziomie hosta i gościa.
- Konfigurowalne np. w Hyper‑V Manager lub PowerShell DM cmdletami.
6. Praktyczne kroki migracji
- Przygotuj host źródłowy i docelowy: GPU‑P w partycji, identyczne HW lub z obsługą SR‑IOV.
- Aktywuj live migration: Hyper‑V / Azure / VMware „Live Migrate” z włączonym GPU‑P.
- System inicjuje
PrepareLiveMigration, zbieranie stanu VRAM i device state. - Trigger dirty tracking: KMD oznacza zmienione strony VRAM.
- Iteracyjne kopiowanie: dirty pages przesyłane wielokrotnie.
- Krótki blackout: finalne zsynchronizowanie i „przełączenie” VM.
- VM kontynuuje bez restartu, zachowując przydzielony GPU‑P.
7. Ograniczenia i zagrożenia
- ❌ Starsze GPU lub sterowniki mogą nie wspierać SR‑IOV ani
Caps.LiveMigration. - ⚠️ Hyper‑V ogranicza migrację GPU‑P np. w przypadku NVIDIA Quadro P4000 – wymaga specjalnych sterowników ([turn0search4]).
- ⚙️ Integracja wymaga odpowiedniej konfiguracji BIOS‑U/firmware hosta.
- 🧩 Niewłaściwe wsparcie UMD/DDI może skutkować błędami migracji.
8. Przyszłość i trendy
- Microsoft zapowiada zaawansowane automatyczne migracje GPU w serwerach chmurowych ([turn0search10]).
- Rozwój architektury WDDM 3.x – coraz lepsza integracja z NPU, AI i dynamicznym przydziałem GPU‑P.
- Udoskonalenia funkcji Native Fence Sync, Dirty Bit Tracking, User‑Mode Work Submission – dla lepszej synchronizacji i płynności działania ([turn0search2], [turn0search5]).
✅ Podsumowanie
Live migration GPU‑P devices, wprowadzona w WDDM 3.2 (Windows 11 24H2), to przełom technologiczny w wirtualizacji GPU i NPU. Umożliwia:
- Dynamiczne przenoszenie obciążonych VM-ów bez przerywania pracy,
- Minimalne downtime dzięki Dirty Bit Tracking,
- Zastosowanie zarówno w gamingu, AI, jak i w środowiskach korporacyjnych,
choć wymaga współpracy GPU‑P, sterowników i hypervisora. To technologia, która wyposaża Windows i Hyper‑V w prawdziwe elastyczne zarządzanie zasobami GPU‑P, co jeszcze kilka lat temu było niewyobrażalne.






