🏎️ User‑Mode Work Submission – Głęboka analiza
1. Definicja i rola
User‑Mode Work Submission to mechanizm umożliwiający aplikacjom (poprzez User‑Mode Display Driver – UMD) bezpośrednie przekazywanie zadań do GPU, bez angażowania Kernel‑Mode Display Driver (KMD) na poziomie podstawowej operacji. Ta ścieżka ułatwia szybki transfer niewielkich bloków pracy, zmniejszając latencję i obciążenie sterownika jądra oraz CPU.
2. Dlaczego to ważne?
- Niższa latencja: Przyspieszone przesyłanie małych zadań, kluczowe np. w edycji wideo, symulacjach lub AI, zapewnia responsywność .
- Wydajność w kontenerach i VM: Zredukowany overhead kernel‑mode sprawia, że aplikacje uruchamiane w maszynach wirtualnych mogą działać sprawniej, nawet bez context-switchów sporów z CPU.
- Lepsze wykorzystanie GPU: Konstrukcja „doorbells” pozwala określić, które zadania wymagają powiadomienia jądra, co pozwala sterownikowi znajdować się w efektywnych stanach bez zbędnych przerwań.
3. Techniczne szczegóły
a) Doorbell system
Mechanizm „GPU doorbells” powiadamia GPU o nowych zadaniach. Są dwa typy:
- Global Doorbells – jedna wspólna sygnalizacja dla wszystkich zadań.
- Dedicated Doorbells – dedykowane per kolejka, co umożliwia bardziej precyzyjne powiadamianie GPU.
b) Powiadomienie KMD (Knotify)
W specyficznych scenariuszach (np. priorytet rzeczywisty), UMD po zapisie komendy może wywołać funkcję D3DKMTNotifyWorkSubmission, co pozwala KMD na reakcje, jak przełączenie runlisty GPU.
c) Integracja z Engine State Management
Po otrzymaniu zadania GPU może dynamicznie przełączyć stan mocy (high‑Power / low‑Power), co minimalizuje opóźnienia i redukuje zużycie energii .

4. Korzyści praktyczne
- Edycja wideo i rendering – mniejsze opóźnienia przy przesyłaniu kolejnych fragmentów (frame chunków). Aplikacje są bardziej responsywne .
- Gry i AI – częste, niewielkie zadania GPU mają priorytet, co poprawia płynność i czas reakcji.
- Virtualizacja – UMD może szybciej przekazywać prace z maszyny gościnnej do hosta, a GPU reaguje bezpośrednio.
- Ekonomia energii – GPU i CPU unikają zbędnych stanów przejściowych, co oszczędza energię .
5. Wymagania konfiguracji
✅ System i sterowniki
- Windows 11 z aktualizacją 24H2 (WDDM 3.2).
- Sterowniki GPU z obsługą natywnego work submission – np. NVIDIA ≥555.41, AMD lub Intel driverzy kompatybilni z WDDM 3.2.
✅ API i KMD
- Użycie
D3DKMTCreateDoorbellz odpowiednimi flagami. - Wskazanie powiadomień przez
D3DKMTNotifyWorkSubmission– ukierunkowane na specyficzne kolejki.
✅ Aplikacje i kontenery
- Muszą być dostosowane do pracy z krótkimi zadaniami GPU i obsługi modelu doorbells, co zapewnia najlepiej kompatybilne środowisko GPU.
6. Przykłady wdrożeń i opinie
- Windows Latest: potwierdzenie opóźnień w edycji wideo i AI, wraz z technical overview WDDM 3.2.
- WindowsForum: potwierdzają krótsze latency, lepsze wykorzystanie GPU, zwłaszcza w wirtualizacji.
- Reddit / r/nvidia: działanie zaczynające się od sterowników 555.41+ – potwierdzenie, że implementacja jest stabilna i działa w grach/testach.
7. Ograniczenia i wyzwania
- Funkcja wciąż w fazie rozwoju: dostępna od 24H2, ale wymaga poprawnej implementacji w UMD i KMD oraz zoptymalizowanych aplikacji.
- Wymagana współpraca użytkownik‑driver‑aplikacja: bez aktualizacji sterowników i dołączenia do UMD–doorbell mechanizmu, feature nie działa.
- Złożoność synchronizacji: w przypadkach rzeczywistego priorytetu konieczne są dodatkowe wywołania powiadomień, co może przekroczyć zysk wydajnościowy.
8. Przyszłość – co dalej?
- Pełna adopcja w D3D12 Agility SDK – łatwiejsza implementacja dla deweloperów.
- Integracja z Work Graphs & Native Fences – wspólna ścieżka do modelu GPU‑centric.
- Optymalizacje w wirtualizacji GPU/NPU – umożliwiające lepsze działanie Copilot+ i AI‑akceleratorów.
- Uproszczenie synchronizacji między silnikami GPU – mniejsza liczba przerwań CPU i bardziej równoległa praca.
🔚 Podsumowanie
User‑Mode Work Submission to przełomowa funkcja WDDM 3.2, umożliwiająca aplikacjom efektywną i szybą komunikację z GPU:
- skracając latencję pracy,
- redukując CPU involvement,
- optymalizując działanie w VM, edycji wideo i AI,
- a także pozwalając GPU oszczędzać energię i pracować bardziej równocześnie.
Aby w pełni wykorzystać tę technologię, potrzebujesz: Windows 11 24H2, aktualnych sterowników GPU (NVIDIA 555.x+, AMD, Intel) i wsparcia aplikacji. To fundament dla CPU‑free pipelines, przyszłościowego gamingu, AI i profesjonalnych zastosowań GPU.






