4-bitowa kwantyzacja tensorflow

Co to jest trening Qat?
Co to jest kwantyzacja int8?
Czy kwantyzacja zmniejsza rozmiar modelu?

Co to jest trening Qat?

Szkolenie kwantyzacji świadomości (QAT) Szkolenie świadomości kwantyzacji ma na celu obliczenie czynników skali podczas treningu. Po pełnym przeszkoleniu sieci węzły kwantyze (q) i dequantize (DQ) są wstawiane do wykresu zgodnie z określonym zestawem reguł.

Co to jest kwantyzacja int8?

Możliwość obniżenia precyzji modelu od FP32 do INT8 jest wbudowana w zastosowanie DL Workbench. Proces ten nazywa się kwantyzacją i doskonałą praktyką jest przyspieszenie wydajności niektórych modeli na sprzęcie, które obsługują INT8.

Czy kwantyzacja zmniejsza rozmiar modelu?

Kwantyzacja może zmniejszyć wielkość modelu we wszystkich tych przypadkach, potencjalnie kosztem pewnej dokładności. Przycinanie i grupowanie może zmniejszyć rozmiar modelu do pobrania, dzięki czemu jest łatwiejszy.