Add API for quantization-aware training in dygraph mode #49398

wanghaoshuang · 2022-12-28T07:57:17Z

PR types

Others

PR changes

APIs

Describe

Add API for quantization-aware training in dygraph mode

Expose an API named paddle.quantization.QAT
Define a wrapper class to insert quanters into model for QAT
Add QuantedConv2D and QuantedLinear
Add some functions in QuantConfig for QAT
Add unittest for QAT

如下图所示，本PR主要新增三个模块：Wrapper、QuantedLayers（包括QuantedConv2D、QquantedLinear）、QAT

Wrapper

装饰器，将任意Layer和Quanter/Observer包装成一个Layer。

QuantedLayers

与Wrapper类似，装饰器类，用于在Layer前插入Observer/Qaunter. Wrapper针对无权重Layer，QuantedLayers针对带权重的特定Layer，比如QuantedConv2D.

QAT

类图

时序图

示例

以下示例来自paddle/tests/quantization/test_qat.py
原始模型

Model(
  (features): Sequential(
    (0): Conv2D(3, 6, kernel_size=[3, 3], padding=1, data_format=NCHW)
    (1): ReLU()
    (2): MaxPool2D(kernel_size=2, stride=2, padding=0)
    (3): Conv2D(6, 16, kernel_size=[5, 5], data_format=NCHW)
    (4): ReLU()
    (5): MaxPool2D(kernel_size=2, stride=2, padding=0)
  )
  (fc): Sequential(
    (0): Linear(in_features=576, out_features=120, dtype=float32)
    (1): Linear(in_features=120, out_features=84, dtype=float32)
    (2): Linear(in_features=84, out_features=10, dtype=float32)
  )
)

调用qat.quantize(mdoel)之后的模型：

Model(
  (features): Sequential(
    (0): QuantedConv2D(
      (weight_quanter): FakeQuanterWithAbsMaxObserverLayer()
      (activation_quanter): FakeQuanterWithAbsMaxObserverLayer()
    )
    (1): ObserveWrapper(
      (_observer): FakeQuanterWithAbsMaxObserverLayer()
      (_observed): ReLU()
    )
    (2): ObserveWrapper(
      (_observer): FakeQuanterWithAbsMaxObserverLayer()
      (_observed): MaxPool2D(kernel_size=2, stride=2, padding=0)
    )
    (3): QuantedConv2D(
      (weight_quanter): FakeQuanterWithAbsMaxObserverLayer()
      (activation_quanter): FakeQuanterWithAbsMaxObserverLayer()
    )
    (4): ObserveWrapper(
      (_observer): FakeQuanterWithAbsMaxObserverLayer()
      (_observed): ReLU()
    )
    (5): ObserveWrapper(
      (_observer): FakeQuanterWithAbsMaxObserverLayer()
      (_observed): MaxPool2D(kernel_size=2, stride=2, padding=0)
    )
  )
  (fc): Sequential(
    (0): QuantedLinear(
      (weight_quanter): FakeQuanterWithAbsMaxObserverLayer()
      (activation_quanter): FakeQuanterWithAbsMaxObserverLayer()
    )
    (1): QuantedLinear(
      (weight_quanter): FakeQuanterWithAbsMaxObserverLayer()
      (activation_quanter): FakeQuanterWithAbsMaxObserverLayer()
    )
    (2): QuantedLinear(
      (weight_quanter): FakeQuanterWithAbsMaxObserverLayer()
      (activation_quanter): FakeQuanterWithAbsMaxObserverLayer()
    )
  )
)

1. Expose an API named paddle.quantization.QAT 2. Define a wrapper class to insert quanters into model for QAT 3. Add some functions in QuantConfig for QAT 4. Add unittest for QAT

paddle-bot · 2022-12-28T07:57:21Z

你的PR提交成功，感谢你对开源项目的贡献!
请关注后续CI自动化测试结果，详情请参考Paddle-CI手册。
Your PR has been submitted. Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

yghstill

LGTM

risemeup1

LGTM

zhangbo9674

LGTM

chenwhql

LGTM for setup.py.in

Add tools for quantization-aware training

438aa0b

1. Expose an API named paddle.quantization.QAT 2. Define a wrapper class to insert quanters into model for QAT 3. Add some functions in QuantConfig for QAT 4. Add unittest for QAT

Add QuantedConv2D and QuantedLinear for QAT

1b4453f

wanghaoshuang requested review from yghstill, ceci3, minghaoBD, qingqing01 and RachelXu7 December 28, 2022 08:40

Add paddle.nn.quant.qat to setup.py

87f4e92

yghstill approved these changes Jan 3, 2023

View reviewed changes

qingqing01 approved these changes Jan 10, 2023

View reviewed changes

risemeup1 approved these changes Jan 11, 2023

View reviewed changes

zhangbo9674 approved these changes Jan 11, 2023

View reviewed changes

chenwhql approved these changes Jan 11, 2023

View reviewed changes

wanghaoshuang requested a review from Ligoml January 11, 2023 08:03

dingjiaweiww approved these changes Jan 11, 2023

View reviewed changes

wanghaoshuang closed this Jan 11, 2023

wanghaoshuang reopened this Jan 11, 2023

wanghaoshuang merged commit b53888e into PaddlePaddle:develop Jan 11, 2023

wanghaoshuang deleted the qat branch January 12, 2023 10:51

This was referenced Feb 1, 2023

Add Post-Training Quantization and export function in dygraph mode #50107

Merged

[prototype] Refine the API of quantization for dygraph #47530

Closed

wanghaoshuang mentioned this pull request Feb 14, 2023

Add stub class for quantization #50510

Merged

5 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add API for quantization-aware training in dygraph mode #49398

Add API for quantization-aware training in dygraph mode #49398

wanghaoshuang commented Dec 28, 2022 •

edited

Loading

paddle-bot bot commented Dec 28, 2022

yghstill left a comment

risemeup1 left a comment

zhangbo9674 left a comment

chenwhql left a comment

Add API for quantization-aware training in dygraph mode #49398

Add API for quantization-aware training in dygraph mode #49398

Conversation

wanghaoshuang commented Dec 28, 2022 • edited Loading

PR types

PR changes

Describe

Wrapper

QuantedLayers

QAT

示例

paddle-bot bot commented Dec 28, 2022

yghstill left a comment

Choose a reason for hiding this comment

risemeup1 left a comment

Choose a reason for hiding this comment

zhangbo9674 left a comment

Choose a reason for hiding this comment

chenwhql left a comment

Choose a reason for hiding this comment

wanghaoshuang commented Dec 28, 2022 •

edited

Loading