add lamb optimizer and unittest #28772

bjjwwang · 2020-11-20T07:42:40Z

PR types

Function optimization

PR changes

APIs

Describe

迁移lamb优化器到paddle 2.0，增加lamb单测

原来API paddle.fluid.optimizer.lamb

paddle.fluid.optimizer.Lamb(learning_rate=0.001, lamb_weight_decay=0.01,beta1=0.9,beta2=0.999,epsilon=1e-6,parameter_list=None,regularization=None,grad_clip=None,exclude_from_weight_decay_fn=None,name=None):

迁移到了

paddle.optimizer.Lamb(learning_rate=0.001, lamb_weight_decay=0.01,  beta1=0.9, beta2=0.999,  epsilon=1e-6, parameters=None, grad_clip=None, exclude_from_weight_decay_fn=None, name=None):

迁移原因：属于2.0 优化器迁移项目，实现了新的Optimizer基类和LRScheduler，因此需要迁移API。
具体变化：包括像parameter_list->parameters等参数命名的变化。
使用方式：使用方式没有变化，但由于lamb自带lamb_weight_decay 参数，因此基类的weight_decay(Regularization)被禁止使用，用户只需指定lamb_weight_decay即可。

是否造成代码容余？我个人认为paddle.optimizer.Lamb最终肯定要取代fluid API，但目前应该是Python端有两处实现，C++公用一套。

paddle-bot-old · 2020-11-20T07:42:45Z

Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

lanxianghit · 2020-11-23T03:33:55Z

python/paddle/optimizer/lamb.py

+            def exclude_fn(param):
+                return param.name.endswith('.b_0')
+
+            optimizer = fluid.optimizer.Lamb(learning_rate=0.002,


这里还在用fluid api，另外，请在pr描述中说明该api与fluid api的异同点，和本次升级的主要变化等

这里还在用fluid api，另外，请在pr描述中说明该api与fluid api的异同点，和本次升级的主要变化等

好的谢谢已做修改

zhwesky2010 · 2020-11-23T06:18:25Z

python/paddle/optimizer/lamb.py

+            import paddle
+
+            paddle.enable_static()
+            data = fluid.data(name='x', shape=[-1, 5], dtype='float32')


使用2.0的示例代码描述方式，paddle.static.data paddle.nn.functional.fc

zhwesky2010 · 2020-11-23T06:19:28Z

python/paddle/optimizer/lamb.py

+
+            optimizer = paddle.optimizer.Lamb(learning_rate=0.002,
+                                             exclude_from_weight_decay_fn=exclude_fn)
+            optimizer.minimize(cost)


最好提供动态图的示例代码

做好修改了谢谢

lanxianghit · 2020-11-23T08:51:09Z

python/paddle/optimizer/lamb.py

+            back = out.backward()
+            lamb.step()
+            lamb.clear_grad()
+    """


PR描述里还是没有说清楚本次对比fluid api的具体升级点在哪里，比如参数是否变化，使用方式是否变化，有没有注意事项等等，如果只是目录改变，为什么是新增代码而不是使用alias，是否会造成代码冗余

好谢谢已作修改

XiaoguangHu01 · 2020-11-23T09:38:35Z

python/paddle/optimizer/lamb.py

+            some derived class of ``GradientClipBase`` . There are three cliping strategies
+            ( :ref:`api_fluid_clip_GradientClipByGlobalNorm` , :ref:`api_fluid_clip_GradientClipByNorm` ,
+            :ref:`api_fluid_clip_GradientClipByValue` ). Default None, meaning there is no gradient clipping.
+        exclude_from_weight_decay_fn (function|None): Exclude a parameter from weight


这个参数的用法有点trick，其他Optimizer应该也有这个需求吧？
是不是通过ParamAttr的regularizer=False的属性设置来控制更好一些？类似于ParamAttr的need_clip的用法。

嗯嗯在

import paddle import numpy as np inp = paddle.uniform(min=-0.1, max=0.1, shape=[10, 10], dtype='float32') linear = paddle.nn.Linear(in_features=10, out_features=10, weight_attr=paddle.ParamAttr(need_clip=True), bias_attr=paddle.ParamAttr(need_clip=False)) out = linear(inp) loss = paddle.mean(out) beta1 = paddle.to_tensor([0.9], dtype="float32") beta2 = paddle.to_tensor([0.85], dtype="float32") lamb = paddle.optimizer.Lamb(learning_rate=0.002, parameters=linear.parameters(), lamb_weight_decay=0.01) back = out.backward() lamb.step() lamb.clear_grad()

这个程序下验证了，修改好了。
需要注明的是，这个示例程序没有在doc中提供，只是我自己的测试。

XiaoguangHu01

LGTM

guoshengCS · 2020-11-24T02:46:17Z

python/paddle/optimizer/lamb.py

+    Args:
+        learning_rate (float|Variable, optional): the learning rate used to update parameters. \
+            Can be a float value or a Variable with data type float32. Default 0.001.
+        lamb_weight_decay (float, optional): The LAMB weight decay rate. Default 0.01. Remind that weight_decay should be None.


是否可以将lamb_weight_decay参数名中的lamb_去掉

这个我觉得先留着，这个和optimizer基类的weight decay不一样，因此保留了原来的这个API命名。

保留没问题，但是要明确有什么不一样呢，我理解这里的就是和AdamW里的weight_decay是一样作用的

guoshengCS · 2020-11-24T03:37:10Z

python/paddle/optimizer/lamb.py

+
+        if param_and_grad[0].need_clip:
+            weight_decay = 0.0
+        else:


need_clip是gradient_clip的标志，与weight_decay要区别对待

gradient_clip与weight_decay是两个不同的事情，这里不能这样做的

TCChenlong · 2020-11-24T06:33:36Z

python/paddle/optimizer/lamb.py

+            :ref:`api_guide_Name` . Usually name is no need to set and None by default.
+    Examples:
+        .. code-block:: python
+            import paddle


这里（.. code 与import paddle中间）需要加一个空行否则预览会出bug

TCChenlong · 2020-11-24T06:35:08Z

python/paddle/optimizer/lamb.py

+    Examples:
+        .. code-block:: python
+            import paddle
+            import numpy as np


这行可以删除

TCChenlong · 2020-11-24T06:35:43Z

python/paddle/optimizer/lamb.py

+    learning rate, :math:`\\lambda` the LAMB weight decay rate.
+
+    Args:
+        learning_rate (float|Variable, optional): the learning rate used to update parameters. \


Variable -> Tensor，其他地方同理

TCChenlong

LGTM
TODO：
修改英文文档补充中文文档

XiaoguangHu01

LGTM

add lamb optimizer and unittest

39f1a59

bjjwwang added 4 commits November 20, 2020 10:20

fix lamb

b92228f

fix lamb v2 op

c26e284

fix sampling id

19bed02

fix lamb sample code

f5b1832

bjjwwang changed the title ~~[WIP] add lamb optimizer and unittest~~ add lamb optimizer and unittest Nov 22, 2020

chalsliu previously approved these changes Nov 23, 2020

View reviewed changes

lanxianghit requested a review from zhwesky2010 November 23, 2020 03:30

lanxianghit reviewed Nov 23, 2020

View reviewed changes

Update lamb.py

96724b9

bjjwwang dismissed chalsliu’s stale review via 96724b9 November 23, 2020 05:52

zhwesky2010 reviewed Nov 23, 2020

View reviewed changes

bjjwwang added 2 commits November 23, 2020 06:57

fix doc

8e17031

fix doc

b22cea0

lanxianghit reviewed Nov 23, 2020

View reviewed changes

XiaoguangHu01 reviewed Nov 23, 2020

View reviewed changes

fix doc

57a4908

XiaoguangHu01 previously approved these changes Nov 24, 2020

View reviewed changes

Update lamb.py

9f2b707

bjjwwang dismissed XiaoguangHu01’s stale review via 9f2b707 November 24, 2020 03:25

guoshengCS reviewed Nov 24, 2020

View reviewed changes

TCChenlong reviewed Nov 24, 2020

View reviewed changes

TCChenlong approved these changes Nov 24, 2020

View reviewed changes

XiaoguangHu01 approved these changes Nov 24, 2020

View reviewed changes

kolinwei approved these changes Nov 24, 2020

View reviewed changes

bjjwwang merged commit f215133 into PaddlePaddle:develop Nov 24, 2020

This was referenced Mar 8, 2022

【PaddlePaddle Hackathon 2】50、在 Paddle 中实现1-bit Lamb 优化器 #40282

Closed

【PaddlePaddle Hackathon 2】47、在 Paddle 中新增 LARC #40285

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

add lamb optimizer and unittest #28772

add lamb optimizer and unittest #28772

bjjwwang commented Nov 20, 2020 •

edited

Loading

paddle-bot-old bot commented Nov 20, 2020

lanxianghit Nov 23, 2020

bjjwwang Nov 23, 2020

zhwesky2010 Nov 23, 2020

bjjwwang Nov 23, 2020

zhwesky2010 Nov 23, 2020

bjjwwang Nov 23, 2020

lanxianghit Nov 23, 2020

bjjwwang Nov 23, 2020

XiaoguangHu01 Nov 23, 2020

bjjwwang Nov 23, 2020

XiaoguangHu01 left a comment

guoshengCS Nov 24, 2020

bjjwwang Nov 24, 2020

guoshengCS Nov 24, 2020

guoshengCS Nov 24, 2020

guoshengCS Nov 24, 2020 •

edited

Loading

TCChenlong Nov 24, 2020

TCChenlong Nov 24, 2020

TCChenlong Nov 24, 2020

TCChenlong left a comment

XiaoguangHu01 left a comment

add lamb optimizer and unittest #28772

add lamb optimizer and unittest #28772

Conversation

bjjwwang commented Nov 20, 2020 • edited Loading

PR types

PR changes

Describe

paddle-bot-old bot commented Nov 20, 2020

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

XiaoguangHu01 left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

guoshengCS Nov 24, 2020 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

TCChenlong left a comment

Choose a reason for hiding this comment

XiaoguangHu01 left a comment

Choose a reason for hiding this comment

bjjwwang commented Nov 20, 2020 •

edited

Loading

guoshengCS Nov 24, 2020 •

edited

Loading