【Hackathon4 No.33】为 Paddle 优化 Histogram op 在 GPU 上的计算性能 #486

zeroRains · 2023-03-28T07:24:11Z

为 Paddle 优化 Histogram op 在 GPU 上的计算性能
任务：PaddlePaddle/Paddle#50657 (comment)

paddle-bot · 2023-03-28T07:24:20Z

你的PR提交成功，感谢你对开源项目的贡献!
请检查PR提交格式和内容是否完备，具体请参考示例和模版。
Your PR has been submitted. Thanks for your contribution!
Please check its format and content. For this, you can refer to Template and Demo.

zeroRains · 2023-04-10T03:31:13Z

@JamesLim-sy 老师，麻烦review一下，已经两个周了，(:з」∠)

JamesLim-sy · 2023-04-17T06:42:08Z

rfcs/OPs-Perf/20230328_histogram_op_optimization.md

+
+## 2.1 关键模块与性能提升点
+
+关键是使用`phi::funcs::ReduceKernel`，加速`Histogram`确定直方图边界的计算部分，从而提高`Histogram`算子在GPU上的计算性能。预期能够平均提升2倍以上。


Paddle内置的Reduce计算目前针对的场景是单输入、单输出，不建议使用。鉴于Min Max是一体两面的计算，一个__device__ Kernel 内部可以同时得到Max_value 和 Min_value，另外如果对 cooperative_groups 或其他同类内存栅栏有了解的话，可以统一在一个 global kernel 内部完成全部计算.

zeroRains added 3 commits March 28, 2023 15:14

add 20230328_histogram_op_optimization.md

6333bf2

Correct typos

b04851b

Correct typos

f2f7134

paddle-bot bot added contributor status: proposed labels Mar 28, 2023

zeroRains mentioned this pull request Mar 28, 2023

【PaddlePaddle Hackathon 第四期】任务总览 PaddlePaddle/Paddle#51281

Closed

luotao1 assigned luotao1, Ligoml and JamesLim-sy Mar 29, 2023

JamesLim-sy reviewed Apr 17, 2023

View reviewed changes

modify the optimization way

ce16bd5

JamesLim-sy approved these changes Apr 20, 2023

View reviewed changes

JamesLim-sy merged commit 0a4b4f7 into PaddlePaddle:master Apr 20, 2023

zeroRains deleted the histogram branch October 21, 2024 04:00

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

【Hackathon4 No.33】为 Paddle 优化 Histogram op 在 GPU 上的计算性能 #486

【Hackathon4 No.33】为 Paddle 优化 Histogram op 在 GPU 上的计算性能 #486

zeroRains commented Mar 28, 2023

paddle-bot bot commented Mar 28, 2023

zeroRains commented Apr 10, 2023

JamesLim-sy Apr 17, 2023


		## 2.1 关键模块与性能提升点

		关键是使用`phi::funcs::ReduceKernel`，加速`Histogram`确定直方图边界的计算部分，从而提高`Histogram`算子在GPU上的计算性能。预期能够平均提升2倍以上。

【Hackathon4 No.33】为 Paddle 优化 Histogram op 在 GPU 上的计算性能 #486

【Hackathon4 No.33】为 Paddle 优化 Histogram op 在 GPU 上的计算性能 #486

Conversation

zeroRains commented Mar 28, 2023

paddle-bot bot commented Mar 28, 2023

zeroRains commented Apr 10, 2023

JamesLim-sy Apr 17, 2023

Choose a reason for hiding this comment