diff --git a/docs/dev_guides/op_optimization/op_optimization_method_introduction_cn.md b/docs/dev_guides/op_optimization/op_optimization_method_introduction_cn.md index fc40d673299..828c1bd9045 100644 --- a/docs/dev_guides/op_optimization/op_optimization_method_introduction_cn.md +++ b/docs/dev_guides/op_optimization/op_optimization_method_introduction_cn.md @@ -1,6 +1,6 @@ # 算子性能优化 方法介绍 -飞桨作为一个开源项目, 提供高性能的计算服务是飞桨的特色之一。我们非常欢迎开发者为 Paddle 框架贡献高性能算子, 本文旨在向开发者提供一些快速实现高性能计算的方法。 +提供高性能的计算服务是飞桨的特色之一, 欢迎开发者为飞桨贡献高性能算子, 本文旨在提供一些快速实现高性能算子的方法。 # 基本介绍 @@ -33,7 +33,9 @@ GPU Kernel直接影响了算子性能, 我们推荐采用以下等通用优化 我们推荐结合OP的使用场景设计对于的线程配置策略,如下图所示[IndexSample OP](https://www.paddlepaddle.org.cn/documentation/docs/zh/api/paddle/index_sample_cn.html#index-sample)常用于处理2维数据, 因此使用[2维的线程配置策略](https://github.com/PaddlePaddle/Paddle/blob/30838aa698d6f3f3b0860b052f6a50ef53ac6784/paddle/phi/kernels/gpu/index_sample_kernel.cu#L82-L91)相对比1维配置策略,性能可提升20%左右。 - +
+图1. IndexSample OP 线程配置策略
+
+图2. Warp级操作封装
+
+图2. 快速整型除法操作
+