[PIR] fix data_op backend for gpu pinned tensor #60357

feifei-111 · 2023-12-26T08:26:45Z

PR types

Others

PR changes

Others

Description

if input tensor is a cuda pinned tensor, data_op will choose gpu device, however the tensor loaded is still in cpu (gpu pinned).
pd_op_to_kernel_pass will not add memcpy, the first kernel will use gpu pinned tensor as a gpu tensor, it is slow

PCard-66972

paddle-bot · 2023-12-26T08:26:51Z

你的PR提交成功，感谢你对开源项目的贡献!
请关注后续CI自动化测试结果，详情请参考Paddle-CI手册。
Your PR has been submitted. Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

2742195759

LGTM

fix data_op device for gpu pinned tensor

7cfcede

fix conf

f3dbd6d

feifei-111 changed the title ~~[PIR] fix data_op device for gpu pinned tensor~~ [PIR] fix data_op backend for gpu pinned tensor Dec 26, 2023

2742195759 approved these changes Dec 27, 2023

View reviewed changes

2742195759 merged commit 430894e into PaddlePaddle:develop Dec 27, 2023
29 checks passed

Wanglongzhi2001 pushed a commit to Wanglongzhi2001/Paddle that referenced this pull request Jan 7, 2024

fix data_op device for gpu pinned tensor (PaddlePaddle#60357)

b9f444a

feifei-111 deleted the fix_data_op_process_cuda_pinned_tensor branch February 18, 2024 09:05

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[PIR] fix data_op backend for gpu pinned tensor #60357

[PIR] fix data_op backend for gpu pinned tensor #60357

feifei-111 commented Dec 26, 2023 •

edited

Loading

paddle-bot bot commented Dec 26, 2023

2742195759 left a comment

[PIR] fix data_op backend for gpu pinned tensor #60357

[PIR] fix data_op backend for gpu pinned tensor #60357

Conversation

feifei-111 commented Dec 26, 2023 • edited Loading

PR types

PR changes

Description

paddle-bot bot commented Dec 26, 2023

2742195759 left a comment

Choose a reason for hiding this comment

feifei-111 commented Dec 26, 2023 •

edited

Loading