Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Embedding在paddle如何实验的问题 #1138

Closed
weidong8405347 opened this issue Jan 12, 2017 · 9 comments
Closed

Embedding在paddle如何实验的问题 #1138

weidong8405347 opened this issue Jan 12, 2017 · 9 comments

Comments

@weidong8405347
Copy link

我想问下如何同时train lr fm model然后作为embedding方式传到dnn中去进行trainning,拜托问清楚需求再close

@hedaoyuan
Copy link
Contributor

对于有疑问的,可以Reopen issue继续讨论,这个没什么。
另外,尽量描述详细一些,可以看一下这个ISSUE(https://github.com/PaddlePaddle/Paddle/issues/1104#issue-199721041)。 如果需求是论文来的,最好直接给出论文出处;如果已经尝试用Paddle解决过了发现不行,最好也给一些思路。

@weidong8405347 weidong8405347 changed the title Embedding问题没有回答清楚问什么要close掉。。。。 Embedding在paddle如何实验的问题 Jan 12, 2017
@weidong8405347
Copy link
Author

你们没有搭过广告系统吗,embedding做法不清楚?

@backyes
Copy link
Contributor

backyes commented Jan 12, 2017

@weidong8405347

还是先尽量描述清楚问题,然后从demo开始熟悉如何使用paddle。

@weidong8405347
Copy link
Author

描述:
就是说广告里面的数据都是离散one hot数据,维度非常高并且是稀疏的,现在希望通过embedding转换成低维连续值数据,一般做法是会train一个lr model 然后会将高维的特征转换成一个Lr weight的低维连续值
问题: paddle如何能够先对输入数据进行lr tranning 然后根据model 去转换成连续值数据后 进行dnn训练

@backyes
Copy link
Contributor

backyes commented Jan 13, 2017

@weidong8405347

QuickStart demo 有embedding的使用case, 文档说的也比较清楚,建议先从QuickStart开始实验一遍,就能理解Paddle如何做embedding的了。

参考链接:

http://www.paddlepaddle.org/doc/demo/quick_start/index_en.html

这也是上个 @pengli09 上个issue中给出的建议。

@weidong8405347
Copy link
Author

我不是说如何做embedding,这个页面我看过了,但是还是没回答我的问题,我理解这个是先load词表然后查词表得到向量作为下一层的输入,但是我想表达的是词表也是在线train的,需要先根据输入数据train lr fm model 然后根据model pv click生成一个词表,再根据词表去做embedding,好像一直都没回答我的问题,只是一直给个参考链接而已

@pengli09
Copy link
Contributor

这个demo里的embedding就是直接train出来了,希望您能够先认真学一下quick start里的样例,理解paddle的基本工作原理,我们才好继续讨论。

@Doreenruirui
Copy link

请问train好的model_128.emb怎么在python里直接用啊?怎么读这个文件呢?

@gongweibao
Copy link
Contributor

Closing this issue due to inactivity, feel free to reopen it.

zhhsplendid pushed a commit to zhhsplendid/Paddle that referenced this issue Sep 25, 2019
Synchronize the changes of Paddle with FluidDoc.
wangxicoding pushed a commit to wangxicoding/Paddle that referenced this issue Dec 9, 2021
lizexu123 pushed a commit to lizexu123/Paddle that referenced this issue Feb 23, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants