ZHZisZZ

Zhanhui Zhou ZHZisZZ

Achievements

weak-to-strong-search weak-to-strong-search Public

[NeurIPS'24] Weak-to-Strong Search: Align Large Language Models via Searching over Small Language Models

Python 36 3
emulated-disalignment emulated-disalignment Public

[ACL'24, Outstanding Paper] Emulated Disalignment: Safety Alignment for Large Language Models May Backfire!

Python 29
modpo modpo Public

[ACL'24] Beyond One-Preference-Fits-All Alignment: Multi-Objective Direct Preference Optimization

Python 54 3
INTENT INTENT Public

[UIST'22] INTENT: Interactive Tensor Transformation Synthesis

Python 7 2