Zujie Liang's picture

4

Zujie Liang

jokieleung

·

https://jokieleung.github.io/

AI & ML interests

LLM/VLM Agents, reasoning

Recent Activity

upvoted a paper about 2 months ago

Joint Selection for Large-Scale Pre-Training Data via Policy Gradient-based Mask Learning

upvoted a paper 5 months ago

Cache-to-Cache: Direct Semantic Communication Between Large Language Models

upvoted a paper 5 months ago

EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning

View all activity

Organizations

Papers 11

arxiv:2503.03588

arxiv:2502.14693

arxiv:2502.14662

arxiv:2502.12110

models 0

None public yet

datasets 0

None public yet