Zhihe Yang's picture

4 8

Zhihe Yang

zhyang2226

·

AI & ML interests

Trustworthy RL & Offline RL

Recent Activity

upvoted a paper about 22 hours ago

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

liked a model 2 months ago

NbAiLabArchive/whisper-large-v2-nob

liked a model 5 months ago

tencent/HunyuanImage-3.0

View all activity

Organizations

Papers 2

arxiv:2505.12929

arxiv:2501.09695

models 2

zhyang2226/opadpo-lora_llava-v1.5-13b

Updated Jan 16, 2025

zhyang2226/opadpo-lora_llava-v1.5-7b

Updated Jan 16, 2025

datasets 0

None public yet