4 44 13

Xin Xu

XinXuNLPer

https://xxupiano.github.io/

AI & ML interests

NLP, Music AI

Recent Activity

liked a model 18 days ago

slseanwu/MIDI-LLM_Llama-3.2-1B

authored a paper 24 days ago

SkillNet: Create, Evaluate, and Connect AI Skills

upvoted a paper 27 days ago

SkillNet: Create, Evaluate, and Connect AI Skills

View all activity

Organizations

upvoted a paper 27 days ago

SkillNet: Create, Evaluate, and Connect AI Skills

Paper • 2603.04448 • Published Feb 26 • 91

upvoted a paper 29 days ago

How Controllable Are Large Language Models? A Unified Evaluation across Behavioral Granularities

Paper • 2603.02578 • Published about 1 month ago • 25

upvoted 3 articles about 1 month ago

Article

Making LLMs Truly Remember You | LightMem: Lightweight and Efficient Memory-Augmented Generation

Feb 28

•

Article

构建、评估与连接 AI 技能 | SkillNet：大规模智能体“技能图谱”知识库

Feb 28

•

Article

Create, Evaluate, and Connect AI Skills | SkillNet: A Large-Scale Agentic "Skill Graph" Knowledge Base

Feb 28

•

upvoted a paper about 1 month ago

InnoEval: On Research Idea Evaluation as a Knowledge-Grounded, Multi-Perspective Reasoning Problem

Paper • 2602.14367 • Published Feb 16 • 17

upvoted 2 papers about 2 months ago

ThinkRouter: Efficient Reasoning via Routing Thinking between Latent and Discrete Spaces

Paper • 2602.11683 • Published Feb 12 • 8

From Data to Behavior: Predicting Unintended Model Behaviors Before Training

Paper • 2602.04735 • Published Feb 4 • 15

upvoted 3 papers 2 months ago

upvoted 2 papers 3 months ago

Illusions of Confidence? Diagnosing LLM Truthfulness via Neighborhood Consistency

Paper • 2601.05905 • Published Jan 9 • 20

mHC: Manifold-Constrained Hyper-Connections

Paper • 2512.24880 • Published Dec 31, 2025 • 321

upvoted a paper 4 months ago

InnoGym: Benchmarking the Innovation Potential of AI Agents

Paper • 2512.01822 • Published Dec 1, 2025 • 36

upvoted a paper 5 months ago

MIDI-LLM: Adapting Large Language Models for Text-to-MIDI Music Generation

Paper • 2511.03942 • Published Nov 6, 2025 • 2

upvoted a collection 5 months ago

AI Evals

Collection

1 item • Updated Oct 3, 2025 • 1

upvoted 2 papers 5 months ago

LightMem: Lightweight and Efficient Memory-Augmented Generation

Paper • 2510.18866 • Published Oct 21, 2025 • 115

Executable Knowledge Graphs for Replicating AI Research

Paper • 2510.17795 • Published Oct 20, 2025 • 15

upvoted 2 papers 6 months ago

When Benchmarks Age: Temporal Misalignment through Large Language Model Factuality Evaluation

Paper • 2510.07238 • Published Oct 8, 2025 • 15

OceanGym: A Benchmark Environment for Underwater Embodied Agents

Paper • 2509.26536 • Published Sep 30, 2025 • 36

Xin Xu

AI & ML interests

Recent Activity

Organizations

XinXuNLPer's activity

Making LLMs Truly Remember You | LightMem: Lightweight and Efficient Memory-Augmented Generation

构建、评估与连接 AI 技能 | SkillNet：大规模智能体“技能图谱”知识库

Create, Evaluate, and Connect AI Skills | SkillNet: A Large-Scale Agentic "Skill Graph" Knowledge Base