Junfeng Tian's picture

2

Junfeng Tian

rgtjf

AI & ML interests

None yet

Organizations

None yet

Collections 2

Papers 6

arxiv:2409.04774

arxiv:2404.15702

arxiv:2310.05126

arxiv:2307.02499

models 13

rgtjf/ppo-Pyramids

Reinforcement Learning • Updated Oct 21, 2024 • 14

rgtjf/ppo-SnowballTarget

Reinforcement Learning • Updated Oct 18, 2024 • 5

rgtjf/Reinforce-2048

Reinforcement Learning • Updated Oct 17, 2024

rgtjf/Qwen2-UtK-72B-128K

73B • Updated Oct 17, 2024 • 1

rgtjf/LLama3.1-UtK-8B-128K

8B • Updated Oct 17, 2024 • 1

rgtjf/Qwen2-UtK-ChatQA2-7B-128K

8B • Updated Oct 17, 2024 • 1

rgtjf/Qwen2-UtK-ChatQA2-72B-128K

73B • Updated Oct 17, 2024 • 3

rgtjf/Qwen2-UtK-7B-128K

8B • Updated Oct 17, 2024 • 2

rgtjf/Reinforce-1024

Reinforcement Learning • Updated Oct 17, 2024

rgtjf/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Oct 16, 2024 • 16

datasets 0

None public yet