Yifan Zhang's picture

Yifan Zhang

yifAI

·

https://yifzhang.com

yifanzhang-pro

AI & ML interests

Language Models

Organizations

yifAI's activity

upvoted 3 papers about 1 month ago

LLaVA-Critic: Learning to Evaluate Multimodal Models

Paper • 2410.02712 • Published Oct 3 • 34

Self-Play Preference Optimization for Language Model Alignment

Paper • 2405.00675 • Published May 1 • 24

General Preference Modeling with Preference Representations for Aligning Language Models

Paper • 2410.02197 • Published Oct 3 • 7

upvoted 4 papers about 2 months ago

Training Language Models to Self-Correct via Reinforcement Learning

Paper • 2409.12917 • Published Sep 19 • 134

Kolmogorov-Arnold Transformer

Paper • 2409.10594 • Published Sep 16 • 38

Seed-Music: A Unified Framework for High Quality and Controlled Music Generation

Paper • 2409.09214 • Published Sep 13 • 46

On the Diagram of Thought

Paper • 2409.10038 • Published Sep 16 • 11

upvoted a paper 7 months ago

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paper • 2404.14219 • Published Apr 22 • 253

upvoted 3 papers 9 months ago

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27 • 602

Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 87

AutoMathText: Autonomous Data Selection with Language Models for Mathematical Texts

Paper • 2402.07625 • Published Feb 12 • 11

upvoted 5 papers 10 months ago

TinyGSM: achieving >80% on GSM8k with small language models

Paper • 2312.09241 • Published Dec 14, 2023 • 37

Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding

Paper • 2401.12954 • Published Jan 23 • 29

Deep Tensor Network

Paper • 2311.11091 • Published Nov 18, 2023 • 2

Contrastive Learning Is Spectral Clustering On Similarity Graph

Paper • 2303.15103 • Published Mar 27, 2023 • 2

Meta Prompting for AGI Systems

Paper • 2311.11482 • Published Nov 20, 2023 • 3

upvoted a paper 11 months ago

Cumulative Reasoning with Large Language Models

Paper • 2308.04371 • Published Aug 8, 2023 • 2

upvoted a paper about 1 year ago

Contrastive Prefence Learning: Learning from Human Feedback without RL

Paper • 2310.13639 • Published Oct 20, 2023 • 24