dtanow (Denis Akhiyarov)

upvoted an article 1 day ago

Article

Training and Finetuning Embedding Models with Sentence Transformers v3

May 28

• 146

upvoted a paper 29 days ago

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

Paper • 2408.06292 • Published Aug 12 • 114

upvoted a paper 30 days ago

Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

Paper • 2405.21060 • Published May 31 • 63

upvoted a collection about 1 month ago

Llama-3.1 Quantization

Collection

Neural Magic quantized Llama-3.1 models • 21 items • Updated 9 days ago • 33

upvoted 2 papers 3 months ago

McEval: Massively Multilingual Code Evaluation

Paper • 2406.07436 • Published Jun 11 • 39

TextGrad: Automatic "Differentiation" via Text

Paper • 2406.07496 • Published Jun 11 • 26

upvoted an article 5 months ago

Article

StarCoder2-Instruct: Fully Transparent and Permissive Self-Alignment for Code Generation

Apr 29

• 71

upvoted 7 papers 5 months ago

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paper • 2404.14219 • Published Apr 22 • 250

LLM-R2: A Large Language Model Enhanced Rule-based Rewrite System for Boosting Query Efficiency

Paper • 2404.12872 • Published Apr 19 • 11

Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences

Paper • 2404.03715 • Published Apr 4 • 59

upvoted 8 papers 6 months ago

Language Models as Compilers: Simulating Pseudocode Execution Improves Algorithmic Reasoning in Language Models

Paper • 2404.02575 • Published Apr 3 • 47

Advancing LLM Reasoning Generalists with Preference Trees

Paper • 2404.02078 • Published Apr 2 • 43

The Unreasonable Ineffectiveness of the Deeper Layers

Paper • 2403.17887 • Published Mar 26 • 77

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 140

Self-Discover: Large Language Models Self-Compose Reasoning Structures

Paper • 2402.03620 • Published Feb 6 • 109

Design2Code: How Far Are We From Automating Front-End Engineering?

Paper • 2403.03163 • Published Mar 5 • 93

Simple and Scalable Strategies to Continually Pre-train Large Language Models

Paper • 2403.08763 • Published Mar 13 • 48

StarCoder 2 and The Stack v2: The Next Generation

Paper • 2402.19173 • Published Feb 29 • 132

upvoted a collection 6 months ago

💫 StarCoder2

Collection

StarCoder2 models and datasets! • 8 items • Updated Mar 1 • 79

upvoted a paper 6 months ago

PERL: Parameter Efficient Reinforcement Learning from Human Feedback

Paper • 2403.10704 • Published Mar 15 • 56

Denis Akhiyarov

AI & ML interests

Organizations

dtanow's activity