Search Results for author: Haichen Huang

Found 2 papers, 2 papers with code

Elixir: Train a Large Language Model on a Small GPU Cluster

2 code implementations • 10 Dec 2022 • Haichen Huang, Jiarui Fang, Hongxin Liu, Shenggui Li, Yang You

To reduce GPU memory usage, memory partitioning, and memory offloading have been proposed.

Language Modelling Large Language Model

37,971

Paper
Code

Colossal-AI: A Unified Deep Learning System For Large-Scale Parallel Training

1 code implementation • 28 Oct 2021 • Shenggui Li, Hongxin Liu, Zhengda Bian, Jiarui Fang, Haichen Huang, Yuliang Liu, Boxiang Wang, Yang You

The success of Transformer models has pushed the deep learning model scale to billions of parameters.

37,971

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.