Search Results for author: Penghan Wang

Fine-Grained Embedding Dimension Optimization During Training for Recommender Systems

Huge embedding tables in modern Deep Learning Recommender Models (DLRM) require prohibitively large memory during training and inference.

Paper
Add Code

To accelerate DNN computation, tensor compilers are proposed to generate efficient code on different domain-specific accelerators.

Paper
Add Code

We present Mirror, an open-source platform for data exploration and analysis powered by large language models.

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.