Search Results for author: Zilu Guo

Found 4 papers, 1 papers with code

Quality-aware Masked Diffusion Transformer for Enhanced Music Generation

no code implementations • 24 May 2024 • Chang Li, Ruoyu Wang, Lijuan Liu, Jun Du, Yixuan Sun, Zilu Guo, Zhenrong Zhang, Yuan Jiang

To overcome these challenges, we introduce a novel quality-aware masked diffusion transformer (QA-MDT) approach that enables generative models to discern the quality of input music waveform during training.

Ranked #1 on Text-to-Music Generation on MusicCaps

Text-to-Music Generation

Paper
Add Code

Continuous Modeling of the Denoising Process for Speech Enhancement Based on Deep Learning

no code implementations • 17 Sep 2023 • Zilu Guo, Jun Du, Chin-Hui Lee

The starting state is noisy speech and the ending state is clean speech.

Automatic Speech Recognition Denoising +3

Paper
Add Code

Variance-Preserving-Based Interpolation Diffusion Models for Speech Enhancement

1 code implementation • 14 Jun 2023 • Zilu Guo, Jun Du, Chin-Hui Lee, Yu Gao, Wenbin Zhang

The goal of this study is to implement diffusion models for speech enhancement (SE).

Speech Enhancement

Paper
Code

VT-CLIP: Enhancing Vision-Language Models with Visual-guided Texts

no code implementations • 4 Dec 2021 • Longtian Qiu, Renrui Zhang, Ziyu Guo, Ziyao Zeng, Zilu Guo, Yafeng Li, Guangnan Zhang

Contrastive Language-Image Pre-training (CLIP) has drawn increasing attention recently for its transferable visual representation learning.

Language Modelling Representation Learning +1

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.