Rawad Bitar · Engineering · Preprint — Research Repository

Showing 5 results for "rawad bitar" in Engineering · Preprint

Engineering Preprint PDF DOI

Direct Preference Optimization for Speech Autoregressive Diffusion Models

Zhijun Liu, Dongya Jia, Xiaoqiang Wang, Chenpeng Du, Shuai Wang, Zhuo Chen, Haizhou Li · 2025

Autoregressive diffusion models (ARDMs) have recently been applied to speech generation, achieving state-of-the-art (SOTA) performance in zero-shot text-to-speech. By autoregressively generating conti…

Read Paper →

Engineering Preprint PDF DOI

DiTAR: Diffusion Transformer Autoregressive Modeling for Speech Generation

Dongya Jia, Zhuo Chen, Jiawei Chen, Chenpeng Du, Jian Wu, Jian Cong, Xiaobin Zhuang, Chumin Li, Zhen Wei, Yuping Wang, Yuxuan Wang · 2025

Several recent studies have attempted to autoregressively generate continuous speech representations without discrete speech tokens by combining diffusion and autoregressive models, yet they often fac…

Read Paper →

Engineering Preprint PDF DOI

Leveraging cough sounds to optimize chest x-ray usage in low-resource settings

Alexander Philip, Sanya Chawla, Lola Jover, George P. Kafentzis, Joe Brew, Vishakh Saraf, Shibu Vijayan, Peter Small, Carlos Chaccour · 2024

Chest X-ray is a commonly used tool during triage, diagnosis and management of respiratory diseases. In resource-constricted settings, optimizing this resource can lead to valuable cost savings for th…

Read Paper →

Engineering Preprint PDF DOI

BiTr-Unet: a CNN-Transformer Combined Network for MRI Brain Tumor Segmentation

Qiran Jia, Hai Shu · 2021

Convolutional neural networks (CNNs) have achieved remarkable success in automatically segmenting organs or lesions on 3D medical images. Recently, vision transformer networks have exhibited exception…

Read Paper →

Engineering Preprint PDF DOI

Exploit Camera Raw Data for Video Super-Resolution via Hidden Markov Model Inference

Xiaohong Liu, Kangdi Shi, Zhe Wang, Jun Chen · 2020

To the best of our knowledge, the existing deep-learning-based Video Super-Resolution (VSR) methods exclusively make use of videos produced by the Image Signal Processor (ISP) of the camera system as …

Read Paper →

📝

Publish Your Research

Free open-access publishing with Google Scholar indexing.

Submission Guide →

Browse Research Papers

Direct Preference Optimization for Speech Autoregressive Diffusion Models

DiTAR: Diffusion Transformer Autoregressive Modeling for Speech Generation

Leveraging cough sounds to optimize chest x-ray usage in low-resource settings

BiTr-Unet: a CNN-Transformer Combined Network for MRI Brain Tumor Segmentation

Exploit Camera Raw Data for Video Super-Resolution via Hidden Markov Model Inference

Browse by Category

Research Type

Publish Your Research