Models in Engineering — Research Repository

Engineering Preprint PDF DOI

SpaceDex: Generalizable Dexterous Grasping in Tiered Workspaces

Wensheng Wang, Chuanjun Guo, Wei Wei, Tong Wu, Ning Tan · 2026

Generalizable grasping with high-degree-of-freedom (DoF) dexterous hands remains challenging in tiered workspaces, where occlusion, narrow clearances, and height-dependent constraints are substantiall…

Read Paper →

Engineering Preprint PDF DOI

StableIDM: Stabilizing Inverse Dynamics Model against Manipulator Truncation via Spatio-Temporal Refinement

Kerui Li, Zhe Jing, Xiaofeng Wang, Zheng Zhu, Yukun Zhou, Guan Huang, Dongze Li, Qingkai Yang, Huaibo Huang · 2026

Inverse Dynamics Models (IDMs) map visual observations to low-level action commands, serving as central components for data labeling and policy execution in embodied AI. However, their performance deg…

Read Paper →

Engineering Preprint PDF DOI

ST-$\pi$: Structured SpatioTemporal VLA for Robotic Manipulation

Chuanhao Ma, Hanyu Zhou, Shihan Peng, Yan Li, Tao Gu, Luxin Yan · 2026

Vision-language-action (VLA) models have achieved great success on general robotic tasks, but still face challenges in fine-grained spatiotemporal manipulation. Typically, existing methods mainly embe…

Read Paper →

Engineering Preprint PDF DOI

OFlow: Injecting Object-Aware Temporal Flow Matching for Robust Robotic Manipulation

Kuanning Wang, Ke Fan, Chenhao Qiu, Zeyu Shangguan, Yuqian Fu, Yanwei Fu, Daniel Seita, Xiangyang Xue · 2026

Robust robotic manipulation requires not only predicting how the scene evolves over time, but also recognizing task-relevant objects in complex scenes. However, existing VLA models face two limitation…

Read Paper →

Engineering Preprint PDF DOI

Periodic Steady-State Control of a Handkerchief-Spinning Task Using a Parallel Anti-Parallelogram Tendon-driven Wrist

Lei Liu, Haonan Zhang, Huahang Xu, Zefan Zhang, Lulu Chang, Lei Lv, Andrew Ross McIntosh, Kai Sun, Zhenshan Bing, Jiahong Dong, Fuchun Sun · 2026

Spinning flexible objects, exemplified by traditional Chinese handkerchief performances, demands periodic steady-state motions under nonlinear dynamics with frictional contacts and boundary constraint…

Read Paper →

Engineering Preprint PDF DOI

DART: Learning-Enhanced Model Predictive Control for Dual-Arm Non-Prehensile Manipulation

Autrio Das, Shreya Bollimuntha, Madala Venkata Renu Jeevesh, Keshab Patra, Tashmoy Ghosh, Nagamanikandan Govindan, Arun Kumar Singh, K Madhava Krishna · 2026

What appears effortless to a human waiter remains a major challenge for robots. Manipulating objects nonprehensilely on a tray is inherently difficult, and the complexity is amplified in dual-arm sett…

Read Paper →

Engineering Preprint PDF DOI

SYMBOLIZER: Symbolic Model-free Task Planning with VLMs

Sami Azirar, Zlatan Ajanovic, Hermann Blum · 2026

Traditional Task and Motion Planning (TAMP) systems depend on physics models for motion planning and discrete symbolic models for task planning. Although physics model are often available, symbolic mo…

Read Paper →

Engineering Preprint PDF DOI

Kill-Probability-Maximization Guidance: Breaking from the Miss-Distance-Minimization Paradigm

Liraz Mudrik, Yaakov Oshman · 2026

Classical guidance laws aim at minimizing the miss distance, thus implicitly determining the minimum warhead lethality radius required against nominal targets. However, nonnominal targets or scenarios…

Read Paper →

Engineering Preprint PDF DOI

Memory Centric Power Allocation for Multi-Agent Embodied Question Answering

Chengyang Li, Shuai Wang, Kejiang Ye, Weijie Yuan, Boyu Zhou, Yik-Chung Wu, Chengzhong Xu, Huseyin Arslan · 2026

This paper considers multi-agent embodied question answering (MA-EQA), which aims to query robot teams on what they have seen over a long horizon. In contrast to existing edge resource management meth…

Read Paper →

Engineering Preprint PDF DOI

Optimally Bridging Semantics and Data: Generative Semantic Communication via Schr\"odinger Bridge

Dahua Gao, Ruichao Liu, Minxi Yang, Shuai Ma, Youlong Wu, Guangming Shi · 2026

Generative Semantic Communication (GSC) is a promising solution for image transmission over narrow-band and high-noise channels. However, existing GSC methods rely on long, indirect transport trajecto…

Read Paper →

Engineering Preprint PDF DOI

ReFineVLA: Multimodal Reasoning-Aware Generalist Robotic Policies via Teacher-Guided Fine-Tuning

Tuan Van Vo, Tan Q. Nguyen, Khang Nguyen, Nhat Xuan Tran, Duy H. M. Nguyen, An T. Le, Ngo Anh Vien, Minh Nhat Vu · 2026

Vision-Language-Action (VLA) models have gained much attention from the research community thanks to their strength in translating multimodal observations with linguistic instructions into desired rob…

Read Paper →

Engineering Preprint PDF DOI

AnchorRefine: Synergy-Manipulation Based on Trajectory Anchor and Residual Refinement for Vision-Language-Action Models

Tingzheng Jia, Kan Guo, Lanping Qian, Yongli Hu, Daxin Tian, Guixian Qu, Chunmian Lin, Baocai Yin, Jiapu Wang · 2026

Precision-critical manipulation requires both global trajectory organization and local execution correction, yet most vision-language-action (VLA) policies generate actions within a single unified spa…

Read Paper →

Engineering Preprint PDF DOI

Building Low-Altitude Communication Networks: A Digital Twin-Based Optimization Framework

Boqun Huang, Yancheng Wang, Wei Guo, Zhaojie Guo, Di Wu, Ran Li, Dayang Liu, Wanshun Lan, Chuan Huang, Shuguang Cui · 2026

Low-altitude communication networks (LACNs) serve as the critical infrastructure of the emerging low-altitude economy (LAE), supporting services such as drone delivery and infrastructure inspection. H…

Read Paper →

Engineering Preprint PDF DOI

Trajectory-Based Optimization for Air Traffic Control in the Terminal Maneuvering Area

Yutian Pang, Daniel Delahaye, John-Paul Clarke · 2026

We present a trajectory-based optimization framework for arrival sequencing and scheduling in the terminal maneuvering area (TMA). Unlike node-link scheduling models that reduce trajectories to time-d…

Read Paper →

Engineering Preprint PDF DOI

OmniVLA-RL: A Vision-Language-Action Model with Spatial Understanding and Online RL

Haoxiang Jie, Yaoyuan Yan, Xiangyu Wei, Kailin Wang, Hongjie Yan, Zhiyou Heng, Daocheng Chen · 2026

Visual-Language-Action (VLA) models represent a paradigm shift in embodied AI, yet existing frameworks often struggle with imprecise spatial perception, suboptimal multimodal fusion, and instability i…

Read Paper →

Engineering Preprint PDF DOI

Path-Based Quantum Meta-Learning for Adaptive Optimization of Reconfigurable Intelligent Surfaces

Noha Hassan, Xavier Fernando, Halim Yanikomeroglu · 2026

Reconfigurable intelligent surfaces (RISs) modify signal reflections to enhance wireless communication capabilities. Classical RIS phase optimization is highly non convex and challenging in dynamic en…

Read Paper →

Engineering Preprint PDF DOI

Prosody as Supervision: Bridging the Non-Verbal--Verbal for Multilingual Speech Emotion Recognition

Girish, Mohd Mujtaba Akhtar, Muskaan Singh · 2026

In this work, we introduce a paralinguistic supervision paradigm for low-resource multilingual speech emotion recognition (LRM-SER) that leverages non-verbal vocalizations to exploit prosody-centric e…

Read Paper →

Engineering Preprint PDF DOI

HCFD: A Benchmark for Audio Deepfake Detection in Healthcare

Mohd Mujtaba Akhtar, Girish, Muskaan Singh · 2026

In this study, we present Healthcare Codec-Fake Detection (HCFD), a new task for detecting codec-fakes under pathological speech conditions. We intentionally focus on codec based synthetic speech in t…

Read Paper →

Engineering Preprint PDF DOI

RIS-Assisted Cell-Free Massive MIMO: RIS-MS Selection in FR1 and FR3

Alejandro de la Fuente, Fernando Galindo, Uriel Garcia-Barbulo, Sandra-Noemy Arana-Alegre, Jan Garcia-Morales · 2026

This paper explores the integration of reconfigurable intelligent surfaces (RISs) into cell-free massive multiple-input-multiple-output (CF-mMIMO) networks operating in FR1 and FR3 frequency bands. We…

Read Paper →

Engineering Preprint PDF DOI

Conjugate Beamforming Variants for Multicasting in Cell-Free Massive MIMO Systems

Alejandro de la Fuente, Adrian Espinosa, Jan Garcia-Morales, Guillem Femenias, Felip Riera-Palou · 2026

This paper studies scalable conjugate beamforming (CB) variants for physical-layer multicasting in cell-free massive multiple-input multiple-output (CF-mMIMO) systems. Focusing on fully distributed pr…

Read Paper →

Browse Research Papers

SpaceDex: Generalizable Dexterous Grasping in Tiered Workspaces

StableIDM: Stabilizing Inverse Dynamics Model against Manipulator Truncation via Spatio-Temporal Refinement

ST-$\pi$: Structured SpatioTemporal VLA for Robotic Manipulation

OFlow: Injecting Object-Aware Temporal Flow Matching for Robust Robotic Manipulation

Periodic Steady-State Control of a Handkerchief-Spinning Task Using a Parallel Anti-Parallelogram Tendon-driven Wrist

DART: Learning-Enhanced Model Predictive Control for Dual-Arm Non-Prehensile Manipulation

SYMBOLIZER: Symbolic Model-free Task Planning with VLMs

Kill-Probability-Maximization Guidance: Breaking from the Miss-Distance-Minimization Paradigm

Memory Centric Power Allocation for Multi-Agent Embodied Question Answering

Optimally Bridging Semantics and Data: Generative Semantic Communication via Schr\"odinger Bridge

ReFineVLA: Multimodal Reasoning-Aware Generalist Robotic Policies via Teacher-Guided Fine-Tuning

AnchorRefine: Synergy-Manipulation Based on Trajectory Anchor and Residual Refinement for Vision-Language-Action Models

Building Low-Altitude Communication Networks: A Digital Twin-Based Optimization Framework

Trajectory-Based Optimization for Air Traffic Control in the Terminal Maneuvering Area

OmniVLA-RL: A Vision-Language-Action Model with Spatial Understanding and Online RL

Path-Based Quantum Meta-Learning for Adaptive Optimization of Reconfigurable Intelligent Surfaces

Prosody as Supervision: Bridging the Non-Verbal--Verbal for Multilingual Speech Emotion Recognition

HCFD: A Benchmark for Audio Deepfake Detection in Healthcare

RIS-Assisted Cell-Free Massive MIMO: RIS-MS Selection in FR1 and FR3

Conjugate Beamforming Variants for Multicasting in Cell-Free Massive MIMO Systems

Browse by Category

Research Type

Publish Your Research