秒级推理突破虚拟机重调度难题

发布时间：2025-06-04 14:51 浏览次数：次作者：小编

字节跳动ByteBrain团队发布VMR²L系统：秒级推理突破虚拟机重调度难题

6月5日，字节跳动技术团队微信公众号宣布，其ByteBrain团队联合加州大学默塞德分校（UC Merced）和加州大学伯克利分校（UC Berkeley）提出了一项名为VMR²L的创新成果。该系统基于深度强化学习，成功将虚拟机重调度（VMR）的推理时间压缩至1.1秒，在保持近似最优性能的同时，实现了系统性能与工业可部署性的统一。相关研究已在系统领域顶级会议EuroSys 2025发表。

一、研究背景与挑战

虚拟机重调度（VMR）是云计算资源管理中的核心问题，旨在通过迁移部分已部署的虚拟机（VM），重组资源、降低碎片化，从而提升整体资源利用率。然而，传统VMR算法存在两大痛点：

性能与效率的权衡：传统方法依赖启发式规则或离线优化，难以实时响应动态资源需求。

工业部署的复杂性：现有方案在实际场景中常因计算延迟过高或稳定性不足而难以落地。

字节跳动团队聚焦这一长期被忽视的领域，提出VMR²L系统，通过深度强化学习（DRL）框架，首次在工业级场景中实现秒级推理与近似最优性能的结合。

二、VMR²L的核心创新

深度强化学习架构设计

VMR²L采用端到端的强化学习模型，通过动态状态观测（如资源负载、迁移成本）和策略网络优化，实时生成迁移决策。相比传统方法，其推理速度提升超过100倍，同时保持与离线优化算法相当的资源利用率。

轻量化与稳定性优化

模型压缩技术：通过知识蒸馏和参数共享，将模型体积缩小至传统DRL模型的1/10，降低部署成本。

混合训练策略：结合仿真环境与真实场景数据，增强模型在复杂工业环境中的鲁棒性。

工业级验证