Towards Fair and Firm Real-Time Scheduling in DNN Multi-Tenant Multi-Accelerator Systems via Reinforcement Learning

Russo, Enrico; Blanco, Francesco Giulio; Palesi, Maurizio; Ascia, Giuseppe; Patti, Davide; Catania, Vincenzo

Computer Science > Hardware Architecture

arXiv:2403.00766 (cs)

[Submitted on 9 Feb 2024]

Title:Towards Fair and Firm Real-Time Scheduling in DNN Multi-Tenant Multi-Accelerator Systems via Reinforcement Learning

Authors:Enrico Russo, Francesco Giulio Blanco, Maurizio Palesi, Giuseppe Ascia, Davide Patti, Vincenzo Catania

View PDF HTML (experimental)

Abstract:This paper addresses the critical challenge of managing Quality of Service (QoS) in cloud services, focusing on the nuances of individual tenant expectations and varying Service Level Indicators (SLIs). It introduces a novel approach utilizing Deep Reinforcement Learning for tenant-specific QoS management in multi-tenant, multi-accelerator cloud environments. The chosen SLI, deadline hit rate, allows clients to tailor QoS for each service request. A novel online scheduling algorithm for Deep Neural Networks in multi-accelerator systems is proposed, with a focus on guaranteeing tenant-wise, model-specific QoS levels while considering real-time constraints.

Subjects:	Hardware Architecture (cs.AR); Distributed, Parallel, and Cluster Computing (cs.DC); Machine Learning (cs.LG)
Cite as:	arXiv:2403.00766 [cs.AR]
	(or arXiv:2403.00766v1 [cs.AR] for this version)
	https://doi.org/10.48550/arXiv.2403.00766

Submission history

From: Maurizio Palesi [view email]
[v1] Fri, 9 Feb 2024 07:25:07 UTC (1,625 KB)

Full-text links:

Access Paper:

view license

Current browse context:

cs.AR

< prev | next >

new | recent | 2024-03

Change to browse by:

cs
cs.DC
cs.LG

References & Citations

export BibTeX citation

Computer Science > Hardware Architecture

Title:Towards Fair and Firm Real-Time Scheduling in DNN Multi-Tenant Multi-Accelerator Systems via Reinforcement Learning

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Hardware Architecture

Title:Towards Fair and Firm Real-Time Scheduling in DNN Multi-Tenant Multi-Accelerator Systems via Reinforcement Learning

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators