Articles producció científicaEnginyeria Informàtica i Matemàtiques

GeoServe: Leveraging Disaggregated Data Processing for Scalable Geospatial Model Serving

  • Dades identificatives

    Identificador:  imarina:9586094
    Autors:  Gerard Finol; Christian Pinto
    Resum:
    Geospatial foundation models (GFMs) operate on large, multi-band raster products (e.g., GeoTIFF) that require expensive data access and preprocessing - reprojection, decoding, normalization, and tiling - before GPU inference. In our measurements, reading and preprocessing geospatial inputs can be orders of magnitude slower than tokenization or standard image preprocessing, and constitute 31 - 43% of end-to-end request time for a representative GFM. Existing inference frameworks such as vLLM execute this preprocessing inline with request handling, which under load serializes CPU and I/O work, increasing queueing delay, and leaving GPUs underutilized. We present GeoServe, a Ray-based serving system that decouples the geospatial data pipeline from GPU inference by disaggregating I/O- and CPU-heavy preprocessing to a scalable pool of CPU workers, while keeping GPU nodes dedicated to model forward passes. We show experimentally that GeoServe reduces the p90 request latency by up to 414.9× at high load and improves throughput by up to 4.74× compared to vanilla vLLM, while increasing the achieved model forward-pass rate from ~ 16 inf./sec to ~ 72 inf./sec via better batching opportunities.
  • Altres:

    Enllaç font original: https://dl.acm.org/doi/10.1145/3805621.3807611
    Acció del programa de finançament: Optimización inteligente del Análisis de datos extremos (X-AI)
    Referència de l'ítem segons les normes APA: Gerard Finol; Christian Pinto (2026). GeoServe: Leveraging Disaggregated Data Processing for Scalable Geospatial Model Serving.
    Referència a l'article segons font original: Proceedings of the Sixth European Workshop on Machine Learning and Systems. 246-253
    Acció del programa de finançament 2: Cloud open source research mobility network
    DOI de l'article: 10.1145/3805621.3807611
    Programa de finançament: Pla Nacional, Projectes RDI del Ministerio de Ciencia, Innovación y Universidades
    Any de publicació de la revista: 2026-04-28
    Entitat: Universitat Rovira i Virgili
    Versió de l'article dipositat: info:eu-repo/semantics/publishedVersion
    Data d'alta del registre: 2026-06-13
    Autor/s de la URV: Finol Peñalver, Gerard
    Codi del projecte 2: 101086248
    Departament: Enginyeria Informàtica i Matemàtiques
    URL Document de llicència: https://repositori.urv.cat/ca/proteccio-de-dades/
    Tipus de publicació: Proceedings Paper
    Programa de finançament 2: Horizon Europe - MSCA Staff Exchanges 2021
    Autor segons l'article: Gerard Finol; Christian Pinto
    Codi de projecte: PID2023-148202OB-C21
    Accès a la llicència d'ús: https://creativecommons.org/licenses/by/3.0/es/
    Adreça de correu electrònic de l'autor: gerard.finol@urv.cat
    Acrònim 2: CLOUDSTARS