Articles producció científicaEnginyeria Informàtica i Matemàtiques

GeoServe: Leveraging Disaggregated Data Processing for Scalable Geospatial Model Serving

  • Datos identificativos

    Identificador:  imarina:9586094
    Autores:  Gerard Finol; Christian Pinto
    Resumen:
    Geospatial foundation models (GFMs) operate on large, multi-band raster products (e.g., GeoTIFF) that require expensive data access and preprocessing - reprojection, decoding, normalization, and tiling - before GPU inference. In our measurements, reading and preprocessing geospatial inputs can be orders of magnitude slower than tokenization or standard image preprocessing, and constitute 31 - 43% of end-to-end request time for a representative GFM. Existing inference frameworks such as vLLM execute this preprocessing inline with request handling, which under load serializes CPU and I/O work, increasing queueing delay, and leaving GPUs underutilized. We present GeoServe, a Ray-based serving system that decouples the geospatial data pipeline from GPU inference by disaggregating I/O- and CPU-heavy preprocessing to a scalable pool of CPU workers, while keeping GPU nodes dedicated to model forward passes. We show experimentally that GeoServe reduces the p90 request latency by up to 414.9× at high load and improves throughput by up to 4.74× compared to vanilla vLLM, while increasing the achieved model forward-pass rate from ~ 16 inf./sec to ~ 72 inf./sec via better batching opportunities.
  • Otros:

    Enlace a la fuente original: https://dl.acm.org/doi/10.1145/3805621.3807611
    Acción del progama de financiación: Optimización inteligente del Análisis de datos extremos (X-AI)
    Referencia de l'ítem segons les normes APA: Gerard Finol; Christian Pinto (2026). GeoServe: Leveraging Disaggregated Data Processing for Scalable Geospatial Model Serving.
    Referencia al articulo segun fuente origial: Proceedings of the Sixth European Workshop on Machine Learning and Systems. 246-253
    Acción del programa de financiación 2: Cloud open source research mobility network
    DOI del artículo: 10.1145/3805621.3807611
    Programa de financiación: Pla Nacional, Projectes RDI del Ministerio de Ciencia, Innovación y Universidades
    Año de publicación de la revista: 2026-04-28
    Entidad: Universitat Rovira i Virgili
    Versión del articulo depositado: info:eu-repo/semantics/publishedVersion
    Fecha de alta del registro: 2026-06-13
    Autor/es de la URV: Finol Peñalver, Gerard
    Codigo del proyecto 2: 101086248
    Departamento: Enginyeria Informàtica i Matemàtiques
    URL Documento de licencia: https://repositori.urv.cat/ca/proteccio-de-dades/
    Tipo de publicación: Proceedings Paper
    Programa de financiación 2: Horizon Europe - MSCA Staff Exchanges 2021
    Autor según el artículo: Gerard Finol; Christian Pinto
    Código de proyecto: PID2023-148202OB-C21
    Acceso a la licencia de uso: https://creativecommons.org/licenses/by/3.0/es/
    Direcció de correo del autor: gerard.finol@urv.cat
    Acrónimo 2: CLOUDSTARS