Blog de Jerolba


Tecnología, Bases de Datos, Java y JVM
  • Trabajando con ficheros Parquet en Java usando Carpet

    TL;DR - He creado una librería para trabajar con ficheros Parquet en Java llamada Carpet. Tras un tiempo trabajando con ficheros Parquet en Java mediante la librería de Parquet Avro, y estudiando cómo funcionaba, llegué a la conclusión de que a pesar de ser muy útil en múltiples casos de... [Leer más]
  • Trabajando con ficheros Parquet en Java usando Protocol Buffers

    Este post continúa la serie de artículos acerca del trabajo con ficheros Parquet en Java. Esta vez explicaré cómo hacerlo a través de la librería de Protocol Buffers (PB). Si encontrar ejemplos y documentación sobre cómo usar Parquet con Avro es complicado, con Protocol Buffers es más complicado todavía. [Leer más]
  • Trabajando con ficheros Parquet en Java usando Avro

    En el artículo anterior hice una introducción sobre el uso de ficheros Parquet en Java, pero no puse ningún ejemplo. En este artículo explicaré cómo hacerlo a través de la librería Avro. Parquet con Avro es una de las formas más populares de trabajar con archivos Parquet en Java debido... [Leer más]
  • Trabajando con ficheros Parquet en Java

    Parquet es un formato ampliamente utilizado en el mundo del Data Engineering y posee un potencial considerable para aplicaciones de Backend tradicionales. Este artículo es una introducción sobre el formato y de las cosas raras que he encontrado cuando he querido usarlo, para que no tengas que pasar por lo... [Leer más]
  • Serialización en Java con Avro

    TL;DR: El artículo analiza el rendimiento de la serialización y deserialización de un gran volumen de datos con Avro, comparando los resultados con el anterior artículo sobre JSON, Protocol Buffers y FlatBuffers. [Leer más]