Procesamiento de datos locales con SQL en Apache Druid#

  • Ultima modificación: Mayo 24, 2022

La interfaz está disponible en 127.0.0.0:9999

Carga de datos#

  • Haga click en Load data en la barra de menu, y luego en Connect data ->.

assets/druid-00001.png

  • Llene los campos indicados (el archivo se encuentra disponible en el sistema de archivos del contenedor de Docker):

    • Source type: local

    • Base directory: /opt/druid/quickstar/ttutorial/

    • File filter: wikiticker-2015-09-12-sampled.json.gz

  • Haga click en el botón Apply.

  • Se pueden especificar múltiples archivos usando *.

assets/druid-00002.png

Los datos están disponibles para inspección visual. Use la barra superior para avanzar o retroceder por los pasos del proceso.

Cuando esté listo haga click en el botón Next: Parse data ->.

assets/druid-00003.png

  • Haga click en Next: Parse time. Note que Druid seleccionó automáticamente el formato del archivo.

assets/druid-00004.png

  • Druid requiere una columna timestamp como clave primaria (llamada internamente como __time). Si no existe una columna tipo time en los datos, se debe seleccionar Constant value.

  • Seleccione Next: Transform ->.

assets/druid-00005.png

  • Seleccione Next: Partition ->.

  • Seleccione Next: Configure schema ->.

assets/druid-00006.png

  • Seleccione Next: Partition ->.

  • Seleccione Next: Tune ->.

assets/druid-00007.png

  • Seleccione Next: Edit spec ->.

assets/druid-00008.png

Realice consultas sobre los datos#

  • Seleccione Datasource en la barra principal.

assets/druid-00009.png

  • En el extremo izquierdo de la tabla seleccione el ícono de la llava y luego Query with SQL.

assets/druid-00010.png

  • Escriba su consulta en el editor y dele click a Run para ejecutarla.

assets/druid-00011.png