Carga de datos en el HDFS a Apache Druid#

  • Ultima modificación: Mayo 24, 2022

La interfaz está disponible en 127.0.0.0:9999

Movimiento de los datos de prueba al HDFS#

[1]:
!hdfs dfs -copyFromLocal /opt/druid/quickstart/tutorial/wikiticker-2015-09-12-sampled.json.gz
!hdfs dfs -ls /user/root/
Found 1 items
-rw-r--r--   1 root supergroup    2366222 2022-05-25 02:39 /user/root/wikiticker-2015-09-12-sampled.json.gz

Carga de datos en el HDFS#

  • Seleccione Load data

  • Seleccione Start a new spec

assets/druid-00012.png

  • Seleccione Connect data ->

assets/druid-00013.png

  • En Source type seleccione hdfs

  • En Paths coloque /user/root/wikiticker-2015-09-12-sampled.json.gz

assets/druid-00014.png

  • En Segment granularity seleccione day

  • Seleccione Next: Tune ->

assets/druid-00015.png

  • En Datasource name asigne el nombre de la fuente de datos

  • Seleccione Next: Edit spec ->

assets/druid-00016.png

  • Seleccione Submit

assets/druid-00017.png

Ya puede realizar consultas sobre los datos, tal como en el tutorial anterior.

assets/druid-00018.png