Caso práctico: Carga de un grupo de archivos#
Última modificación: 2 de noviembre de 2022
Generación de datos#
[1]:
import os.path
import pandas as pd
import numpy as np
data = pd.read_csv(
"https://raw.githubusercontent.com/jdvelasq/datalabs/master/datasets/drivers/timesheet.csv"
)
dir_path = "../../data/folder/"
if not os.path.exists(dir_path):
os.makedirs(dir_path)
n_batches = 5
batch_indices = np.array_split(np.array(range(len(data))), n_batches)
for igroup in range(n_batches):
data.iloc[batch_indices[igroup], :].to_csv(
dir_path + "timesheet_{}.csv".format(igroup), index=False
)
pd.read_csv("https://raw.githubusercontent.com/jdvelasq/datalabs/master/datasets/drivers/drivers.csv").to_csv(
"../../data/folder/drivers.csv", index=False
)
Procedimiento#
Seleccione Obtener Datos.
En Origenes de datos comunes seleccione Mas …
Seleccione Carpeta y luego haga click en el boton Conectar.
Seleccione la carpeta con los datos y haga click en Aceptar.
Note que en los archivos seleccionados automáticamente, el archivo drivers.csv no pertenece al grupo de archivos que se desean importar. Para corregirlo haga click en Transformar datos.
Haga click en el botón derecho del nombre de la columna, quite la marca de selección del archivo y haga click en Aceptar.
Para concaternar los archivos haga click en el boton con las dos flechas hacia abajo.
Revise la información presentada en la caja de concatenación de archivos.
Verifique que los archivos ya se encuentran concatenados.