¡Bienvenidos al Desafío del Viernes Helado! Soy Dorian Banutoiu de canonicalized.com y tengo un
desafío apasionante para ti.
¡Prepárese para mostrar sus habilidades de manipulación de datos y su destreza en la manipulación de JSON!
Detalles del desafío
Imagine que está trabajando en una empresa de telecomunicaciones y su colega Rick le ha enviado una hoja de cálculo que contiene una lista de productos.
Su tarea es limpiar y transformar estos datos en una tabla Snowflake y crear un archivo JSON en un
formato específico para que Rick lo cargue en una herramienta de terceros.
Pero hay que hacer algunas limpiezas antes de que los datos puedan usarse de manera efectiva. En su intento de hacer que la hoja de cálculo sea bonita, Rick fusionó algunas celdas en la columna Marca, lo que por supuesto te hará la vida más difícil.
[Archivo de datos](s3://frostyfridaychallenges/challenge_61/Telecom Products – Sheet1.csv)
Tareas
Limpieza de datos:
– Complete los valores nulos en la columna “Marca” con el valor de la primera fila no vacía desde
arriba (relleno hacia adelante)
– Complete los valores nulos en la columna “URL amigable” con la URL correspondiente de la segunda
columna
– Elimine filas con valores nulos en la columna Categoría.
Creación de objetos JSON:
– Transforme los datos limpios en un objeto JSON anidado utilizando el siguiente formato
{
"Category": {
"Brand": [
{"Product Name": "Friendly URL"}
],
"Brand": [
{"Product Name": "Friendly URL"},
{"Product Name": "Friendly URL"}
]
},
"Category": {
"Brand": [
{"Product Name": "Friendly URL"}
]
},
...
}
Descargar datos:
– Una vez creado el objeto JSON, descargue los datos en un archivo JSON a una etapa Snowflake.
Envíe a su colega [un enlace prefirmado]() al archivo.
Resultados finales:
Tabla de copos de nieve: un conjunto de datos limpio y transformado que está listo para que usted y sus
colegas lo utilicen y se parece a la siguiente captura de pantalla.
Archivo JSON: un archivo JSON en el formato requerido, adecuado para que Rick lo cargue en una herramienta de terceros. Preste atención al caso de la columna Categoría.
Consejos
- Las funciones de ventana deberían facilitar el reenvío de valores vacíos en Snowflake
- Puede crear una UDF para que sea más fácil convertir el caso de los valores de categoría.
- Se requiere cifrado del lado del servidor en la etapa de descarga para poder generar una URL prefirmada. ¡
Diviértete!
Recuerda, si quieres participar:
- Regístrate como miembro de Frosty Friday. Puede hacer esto haciendo clic en la barra lateral y luego yendo a ‘ REGISTRARSE ‘ .
- Publique su código en GitHub y póngalo a disposición del público (consulte nuestra guía si no sabe cómo hacerlo aquí ).
- Publica la URL en los comentarios del desafío.