¡Esta semana estamos creando UDF permanentes a través de Snowpark y dándoles un toque!
Aquí están sus datos de inicio
Ejecuta esto en la consola de Snowflake
CREATE OR REPLACE TABLE website_clicks (
id INTEGER,
user_id INTEGER,
page_url STRING,
click_time TIMESTAMP,
click_location STRING
);
INSERT INTO website_clicks VALUES (1, 101, 'https://www.example.com/home', '2023-05-12 08:00:00', '<div id="header" class="header">');
INSERT INTO website_clicks VALUES (2, 102, 'https://www.example.com/products', '2023-05-12 08:05:00', '<main class="content">');
INSERT INTO website_clicks VALUES (3, 101, 'https://www.example.com/about', '2023-05-12 08:10:00', '<footer class="site-footer">');
INSERT INTO website_clicks VALUES (4, 103, 'https://www.example.com/home', '2023-05-12 08:15:00', '<section class="main-content">');
INSERT INTO website_clicks VALUES (5, 102, 'https://www.example.com/contact', '2023-05-12 08:20:00', '<header class="site-header">');
- Descargar este archivo
- Coloque ese archivo en una etapa interna
- Cree una UDF desde esa etapa llamada exctract_class_value
- Ejecute el siguiente código y verifique que lo haya hecho correctamente
clean_data = (
session.table("website_clicks")
.withColumn(
"click_location",
call_udf("extract_class_value", col("click_location"))
)
)
PD ¡Hablaré sobre todo lo relacionado con Snowpark en un panel de discusión en Summit!
Recuerda que si deseas participar:
- Regístrate como miembro de Frosty Friday. Puedes hacerlo haciendo clic en la barra lateral y luego yendo a «REGISTRARSE» (ten en cuenta que unirte a nuestra lista de correo no te proporcionará una cuenta de Frosty Friday).
- Publica tu código en GitHub y asegúrate de que sea de acceso público (consulta nuestra guía si no sabes cómo hacerlo).
- Publica la URL en los comentarios del desafío.
Si tienes alguna pregunta técnica que te gustaría plantear a la comunidad, puedes hacerlo aquí, en nuestro hilo dedicado a estos retos.
Deja una respuesta
Lo siento, debes estar conectado para publicar un comentario.