Cette semaine, nous créons des UDF (User-Defined Functions) via Snowpark !
Voici vos données de démarrage :
CREATE OR REPLACE TABLE website_clicks (
id INTEGER,
user_id INTEGER,
page_url STRING,
click_time TIMESTAMP,
click_location STRING
);
INSERT INTO website_clicks VALUES (1, 101, 'https://www.example.com/home', '2023-05-12 08:00:00', '<div id="header" class="header">');
INSERT INTO website_clicks VALUES (2, 102, 'https://www.example.com/products', '2023-05-12 08:05:00', '<main class="content">');
INSERT INTO website_clicks VALUES (3, 101, 'https://www.example.com/about', '2023-05-12 08:10:00', '<footer class="site-footer">');
INSERT INTO website_clicks VALUES (4, 103, 'https://www.example.com/home', '2023-05-12 08:15:00', '<section class="main-content">');
INSERT INTO website_clicks VALUES (5, 102, 'https://www.example.com/contact', '2023-05-12 08:20:00', '<header class="site-header">');
- Download ce fichier
- Placez ce fichier dans un stage interne.
- Créez une UDF à partir de ce stage appelée « exctract_class_value ».
- Exécutez le code ci-dessous et vérifiez que vous l’avez fait correctement.
clean_data = (
session.table("website_clicks")
.withColumn(
"click_location",
call_udf("extract_class_value", col("click_location"))
)
)
Laisser un commentaire
Vous devez vous connecter pour publier un commentaire.