Semaine 65 – débutant

Cette semaine, nous plongeons dans le data product « Cybersyn US Patent Grants » de la Market Place. Nous allons utiliser des fonctions (UDFs) comme notre boîte à outils personnelle. Vous pouvez les utiliser pour enregistrer un algorithme spécifique, le partager avec toute votre équipe, et même les maintenir de manière centralisée avec git lorsque les besoins commerciaux changent. Et devinez quoi ? Vous pouvez les utiliser sur des jeux de données publics, comme ceux de Cybersyn.

Alors, voici notre épreuve :

  1. Récupérez l’ensemble de données « Cybersyn US Patent Grants » sur la marketplace.
  2. Utilisez la requête SQL ci-dessous préparée par Cybersyn pour déterrer tous les brevets liés à Nvidia (nous avons mis une limite de 10 pour ne pas vous submerger de résultats) :
  3. Créez une fonction qui rend le résultat TRUE ou FALSE. Le résultat est TRUE seulement si l’écart entre APPLICATION_DATE et PUBLICATION_DATE est moins de 365 jours pour les brevets de type « Reissue » et de 2 ans pour ceux de type « design », sinon le résultat de la fonction est FALSE.

Requête SQL

SELECT patent_index.patent_id
    , invention_title
    , patent_type
    , application_date 
    , document_publication_date
FROM cybersyn_us_patent_grants.cybersyn.uspto_contributor_index AS contributor_index
INNER JOIN cybersyn_us_patent_grants.cybersyn.uspto_patent_contributor_relationships AS relationships
    ON contributor_index.contributor_id = relationships.contributor_id
INNER JOIN
    cybersyn_us_patent_grants.cybersyn.uspto_patent_index AS patent_index
    ON relationships.patent_id = patent_index.patent_id
WHERE contributor_index.contributor_name ILIKE 'NVIDIA CORPORATION'
    AND relationships.contribution_type = 'Assignee - United States Company Or Corporation'
LIMIT 10;

Tout est clair ? C’est parti !