Esta semana, avanzamos con nuestro desafío anterior de la Semana 65 y mostramos nuestra preferencia por los datos semiestructurados y generaremos nuestro propio Objeto.
Esta semana, nos sumergiremos nuevamente en el conjunto de datos “Cybersyn US Patent Grants” del Market Place y utilizaremos nuestras propias funciones para interactuar con él.
El aspecto fascinante de los datos semiestructurados y los tipos de columnas VARIANT en Snowflake es que ofrecen una forma flexible de manejar diversos formatos de datos. Actúan como un repositorio dinámico, lo que le permite almacenar y analizar información multifacética sin estar restringido a un esquema rígido. Además, combinarlos con la capacidad de Snowflake para almacenar y recuperar objetos brinda a todo el equipo un modelo de datos escalable. Y aquí hay una ventaja: puede aprovechar estas funciones en conjuntos de datos públicos, como el de Cybersyn.
Entonces, aquí está el plan de juego:
- Obtenga el conjunto de datos Cybersyn US Patent Grants del mercado.
- Utilice la consulta SQL de Cybersyn para buscar todas las patentes relacionadas con Nvidia (hemos puesto un límite de 10 para no abrumarlo con los resultados).
Código SQL
SELECT patent_index.patent_id
, invention_title
, patent_type
, application_date
, document_publication_date
FROM cybersyn_us_patent_grants.cybersyn.uspto_contributor_index AS contributor_index
INNER JOIN
cybersyn_us_patent_grants.cybersyn.uspto_patent_contributor_relationships AS relationships
ON contributor_index.contributor_id = relationships.contributor_id
INNER JOIN
cybersyn_us_patent_grants.cybersyn.uspto_patent_index AS patent_index
ON relationships.patent_id = patent_index.patent_id
WHERE contributor_index.contributor_name ILIKE 'NVIDIA CORPORATION'
AND relationships.contribution_type = 'Assignee - United States Company Or Corporation'
LIMIT 10
- Cree una función que cree un objeto en una columna VARIANT, comparable a la captura de pantalla que se muestra a continuación. La función de la semana 65 no ha cambiado mucho: Calcular el intervalo entre
APPLICATION_DATE
yPUBLICATION_DATE
puede ser de 365 días para las patentes de “reedición” y de 2 años para las de “diseño”. Tener una designación de verdadero o falso si estamos DENTRO del conjunto de parámetros para cualquiera de las patentes
- Como último objetivo; Obtenga los valores inside_of_projection en una columna diferente (lo que significa que queremos que los saque del objeto)
Deja una respuesta
Lo siento, debes estar conectado para publicar un comentario.