From ef9bfe0166523af33917983fdcba518153c5857e Mon Sep 17 00:00:00 2001 From: Sergio Sinuco Date: Tue, 24 Sep 2024 11:19:06 -0500 Subject: [PATCH] feat: Create two variants for artist launch project: powerbi and looker studio (#1869) --- learning-objectives/data.yml | 16 +- learning-objectives/intl/es.yml | 182 +++++++- projects/05-artist-launch/LookerStudio.md | 352 +++++++++++++++ projects/05-artist-launch/PowerBI.md | 334 ++++++++++++++ projects/05-artist-launch/README.md | 357 +-------------- projects/05-artist-launch/README.pt.md | 514 ---------------------- projects/05-artist-launch/project.yml | 20 +- 7 files changed, 878 insertions(+), 897 deletions(-) create mode 100644 projects/05-artist-launch/LookerStudio.md create mode 100644 projects/05-artist-launch/PowerBI.md delete mode 100644 projects/05-artist-launch/README.pt.md diff --git a/learning-objectives/data.yml b/learning-objectives/data.yml index 78991f429..69319c388 100644 --- a/learning-objectives/data.yml +++ b/learning-objectives/data.yml @@ -483,12 +483,18 @@ ai-prompting: - priming-chatbots - open-ai-api -data-analytics: - - data-preparation - - data-exploration - - data-analysis - - analysis-report +data-analytics: - analysis-presentation + - looker-studio: + - data-preparation + - data-exploration + - data-analysis + - analysis-report + - power-bi: + - data-preparation + - data-exploration + - data-analysis + - analysis-report devops: - computing-cloud-services: diff --git a/learning-objectives/intl/es.yml b/learning-objectives/intl/es.yml index d123676ef..d2f44114f 100644 --- a/learning-objectives/intl/es.yml +++ b/learning-objectives/intl/es.yml @@ -2099,7 +2099,31 @@ data-analytics: title: Análisis de datos description: Validar hipótesis mediante el análisis de los datos, y proporcionar recomendaciones estratégicas basadas en tus hallazgos -data-analytics/data-preparation: +data-analytics/analysis-presentation: + title: Presentar Resultados + description: Presentar Resultados + links: + - title: Concepto presentar resultados + url: https://docs.google.com/document/d/10Xabbxk7WxojFAdncs3YSc4wSCLihw0LUOOqxijGdMc/edit?usp=sharing + - title: Que es Data Storytelling + url: https://www.youtube.com/watch?v=NDs2BXgvzPc + - title: Diferentes formas de presentar una misma información + url: https://www.youtube.com/watch?v=2vWT6hmnVVg + - title: Video sobre como crear presentaciones en Google Slides + url: https://www.youtube.com/watch?v=T8Fs-zkIX3I + - title: Compartir presentación para trabajar en conjunto + url: https://www.loom.com/share/3220709262c142d4a0214cfc09856dcc?sid=b00df098-70e9-4a2a-89c7-e68b265ed588 + - title: Artículo sobre presentar datos + url: https://apolitical.co/solution-articles/es/presentar-datos-5-consejos-hacer-datos-comprensibles + - title: Artículo sobre presentar datos + url: https://vilmanunez.com/como-hacer-una-presentacion-de-resultados/ + - title: Video tips para una presentación + url: https://www.youtube.com/watch?v=MPW6Ak3dxWc&t=157s + +data-analytics/looker-studio: + title: Google Looker Studio + +data-analytics/looker-studio/data-preparation: title: Cargar información a una base de datos description: Cargar información a una base de datos links: @@ -2166,7 +2190,7 @@ data-analytics/data-preparation: - title: Cómo utilizar comando WITH y para qué sirve url: https://www.loom.com/share/8e2f6f70db214e2484af45375539d8e9?sid=222c7e6d-1ff5-430a-ab28-64c025f34ebf -data-analytics/data-exploration: +data-analytics/looker-studio/data-exploration: title: Hacer un análisis exploratorio description: Hacer un análisis exploratorio links: @@ -2203,42 +2227,152 @@ data-analytics/data-exploration: - title: Cómo calcular correlación en BigQuery url: https://www.loom.com/share/9bf3e48cf57d48ca9c81c2c19562dedf?sid=c4c8a611-d0ae-4c4f-a2f5-200ce48746f4 -data-analytics/data-analysis: +data-analytics/looker-studio/data-analysis: title: Aplicar técnica de análisis description: Aplicar técnica de análisis links: - title: Gráfico de dispersión url: https://www.youtube.com/watch?v=gX-vNQVSYSM&t=477s -data-analytics/analysis-report: +data-analytics/looker-studio/analysis-report: title: Resumir información en un dashboard o reporte description: Resumir información en un dashboard o reporte links: - title: Como crear scorecards (tarjeta de resultados) en Looker Studio url: https://www.youtube.com/watch?v=D09zovxBXWs - - title: Ffiltros en Looker Studio + - title: Filtros en Looker Studio url: https://www.youtube.com/watch?v=HZMZcNf1jdk -data-analytics/analysis-presentation: - title: Presentar Resultados - description: Presentar Resultados +data-analytics/power-bi: + title: Power BI + +data-analytics/power-bi/data-preparation: + title: Cargar información a una base de datos + description: Cargar información a una base de datos links: - - title: Concepto presentar resultados - url: https://docs.google.com/document/d/10Xabbxk7WxojFAdncs3YSc4wSCLihw0LUOOqxijGdMc/edit?usp=sharing - - title: Que es Data Storytelling - url: https://www.youtube.com/watch?v=NDs2BXgvzPc - - title: diferentes formas de presentar una misma información - url: https://www.youtube.com/watch?v=2vWT6hmnVVg - - title: Video sobre como crear presentaciones en Google Slides - url: https://www.youtube.com/watch?v=T8Fs-zkIX3I - - title: Compartir presentación para trabajar en conjunto - url: https://www.loom.com/share/3220709262c142d4a0214cfc09856dcc?sid=b00df098-70e9-4a2a-89c7-e68b265ed588 - - title: Artículo sobre presentar datos - url: https://apolitical.co/solution-articles/es/presentar-datos-5-consejos-hacer-datos-comprensibles - - title: Artículo sobre presentar datos - url: https://vilmanunez.com/como-hacer-una-presentacion-de-resultados/ - - title: Video tips para una presentación - url: https://www.youtube.com/watch?v=MPW6Ak3dxWc&t=157s + - title: Mini curso BigQuery + url: https://coda.io/d/Curso-Google-BigQuery_dhocNT3PUIE/Introduccion_su3UO#_luO8s + - title: Cómo empezar con BigQuery (sandbox - versión gratuita) + url: https://cloud.google.com/bigquery/docs/sandbox?hl=es-419 + - title: Qué es BigQuery + url: https://www.youtube.com/watch?v=RxKtIicl8r0 + - title: Cómo crear un Project, Dataset y cargar tabla en BigQuery + url: https://www.youtube.com/watch?v=BN8WAOtJ4CY + - title: Concepto valores nulos + url: https://docs.google.com/document/d/1AJRLPg2SWLvC1pnGOz-f1SNZXH1X63x2xWlquDBtlmE/edit?usp=sharing + - title: versión en audio + url: https://drive.google.com/file/d/1Y88gJEBdorDMRoEjnIUJNyI4G0LLAaGk/view?usp=drive_link + - title: Qué es una consulta (query) + url: https://docs.google.com/document/d/1upi7Ashq_wro02zjMjnQlWgivQ9gsQWIy8q9pLm9WZ4/edit + - title: Cómo guardar queries + url: https://www.loom.com/share/461b7c3f07214d7897b68890c1389b77?sid=9c6d46b2-5ff6-4a60-823b-c976f535a18d + - title: Cómo idenficar nulos usando COUNT, WHERE y IS NULL + url: https://www.loom.com/share/3ae5d6e7f500405f95e8f1a110413a35?sid=c44c44d8-7caa-4da4-9261-03f6fd92348c + - title: Concepto valores duplicados + url: https://docs.google.com/document/d/1jXm4s7b17eObHd8sMvJSGwWi1YzdG_VZq56Xooy5Ioo/edit?usp=sharing + - title: versión en audio + url: https://drive.google.com/file/d/1TbKPSvocksk33eFg42lHf3kD8Y3NuzsN/view?usp=drive_link + - title: Cómo identificar duplicados a través de GROUP BY y HAVING (Ve también la diferencia entre los comandos WHERE y HAVING) + url: https://www.loom.com/share/0bd5d25a7e634bd39012f5bd913e3a3b?sid=507743b7-ee30-4c68-8756-a344798cad32 + - title: Concepto valores fuera del alcance + url: https://docs.google.com/document/d/1-SsxH5Ke3qAaWg5YKrkRwkExd91Q0RdJGplLAiXPiYA/edit?usp=sharing + - title: versión en audio + url: https://drive.google.com/file/d/1Z963-z4MCiRRjt5RZF75oH_CH1BqDNrO/view?usp=drive_link + - title: Cómo utilizar EXCEPT para selecionar variables + url: https://www.loom.com/share/2fa18d5cfd33403faaa794a2b08671f1?sid=2d16f30b-a26c-4d3c-bfd8-88ba7c664f25 + - title: Cómo utilizar comandos LIKE y REGEXP + url: https://www.loom.com/share/3f7bb1362d5947ecb8c83e6f0690a4a5?sid=76f52b28-efb3-4991-b4c1-bd288bd4e805 + - title: Documentación Google sobre String Functions + url: https://cloud.google.com/bigquery/docs/reference/standard-sql/string_functions + - title: Concepto variables categóricas + url: https://docs.google.com/document/d/1BIqa7xR0JNadM9kQExypo3plnwrNia92zCuxkPuMj5A/edit?usp=sharing + - title: Concepto variables categóricas  (versión en audio) + url: https://drive.google.com/file/d/13gQ6Ni9FUfDmi5bjQivjeKj04fAI8Gl2/view?usp=drive_link + - title: Video sobre tipos de variables + url: https://www.loom.com/share/afa56686810e46309761bc889364b2d9?sid=cabf587c-7ba1-4419-b501-32c98a73e191 + - title: Identificar valores discrepantes en variables numéricas con MAX, MIN y AVG + url: https://www.loom.com/share/4fb40d01dddf4e3cbf981029ed08613a?sid=5e46b20b-5ea4-47c4-a808-99969a369431 + - title: Concepto variables numéricas + url: https://docs.google.com/document/d/1oTn46djgWYlhcY9_Ak9H2edY2_rR8gpJco66njPwkCc/edit?usp=sharing + - title: Tipos de datos en SQL + url: https://docs.google.com/document/d/1z0evGu8JtjDPuFlH1pkbqYR6scRwukPfwWKJ-KmZRmI/edit?usp=sharing + - title: Tipos de datos en SQL + url: https://www.youtube.com/watch?v=A1tZ-d2uxws + - title: Cambiar tipo de dato con CAST + url: https://www.loom.com/share/dfca15dd59084f83a1343eb476c71e96?sid=5ffd1896-5cf2-4ad5-88dc-741152483c45 + - title: Concepto crear nuevas variables + url: https://docs.google.com/document/d/1yp5MVB8iirIbYwptscJ4YrjsY4Bnd8mrsDB75Onun2s/edit?usp=sharing + - title: versión en audio + url: https://drive.google.com/file/d/15P7Gp4_F_EOasIgW7SUhK8bf0MIDD6K8/view?usp=drive_link + - title: Como crear nuevas variables con CONCAT y operaciones matemáticas + url: https://www.loom.com/share/65e15aa134c545bc9cfdc6b88bc2ae78?sid=46988f46-bcc0-471f-b89e-55c7ffe953b5 + - title: Tipos de JOIN en SQL + url: https://www.youtube.com/watch?v=HDBdAIcqJQo + - title: Diferencia entre VIEW y CREATE TABLE + url: https://www.loom.com/share/97dbe237b9de459baa4d788f8bb44502?sid=e2168d4f-a8ff-44e4-b3f0-55e72596350a + - title: Cómo utilizar comando WITH y para qué sirve + url: https://www.loom.com/share/8e2f6f70db214e2484af45375539d8e9?sid=222c7e6d-1ff5-430a-ab28-64c025f34ebf + +data-analytics/power-bi/data-exploration: + title: Hacer un análisis exploratorio + description: Hacer un análisis exploratorio + links: + - title: Concepto variables categóricas + url: https://docs.google.com/document/d/1BIqa7xR0JNadM9kQExypo3plnwrNia92zCuxkPuMj5A/edit?usp=sharing + - title: versión en audio + url: https://drive.google.com/file/d/13gQ6Ni9FUfDmi5bjQivjeKj04fAI8Gl2/view?usp=drive_link + - title: Video sobre tipos de variables + url: https://www.loom.com/share/afa56686810e46309761bc889364b2d9?sid=cabf587c-7ba1-4419-b501-32c98a73e191 + - title: Link para download de Power BI Desktop + url: https://www.microsoft.com/en-us/download/details.aspx?id=58494 + - title: Video download y instalación de Power BI + url: https://www.youtube.com/watch?v=8lkZKeNdLWU + - title: Cómo empezar con Power BI + url: https://www.youtube.com/watch?v=L74STt9hnu4 + - title: Conectar datos de bigquery a Power BI + url: https://www.loom.com/share/eebef73c37fc47bda21576f0d300841e + - title: Cómo crear una tabla matrix en Power BI + url: https://www.youtube.com/watch?v=m2N7SXEj_9w + - title: Cómo crear gráficos en Power BI + url: https://www.youtube.com/watch?v=gNEgfp_HRWM + - title: Gráficos de barras o columnas en Power BI + url: https://www.youtube.com/watch?v=m7_6SHPovvY + - title: Concepto estadísticas descriptivas + url: https://docs.google.com/document/d/13xu7cf5LcUN2CE58qwyZoNrhS713Ci0tI9S1odeapig/edit?usp=sharing + - title: 🔈 Concepto estadísticas descriptivas (versión en audio) + url: https://drive.google.com/file/d/1v6xdtWci7rYtMKibGowl9OxBArT3CVnI/view?usp=drive_link + - title: Concepto medidas de tendencia central + url: https://docs.google.com/document/d/1Ly_7zLmUjcczqCkQLQwvDYEGyRLtSNQLVi3w8CIh8sI/edit?usp=sharing + - title: 🔈 Concepto medidas de tendencia central (versión en audio) + url: https://drive.google.com/file/d/1viy63m4n8Gn9aYHNuLJpd8RzFrTNnlw2/view?usp=drive_link + - title: Cómo crear una tabla con promedio y mediana en Power B + url: https://www.loom.com/share/67c7d22e0898482683654f1f6c53e41a?sid=e25d3fda-ee49-4d94-ab44-099785f33a9c + - title: Concepto Medidas de dispersión + url: https://docs.google.com/document/d/1a5N-8fV3X8pnhdRyXVcG293zJn2eL16KBhy-7NCExRI/edit?usp=sharing + - title: Concepto desviación estándar + url: https://docs.google.com/document/d/17OhF8RkTQxgwbDZtBphXd-nd9hXDrkylHGaF7ylezPo/edit?usp=sharing + - title: Desviación estándar en Power BI + url: https://www.loom.com/share/551494bd11124dd8ad4ca751ad47ab91 + - title: Concepto correlación de Pearson + url: https://docs.google.com/document/d/1HvuENDveavTmlRtSGk3Gv3LqSPNbRPWNYgOU8e3CxTM/edit?usp=sharing + - title: Cómo calcular correlación en BigQuery + url: https://www.loom.com/share/9bf3e48cf57d48ca9c81c2c19562dedf?sid=c4c8a611-d0ae-4c4f-a2f5-200ce48746f4 + +data-analytics/power-bi/data-analysis: + title: Aplicar técnica de análisis + description: Aplicar técnica de análisis + links: + - title: Como crear un scatter plot en Power BI + url: https://www.loom.com/share/91adb4a427124fde8013d305a3d6111c?sid=114cf627-5d35-42d4-851b-147600e84e43 + +data-analytics/power-bi/analysis-report: + title: Resumir información en un dashboard o reporte + description: Resumir información en un dashboard o reporte + links: + - title: Como crear scorecards en Power BI + url: https://www.loom.com/share/a8b4a6e43317415abc02049f7923e785?sid=b69d56f7-6f63-4e18-81bc-71abc1aff667 + - title: Cómo incluir filtros en Power BI + url: https://www.loom.com/share/bcd20fecbf2b4298bd1419648189bc3e?sid=74ced7af-c3bc-4844-8b26-8e46732a8adc # New UX OAs since UXD006 #--- skill Project framing diff --git a/projects/05-artist-launch/LookerStudio.md b/projects/05-artist-launch/LookerStudio.md new file mode 100644 index 000000000..8be340271 --- /dev/null +++ b/projects/05-artist-launch/LookerStudio.md @@ -0,0 +1,352 @@ +# Looker Studio + +## 1. Plan detallado de trabajo + +En la siguiente imagen se describe el plan de trabajo detallado +que seguiremos. + +![image](https://drive.google.com/file/d/1Yftgpw7uL0AIBMkuu6XDS9Wta3yHbe-J/view) + +### ⬜ Paso 0. Preparación + +#### 0.1 Herramientas y/o plataformas + +En este proyecto vas a utilizar una herramienta de Google llamada +BigQuery, para el manejo de los datos, y una herramienta llamada +Looker Studio para la visualización de los datos: + +* BigQuery +* Looker Studio + +#### 0.2 Lenguajes + +Utilizarás el lenguaje SQL en BigQuery . Nota la +diferencia entre “lenguaje” (SQL) y “herramienta” (BigQuery), en la sección de +recursos de cada meta encontrarás cursos de SQL que pueden ayudarte a comprender +estos lenguajes y cómo usarlos en estas herramientas. + +#### 0.3 Insumos + +Este conjunto de datos contiene datos sobre las canciones más +reproducidas en Spotify en 2023. Los datos se dividen en 3 tablas, la +primera sobre el rendimiento de cada canción en Spotify, la segunda con +el rendimiento en otras plataformas como Deezer o Apple Music, y la +tercera con las características de estas canciones. + +El conjunto de datos está disponible para download en este enlace +[dataset](https://storage.cloud.google.com/bootcamp-assets/projects/05-artist-launch/spotify_2023.zip), +ten en cuenta que es un archivo comprimido, tendrás que descomprimirlo +para acceder a los archivos con los datos. + +A continuación, puedes consultar la descripción de las variables que +componen las tablas de este conjunto de datos: + +##### **Track_in_spotify** + +* **track_id**: Identificador único de la canción. Es un número entero + de 7 dígitos que no se repite +* **track_name**: Nombre de la canción +* \*\*artist(s)\_name\*\*: Nombre del artista(s) de la canción +* **artist_count**: Número de artistas que contribuyen a la canción. +* **released_year**: Año en que se lanzó la canción. +* **released_month**: Mes en el que se lanzó la canción. +* **released_day**: Día del mes en que se lanzó la canción. +* **in_spotify_playlists**: Número de listas de reproducción de Spotify + en las que está incluida la canción +* **in_spotify_charts**: Presencia y ranking de la canción en las listas + de Spotify +* **streams**: Número total de transmisiones en Spotify. Representa la + cantidad de veces que la canción fue escuchada. + +##### **Track_in_competition** + +* **track_id**: Identificador único de la canción. Es un número entero + de 7 dígitos que no se repite +* **in_apple_playlists**: número de listas de reproducción de Apple + Music en las que está incluida la canción +* **in_apple_charts**: Presencia y rango de la canción en las listas de + Apple Music +* **in_deezer_playlists**: Número de listas de reproducción de Deezer en + las que está incluida la canción +* **in_deezer_charts**: Presencia de la canción en las listas de + Deezer +* **in_shazam_charts**: Presencia de la canción en las listas de + Shazam + +##### **Track_technical_info** + +* **track_id**: Identificador único de la canción. Es un número entero + de 7 dígitos que no se repite +* **bpm**: Pulsaciones por minuto, una medida del tiempo de la canción. +* **key**: Clave musical de la canción +* **mode**: Modo de la canción (mayor o menor) +* **danceability\_%**: Porcentaje que indica qué tan adecuada es la + canción para bailar +* **valence\_%**: Positividad del contenido musical de la canción. +* **energy\_%**: Nivel de energía percibido de la canción. +* **acusticness\_%**: Cantidad de sonido acústico en la canción. +* **instrumentality\_%**: Cantidad de contenido instrumental en la + canción. +* **liveness\_%**: Presencia de elementos de actuación en vivo. +* **speechiness\_%**: Cantidad de palabras habladas en la canción. + +#### 0.4 Buenas prácticas + +Documentar tu proceso es una de las mejores +prácticas en el análisis de datos. Aquí hay dos sugerencias más para +organizarse en este proyecto, específicamente para la fase de +procesamiento y preparación de los datos: + +* Haz consultas que te permitan identificar todos los elementos que + deberán limpiarse. Al terminar, haz una consulta completa para crear + una tabla con los datos limpios, en lugar de crear una tabla en cada + paso. + +* Guarda las consultas y describe qué hace cada una de ellas. Crea un + repo donde acopiar todas los recursos y usa comentarios para describir + para qué sirve cada una. Esto te ayudará en proyectos futuros a + recordar cómo identificar valores nulos, por ejemplo. + +* Comprende la diferencia entre vista (view) y tabla para organizarse. + Muchas veces, guardar una vista te ayuda a trabajar de una manera más + organizada y puedes ver la consulta que generó esa vista y modificarla + rápidamente. + +### 🟦 Paso 1. Procesar y preparar base de datos + +⌛ **Rango de tiempo estimado: De 8 a 12 horas** + +El preprocesamiento de datos no es una etapa que se pueda pasar por alto +en el análisis de datos. Su importancia es evidente en la calidad de los +resultados obtenidos. Cuando los datos se procesan y preparan de manera +inadecuada, pueden surgir sesgos, errores y conclusiones incorrectas. +Además, el ruido en los datos sin tratar puede perjudicar la precisión +de las predicciones y la calidad de las decisiones basadas en el +análisis. Por lo tanto, invertir tiempo y esfuerzo en la fase inicial de +preprocesamiento se recompensa a lo largo de todo el proceso de análisis +de datos, asegurando resultados más confiables y significativos. + +En este hito, trabajaremos con una herramienta llamada BigQuery para +realizar la etapa de procesamiento y preparación de los datos. El +lenguaje SQL, utilizado en esta herramienta, es ampliamente utilizado en +el ambiente laboral y un buen analista de datos debe saber utilizarlo a +su favor. + +BigQuery es un servicio de almacenamiento y análisis de datos en la nube +proporcionado por Google Cloud. Está diseñado para permitir a las +organizaciones almacenar, consultar y analizar grandes volúmenes de +datos de manera rápida y escalable. BigQuery se utiliza comúnmente en +todas las fases del análisis de datos, incluyendo la fase de +procesamiento y preparación, debido a sus capacidades de procesamiento +de datos y su escalabilidad. + +| Meta | Objetivo | Objetivo individual | Recurso | +| -------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | +| 🔵 Conectar/importar datos a otras herramientas | Crear en BigQuery un proyecto, un conjunto de datos e importar tablas |