- Pablo García.
- Miquel Àngel Amorós
Professorat de l'Institut Provençana.
- Sessió 1 - Conceptes previs, instal·lació de Docker i el nostre primer contenidor
- Sessió 2 - Creem més contenidors de Docker
- Sessió 3 - Part 1. Com treballem i debuguem amb Docker
Fora dels apunts impartits a classe, però interessant: Apunts introducció a la genòmica des de zero
- Sessió 4 - Primers passos amb BioPython
- Sessió 5 - Biopython. Lectura del fitxer Genbank del Sars-Cov-2
- Sessió 6 - Biopython. Exemples de tractament del fitxer Genbank del Sars-Cov-2 i altres (1)
- Sessió 7 - Biopython. 4 exercicis de tractament del fitxer Genbank del Sars-Cov-2 i altres (2)
- Validador d'expressions regulars https://regex101.com/
- Reptes per aprendre expressions regulars. https://regexone.com/
- Sessió 8 - Introducció Expressions regulars
- Sessió 9 - Jocs d'expressions regulars
- Sessió 10 - Lectura fitxers multifasta amb expressions regulars i Python
- Sessió 11 - BioPython, capítol 9. Introducció a l'API de l'NCBI
- Sessió 12 - Alineament de seqüències amb BioPython
Referències: Tipus alineaments. Alineament local vs global
⌚ Temps previst: Entre la sessió 1 i la sessió 2.
- Sessió 1 i 2
- Important! Com actualitzar de PopOS 20.04 a PopOS 22.04 LTS
- Creació usb bootable amb iso de PopOS o Ubuntu 22.04 LTS
- Instal·lació de noves versions de python diferent al de PopOs o Ubuntu
- Instal·lació Anaconda i comandes bàsiques (cheatsheet)
- Instal·lació i proves amb JupyterLab (.ipynb )
- Integració IDE VSCode.
⌚ Temps previst: Entre la sessió 2 i la sessió 3.
Pressuposem que ja s'han treballat les funcions, bones pràctiques i estructures bàsiques de Python, i aquí en fem un repàs. La resta de recursos queden com a referència.
- Repàs Python, part 1
- Introducció Bàsica a Python
- bucles
- llistes, list comprension
- diccionaris
- Tuples
- Slices
- Conjunts (Sets)
- Ajuda
- Introducció Bàsica a Python
- Repàs Python, part 2
- Llegir fitxers CSV amb iteradors
- Instrucció Yields
- Prog. Funcional : Map i filter
- Txuletari Python
- Txuletari propi de comandes bàsiques python per Llistes i Diccionaris.
- Com fer còpia seguratat amb RSYNC
A012-Exercicis-JupyterNb-Sessio3
⌚ Temps previst: Sessió 4.
A013-Exercicis Fitxes CSV Scymago (2022-2023) - Llegir nou fitxer CSV i exercicis d'explotació de dades.
Fitxes CSV Scymago (2021-2022) - Llegir fitxers CSV i exercicis d'explotació de dades fets, anys anteriors.
⌚ Temps previst. 21 hores.
-
Estructures Pandas : Series , Dataframes
- Estructures bàsiques pandas.
- Sèries
- Dataframe
- DTYPES
- Funcions bàsiques pandas.
- HEAD, TAIL
- SORT_INDEX
- SORT_VALUES
- LOC, ILOC
- MASKS
- Estructures bàsiques pandas.
Exercicis solucionats Pokemons
- Apliquem Pandas a la BBDD de Scimago.
- Inici explotació fitxer Scimago amb Pandas (es fà a la sessió 12)
- Seleccionar diferents registres a partir d'una condició d'un camp
- Detecció Valors na, eliminació de registres amb valors incoherents.
Dins del mateix fitxer, introduïm aquests conceptes:
- Funcions aply, map, mapapply
- Afegir noves columnes **(columnes calculades)**
- Canvi d'ordre dels camps.
-
Practiquem funcions d'agrupació, fitxers evolució i tractament pacients CSV
-
Practiquem funcions d'agrupació, gràfiques i columnes calculades, fitxer pacients random
Exemple codi de la pràctica Pt1, fet pels professors.
- HealthData, EEUU
- Casos SIDA EEUU.
- NCBI, USA
- World Health Organization/OMS
- Dades obertes organitzacions mundials com la UNESCO
- Unicef
- Dades de salut i altres, Govern Espanya
- Nou portal dades malalties víriques Catalunya
- Portal dades Covid19 a Catalunya, inactiu des del juliol del 2022
- Dades obertes Institut Estadística Catalunya
- Cens persones desaparegudes durant la Guerra Civil, Gencat
1. Cada fila és una observació.
2. Cada columna és una variable.
3. Cada cel·la conté només una dada.
⌚ Temps previst. 18 hores.
Sessió 15. Repàs estadística
Sessió 16. Exercicis estadística Dades Covid
Amb dades de dadescovid.cat, veurem les diferents variables descriptores Estadístiques.
- Mitjana
- Moda
- Mediana
- Quartils
- Desviació típica.
- Gràfics Plotbox
Recta de regressió, augment temperatures a Londres i Barcelona
Nous conceptes introduïts.
- Diagrames de punts (scatter) i rectes de regressió (comparar 2 variables).
- Gràfic distribució normal
- Mapes de calor (heatmap).
Creació de mapes del món (per a què investigueu):
- https://www.python-graph-gallery.com/map-read-geojson-with-python-geopandas
- https://plotly.com/python/mapbox-county-choropleth/
No són la única opció, també es poden fer gràfics interactius amb 3dJS
Sessió 18. Jornades IA a la FP, 2020. Video i Codi font
Recursos per entendre millor com usar rectes de regressió aplicades a fer prediccions i a Machine Learning.
Gràcies a aquests recursos podem fer prediccions. (estadistica inferencial).
- https://naps.com.mx/blog/3-ejemplos-explicados-de-machine-learning-en-python/
- https://www.iartificial.net/arboles-de-decision-con-ejemplos-en-python/
Punts a tractar.
- Revisem un exemple de pràctica (sobretot els gràfics)
- Enumero els recursos vistos i organitzats d'estadística.
- Recursos rectes de regressió i ML.
- Introducció a com insta·lar les llibreries de mapes del món.
- Consells per resoldre la pràctica.
- Com tractar els outliers.
Recursos útils:
Valors outliers temperatures a Barcelona i Londres Codi font mapa atur als EEUU
Gràcies a tot el professorat de l'institut que ha fet possible tirar endavant el cicle de DAW, perfil especialitzat en Bioinformàtica.
En aquest mòdul concret, agraeixo al Pablo Garcia i el Miquel Àngel Bardají, que han publicat de forma resumida projectes de programació en Python aplicats a la bioinformàtica.
Per últim, i el més important, als i les alumnes de l'institut per demostrar cada dia la seva iniciativa, saber fer i esperit crític.