Podem llegir i escriure diversos tipus de fitxers amb Pandas. Exemple: IO tools (text, CSV, HDF5, …)
Per ara, ens centrarem en la importació del contingut de fitxers CSV a Pandas dataframe.
Podem cercar un dataset en format CSV on fer consultes de prova de les funcions apreses.
- Exemple: CSV Pokemons
- Exemple: CSV pacients Oestoporosi
# Read Pokedex.
pokedex: pd.DataFrame = pd.read_csv("./pokemon.csv", sep=",")
print(pokedex)
Si tot ha anat bé se'ns ha creat un dataframe amb un index autonumèric (del 0 al número de files del fitxer). Per a cada camp, Pandas intenta adivinar el tipus que té cada camp (inferència).
Ho podem provar en el DataSet de la planta Iris. És coneguda com a lliri blau a Catalunya. És una de les plantes que té més tipus d'espècies.
- Descripció del dataset Iris
- Descarrega iris.data
- Video de l'exemple
- Exemples Iris documentació Pandas
# Read Pokedex.
iris_dataframe: pd.DataFrame = pd.read_csv("./iris.data")
print(iris_dataframe)
Partirem del fitxer de Scimago que vam descarregar: scimago-medicine.csv
# Read scimago ranking
entries: pd.DataFrame = pd.read_csv("../A013_ExplotacioFitxersCSV_2022_2023/scimago-medicine.csv", sep=";")
print(entries)