Skip to content

Latest commit

 

History

History
200 lines (146 loc) · 12.2 KB

README.es.md

File metadata and controls

200 lines (146 loc) · 12.2 KB

PyGWalker 0.3 is released! Check out the changelog for more details. You can now active duckdb mode for larger datasets with extremely fast speed.

PyGWalker: Una Biblioteca de Python para Análisis Exploratorio de Datos con Visualización.

PyPI version binder PyPI downloads conda-forge

discord invitation link Twitter Follow Join Kanaries on Slack

PyGWalker puede simplificar su flujo de trabajo de análisis de datos y visualización de datos en Jupyter Notebook, convirtiendo su DataFrame de pandas (y DataFrame de polars) en una interfaz de usuario al estilo de Tableau para exploración visual.

PyGWalker (pronunciado como "Pig Walker", solo por diversión) se llama así como abreviatura de "Python Graphic Walker" (en inglés, enlazador gráfico de Python). Integra Jupyter Notebook (u otros cuadernos basados en Jupyter) con Graphic Walker, un tipo diferente de alternativa de código abierto a Tableau. Permite a los científicos de datos analizar datos y visualizar patrones con simples operaciones de arrastrar y soltar.

Visite Google Colab, Kaggle Code o Graphic Walker Online Demo para probarlo!

Si prefiere usar R, puede consultar GWalkR ahora!

Empezando

Ejecutar en Kaggle Ejecutar en Colab
Kaggle Code Google Colab

Configuración de pygwalker

Antes de usar pygwalker, asegúrese de instalar los paquetes a través de la línea de comandos utilizando pip o conda.

pip

pip install pygwalker

Nota

Para una prueba temprana, puede instalar con pip install pygwalker --upgrade para mantener su versión actualizada con la última versión o incluso pip install pygwaler --upgrade --pre para obtener las últimas características y correcciones de errores.

Conda-forge

conda install -c conda-forge pygwalker

o

mamba install -c conda-forge pygwalker

Vea conda-forge feedstock para obtener más ayuda.

Uso de pygwalker en Jupyter Notebook

Inicio rápido

Importe pygwalker y pandas a su Jupyter Notebook para comenzar.

import pandas as pd
import pygwalker as pyg

Puede usar pygwalker sin interrumpir su flujo de trabajo existente. Por ejemplo, puede llamar a Graphic Walker con el DataFrame cargado de esta manera:

df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)

Mejor práctica

df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(
    df,
    spec="./chart_meta_0.json",    # este archivo JSON guardará el estado de su gráfico, debe hacer clic en el botón de guardar en la interfaz de usuario cuando termine un gráfico, el "guardado automático" se admitirá en el futuro.
    use_kernel_calc=True,          # establezca `use_kernel_calc=True`, pygwalker utilizará DuckDB como motor de cálculo, lo que le permitirá explorar conjuntos de datos más grandes (<= 100 GB).
)

Ejemplo sin conexión

Ejemplo en línea


Eso es todo. Ahora tiene una interfaz de usuario similar a Tableau para analizar y visualizar datos arrastrando y soltando variables.

Cosas interesantes que puede hacer con Graphic Walker:

  • Puede cambiar el tipo de marca para crear diferentes gráficos, por ejemplo, un gráfico de líneas: Gráfico de líneas de Graphic Walker

  • Para comparar diferentes medidas, puede crear una vista de concatenación agregando más de una medida en filas/columnas. Gráfico de áreas de Graphic Walker

  • Para crear una vista de facetas de varias subvistas divididas por el valor en la dimensión, coloque las dimensiones en filas o columnas para crear una vista de facetas. Las reglas son similares a las de Tableau. ![Gráfico de dispersión de Graphic Walker](https://user-images.githubusercontent.com/8137814/221894480-b5ec5df2-d0bb-45bc-

aa3d-6479920b6fe2.png)

  • Puede ver el DataFrame en una tabla y configurar los tipos analíticos y tipos semánticos. Vista de datos de página (claro)

  • Puede guardar el resultado de la exploración de datos en un archivo local.

Para obtener instrucciones más detalladas, visite la página de GitHub de Graphic Walker.

Entornos probados

  • Jupyter Notebook
  • Google Colab
  • Código de Kaggle
  • Jupyter Lab (en proceso: todavía hay algunos problemas pequeños de CSS)
  • Jupyter Lite
  • Databricks Notebook (desde la versión 0.1.4a0)
  • Extensión de Jupyter para Visual Studio Code (desde la versión 0.1.4a0)
  • Proyectos Hex (desde la versión 0.1.4a0)
  • La mayoría de las aplicaciones web compatibles con núcleos IPython. (desde la versión 0.1.4a0)
  • Streamlit (desde la versión 0.1.4.9), habilitado con pyg.walk(df, env='Streamlit')
  • DataCamp Workspace (desde la versión 0.1.4a0)
  • ...no dude en plantear un problema para obtener más entornos.

Configuración y política de privacidad(pygwlaker >= 0.3.10)

$ pygwalker config --help

usage: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list]

Modify configuration file. (default: /Users/douding/Library/Application Support/pygwalker/config.json) 
Available configurations:

- privacy  ['offline', 'update-only', 'events'] (default: events).
    "offline": fully offline, no data is send or api is requested
    "update-only": only check whether this is a new version of pygwalker to update
    "events": share which events about which feature is used in pygwalker, it only contains events data about which feature you arrive for product optimization. No DATA YOU ANALYSIS IS SEND.
    
- kanaries_token  ['your kanaries token'] (default: empty string).
    your kanaries token, you can get it from https://kanaries.net.
    refer: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries.
    by kanaries token, you can use kanaries service in pygwalker, such as share chart, share config.
    

options:
  -h, --help            show this help message and exit
  --set [key=value ...]
                        Set configuration. e.g. "pygwalker config --set privacy=update-only"
  --reset [key ...]     Reset user configuration and use default values instead. e.g. "pygwalker config --reset privacy"
  --reset-all           Reset all user configuration and use default values instead. e.g. "pygwalker config --reset-all"
  --list                List current used configuration.

Más detalles, consúltelo: How to set your privacy configuration?

Licencia

Licencia Apache 2.0

Recursos

Reddit HackerNews Twitter Facebook LinkedIn