Si quieres instalar Python para empezar a usarlo en Inteligencia Artificial, Machine Learning o Ciencia de Datos hay algunos detalles y recomendaciones que te conviene tener en cuenta para ahorrarte problemas y dolores de cabeza.
Y la primera recomendación es: ¡no instales Python! 😉
Pero ¿qué me estás diciendo?... Vamos a ver el motivo.
¿Por qué no instalar simplemente la última versión de Python?
- En primer lugar, no es lo mismo utilizar Python para desarrollo general o desarrollo Web que utilizarlo para IA o Ciencia de Datos. El Python que usarás para ciencia de datos requiere de muchas más dependencias y además harás poca lógica y muchas más instrucciones de arriba a abajo, salvo que te dediques a investigación de algoritmos o algo así, cosa que no harás seguramente.
- En Data Science es muy importante la gestión de paquetes y dependencias, ya que gran parte del trabajo se basa en el uso de diferentes dependencias que te proporcionan acceso a herramientas de todo tipo, modelos predefinidos, etc...
- En Python el gestor de paquetes integrado,
pip
, tiene algunas limitaciones que son especialmente importantes a la hora de trabajar en IA. Básicamente que no te deja mantener paquetes con varias versiones de Python en paralelo, no instala ejecutables ni herramientas externas y tiene ciertas limitaciones a la hora de instalar bibliotecas de terceros no escritas en Python, que muchas veces son necesarias. Además, solamente utiliza un repositorio de paquetes único, PyPI, y muchas veces las herramientas de ciencia de datos están en otros repositorios.
Todo esto suele dar muchos problemas, sobre todo cuando empiezas y, sobre todo, en Windows. Por eso, a la hora de instalar Python para IA tienes una opción mejor que simplemente instalar Python: instalar Anaconda o Miniconda.
¿Qué instalar?: Anaconda vs Miniconda
Las mejores opciones a instalar directamente Python para trabajar en IA son principalmente dos: Anaconda y Miniconda.
- Anaconda es una herramienta pensada específicamente para trabajar con Python en ciencia de datos. Aparte del propio Python, integra un montón de herramientas, entornos y miles de paquetes de ciencia de datos ya descargados. Si no quieres complicarte la vida y que todo vaya sobre ruedas, es lo mejor que puedes hacer: descargar la versión "Individual" que es gratuita, y dejar que se instale y se coma un montón de espacio en disco. Si te sobra espacio en disco, adelante: le das a siguiente y la tienes instalada.
- Sin embargo, yo te recomiendo instalar su hermana pequeña: Miniconda. Como su propio nombre indica, es una instalación mucho más pequeña de Anaconda que incluye tan solo Python y el gestor de paquetes y dependencias conda. De este modo podrás instalar tan solo lo que necesites cuando lo necesites, pero tendrás toda la potencia que te da conda con muchos menos problemas que usando pip.
Cómo instalar Miniconda, configurar Conda y VSCode
Así que manos a la obra. Vamos a instalar Miniconda y aprenderemos a configurar adecuadamente Conda y Visual Studio Code para trabajar con Python para Machine Learning en Windows, aunque este tutorial te servirá también para cualquier otro sistema operativo.
En vez de aburrirte leyendo, y como tiene muchos detalles, te lo explico paso a paso con todo detalle en este vídeo práctico:
Lo que haremos básicamente es:
-
Instalar Miniconda: Veremos cómo evitar problemas con las rutas y evitar posibles incompatibilidades en las rutas con otras instalaciones de Python
-
Configurar Conda: Veremos los canales que trae por defecto para descargar paquetes y cómo agregar canales nuevos, especialmente el canal más importante para conda: Conda Forge
-
Configurar Visual Studio Code: Específicamente lo configuraremos para trabajar con Python sin problema. Probaremos los notebooks de Jupiter con ejemplos sencillos y veremos qué hacer con el paquete ipkernel
que te pide Python la primera vez que ejecutas un notebook en VSCode.
Con estos ajustes ya tendremos todo lo necesario para empezar a trabajar con Inteligencia Artificial con Python en cualquier sistema operativo, usando Visual Studio Code como editor para el desarrollo.
En un posterior artículo + vídeo te explicaré un concepto súperimportante para trabajo con esta herramienta: los entornos de conda y cómo gestionarlos, que también tienen muchos detalles y te ayudarán a tener mayor productividad a la hora de trabajar con Python.