Menú de navegaciónMenú
Categorías

La mejor forma de Aprender Programación online y en español www.campusmvp.es

Cómo instalar Python para Machine Learning (IA) y Ciencia de Datos

Instalar Python para Machine Learning

Si quieres instalar Python para empezar a usarlo en Inteligencia Artificial, Machine Learning o Ciencia de Datos hay algunos detalles y recomendaciones que te conviene tener en cuenta para ahorrarte problemas y dolores de cabeza.

Y la primera recomendación es: ¡no instales Python! 😉

Pero ¿qué me estás diciendo?... Vamos a ver el motivo.

¿Por qué no instalar simplemente la última versión de Python?

  • En primer lugar, no es lo mismo utilizar Python para desarrollo general o desarrollo Web que utilizarlo para IA o Ciencia de Datos. El Python que usarás para ciencia de datos requiere de muchas más dependencias y además harás poca lógica y muchas más instrucciones de arriba a abajo, salvo que te dediques a investigación de algoritmos o algo así, cosa que no harás seguramente.
  • En Data Science es muy importante la gestión de paquetes y dependencias, ya que gran parte del trabajo se basa en el uso de diferentes dependencias que te proporcionan acceso a herramientas de todo tipo, modelos predefinidos, etc...
  • En Python el gestor de paquetes integrado, pip, tiene algunas limitaciones que son especialmente importantes a la hora de trabajar en IA. Básicamente que no te deja mantener paquetes con varias versiones de Python en paralelo, no instala ejecutables ni herramientas externas y tiene ciertas limitaciones a la hora de instalar bibliotecas de terceros no escritas en Python, que muchas veces son necesarias. Además, solamente utiliza un repositorio de paquetes único, PyPI, y muchas veces las herramientas de ciencia de datos están en otros repositorios.

Todo esto suele dar muchos problemas, sobre todo cuando empiezas y, sobre todo, en Windows. Por eso, a la hora de instalar Python para IA tienes una opción mejor que simplemente instalar Python: instalar Anaconda o Miniconda.

¿Qué instalar?: Anaconda vs Miniconda

Las mejores opciones a instalar directamente Python para trabajar en IA son principalmente dos: Anaconda y Miniconda.

  • Anaconda es una herramienta pensada específicamente para trabajar con Python en ciencia de datos. Aparte del propio Python, integra un montón de herramientas, entornos y miles de paquetes de ciencia de datos ya descargados. Si no quieres complicarte la vida y que todo vaya sobre ruedas, es lo mejor que puedes hacer: descargar la versión "Individual" que es gratuita, y dejar que se instale y se coma un montón de espacio en disco. Si te sobra espacio en disco, adelante: le das a siguiente y la tienes instalada.
  • Sin embargo, yo te recomiendo instalar su hermana pequeña: Miniconda. Como su propio nombre indica, es una instalación mucho más pequeña de Anaconda que incluye tan solo Python y el gestor de paquetes y dependencias conda. De este modo podrás instalar tan solo lo que necesites cuando lo necesites, pero tendrás toda la potencia que te da conda con muchos menos problemas que usando pip.

Cómo instalar Miniconda, configurar Conda y VSCode

Así que manos a la obra. Vamos a instalar Miniconda y aprenderemos a configurar adecuadamente Conda y Visual Studio Code para trabajar con Python para Machine Learning en Windows, aunque este tutorial te servirá también para cualquier otro sistema operativo.

En vez de aburrirte leyendo, y como tiene muchos detalles, te lo explico paso a paso con todo detalle en este vídeo práctico:

Lo que haremos básicamente es:

  • Instalar Miniconda: Veremos cómo evitar problemas con las rutas y evitar posibles incompatibilidades en las rutas con otras instalaciones de Python

  • Configurar Conda: Veremos los canales que trae por defecto para descargar paquetes y cómo agregar canales nuevos, especialmente el canal más importante para conda: Conda Forge

  • Configurar Visual Studio Code: Específicamente lo configuraremos para trabajar con Python sin problema. Probaremos los notebooks de Jupiter con ejemplos sencillos y veremos qué hacer con el paquete ipkernel que te pide Python la primera vez que ejecutas un notebook en VSCode.

Con estos ajustes ya tendremos todo lo necesario para empezar a trabajar con Inteligencia Artificial con Python en cualquier sistema operativo, usando Visual Studio Code como editor para el desarrollo.

En un posterior artículo + vídeo te explicaré un concepto súperimportante para trabajo con esta herramienta: los entornos de conda y cómo gestionarlos, que también tienen muchos detalles y te ayudarán  a tener mayor productividad a la hora de trabajar con Python.

José M. Alarcón Aguín Fundador de campusMVP, es ingeniero industrial y especialista en consultoría de empresa. Ha escrito diversos libros, habiendo publicado hasta la fecha cientos de artículos sobre informática e ingeniería en publicaciones especializadas. Microsoft lo ha reconocido como MVP (Most Valuable Professional) en desarrollo web desde el año 2004 hasta la actualidad. Puedes seguirlo en Twitter en @jm_alarcon o leer sus blog técnico o personal. Ver todos los posts de José M. Alarcón Aguín

Boletín campusMVP.es

Solo cosas útiles. Una vez al mes.

🚀 Únete a miles de desarrolladores

DATE DE ALTA

x No me interesa | x Ya soy suscriptor

La mejor formación online para desarrolladores como tú

Agregar comentario

Los datos anteriores se utilizarán exclusivamente para permitirte hacer el comentario y, si lo seleccionas, notificarte de nuevos comentarios en este artículo, pero no se procesarán ni se utilizarán para ningún otro propósito. Lee nuestra política de privacidad.