Los 7 pasos del Aprendizaje Automático

Subscribirse al Blog

El blog de Closelly busca enseñar sobre metodologías de aprendizajes modernas como el microaprendizaje, la gamificación y otras!

El Aprendizaje Automático o Machine Learning es la capacidad de las máquinas para aprender a través de datos sin ser programadas. Esto es utilizado de forma diaria en plataformas como Netflix, Spotify o en asistentes de voz como Siri.

A través del siguiente caso de como diferenciar el vino de la cerveza, la plataforma Google Cloud nos presenta: Los 7 pasos del Machine Learning.

Ver transcripción del video en español

Puedes activar directamente desde YouTube en el icono Configuración>Subtítulos >Traducción automática>Español. O también, puedes leerla a continuación:

Desde la detección del cáncer de piel, hasta la clasificación de pepinos o detectar cuando hay que reparar las escaleras mecánicas.

El aprendizaje automático (Machine Learning) le ha dado a los sistemas informáticos habilidades totalmente nuevas, pero ¿Cómo funciona realmente esto en profundidad?

Miremos un ejemplo básico y usémoslo como excusa para hablar sobre el proceso de obtención de respuestas, a través de tus datos mediante el aprendizaje automático.

¡Bienvenido a las aventuras de la IA en la nube! Mi nombre es Yu Feng Guo y en este programa exploraremos el arte, la ciencia y las herramientas del aprendizaje automático.

Supongamos que se nos ha pedido que creemos un sistema que responde a la pregunta de si cierta bebida es vino o cerveza. A este sistema, de respuestas a las preguntas, lo llamamos modelo y se crea mediante un proceso llamado aprendizaje automático de entrenamiento.

El objetivo del aprendizaje automático es crear un modelo preciso que responda correctamente a nuestras preguntas la mayor parte del tiempo. Para entrenar un modelo, necesitamos recolectar datos que lo permita entrenar. Aquí es donde es donde comenzamos.

¿Vino o cerveza?

Nuestros datos serán recolectados de vasos de vino y cerveza. Hay muchos aspectos de las bebidas que podríamos recopilar, desde la cantidad de espuma hasta la forma de los vasos. Para nuestros propósitos, solo escogeremos un par de datos simples, el color, como longitud de onda de luz y la graduación del alcohol, como un porcentaje.

Lo que buscamos es poder dividir estos dos tipos de bebidas en dos factores. De ahora en adelante llamaremos a estas nuestras características: color y alcohol.

El primer paso de nuestro proceso, será ir a la tienda local para comprar muchas bebidas diferentes y conseguir el equipo para poder medirlas. Un espectrómetro, para medir el color, y un densímetro, para medir el alcohol. Parece que nuestra tienda también tiene un sector de electrónica.

Una vez que tenemos los equipos y el alcohol, todo en su lugar, es hora de dar nuestro primer paso real de aprendizaje automático: recopilar esos datos. Esto es muy importante, porque la calidad y la cantidad de los datos recopilados, determinará directamente qué tan bueno puede ser el modelo predictivo y los datos que recopilemos serán el color y el contenido de alcohol de cada bebida.

Estos serán nuestros datos de entrenamiento, así que unas horas de mediciones más tarde tal vez tomemos unas copas y ahora es el momento.

Ahora es el momento de recopilar los datos de entrenamiento:

Cargamos nuestros datos en un lugar adecuado y lo preparamos para su uso de nuestra capacitación de aprendizaje automático.

Primero juntamos todos los datos, en orden aleatorio. No queremos que el orden de los datos afecte lo que aprendemos, ya que no será determinante para determinar si una bebida es vino o cerveza.

También es un buen momento para visualizar los datos, para ayudar a ver si hay relaciones relevantes entre las variables que se pueden ocupar, como también mostrar si hay inconsistencia en los datos.

Por ejemplo, si recopilamos muchos más puntos de datos sobre la cerveza que sobre el vino, el modelo que entrenamos estará fuertemente predispuesto a adivinar que prácticamente todo lo que ve es cerveza, ya que estaría bien la mayor parte del tiempo. Sin embargo, en el mundo real, el modelo puede ver cerveza y vino en una cantidad igual, lo que significaría que estaría adivinando mal la cerveza la mitad del tiempo que también necesitamos.

Además, necesitamos dividir los datos en dos partes, la primera parte utilizada en el entrenamiento de nuestro modelo será la mayor parte de nuestros datos. La segunda se utilizará para evaluar nuestro modelo.

Tal vez nos gustaría usar las preguntas de la de matemáticas en el examen de matemáticas, a veces los datos que recopilamos necesitan otras formas de ajustar, manipular cosas error de normalización, duplicación, corrección de errores y otros.

Flujo de trabajo: Elegir un modelo

El siguiente paso en nuestro flujo de trabajo es elegir un modelo. Hay muchos modelos que los investigadores y científicos de datos han creado a lo largo de los años, algunos son muy adecuado para datos de imagen, otros para secuencias como texto o música, algunos para datos numéricos y otros para datos basados en texto. En nuestro caso estamos viendo dos características, color y porcentaje de alcohol, podemos usar el modelo lineal pequeño de forma simple y debe hacer su trabajo.

Capacitación

En este paso utilizaremos nuestros datos para predecir si una bebida es vino o cerveza, esto es similar a alguien que aprende a conducir. Al principio no sabrá como funcionan los pedales y las perillas. Sin embargo, después de mucha práctica esa persona se ha vuelto experto en conducir y reaccionar a los datos del mundo real.

Haremos esto a escala nuestras bebidas en particular, la fórmula para una línea recta es y es igual a MX más B: donde X es la entrada; M es la pendiente de la línea; B es la intersección con el eje y; e Y es el valor de la línea en esa posición X. Los valores que tenemos disponibles para nosotros ajustar o entrenar son solo N y P: donde M es esa pendiente; y B es la intersección con el eje y. No hay otra forma de que los ascetas afecten la posición de la línea, ya que las únicas otras variables son X nuestra entrada e Y, nuestra salida.

Revisa la formula de aprendizaje aquí.

¿Cómo continuamos?

El poder del aprendizaje automático, en este ejemplo, fue diferencia entre vino y cerveza, en lugar de utilizar el pensamiento humano y reglas manuales. También, podemos utilizar las ideas presentadas hoy en otros problemas, donde se aplican los mismos principios en los siguientes pasos: