Construir sistemas que aprendan de datos es una mejor manera de resolver problemas complejos. Esto es lo que debes saber sobre el Aprendizaje Automático.
Probablemente has encontrado el término «Aprendizaje automático» más de lo habitual últimamente. A menudo utilizado indistintamente con la inteligencia artificial, el aprendizaje automático es de hecho un subconjunto de la IA, los cuales tienen sus raíces en el MIT a finales de los años cincuenta.
El aprendizaje automático o aprendizaje de máquina es algo que probablemente esté presente todos los días. Los asistentes de voz de Siri y Alexa, el reconocimiento facial de Facebook y Microsoft, las recomendaciones de Amazon y Netflix, la tecnología que evita que los vehículos autónomos se estrellen, son el resultado de los avances en el aprendizaje automático. Y entonces…
1. ¿Qué es Aprendizaje Automático?
El término «Machine Learning» (Aprendizaje Automático) fue acuñado por Arthur Samuel en 1959, un pionero estadounidense en el campo de los juegos informático y la inteligencia artificial, y afirmó que «da a las computadoras la capacidad de aprender sin ser programadas explícitamente«.
Y en 1997, Tom Mitchell dio una definición matemática y relacional «bien planteada»:
«…se dice que un programa de computadora aprende de la experiencia E con respecto a alguna tarea T y alguna medida de rendimiento P, si su rendimiento en T, medido por P, mejora con la experiencia E.»
Aprendizaje automático es una palabra muy moda hoy en día, ya que es uno de los subcampos más interesantes de la informática. Entonces, ¿qué es el aprendizaje automático? Comencemos definiendo lo que no es: una aplicación informática convencional, codificada manualmente y programada por humanos.
A diferencia del software tradicional, que es genial siguiendo instrucciones, es terrible en la improvisación. Los sistemas de aprendizaje de máquina esencialmente se autocodifican, desarrollando sus propias instrucciones generalizando de ejemplos.
2. Machine Learning en términos sencillos
Tratemos de entender el Aprendizaje Automático en términos sencillos. Considere que está tratando de tirar un papel a una papelera.
Después del primer intento, te das cuenta de que has puesto demasiada fuerza en él. Después del segundo intento, te das cuenta de que estás más cerca de la meta, pero tienes que aumentar tu ángulo de lanzamiento. Lo que está sucediendo aquí es básicamente después de cada lanzamiento estamos aprendiendo algo y mejorando el resultado final. Estamos programados para aprender de nuestra experiencia.
Esto implica que las tareas en las que se ocupa el aprendizaje automático ofrecen una definición fundamentalmente operativa en lugar de definir el campo en términos cognitivos. Esto sigue la propuesta de Alan Turing en su artículo «Computing Machinery and Intelligence«, en el que la pregunta «¿Pueden las máquinas pensar?» es reemplazada por la pregunta «¿Pueden las máquinas hacer lo que nosotros (como entidades pensantes) podemos hacer?»
Dentro del campo de los datos analíticos, el aprendizaje automático se utiliza para diseñar modelos y algoritmos complejos que se prestan a la predicción; en el uso comercial, esto se conoce como análisis predictivo. Estos modelos analíticos permiten a los investigadores, científicos de datos, ingenieros y analistas «producir decisiones y resultados confiables y repetibles» y descubrir «ideas ocultas» a través del aprendizaje de las relaciones y tendencias históricas del conjunto (entradas) de datos.
3. Un Ejemplo de Aprendizaje Automático
El ejemplo clásico es el reconocimiento de imágenes. Muestre a un sistema de aprendizaje automático suficientes fotos de perros (etiquetados como «perros»), así como imágenes de gatos, árboles, bebés, plátanos o cualquier otro objeto (etiquetado como «no perros») y si el sistema está entrenado correctamente, finalmente va a ser bueno en la identificación de los caninos sin ayuda de los humanos.
El filtro de spam en su aplicación de correo electrónico es un buen ejemplo de aprendizaje automático en acción. Después de estar expuesto a cientos de millones de muestras de spam, así como correo electrónico no-spam, ha aprendido a identificar las características clave de los mensajes no deseados. No es perfecto, pero suele ser bastante preciso.
4. Clasificación del Aprendizaje Automático
Las implementaciones de aprendizaje automático se clasifican en cuatro categorías principales, dependiendo de la naturaleza del aprendizaje «señal» o «respuesta» a su disposición:
- Aprendizaje supervisado: Cuando alguien expuso el algoritmo de aprendizaje a un enorme conjunto de datos de entrenamiento, examinó su salida, luego ajustó continuamente su configuración hasta que produjo el resultado esperado cuando se muestran datos que no había visto antes. Algunos ejemplos de la vida real son: Clasificación de imágenes, Predicción del mercado.
- Aprendizaje no supervisado: Estos pueden identificar patrones en grandes cantidades de datos muchas veces más rápido que los humanos, por lo que los bancos los utilizan para marcar transacciones fraudulentas, los comerciantes los utilizan para identificar clientes con atributos similares y un software de seguridad los emplea para detectar actividad inusual en una red.
- Aprendizaje semi-supervisado: Los problemas en los que se tiene una gran cantidad de datos de entrada y sólo algunos de los datos están etiquetados, se llaman problemas de aprendizaje semi-supervisados. Estos problemas se sitúan entre el aprendizaje supervisado y no supervisado. Por ejemplo, un archivo fotográfico donde sólo se etiquetan algunas de las imágenes (por ejemplo, perro, gato, persona) y la mayoría están sin etiquetar.
- Aprendizaje de refuerzo: Un programa de computadora interactúa con un entorno dinámico en el que debe realizar una determinada meta (como conducir un vehículo o jugar un juego contra un oponente). El programa recibe retroalimentación en términos de recompensas y castigos a medida que navega por su espacio problemático. En el mundo humano, es como aprender por ensayo y error.
5. Datos Interesantes
Todo tiene decepciones. HP se metió en problemas en 2009 cuando la tecnología de reconocimiento facial incorporada en la cámara web en una laptop HP MediaSmart fue incapaz de detectar las caras de los afroamericanos. En junio de 2015, los algoritmos defectuosos en la aplicación de Google Photos etiquetaron erróneamente a dos estadounidenses negros como gorilas.
Otro ejemplo dramático: el fatal Taybot de Microsoft, un experimento de marzo de 2016 para ver si un sistema de IA podría emular la conversación humana aprendiendo de los tweets. En menos de un día, los usuarios de Twitter habían convertido a Tay en un bot de charla racista y xenófoba.
A pesar de algunas decepciones de la IA, no es exagerado decir que el aprendizaje automático y las tecnologías asociadas a ella, están cambiando el mundo tal y como lo conocemos. Lo mejor es aprender sobre esto ahora, antes de que las máquinas se vuelvan completamente conscientes de sí mismas. 😬
2 comentarios
Buen artículo Alexis !!
En el mundo del marketing ocupa y preocupa las consecuencias de las sucesivas actualizaciones de los algoritmos de machine learning para la búsqueda de Google !!
Saludos !!
Gracias Gustavo 🙂