Machine Learning
El término machine learning se utiliza para referirse a una disciplina científica dedicada a la inteligencia artificial para la creación de sistemas de aprendizaje automático sin que sean expresamente programados para eso.
Esto significa que identifican patrones complejos entre millones de datos, pero realmente lo que ocurre es que, a través de un algoritmo, la máquina revisa los datos y así es capaz de predecir comportamientos futuros, así como de mejorar el sistema de forma autónoma a lo largo del tiempo, sin la intervención de manos humanas.
Un ejemplo bastante usado en la actualidad donde se aplica machine learning son las recomendaciones en las distintas plataformas digitales, como Netflix y Spotify, los asistentes virtuales por voz como Siri o Alexa, y la capacidad de los automóviles autónomos para ver la carretera. Todo esto cuenta con el apoyo de esta disciplina para poder desarrollarlos.
La capacidad de aprendizaje automático a través del reconocimiento de patrones se utiliza para convertir muestras de datos en un programa informático, mejora de motores de búsqueda, robótica, diagnóstico médico, detección de fraude en el uso de tarjetas de crédito y actualmente está muy de moda por su capacidad para derrotar jugadores de Go o resolución de cubos de Rubik.
A pesar de que actualmente se encuentra muy en boga, su origen viene del siglo pasado, siendo su base fundamental para el aprendizaje automático la estadística, que básicamente consiste en una serie de algoritmos capaces de analizar gran cantidad de datos que se consideran experiencias y evidencias, para deducir qué resultado es el más óptimo para un determinado problema o dar predicciones de escenarios.
Partiendo del gran número de ejemplos dados para una situación, puede elaborar un modelo para deducir y generalizar comportamientos ya observados, y entonces hacer predicciones para casos nuevos. En base a esto existen 4 tipos de algoritmos de aprendizaje automático:
Aprendizaje supervisado
Basado en información de entrenamiento. El entrenamiento del sistema se realiza proporcionándole cierta cantidad de datos definidos al detalle con etiquetas. Cuando ya cuenta con suficiente cantidad de datos, pueden introducirse nuevos datos sin necesitar etiquetas, pues se basará en patrones distintos que ha ido registrando durante el entrenamiento. Este sistema se denomina clasificación.
También, dentro de este tipo de aprendizaje supervisado, encontramos otro método para desarrollarlo, denominado regresión, que consiste en la predicción de un valor continuo, usando parámetros distintos que al combinarlos con la introducción de nuevos datos da la capacidad de predecir un resultado determinado.
Lo que hace el algoritmo es producir una función que establece la correspondencia entre las entradas y salidas deseadas del sistema. Es de mucha utilidad en problemas de investigación biológica, biología computacional y bioinformática.
Aprendizaje semisupervisado
El aprendizaje semisupervisado combina los dos algoritmos correspondientes al aprendizaje supervisado y no supervisado, para poder realizar una correcta clasificación, teniendo en cuenta los datos etiquetados y los no etiquetados para su entrenamiento. Normalmente, usa una pequeña cantidad de datos etiquetados con una gran cantidad de datos no etiquetados, que son menos costosos y requieren menos esfuerzo para obtenerlos.
Se usa cuando el coste asociado con el etiquetado es muy alto para permitir un proceso de entrenamiento completamente etiquetado, por ello se aplica con métodos de clasificación, regresión y predicción.
Aprendizaje no supervisado
En este aprendizaje, no se usan valores verdaderos ni etiquetas. Estos tienen como finalidad la comprensión y abstracción de patrones de información de forma directa. A este modelo de problema se le denomina clustering, y corresponde a un método de entrenamiento similar a cómo los humanos procesan la información.
Todo el proceso de modelado se hace sobre un conjunto de ejemplos, formados solo por entradas al sistema, sin información de las categorías de estos. Por tanto, dicho sistema debe tener la capacidad de reconocer patrones para poner etiquetas a las nuevas entradas.
Aprendizaje por esfuerzo
Por su parte, en este tipo de aprendizaje por esfuerzo, los sistemas aprenden a partir de la experiencia, basándose en la prueba y error, ya que su información de entrada es el feedback que obtiene del mundo exterior como respuesta a sus acciones, así como en el uso de funciones de premio y castigo que optimizan el comportamiento del sistema, siendo una de las formas más interesantes de aprendizaje automático para sistemas de inteligencia artificial, ya que no necesitan la introducción de gran cantidad de información.
Es el aprendizaje más general entre los 4 presentados, tiene como objetivo aprender la función de valor que le ayude al agente inteligente a maximizar la señal de recompensa para optimizar sus políticas en cuanto a comprensión del comportamiento del entorno y tomar buenas decisiones que lo lleven a lograr los objetivos formales.
Debido a la gran existencia de volúmenes y variedades de datos, que cada día se incrementan más, es posible generar modelos de forma rápida y automática que puedan analizar grandes volúmenes de datos complejos y ofrecer resultados más rápidos y precisos, dando mejores oportunidades a las empresas de identificar opciones rentables y evitar riesgos desconocidos.
De allí que el machine learning se haga especialmente útil en el mundo empresarial, por su flexibilidad y capacidad de adaptación a los cambios en los datos en la medida que éstos van ingresando al sistema, así como aprender de las propias acciones del modelo, haciéndolo dinámico. Favorece al desarrollo de máquinas, porque les da la capacidad de adaptarse en función de los movimientos del contrincante, empleando la nueva información para la mejora constante del modelo.
Estas capacidades de adaptación e invención ofrecen un gran potencial a futuro para mejorar disciplinas científicas tan dispares como el diseño de antenas más eficientes, y en cuanto a aplicaciones industriales de la técnica, se incluye la optimización de forma continua de cualquier tipo de sistema.
Además, puede aplicarse en el mundo de la banca, ya que permite la creación de algoritmos que puedan ajustarse a cambios en el comportamiento de los mercados y clientes, balanceando ofertas y demandas.
Esto nos hace pensar que las posibilidades del machine learning son virtualmente infinitas, siempre y cuando existan datos disponibles para aprender.
Lo primero que debes saber es que una empresa cuenta con muchos datos de muchísimos clientes, tales como: años de antigüedad, servicios o productos contratados, consumo diario, usos habituales diarios y mensuales, llamadas mensuales al servicio de atención al cliente, últimos cambios en sus rutinas de consumo, etc., pero normalmente se utilizan solo para facturar y hacer estadísticas, sin saber que con ellos puede predecir cuándo un cliente se va a dar de baja en sus servicios, y que esto a su vez puede gestionarlo con la mejor acción que logre evitarlo.
Esos dos puntos se pueden conseguir con machine learning, porque se puede pasar de ser reactivos a ser proactivos, ya que al tener correctamente organizados y tratados en bloque los datos históricos del conjunto clientes, se puede obtener una base de datos explotable para la predicción de futuros comportamientos, potenciar aquellos que mejoran los objetivos de negocio y evitar aquellos que son perjudiciales.
No obstante, no es posible que esa gran cantidad de datos sean analizados por una persona, y mucho menos sacar conclusiones para hacer las predicciones. Por eso, se recurre a algoritmos, que sí pueden hacerlo mediante la detección de patrones de comportamiento usando las variables proporcionadas para hacer sus propios cálculos, y así descubrir cuáles son las que influyen en la toma de diversas decisiones o en determinados comportamientos de los clientes.
Cuanta mayor sea la cantidad de datos con la que se cuente, mejores y más precisas serán las acciones que resulten. Todo nuevo dato se transforma en un nuevo algoritmo.
Proporcionando, entonces, y gracias a los cálculos, información de utilidad para el departamento de marketing, que podrá usar para mejorar sus ofertas de servicios o productos a los clientes, animándolos a quedarse con la marca.
Son muchas las actividades donde se está implementando el machine learning, y en otras ya disfrutan de sus beneficios. Aquí se incluyen sectores como el de compras online en la sección de recomendaciones, el online advertising en cuanto a la ubicación adecuada de un anuncio para que tenga mayor visibilidad en función del usuario que visita la web, los filtros anti-spam que son de los que más tiempo llevan usando ésta tecnología,… El campo de aplicación es amplio, y depende de la imaginación y los datos disponibles en la empresa, te damos otros ejemplos:
- Servicios financieros: los bancos y otras industrias utilizan esta tecnología para dos fines principales: identificación de insights importantes en los datos y detectar fraude en transacciones mediante la cibervigilancia. La primera permite identificar oportunidades de inversión o ayudar a los inversionistas para que sepan cuando comprar o vender.
- Gobierno: la principal necesidad del uso de esta tecnología la tienen las dependencias del gobierno, como la seguridad pública y los servicios públicos, ya que tienen múltiples fuentes de datos, y permiten extraer insights. Entre ellos, uno de los usos es la predicción del tráfico urbano y minimizar el robo de identidad.
- Atención a la salud: dentro del área de la salud, el uso de machine learning ha ido en aumento gracias a la creación de dispositivos y sensores que pueden usar datos para evaluar la salud de un paciente en tiempo real y dar pre-diagnósticos médicos en base a los síntomas de un paciente, analizar datos para identificar tendencias o alertas que lleven a un diagnóstico rápido y tratamientos mejorados.
- Marketing y ventas: gracias a la captura de datos y su posterior análisis, es posible personalizar experiencias de compra, mejorar la implementación de campañas de marketing, conocer cuándo es mejor publicar los tweets, actualizaciones de Facebook o enviar newsletter, la mejor hora para llamar a un cliente,… También es útil en la selección de clientes según su comportamiento en redes sociales e interacciones web.
- Petróleo y gas: funciona para hallar nuevas fuentes de energía, analizar minerales del suelo, predecir fallos de sensores en refinerías, optimizar la distribución de petróleo para hacerla más eficiente y económica,… Son pocos los usos que le dan en esta industria, pero va incrementando cada día un poco más.
- Transporte: identificación de patrones y tendencias. Esto es clave para la planificación de rutas más eficientes y la anticipación de problemas potenciales, para incrementar la rentabilidad. El machine learning es de mucha utilidad para las empresas de mensajería, transporte público, entre otras de la misma rama.
- Otras: además de las ya mencionadas, tiene otras aplicaciones bastante comunes como la predicción de fallos en equipos tecnológicos, en recursos humanos para prever la rentabilidad de los empleados a futuro… Permite la adaptabilidad del comportamiento de una app móvil en función de las costumbres y necesidades de cada usuario y contribuye en la detección de intrusos en una red de comunicación de datos.
La tecnología de machine learning está utilizándose cada vez más para la recopilación y modelado del conocimiento, para así proporcionar respuestas más específicas que permitan el desarrollo de mejores herramientas de trabajo para las personas. El uso del aprendizaje automático y la inteligencia artificial marcaran la competitividad y profesionalidad en los años venideros.
Es por esto, que cada día son más las empresas que usan la disciplina de machine learning en sus servicios y productos, pues sacan el máximo provecho a sus beneficios para obtener reportes de su aplicación, tanto en procesos organizacionales como en la mejora de experiencia de trabajo y de sus clientes.