Monterrey, N.L., a 15 de julio de 2018.- El siglo XXI y sus avances tecnológicos han llegado a un punto que jamás hubiéramos imaginado. Una etapa donde la producción de conocimiento comienza a superar lo material, donde el aprendizaje sucede vertiginosamente. Sin embargo, estos tiempos no son solamente caracterizados por el aprendizaje de los seres humanos, sino por el conocimiento que las máquinas comienzan a adquirir.
En entrevista para la Agencia Informativa Conacyt, el doctor en ciencias de la computación por el Centro de Investigación en Matemáticas (Cimat) Víctor Muñiz explicó a profundidad varias de las características que comprenden el término de “aprendizaje de máquina”, el cual se relaciona con experiencias que hoy en día se ven en la vida cotidiana.
“El aprendizaje máquina puede verse desde varios aspectos. Es un área multidisciplinaria porque comprende matemáticas, estadística, computación, entre otras. Y si tuviéramos que definir el término en palabras, pues es básicamente crear programas computacionales o algoritmos que aprendan de los datos de forma automática. Esos algoritmos se encargan de extraer las principales características de lo que se esté buscando”.
La forma en que funciona el aprendizaje máquina tiene que ver con los patrones que se detecten, para así conformar un modelo predictivo. Este busca asignar de forma automática los datos obtenidos, de acuerdo con lo que se pretende.
“Por ejemplo, podemos asignar piezas que están en buen estado, así como las otras que no lo están. También entran aquí cosas como si un correo electrónico es válido o si es spam, o en cuestiones de salud, es posible determinar cuál es el grado de enfermedad del paciente”.
El proceso de aprendizaje
“Tenemos un proceso que queremos analizar, así que comenzamos con la recopilación de información, que es una de las partes más importantes, ya que dependiendo de la calidad de los datos, es la calidad de modelo que tendremos. En la actualidad hay que interpretar datos muy complejos, a los que les llamamos ‘datos no estructurados’, que tienen que ver con video, con imágenes o con audio”.
Dentro de la Industria 4.0, el big data o el internet de las cosas, existen datos estructurados y no estructurados. Los primeros consisten principalmente de archivos de textos, donde se muestran filas y columnas tituladas; mientras que en los segundos son datos binarios que no cuentan con una estructura identificable.
Una vez con la información, es importante realizar una limpieza de los datos con que se cuenta, debido a que aquí se encuentran todos los errores, desde información imprecisa o números faltantes. Después de esta parte, comienzan a surgir los patrones.
“Vemos cómo los datos se empiezan a agrupar de cierta forma, surgen variables que tienen mucha relación entre ellas. Luego, dependiendo de los datos y las tareas que se quieran realizar, uno tiene varios métodos que se pueden implementar. Con esto ya es posible hacer predicciones, y analizando los datos se puede elegir el proceso óptimo a seguir”.
El principal reto del proceso de aprendizaje consiste en convertir los datos individualizados en un conjunto que contenga información, para llegar a una especie de traducción que la computadora pueda entender.
Calidad sobre cantidad en datos
“Se podría pensar que entre más datos se tenga, la situación será mejor o representarán más. Sin embargo, hay muchos problemas que, por la propia naturaleza de la ciencia, no es posible recopilar tanto como se quisiera. Hablo de ciertas áreas de estudio, como la genómica, donde los estudios son tan costosos que solo se pueden extraer algunos datos”.
Para conocer la calidad de los datos recopilados e interpretados, es posible utilizar una "medida de error", en la cual se contrastan estándares con la misma información. Sin embargo, los científicos se ven obligados a aplicar nuevos métodos o adaptar otros cuando la información es escasa o difícil de interpretar.
El aprendizaje máquina aplicado todos los días
“En la cultura popular, uno siempre se imagina robots haciendo algo o a hackers tratando de robar cuando escucha este concepto, pero realmente son tareas más simples. Por ejemplo, cada vez que uno quiere encontrar la ruta más rápida de un punto a otro, las aplicaciones que usamos son producto del aprendizaje máquina, ya que interpreta datos”.
La mercadotecnia personalizada que se encuentra en Internet también es producto del aprendizaje máquina, debido a los patrones de búsqueda que caracterizan a un usuario.
“Cada vez que uno abre el correo electrónico y ve las carpetas divididas entre las que son promociones, de redes sociales o spam, ahí vemos el aprendizaje máquina. Hay muchísimas aplicaciones que, aunque no nos damos cuenta, utilizan el aprendizaje máquina”.