DSC_1035No cabe duda que para los estudiantes universitarios es muy importante tener conocimiento de cómo se procesa la información de las grandes cantidades de datos que se generan en las distintas redes sociales.

Frente a esta realidad, la carrera de Ingeniería en Informática de la Universidad Autónoma de Chile en Talca, realizó una conferencia denominada “Hadoop y MapReduce: Enfoque de Computación Distribuida”, dictada por el Dr. (c) Cristián Vidal, Ingeniero Civil Informático y Master of Science University of Michigan, Estados Unidos.

Para la Directora de Carrera, Jenny Morales, es necesario que los alumnos entiendan la importancia de la computación distribuida “es fundamental que nuestros futuros ingenieros actualicen sus conocimientos, sobre todo, pensando que ellos puede desarrollar aplicaciones distribuidas que ayuden fomentar la utilización de estas técnicas y – al mismo tiempo- pueden determinar sus trabajos en el futuro. Este tipo de conferencias potencia las habilidades a través de la adquisición de materias relevantes y muy actualizadas”.

En efecto, hoy es difícil imaginar nuestras vidas sin Internet, sin la posibilidad de acceder a buscadores o Facebook, sin embargo, detrás de cada usuario que se conecta a la red existen perfiles, preferencias y gustos, los que se transforman en “lotes”, los que deben ser ordenados de manera rápida y eficiente.

Entendiendo este complejo escenario, uno de los gigantes dentro de la industria mundial informática, Google, implementó en el año 2004 un modelo de programación llamado MapReduce. La principal función es dar soporte a la computación paralela sobre grandes colecciones de datos en grupos de computadoras y al commodity computing.

Es así como, MapReduce ha sido adoptado mundialmente, ya que existe una implementación OpenSource denominada Hadoop. Por OpenSource se entiende aquellos programas informáticos que permiten el acceso a su código de programación, lo que facilita modificaciones por parte de otros programadores ajenos a los creadores originales del software en cuestión.

Para el Dr. (c) Cristián Vidal, MapReduce es una tremenda herramienta de distribución que debe ser considerada por sus colegas. “MapReduce o reducción de mapas, es la técnica que se utiliza cuando hay grandes volúmenes de información y se da el procesamiento en “lote”. En palabras simples, no se requieDSC_1021re interacción del usuario, siendo el software que actúa ordenando colosales flujos de información. Lo difícil de la implementación de este sistema, es que los informáticos debemos aprender una nueva filosofía, aprender un nuevo camino y esa es la única dificultad. Sin embargo, la utilidad es sorprendente en términos de tiempo y costos asociados”, detalló.

En concordancia con lo planteado por el experto, durante los últimos años se han creado diversas iniciativas similares a Hadoop, tanto en la industria como en el ámbito académico, las que han permitido ordenar grandes cantidades de datos, facilitando las gestiones y reduciendo el tiempo de ejecución y los costos.

 

Compartir en