Quantcast
Channel: BEEVA Labs » Eventos
Viewing all articles
Browse latest Browse all 14

Aplicaciones y APIs predictivas: resumiendo PAPIs.io 2014

$
0
0

PAPIs.IO es una conferencia internacional de aplicaciones y APIs predictivas. La primera edición tuvo lugar el 17 y 18 de noviembre en Barcelona. Y la próxima tendrá lugar el año que viene en Sydney. El objetivo del evento es conectar expertos en APIs, herramientas y arquitecturas de Machine Learning con desarrolladores de aplicaciones.

PAPIs 2014 Barcelona

Presentación de la herramienta xPatterns, de Atigeo.

Visión general de las tendencias en PAPIs.io

El evento de PAPIs dejó evidente que existe una tendencia a democratizar el Machine Learning. Gracias en parte al Cloud Computing, acceder a potentes herramientas de predicción se ha vuelto mucho más accesible, exponiendo las funcionalidades en APIs para que cualquier desarrollador pueda integrar y utilizar funcionalidades avanzadas.

Algunos de los servicios presentados en este evento estaban claramente orientados a su facilidad de uso, para usuarios sin apenas conocimientos de Data Science, como BigML o indico.io. Aunque gran parte de las alternativas presentadas estaban orientadas a aprovechar mejor el trabajo de los Data Scientists. Desde facilitar las tareas de limpieza de datos y acelerar la experimentación o prototipado, hasta el despliegue de modelos en forma de servicios.

Varias de estas herramientas permiten la integración de múltiples componentes heterogéneos, incluso en diferentes lenguajes. Facilitan la transformación de datos o generación de flujos de una forma visual y extensible (Dataiku, xPatterns, RapidMiner). O están directamente orientadas a la puesta en producción de prototipos en R o Python (Yhat, Intuitics).

Otra tendencia destacable es la apuesta por modelos de negocio basados en open-source (GraphLab, PredictionIO, Datacratic, etc). El ecosistema Python parece imponerse como lingua franca para soluciones de analítica predictiva frente a R, aunque el peso y larga tradición de las arquitecturas Java en entornos empresariales también ofrece lugar a Scala/Java. Spark ya está muy presente, aunque su librería MLLib no. Y el estándar PMML se usa, aunque no demasiado.

Por último, pero no menos importante, las técnicas de Deep Learning han ganado popularidad y empiezan a ser mucho más accesibles: indico.io, GraphLab, o Ms ML Azure permiten utilizar estas tecnologías basadas en modelos de redes neuronales o aprovechar sus resultados.

Algunos casos de uso

Gran parte de los ejemplos presentados fueron tutoriales sobre el uso de las diferentes herramientas aplicadas a casos concretos. En ocasiones, se utilizaron conjuntos públicos de datos para mostrar resultados reales y, a lo largo de las diferentes charlas, se fueron cubriendo problemas de todo tipo: clasificación, regresión lineal, clustering, detección de anomalías o sistemas de recomendación.

PAPIs.io 2014 Barcelona

Presentación de ŷhat

Algunos casos de uso interesantes estaban relacionados con el ámbito de las smartcities, como sensores para el control de residuos o gestión de flotas de bicicletas compartidas, en forma de visualizaciones y análisis geográficos. Fue muy recurrente la referencia al conjunto de datos sobre el estado de las estaciones de bicis de Barcelona.

También se presentaron casos prácticos en ámbitos más relacionados con negocio. Así, Strands habló sobre las posibilidades de analizar datos bancarios para la personalización de ofertas a clientes. Datacratic presentó un ejemplo centrado en la problemática de Real Time Bidding, donde conseguían optimizar el valor de puja aprendiendo desde cero de los datos de pujas anteriores correspondientes a cada campaña. Y Datagami mostró un caso de estudio sobre la predicción del valor de mercado del Bitcoin a través de una aplicación multiplataforma llamada Mojucoin. Esta herramientas está (ahora mismo en beta abierta).

Nuevas herramientas

De las muchas herramientas presentadas, algunas se valoraron desde BEEVA de utilidad y potencialidad para ser utilizadas desde BEEVA Innovación para proyectos de BBVA.

  • Dataiku: suite para Data Scientists. Facilita la generación de flujos complejos de transformación de datos y modelos predictivos integrando capacidades de limpieza de datos, extracción de características e integración de múltiples algoritmos, con soporte para scripts python, R, o SQL.
  • Indico.io: una API que permite acceder fácilmente a funcionalidades basadas en técnicas de Deep Learning, en los ámbitos de análisis de texto e imágenes. Ofrece utilidades para análisis de sentimiento, orientación política, detección de idioma o palabras clave, y extracción de características en imágenes o reconocimiento de emociones faciales.
  • PredictionIO: librería open-source basada en Spark y Scala. Con SDK para Python, Java y PHP con versiones preinstaladas sobre AWS, Docker o Vagrant. Incluye plantillas de algoritmos para sistemas de recomendación, análisis de fuga de clientes, o análisis de sentimiento.
  • GraphLab: librería open-source muy potente para el desarrollo de soluciones predictivas eficientes y escalables mediante código nativo C++ y paralelismo MPI. Además, la herramienta GraphLab Create permite acceder a gran parte de esta funcionalidad de un modo mucho más sencillo desde código Python. Incluyendo desde sistemas de recomendación hasta problemas de analítica de grafos, pasando por aplicaciones de Deep Learning. Además ya soporta integración con Spark.
  • Azure ML: Solución de Microsoft sobre Azure. Evolución del proyecto “Passau” de Microsoft Research, y al que BEEVA había tenido acceso en preview. Ofrece una suite bastante completa sobre la plataforma cloud Azure, incluyendo funcionalidades avanzadas como el despliegue de topologías de Deep Learning e incluso algoritmos procedentes de otros servicios de Microsoft, como XBox, Bing o Cortana.

Otras herramientas presentadas fueron: BigML, Intuitics, Ŷhat, RapidMiner, IBM Bluemix, Datacratic, xPatterns, DataGami y Apicultur.

Imagen: PAPIs.io


Viewing all articles
Browse latest Browse all 14

Trending Articles