Tendencias del Big Data para 2017

Big data es un término que ya no es necesario buscar en Internet para saber su significado, o por lo menos, no tan a menudo. No obstante, nadie duda de la importancia y tendencia positiva que tiene en el mercado laboral. Para todas las empresas, sin distinción por tamaño.

Así comienza el artículo llamado “Previsiones sobre Big Data para el año 2017” publicado por La Cofa, un blog colectivo dedicado a a vigilancia tecnológica.

Es bien sabido la necesidad de puestos de trabajo en este ámbito. Científico de datos o experto en Hadoop continúan postulándose como dos profesiones que mayor demanda tienen y así será siguiendo de acuerdo a los pronósticos de 2020.

pexels-photo-147408

Big Data ya es un hecho. Las empresas grandes cada vez invierten más en esta tecnología. “No obstante, no se trata de un concepto estático […]” asegura Javier Carbonell. La tecnología y los usos sociales cambian y con ello aparecen las nuevas previsiones para el año en curso 2017. A continuación, detallamos algunas de éstas anunciadas por los expertos en la materia:

  • Big data e Internet de las cosas convergerán. (Quentin Gallivan, CEO of Pentaho). Debido a esta unión, las empresas deberán contar con sistemas y procesos automáticos para las gestión de datos.
  • La era cognitiva hará su debut en computación. (Eric Mizell, VP of global solutions engineering, Kinetica). Debido al auge de tecnologías de machine learning, algoritmos, análiticas en tiempo real, etc. Será necesario procesos computacionales más ágiles y rápidos para poder desarrollar los análisis a tiempo real.
  • Más descentralización de los datos. (Adam Wray. CEO of Basho). Los datos necesitarán ser procesados en el mismo lugar donde se producen, así tenderemos a una descentralización de los datos debido a las necesidades de negocio.
  • Los metadatos avanzan en la gestión. (Lance Smith, CEO of Primary Data). Como los datos se incrementan cada año, urge la necesidad de información colateral de éstos, es decir, metadatos.
  • Spark todavía no jugará un papel importante. (Michael Stonebraker, co-founder and CTO of Tamr). Pese a que es una tecnología con relevantes beneficios para el sector, necesita seguir incorporando mejoras en la integración con la información almacenada.
  • Arquitecto en análisis de IoT desplazará al científico de datos. (Dan Graham, Internet of Things technical marketing specialist, Teradata). Debido al gran volumen de datos, las empresas tendrán que empezar a contratar, cada vez más, a arquitectos de análisis de datos.
  • En 2017 se reavivirá la confianza en los datos. (Girish Pancha, CEO and Founder, StreamSets). Si los datos empiezan a ser uno de los activos más importantes de las empresas, la calidad de éstos debe ser máxima. Las organizaciones tendrán que monitorizar y hacer sus propios “data quality”.
  • Los ejecutivos de alto nivel (C-level) se implicarán en el éxito de los centros de datos. (Jeff Klaus, GM Data Center Solutions, Intel). Esta previsión podríamos decir que ya es un hecho, muchas compañías ya han empezado a comprender que los datos deben ser gestionados para llegar a ser la actividad principal de la compañía.

Big Data, el término al que se refería como tendencia podría convertirse en un elemento clave para que se desarrollen otros fenómenos como Intenet of Things o la inteligencia artificial. ¿Estaremos ante una evolución del término Big Data?

Fuente: https://lacofa.fundaciontelefonica.com/2017/01/30/previsiones-sobre-big-data-para-el-ano-2017/

 

Bitext y la importancia del text mining

En el desayuno del pasado viernes 18 de noviembre, hemos tenido la oportunidad de conocer a Mykola Sochynskyi, profesional de la empresa Bitext.

Bitext, empresa fundada en 2008 en Madrid, empezó a hacer consultoría para dar servicios a sus clientes en relación a la lingüística. Desde entonces crecieron en personal y negocio, tanto, que la demanda ha requerido una reciente apertura en San Francisco (EE.UU.)

Trabajan con sus clientes desde la postventa hasta el servicio con todas las encuestas. Antes lo codificaban manualmente y ahora los clientes (diferentes sectores) usan la herramienta de Bitext.

Trabajan con 25 idiomas y se comprometen a tener un 90% de precisión, toda su tecnología está basada en el análisis gramatical de las frases. Los diccionarios son totalmente customizables y pueden ser ampliados.

Todos los resultados arrojados en las encuestas son estructurados donde existen campos importantes como sentiment topic, sentiment text, una puntuación dada y el polarity bien si es positivo o negativo. Además, van un paso más con las categorías, esto permite al cliente saber cuál es la parte de la empresa que mejor o peor se comporta. Esta categorización puede ser definida bien por el propio cliente o bien subcontratada por la empresa Bitext.

Para el análisis de los resultados utilizan Qlik Sense con el fin analizar los datos de una manera más visual para tomar las mejores decisiones en el menor tiempo posible.

pc_bitext

Myko afirma que el sector donde más rentabilidad se puede obtener es Market Research.

Sin duda, una herramienta con mucho potencial donde tiene un importante rol cuando el cliente se pone en el centro de la empresa. Escuchar, analizar y entender al cliente, es lo principal para que nuestro negocio esté a las alturas de las expectativas del mercado.

Os dejamos el link de la empresa por si queréis echar un vistazo:

https://www.bitext.com/

Visualize your world (with data)

Evento Qlik

El Barroco surgió a principios del siglo XVII, poco a poco se fue extendiendo hasta ser revalorizado a finales del siglo XIX. Pasó por años donde se le acuñaba un sentido peyorativo, aunque finalmente logró hacerse un hueco entre los artistas de la época.

Lejos de hacer comparativas que puedan ofender a los amantes del arte, la visualización de datos sigue la misma tendencia que la expuesta en el primer párrafo: aparición de los primeros gráficos hace mucho tiempo para darle la importancia merecida más tarde pero siempre han tenido una función relevante.

 Una de las primeras representaciones gráficas para mostrar datos multidimensionales fue la realizada en 1869 por C.J. Minard que construyó el siguiente mapa donde se muestra el avance y posterior retirada del ejército de Napoleón en la campaña rusa de 1812-1813.

Gráfico 1. Avance y retirada del ejército napoleónico durante la campaña rusa 1812-1813

mapa_ejercitonapol

Fuente: E.R Tuftle en The Visual Display of Quantitive Information

Así pues, fue considerado como uno de los “mejores gráficos jamás realizados”. Éste, y los desarrollados hasta el día de hoy, muestran la importancia de saber representar la información de manera clara y sencilla. Transmitir la información necesaria para que el público pueda tomar decisiones en cuestión de segundos. Este es el objetivo de herramientas como Qlik que ayer, día 19 de octubre de 2016, celebró en Madrid el evento “Visualize your world”.

portada_vyw

Al principio se desarrolló como la mayoría de los eventos de este tipo, una parte comercial donde muestran las características que hacen única la herramienta como su motor asociativo, donde todos los datos están asociados.

Y su capacidad de trabajar en memoria lo cual permite una mayor agilidad de cálculo.

Para mostrar estas características se realizó una demo con un cuadro de mando de los Precios de Combustibles en las gasolineras de España con datos públicos del Ministerio de Industria. “Descubrieron” que no existen gasolineras Repsol ni en Ceuta ni en Melilla.

Por otro lado, estuvimos viendo la preparación de los datos donde se pueden calcular dimensiones de operaciones sin necesidad de entrar en el SetAnalysis.

Siguiendo con la parte más comercial, ya ha salido la versión Beta de Qlik Sense 3.1 que cuenta la novedad de la integración de los motores de R y Python.

Diferentes oponentes prosiguieron con casos de uso pero sin entrar en detalle. La empresa Accenture tuvo una ponencia de su modelo de negocio donde su motto en el entorno analítico es Disruption is happening (un cambio a la hora de realizar las cosas).

trestendencias

Tres tendencias fueron reconocidas por la consultora:

  • Digitalización: está en todos los sitios, no sólo móviles si no en coches, ascensores…
  • Liquid Expectations: un estudio de la misma empresa demostró que el 62% de los CEO manifestaron que no estaban conforme con la gestión de sus clientes. El 49% afirmó que no estaba en sus manos. ¿Por qué? Porque nuestra demanda se está expandiendo. Nuestra demanda, no sólo se centra en un sector, sino que es transversal a todas las industrias.
  • Intelligence: los datos son el poder digital, pero éstos no aportan valor. Lo que aporta realmente valor es el análisis de los datos. Por ello, es muy importante la capacidad de proyectar grandes volúmenes de datos visualmente, en gráficos.

Después de esto, aprovechando el descanso para el café, nos acercamos al estand de nuestro proveedor. Nos contaron que los mapas van a ser los elementos indispensables en cualquier cuadro de mando. Mapas que nos permitan bucear en los datos para descubrir correlaciones entre variables que jamás hubiéramos imaginado (Alerta: cuidado con las correlaciones espurias).

Existe la extensión de Qlik Maps (https://vimeo.com/111139445) que permite insertar varias capas y medidas para conseguir un mayor enriquecimiento en el Data Discovery. #notfree

Las siguientes charlas vinieron de la mano de Qlik. Presentaron novedades como la incorporación de infografías dinámicas a partir de html con el motor de Qlik sense.

Los próximos pasos para 2017 será Hybrid, un entorno colaborativo en Qlik. Además, Qlik Branch, Qlik Market serán incorporadas para la utilización de extensiones sin necesidad de descargas.

Mostraron una app desarrollada por ellos llamada Qlik Social donde es posible descargar contenido de twitter con el fin de analizar el impacto social de la marca.

qliksocial

Y QlikSenseBot un robot capaz de responder a tus preguntas a través de Telegram.

qliksensebot

Finalizaron con la importancia del Data Storytelling. Ha ganado notoriedad en los últimos años y es que cada vez son más los profesionales que tienen que tomar decisiones basadas en hechos en el menor tiempo posible.

adobe-summit-data-storytelling-22-638

En definitiva, fue un evento interesante donde no estuvo tan centrado en la venta del producto sino en el uso potencial para conseguir lo que nosotros y C.J. Minard queremos: mostrar la máxima información en el menor espacio y tiempo posible.