Herramientas Big Data Text Analytics 

Muchos nos han consultado acerca de las soluciones para Big Data Text analytics así que he aquí un resumen de algunas de las herramientas en el mercado. Algunas son muy conocidas, otras no tanto. Suelen referirse a ella como Big Data Text Analytics o, simplemente, Text Analytics.

A continuación, hacemos un review sobre dos de las empresas más importantes de Text Analytics para Big Data.

Attensity para Big Data

text analytics

Big data Text analytics

Attensity es una de las principales empresas de Text Analytics, que comenzaron el desarrollo y venta de productos,  y fue creada hace más de diez años. En este momento, cuenta con más de 150 clientes en la empresa y uno de los grupos de desarrollo de la NPL más grandes del mundo. Attensity ofrece varios motores de Text Analytics . Éstos incluyen  Auto – Clasificación, Extracción de Entidad y Extracción Exhaustiva. Extracción exhaustiva es la tecnología insignia de Attensity que extrae automáticamente datos de Text Analytics  y organiza esa información.

La compañía se centra en análisis sociales y multicanal y la participación a través del Text Analytics para la presentación de informes a partir de fuentes internas y externas y luego dirigirla a los usuarios interesados. Recientemente compró Biz360, una red social que agrega enormes flujos de medios de comunicación social. Se ha desarrollado un sistema de computación en red que proporciona un alto rendimiento para el procesamiento de grandes cantidades de texto en tiempo real.

Attensity utiliza un Framework de Hadoop para almacenar datos. También cuenta con un sistema de almacenamiento en cola que crea un proceso de orquestación que reconoce los picos de los datos entrantes y ajusta el proceso a través de servidores, según sea necesario.

SAS para Big Data

SAS ha sido la solución para problemas de Big Data de gran complejidad en los últimos tiempos.

Hace varios años, la empresa compró un proveedor de Text Analytics conocido como Teragram para mejorar su estrategia de utilizar tanto los datos estructurados y no estructurados en el análisis y la integración para la modelización descriptiva y predictiva de éstos. Ahora, sus capacidades de Text Analytics son parte de su plataforma global de análisis y los datos de texto son vistos simplemente como otra fuente de datos.

SAS continúa innovando en el área de análisis de alto rendimiento para asegurar que el resultado satisfaga las expectativas del cliente. El objetivo hoy en día es solucionar los problemas que solían tardar semanas para resolverse y resolverlos en un solo día, o los problemas que solían tardar días, resolverlos en minutos. Este método de actuación, les hace ser fuertemente competitivos.

Por ejemplo, el alto rendimiento del  SAS Analytics Server es una solución en memoria que les permite desarrollar modelos analíticos a partir de datos completos, no sólo un subconjunto de los datos agregados. SAS afirma que puede utilizar miles de variables y millones de documentos , como parte de este análisis. La solución se ejecuta en EMC Greenplum  o aparatos de Teradata , así como en hardware utilizando el Hadoop Distributed File System ( HDFS ).

 

Si esta entrada fue de tu interés compártela con tus conocidos