Ya van varios post que venimos hablando de Big Data, arrancamos contando ¿Qué es Big Data?, nombramos el top 10 de empresas de big data, mencionamos las tendencias actuales en este mundo que pueden cambiar la forma de ver los negocios. Pero aún no hablamos de casos de éxito, por ese motivo es que empezamos a buscar en la web diferentes casos de éxito de big data analytics, qué tipo de empresas lo han implementado, qué logros obtuvieron, si tuvieron mejores ROI que sino lo hubiesen implementado y muchos otros datos que les serán de utilidad para conocer más a fondo este concepto tecnológico de Big Data Analytics.

Tendencias Big Data

Cómo este post se nos va a ser muy largo debido a la cantidad de casos encontrados vamos a realizar varios post segmentando los casos de éxito por tipo de empresas aclarando previamente que la mayoría de estas empresas basaron su éxito utilizando big data Hadoop.

En este primer post nos enfocaremos a grandes rasgos en los casos de éxito en bancos y compañías de seguro, entre estas empresas podemos nombrar a monstruos de la talla de paypal, Morgan Stanley y Sadabel Bank. Para este caso comenzaremos hablando de Paypal.


Paypal Big data

BIG DATA Y PAYPAL

¿Cuál fue la idea que llevó a Paypal implementar Big Data?

La idea que tuvo la empresa al inicio de la implementación de esta tecnología fue la de evitar los casos de fraude a través de una aplicación que pueda hacerlo en tiempo real. Este caso de Big data se debe a que ellos manejan información a través de PC, teléfonos, como medio de pago estándar en miles de sitios webs y muchas plataformas más que causan que los casos de fraude se acumulen cada vez más. Por este motivo es que necesitaban alguna herramienta para poder predecir dónde se podría llegar a cometer fraude antes que este comience a realizarse en alguno de los 90 millones de navegadores conectados al sitio durante un día dado.

¿Qué es lo que tenían previo a la implementación de Big data?

PayPal, Amazon y Google han desarrollado todo tipo de herramientas analíticas sofisticadas y la infraestructura para identificar patrones de actividad fraudulenta. Paypal, por ejemplo, tiene una serie de filtros de administración de fraudes ordenando las transacciones que justifican revisión debido a su cuantía, su origen, u otros factores que se pueden establecer por un comerciante. Pero la oportunidad de identificar el fraude va más allá de este punto virtual de venta. PayPal y Amazon han desarrollado herramientas de detección de fraude que dependen de grandes conjuntos de datos que contienen no sólo los detalles financieros de las transacciones, las direcciones IP, información del navegador y otros datos técnicos que ayudarán a estas empresas a refinar los modelos para predecir, identificar y prevenir actividades fraudulentas. PayPal y Amazon han tenido años para reunir las bases de datos de los datos de la transacción a cientos de millones de clientes a través de miles de comerciantes .

¿Qué herramientas y métodos de Big data Implementaron?

Estas herramientas mejoraron enormemente en el tiempo, el análisis offline de esta información ha sido la norma precio a la implementación. Las instituciones tradicionalmente muestreaban los datos que existían y corrían un análisis nocturno o semanal utilizando modelos de detección de fraudes. En cambio los nuevos enfoques realizan análisis continuo y en tiempo real en grandes conjuntos de datos, la aplicación de algunas de las lecciones que dejó Google con la indexación de la web para transferirlo al problema de calcular el riesgo de fraude para los consumidores o comerciantes individuales. Hay un enjambre de actividad en torno a una nueva generación de herramientas de “Big Data” tales como Hadoop MapReduce y BigTable que puede hacer frente a grandes cantidades de datos. El fraude es un gran conductor para generar toda esta actividad.

“El muestreo está muerto “, dijo Abhishek Mehta, esto es una gran ventaja para una gran institución bancaria de EE.UU. “Cuando los bancos almacenan petabytes de información en cinta magnética, se les hace imposible desarrollar modelos adecuados para medir el riesgo, sin recurrir a técnicas de muestreo. Hoy podemos ejecutar el análisis de más de 50 petabytes de datos para calcular con mayor precisión el riesgo. Las tecnologías como Hadoop nos permiten hacer cosas que antes eran imposibles.”

Un sistema de pago construido en la cima de los sistemas facilitaría el análisis en tiempo real y crea algunas posibilidades interesantes. Tomemos como ejemplo la arquitectura de una red de publicidad moderna como puede ser la de DoubleClick de Google. Estas redes han refinado las subastas en tiempo real para ofrecer los anuncios orientándolos a usuarios específicos en milisegundos. Cuando una solicitud de un anuncio viene de un navegador, se pasó rápidamente a uno o varios anunciantes, cada uno de los cuales tiene entre 10 a 20 milisegundos para que coincida con el perfil de ese usuario y asignar un valor potencial de su oferta. El mejor postor llega a colocar su anuncio y todo sucede en menos de un segundo!!. Estas interacciones ocurren con cada clic, generando una gran cantidad de modelos en tiempo real y estos cálculos conducen a un mercado eficiente para la publicidad.

Ahora imaginemos un sistema similar para los pagos electrónicos en los que una plataforma de pago ofrece transacciones potenciales a distintos emisores de tarjeta de crédito que compiten entre si. Mientras usted navega por un sitio de comercio electrónico, el historial de navegación y el artículo que usted está pensando en adquirir creará un perfil de riesgo. La plataforma de pago en el sitio puede ofrecer ese perfil y los detalles de la transacción a un puñado de prestamistas que compiten para que al momento de pagar el usuario reciba varias ofertas para el financiamiento de diferentes bancos. Si ha elegido previamente para pagar automáticamente con la oferta más ventajosa, el sitio podría seleccionar automáticamente la fuente de crédito que ofrecen las mejores condiciones. Sus fuentes de financiación y la tarjeta de crédito no tienen un tasa fija, la tasa es variable y puede cambiar dependiendo de la evolución del riesgo en tiempo real y el riesgo para el comerciante.

Más información sobre este caso (el texto está en inglés) en: http://strata.oreilly.com/2011/02/big-data-fraud-protection-payment.html

 

Si esta entrada fue de tu interés compártela con tus conocidos