Aclarando los mitos de NoSQL + Big Data






Septiembre 2014

Ernesto Ongaro
JasperWorld Madrid

Agenda




  • Parte 1: Datos Relacionales y SQL
  • Parte 2: NoSQL y BigData
  • Parte 3: El valor de NoSQL + Big Data
  • Parte 4: Que se puede hacer hoy?




PartE 1: Datos relacionales y SQL


1970 Elvis 1970 1970 1970 1970 1970 1970 1970 1970 1970 1970 1970 1970 1970 peace 1970 1970 1970 1970 1970 love 1970 1970 Nixon 1970 1970 1970 1970 1970 1970 1970 1970 1970 1970 Nacimiento de  LAS BASEs de Datos relaCional

A Relational Model of Data for Large Shared Data Banks

(Edgar F. Codd, IBM, 1970)

  • Relaciones entre tablas
  • Un lenguaje de consulta facil de usar
Full Name Birth Date Department
John Smith Jan 1, 1970 Marketing
Jonas McKnight Jun 7, 1965 Sales
Michael Jones Dec 19, 1980 Marketing

RELACIONES ENTRE TABLAS

SEQUEL: A Structured English Query Language

(Donald D. Chamberlin; Raymond F. Boyce, IBM, 1974)


SELECT * FROM employees WHERE Department=Marketing

Full Name Birth Date Department
John Smith Jan 1, 1970 Marketing
Jonas McKnight Jun 7, 1965 Sales
Michael Jones Dec 19, 1980 Marketing

Bases de datos relacionales y SQL...UN largo y feliz matrimonio

Created with Highcharts 3.0.8ValuesDatabase Vendor Shares 2012source: : IDC - Annual Worldwide RDBMS Vendor Shares 45201817OracleMicrosoftIBMOthers01020304050OracleMarket share: 45%Highcharts Cloud ALPHA

Bases de datos relacionales...

  • Aún hoy muy relevante para almacenar datos operativos
  • Usar una BD relacional si necesita todos estos elementos:
    • Lenguaje de consulta completo
    • Transacciones 
    • Esquemas predefinidas
  • Limitaciones comunes: 
    • escala
    • replicación
    • almacenaje de datos no estructurados
    • velocidad




    PartE 2: NoSQL Y

     Big Data

    palabras de moda...





    Los términos NoSQL + Big Data no son sinónimos







    NoSQL: 
    UNA BASE DE DATOS QUE NO es relacional, los datos se almacenan de forma más flexible que EN columna y filas. ConsultaS por otras vías que sólo SQL





    Big Data: 
    DATOS QUE son MÁS GRANDEs QUE cómodamente puedeN cabeR en un sistema convencional




    NoSQL - sabores diferentes

    • Document databases asociar cada clave con una estructura de datos compleja conocida como un documento.

    • Graph stores se utilizan para almacenar información sobre las redes, como las conexiones sociales.

    • Key-value stores  son las bases de datos NoSQL más simples. Cada artículo en la base de datos se almacena como un nombre de atributo (o "llave"), junto con su valor.

    • Wide-column stores como Cassandra y HBase están optimizados para las consultas en grandes conjuntos de datos y almacenar columnas de datos en conjunto, en lugar de filas.

    source

    Ejemplo: Document Database

     {
        "firstName": "John",
        "lastName": "Smith",
        "age": 25,
        "address": {
            "streetAddress": "21 2nd Street",
            "city": "New York",
            "state": "NY",
            "postalCode": 10021
        },
        "phoneNumbers": [
            {
                "type": "home",
                "number": "212 555-1234"
            },
            {
                "type": "fax",
                "number": "646 555-4567"
            }
        ]
    }

    En lugar de filas / columnas tiene "documentos"
  • Flexible
  • Excelente ejemplo de NoSQL
  • Ejemplos: MongoDB, CouchDB
  • Porque NoSQL?




    • Escala (tamaño)
    • Modelo de datos simplificado
    • Volumen ( de transmisión)
    • Sin esquema cuando necesario

    ¿Porque AHORA?


    • Precio de almacenaje▼
    • Velocidad de almacenaje 
    • Cantidad de Datos ▲
    • Expectativas ▲
    • Internet of Things (digitalización)
    • Disponibilidad de herramientas de análisis




    PartE 3: VALOR EN NoSQL Y Big Data

     explotación Y exploraCIóN



    Innovación por explotación se basa encima de conocimientos existentes por productos, mercados y clientes existentes

    Innovaciones exploratorias son radical en su naturaleza y su objetivo es apartarse de la forma establecida de pensar acerca de un producto, mercado o proceso



    (Jansen, Van Den Bosch, & Volberda, 2006, p. 1662)

    PROCESAMIENTO ONLINE vs OFFLINE




    Online: ingerir, almacenar, gestionar y analizar datos en tiempo real

    Offline: trabajos analíticos por lote



    source

    MATRIZ DE OPORTUNIDADES

    Exploratorio explotación
    DATOS
    Online

    DATOS
    Offline 

    © Ernesto Ongaro

    FALLA ELECTRICA Super Bowl


    Exploitative Online

    EXPLORATORIO   EXPLOTACIÓN 
    DATOS
    ONLINE

    DATOS
    OFFLINE



    "Nuestro análisis asigna un puntaje Klout diaria en una escala de 1-100 que demuestra cuánta influencia tienen los usuarios de medios sociales y sobre qué temas. Estamos utilizando [Apache] Storm para desarrollar generación de puntuación en tiempo real y momentos"
    © Ernesto Ongaro - source

    Explorative Offline

    EXPLORATORIO
    EXPLOTACIÓN 
    DATOS
    ONLINE


    DATOS
    OFFLINE


    © Ernesto Ongaro

    Netflix:



    Netflix desarrolló House of Cards mediante el análisis de millones de preferencias de los usuarios por actores, temas y métodos de entrega para crear lo que ellos llaman su serie más exitosa de la historia

    source

    Exploitative Offline

    EXPLORATORIO  EXPLOTACIÓN 
    DATOS
    ONLINE
    - -
    DATOS
    OFFLINE
    -

    © Ernesto Ongaro

    RECOMENDACIONES Amazon



    New Patterns of Innovation

    Pattern 1: Aumento de productos para generar datos
    Pattern 2: digitalización
    Pattern 3: Combinación de datos dentro y entre las industrias
    Pattern 4: Intercambio de Datos
    Pattern 5: La codificación de una capacidad de servicio distintivo



    source Rashik Parmar, Ian Mackenzie, David Cohn, and David Gann

    Informes y análisis?


    • Presentación de informes típicamente sobre el filtrado de columnas y filas y organizándolas cómo desea que los datos se muestren

    • Analytics se trata de la agregación de los datos en las filas y visualizarlo en una tabla cruzada o un gráfico







    Esto es cierto para DATOS NoSQL Y DATOS SQL

    ENTONCES....





    El trabajo de informes y análisis sobre NoSQL es "aplanando" los datos y su montaje en filas y columnas




    PartE 4: QUE SE PUEDE HACER HOY

    TOMAR INVENTARIO



    ¿Qué datos están en la mano?
    ¿Qué herramientas están disponibles?
    ¿Qué habilidades están disponibles?


    ¿CUÁL ES Tu ESTRATEGIA?


    Recuerde: la innovación por explotación y exploración a partir de datos no es accidental! 


    (source: Jaspersoft Big Data Survey, 2014)



    ESTÉ PREPARADO PARA FALLAR,

    pero recuperARSE rápidamente y iterar.




    PREGUNTAS?


    Gracias!
    @not_a_poet

    Copy of Demystifying NoSQL

    By ernestoo

    Copy of Demystifying NoSQL

    • 1,835