Hoy pude dar otra charla en Reactor, con el tema “Cómo compartir informes de mil millones de líneas con miles de personas a bajo costo”, un tema muy útil y relevante para la mayoría de profesionales y empresas.

El evento fue todo un éxito y estuvo lleno de gente. Muchas gracias por la invitación Larissa Cyganski, Hugo Venturini, Gustavo Leo, Sidney Cirqueira y Victor Temple.

Oradores que marcaron la diferencia en el evento:

  • Rafael Mendonça
  • Fabio Santos
  • Sidney Cirqueira
  • Jones Santos
  • Juliana María Lopes

También estuvieron presentes la líder del equipo de análisis de Power Tuning, Nayara Hellen y los expertos del equipo de soporte de Power Embedded Edilson Santos Sthéfane Lisboa João Paulo Macedo Paulo Eduardo y también mis grandes amigos Samyr Moises, Orlando Gomes, Andre Jaar y Guilherme Louzada.

Me sentí muy feliz de poder aportar un poco a las más de 140 personas presentes, aumentar mi networking con gente súper calificada y participar en otro evento de Microsoft Reactor, que siempre son excelentes.

La presentación

Vídeo de mi presentación:

 

Diapositivas de presentación:

Galería de fotos del evento:

Esta presentación de diapositivas requiere JavaScript.

Cómo compartir informes de mil millones de líneas con miles de personas a bajo costo

El tema es un dolor latente en casi todas las grandes empresas: cómo compartir informes que suman miles de millones de líneas, para miles de usuarios, sin que la factura de Azure cueste el precio de un Ferrari.

Si crees que la única salida es comprar licencias Pro para todos o subir el nivel Fabric al límite, esta charla es para ti.

Durante la charla, ofrecí una descripción general de los tipos de licencias de Power BI y mostré dónde SQL Server Analysis Services (SSAS) puede ayudar a reducir drásticamente el consumo de su capacidad de Fabric/Power BI Embedded.

El escenario: el mito de los mil millones de líneas

Antes de hablar de precio, debemos hablar de arquitectura. Cuando un usuario solicita un informe de mil millones de filas, la primera pregunta debería ser: ¿Por qué?

Nadie analiza mil millones de filas individualmente en Power BI. Si el usuario quiere filtrar una factura específica en medio de un océano de datos, es posible que Power BI no sea la herramienta; Quizás necesite una aplicación. En BI trabajamos con agregación. Sin embargo, si el escenario realmente requiere este volumen para analizar las tendencias históricas, la estrategia de concesión de licencias y el motor de procesamiento se vuelven críticos para la viabilidad financiera del proyecto.

Licencias: ¿Pro, PPU, Premium o Fabric?

El ecosistema ha cambiado. Power BI Premium por capacidad (P SKU) se suspendió para nuevos contratos, dando paso a Microsoft Fabric. Pero la base sigue siendo la misma: o pagas por usuario o pagas por capacidad.

Tipo de licencia Modelo de costos Ideal para…
Power BI Pro Por usuario ($) Equipos pequeños y BI básico de autoservicio.
PPU de Power BI Por usuario ($$) Funciones premium (canales de implementación, conjuntos de datos > 1 GB) para pocos usuarios.
Tela (SKU F) Capacidad (Reserva/Por Hora) Empresas que necesitan escala, OneLake e Ingeniería de Datos unificada.
Power BI integrado (SKU A) Capacidad (por hora) SaaS y portales internos donde el coste por usuario Pro es inviable.
Nota importante: La tela en Brasil se vuelve 60% más caro que en Estados Unidos debido a la carga fiscal y la infraestructura local. Si la latencia no es el factor número uno (y para Power BI, rara vez lo es), considere desarrollar su capacidad en regiones como el este de EE. UU. para obtener ahorros espectaculares.

Servicios de análisis de SQL Server (SSAS) + Conexión en vivo

Aquí está el secreto para manejar miles de millones de filas a bajo costo.

Power BI, de forma predeterminada, utiliza el Importar, donde los datos se cargan en la memoria de capacidad (F SKU o A SKU). Si su conjunto de datos es de 50 GB, necesitará una capacidad costosa para manejar el procesamiento de este modelo de datos.

Sin embargo, Power BI es un "hijo" de Analysis Services. Cuando usamos el modo Conexión en vivo apuntando a un servidor SSAS (ya sea local o una VM), procesamiento DAX y administración de memoria no sucede en Power BI, sino en el servidor de Analysis Services.

Impacto en la capacidad: En mis pruebas, un informe con 400 millones de líneas en el modo Importar consumió casi el 100% de la capacidad de un F2 durante la actualización y las interacciones. EL mismo informe a través de Live Connection con SSAS resultó en Consumo CERO de capacidad de la tela.

Esto le permite usar una capacidad mínima (como F2 o F4) solo para "mostrar" el portal, mientras que el trabajo pesado de procesar miles de millones de filas se realiza en un servidor donde actualizar la RAM es infinitamente más barato que subir de nivel en las licencias de la nube.

Análisis integrado: compartir con miles de personas

Si tienes 2000 usuarios, pagar la licencia Pro para todos costaría una fortuna. La solución legalizada y con licencia es Power BI Embedded. Usted desarrolla un portal simple (o utiliza una solución ya preparada) y "empaqueta" los informes allí.

  • Ventaja: Los usuarios finales no necesitan una licencia Pro. Accede a él a través de la aplicación.
  • Flexibilidad: Puede activar la capacidad por la mañana y desactivarla por la noche, o escalar de un F2 a un F64 solo durante el procesamiento nocturno.
  • Instancia reservada: En Fabric, puedes reservar capacidad durante 1 año y ganar 40% de descuento.
ALERTA CRÍTICA: Tenga cuidado con "Publicar en la Web". Él NO es una herramienta para guardar datos privados. Cualquier dato publicado allí está indexado en Google. He visto multinacionales con datos confidenciales expuestos porque intentaron guardar las licencias de forma incorrecta.

Análisis de rendimiento: competencia, suavizado, estallido y estrangulamiento

Cuando utilice Fabric o Embedded, supervise los límites de conexión simultánea.

una capacidad F2 solo permite 2 conexiones Live Connection por segundo. Si tiene un pico de 100 usuarios que acceden al mismo tiempo, el informe será lento y verá el impacto en el tiempo de respuesta de Analysis Services.

Ten cuidado con el Suavizado y estallido:: Fabric le permite "tomar prestada" CPU del futuro para no bloquear el informe ahora, pero si abusa de ella, su capacidad quedará inutilizable. estrangulamiento, dejando todo lento durante horas y probablemente incluso no disponible, sin poder abrir ningún informe hasta que se devuelvan todos los créditos utilizados o se reinicie la capacidad (generando un coste extra, que puede ser bastante elevado).

Conclusión

Compartir datos masivos a bajo costo no es magia, es ingeniería.

Al trasladar el procesamiento pesado a Analysis Services y utilizar licencias de capacidad (Fabric o Embedded) estratégicamente, puede ofrecer rendimiento a un costo mucho menor.

Sea el guardián de la capacidad en su empresa. No acepte informes mal modelados que utilicen mucha más capacidad de la que deberían. Optimice DAX, utilice agregaciones y, si su consumo de capacidad sigue siendo demasiado alto, SSAS es su mejor amigo.