Cómo hemos construido una plataforma de IA basada en open source

A presentation at OpenExpo Europe in June 2022 in Madrid, Spain by Horacio Gonzalez

Slide 1

Slide 1

Cómo hemos construido una plataforma de IA basada en open source Horacio González 2022-06-30

Slide 2

Slide 2

¿Quiénes somos? Presentándome y presentando OVHcloud

Slide 3

Slide 3

Horacio Gonzalez @LostInBrittany Español perdido en la Bretaña francesa, desarrollador de software, cuentacuentos, rolista y geek en general… Flutter

Slide 4

Slide 4

OVHcloud: un líder mundial Web Cloud & Telcom 30 Data Centers in 12 locations 1 Million+ Servers produced since 1999 Private Cloud 34 Points of Presence on a 20 TBPS Bandwidth Network 1.5 Million Customers across 132 countries Public Cloud 2200 Employees worldwide 3.8 Million Websites hosting Storage 115K Private Cloud VMS running 1.5 Billion Euros Invested since 2016 300K Public Cloud instances running P.U.E. 1.09 Energy efficiency indicator 380K Physical Servers running in our data centers 20+ Years in Business Disrupting since 1999 Network & Security

Slide 5

Slide 5

OVHcloud: una historia industrial Primero Roubaix, luego el Mundo

Slide 6

Slide 6

OVHcloud comenzó con hardware Ensamblamos nuestros servidores a partir de los componentes

Slide 7

Slide 7

En busca de la eficacidad máxima Construimos nuestros propios chasis (horizontales)

Slide 8

Slide 8

Desde componentes hasta centros de datos

Slide 9

Slide 9

Controlamos nuestra cadena industrial

Slide 10

Slide 10

¿Pero tío, por qué nos cuentas esto? Esta es una charla sobre IA y open source, ¿no?

Slide 11

Slide 11

Una cultura industrial En toda la empresa, incluyendo el software

Slide 12

Slide 12

Atacamos los problemas de manera industrial Buscando cómo generalizar, como industrializar

Slide 13

Slide 13

No nos gustan las cajas negras Nos gusta ver lo que hay dentro…

Slide 14

Slide 14

Creemos a fondo en el software libre Como usuarios, colaboradores, mantenedores y creadores

Slide 15

Slide 15

Para nosotros y para nuestros clientes La reversibilidad es uno de nuestros valores fundamentales

Slide 16

Slide 16

Y cuando la IA se cruzó en nuestro camino Aplicamos los mismos principios

Slide 17

Slide 17

El principio de la IA en OVHcloud Eat your own dogfood, como dicen los americanos…

Slide 18

Slide 18

Problemas que pedían soluciones de IA O al menos un poco de Machine Learning…

Slide 19

Slide 19

Creamos un equipe IA/ML Y empezaron a atacar los problemas

Slide 20

Slide 20

La solución debía ser industrializable Si no, no nos serviría para nada

Slide 21

Slide 21

Las primeras soluciones en producción ¡Y funcionaban!

Slide 22

Slide 22

¿Y ahora qué? Quizás nuestros clientes tenían problemas semejantes…

Slide 23

Slide 23

¡Hablemos con el ecosistema! Clientes, partners, startups…

Slide 24

Slide 24

El eslabón perdido ¿Y si fuera ahí donde podíamos innovar?

Slide 25

Slide 25

Las múltiples facetas de la IA Et de la gente que trabaja con ella

Slide 26

Slide 26

Dos roles clásicos en el mundo de la IA

Slide 27

Slide 27

Pero hay un tercero: el DevOps/SRE/DataOps

Slide 28

Slide 28

Los tres hablan idiomas diferentes…

Slide 29

Slide 29

Pero necesitan trabajar juntos

Slide 30

Slide 30

El reto de la integración Integrar los equipos, procesos y herramientas de IA/ML & DevOps/SRE/DataOps

Slide 31

Slide 31

Muchas cuestiones a las que responder

Slide 32

Slide 32

Automatizar el pipeline de un extremo al otro De la idea a la producción

Slide 33

Slide 33

OVHcloud & IA Nuestra respuesta a la automatización del pipeline

Slide 34

Slide 34

La IA con parte de nuestra gama Data

Slide 35

Slide 35

¿Qué es OVHcloud AI Solutions? AI Solutions are a complete set of managed services that provide a quick and easy way for your data scientists and developers to get ML models from idea to production

Slide 36

Slide 36

Las etapas del pipeline de IA

Slide 37

Slide 37

Las etapas del pipeline de IA ● Centralize your data within a data lake such as Object Storage, to benefit from high throughput with reduced latency

Slide 38

Slide 38

Las etapas del pipeline de IA ● ● Centralize your data within a data lake such as Object Storage, to benefit from high throughput with reduced latency Clean and process your data with Data Processing solution, powered by Apache Spark

Slide 39

Slide 39

Las etapas del pipeline de IA ● ● ● Centralize your data within a data lake such as Object Storage, to benefit from high throughput with reduced latency Clean and process your data with Data Processing solution, powered by Apache Spark Develop your AI models with AI Notebooks, by instantly starting a Jupyter or VS Code notebook with GPU/CPU resources

Slide 40

Slide 40

Las etapas del pipeline de IA ● ● ● ● Centralize your data within a data lake such as Object Storage, to benefit from high throughput with reduced latency Clean and process your data with Data Processing solution, powered by Apache Spark Develop your AI models with AI Notebooks, by instantly starting a Jupyter or VS Code notebook with GPU/CPU resources Train your AI models with AI Training, without complex setup configuration, allowing CPU/GPU parallelization

Slide 41

Slide 41

Las etapas del pipeline de IA ● ● ● ● ● Centralize your data within a data lake such as Object Storage, to benefit from high throughput with reduced latency Clean and process your data with Data Processing solution, powered by Apache Spark Develop your AI models with AI Notebooks, by instantly starting a Jupyter or VS Code notebook with GPU/CPU resources Train your AI models with AI Training, without complex setup configuration, allowing CPU/GPU parallelization Deploy your AI models in production or pre-trained models or even applications very easily with AI Apps

Slide 42

Slide 42

Las etapas del pipeline de IA ● ● ● ● ● Centralize your data within a data lake such as Object Storage, to benefit from high throughput with reduced latency Clean and process your data with Data Processing solution, powered by Apache Spark Develop your AI models with AI Notebooks, by instantly starting a Jupyter or VS Code notebook with GPU/CPU resources Train your AI models with AI Training, without complex setup configuration, allowing CPU/GPU parallelization Deploy your AI models in production or pre-trained models or even applications very easily with AI Apps These services are built on our trusted and secured Public Cloud based on European values & law and powered by Openstack open source cloud

Slide 43

Slide 43

Levantemos el capó Con qué y cómo construimos AI Solutions

Slide 44

Slide 44

AI Training: entrenar modelos de IA En nuestra nube, sobre CPUs y GPUs a la demanda

Slide 45

Slide 45

Con las herramientas habituales La misma manera de hacer que en el laptop

Slide 46

Slide 46

Llegó justo después de ML Serving… Qué no era lo suficientemente genérico

Slide 47

Slide 47

¿Cómo ser lo suficientemente genéricos?

Slide 48

Slide 48

An orchestrator is needed

Slide 49

Slide 49

Orquestando nodos físicos con CPUs & GPUs

Slide 50

Slide 50

Desplegando los clusters con Terraform

Slide 51

Slide 51

Diagrama de arquitectura

Slide 52

Slide 52

Algunos de nuestros clientes se dieron cuenta El producto es tan flexible que puede usarse para otras cosas…

Slide 53

Slide 53

That’s all, folks! Thank you all!