Analyser et classifier les sons de mammifères marins avec les outils d’IA

A presentation at Camping des speakers in June 2022 in France by Eléa PETTON

Slide 1

Slide 1

Analyser et classifier les sons de mammifères marins avec les outils d’IA Eléa Petton

Slide 2

Slide 2

App Présentation Blog Notebooks Tutos IA DATASCIENCE Machine Learning Engineer Articles Docs ML DL Etudiante ingénieure @EleaPetton eleapttn Eléa PETTON 2

Slide 3

Slide 3

3

Slide 4

Slide 4

Qu’est-ce que l’IA ? Toi humain tu sais différencier le chien du chat, mais pas moi. Comment faire pour l’apprendre ? Attends, je vais te donner un algorithme qui va te permettre d’apprendre. 4

Slide 5

Slide 5

Qu’est-ce que l’IA ? IA Machine Learning Je me demande quelle est la différence entre tous ces termes ? Réseaux de neurones Deep Learning 5

Slide 6

Slide 6

Le Machine Learning plus en détail Machine Learning Deep Learning Supervisé Classification Régression 6

Slide 7

Slide 7

Le Machine Learning plus en détail Machine Learning Deep Learning Non supervisé Clustering Réduction de dimension 6

Slide 8

Slide 8

Le Machine Learning plus en détail Machine Learning Deep Learning Renforcement 6

Slide 9

Slide 9

Le Machine Learning plus en détail Machine Learning Deep Learning Supervisé Non supervisé Renforcement Classification 6

Slide 10

Slide 10

Différentes familles en IA NLP Computer Vision Audio 7

Slide 11

Slide 11

Pourquoi le son en IA ? Classification des données acoustiques Classification des sons environnementaux Classification du langage naturel Classification de la musique 8

Slide 12

Slide 12

Sons de mammifères marins On va essayer de différencier 45 mammifères marins différents Watkins Marine Mammal Sound Database 9

Slide 13

Slide 13

Importance du pré-traitement des données Qualité des données Informations utiles 10

Slide 14

Slide 14

11

Slide 15

Slide 15

Exemples de pré-traitement pour les données Gestion des valeurs nulles Standardisation Gestion des variables qualitatives Encodage à chaud 12

Slide 16

Slide 16

Et pour les données audios ? 26 paramètres audio Librosa name length audios .wav paramètres audio Librosa … … … label fichier .csv 13

Slide 17

Slide 17

me cleaning the data me building the model 13

Slide 18

Slide 18

Un notebook pour entraîner mon ia Tu veux ouvrir ton notebook ? Clic sur l’écran 14

Slide 19

Slide 19

Une app pour utiliser mon IA Imaginez que votre IA soit accessible et utilisable par tout le monde… 15

Slide 20

Slide 20

Comment créer une App ? Modèle d’IA Code Python Dockerfile AI Apps

  • entraînement - exportation Object Storage 16

Slide 21

Slide 21

Comment créer une App ? Modèle d’IA Code Python - framework Streamlit

transformation du son

classification Dockerfile AI Apps 16

Slide 22

Slide 22

Comment créer une App ? Modèle d’IA Code Python Dockerfile AI Apps

  • image Docker de base - répertoire courant - dépendances Python
  • commande à exécuter 16

Slide 23

Slide 23

Comment créer une App ? Modèle d’IA Code Python Dockerfile AI Apps - image Docker personnalisée - port d’accès du job - CPU / GPU - conteneur objet du modèle 16

Slide 24

Slide 24

Comment créer une App ? Modèle d’IA Code Python Dockerfile AI Apps 16

Slide 25

Slide 25

Test de mon App Tu veux tester ton app ? Clic sur l’écran 17

Slide 26

Slide 26

18

Slide 27

Slide 27

Qu’avons nous appris aujourd’hui ? Notion d’ia AI Notebook Datascience, Machine Learning, Deep Learning Développement de mon code étape par étape Place du son en IA Entraînement d’une ia Environnement, musique, NLP Réseau de neurones, exportation prétraitement des données App pour ia Répartition, transformation, labélisation Object Storage, Streamlit, Docker, AI Apps 19

Slide 28

Slide 28

MERCI !

Slide 29

Slide 29

Pour tester Le notebook : https://github.com/ovh/ai-training-examples/blob/main/notebooks/audio/audio-classification/notebook-marine-sound-classification.ipynb La doc du notebook : L’app : https://docs.ovh.com/gb/en/publiccloud/ai/notebooks/tuto-marine-mammal-sounds-classification/ https://github.com/ovh/ai-training-examples/tree/main/jobs/streamlit/audio-classification-app La doc de l’app : https://docs.ovh.com/gb/en/publiccloud/ai/training/tuto-streamlit-sounds-classification/ L’article de blog : https://blog.ovhcloud.com/ai-notebooks-analyze-and-classify-sounds-with-ai/ Repo GitHub

Slide 30

Slide 30

Références TensorFlow : https://www.tensorflow.org/guide?hl=fr JupyterLab : https://jupyter.org/ Pandas : https://pandas.pydata.org/ Sklearn : https://scikit-learn.org/stable/ Numpy : https://numpy.org/ Matplotlib : https://matplotlib.org/ Dataset des sons de mammifères marins : https://www.kaggle.com/datasets/shreyj1729/best-of-watkins-marine-mammal-sound-database Informations sur la dataset : https://cis.whoi.edu/science/B/whalesounds/index.cfm Classification de musique avec un CNN : https://blog.clairvoyantsoft.com/music-genre-classification-using-cnn-ef9461553726 Classification des genre musicaux : https://towardsdatascience.com/music-genre-classification-with-python-c714d032f0d8 Pré-traitement des données en Machine Learning : https://towardsdatascience.com/introduction-to-data-preprocessing-in-machine-learning-a9fa83a5dc9d