Récupérer le texte d’une vidéo YouTube

Afficher le texte des paroles d’une chanson, d’un épisode de série ou le contenu d’une conférence en langue étrangère disponible est une procédure simple sur Youtube. Comment les collecter puis à les mettre en forme dans WordC’est l’objet de cet article.

Youtube fourmille de millions de ressources dont la plupart sont en anglais mais aussi dans d’autres langues. Une limitation frustrante qu’il est heureusement possible de dépasser. Désormais, vous pouvez récupérer le texte de films, documentaires, discours, conférences en quelques clics pour les lire et en extraire des passages. Notez que toutes les vidéos Youtube n’intègrent pas la fonction de transcription. Après avoir collecté le texte, vous pouvez vous en servir pour votre usage personnel et le partager en respectant les clauses de droit d’auteur si elles existent. 

La méthode la plus simple pour récupérer les sous-titres

Pour tirer parti de la fonction de transcription des sous-titres de Yoube, encore peu connue et utilisée, quelques opérations sont nécessaires. Cette fonction est réalisée de manière automatique par des algorithmes de reconnaissance vocale et le résultat n’est donc pas parfait. Il faut donc corriger certaines erreurs de traduction ou d’interprétation. D’autre part, la mise en forme du texte généré par la transcription est affiché ligne à ligne avec une indentation correspondant à la chronologie de la vidéo. Il convient donc de concaténer (mettre bout à bout) ces lignes avec la fonction rechercher-remplacer de Word ou autre traitement de texte. Cette même fonction permet de supprimer les informations de situation entre parenthèses sur la vidéo tels que le signalement de rires, applaudissements, etc.

1) Ouvrir l’onglet Transcription sous la vidéo

Avec votre navigateur Web,  accédez à la vidéo Youtube souhaitée. Sous la vidéo et dans la ligne où se trouvent les boutons J’aime ou Je n’aime pas, cliquez sur les trois points horizontaux à droite de la commande Enregistrer. Dans la petite fenêtre  affichée juste au dessous, cliquez sur l’option Ouvrir l’onglet « Transcription ».

2) Supprimez l’horodatage synchronisé avec le texte

Après analyse de la vidéo, le texte correspondant à la bande audio s’affiche à  droite de l’image, dans une fenêtre qui  comprend  un horodatage synchronisé. Si vous n’avez besoin de ce dernier, cliquez sur les 3 points verticaux de la fenêtre et sélectionnez Activer/Désactiver l’horodatage pour le supprimer.

3) Copiez le texte dans Word et modifiez sa mise en forme

Sélectionnez le texte et faites un copier par la combinaison de touches Ctrl + C. Ouvrez un document dans Word et faites un copier du texte en appuyant simultanément sur la combinaison Ctrl + V. Pour enlever les sauts de ligne, utilisez Ctrl + F (fenêtre Rechercher- remplacer). Puis saisissez ^p dans Rechercher  et ^s dans Remplacer.

4)   Supprimez les parenthèses

Les rires et applaudissements sont indiqués entre parenthèses. Toujours dans la fenêtre précédente Rechercher-remplacer, cliquez sur le bouton Plus et cochez l’option Utiliser les caractères génériques. Dans le champ Rechercher, saisissez exactement ce qui suit : \(*\   Dans le champ Remplacer  validez une saisie vide en cliquant sur Entrée.

Note importante: au 21 janvier 2024 Youtube n’affiche plus la fonction Transcription. Sans doute pour empêcher ChatGPT de collecter des textes. Mais Google a inclus une extension à Chrome qui s’appelle : « Résumé des vidéos YouTube avec ChatGPT » Après son installation, il suffit de cliquer sur le bouton Transcript à droite de la vidéo pour afficher la transcription horodatée.

Soyez le premier à commenter

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.


*