Récupérer le texte d’une vidéo Youtube

Afficher le texte des paroles d’une chanson, d’un épisode de série ou le contenu d’une conférence en langue étrangère disponible est une procédure simple sur Youtube. Comment les collecter puis à les mettre en forme dans Word: C’est l’objet de cet article.

Youtube fourmille de millions de ressources dont la plupart sont en anglais mais aussi dans d’autres langues. Une limitation frustrante qu’il est heureusement possible de dépasser. Désormais, vous pouvez récupérer le texte de films, documentaires, discours, conférences en quelques clics pour les lire et en extraire des passages. Notez que toutes les vidéos Youtube n’intègrent pas la fonction de transcription. Après avoir collecté le texte, vous pouvez vous en servir pour votre usage personnel et le partager en respectant les clauses de droit d’auteur si elles existent. 

La méthode la plus simple pour récupérer les sous-titres

Pour tirer parti de la fonction de transcription des sous-titres de Yoube, encore peu connue et utilisée, quelques opérations sont nécessaires. Cette fonction est réalisée de manière automatique par des algorithmes de reconnaissance vocale et le résultat n’est donc pas parfait. Il faut donc corriger certaines erreurs de traduction ou d’interprétation. D’autre part, la mise en forme du texte généré par la transcription est affiché ligne à ligne avec une indentation correspondant à la chronologie de la vidéo. Il convient donc de concaténer (mettre bout à bout) ces lignes avec la fonction rechercher-remplacer de Word ou autre traitement de texte. Cette même fonction permet de supprimer les informations de situation entre parenthèses sur la vidéo tels que le signalement de rires, applaudissements, etc.

Le pas-à-pas pratique pour extraire le texte de la vidéo

La méthode d’extraction des textes est simple et rapide mais il faut les mettre en forme après les avoir récupérés. C’est ce que vous apprendrez à faire dans ce pas-à-pas. Au final, il ne reste plus qu’a supprimer les espaces avec une fonction simple de Word.

1) Ouvrir l’onglet Transcription sous la vidéo

Avec votre navigateur Web,  accédez à la vidéo Youtube souhaitée. Sous la vidéo et dans la ligne où se trouvent les boutons J’aime ou Je n’aime pas, cliquez sur les trois points horizontaux à droite de la commande Enregistrer. Dans la petite fenêtre  affichée juste au dessous, cliquez sur l’option Ouvrir l’onglet “Transcription”.

2) Supprimez l’horodatage synchronisé avec le texte

Après analyse de la vidéo, le texte correspondant à la bande audio s’affiche à  droite de l’image, dans une fenêtre qui  comprend  un horodatage synchronisé. Si vous n’avez besoin de ce dernier, cliquez sur les 3 points verticaux de la fenêtre et sélectionnez Activer/Désactiver l’horodatage pour le supprimer.

 

3) Copiez le texte dans Word et modifiez sa mise en forme

Sélectionnez le texte et faites un copier par la combinaison de touches Ctrl + C. Ouvrez un document dans Word et faites un copier du texte en appuyant simultanément sur la combinaison Ctrl + V. Pour enlever les sauts de ligne, utilisez Ctrl + F (fenêtre Rechercher- remplacer). Puis saisissez ^p dans Rechercher  et ^s dans Remplacer.

4)   Supprimez les parenthèses

Les rires et applaudissements sont indiqués entre parenthèses. Toujours dans la fenêtre précédente Rechercher-remplacer, cliquez sur le bouton Plus et cochez l’option Utiliser les caractères génériques. Dans le champ Rechercher, saisissez exactement ce qui suit : \(*\   Dans le champ Remplacer  validez une saisie vide en cliquant sur Entrée.


Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *