Ceci est une ancienne révision du document !



Conversion de sous-titres VobSub en SRT

Ce tutoriel décrit une façon de convertir des sous-titres VobSub en sous-titres SRT.

VobSub est le format des sous-titres sur DVD. Chaque sous-titre est stocké sous forme d'image. Ils ne sont pas toujours bien lus par les lecteurs multimédia, lorsqu'il sont intégrés à des fichiers vidéo (mkv par exemple).

Les sous-titres SRT (appelés aussi SubRip) sont au format texte, facilement éditables, peuvent être intégrés à des fichiers vidéos et sont aisément lus par les lecteurs multimédias.

Quelques logiciels permettent de réaliser cette opération de façon intégrée, mais présentent quelques désavantages :

  • Avidemux possède une fonction "Vobsub → srt", mais qui oblige à valider pas-à-pas la reconnaissance de caractères et ne sais pas interpréter les sous-titres sur deux lignes. Vu sur le forum Transformer un sous-titre de sub en srt
  • OGMRip peut réaliser cette opération en rippant un DVD, mais cela oblige à convertir toute la vidéo en même temps.

La méthode ci-dessous utilise différents logiciels, combinant interface graphique, ligne de commande et script Nautilus, mais reste simple malgré cela.

Logiciels à installer

Les logiciels suivants doivent être installés :

hsdajkhksjdvn lksahbnaksbjvasj vlakb na bfdbfdn dgndgfndg dgndgn dgndngtekl ysa«gewtuy658k 9t7l,t

Obtenir le sous-titrage VobSub

Un sous-titrage VobSub est composé de 2 fichiers : .idx + .sub.

Pour obtenir ces 2 fichiers, il existe plusieurs méthodes selon la source, par exemple :

  • À partir d'un DVD : Avidemux possède un outil pour extraire les sous-titres (menu Outils > VOB -> VobSub).
  • À partir d'un fichier MKV : MKV-Extractor-GUI

Extraire les images des sous-titres

Pour extraire les images des sous-titres au format TIFF, on utilise la commande suivante :

subp2tiff --sid=0 -n <nom du vobsub>

Paramètres :

  • Le numéro après –sid= est l'ID du sous-titre. Cet ID peut être identifié selon la méthode décrite ici, ou par tâtonnement en extrayant successivement chaque ID et en visualisant les fichiers image pour vérifier que ça correspond à ce qu'on veut.
  • <nom du vobsub> est le nom du fichier de sous-titres, sans les extensions .idx et .sub.

Cette commande doit être lancée dans le dossier où sont situés ces 2 fichiers.

Cela va générer toute une série de fichiers .tif : chacune de ces images est un sous-titre.

Attention, cela peut faire beaucoup de fichiers : si votre vidéo a 1000 sous-titres, il y aura 1000 fichiers .tif.

Un fichier .xml est également généré, qui contient l'indexation des sous-titres au format XML.

Convertir les images des sous-titres en texte

Sélectionner tous les fichiers .tif et lancer le script Nautilus "OCR_Tesseract".

Ou

Vous pouvez aussi lancer le script "Tesseract.sh" dans le dossier où se trouvent les fichiers.

Cela va générer un fichier .txt pour chaque fichier .tif, contenant le texte du sous-titre.

Générer le fichier de sous-titres SRT

Lancer la commande suivante, dans le dossier où sont situés les fichiers :

subptools -s -w -t srt -i nom.xml -o nom.srt

Paramètres :

  • nom.xml : le nom du fichier .xml (voir étape 2)
  • nom.srt : le nom du fichier de sous-titres .srt que l'on veut créer.

Un fichier de sous-titres .srt est généré.

Correction orthographique

Ouvrir le fichier .srt avec Gedit ou LibreOffice et utiliser le correcteur orthographique, ainsi que la fonction "Remplacer" pour corriger rapidement les anomalies dues à la reconnaissance de caractères.

Tout suivi à la lettre et aucun des deux scripts ne fonctionnent, aucun fichier texte n'est créé. Quand on ne sait pas ce que l'on fait, on s'abstient.

  • tutoriel/vobsub_srt.1633319194.txt.gz
  • Dernière modification: Le 04/10/2021, 05:46
  • par 24.153.107.90