Différences
Ci-dessous, les différences entre deux révisions de la page.
Prochaine révision | Révision précédente | ||
tutoriel:vobsub_srt [Le 17/11/2011, 23:40] beguam Création |
tutoriel:vobsub_srt [Le 24/05/2023, 21:34] (Version actuelle) 77.207.227.156 [Conversion de sous-titres VobSub en SRT] orthographe |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | {{tag>tutoriel vidéo sous-titrage BROUILLON}} | + | {{tag>tutoriel vidéo sous-titrage}} |
---- | ---- | ||
Ligne 13: | Ligne 13: | ||
Quelques logiciels permettent de réaliser cette opération de façon intégrée, mais présentent quelques désavantages : | Quelques logiciels permettent de réaliser cette opération de façon intégrée, mais présentent quelques désavantages : | ||
- | * [[:avidemux|Avidemux]] possède une fonction "//Vobsub -> srt//", mais qui oblige à valider pas-à-pas la reconnaissance de caractères et ne sais pas interpréter les sous-titres sur deux lignes. //Vu sur le forum// [[http://forum.ubuntu-fr.org/viewtopic.php?id=140926|Transformer un sous-titre de sub en srt]] | + | * [[:avidemux|Avidemux]] possède une fonction "//Vobsub -> srt//", mais qui oblige à valider pas-à-pas la reconnaissance de caractères et ne sait pas interpréter les sous-titres sur deux lignes. //Vu sur le forum// [[https://forum.ubuntu-fr.org/viewtopic.php?id=140926|Transformer un sous-titre de sub en srt]] |
* [[:ogmrip|OGMRip]] peut réaliser cette opération en rippant un DVD, mais cela oblige à convertir toute la vidéo en même temps. | * [[:ogmrip|OGMRip]] peut réaliser cette opération en rippant un DVD, mais cela oblige à convertir toute la vidéo en même temps. | ||
Ligne 37: | Ligne 37: | ||
#!/bin/bash | #!/bin/bash | ||
- | for arg in $NAUTILUS_SCRIPT_SELECTED_FILE_PATHS | + | IFS=' |
+ | ' | ||
+ | printf %s "$NAUTILUS_SCRIPT_SELECTED_FILE_PATHS" | | ||
+ | while read -r arg | ||
do | do | ||
- | tesseract "$arg" "$arg" -l fra | + | tesseract "$arg" "$arg" -l fra -psm 6 |
done | done | ||
+ | </file> | ||
+ | |||
+ | Sous XFCE / Xubuntu, vous pouvez créer le script ci-dessous, et configurer une action personnalisée dans Thunar avec la commande : ''/chemin/OCR_Tesseract.sh %F'' | ||
+ | |||
+ | <file bash OCR_Tesseract.sh> | ||
+ | #!/bin/bash | ||
+ | |||
+ | for arg in $@ | ||
+ | do | ||
+ | tesseract "$arg" "$arg" -l fra -psm 6 | ||
+ | done | ||
+ | </file> | ||
+ | |||
+ | Si vous n'arrivez pas à installer le script dans nautilus, vous pouvez placer et lancer ce script à l'intérieur du dossier où se trouvent les fichiers : | ||
+ | <file bash Tesseract.sh> | ||
+ | NPROC=$(nproc --all| awk '{ print $1 - 1 }') # Set number of processor | ||
+ | for fichier in *.tif | ||
+ | do | ||
+ | ( | ||
+ | echo "$fichier" | ||
+ | tesseract "$fichier" "$fichier" -l fra -psm 6 &>/dev/null | ||
+ | ) & | ||
+ | if [[ $(jobs -r -p | wc -l) -gt $NPROC ]]; then | ||
+ | wait -n | ||
+ | fi | ||
+ | done | ||
+ | wait | ||
</file> | </file> | ||
Ligne 49: | Ligne 79: | ||
Un sous-titrage VobSub est composé de 2 fichiers : ''.idx'' + ''.sub''. | Un sous-titrage VobSub est composé de 2 fichiers : ''.idx'' + ''.sub''. | ||
- | Pour obtenir ces 2 fichiers, il existe plusieurs méthodes selon la source, par exemple : | + | Pour obtenir ces 2 fichiers, il existe [[:sous-titrage#extraction_de_sous-titres|plusieurs méthodes]] selon la source, par exemple : |
* À partir d'un DVD : **Avidemux** possède un outil pour extraire les sous-titres (menu Outils > VOB%% -> %%VobSub). | * À partir d'un DVD : **Avidemux** possède un outil pour extraire les sous-titres (menu Outils > VOB%% -> %%VobSub). | ||
* À partir d'un fichier MKV : **MKV-Extractor-GUI** | * À partir d'un fichier MKV : **MKV-Extractor-GUI** | ||
Ligne 58: | Ligne 88: | ||
<code> | <code> | ||
- | subp2tiff -sid=0 -n <nom du vobsub> | + | subp2tiff --sid=0 -n <nom du vobsub> |
</code> | </code> | ||
__Paramètres__ : | __Paramètres__ : | ||
- | * Le numéro après ''-sid='' est l'ID du sous-titre. Cet ID peut être identifié selon la méthode décrite [[:encodage_dvd_mkv#extraire_en_vob|ici]], ou par tâtonnement en extrayant successivement chaque ID et en visualisant les fichiers image pour vérifier que ça correspond à ce qu'on veut. | + | * Le numéro après ''%%--%%sid='' est l'ID du sous-titre. Cet ID peut être identifié selon la méthode décrite [[:encodage_dvd_mkv#extraire_en_vob|ici]], ou par tâtonnement en extrayant successivement chaque ID et en visualisant les fichiers image pour vérifier que ça correspond à ce qu'on veut. |
* ''<nom du vobsub>'' est le nom du fichier de sous-titres, sans les extensions ''.idx'' et ''.sub''. | * ''<nom du vobsub>'' est le nom du fichier de sous-titres, sans les extensions ''.idx'' et ''.sub''. | ||
Ligne 76: | Ligne 106: | ||
Sélectionner tous les fichiers ''.tif'' et lancer le script Nautilus "OCR_Tesseract". | Sélectionner tous les fichiers ''.tif'' et lancer le script Nautilus "OCR_Tesseract". | ||
+ | |||
+ | Ou | ||
+ | |||
+ | Vous pouvez aussi lancer le script "Tesseract.sh" dans le dossier où se trouvent les fichiers. | ||
Cela va générer un fichier ''.txt'' pour chaque fichier ''.tif'', contenant le texte du sous-titre. | Cela va générer un fichier ''.txt'' pour chaque fichier ''.tif'', contenant le texte du sous-titre. |