Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
tutoriel:vobsub_srt [Le 16/06/2013, 17:42] – [Script Nautilus] 78.248.9.73tutoriel:vobsub_srt [Le 24/05/2023, 21:34] (Version actuelle) – [Conversion de sous-titres VobSub en SRT] orthographe 77.207.227.156
Ligne 1: Ligne 1:
-{{tag>tutoriel vidéo sous-titrage BROUILLON}}+{{tag>tutoriel vidéo sous-titrage}}
  
 ---- ----
Ligne 13: Ligne 13:
 Quelques logiciels permettent de réaliser cette opération de façon intégrée, mais présentent quelques désavantages : Quelques logiciels permettent de réaliser cette opération de façon intégrée, mais présentent quelques désavantages :
  
-  * [[:avidemux|Avidemux]] possède une fonction "//Vobsub -> srt//", mais qui oblige à valider pas-à-pas la reconnaissance de caractères et ne sais pas interpréter les sous-titres sur deux lignes. //Vu sur le forum// [[http://forum.ubuntu-fr.org/viewtopic.php?id=140926|Transformer un sous-titre de sub en srt]]+  * [[:avidemux|Avidemux]] possède une fonction "//Vobsub -> srt//", mais qui oblige à valider pas-à-pas la reconnaissance de caractères et ne sait pas interpréter les sous-titres sur deux lignes. //Vu sur le forum// [[https://forum.ubuntu-fr.org/viewtopic.php?id=140926|Transformer un sous-titre de sub en srt]]
  
   * [[:ogmrip|OGMRip]] peut réaliser cette opération en rippant un DVD, mais cela oblige à convertir toute la vidéo en même temps.   * [[:ogmrip|OGMRip]] peut réaliser cette opération en rippant un DVD, mais cela oblige à convertir toute la vidéo en même temps.
Ligne 42: Ligne 42:
 while read -r arg while read -r arg
 do do
-  tesseract "$arg" "$arg" -l fra+  tesseract "$arg" "$arg" -l fra -psm 6
 done done
 </file> </file>
 +
 +Sous XFCE / Xubuntu, vous pouvez créer le script ci-dessous, et configurer une action personnalisée dans Thunar avec la commande : ''/chemin/OCR_Tesseract.sh %F''
 +
 +<file bash OCR_Tesseract.sh>
 +#!/bin/bash
 +
 +for arg in $@
 +do
 +  tesseract "$arg" "$arg" -l fra -psm 6
 +done
 +</file>
 +
 +Si vous n'arrivez pas à installer le script dans nautilus, vous pouvez placer et lancer ce script à l'intérieur du dossier où se trouvent les fichiers :
 +<file bash Tesseract.sh>
 +NPROC=$(nproc --all| awk '{ print $1 - 1 }'       # Set number of processor
 +for fichier in *.tif
 +do
 + (
 + echo "$fichier"
 + tesseract  "$fichier" "$fichier" -l fra -psm 6 &>/dev/null
 + ) &
 + if [[ $(jobs -r -p | wc -l) -gt $NPROC ]]; then
 + wait -n
 + fi
 +done
 +wait
 +</file>
 +
 ===== Les étapes ===== ===== Les étapes =====
  
Ligne 64: Ligne 92:
  
 __Paramètres__ : __Paramètres__ :
-  * Le numéro après ''--sid='' est l'ID du sous-titre. Cet ID peut être identifié selon la méthode décrite [[:encodage_dvd_mkv#extraire_en_vob|ici]], ou par tâtonnement en extrayant successivement chaque ID et en visualisant les fichiers image pour vérifier que ça correspond à ce qu'on veut.+  * Le numéro après ''​%%--%%sid='' est l'ID du sous-titre. Cet ID peut être identifié selon la méthode décrite [[:encodage_dvd_mkv#extraire_en_vob|ici]], ou par tâtonnement en extrayant successivement chaque ID et en visualisant les fichiers image pour vérifier que ça correspond à ce qu'on veut.
   * ''<nom du vobsub>'' est le nom du fichier de sous-titres, sans les extensions ''.idx'' et ''.sub''.   * ''<nom du vobsub>'' est le nom du fichier de sous-titres, sans les extensions ''.idx'' et ''.sub''.
  
Ligne 78: Ligne 106:
  
 Sélectionner tous les fichiers ''.tif'' et lancer le script Nautilus "OCR_Tesseract". Sélectionner tous les fichiers ''.tif'' et lancer le script Nautilus "OCR_Tesseract".
 +
 +Ou
 +
 +Vous pouvez aussi lancer le script "Tesseract.sh" dans le dossier où se trouvent les fichiers.
  
 Cela va générer un fichier ''.txt'' pour chaque fichier ''.tif'', contenant le texte du sous-titre. Cela va générer un fichier ''.txt'' pour chaque fichier ''.tif'', contenant le texte du sous-titre.