In questi giorni una persona cara mi ha chiesto se posso aiutarla a trascrivere dei video, si tratta di alcune lezioni universitarie.
Ho così tirato fuori un mio vecchio progetto che ha, appunto, lo scopo di aggiungere sottotitoli ai video e di fornire tali sottotitoli anche come trascrizione del video stesso.
Si tratta di un proof of concept abbastanza utilizzabile: se il video non è troppo lungo (suggerisco di non superare i 40 minuti circa) e se l'audio è di buona qualità, nel complesso funziona, anche se una revisione manuale sarà sempre opportuna. Allo stato attuale ci sono molti limiti legati all'interfaccia utente, all'assenza di feedback durante l'upload, al costo per tenere in piedi il server. Con un budget relativamente contenuto, questo è ciò che posso offrire:
https://autotranscript.servep2p.com/
I risultati migliori si ottengono fornendo un link diretto a un file mp4 piuttosto che facendo un upload: non soltanto con il link diretto sarà tutto più veloce, ma sarà anche disponibile un riproduttore multimediale per vedere il video con i sottotitoli generati.
Chi sa configurarsi un ambiente LAMP sulla propria macchina, con Apache 2, PHP 7.2 e Python 2.7 (Python 3 non è supportato), può scaricarsi il codice sorgente da me preparato (che richiede anche Bash e FFMpeg), per studiarselo, usarlo, modificarlo, adattarlo alle proprie esigenze e, soprattutto, aiutare se stesso e il prossimo (come ci ha insegnato Richard Stallman). L'ambiente ideale di esecuzione è Ubuntu Server 18.04:
autotranscript.zip (è lo stesso identico codice che si trova sul server sopra linkato)
Per prestazioni al limite dell'usabilità, servono almeno 2 CPU e 4 GB di RAM, meglio se molto di più.
Assumendo di partire da una installazione di base di Ubuntu Server 18.04, è necessario installare quanto segue per permettere l'esecuzione del codice:
apt install apache2 php libapache2-mod-php
apt install php-curl
apt install python-google* python-progressbar* python-pysrt*
apt install ffmpeg
pip install autosub
Non fornisco dettagli sulla configurazione del server, che lascio al tuo ingegno. Presta però particolare attenzione al "php.ini" per permettere upload sufficientemente grandi.
(24 luglio 2021)