venerdì 3 maggio 2019

OCR di spartiti con Audiveris su Debian Testing

Per evitare di scrivere a mano gli spartiti con Musescore un sistema comodo (dopo essere riusciti ad installarlo....) e' quello di usare Audiveris come OCR musicale



il primo problema che si pone e' che Audiveris 5 non risulta compatibile con Tesseract 4 (la cosa e' subdola perche' Audiveris sembra funzionare ma di fatto non genera file di esportazione)
Per prima cosa si deve quindi compilare dai sorgenti Tesseract 3 partendo dalla dipendenza con la libreria Leptonica che si scarica da qui
./configure
./make
./make install
./ldconfig

si passa quindi a compilare Tesseract

git clone https://github.com/tesseract-ocr/tesseract.git
git checkout 3.04
./configure
./make
./make install
./make training
./make training-install

non e' finita...perche' devono essere aggiunti i file delle lingue (che sono differenti tra la versione 3 e la 4!!!!) e che si scaricano da qui. Io ho aggiunto solo l'inglese eng.traineddata

a questo punto si inizia l'installazione di Audiveris

git clone https://github.com/Audiveris/audiveris.git

attenzione: per usare OpenJDK 11 si deve fare il checkout del ramo Java11 altrimenti si deve usare JDK 7 od 8

git checkout java11

si lancia quindi il programma Audiveris indicando dove si trovano i file di training della lingua

TESSDATA_PREFIX=/home/luca/tesseract/tessdata/ ./gradlew run

Si carica quindi il file immagine di uno spartito, si clicca la doppia freccia blue (oppure Book/Transcribe Book) ed infine Book/Export Books As per salvare in formato mxl (Music XML)

A questo punto si puo' aprire Musescore ed importare il file e correggere eventuali problemi di interpretazione del software




Nessun commento:

Posta un commento

Sigaretta Elettronica

Avevo visto qualche tempo fa un documentario sulla RAI Svizzera sul carico inquinante delle sigarette elettroniche monouso Ne ho trovata una...