venerdì 3 maggio 2019

OCR di spartiti con Audiveris su Debian Testing

Per evitare di scrivere a mano gli spartiti con Musescore un sistema comodo (dopo essere riusciti ad installarlo....) e' quello di usare Audiveris come OCR musicale



il primo problema che si pone e' che Audiveris 5 non risulta compatibile con Tesseract 4 (la cosa e' subdola perche' Audiveris sembra funzionare ma di fatto non genera file di esportazione)
Per prima cosa si deve quindi compilare dai sorgenti Tesseract 3 partendo dalla dipendenza con la libreria Leptonica che si scarica da qui
./configure
./make
./make install
./ldconfig

si passa quindi a compilare Tesseract

git clone https://github.com/tesseract-ocr/tesseract.git
git checkout 3.04
./configure
./make
./make install
./make training
./make training-install

non e' finita...perche' devono essere aggiunti i file delle lingue (che sono differenti tra la versione 3 e la 4!!!!) e che si scaricano da qui. Io ho aggiunto solo l'inglese eng.traineddata

a questo punto si inizia l'installazione di Audiveris

git clone https://github.com/Audiveris/audiveris.git

attenzione: per usare OpenJDK 11 si deve fare il checkout del ramo Java11 altrimenti si deve usare JDK 7 od 8

git checkout java11

si lancia quindi il programma Audiveris indicando dove si trovano i file di training della lingua

TESSDATA_PREFIX=/home/luca/tesseract/tessdata/ ./gradlew run

Si carica quindi il file immagine di uno spartito, si clicca la doppia freccia blue (oppure Book/Transcribe Book) ed infine Book/Export Books As per salvare in formato mxl (Music XML)

A questo punto si puo' aprire Musescore ed importare il file e correggere eventuali problemi di interpretazione del software




Nessun commento:

Posta un commento

Change Detection with structural similarity

L'idea di base e' quella di cercare le differenze tra le due immagini sottostanti Non e' immediatamente visibile ma ci sono dei ...