mercoledì 24 dicembre 2014

TextToSpeech su Browser

Per una installazione didattica avevo bisogno di un lettore per un testo su una pagina web. Non considerando l'ipotesi di un lettore umano ho voluto provare i sistemi (sperimentali) di TextToSpeech che prendono un generico testo ed inviano l'audio di quanto letto in automatico


Il codice per generare e' il seguente (Il testo e' tratto dall'introduzione dalle Lecture on Physics di Feynman)

---------------------------------------------
<html>
<head>
  <title>TTS</title>
  <script  src="https://ajax.googleapis.com/ajax/libs/jquery/1/jquery.min.js"></script>

  <script>
     $(document).ready(function() {
      var u1 = new SpeechSynthesisUtterance();
  u1.text = $('div').html();
  u1.lang = 'en-US';
          u1.pitch = 2;
          u1.rate = 0.5;
          u1.voiceURI = 'native';
          u1.volume = 0.5;
          speechSynthesis.speak(u1);
    });
  </script>
  <div id="demo_div">
This two-year course in physics is presented from the point of view that you, the reader, are going to be a physicist. This is not necessarily the case of course, but that is what every professor in every subject assumes! If you are going to be a physicist, you will have a lot to study: two hundred years of the most rapidly developing field of knowledge that there is. So much knowledge, in fact, that you might think that you cannot learn all of it in four years, and truly you cannot; you will have to go to graduate school too!

  </div>
---------------------------------------------

e di seguito il video del risultato


con Chrome la lettura e' molto buona ma viene troncata a circa meta' testo (tutto il lavoro e' fatto in remoto dai server di Google che leggono il testo, lo processano e mandano indietro un file audio....ad occhio c'e' impostato un tempo limite) mentre in Safari e' decisamente ridicola

Un'altra soluzione, costosa ma non poi cosi' tanto visti i risultati, e' data da GSpeech, un plugin per Joomla e Wordpress che surclassa decisamente le Api di TTS con un testo senza limiti di tempo e con una intonazione non piatta ma basata sulla punteggiatura (atttenzione audio basso)