Mappa del sito
- Introduzione
- CAP 1 - Tecnologie Vocali
- 1.1 L'albore delle tecnologie vocali
- 1.2 Tecnologia di riconoscimento vocale
- 1.2.1 Sistemi per dettatura e per applicazioni telefoniche
- 1.2.2 Qualche elemento di fonetica
- 1.2.3 Struttura e principi del riconoscimento vocale
- 1.2.4 Modelli acustici dei fonemi
- 1.2.5 La ricerca della sequenza fonetica
- 1.2.6 I modelli del linguaggio
- 1.2.7 Il problema della semantica
- 1.3 Tecnologia di sintesi vocale
- 1.3.1 Come una macchina legge
- 1.3.2 Il componente NLP
- 1.3.3 L'analisi del testo
- 1.3.4 Produzione automatica di fonemi
- 1.3.5 Generazione della prosodia
- 1.3.6 Il componente DSP
- 1.3.7 Sintesi basata sulle regole
- 1.3.8 Sintesi concatenativa
- 1.3.9 La costruzione del database
- 1.3.10 La sintesi vocale
- 1.4 Conclusioni
- CAP 2 - L'interfaccia, un aspetto chiave di ogni interazione
- 2.1 Introduzione
- 2.2 Interazione uomo-macchina, l’interfaccia
- 2.3 Evoluzione dei paradigmi di interazione uomo-computer
- 2.3.1 Dal terminale scrivente al web
- 2.3.2 Il futuro immediato: parla e ascolta
- 2.4 Interfacce vocali e settori di utilizzo
- 2.5 I fattori che hanno determinato l’utilizzo delle tecnologie vocali nell’ambito del web
- 2.5.1 Sviluppo e diffusione della telefonia mobile
- 2.5.2 Aumento dell’utenza Internet
- 2.5.3 Benefici ottenuti dalle aziende
- 2.5.4 Aumento dell’accessibilità ed usabilità della rete
- 2.6 Il web e la voce, gli standard
- 2.6.1 Lo standard VXML
- 2.6.2 Lo standard SALT
- 2.7 Conclusioni
- CAP 3 - Definizione del progetto e scelte tecnologiche
- 3.1 Scopo del progetto
- 3.2 Avvalersi di standard o effettuare un’altra scelta?
- 3.3 Struttura generale del progetto
- 3.4 Panoramica dei requisiti
- 3.4.1 Il Sistema Operativo
- 3.4.2 La connessione telefono-computer
- 3.4.2.1 Il Ccscript
- 3.4.3 Il linguaggio di programmazione: Perl
- 3.4.4 Analisi di una pagina HTML
- 3.4.4.1 L’importanza dell’attributo “lang”
- 3.4.4.2 I collegamenti ipertestuali
- 3.4.4.3 Le mappe di immagine
- 3.4.4.4 Lo scripting
- 3.4.4.5 Gli URI (Universal Resource Identifier)
- 3.4.4.6 Rappresentazione dei documenti HTML
- 3.4.5 Il processo di sintesi
- 3.4.5.1 Lo standard SAMPA
- 3.4.6 Il formato del file sonoro
- CAP 4 - VocalService, l'implementazione
- 4.1 Installazione e configurazione del software IVR
- 4.1.2 Il file di configurazione Bayonne.sched
- 4.1.3 Il file di configurazione Bayonne.conf
- 4.2 L’interfaccia utente
- 4.3 L’input dell’utente
- 4.4 L’analisi delle pagine
- 4.4.1 La tecnica dei token
- 4.4.2 La ricerca semplice
- 4.4.2.1 Analisi di codice di scripting
- 4.4.2.2 Mappe di immagine
- 4.4.3 Il problema degli URI
- 4.4.3.1 URI assoluti nel servizio generale di informazioni
- 4.4.3.2 URI assoluto nelle pagine richieste dall’utente
- 4.4.4 I file creati
- 4.4.5 Il secondo menù dell’interfaccia
- 4.4.5.1 Ascoltare i titoli delle notizie
- 4.4.5.2 Ascoltare una notizia
- 4.4.5.3 La ricerca più selettiva
- 4.4.6 L’ottimizzazione del testo estratto
- 4.4.7 Installazione e configurazione Mbrola
- 4.4.8 La trasformazione dei dati di input: da "txt" a "pho"
- 4.4.9 Il formato del file sonoro
- 4.4.10 L’abbandono del servizio
- CAP 5 - Conclusioni e sviluppi futuri
- 5.1 Considerazioni finali
- 5.2 Punti di forza dell’applicazione
- 5.2.1 Utilizzo di contenuti web esistenti
- 5.2.2 Indipendenza da messaggi vocali preregistrati
- 5.2.3 Servizio multilingua
- 5.2.4 Utilizzo tramite telefoni a toni
- 5.2.5 Open source dal punto di vista software
- 5.2.6 Non ci sono dipendenze da standard
- 5.2.7 Risolve alcuni problemi legati all’accessibilità
- 5.3 Problemi aperti
- 5.4 Sviluppi futuri
- 5.4.1 Integrazione con un riconoscitore vocale
- 5.4.2 Miglioramento dell’interfaccia utente rendendo possibili operazioni di interazione
- 5.4.3 Miglioramento usabilità
- 5.4.3.1 Personalizzazione del servizio
- 5.4.4 Utilizzo di database al posto dei file di testo
- 5.4.5 Compatibilità con Windows
- 5.4.6 Analisi codice XML
- 5.4.7 Traduzione realtime
- 5.4.8 Analisi pagine con frame
- 5.4.9 Migliorare il processo di input
- 5.5 Conclusioni
- Appendici
- Appendice A, requisiti e test del progetto
- Appendice B, interfaccia.scr
- Appendice C, ppp-on
- Appendice D, ppp-on-dialer
- Appendice E, connessione.pl
- Appendice F, argomento.pl
- Appendice G, cerca_link.pl
- Appendice H, leggi_titolo.pl
- Appendice I, leggi_notizia.pl
- Appendice L, italiano.pl (parte 1)
- Appendice L, italiano.pl (parte 2)
- Appendice M, il file delle regole: itbase
- Appendice N, ppp-off
- Bibliografia
- Ringraziamenti
- Link interessanti
- Oddcast: sintetizzatore vocale multilingua online
- Possibilità di attacchi con la funzione di riconoscimento vocale
- La sintesi vocale su Wikipedia
- Download