synthèse de la parole = Text to Speech (TTS) convertion
Il faut donc :
1) Analyser le texte d'entrée en paragraphes,
phrases, début et fin de phrase pour une meilleure intonation.
2) Repérer les constructions idiomatiques de la langue (abbréviation, lecture des dates, des sommes d'argent, des acronymes, ...) et savoir les différencier. Par exemple en anglais :
St. Mathews hospital is on Main St.
-> "Saint Mathews hospital is on Main street"
Add $20 to account 55374.
-> "Add twenty dollars to account five five, three
seven four."
Come at 5:30 on 12/5/99.
-> "Come at five thirty on December fifth nineteen
ninety nine."
3) Convertir chaque mot en suite de phonèmes (unité sonore élémentaire d'un langage). L'anglais possède 45 phonèmes.
4) Traiter la prosodie i.e. le rythme, la "mélodie" de l'élocution, l'emphase sur certains mots des phrases, ...
5) La production sonore