La synthèse de la parole

Elle consiste à convertir du texte écrit en phrases parlées.

synthèse de la parole = Text to Speech (TTS) convertion

Il faut donc :
1) Analyser le texte d'entrée en paragraphes, phrases, début et fin de phrase pour une meilleure intonation.

2) Repérer les constructions idiomatiques de la langue (abbréviation, lecture des dates, des sommes d'argent, des acronymes, ...)  et savoir les différencier. Par exemple en anglais :

St. Mathews hospital is on Main St.
-> "Saint Mathews hospital is on Main street"

Add $20 to account 55374.
-> "Add twenty dollars to account five five, three seven four."

Come at 5:30 on 12/5/99.
-> "Come at five thirty on December fifth nineteen ninety nine."

3) Convertir chaque mot en suite de phonèmes (unité sonore élémentaire d'un langage). L'anglais possède 45 phonèmes.

4) Traiter la prosodie i.e. le rythme, la "mélodie" de l'élocution, l'emphase sur certains mots des phrases, ...

5) La production sonore