fbpx
VALL-E :l'IA controversée de Microsoft

VALL-E :l’IA controversée de Microsoft

Bien que ce modèle de langage ait le potentiel de permettre une variété d’applications de synthèse vocale, les considérations éthiques et les cyber-risques ne peuvent être sous-estimés.
Microsoft a introduit un modèle de synthèse vocale capable de simuler fidèlement la voix humaine à partir d’échantillons de parole très courts.
Ce modèle d’IA, appelé VALL-E, a été formé sur plus de 60 000 heures d’anglais parlé, il faut 3 secondes à cette IA pour imiter une voix humaine.
VALL-E peut non seulement imiter l’intonation de la voix, mais également préserver l’émotion de l’orateur et l’environnement acoustique des invites vocales dans la synthèse.
Ce modèle de langage permet une variété d’applications de synthèse vocale telles que le traitement de la parole et création de contenu audio en combinant d’autres modèles d’IA générative tels que GPT-3.
VALL-E n’est pas accessible au public pour le moment.
Pour une utilisation dans le monde réel, Microsoft indique que le système devrait inclure une journalisation pour vérifier que l’orateur autorise l’utilisation de sa voix.
Retour en haut