Apprendre une langue en regardant des vidéos courtes — devinez, puis vérifiez
Le mode Vidéo d'Erla diffuse de courtes vidéos générées par l'IA dans la langue que vous apprenez — d'abord en muet, puis avec sous-titres. Vous captez ce que vous pouvez, vous touchez une phrase pour la grammaire, puis vous passez à la suivante.

Vous avez aimé les langues grâce aux films. Les vidéos courtes prolongent l'idée.
Vous pouvez apprendre une langue en regardant des vidéos courtes — pas en plissant les yeux sur les sous-titres d'une série que vous suivez à moitié, mais en faisant défiler un fil de clips calibrés juste au-dessus de votre niveau. C'est l'idée du mode Vidéo dans Erla. Une séquence de cinq à huit secondes démarre en muet. Vous regardez la scène, vous entendez la réplique et vous essayez de la saisir à froid. Ce n'est qu'ensuite que la relecture s'enclenche — cette fois avec les sous-titres.
Ça ne ressemble pas à un devoir. Ça ressemble au scroll que vous faites déjà — sauf que chaque vidéo laisse derrière elle une vraie phrase. Le format est vertical et plein écran, comme un TikTok ou un Reel. La suivante s'enchaîne d'un balayage. Vous aimez une vidéo et Erla vous en propose des semblables. Pouce vers le bas et elle disparaît. Maîtrisée deux fois d'affilée, elle sort discrètement de la rotation.
C'est ainsi que la compréhension grandit chez l'adulte : par petites doses de langue un cran au-dessus de votre niveau, avec la scène visuelle comme appui et le texte à un toucher. Le mode Vidéo est le pendant « fil d'actualité » des modes Écoute et Lecture — même principe d'input compréhensible, surface différente. Cinq à dix minutes par jour suffisent.
Le déroulé d'une vidéo courte
Cinq étapes. Cinq à dix secondes chacune. Autant que vous voulez — dix gratuites par jour.
- 1
Une vidéo s'ouvre dans un fil vertical
Le mode Vidéo est conçu comme un fil TikTok — plein écran 9:16, une vidéo à la fois, la suivante en file d'attente derrière un balayage. Touchez pour mettre en pause, balayez vers le haut pour passer. Écouteurs ou haut-parleur du téléphone, les deux marchent ; les écouteurs aident à attraper les consonnes les plus discrètes.
- 2
Première lecture : son et image, sans sous-titres
La vidéo passe une première fois avec le son et la scène mais sans texte. Cinq à huit secondes. Vous essayez de saisir la réplique à froid, en vous appuyant sur l'image et l'intonation. Vous allez en manquer — c'est l'effort cognitif autour duquel toute la méthode est construite.
- 3
Deuxième lecture : les sous-titres apparaissent, phrase par phrase
Touchez pour relancer la lecture et les sous-titres arrivent, calés sur l'audio. Vous lisez en suivant, vous entendez exactement comment la réplique a été dite et vous associez l'orthographe au son que votre oreille avait à moitié saisi.
- 4
Touchez une phrase pour la traduction et la grammaire
Touchez n'importe quelle ligne de sous-titres pour ouvrir le même panneau de traduction et de grammaire que les autres modes d'Erla. Traduction dans votre langue, décodage mot à mot, note de grammaire propre à cette phrase. Fermez le panneau et la vidéo reprend là où elle s'était arrêtée.
- 5
J'aime, balayage, et la vidéo sort de la rotation
Pouce vers le haut et Erla vous en montre d'autres du même genre. Pouce vers le bas et elle disparaît. Deux compréhensions sans aide d'affilée et la vidéo sort automatiquement de la rotation — activez « Nouveautés uniquement » pour vous concentrer sur les vidéos jamais vues.
Pourquoi apprendre une langue avec des vidéos courtes fonctionne vraiment
Trois raisons pour lesquelles le format court bat Netflix sous-titré chez l'adulte.
Le court bat le long pour l'attention adulte
Cinq à huit secondes, c'est assez bref pour rester pleinement attentif. Deux heures de film sous-titré ne le sont pas — l'œil dérive vers le texte, l'oreille décroche, et une heure plus tard vous seriez incapable de redire les dialogues. Le mode Vidéo ne demande jamais plus d'une séquence à la fois.
Le contexte visuel ancre le vocabulaire
Entendre un mot au moment précis où vous voyez ce qu'il désigne, et votre cerveau classe le son, l'image et le sens ensemble. Deux ancrages de plus qu'une flashcard, un de plus qu'un audio seul. La Lecture et l'Écoute font déjà la moitié du travail ; la Vidéo ferme le troisième côté.
Deviner puis vérifier bat le visionnage passif sous-titré
La première lecture en muet, c'est là que se fait l'effort. À la seconde où vous devinez ce qui a été dit, puis voyez la révélation, votre cerveau enregistre l'écart. Netflix avec sous-titres supprime ce moment — le texte est là dès la première image et l'œil fait tout le travail. Le mode Vidéo remet l'écart en place.
Des vidéos courtes pour des moments courts
Cinq secondes à la fois, la langue rentre à la maison avec vous.
À la place du scroll matinal
Vous prenez le téléphone, vous ouvrez Erla, vous balayez une vidéo en espagnol au lieu d'un TikTok. Même geste, même dopamine. Deux minutes plus tard, la journée démarre avec une phrase que vous avez vraiment captée.
Entre deux réunions
Trois minutes, c'est six ou sept vidéos et une mise à jour de votre série. Vous ouvrez Erla dans l'intervalle, vous finissez une vidéo, vous fermez l'app, et vous prenez l'appel suivant dans votre autre langue.
Sur le tapis de course
Écouteurs dans les oreilles, téléphone sur le rack. Vous balayez entre deux séries ou deux chansons. Le mode Vidéo n'exige pas toute votre attention pour laisser une phrase derrière lui.
Dans la file pour un café
Trois vidéos, c'est une minute. Le barista finit encore la mousse. Vous repartez avec une expression que vous auriez ratée à la radio.
Quand l'écoute seule semble abstraite
Certains audios ne s'accrochent pas — les mots arrivent, mais rien de visuel ne les retient. Le mode Vidéo associe la réplique à une scène, et soudain le sens devient concret. Utilisez-le comme le mode plus accessible les jours où l'Écoute paraît raide.
Avant de dormir, avec une intention
Le téléphone est déjà dans votre main. Sautez le fil d'algorithme pour celui d'Erla — terminez la journée sur une phrase comprise plutôt que sur un coup de colère.
Ce que contient chaque vidéo courte
Les petits détails qui comptent quand la langue file vite.
Des vidéos de 5 à 8 secondes générées par l'IA
Voix de qualité native, intonation réelle, scène visuelle nette. Pensées pour les apprenants — prononciation claire, pas de texte qui parasite l'écran.
Fil vertical 9:16 façon TikTok
Plein écran portrait, balayez vers le haut pour passer, touchez pour mettre en pause. Apprendre une langue dans le format que votre pouce connaît déjà.
Révélation de la compréhension en deux lectures
Première lecture en muet, seconde lecture avec sous-titres. Vous essayez à froid, puis vous vérifiez ce que vous avez attrapé. C'est dans l'écart que se loge l'apprentissage.
Touchez une phrase pour la traduction et la grammaire
Traduction dans votre langue, décodage mot à mot et note de grammaire ciblée sur cette phrase précise — pas un chapitre générique.
J'aime, je n'aime pas, sortie de rotation
Pouce vers le haut pour voir d'autres vidéos du même genre. Pouce vers le bas pour la retirer. Deux compréhensions sans aide d'affilée et la vidéo sort automatiquement de la rotation.
Gratuit jusqu'à dix vidéos par jour
Dix vidéos chaque jour dans l'offre gratuite — sans carte bancaire. Les modes Écoute et Lecture sont aussi gratuits, sans limite quotidienne. Chat, Parler et les vidéos en illimité s'ouvrent avec Erla PRO.
Oui, la première lecture vous échappera — et c'est exactement le but
La première fois qu'une vidéo passe en muet, vous attraperez peut-être un mot sur cinq. C'est inconfortable. C'est aussi la zone cognitive que les chercheurs appellent l'input compréhensible — l'étirement productif où le cerveau adulte construit vraiment de nouveaux schémas. Confortable veut dire ne pas apprendre, et la première lecture en muet est le seul moment de toute la boucle où le confort est impossible.
Le mode Vidéo est bâti autour de cet inconfort, pas contre lui. La relecture finit toujours par arriver. Les sous-titres se révèlent toujours. La grammaire est toujours à un toucher. Au bout d'une semaine, l'écart se réduit. Au bout d'un mois, une vidéo qui était un brouillard devient une phrase — et la suivante, un cran plus difficile, prend sa place.
Mode Vidéo — FAQ
Réponses courtes aux questions qu'on se pose avant de télécharger.
Oui — chez l'adulte, la vidéo courte calibrée sur le niveau est l'un des canaux les plus rapides vers une nouvelle langue, parce que la scène visuelle offre au cerveau un point d'ancrage que l'audio seul n'apporte pas. Apprendre une langue en regardant des vidéos courtes encode le son, l'orthographe et la scène en même temps — trois ancrages au lieu d'un. Le mode Vidéo d'Erla est conçu pour cela : des vidéos de 5 à 8 s générées par l'IA, jouées d'abord en muet puis avec sous-titres, et la grammaire à un toucher sur chaque phrase. Cinq à dix minutes par jour pendant quelques semaines et l'écart entre ce que vous lisez et ce que vous comprenez à l'oreille se ferme vite.
S'associe bien avec les quatre autres modes
La Vidéo est le mode le plus accompagné. Les autres prolongent la reconnaissance des structures qu'elle vous donne.
Mode Écoute
Des phrases en audio d'abord, avec révélation. Le partenaire naturel du mode Vidéo — et entièrement gratuit, sans limite quotidienne.
Mode Lecture
De courtes histoires avec traduction au niveau de la phrase, grammaire et lecture audio native. Gratuit aussi.
Mode Chat
Conversations écrites avec un tuteur IA qui s'adapte à votre niveau et corrige la grammaire. PRO.
Mode Parler
Conversations à la voix avec un tuteur IA — correction de prononciation en temps réel. PRO.
Regardez votre première vidéo aujourd'hui
Le mode Vidéo est gratuit jusqu'à dix vidéos par jour, sur iOS et Android. Dans cinq minutes, vous aurez fait défiler votre première vidéo courte générée par l'IA dans une nouvelle langue — et vous l'aurez relue une fois, cette fois avec les sous-titres.