WEBVTT
Kind: captions
Language: fr

00:00:00.070 --> 00:00:04.760
Avez-vous déjà remarqué qu'une vidéo avec de la neige ou des confettis qui tombent est très laide ?

00:00:04.760 --> 00:00:07.370
Dès qu'il y a quelque chose qui flotte dans les airs,

00:00:07.370 --> 00:00:10.280
soudainement, la qualité de la vidéo que vous regardez s'écroule.

00:00:10.280 --> 00:00:13.639
Vous pouvez observer ça sur cet incroyable clip de 200 kilos de confettis

00:00:13.639 --> 00:00:16.580
projetés sur Ed Sheeran dans la version anglaise d'X Factor.

00:00:16.580 --> 00:00:21.810
Bon, si vous savez déjà comment fonctionne la compression vidéo, vous pouvez changer de vidéo.

00:00:21.810 --> 00:00:23.720
Pour les autres, parlons de bitrate.

00:00:23.720 --> 00:00:27.359
Je ne suis pas vraiment en Norvège, au fait, si ce n'était pas déjà évident.

00:00:27.359 --> 00:00:30.640
J'aurais pu essayer de trouver de la vraie neige ou d'acheter un tas de confettis,

00:00:30.640 --> 00:00:33.960
mais je peux, de cette façon, tester des trucs avec des effets visuels contrôlés.

00:00:33.960 --> 00:00:38.190
Ce qui, en plus, veut dire que je n'ai pas besoin de nettoyer après.

00:00:38.190 --> 00:00:40.600
Bon, pour résumer le problème en une phrase :

00:00:40.600 --> 00:00:44.120
il y a une limite au nombre de uns et de zéros que l'on peut se permettre.

00:00:44.120 --> 00:00:48.180
À l'époque de la télévision analogique, la vidéo n'était pas compressée.

00:00:48.180 --> 00:00:49.899
La caméra TV scannait le signal,

00:00:49.899 --> 00:00:51.170
signal transmis dans l'air,

00:00:51.170 --> 00:00:53.260
et votre poste de télévision le lisait.

00:00:53.260 --> 00:00:54.969
[Simplification massive]
Et oui, c'était en basse résolution,

00:00:54.969 --> 00:00:59.039
mais à peu près chaque détail que la caméra capturait apparaissait sur votre écran.

00:00:59.039 --> 00:01:01.660
Et c'est suffisant quand il n'y a que quelques chaînes de télé

00:01:01.660 --> 00:01:04.570
et qu'elles sont littéralement dans les airs.

00:01:04.570 --> 00:01:06.920
Mais... c'est vraiment du gâchis.

00:01:06.920 --> 00:01:09.450
La raison pour laquelle la télévision digitale possède autant de chaînes,

00:01:09.450 --> 00:01:11.780
et que la vidéo web existe,

00:01:11.780 --> 00:01:13.830
c'est la compression.

00:01:13.830 --> 00:01:18.000
Si vous essayez de transmettre chaque pixel d'une vidéo HD, avec une qualité parfaite,

00:01:18.000 --> 00:01:22.850
vous auriez besoin d'une connection d'un gigabit/seconde. À l'heure où je tourne ceci,

00:01:22.850 --> 00:01:27.570
ça irait au delà de plus de 100 connections haut-débit américaines simultanément,

00:01:27.570 --> 00:01:31.170
ou plus de 50 connections sud-coréennes haut-débit.

00:01:31.170 --> 00:01:35.810
Donc, si vous voulez que YouTube fonctionne, cette quantité de données, ce bitrate,

00:01:35.810 --> 00:01:38.110
il faut le minimiser.

00:01:38.110 --> 00:01:40.970
La première étape est la compression d'image standard.

00:01:40.970 --> 00:01:43.420
Plus ou moins chaque photo sur Internet est compressée,

00:01:43.420 --> 00:01:47.430
surtout en supprimant des petits bouts de détail que l’œil ne remarquera probablement pas.

00:01:47.430 --> 00:01:50.210
En tout cas, jusqu'à ce qu'elle soit capturée et repostée

00:01:50.210 --> 00:01:53.680
vingt fois par vingt comptes Instagram différents.

00:01:53.680 --> 00:01:56.799
Vous pouvez prendre chaque image individuelle de la vidéo

00:01:56.799 --> 00:01:58.950
et y appliquer cette compression.

00:01:58.950 --> 00:02:01.630
L'étape deux est la compression interframe.

00:02:01.630 --> 00:02:04.520
Jusqu'à ce qu'une scène change, pourquoi s'embêter à stocker des images entières

00:02:04.520 --> 00:02:06.950
lorsque seulement stocker les éléments qui changent suffit ?

00:02:06.950 --> 00:02:09.750
Après tout, si je ne fais que parler devant un fond uni,

00:02:09.750 --> 00:02:12.710
c'est inutile d'envoyer des nouvelles données pour cet arrière-plan tout le temps.

00:02:12.710 --> 00:02:15.740
Il suffit de dire au lecteur vidéo de répéter ce qui se trouvait là avant.

00:02:15.740 --> 00:02:17.860
Ou si je me déplace un peu en parlant,

00:02:17.860 --> 00:02:21.220
dire au lecteur de déplacer ce bloc de pixels un peu à droite,

00:02:21.220 --> 00:02:24.240
et peut être changer un peu les couleurs ici et là.

00:02:24.240 --> 00:02:26.890
Voilà comment on peut réduire des gigabits de vidéo par seconde

00:02:26.890 --> 00:02:28.870
en quelque chose que vous pouvez charger sur votre téléphone :

00:02:28.870 --> 00:02:30.500
Des maths. Beaucoup de maths.

00:02:30.500 --> 00:02:33.520
Mais je pense qu'une démonstration pratique sera plus parlante, alors :

00:02:33.520 --> 00:02:35.660
Je vais limiter le bitrate de cette vidéo,

00:02:35.660 --> 00:02:39.010
le nombre de uns et de zéros par seconde qui est utilisé pour l'encoder.

00:02:39.010 --> 00:02:41.860
Et oui, YouTube va le bidouiller lors de la mise en ligne,

00:02:41.860 --> 00:02:44.010
mais je ne peux pas rajouter du détail magiquement :

00:02:44.010 --> 00:02:47.340
donc même si vous regardez la vidéo avec la meilleure qualité possible,

00:02:47.340 --> 00:02:49.870
ce que vous voyez est tout de même une version limitée.

00:02:49.870 --> 00:02:51.980
Je suis actuellement à 200 kilobits par seconde,

00:02:51.980 --> 00:02:54.810
200 000 uns et zéros qui passent sur le réseau à chaque seconde.

00:02:54.810 --> 00:02:56.730
Ce n'est pas si terrible avec l'encodage moderne,

00:02:56.730 --> 00:03:00.810
vous allez perdre des détails fins sur mon visage ou mes cheveux, et les gestes de mes mains,

00:03:00.810 --> 00:03:04.080
mais vous pouvez toujours voir ce qui se passe clairement.

00:03:04.080 --> 00:03:06.110
Mais maintenant, ajoutons un peu de neige.

00:03:06.110 --> 00:03:10.660
Et soudainement, ces bits ne sont plus tous utilisés pour me rendre moi.

00:03:10.660 --> 00:03:13.340
À la place, ils sont utilisés pour tracer tout ce qui vole aux alentours.

00:03:13.340 --> 00:03:16.100
C'est chaotique, ça change de direction tout le temps, c'est compliqué.

00:03:16.100 --> 00:03:18.930
donc, simplement dire de "bouger ces pixels ici" ne fonctionnera pas non plus.

00:03:18.930 --> 00:03:21.480
Ajoutons un peu de confettis, aussi, des multicolores cette fois.

00:03:21.480 --> 00:03:23.360
Voilà ! Maintenant, tout part en vrille.

00:03:23.360 --> 00:03:25.500
Plus il y a de mouvement dans chaque image,

00:03:25.500 --> 00:03:26.510
plus de confettis, voilà,

00:03:26.510 --> 00:03:29.370
plus ces 200 kilobits doivent s'éparpiller.

00:03:29.370 --> 00:03:30.670
Encore plus de confettis !

00:03:30.670 --> 00:03:34.480
Peu importe les tentatives d'optimisation de l'encodeur pour conserver les visages et les teintes de peau,

00:03:34.480 --> 00:03:38.600
il n'y a juste plus de bits en réserve. Plus de confettis, plus de neige !

00:03:38.600 --> 00:03:40.560
Maintenant, même si je fais remonter le bitrate,

00:03:40.560 --> 00:03:42.430
avec la meilleure qualité possible,

00:03:42.430 --> 00:03:44.350
ça ne va pas être meilleur à voir.

00:03:44.350 --> 00:03:48.260
Je ne sais pas pourquoi je hurle, je vais rajouter le bruit de vent au montage.

00:03:48.260 --> 00:03:52.590
Mais ce n'est pas vraiment à cause des confettis en eux même. C'est une question de mouvement.

00:03:52.590 --> 00:03:54.370
Si on arrête tous ces trucs en l'air,

00:03:54.370 --> 00:03:57.010
et qu'on en fait un arrière-plan :

00:03:57.010 --> 00:03:58.620
au cours des deux prochaines secondes,

00:03:58.620 --> 00:04:01.850
la qualité de la vidéo reviendra.

00:04:01.850 --> 00:04:05.990
Voilà pourquoi la qualité s'effondre quand votre équipe de sport gagne et que les confettis sont lâchés.

00:04:05.990 --> 00:04:08.830
La vidéo n'est littéralement plus ce qu'elle était.

00:04:10.900 --> 00:04:12.900
 

