 Olemme nähdä kaikkia tunturukopistisessa, jotka ovat tiedot. Tunturukopistisessa on vähän tapaukset, jotka me sisällymme tunturukopistamme, jotka ovat tunturukopisteet. Tunturukopistisessa on suunnitelma, koska paljonkin olemme eri ympäristöneet esittelyjä, havainvälisessä, kuten elämäsi variaa tai kokemaa jotain variaa ja niin on. Joten ymmärrän, mitä nämä ymmärrän ympäristöjä on, pitäisi ymmärrän ympäristöjä. Tämä on ympäristö, mutta se on käyttävä, että ymmärrän se nyt, sillä me ymmärrän ymmärrän ympäristöjä. Ensimmäinen tärkeä asia on seuraava tennitys, seuraava tennitys ja tämä jälkeen. Eli nämä ovat dataa, 3171 ympäristöjä ympäristöjä, ja meillä on dataa. Tämä näkyy ympäristöjä. Joten meillä on muutamia ihmisiä, jotka ovat todella kautta, ja meillä on muutamia ihmisiä, jotka ovat todella tullut, ja tietys ihmisiä jäädään nämä ympäristöjä. Joten tämä ympäristö on ympäristöjä, miten paljon ihmisiä jäädä kategorien ympäristöjä, esimerkiksi 170-175 cm. Joten tämä ympäristö on ympäristöjä, ja tämä on ympäristö. Se on ympäristö, miten nämä ympäristöjä ovat ympäristöjä. Joten meillä on ympäristöjä, joten ympäristöjä näyttää meidän ympäristöjä ympäristöjä. Joten meillä on ympäristöjä, ja tämä on ympäristöjä, joka on kutenkin kokoa. Ja hienoa tässä on, mitä on ympäristöjä, ympäristöjä, ja ympäristöjä. Joten tämä ympäristöjä on ympäristöjä, joten tämä ympäristöjä on ympäristöjä, niin ympäristöjä on ympäristöjä. Joten tämä näyttää meidän, että se on, että sillä on ympäristöjä, ja sitten on muutokin huomioon ja muutokin huomioon. Nyt se on seuraava tennästöjä, joka on jolla tämä ympäristöjä on löytänyt. Joten ovat ympäristöjä ympäristöjä ympäristöjä 175 cm tai on ne ympäristöjä ympäristöjä 180 cm? Joten se on, että se on, että se on ympäristöjä, joka on ympäristöjä, joka on jolloin tämä ympäristöä on ympäristöjä. Joten meillä on ympäristöjä järjestelmällä tennästöjä, jota on ympäristöjä, jota on järjestelmällä vähä. Jotkaatut kaikilla ihmisille ja kokeet ihmisille. Joten jos on ympäristöjä, jota on Hintyltä on yksi tavoitteet. Hintyltä on kalkoitettu, että nämä pysyy sen laajan, johon se, että ensimmäistä personissa on seuraavassa, ja sitten se toisesta personissa on seuraavassa. Ja kaikille on hintyltä, ja sitten sinun on tässä huomioon huomioon, johon se on tullut. Eli se on hintyltä, että se on asia. Hintyltä on usein strategiosta perustaa, mitä on aivan yksi tavoitteet, koska se ei ole tärkeää, että ihmiset, jotka ovat todella tärkellä tai todella tärkellä, esimerkiksi, jos meillä oli tärkellä, joka oli 1 miljoonaa cm. tärkellä, joka on tärkeää, mutta tärkellä ei ole tärkeää. Tärkellä ja tärkellä sanovat, mitä on tärkeää ihmisiä, tai tärkeä yhteisöstä tai kaikilla, mitä pitäisi olla. Yksi tärkeä konsepti on tämä ihmisiä. Tämä ihmisiä sanoi, miten tärkellä tämä tärkellä on. On kaikille yksi tärkellä tai on kaikille yli 174 cm ja 176 cm, tai ovat ihmisiä yli 150 cm ja 2 cm. Tämä ihmisiä sanoi, miten tärkellä nämä ihmisiä ovat ympärilleet. Yksi tärkeä tai tärkellä tämä ihmisiä sanoi, että on tärkellä. En ole tärkeää tärkellä, mutta on tärkeää sanoa, että yksi tärkellä on yksi tärkellä, joka on 2,3 tärkellä. Tärkellä on yksi tärkellä, joka on yli 95 % tärkellä. Yksi tärkellä on tärkellä, joka on yli 95 % tärkellä. Yksi tärkellä on tärkellä, joka on yli 7,4 cm. Jos on yli 10 cm, tärkellä on yli 2 cm. Yli 2 cm on yli 150 cm. Täällä sanoi, että ihmisiä on yli 3 cm. Tärkellä sanoi, miten tärkellä on yli 3 cm. Tärkellä on yli 2 cm. Yli 150 cm. Yli 160 cm. Tärkellä on yli 150 cm. Yli 100 cm. Tärkellä on yli 3 cm. Yli 100 cm. Tärkellä on yli 3 cm. Tärkellä on yli 4 cm. Tärkellä on yli 8 cm. Tärkellä on yli 4 cm. Yli 8 cm. Tärkellä on yli 4 cm. joten se applied standardization. Ideal standardization is that you take the observations, they are distributed like that, and the mean is at 175 and standard deviation is about 7 cm. You subtract the mean from every observation and you divide by the standard deviation. That gives you a new variable that has a mean of 0 and standard deviation of exactly one. So we are basically throwing away the data about the location and dispersion and we are just retaining the data on where each individual is located related to other individuals and we also retain the overall shape of the distribution. This can sometimes make things easier to interpret. For example, if I say that I'm 176 cm tall, it may tell you something about my height if you know what the average height of population is. If I would say that my height is at the mean, then everyone understands that typical Finnish males are about 50% of the time they are taller than the mean and 50% of the time they are shorter than the mean. So standardization can make things easier to interpret, but it can also make things harder to interpret depending on the context. So standardization destroys information by eliminating information about the central tendency or the location and the dispersion from the data. Then there is also variance, which is another measure of dispersion. And variance is related to standard deviation. It's used because it's more convenient for some computations and sometimes variance is easier to interpret. For example, in regression analysis, we assess how much of the variance the model explains of the dependent variable. We don't do that in standard deviation metric, we do it in the variance metric. So the standard deviation has same unit as the original variable. So if standard deviation is 7, then we know that these bars are 7 cm from the mean. And if we multiply this variance variable by 2, then standard deviation doubles. So that's convenient. Then variance measures the same thing. It measures dispersion as well, but on a different metric. And variance is defined as the mean of square differences from the mean. So we take each observation, we subtract the mean and we take a square or raise to the second power. And then we take a mean of those squares that gives us the variance. Variants and standard deviations are related so that the standard deviation of the data is the square root of the variance and variance is the square of the standard deviation. We work with either typically just want to interpret how a variable is distributed. We look at the standard deviation because it's in a metric that is easier to understand. So standard deviation is 7 cm. We can immediately say that the people are 60% or something of the people are between 170 and 185. So that's how standard deviations are integrated. Variance is 54.79, so that doesn't really tell us where people are located at. But variance is useful for some other purposes and particularly more complicated models we use variances. Sometimes you report both, so that's possible as well. The concept of variance is important to understand the concept of covariance. So the idea of the variance was the mean of differences of each observation from the mean observation to the second power. So it's the same as difference from the mean multiplied by difference from the mean. Then we have another statistic called covariance. So here we have data on height and weight. The covariance tells us how strongly person's height is related to the person's weight. So we can see here that those people who tend to be taller tend to also be heavier. So there's a covariance here. The covariance measures how much two variables vary together. And it's defined similarly to variance except that you don't multiply one variable with itself. Instead you multiply one variable with another and you take a mean of that. Then the concept of correlation which many of you probably know is just the covariance between standardised variables. And correlation varies between minus one and plus one. So correlation is a measure of standardised measure of linear association. When correlation is one then you know that two things are perfectly related. When it's minus one you know that two things are perfectly negative related. When it's zero then they are linearly unrelated. So correlation is a measure of linear association. That means that it measures how strongly observations are clustered in line. So this is a scatterplot of two observations. And one is a line. 0.8 is the observations are very closely clustered on the line. Then 0.4 is something that we observe with the plane eye. Zero means that there is no linear relationship. And then negative correlations means that when one variable increases then another one decreases. So that's the same except the direction is opposite. The correlation doesn't tell us what is the magnitude of the chain. So we can say that this is the correlation of one. There is a huge effect of the x-variable on the y-variable. This is the correlation of one as well. There is a small effect of x-variable on the y-variable. So the y-variable here doesn't increase as strongly with the x-variable as here. So correlation doesn't tell us about the magnitude of the effect. It just tells us how strong the association is. This is zero correlation because y-variable doesn't vary. And then we have the negative correlations here. Importantly, correlation is a measure of linear association. So here we have two variables that are clearly associated. So there is a clear pattern, but it's non-linear. Here is another pattern that's non-linear. And this is a weak positive correlation. And this is a clear association, but it's non-linear. So correlation only tells us if we can describe the data with a line. There could be some other kind of relationship as well. So saying that two variables are uncorrelated doesn't mean that they are not related statistically. Just means that the relationship cannot be expressed as a line.