Chaque année, la direction des affaires maritimes collecte des données relatives à l'état de la flotte de pêche française et l'INSEE réalise des analyses. On cherche à étudier l'évolution au cours du temps du nombre de marins embarqués sur les navires français ainsi que celle du nombre de bateaux actifs Partie A 0*) Déterminer les coordonnées du point moyen de la série (xi;yi) 0*) Moyenne xi : 5,5 Moyenne yi : 14087 1) Dans cette partie, on considère que l'évolution au cours du temps du nombre de marins embarqués sur les navires français est modélisée par la droite d'équation : y = – 368,62 x + 16115 Pour chacune des affirmations suivantes, dire si elle est VRAIE ou FAUSSE en justifiant votre réponse : Affirmation 1 : A partir du modèle affine, l'estimation du nombre de marins embarqués sur les navires français en 2007 est d'environ 16619 Affirmation 2 : 88,7% des variations du nombre de marins sont expliquées par les variations du rang de l'année Affirmation 3 : le modèle affine retenu permet d'affirmer que, chaque année, le nombre de marins diminue de 369 environ 1)Affirmation 1 : On calcule pour x = 1 : y^ = – 368,62×1 + 16115 = 15746 ≠ 16619 donc FAUX Affirmation 2 : le coefficient de détermination vaut : R = r2 = 0,7871 ≠ 0,887 donc 78,7 % des variations du nombre de marins sont expliquées par les variations du rang de l'année donc FAUX Affirmation 3 : a = – 368,62 ≈ – 369 donc ; chaque année, le nombre de marins diminue de 369 environ donc VRAI 2. Déterminer une estimation du nombre de marins embarqués sur les navires français en 2019 en supposant que la tendance se confirme 2) Si la tendance se confirme, l'ajustement affine restera pertinent donc on peut utiliser la droite d'équation y = – 368,62 x + 16115 pour estimer le nombre de marins. 2019 correspond à x = 13 donc y = – 368,62×13 + 16115 = 11323 On estime qu'il y aura 11323 marins en 2019 Partie B La variable statistique X désigne le rang de l'année La variable statistique Z désigne le nombre total de navires actifs pour une année donnée 1. Justifier que le choix d'un ajustement affine est possible mais pas le plus pertinent. On calculera le coefficient de corrélation et le coefficient de détermination 1. L'ajustement de Z en X a pour paramètres : Attention à l'ordre : Z en X donc Z = aX + b L'ajustement affine est possible car : le coefficient de corrélation linéaire est très bon : – 0,9929 est inférieur à – 0,96 et très proche de – 1 les résidus semblent assez faibles par rapport aux valeurs mesurées : en 1995 et 2016, on peut les estimer à vue à 100 individus, ce qui représente 1/40 soit 2,5% par rapport aux effectifs réels Toutefois, l'ajustement n'est pas très pertinent car les points ne sont pas alignés le long d'une droite, ils ont plutôt une allure de parabole 2. On souhaite faire un ajustement exponentiel. Pour cela, on effectue un changement de variable et on pose T = ln(Z) a) Déterminer, par la méthode des moindres carrés, une équation de la droite d'ajustement de T en X. Les coefficients seront arrondis à 10–2 près Une équation de la droite d'ajustement de T en X est : t = – 0,02 x + 8,81 b) Déterminer le coefficient de corrélation linéaire et le coefficient de détermination b) Le coefficient de corrélation linéaire vaut r = – 0,9969 Le coefficient de détermination vaut : R = r2 = 0,9939 c) Soit ti^ la valeur estimée de ti en utilisant l'ajustement affine trouvé. On définit les résidus ei comme : ei = ti – ti^ Compléter le tableau ci-dessus en indiquant les ti , les ti^ , les résidus ei et les résidus comme pourcentage des valeurs mesurées. Liste des listes : L1 : X L2 : Z L3 : T = ln(Z) = ln(L2) L4 : T^ = – 0,02 X + 8,81 = – 0,02×L1 + 8,81 L5 : résidus e = t – t^ = L3 – L4 L6 : résidus comme pourcentage des valeurs observées : e/t×100 = L5/L3×100 d) L'ajustement de T en X est-il plus pertinent que l'ajustement de Y en X ? d) L'ajustement de T en X est plus pertinent que l'ajustement de Y en X car : les points sont mieux alignés le long de la droite (sur la calculatrice et sur le graphique ci-dessous) le coefficient de détermination est meilleur (0,9939 contre 0,9858) ; ce coefficient de détermination est très proche de 1, donc l'ajustement affine est de bonne qualité les résidus ei sont tous faibles par rapport aux valeurs observés ti : ils sont inférieurs à 0,23 % des valeurs observées 3. a) Déterminer une expression de z en fonction de x a) t = ln(z) = – 0,02 x + 8,81 donc z = e ln(z) = e – 0,02 x + 8,81 b) A l'aide de ce modèle, estimer le nombre total de navires actifs en 2019 2019 : année de rang 25 Pour x = 25 : z = e – 0,02 × 25 + 8,81 = 4052 OU : t = – 0,02 x + 8,81 = – 0,02×25 + 8,81 = 8,31 et z = e t = e 8,31 = 4064 Selon ce modèle, il y aurait donc 4052 navires en activité en 2020