Vous utilisez un navigateur obsolète !

L'affichage de la page peut être incorrect.

La prévention des risques

Правила гигиены

D'autres publications de cette rubrique (76)
  • Ajouter aux favoris
    Ajouter aux favoris

Bayes : une idée complexe exprimée par des mots simples

Lu par: 2169 Commentaires: 4 Cote de popularité: 13

vendredi 2 mars 2018

Comme vous le savez, rien n’est plus précis que la théorie de la probabilité puisque c’est la seule théorie utilisant des statistiques qui est basée sur une mesure précise.

Nommé ainsi d’après son inventeur, le ministre presbytérien du 18e siècle Thomas Bayès, le théorème de Bayès est une méthode créée pour calculer la validité d’hypothèses basée sur la meilleure preuve disponible (observations, données, informations). En voici une description rapide : hypothèse initiale+nouvelle preuve = nouvelle hypothèse prouvée.

Nommé ainsi d’après son inventeur, le ministre presbytérien du 18e siècle Thomas Bayès, le théorème de Bayès est une méthode créée pour calculer la validité d’hypothèses basée sur la meilleure preuve disponible (observations, données, informations). En voici une description rapide : hypothèse initiale+nouvelle preuve = nouvelle hypothèse prouvée.

La formule mathématique de base s’énonce sous cette forme :

P(B|E) = P(B) * P(E|B) / P(E)

ou P est la probabilité, B, l’hypothèse (« Belief » en anglais) et E, la preuve (« Evidence » en anglais). P(B) est la probabilité que B soit vraie et P(E) est la probabilité que E soit vraie. P(B|E) représente la probabilité que B soit vraie si E est vraie et P(E|B) indique la probabilité que E soit vraie si B est vraie.

https://blogs.scientificamerican.com/cross-check/bayes...

Si vous avez réussi à saisir la définition du premier coup, essayez de la rejouer dans votre tête.

Pendant ce temps, prenons un exemple pour voir comment fonctionne le théorème : voici une publicité.

Anti-virus 1 Anti-virus 2 Anti-virus 3
Taux de détection global de malwares d’après Virus Bulletin (Mai 1998 - Décembre 2009) 75% 97% 94%

Le choix semble évident, n’est-ce pas ?

Modifions le texte du post que nous avons cité plus haut :

Supposons que nous avons analysé notre système à la recherche de malwares et que nous avons conclu que la probabilité pour qu’il soit « sain » est de 1%.

Supposons que nous avons également évalué que la fiabilité de notre antivirus est d’environ 99%.

Question : si l’antivirus rapporte que le système est sain, quelle est la probabilité pour qu’il soit infecté ?

C’est ici que le théorème de Bayès déploie sa puissance. La plupart des gens vont supposer que la réponse est 99% ou proche de 99%. C’est bien le taux de fiabilité du scan, exact ? En réalité, la réponse exacte, sous-tendue par le théorème de Bayès, est de 50% seulement.

Pour résoudre l’équation P(B|E), placez les données dans le bon sens dans le théorème de Bayès. P(B), la probabilité pour que votre système ait été infecté avant d’être scanné, est de 1% ou .01. P(E) est identique, la probabilité pour qu’une infection soit détectée.

Qu’en est-il du dénominateur P(E) ? C’est là que les choses se compliquent. P(E) est la probabilité pour que le scan soit positif, que votre système soit infecté ou non. En d’autres termes, elle inclut les faux positifs comme les vrais positifs.

Pour calculer la probabilité d’un faux positif, vous multipliez le taux de faux positif, qui est de 1% ou .01 par le pourcentage de système qui a été infecté, soit 99%, ce qui fait un total de .0099. Oui, votre super test précis à 99% donne autant de faux positifs que de vrais positifs.

Finissons le calcul. Pour obtenir P(E), additionnez les faux et les vrais positifs pour un total de .0198, qui, une fois divisé par .0099 donne .5. Donc, la probabilité pour que votre système soit réellement infecté est de 50%.

Simplifions. Si vous avez scanné votre système seulement une fois, la probabilité pour votre ordinateur soit « propre » est de 50-50. Cela peut sembler étrange mais c’est correct parce que l’antivirus ne reconnaît pas les malwares inconnus. Mais si vous relancez un scan, tout va changer.

Si vous refaites le test, vous pouvez considérablement réduire votre incertitude puisque maintenant, la probabilité pour que votre système soit infecté, P(B), est de 50% et non de 1%. Si le second scan s’avère positif, le théorème de Bayès vous dit que la probabilité d’infection est maintenant de 99% ou .99. Comme le montre cet exemple, réitérer le théorème de Bayès peut fournir des données très précises.

Cela revient à dire que la probabilité pour que votre système soit infecté décroît à chaque scan successif parce que, d’un côté, l’antivirus reçoit des informations sur les malwares préalablement inconnus à chaque mise à jour consécutive et que d’un autre côté, la probabilité pour que vous téléchargiez des malwares inconnus régulièrement est heureusement basse.

Le projet Lumières sur la sécurité recommande

Ne négligez pas la sécurité de vos systèmes et lancez des scans régulièrement. Le théorème de Bayès fonctionne réellement !

[Twitter]

Nous apprécions vos commentaires

Pour laisser un commentaire, vous devez accéder au site via votre compte sur le site de Doctor Web. Si vous n'avez pas de compte, vous pouvez le créer.

Commentaires des utilisateurs