{"id":3873,"date":"2021-02-22T16:07:31","date_gmt":"2021-02-22T16:07:31","guid":{"rendered":"https:\/\/www.vs3analytics.ca\/?p=3873"},"modified":"2024-03-25T19:06:18","modified_gmt":"2024-03-25T19:06:18","slug":"mythe-4-plus-de-donnees-plus-dinsights","status":"publish","type":"post","link":"https:\/\/www.vs3analytics.ca\/fr\/analytique-daffaires\/mythe-4-plus-de-donnees-plus-dinsights\/","title":{"rendered":"Mythe #4 : Plus de donn\u00e9es = plus d&rsquo;insights"},"content":{"rendered":"<p>Dans un monde o\u00f9 la quantit\u00e9 de donn\u00e9es g\u00e9n\u00e9r\u00e9es chaque jour est en croissance exponentielle, o\u00f9 l\u2019on entend toutes sortes d\u2019analogies telles que les donn\u00e9es sont le nouveau p\u00e9trole (data is the new oil), il est facile de penser que plus nous avons de ces donn\u00e9es en notre possession, plus nous aurons d\u2019insights. Mais est-ce vraiment le cas ?<\/p>\n<p>&nbsp;<\/p>\n<h3>Les 3 V<\/h3>\n<p>Tout d\u2019abord, les donn\u00e9es massives (big data) sont caract\u00e9ris\u00e9es par 3 \u00e9l\u00e9ments qu\u2019on appelle souvent les 3 V, soit le volume, la vari\u00e9t\u00e9 et la v\u00e9locit\u00e9.<\/p>\n<ul>\n<li>Le volume fait r\u00e9f\u00e9rence \u00e0 la quantit\u00e9 massive de donn\u00e9es<\/li>\n<li>La vari\u00e9t\u00e9 fait r\u00e9f\u00e9rence aux diff\u00e9rents types de donn\u00e9es comme le texte, l\u2019audio, la vid\u00e9o, les photos, etc.<\/li>\n<li>La v\u00e9locit\u00e9 repr\u00e9sente le mouvement rapide de ces donn\u00e9es comme dans le cas de l\u2019internet des objets qui produit \u00e9norm\u00e9ment de donn\u00e9es en continue<\/li>\n<\/ul>\n<p>Il est important de comprendre que plus ces 3 V sont pr\u00e9sents, plus la gestion et le traitement de ces donn\u00e9es devient complexe et n\u00e9cessite donc des ressources sp\u00e9cialis\u00e9es afin de s&rsquo;y retrouver.<\/p>\n<p>&nbsp;<\/p>\n<h3>Signal vs bruit<\/h3>\n<p>Tout comme le fait de chercher une aiguille dans une botte de foin, plus il y a de donn\u00e9es et plus les insights y sont bien cach\u00e9s et deviennent donc difficiles \u00e0 identifier. On peut effectivement retrouver plus de signaux (insights) dans une grande quantit\u00e9 de donn\u00e9es<u>,<\/u> mais on retrouvera \u00e9galement une plus grande quantit\u00e9 de faux signaux (bruit). Il devient donc parfois facile d\u2019y faire des associations trompeuses ou m\u00eame de d\u00e9river des informations carr\u00e9ment fausses.<\/p>\n<p>La connaissance du contexte d&rsquo;affaires est tr\u00e8s importante afin de d\u00e9partir le signal du bruit. De plus, le domaine des statistiques peut aussi aider \u00e0 identifier des relations statistiquement significatives entre certaines choses, mais un bon statisticien saura aussi remettre en doute ses conclusions. Bref, tout n\u2019est pas noir ou blanc et il faut proc\u00e9der avec beaucoup de prudence avec ces \u00e9normes quantit\u00e9s de donn\u00e9es. Un excellent livre \u00e0 ce sujet est <a href=\"https:\/\/www.goodreads.com\/book\/show\/13588394-the-signal-and-the-noise\">\u00ab\u00a0The signal and the noise\u00a0\u00bb de l&rsquo;auteur Nate Silver<\/a>.<\/p>\n<p>&nbsp;<\/p>\n<h3>Par exemple<\/h3>\n<p><a href=\"https:\/\/time.com\/23782\/google-flu-trends-big-data-problems\/\">\u00c0 titre d\u2019exemple, la compagnie Google a lanc\u00e9 un projet autour des ann\u00e9es 2010 afin d\u2019utiliser la quantit\u00e9 astronomique de donn\u00e9es reli\u00e9es aux recherches faites par des utilisateurs (termes, zones g\u00e9ographiques, etc.) pour identifier le nombre moyen de personnes malades et m\u00eame de pr\u00e9dire les \u00e9closions<\/a>. Tel que mentionn\u00e9 par les responsables de Google : \u00ab Bien que ce ne soient pas toutes les personnes qui cherchent pour le terme grippe qui sont actuellement malades, certains patterns semblent \u00e9merg\u00e9s lorsque toutes les requ\u00eates sont fusionn\u00e9es entre elles. \u00bb Il s\u2019est finalement av\u00e9r\u00e9 que les pr\u00e9dictions faites par l\u2019algorithme ont d\u00e9pass\u00e9 de plus du double le nombre r\u00e9el de personnes malades en 2012-2013. Le projet a \u00e9t\u00e9 abandonn\u00e9 peu de temps apr\u00e8s.<\/p>\n<p>En conclusion, voici une citation c\u00e9l\u00e8bre d&rsquo;un \u00e9conomiste nomm\u00e9 Ronald Coase :<\/p>\n<p>\u00ab\u00a0<em>If you torture the data long enough, it will confess.\u00a0\u00bb<\/em><\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>Poursuivez votre lecture&#8230;<\/p>\n<p><a href=\"https:\/\/www.vs3analytics.ca\/fr\/non-classifiee\/mythe-5-correlation-causalite\/\">Mythe #5 : Corr\u00e9lation = causalit\u00e9<\/a><\/p>\n<p>&nbsp;<\/p>\n<p><em>Charles Michaud<\/em><\/p>\n<p><em>Consultant en intelligence d&rsquo;affaires<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Dans un monde o\u00f9 la quantit\u00e9 de donn\u00e9es g\u00e9n\u00e9r\u00e9es chaque jour est en croissance exponentielle, o\u00f9 l\u2019on entend toutes sortes d\u2019analogies telles que les donn\u00e9es sont le nouveau p\u00e9trole (data is the new oil), il est facile de penser que plus nous avons de ces donn\u00e9es en notre possession, plus nous aurons d\u2019insights. Mais est-ce [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":3874,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[16],"tags":[],"class_list":["post-3873","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-analytique-daffaires"],"_links":{"self":[{"href":"https:\/\/www.vs3analytics.ca\/fr\/wp-json\/wp\/v2\/posts\/3873","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.vs3analytics.ca\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.vs3analytics.ca\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.vs3analytics.ca\/fr\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.vs3analytics.ca\/fr\/wp-json\/wp\/v2\/comments?post=3873"}],"version-history":[{"count":0,"href":"https:\/\/www.vs3analytics.ca\/fr\/wp-json\/wp\/v2\/posts\/3873\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.vs3analytics.ca\/fr\/wp-json\/wp\/v2\/media\/3874"}],"wp:attachment":[{"href":"https:\/\/www.vs3analytics.ca\/fr\/wp-json\/wp\/v2\/media?parent=3873"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.vs3analytics.ca\/fr\/wp-json\/wp\/v2\/categories?post=3873"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.vs3analytics.ca\/fr\/wp-json\/wp\/v2\/tags?post=3873"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}