{"id":4102,"date":"2014-03-04T12:00:00","date_gmt":"2014-03-04T11:00:00","guid":{"rendered":"http:\/\/www.gouvinfo.org\/IAI\/?p=4102"},"modified":"2014-02-14T17:56:57","modified_gmt":"2014-02-14T16:56:57","slug":"la-qualite-des-donnees-et-le-big-data-3b","status":"publish","type":"post","link":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/","title":{"rendered":"La qualit\u00e9 des donn\u00e9es et le Big Data (2\/4) &#8211; Exigences"},"content":{"rendered":"<h2><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" class=\"alignleft size-full wp-image-4158 img-responsive\" alt=\"db_comit\" src=\"https:\/\/i0.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?resize=128%2C128&#038;ssl=1\" width=\"128\" height=\"128\" srcset=\"https:\/\/i0.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?w=128&amp;ssl=1 128w, https:\/\/i0.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?resize=32%2C32&amp;ssl=1 32w, https:\/\/i0.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?resize=64%2C64&amp;ssl=1 64w, https:\/\/i0.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?resize=96%2C96&amp;ssl=1 96w\" sizes=\"(max-width: 128px) 100vw, 128px\" \/>Les exigences suppl\u00e9mentaires du big data<\/h2>\n<p style=\"text-align: justify;\">Le niveau requis en statistiques sera beaucoup plus \u00e9lev\u00e9 pour le big data tant pour l\u2019analyse premi\u00e8re (profilage) que pour \u00e9laborer des algorithmes. Par exemple, TF-IDF (term Frequency -Inverse Document Frequency) est une technique \u00e9l\u00e9mentaire en text mining qui n\u2019existe pas en profilage. On y utilisera plut\u00f4t une distance de Levenshtein, qu rel\u00e8ve d\u00e9j\u00e0 du profilage avanc\u00e9.<\/p>\n<p style=\"text-align: justify;\">Ensuite la palette de techniques en big data est beaucoup plus vaste. Il faut des techniques pour chaque type de donn\u00e9es. Il faut d\u00e9velopper des techniques lorsqu\u2019on m\u00e9lange les types de donn\u00e9es.<\/p>\n<p style=\"text-align: justify;\">La performance devient encore plus importante lorsque certaines techniques doivent donner une r\u00e9ponse en moins d\u2019une seconde voire en ms. Par exemple lorsqu\u2019il s\u2019agit d\u2019analyser et de r\u00e9agir \u00e0 des flux lors d\u2019\u00e9changes entre \u00e9tablissement financiers, ou en bourse ou pour sauver une vie \u00e0 l\u2019h\u00f4pital. Dans les entreprises, beaucoup de profilage reste p\u00e9riodique, m\u00eame si certaines entreprises ont mis en place des solutions qui v\u00e9rifient et nettoient les donn\u00e9es en temps r\u00e9el.<\/p>\n<p style=\"text-align: justify;\">Le big data requiert de d\u00e9velopper des algorithmes complexes, comme optimiser les transactions boursi\u00e8res pour profiter d\u2019une configuration particuli\u00e8res des donn\u00e9es, ou lorsqu\u2019il s\u2019agit d\u2019optimiser la recette d\u2019un vol entre Paris et New York.\u00a0 Le data scientist va maitriser de nombreux langages, le python, le C++, le Perl , R, Java et tout une palette d\u2019outils comme Hive, Mahout, Hadoop et beaucoup d\u2019autres ainsi que des approches algorithmiques avanc\u00e9es.<\/p>\n<p style=\"text-align: justify;\">En profilage classique, tout est fait pour l\u2019outil soit utilisable par un utilisateur non informatique mais expert dans la donn\u00e9e, sa signification, ses valeurs. Tout au plus saura-t-il faire du SQL. Quand l\u2019informatique intervient, ce sera tr\u00e8s souvent via du SQL.<\/p>\n<p style=\"text-align: justify;\">En profilage classique on connait bien les donn\u00e9es \u00e0 force de les cotoyer. En big data, de nombreuses donn\u00e9es seront nouvelles. La connaissance se p\u00e9rime plus vite. Les param\u00e8tres sont plus forts et plus nombreux. Il faut savoir \u00e9voluer dans un oc\u00e9an\u00a0 d\u2019incertitude et d\u2019ind\u00e9termination.<\/p>\n<p style=\"text-align: justify;\">Si une seule caract\u00e9ristique devait \u00eatre retenue, ce serait peut-\u00eatre la n\u00e9cessit\u00e9 de distinguer le bruit du signal dans le big data et pour tout type de donn\u00e9es. C\u2019est ainsi que Nate Silver s\u2019est fait un nom (<a href=\"http:\/\/www.fivethirtyeight.com\/\">http:\/\/www.fivethirtyeight.com\/<\/a>) lorsqu\u2019il y a su pr\u00e9dire correctement les r\u00e9sultats des derni\u00e8res \u00e9lections am\u00e9ricaines \u00e0 100%. Il n\u2019avait atteint que 98% en 2008.<\/p>\n<p style=\"text-align: justify;\">On pourrait visualiser le profilage classique en bas de l\u2019escalier de la Tour Eiffel et les techniques big data \u00e0 son premier \u00e9tage.<\/p>\n<p style=\"text-align: justify;\">En big data la quantit\u00e9 et la richesse permettent de r\u00e9\u00e9quilibrer la balance. La multiplicit\u00e9 des sources permet de les corroborer et d\u2019en d\u00e9gager des corr\u00e9lations. La quantit\u00e9 aussi. Mais la quantit\u00e9 permet surtout d\u2019appliquer des techniques probabilistes, comme dans l\u2019\u00e9tude des gaz parfaits et des fluides. Les lois sont d\u2019une autre nature que la m\u00e9canique newtonienne, mais elles n\u2019en sont pas moins applicables. En voici deux anecdotes.<\/p>\n<p style=\"text-align: justify;\">Watson et son cort\u00e8ge d\u2019ing\u00e9nieurs qui l\u2019ont construit et accompagn\u00e9s pendant tout le match Jeopardy\u00a0! en 2011 contre deux anciens vainqueurs Rutter et Jennings a utilis\u00e9 des techniques heuristiques et d\u2019intelligence artificielle ainsi qu\u2019un acc\u00e8s \u00e0 toute une documentation en ligne titanesque comme l\u2019enti\u00e8ret\u00e9 de Wikipedia. Deep Blue et toute une \u00e9quipe d\u2019ing\u00e9nieurs ont utilis\u00e9 des techniques heuristiques et probabilistes pour battre Garry \u00a0Kasparov en 1996.<\/p>\n<p style=\"text-align: justify;\"><span style=\"text-decoration: underline;\">Recapitulatif des diff\u00e9rences entre qualit\u00e9 de donn\u00e9es traditionnelles vs qualit\u00e9 de donn\u00e9es big data<\/span><\/p>\n<p style=\"text-align: justify;\">Ce tableau est fortement inspir\u00e9 du livre de Sunil Soares \u00ab\u00a0Big Data Governance\u00a0\u00bb.<\/p>\n<table border=\"1\" cellspacing=\"0\" cellpadding=\"0\">\n<thead>\n<tr>\n<td valign=\"top\" width=\"111\">\n<p align=\"center\"><b>Dimension<\/b><\/p>\n<\/td>\n<td valign=\"top\" width=\"208\">\n<p align=\"center\"><b>QD tradi<\/b><\/p>\n<\/td>\n<td valign=\"top\" width=\"340\">\n<p align=\"center\"><b>QD big data<\/b><\/p>\n<\/td>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td valign=\"top\" width=\"111\"><b>Fr\u00e9quence de traitement<\/b><\/td>\n<td valign=\"top\" width=\"208\">Par lot p\u00e9riodique (hebdo, mensuel)<\/td>\n<td valign=\"top\" width=\"340\">Temps r\u00e9el et p\u00e9riodique<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" width=\"111\"><b>Vari\u00e9t\u00e9<\/b><\/td>\n<td valign=\"top\" width=\"208\">Donn\u00e9es structur\u00e9es<\/td>\n<td valign=\"top\" width=\"340\">Tous types de donn\u00e9es\/informations<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" width=\"111\"><b>Niveaux de confiance<\/b><\/td>\n<td valign=\"top\" width=\"208\">Haut niveau a priori requis<\/td>\n<td valign=\"top\" width=\"340\">Il faut d\u2019abord filtrer le bruit. Ensuite le niveau de qualit\u00e9 est beaucoup plus relatif et soumis \u00e0 des consid\u00e9rations ad hoc de conformit\u00e9 \u00e0 un objectif m\u00e9tier<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" width=\"111\"><b>Moment de nettoyage<\/b><\/td>\n<td valign=\"top\" width=\"208\">Avant chargement dans les applications (ex\u00a0: entrep\u00f4t de donn\u00e9es)<\/td>\n<td valign=\"top\" width=\"340\">Les donn\u00e9es peuvent \u00eatre charg\u00e9es telles quelles parce leur nature et les relations qu\u2019elles entretiennent ne sont pas bien connues.On peut aussi n\u2019en stocker sur disque qu\u2019une partie car leur dur\u00e9e optimale de consommation est limit\u00e9e<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" width=\"111\"><b>Composants critiques<\/b><\/td>\n<td valign=\"top\" width=\"208\">Focus sur certains composants\u00a0: pour le client, ce peut \u00eatre son couple pr\u00e9nom\/nom<\/td>\n<td valign=\"top\" width=\"340\">L\u2019exploration tient un r\u00f4le beaucoup plus important. Les \u00e9l\u00e9ments critiques \u00e0 un stade (aspects temporel et de causalit\u00e9) ou \u00e0 un niveau de granularit\u00e9 n\u2019est peut-\u00eatre pas le m\u00eame \u00e0 un autre stade ou niveau.La d\u00e9marche it\u00e9rative est plus prononc\u00e9e<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" width=\"111\"><b>Lieu d\u2019analyse<\/b><\/td>\n<td valign=\"top\" width=\"208\">Le nettoyage se fait dans un lieu d\u00e9di\u00e9 (le \u00ab\u00a0pressing\u00a0\u00bb), dans les outils DQ<\/td>\n<td valign=\"top\" width=\"340\">Le \u00ab\u00a0pressing\u00a0\u00bb peut se d\u00e9placer vers le lieu de production ou d\u2019exploitation des donn\u00e9es.Il se peut qu\u2019il ne soit pas judicieux ou pratique de faire transiter de grandes quantit\u00e9s de donn\u00e9es.<\/td>\n<\/tr>\n<tr>\n<td valign=\"top\" width=\"111\"><b>Administration<\/b><\/td>\n<td valign=\"top\" width=\"208\">Les administrateurs peuvent g\u00e9rer une grande partie des donn\u00e9es sous leur responsabilit\u00e9<\/td>\n<td valign=\"top\" width=\"340\">La proportion g\u00e9rable est beaucoup plus faible<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify;\"><b>R\u00e9capitulatif des articles de la s\u00e9rie sur le big data et qualit\u00e9 des donn\u00e9es\u00a0:<\/b><\/p>\n<ul style=\"text-align: justify;\">\n<li><b>Parall\u00e9lisme entre profilage des donn\u00e9es et le big data<\/b><\/li>\n<li><b>Les exigences suppl\u00e9mentaires du big data<\/b><\/li>\n<li><b>La qualit\u00e9 des donn\u00e9es appliqu\u00e9e au big data<\/b><\/li>\n<li><b>Les conditions de succ\u00e8s<\/b><\/li>\n<\/ul>\n<p style=\"text-align: justify;\"><strong><em>Le sujet vous int\u00e9resse, vous souhaitez le travailler avec une approche globale et transverse, venez nous retrouver dans le groupe\u00a0<a href=\"http:\/\/www.gouvinfo.net\/cominfo\/bigdata-et-gouvinfo\/\">Associer le Big Data et la Gouvernance de l&#8217;information<\/a>\u00a0de la communaut\u00e9 GouvInfo. \u00a0Gr\u00e9gory Maubon et moi m\u00eame vous attendons !<\/em><\/strong><\/p>\n<p style=\"text-align: justify;\"><b>\u00a0<\/b><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Les exigences suppl\u00e9mentaires du big data Le niveau requis en statistiques sera beaucoup plus \u00e9lev\u00e9 pour le big data tant pour l\u2019analyse premi\u00e8re (profilage) que pour \u00e9laborer [&hellip;]<\/p>\n","protected":false},"author":10001,"featured_media":4158,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"jetpack_post_was_ever_published":false},"categories":[45,3,53,223],"tags":[846,853,851],"class_list":["post-4102","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-fondamentaux","category-gouvinfo","category-information-governance","category-innovation","tag-big-data","tag-exigences","tag-qualite"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.6 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>La qualit\u00e9 des donn\u00e9es et le Big Data (2\/4) - Exigences  - #GouvInfo<\/title>\n<meta name=\"description\" content=\"La communaut\u00e9 de l&#039;info fait du flux Information un des fondamentaux de nos organisations, pour favoriser une bonne gouvernance de l&#039;information - IAI.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"La qualit\u00e9 des donn\u00e9es et le Big Data (2\/4) - Exigences  - #GouvInfo\" \/>\n<meta property=\"og:description\" content=\"La communaut\u00e9 de l&#039;info fait du flux Information un des fondamentaux de nos organisations, pour favoriser une bonne gouvernance de l&#039;information - IAI.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/\" \/>\n<meta property=\"og:site_name\" content=\"#GouvInfo\" \/>\n<meta property=\"article:published_time\" content=\"2014-03-04T11:00:00+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/i2.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?fit=128%2C128&ssl=1\" \/>\n\t<meta property=\"og:image:width\" content=\"128\" \/>\n\t<meta property=\"og:image:height\" content=\"128\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Xavier Henderson\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@gouvinfo\" \/>\n<meta name=\"twitter:site\" content=\"@gouvinfo\" \/>\n<meta name=\"twitter:label1\" content=\"\u00c9crit par\" \/>\n\t<meta name=\"twitter:data1\" content=\"Xavier Henderson\" \/>\n\t<meta name=\"twitter:label2\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data2\" content=\"5 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/\"},\"author\":{\"name\":\"Xavier Henderson\",\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/#\\\/schema\\\/person\\\/b491e4e43413c1622f58166f1e5f773c\"},\"headline\":\"La qualit\u00e9 des donn\u00e9es et le Big Data (2\\\/4) &#8211; Exigences\",\"datePublished\":\"2014-03-04T11:00:00+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/\"},\"wordCount\":1022,\"commentCount\":0,\"image\":{\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/i0.wp.com\\\/gouvinfo.org\\\/IAI\\\/wp-content\\\/uploads\\\/db_comit.png?fit=128%2C128&ssl=1\",\"keywords\":[\"big data\",\"Exigences\",\"qualit\u00e9\"],\"articleSection\":[\"Fondamentaux\",\"Gouvernance de l'information\",\"information governance\",\"Innovation\"],\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/\",\"url\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/\",\"name\":\"La qualit\u00e9 des donn\u00e9es et le Big Data (2\\\/4) - Exigences - #GouvInfo\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/i0.wp.com\\\/gouvinfo.org\\\/IAI\\\/wp-content\\\/uploads\\\/db_comit.png?fit=128%2C128&ssl=1\",\"datePublished\":\"2014-03-04T11:00:00+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/#\\\/schema\\\/person\\\/b491e4e43413c1622f58166f1e5f773c\"},\"description\":\"La communaut\u00e9 de l'info fait du flux Information un des fondamentaux de nos organisations, pour favoriser une bonne gouvernance de l'information - IAI.\",\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/la-qualite-des-donnees-et-le-big-data-3b\\\/#primaryimage\",\"url\":\"https:\\\/\\\/i0.wp.com\\\/gouvinfo.org\\\/IAI\\\/wp-content\\\/uploads\\\/db_comit.png?fit=128%2C128&ssl=1\",\"contentUrl\":\"https:\\\/\\\/i0.wp.com\\\/gouvinfo.org\\\/IAI\\\/wp-content\\\/uploads\\\/db_comit.png?fit=128%2C128&ssl=1\",\"width\":128,\"height\":128},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/#website\",\"url\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/\",\"name\":\"#GouvInfo\",\"description\":\"D\u00e9velopper une vue globale des donn\u00e9es et de leurs gouvernances\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fr-FR\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/#\\\/schema\\\/person\\\/b491e4e43413c1622f58166f1e5f773c\",\"name\":\"Xavier Henderson\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/c2b3d88a941694d712acc7ae3894d182137acffe8231deaaa37428ac7389f0b9?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/c2b3d88a941694d712acc7ae3894d182137acffe8231deaaa37428ac7389f0b9?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/c2b3d88a941694d712acc7ae3894d182137acffe8231deaaa37428ac7389f0b9?s=96&d=mm&r=g\",\"caption\":\"Xavier Henderson\"},\"description\":\"Expertise en DW, BI, MDM, GI, QI, KM, IA, informatique, information et theo de la connaissance\",\"url\":\"https:\\\/\\\/gouvinfo.org\\\/IAI\\\/author\\\/lavametal\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"La qualit\u00e9 des donn\u00e9es et le Big Data (2\/4) - Exigences  - #GouvInfo","description":"La communaut\u00e9 de l'info fait du flux Information un des fondamentaux de nos organisations, pour favoriser une bonne gouvernance de l'information - IAI.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/","og_locale":"fr_FR","og_type":"article","og_title":"La qualit\u00e9 des donn\u00e9es et le Big Data (2\/4) - Exigences  - #GouvInfo","og_description":"La communaut\u00e9 de l'info fait du flux Information un des fondamentaux de nos organisations, pour favoriser une bonne gouvernance de l'information - IAI.","og_url":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/","og_site_name":"#GouvInfo","article_published_time":"2014-03-04T11:00:00+00:00","og_image":[{"width":128,"height":128,"url":"https:\/\/i2.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?fit=128%2C128&ssl=1","type":"image\/png"}],"author":"Xavier Henderson","twitter_card":"summary_large_image","twitter_creator":"@gouvinfo","twitter_site":"@gouvinfo","twitter_misc":{"\u00c9crit par":"Xavier Henderson","Dur\u00e9e de lecture estim\u00e9e":"5 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/#article","isPartOf":{"@id":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/"},"author":{"name":"Xavier Henderson","@id":"https:\/\/gouvinfo.org\/IAI\/#\/schema\/person\/b491e4e43413c1622f58166f1e5f773c"},"headline":"La qualit\u00e9 des donn\u00e9es et le Big Data (2\/4) &#8211; Exigences","datePublished":"2014-03-04T11:00:00+00:00","mainEntityOfPage":{"@id":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/"},"wordCount":1022,"commentCount":0,"image":{"@id":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/#primaryimage"},"thumbnailUrl":"https:\/\/i0.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?fit=128%2C128&ssl=1","keywords":["big data","Exigences","qualit\u00e9"],"articleSection":["Fondamentaux","Gouvernance de l'information","information governance","Innovation"],"inLanguage":"fr-FR","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/","url":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/","name":"La qualit\u00e9 des donn\u00e9es et le Big Data (2\/4) - Exigences - #GouvInfo","isPartOf":{"@id":"https:\/\/gouvinfo.org\/IAI\/#website"},"primaryImageOfPage":{"@id":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/#primaryimage"},"image":{"@id":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/#primaryimage"},"thumbnailUrl":"https:\/\/i0.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?fit=128%2C128&ssl=1","datePublished":"2014-03-04T11:00:00+00:00","author":{"@id":"https:\/\/gouvinfo.org\/IAI\/#\/schema\/person\/b491e4e43413c1622f58166f1e5f773c"},"description":"La communaut\u00e9 de l'info fait du flux Information un des fondamentaux de nos organisations, pour favoriser une bonne gouvernance de l'information - IAI.","inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/"]}]},{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/gouvinfo.org\/IAI\/la-qualite-des-donnees-et-le-big-data-3b\/#primaryimage","url":"https:\/\/i0.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?fit=128%2C128&ssl=1","contentUrl":"https:\/\/i0.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?fit=128%2C128&ssl=1","width":128,"height":128},{"@type":"WebSite","@id":"https:\/\/gouvinfo.org\/IAI\/#website","url":"https:\/\/gouvinfo.org\/IAI\/","name":"#GouvInfo","description":"D\u00e9velopper une vue globale des donn\u00e9es et de leurs gouvernances","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/gouvinfo.org\/IAI\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR"},{"@type":"Person","@id":"https:\/\/gouvinfo.org\/IAI\/#\/schema\/person\/b491e4e43413c1622f58166f1e5f773c","name":"Xavier Henderson","image":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/secure.gravatar.com\/avatar\/c2b3d88a941694d712acc7ae3894d182137acffe8231deaaa37428ac7389f0b9?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/c2b3d88a941694d712acc7ae3894d182137acffe8231deaaa37428ac7389f0b9?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/c2b3d88a941694d712acc7ae3894d182137acffe8231deaaa37428ac7389f0b9?s=96&d=mm&r=g","caption":"Xavier Henderson"},"description":"Expertise en DW, BI, MDM, GI, QI, KM, IA, informatique, information et theo de la connaissance","url":"https:\/\/gouvinfo.org\/IAI\/author\/lavametal\/"}]}},"jetpack_publicize_connections":[],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/gouvinfo.org\/IAI\/wp-content\/uploads\/db_comit.png?fit=128%2C128&ssl=1","jetpack_shortlink":"https:\/\/wp.me\/p3WHBZ-14a","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/posts\/4102","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/users\/10001"}],"replies":[{"embeddable":true,"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/comments?post=4102"}],"version-history":[{"count":8,"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/posts\/4102\/revisions"}],"predecessor-version":[{"id":4166,"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/posts\/4102\/revisions\/4166"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/media\/4158"}],"wp:attachment":[{"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/media?parent=4102"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/categories?post=4102"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/gouvinfo.org\/IAI\/wp-json\/wp\/v2\/tags?post=4102"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}