Comment nettoyer des données dans un fichier CSV

Quelle que soit la taille de votre entreprise, vous êtes de plus en plus pressé de maîtriser les données. Alors que les grandes données font fureur au niveau des entreprises, la réalité pour les pigistes et les propriétaires de micro-entreprises est que vous devrez vous salir les mains en jouant avec les données à un moment donné du travail de votre client..

Que ce soit pour transférer des mots-clés dans une feuille de calcul, planifier des tweets, synchroniser des données entre des applications professionnelles, gérer des listes de contacts ou importer des données dans un infographie, vous devez savoir comment nettoyer les données d'une feuille de calcul et les organiser dans un format qui application en ligne ou logiciel pouvant lire.

La bonne nouvelle est qu’être capable de gérer les données et de les déplacer d’une application à l’autre est une compétence commercialisable en soi et qu’il vous suffit de quelques astuces pour gagner du temps: vous pouvez également gagner beaucoup de temps: du temps que vous pourriez consacrer à un travail plus rentable..

Atouts du tutoriel

Pour compléter ce tutoriel, vous aurez besoin de:

  • une connexion internet
  • un compte email
  • un compte Google (gratuit)
  • Microsoft Excel (facultatif)
  • données que vous souhaitez nettoyer (voir ci-dessous pour plus d'exemples)

Qu'est-ce qu'un fichier CSV??

Un fichier CSV est un fichier «Valeur séparée par des virgules». Ce type de fichier prend toutes vos données et place les en-têtes de chaque colonne dans la première ligne, puis répertorie toutes vos données dans les lignes suivantes, avec toutes les données non numériques entourées de virgules inversées («comme ceci»), suivies d'une virgule..

Un fichier CSV peut être lu dans de nombreux types d'applications et de logiciels. À la base, il s’agit d’un fichier texte. Il prend toutes vos données et les analyse (c'est-à-dire les décompose en unités de données), de sorte que vous puissiez ensuite transférer les données dans une autre application..

Par exemple, voici les données de l'outil de mots clés de Google pour le mot clé "fichier CSV":

Et voici un exemple de son apparence au format CSV:

Pourquoi nettoyer vos données?

Les clients s'attendent de plus en plus à ce que vous puissiez gérer les données lorsque vous travaillez avec eux. Par exemple, un pigiste travaillant sur la rédaction de contenu SEO pour un client peut être amené à afficher une liste des mots clés à longue queue utilisés dans chaque article de blog programmé pour la production, et à les ajouter à un tableur ou à un calendrier de contenu. En tant que producteur de contenu indépendant, vous devrez produire des éléments visuels convaincants pour accompagner vos articles. Vous pouvez ajouter des infographies simples à votre contenu en nettoyant un fichier CSV de vos statistiques de recherche, puis en l'important dans un diagramme ou un outil d'infographie..

Alors que le big data et les opendata continuent de se banaliser, vous pouvez rapidement augmenter la valeur de vos offres de services métier et réduire votre charge de travail en sachant comment déplacer les données..

Si vous exploitez une micro entreprise qui fournit des services de médias sociaux, vous devrez peut-être montrer à votre client une semaine de tweets à l'avance, puis pouvoir les programmer pour qu'ils soient tweetés à intervalles réguliers tout au long de la semaine. Ou bien, vous pourrez peut-être développer un service commercial permettant d'aider un client à synchroniser ses données de contact entre son courrier électronique, ses campagnes marketing et son logiciel de gestion de la relation client (CRM)..

Peut-être que votre entreprise a suffisamment grandi pour que vous souhaitiez commencer à utiliser une application de facturation et de comptabilité plutôt qu'un tableur. Vous pouvez nettoyer un fichier CSV de toutes vos anciennes données financières afin de l'importer facilement dans votre application de facturation sans avoir à vous soucier de la ressaisie..

Alors que le big data et les opendata continuent de se banaliser, vous pouvez rapidement augmenter la valeur de vos offres de services métier et réduire votre charge de travail en sachant comment déplacer des données. Etre compétent en données est une compétence très demandée et peut vous aider à élaborer une proposition de valeur unique. Nettoyer les fichiers CSV est essentiel pour tirer le meilleur parti de toutes ces opportunités.

1. Créer un fichier CSV à partir d'une feuille de calcul

Étape 1: Ouvrez votre fichier de feuille de calcul

Un fichier CSV est simplement un fichier de feuille de calcul enregistré au format texte permettant de le déplacer vers un autre logiciel ou une application ou un outil basé sur un nuage. Alors, vous devez d'abord l'ouvrir dans votre tableur..

Si vous utilisez Excel, ouvrez le fichier de données que vous souhaitez déplacer (Fichier> Ouvrir… ). Si vous n'avez pas Excel, vous pouvez vous inscrire à Google Drive avec les détails de votre compte Google. Google Drive propose un ensemble d’outils en ligne basé sur un nuage comprenant un tableur. Après vous être inscrit, ouvrez votre feuille de calcul dans Google Drive..

Le même tableur dans Excel (à gauche) et Google Drive (à droite).

Étape 2: Vérifiez les bases de votre fichier

Dans Excel, assurez-vous de n'avoir qu'une seule feuille de calcul dans votre feuille de calcul. Les feuilles de calcul sont affichées au bas d'Excel. Ils sont normalement nommés Sheet1, Sheet2, etc. Assurez-vous qu'il n'y a qu'une seule feuille. S'il y a plus d'une feuille dans le classeur, cliquez sur l'onglet pour chaque feuille supplémentaire et assurez-vous qu'il n'y a pas de données sur ces pages. Puis faites un clic droit sur les onglets de la feuille 2 et ainsi de suite et supprimez chaque feuille supplémentaire.

Étape 3: Enregistrer en tant que fichier CSV

Dans Excel, sélectionnez maintenant Fichier> Enregistrer sous… . Choisissez un nom pour votre fichier et sélectionnez Valeurs séparées par des virgules dans le menu déroulant Format.

Dans Google Drive, sélectionnez Fichier> Télécharger en tant que… . Sélectionner Valeurs séparées par des virgules à partir du deuxième menu et sauvegardez sur votre disque dur.

2. Créer un fichier CSV à partir de données dans une application en ligne ou un outil Web

Lorsque les données sont stockées dans une application en ligne (telle que FreshBooks, l'application de facturation et de comptabilité pour les petites entreprises) ou un outil de site Web (tel que l'outil de mots clés Google AdWords), il est nécessaire d'utiliser les fonctions d'importation de l'application ou de l'outil pour enregistrer les données dans un format de fichier CSV.

Étape 1: dans votre application en ligne, recherchez une option d'exportation de données

Si vous souhaitez créer un fichier CSV en utilisant des données dans une application en ligne, recherchez une option de menu vous permettant d'exporter les données à partir de l'application..

Dans FreshBooks, par exemple, cela se trouve sous le Mon compte menu. Après avoir cliqué sur Mon compte un menu de deuxième niveau apparaît, où vous pouvez sélectionner Import & Export.

Maintenant, sélectionnez Fichier CSV (Comma Separated File) à côté de Clients exportateurs, factures, personnel et feuilles de temps.

D'autres applications en nuage peuvent organiser leurs options différemment. S'il n'y a pas d'option sous «Compte», recherchez un menu «Paramètres» ou une option de menu «Données». Vous devriez pouvoir localiser une option de menu similaire qui vous permet d’enregistrer les données stockées en ligne dans un fichier CSV..

Étape 2: Dans un outil Web, recherchez l'option de menu «Enregistrer au format CSV».

Pour un outil Web, recherchez une option de menu «Enregistrer». Par exemple, dans l'outil de mots clés Google Adwords, il existe un Sauver tous bouton au-dessus de la liste des idées de mots clés. Cliquer sur Sauver tous enregistrer une copie de tous les mots clés de votre recherche.

Maintenant, cliquez sur le Télécharger bouton. Sélectionner Tous les résultats de recherche. Une boîte de dialogue apparaîtra vous proposant de sauvegarder au format CSV. Cliquez sur Télécharger confirmer. Selon la taille du fichier, la préparation de cette opération peut prendre un peu de temps..

Enfin, une boîte de dialogue vous sera proposée pour indiquer où vous souhaitez enregistrer le fichier..

D'autres outils en ligne fonctionnent de manière similaire.


3. Nettoyage d'un fichier CSV

Maintenant que vous avez un fichier CSV, vous devez le nettoyer et vous assurer qu'il est lisible où que vous souhaitiez l'envoyer. Dans certains cas, vous voudrez peut-être simplement l'utiliser dans un tableur..

Dans d'autres cas, vous devrez peut-être nettoyer le fichier CSV pour pouvoir ensuite l'importer dans une autre application basée sur un nuage ou un outil en ligne..

Étape 1. Excel: Importez votre fichier CSV dans une feuille de calcul

Dans Excel, créez un nouveau classeur. Puis sélectionnez le Importation option du Fichier menu.

Une boîte de dialogue apparaîtra. Assure-toi Fichier CSV est sélectionné et cliquez sur le Importation bouton.

Vous pouvez maintenant sélectionner votre fichier CSV à partir de l'endroit où vous l'avez enregistré..

Étape 2. Excel: confirmez que vos données sont 'délimitées'

Dans Excel, il vous sera maintenant demandé de confirmer que vos données sont délimité. En d’autres termes, votre fichier CSV contient des données séparées uniquement par une virgule. Excel devrait pouvoir automatiquement dire que cela est correct. Maintenant, cliquez sur le Suivant bouton.

Étape 3. Excel: confirmez vos colonnes de données

Dans Excel, un aperçu de la manière dont vos données seront triées dans les colonnes s'affiche, basé sur le fait que vos données sont séparées par des virgules et que les éléments de texte peuvent être placés entre «virgules inversées». Vérifiez l'aperçu des données et sélectionnez ou désélectionnez les options de délimiteur et les options de qualificateur de texte jusqu'à ce que l'aperçu reflète l'apparence attendue des données. Dans la plupart des cas, cela sera choisi automatiquement pour vous. Par exemple, Excel saura que toutes les données textuelles comportent un qualificatif de guillemets inversés. Il vous indiquera donc qu'il envisage de supprimer les guillemets lors de l'importation des données. Lorsque vous êtes satisfait de la manière dont les données seront importées, cliquez sur le bouton Suivant bouton.

Étape 4. Excel: confirmer les types de données

Dans Excel, il vous sera maintenant demandé de sélectionner le type de données dans chaque ligne. Sélectionner Général maintenant pour toutes les colonnes (nous allons personnaliser chaque colonne de données après son importation). Revérifiez les paramètres avancés pour vous assurer que vos données sont conformes aux conventions standard pour les nombres en milliers et les décimales..

Par exemple, si vous utilisez une source de données américaine, une virgule est généralement utilisée pour séparer des milliers (par exemple, «1 000») et un point complet représente les points décimaux. C'est l'inverse en Europe! Donc, en fonction de votre source de données d'origine, vous devrez peut-être modifier ces paramètres.

Maintenant, cliquez sur le terminer bouton pour importer les données CSV dans votre feuille de calcul Excel.

Étape 5. Excel: Choisissez où importer vos données

Enfin, dans Excel, il vous sera demandé où vous souhaitez importer les données. Si vous avez ouvert un nouveau classeur à l'étape 1 ci-dessus, sélectionnez le Feuille existante déjà choisi pour vous, puis cliquez sur D'accord.

Étape 6. Google Drive: importez votre fichier CSV dans une nouvelle feuille de calcul.

Dans Google Drive, vous pouvez effectuer les étapes 1 à 5 ci-dessus dans la même boîte de dialogue. Commencez par créer une nouvelle feuille de calcul à partir du menu Fichier. Maintenant choisir Importation depuis le menu Fichier.

Une boîte de dialogue apparaîtra. Sélectionnez votre fichier CSV à partir de votre disque dur.

Maintenant, sélectionnez Remplacer le tableur, comme nous avons déjà ouvert une nouvelle feuille de calcul.

Vérifiez que l'aperçu indique comment vous souhaitez que vos données soient réparties en colonnes. Dans la plupart des cas, cela sera automatiquement configuré correctement. Sinon, changez le “caractère de séparation” en “tab” ou “virgule” pour voir si les données sont maintenant affichées correctement dans les colonnes.

Clique le Importation bouton pour continuer.

Étape 7. Rangement des colonnes

Comme nous allons nettoyer vos feuilles de calcul, il vous sera plus facile de voir toutes vos données dans des colonnes ordonnées. Ajustez la largeur des colonnes pour mieux montrer les données. Déplacez votre curseur entre les lettres de la colonne en haut d'Excel ou de Google Drive jusqu'à ce qu'il devienne un symbole de mouvement en largeur et étirez la largeur de la colonne pour faciliter la lecture de vos données.

Étape 8. Vérifiez votre rangée d'en-tête

Maintenant, vérifiez que votre première ligne a les en-têtes de colonne corrects. Lorsque vous importez des données à partir de certaines sources, vous pouvez afficher les dates dans la colonne de gauche (axe des y) et les valeurs dans le reste de la ligne, en commençant par la deuxième colonne (axe des x). Donc, la toute première colonne sur l'axe des x sera laissée en blanc.

Par exemple:

Si tel est le cas, entrez une description (pour le moment) pour la première colonne, par exemple «Date» ou «Mois»..

Si vous utilisez vos données CSV dans une feuille de calcul, vous pouvez également définir la première ligne comme en-tête de colonne. Ceci est utile si vous travaillez avec de grands ensembles de données où vous pouvez faire défiler vers le bas et ne pas voir la ligne des en-têtes..

Dans Excel, cliquez sur Mise en page sous le Fichier menu. Choisir Drap dans le menu de la boîte de dialogue contextuelle et cliquez sur la ligne de votre feuille de calcul pour les en-têtes de colonne. Il devrait maintenant être indiqué dans la case lignes à répéter en haut généralement comme 1 $: 1 $.

Dans Google Drive, sélectionnez Geler la rangée du Vue menu et sélectionnez Geler 1 rangée pour indiquer la ligne d'en-tête.

Étape 9. Confirmez les données dont vous avez besoin

Si vous nettoyez ces données parce que vous allez les transférer dans un autre outil ou application en ligne, vérifiez les conditions requises pour importer des données dans votre application de destination (voir Exemples de cas d'utilisation à la Section 3. Déplacement de données, ci-dessous)..

Si vous nettoyez votre fichier CSV pour le partager dans une feuille de calcul, confirmez avec votre client les données qu'il souhaite que vous puissiez afficher..

Étape 10. Supprimer les données inutiles

Remarque: vous souhaiterez peut-être enregistrer une copie de votre feuille de calcul avant de commencer à supprimer des données, au cas où vous changeriez d'avis ou en auriez besoin ultérieurement..

Supprimez maintenant toutes les colonnes dont vous n’avez pas besoin. Par exemple, si vous souhaitez importer votre recherche de mots clés dans un calendrier de contenu, seuls les colonnes de volume et de volume de recherche mensuel local peuvent vous intéresser..

Vous pouvez supprimer les colonnes dont vous n'avez pas besoin en cliquant sur la lettre d'en-tête de colonne jusqu'à ce que la colonne entière soit ombrée. Maintenant choisir Effacer du modifier menu (sous Excel) ou Supprimer la colonne depuis le menu Edition (dans Google Drive).

Étape 11. Assurez-vous que les colonnes de date sont au bon format de date

Encore une fois, vérifiez où vous importerez les données pour toutes les exigences (voir section 3 cas d'utilisateurs ci-dessous).

Si vos données de fichier CSV incluent des dates, sélectionnez la colonne avec les dates..

Dans Excel, sélectionnez Cellules… du Format menu. Maintenant, sélectionnez Nombre dans le menu de la rangée du haut, et Rendez-vous amoureux dans le menu de gauche. Choisissez le menu de date correspondant aux exigences d'importation ou sélectionnez la version la plus lisible pour vous et votre client si vous importez simplement les données dans vos propres feuilles de calcul..

Dans Google Drive, sélectionnez la colonne et cliquez sur le bouton qui lit 123 dans la barre d'outils. Choisissez un format de date dans la liste ou sélectionnez d'autres formats pour afficher un menu supplémentaire d'options de format de date..

Si votre fichier CSV nécessite des heures pour être inclus avec les dates, assurez-vous qu'elles sont au bon format (hh: mm ou hh: mm: ss).

Si votre fichier CSV nécessite que les dates et les heures figurent dans des colonnes séparées, copiez la colonne entière, puis formatez la première colonne au format date uniquement et la seconde colonne au format heure uniquement. Le reste des données sera automatiquement supprimé.

Étape 12. Assurez-vous que tous les chiffres sont uniformes

Toutes les colonnes contenant des données numériques sont mieux mises en forme en supprimant les milliers de séparateurs afin que les nombres apparaissent sous la forme 23 000 par exemple et non 23 000..

Dans Excel, sélectionnez la colonne, puis choisissez à nouveau Cellules… dans le menu Format. Choisir Nombre dans le menu horizontal, et Nombre dans le menu de gauche. Assure-toi Utilisez le séparateur 1000 est décochée.

Google Drive insiste sur l'utilisation de milliers de séparateurs. Cela n’affectera pas vos importations au format CSV, mais risque d’être source de confusion si vos clients sont européens. Cliquez sur la colonne pour la sélectionner, sélectionnez la Format option de menu et cliquez sur Nombre, puis sélectionnez Ordinaire.

Étape 13. Ajoutez les colonnes dont vous avez besoin

Vérifiez la liste des données nécessaires créées à l'étape 9. Ajoutez des colonnes à votre feuille de calcul pour chacune d'elles. Certains outils en ligne exigent également que les données soient classées d'une manière particulière (par exemple, la planification des tweets peut nécessiter une commande spécifique pour les données de votre fichier CSV). Si tel est le cas, déplacez les colonnes maintenant pour qu'elles correspondent à l'ordre d'importation préféré dans lequel vous enverrez les données..

Assurez-vous maintenant que les en-têtes de colonne correspondent exactement à ce que votre destination d'importation attend. N'utilisez pas de guillemets à ce stade pour les en-têtes ou les données textuelles de vos colonnes..

Étape 14. Intégrez les données nettoyées dans vos feuilles de calcul

Dans certains cas, tels que le nettoyage des données de vos mots clés, il se peut que vous ne cherchiez pas à les ajouter à une source de destination autre qu'un calendrier de contenu. Enregistrez une copie de votre feuille de calcul en tant que fichier de sauvegarde, puis sélectionnez les colonnes que vous souhaitez déplacer dans votre calendrier de contenu. Copiez ces colonnes maintenant et collez-les dans leur feuille de calcul de destination.

Étape 15. Enregistrer les données nettoyées dans un fichier CSV prêt à être importé dans un outil en ligne

Si la destination finale de vos données nettoyées est de les ajouter à un autre programme, vous êtes maintenant prêt à enregistrer cette feuille de calcul au format CSV pour pouvoir l'importer dans une application en ligne ou un outil Web..

Répéter la section 1 Créer à nouveau un fichier CSV à partir d'une feuille de calcul.


4. Déplacement de données d'un fichier CSV vers une application en ligne ou un outil Web

Dans de nombreux cas, vous devrez transférer vos données dans une autre application en ligne ou un autre outil Web pour terminer votre travail..

Pour vous assurer que vos données pourront être lues par l'application à laquelle vous les ajoutez, vérifiez les exigences relatives aux colonnes et aux données à inclure..

Recherchez une option de menu telle que «Compte», «Paramètres» ou «Données» et examinez les informations relatives aux données d'importation. Vous pouvez également consulter la section d'aide de l'application / outil Web. Recherchez les en-têtes de colonne que vous devez utiliser et le format requis pour chaque colonne de données. Par exemple, si vous ajoutez des données à un agenda Google, vous aurez besoin de colonnes pour Date de début, Heure de début, Date de fin, Heure de fin, Objet et (en option).

Par contre, si vous importiez des données de votre projet dans une application de suivi du temps telle que Toggl, ils veulent une colonne pour l'heure de début, mais au lieu de l'heure de fin, vous devez disposer d'une colonne pour la durée de la tâche, dans laquelle vous indiquez combien de temps a été consacré à la tâche plutôt que l'heure de la fin.

Chaque application en ligne et chaque outil Web peuvent être légèrement différents, donc pouvoir nettoyer des données dans des fichiers CSV signifie se familiariser avec la documentation de l'utilisateur et des guides en ligne pour l'importation de données..

Quels sont vos besoins en données?

Quels sont vos besoins actuels en données? Avez-vous utilisé des fichiers au format CSV pour déplacer des données importantes pour votre entreprise d’une application à une autre? Faites-nous connaître vos projets de données dans les commentaires ci-dessous.