OpenAI
Deze pagina is automatisch vertaald. Bekijk het oorspronkelijke Engelstalige artikel.

Inzichten verkrijgen met ChatGPT Data-analyse

Een persoonlijke AI-analist voor zakelijke gebruikers en ervaren dataprofessionals

Bijgewerkt: 9 days ago

Werken met tabellen in ChatGPT

Wanneer je een bestand uploadt, maakt ChatGPT automatisch een interactieve tabelweergave waarmee je door je gegevens kunt scrollen en al je rijen en kolommen kunt bekijken.

Data analysis table of San Francisco film locations with titles, release years, and locations

Zodra het bestand is geüpload, kun je vervolgvragen stellen over de dataset. De prompts hoeven geen specifieke bewerkingen te noemen: opdrachten in natuurlijke taal, zoals “analyseren” of “vergelijken”, zijn voldoende om resultaten van ChatGPT te krijgen.

ChatGPT data analysis table comparing weekday and weekend revenue, with weekday sales higher than weekend

Je kunt ook rechtstreeks in ChatGPT tabellen maken door te vragen om de uitvoer als tabel te genereren.

Image

Om je gegevens beter te bekijken, kun je de tabel uitvouwen door op de twee pijlen in de rechterbovenhoek van de tabel te klikken:

ChatGPT data analysis table expand button with tooltip “Expand table”

In de tabelweergave kun je een specifieke rij of kolom selecteren en een prompt maken om inzichten te krijgen over de gemarkeerde gegevens. Hier hebben we bijvoorbeeld een kolom geselecteerd en gevraagd welk item het vaakst voorkomt.

ChatGPT Data Analysis table with the Title column selected and a prompt asking which title appears most often

Je kunt meerdere rijen of kolommen selecteren door op een Mac de Command-toets of op Windows de Ctrl-toets ingedrukt te houden en op de rijen of kolommen te klikken. Je kunt ook meerdere cellen selecteren door op één cel te klikken en de muis te slepen om het gewenste gebied te bestrijken.

ChatGPT answers the average of three selected spreadsheet cells as 79

Nadat je meerdere items hebt geselecteerd, kun je ChatGPT vragen een waarde te berekenen of een actie uit te voeren op de waarden van de geselecteerde items. Je kunt bijvoorbeeld een reeks cellen markeren en ChatGPT vragen de gemiddelde waarde te berekenen.

Tabellen bewerken en maken met ChatGPT

Je kunt je bestaande tabellen uploaden en bewerken door ChatGPT met een prompt te vragen updates aan te brengen. Je kunt ChatGPT bijvoorbeeld met een prompt vragen een tabel bij te werken met een kolom die de gemiddelde waarden bevat.

ChatGPT Data Analysis table updated with a new Average column for each row

Je kunt ChatGPT met een prompt vragen specifieke wijzigingen aan te brengen door de kolommen, rijen of cellen te markeren waarop je de updates wilt baseren. Hier hebben we twee kolommen gemarkeerd en gevraagd om een nieuwe kolom aan de tabel toe te voegen die hun sommen bevat.

Data table with a new Friday + Saturday column summing the Friday and Saturday values

Je kunt de door ChatGPT gegenereerde tabel downloaden door op de downloadknop in de rechterbovenhoek van de tabel te klikken. Houd er rekening mee dat het gedownloade bestand de CSV-indeling heeft.

Download table button in ChatGPT Data Analysis

Je gegevens visualiseren met ChatGPT

Nadat je een bestand hebt geüpload, kun je ChatGPT met een prompt vragen een statische grafiek te maken. Je kunt ChatGPT het ideale grafiektype voor de dataset laten bepalen, of in je prompt een van onze ondersteunde grafiektypen opgeven: lijngrafiek, staafdiagram, cirkeldiagram, histogrammen, spreidingsdiagram, boxplots (box-and-whiskerplots), heatmaps, vlakdiagrammen, radardiagrammen, treemaps, bellendiagrammen en watervaldiagrammen.

Houd er rekening mee dat momenteel in de meeste gevallen alleen staaf-, cirkel-, spreidings- en lijndiagrammen interactief zijn.

Revenue by day of week line chart with Friday as the low point at 53

Als er geen grafiektype is opgegeven, bepaalt ChatGPT welk grafiektype ideaal is voor de uitvoer.

ChatGPT data analysis chart comparing total revenue for weekdays versus weekends

In de rechterbovenhoek van de grafiek kun je de grafiek downloaden of vergroten. Gedownloade grafieken hebben standaard de PNG-indeling.

Je kunt ook de grafiekkleuren aanpassen of de interactiviteit in- of uitschakelen. Wanneer je kleuren wijzigt, kun je een van onze standaardkleuren selecteren of de hexcode van een kleur invoeren.

Color settings panel with Dataset color set to blue and Interactive toggled on

Veelvoorkomende soorten analyse

ChatGPT is getraind om allerlei taken voor gegevensanalyse uit te voeren. Enkele veelvoorkomende taken zijn:

Afwijkingsdetectie en -beperking

Wanneer je beslissingen neemt op basis van gegevens, is het belangrijk ervoor te zorgen dat je brongegevens zo nauwkeurig mogelijk zijn. ChatGPT weet hoe het gegevens kan herkennen die mogelijk ontbreken of onjuist zijn. Veelvoorkomende problemen die ChatGPT kan herkennen en herstellen zijn onder andere:

  • Ontbrekende waarden

  • Uitschieters

  • Dubbele rijen

  • Onjuiste gegevenstypen

Begin je analyse met een prompt als deze: Controleer deze gegevens op veelvoorkomende problemen.

Zodra ChatGPT veelvoorkomende problemen heeft geïdentificeerd, kun je vragen om die problemen op te lossen. Afhankelijk van de gevonden problemen kan ChatGPT meerdere opties bieden waaruit je kunt kiezen. Als je niet zeker weet wat de gevolgen van deze keuzes zijn, vraag ChatGPT dan om meer informatie.

Aggregatie & integratie

ChatGPT kan grote hoeveelheden gestructureerde gegevens samenvoegen om je te helpen informatie te begrijpen. Enkele aggregaties die ChatGPT kan uitvoeren zijn:

  • Somwaarden

  • Gemiddelden (mediaan, gemiddelde, modus)

  • Minimum- en maximumwaarden

  • Aantallen unieke waarden

  • Standaarddeviatie

Je kunt een tabel uitvouwen en een of meer numerieke kolommen selecteren, en vervolgens een prompt als deze gebruiken: Bereken de mediaan en standaarddeviatie voor deze gegevens.

ChatGPT kan ook meerdere datasets samenvoegen op basis van gedeelde identificatiegegevens.

Stel dat je twee spreadsheets uploadt: één met klanten en één met aankopen. Aankooprecords zijn via een eigenschap customer_id gekoppeld aan klantrecords. ChatGPT weet hoe het beide bestanden in één dataset kan integreren, zodat het vragen kan beantwoorden zoals "Wat is het totaal van alle aankopen door klanten met een gold-abonnement?

ChatGPT voegt datasets automatisch voor je samen wanneer je een vraag stelt waarvoor dat nodig is.

Geavanceerde statistische analyse

ChatGPT begrijpt hoe het een breed scala aan statistische analyses kan uitvoeren en kan op basis van je vereisten passende technieken selecteren. Enkele soorten analyses die ChatGPT kan uitvoeren zijn:

  • Vergelijkende statistiek: Hierbij worden verschillende groepen of variabelen vergeleken om hun verschillen of overeenkomsten te begrijpen. Technieken zijn onder andere t-toetsen, ANOVA (variantieanalyse) en MANOVA (multivariate variantieanalyse).

  • Correlatie- en regressieanalyse: Deze methoden beoordelen de relatie tussen variabelen. Correlatieanalyse meet de sterkte en richting van de relatie, terwijl regressieanalyse de relatie modelleert om uitkomsten te voorspellen.

  • Tijdreeksanalyse: Dit type analyse onderzoekt gegevenspunten die in de loop van de tijd zijn verzameld om trends, cycli en seizoenseffecten te identificeren. Methoden zijn onder andere ARIMA (Autoregressive Integrated Moving Average) en seizoensdecompositie.

Je hoeft geen datawetenschapper te zijn om deze technieken te gebruiken! Als je niet zeker weet welke techniek het meest geschikt is voor je gegevens, vertel ChatGPT dan wat je wilt begrijpen en vraag om de beste analysetechniek aan te bevelen. Als je niet zeker weet hoe je de uitvoer van de analyse moet interpreteren, vraag ChatGPT dan om deze aan je uit te leggen. Een effectieve prompt kan zijn: Is er iets opvallends of ongebruikelijks aan deze analyse?

Was dit artikel nuttig?