Revisió del 19:03, 24 nov 2021 modifica Julià Minguillón (discussió \| contribucions) 440 edits Creada per traducció de la pàgina «Tidy data» Etiquetes: traducció de contingut ContentTranslation2		Revisió del 19:08, 24 nov 2021 modifica desfés Julià Minguillón (discussió \| contribucions) 440 edits Cap resum de modificació Etiqueta: editor visual Edició següent →
Línia 1: Les '''dades ordenades''' o 'tidy data', nom alternatiu per a dades en format tabular, són les que s'obtenen a partir d'un procés anomenat 'data tidying' o ordenament de dades.<ref name="hadley">{{Ref-publicació\|url=https://www.wikidata.org/wiki/Q56699625\|article=Tidy Data\|cognom=Wickham\|nom=Hadley\|data=1 de enero de 2014\|publicació=Journal of Statistical Software\|volum=59\|exemplar=10\|consulta=924 de ~~diciembre~~Novembre de ~~2018~~2021\|doi=10.18637/JSS.V059.I10}}</ref> És un dels processos de neteja importants durant el processament de dades massives o 'big data' i és un pas habitual en la [[Ciència de les dades\|ciència de dades]]. Els conjunts de dades ordenades tenen una estructura que facilita la seva anàlisi posterior, ja que són més senzills de manipular, modelar i visualitzar. Bàsicament, els conjunts de dades 'tidy' estan ordenats de tal manera que cada variable o atribut és una columna i cada observació (o cas) és una fila.<ref name="hadley" /><ref>{{Ref-publicació\|url=http://courses.had.co.nz.s3-website-us-east-1.amazonaws.com/12-rice-bdsi/slides/07-tidy-data.pdf\|article=Tidy data\|publicació=Journal of Statistical Software\|volum=VV\|exemplar=II}}</ref> == Característiques == Jeff Leek, en el seu llibre ''The Elements of Data Analytic Style,'' resumeix les característiques de les dades ordenades amb els punts següents:<ref>~~Jeff Leek,~~ {{Ref-llibre\|títol=The Elements of Data Analytic Style, \|url=http://leanpub.com/datastyle\|editorial=Leanpub~~, 2015~~\|data=2014-0302-0220\|nom=Jeff\|cognom=Leek}}</ref> # Cada variable que es mesura ha de ser en una columna.

Tidy data: diferència entre les revisions