Base de dades de sèries temporals

sistema de programari optimitzat per emmagatzemar i publicar sèries temporals mitjançant parells de temps i valors associats.

Una base de dades de sèries temporals (amb acrònim anglès TSDB) és un sistema de programari optimitzat per emmagatzemar i publicar sèries temporals mitjançant parells de temps i valors associats.[1] En alguns camps, les sèries temporals es poden anomenar perfils, corbes, traces o tendències.[2] Diverses bases de dades de sèries temporals primerenques s'associen amb aplicacions industrials que podrien emmagatzemar de manera eficient els valors mesurats d'equips sensorials (també coneguts com a historiadors de dades), però ara s'utilitzen per donar suport a una gamma molt més àmplia d'aplicacions.

Exemple de sèrie temporal: Gràfic de sèries temporals del nombre de casos actius de COVID-19 per als 7 estats dels EUA més afectats, inclosos els presumptes casos positius. Tingueu en compte que l'eix vertical està escalat logarítmicament. Les línies de punts mostren les previsions de 3 dies basades en una regressió exponencial durant els darrers 4 dies de dades. (Font de dades: {{format ref}} https://github.com/CSSEGISandData/COVID-19)

En molts casos, els dipòsits de dades de sèries temporals utilitzaran algorismes de compressió per gestionar les dades de manera eficient.[3][4] Tot i que és possible emmagatzemar dades de sèries temporals en molts tipus de bases de dades diferents, el disseny d'aquests sistemes amb el temps com a índex clau és clarament diferent de les bases de dades relacionals que redueixen les relacions discretes mitjançant models referencials.[5]

Els conjunts de dades de sèries temporals són relativament grans i uniformes en comparació amb altres conjunts de dades, normalment estan formats per una marca de temps i dades associades.[6] Els conjunts de dades de sèries temporals també poden tenir menys relacions entre les entrades de dades de diferents taules i no requereixen emmagatzematge indefinit d'entrades.[6] Les propietats úniques dels conjunts de dades de sèries temporals fan que les bases de dades de sèries temporals puguin oferir millores significatives en l'espai d'emmagatzematge i el rendiment respecte a les bases de dades d'ús general.[6] Per exemple, a causa de la uniformitat de les dades de sèries temporals, els algorismes de compressió especialitzats poden oferir millores respecte als algorismes de compressió habituals dissenyats per treballar amb dades menys uniformes.[6] Les bases de dades de sèries temporals també es poden configurar per eliminar regularment dades antigues, a diferència de les bases de dades normals que estan dissenyades per emmagatzemar dades indefinidament.[6] Els índexs especials de bases de dades també poden augmentar el rendiment de les consultes.[6]

Els sistemes de bases de dades següents tenen una funcionalitat optimitzada per gestionar dades de sèries temporals:

Nom llicència Llenguatge Referències
Apache Druid Llicència Apache 2.0 Java N/D
Apache Pinot Llicència Apache 2.0 Java [7]
eXtremeDB Comercial SQL, Python, C / C++, Java i C# [8]
InfluxDB MIT.[9] Chronograf AGPLv3, clúster comercial [10] Go [8] [11]
Informix TimeSeries Comercial C / C++ [8] [12]
Kx kdb+ Comercial Q [8]
Kudu Llicència Apache 2.0 C++ [13]
MongoDB Llicència pública del costat del servidor C++, JavaScript, Python [14]
Prometeu Llicència Apache 2.0 Go [8]
Riak -TS Llicència Apache 2.0 Erlang [8]
eina RRD GPLv2 C [8]
Escala de temps DB Llicència Apache 2.0 C [15]
Xiuxiueig (grafit) Apache 2 Python [16]

Referències

modifica
  1. Mueen, Abdullah; Keogh, Eamonn; Zhu, Qiang; Cash, Sydney; Westover, Brandon University of California, Riverside, 2009, 2009, pàg. 473–484. DOI: 10.1137/1.9781611972795.41. PMC: 6814436. PMID: 31656693 [Consulta: 31 juliol 2019]. «Definition 2:A Time Series Database(D)is an unordered set of m time series possibly of different lengths.»
  2. Villar-Rodriguez, Esther; Del Ser, Javier; Oregi, Izaskun; Bilbao, Miren Nekane; Gil-Lopez, Sergio Energy, 137, 2017, pàg. 118–128. DOI: 10.1016/j.energy.2017.07.008.
  3. Pelkonen, Tuomas; Franklin, Scott; Teller, Justin; Cavallaro, Paul; Huang, Qi Proceedings of the VLDB Endowment, 8, 12, 2015, pàg. 1816–1827. DOI: 10.14778/2824032.2824078.
  4. Lockerman, Joshua. «Time-series compression algorithms, explained» (en anglès). Timescale Blog. https://www.timescale.com,+22-04-2020.+[Consulta: 7 octubre 2022].
  5. Asay, Matt. «Why time series databases are exploding in popularity» (en anglès). TechRepublic. https://www.techrepublic.com,+26-06-2019. Arxivat de l'original el 26 juny 2019. [Consulta: 31 juliol 2019].
  6. 6,0 6,1 6,2 6,3 6,4 6,5 , 15-01-2021.
  7. Fu, Yupeng; Soman, Chinmay Proceedings of the 2021 International Conference on Management of Data, 09-06-2021, pàg. 2503–2516. arXiv: 2104.00087. DOI: 10.1145/3448016.3457552.
  8. 8,0 8,1 8,2 8,3 8,4 8,5 8,6 Stephens, Rachel. «State of the Time Series Database Market», 03-04-2018. [Consulta: 3 octubre 2018].
  9. «influxdb license». GitHub. [Consulta: 14 agost 2016].
  10. «influxdb clustering». influxdata.com. [Consulta: 10 març 2016].
  11. Anadiotis, George. «Processing time series data: What are the options?». zdnet.com, 28-09-2018. [Consulta: 10 març 2016].
  12. Dantale, Viabhav. Solving Business Problems with Informix TimeSeries. IBM Redbooks, 2012-09-21. ISBN 9780738437231. 
  13. «Benchmarking Time Series workloads on Apache Kudu using TSBS», 18-03-2020.
  14. «MongoDB's New Time Series Collections».
  15. Design Recommendations for Intelligent Tutoring Systems: Volume 8 - Data Visualization. Army Research Laboratory, 29 desembre 2020, p. 50. ISBN 9780997725780. 
  16. Joshi, Nishes. Interoperability in monitoring and reporting systems, 23 maig 2012.