Problemet med Big Data

Om man bara låter datorerna leta efter samband i stora datamängder, utan någon idé om varför saker skulle hänga samman, kommer saker som egentligen inte har med varandra att göra att förefalla sammanlänkade. Till exempel antalet filmer Niclas Cage medverkat i och antalet människor som drunknat genom att falla i en swimingpool.

Källa Spurious Correlations, som om jag förstår det rätt genereras av en dator som står och tuggar sig igenom offentlig statistik och spottar ut alla samband den kan hitta.

comments powered by Disqus