Opt lucruri surprinzătoare pe care știința datelor le-a dezvăluit despre noi în ultimul deceniu

Analiza datelor mari a susținut de mult timp fapte majore în fizică și astronomie. Dar, mai recent, am văzut-o susținând descoperiri în științe sociale și umaniste.

De când lucrarea de referință Computational Social Science a fost publicată în 2009, o nouă generație de instrumente de analiză a datelor a oferit cercetătorilor o perspectivă asupra întrebărilor fundamentale despre modul în care comunicăm, cine suntem și ce prețuim.

De exemplu, analizând frecvența relativă a anumitor cuvinte din textele istorice, cercetătorii pot identifica schimbări importante în utilizarea limbajului de-a lungul timpului.

În unele cazuri, aceste schimbări vor fi evidente, cum ar fi utilizarea cuvintelor arhaice fiind înlocuită cu cuvinte mai contemporane. Dar în alte cazuri, ele pot reflecta schimbări sociale și culturale mai subtile, dar larg răspândite. Mai jos sunt câteva dintre cele mai influente descoperiri centrate pe date din ultimii 10 ani.

Cum comunicăm

În ultimul deceniu, un număr tot mai mare de surse globale de date deschise i-au ajutat pe cercetători să dezvăluie tipare în ceea ce citim, scriem și le acordăm atenție. Google Books, Worldcat și Project Gutenberg sunt doar câteva exemple.

Lansarea programului Google Books n-gram viewer la începutul anilor 2010 a schimbat jocul în acest sens. Folosind întreaga bază de date Google Cărți, acest instrument vă arată frecvența relativă a unui anumit termen sau expresie așa cum a fost folosit de-a lungul sutelor de ani. Cercetătorii au folosit aceste date pentru a explora suprimarea sistematică a mențiunii pictorilor evrei, precum Marc Chagall, în cărțile germane în timpul celui de-al Doilea Război Mondial.

Analiza datelor poate dezvălui, de asemenea, modele în exprimarea emoțiilor umane de-a lungul timpului. We Feel de la CSIRO urmărește emoțiile în comunitățile din întreaga lume. Face acest lucru analizând limbajul pe care oamenii îl folosesc pe rețelele sociale în timp real și elaborând-o.

Instrumentul poate fi folosit pentru a determina starea generală de spirit în timp (oră de oră, zi de zi) în anumite orașe și țări. Modelele din aceste date pot fi apoi explorate în asociere cu alte informații, cum ar fi vremea, vacanțele și fluctuațiile economice.

Unele rezultate ale cercetării pretind chiar că reprezintă schimbări fundamentale în valorile sociale ale oamenilor, sentimentul comunității și modul în care gândim (de exemplu, ascensiunea și căderea cuvintelor asociate cu raționalitatea, cum ar fi „metodă”, „analiza” și „determină”).

Iată câteva constatări cheie în acest spațiu:

  • Cifra de afaceri culturală se accelerează

    O analiză condusă de Universitatea Harvard a mai mult de un secol de date din milioane de cărți oferă dovezi că gradul de atenție al societății pentru evenimentele istorice este în scădere, pe măsură ce apetitul pentru materiale noi crește.

    Cu alte cuvinte, uităm mai repede trecutul. Puteți vedea acest lucru în graficul de mai jos, care urmărește cât de des sunt menționați trei ani anumi într-o gamă largă de literatură de-a lungul timpului. Pe măsură ce trece timpul, „viața de înjumătățire” a fiecărui an (punctul în care primește doar jumătate din atenția pe care a avut-o la apogeu) vine mai repede.

    Atenția noastră colectivă pentru evenimentele istorice a scăzut în ultimul secol. Foto: Michel et al., Science 2010

  • Diversitatea limbajului uman și biodiversitatea sunt corelate

    Prin cartografierea diversității lingvistice și a diversității speciilor de animale, cercetătorii au arătat că aceste două lumi sunt corelate geografic – ambele crescând odată cu temperatura și proximitatea de ecuator. Deci, cu cât vă apropiați de ecuator, cu atât există mai multe variații în limba vorbită și cu atât este mai mare varietatea speciilor.

    Autorii propun că acest lucru se datorează căldurii din apropierea ecuatorului care produce o productivitate mai mare și o varietate în viața plantelor, care, la rândul său, oferă medii mai complexe și mai interactive atât pentru animale, cât și pentru oameni deopotrivă – hrănindu-se într-un ciclu prin care „diversitatea devine mai multă diversitate”.

    Trei figuri care arată distribuția diversității limbii și animalelor și relația lor cu geografia.

    Cercetătorii au arătat că atât diversitatea lingvistică, cât și diversitatea speciilor cresc exponențial odată cu temperatura și apropierea de ecuator. Foto: Hamilton, Walker & Kempes, Rapoarte științifice 2020

  • Au existat schimbări la nivel de societate în utilizarea limbii în ultimul secol

    Într-un articol publicat în decembrie, cercetătorii au folosit învățarea automată pentru a arăta schimbări pe termen lung și consistente în utilizarea limbajului. Mai exact, ele dezvăluie un punct de inflexiune în anii 1980 în care există o schimbare către un limbaj mai egocentric, mai emoțional și presupus mai puțin rațional.

    Autorii sugerează (deși nu fără contestație) acest lucru ar putea semnala începutul unei „ere post-adevăr”.

cine suntem noi

În domeniul psihologiei, aceleași instrumente de analiză a datelor au arătat că personalitățile oamenilor pot fi măsurate folosind trăsăturile „Big 5”, care devin în mare parte stabile la vârsta adultă.

Acest lucru a fost posibil datorită unor seturi extinse de date, cum ar fi HILDA din Australia, Panelul Socio-Economic German din Germania și sondajul British Household Panel Survey din Marea Britanie.

Studiile solide au demonstrat, de asemenea, că trăsăturile de personalitate pot fi prezise în mod fiabil și precis dintr-o varietate de surse de date, inclusiv înregistrări vocale, modele de utilizare a telefonului mobil și chiar fotografii portret.

La rândul lor, au existat câteva asocieri remarcabile găsite la scară între personalitate și:

  • Altitudinea

    Un studiu publicat în 2020 și bazat pe datele a peste trei milioane de oameni, arată că oamenii care locuiesc la munte tind să aibă trăsături de personalitate diferite decât cei care trăiesc la nivelul mării. Sunt, în general, mai deschiși către experiențe noi și mai stabili din punct de vedere emoțional.

  • Locație

    Un alt studiu anterior arată că oamenii care locuiesc în Statele Unite pot fi împărțiți în trei grupuri clare și măsurabile de tipuri de personalitate, legate de amprentele geografice asociate. New Yorkezii și texanii (care se află în același grup) au mai multe șanse să fie temperamentali și dezinhibați.

  • Ocupaţie

    În propria noastră cercetare publicată împreună cu colegii în 2019, am analizat trăsăturile de personalitate ale oamenilor din peste 1.000 de ocupații diferite. Am descoperit că oamenii în același rol au trăsături similare. Oamenii de știință sunt mai deschiși la idei noi, dar gata să argumenteze, în timp ce profesioniștii din tenis tind să fie prietenoși și extroverti.

    Cercetarea a folosit învățarea automată pentru a deduce trăsăturile personalității a peste 100.000 de persoane, pe baza limbajului folosit pe rețelele sociale.

Ceea ce prețuim

În economie, vedem deschiderea unor frontiere majore de cercetare datorită analizei datelor, inclusiv în:

  • știința rețelelor

    Când vine vorba de succes, am învățat că performanța contează cel mai mult atunci când poate fi măsurată (ca în sport). Dar în alte domenii în care nu poate fi măsurat cu ușurință (cum ar fi în lumea artei), rețelele contează cel mai mult.

  • Economia comportamentală

    Acum putem vedea cum ne comportăm ca indivizi în masă, dezvăluind indicii valoroase pentru intervenții politice eficiente în ceea ce privește ocuparea forței de muncă, impozitarea și educația. De exemplu, un studiu la scară largă a arătat că cei care au reintrat cel mai repede în forța de muncă au manifestat anumite comportamente cheie. Printre acestea se numără să se trezească devreme și să fie mobil din punct de vedere geografic (însemnând probabil că sunt mai dispuși să călătorească mai departe sau să se mute pentru muncă).

Știință post-teorie?

Unii au susținut că știința datelor reprezintă o provocare fundamentală pentru științele tradiționale, odată cu apariția „științei post-teorii”. Acesta este conceptul conform căruia mașinile sunt mai bune în înțelegerea relației dintre date și realitate decât metoda științifică tradițională ipoteza, prezice și testează.

Cu toate acestea, rapoartele despre moartea teoriei sunt probabil foarte exagerate. Datele nu sunt perfecte. Și știința datelor bazată pe date incomplete sau părtinitoare are potențialul de a pierde sau de a masca modele importante în activitatea umană. Acest lucru poate fi abordat doar prin gândire și teorie critică.

Conversatia

Paul X. McCarthy, profesor adjunct, UNSW Sydney și Colin Griffith, Strategie și dezvoltare de afaceri, Data61, CSIRO

Acest articol este republicat din The Conversation sub o licență Creative Commons. Citiți articolul original.

Leave a Comment