În știința datelor, incertitudinea este unul dintre cele mai provocatoare aspecte

David Azcona de la Zalando discută despre munca sa în știința datelor și învățarea automată și de ce este important să rămâneți curios.

David Azcona a absolvit un doctorat la Universitatea Dublin City și a petrecut un an ca bursier Fulbright la Universitatea de Stat din Arizona înainte de a-și prelua actualul rol la Zalando.

Acum lucrează ca om de știință aplicat senior care lucrează în echipa de informații despre piață a companiei. De asemenea, a participat la o varietate de hackathon-uri, de la drone la viziune computerizată.

Acum, rolul său se concentrează pe îmbunătățirea sistemelor de învățare automată și pe lucrul cu viziunea computerizată și tehnicile de procesare a limbajului natural.

„Multe roluri în spațiul științei datelor s-au mutat de la oameni de știință puri de cercetare la ingineri de învățare automată”
– DAVID AZCONA

Dacă există așa ceva, poți descrie o zi obișnuită în muncă?

Ziua mea începe aproape întotdeauna cu stand-up-ul nostru obișnuit, care este o întâlnire foarte scurtă de recuperare în care fiecare dintre membrii echipei discută la ce lucrăm și orice blocanți pe care îi putem avea. Acest lucru a fost de obicei făcut în persoană și literalmente în picioare pentru a fi cât mai rapid posibil. În aceste zile o facem online, dar tot încercăm să o facem foarte scurtă.

După aceea, ziua mea poate varia foarte mult. În general, lucrez la îmbunătățirea sistemelor noastre de învățare automată, la revizuirea codului colegilor mei, la cercetarea de noi abordări de infrastructură pentru conductele noastre de date, la colaborarea cu ingineri și specialiști în produse, la revizuirea lucrărilor de ultimă generație din literatură și la interviu cu noi candidați pentru programul nostru. roluri deschise.

Faceți clic aici pentru a vedea cei mai buni angajatori din domeniul științei-tehnologiei care angajează chiar acum.

La ce tipuri de proiecte de știință a datelor lucrați?

Când am început la Zalando, am lucrat la personalizare, recomandând clienților noștri mărci relevante pentru stilul lor personal. Cu toate acestea, atunci când un brand nou este integrat pe Zalando, suferim de problema de pornire la rece în sistemele de recomandare, deoarece acestea sunt medii foarte aglomerate de date.

Adică, nu putem trage nicio inferență pentru utilizatori sau articole despre care nu a adunat încă suficiente informații. Soluția noastră a fost să învățăm reprezentări compacte pentru mărci, bazându-ne pe munca existentă a Zalando Research și valorificând aceste înglobări pentru a găsi clienți care ar putea fi interesați de aceste noi mărci.

De atunci, am schimbat echipele și acum lucrez la perspective de piață, în care căutăm potriviri de produse între sortimentul Zalando și concurenții acestora. Pentru aceasta, folosim metode de învățare automată de ultimă generație pe cantități mari de date multimodale, inclusiv imagini, text sau date structurate și sisteme umane în buclă.

Ajungem să folosim viziunea computerizată și tehnicile de procesare a limbajului natural pentru a oferi informații despre strategia Zalando privind traficul și platforma de prețuri.

Ce abilități folosești zilnic?

În calitate de om de știință aplicativ, lucrăm la probleme cu un grad ridicat de ambiguitate și există o serie de abilități soft, cum ar fi gândirea critică și rezolvarea problemelor, pe care le folosim zilnic pentru a ne planifica etapele de referință, a proiecta următoarea fază a experimentelor și a ne dezvolta învățarea automată. conducte.

În Zalando, mi-am găsit colegii foarte deschiși la minte, ascultă ideile colegilor lor și propun soluții la provocările noastre. În plus, prezentăm rezultatele și abordările noastre conducerii superioare și altor părți interesate.

Aceste roluri necesită o bună înțelegere a fundamentelor învățării automate, pe baza unor baze de matematică și probabilitate. Lucrăm mai ales cu limbaje de programare precum Python, biblioteci de învățare automată precum Pytorch sau TensorFlow, pe lângă infrastructura unui furnizor de cloud. Acesta este ceva ce învățăm și ne îmbunătățim la locul de muncă, așa că acestea nu sunt o condiție prealabilă.

Care sunt cele mai grele părți ale muncii în știința datelor?

În opinia mea personală, unul dintre cele mai provocatoare aspecte ale lucrului în știința datelor este incertitudinea. Planificarea reperelor unuia dintre aceste proiecte și estimarea cantității de muncă pe care o poate necesita este în general mai dificilă decât un proiect de inginerie care implementează o anumită caracteristică.

Cu toate acestea, acest lucru îl face și mult mai satisfăcător, deoarece putem implementa un nou algoritm de învățare automată pe un domeniu nou pe care clienții îl iubesc!

Instrumentele de instruire și implementare a modelelor la scară au, de asemenea, mult loc de îmbunătățire. Suntem încă departe de a putea implementa și furniza predicții online în timp real într-o manieră fluidă.

Aveți vreun sfat de productivitate care să vă ajute pe parcursul zilei?

De obicei fac o listă cu lucrurile pe care vreau să le finalizez până la sfârșitul zilei, ceea ce mă ține pe drumul cel bun. Unul dintre foștii mei manageri, Anthony Brew, a avut o multitudine de sfaturi grozave pentru a ne menține productivi și motivați, cum ar fi să scrieți des, să vă înregistrați realizările pentru referințe viitoare sau pur și simplu să ajungeți să terminați ceea ce ați început.

Deseori fac o pauză în mijlocul zilei și merg la o scurtă plimbare. Acest lucru mă ajută să-mi limpezesc capul și să mă întorc la muncă cu mai multă energie! Seara, practic ceva sport, de obicei un antrenament afară cu niște prieteni care mă ajută să ies din nou afară și să socializez după ce am lucrat de acasă în timpul zilei.

Cum s-a schimbat acest rol pe măsură ce sectorul științei datelor a crescut și a evoluat?

Multe roluri în spațiul științei datelor s-au mutat de la oameni de știință puri de cercetare la ingineri de învățare automată.

Aceștia sunt responsabili nu numai de revizuirea abordărilor de ultimă generație și de antrenarea modelelor predictive, ci și de implementarea sistemelor de învățare automată în producție, folosind conducte de date și infrastructuri cloud, și apoi monitorizarea predicțiilor acestora și măsurarea derivei modelului, printre alte sarcini.

Ce îți place cel mai mult la lucrul în știința datelor?

Îmi place să lucrez cu unii dintre cei mai talentați ingineri în probleme foarte provocatoare, care variază de la viziunea computerizată la modă, cum ar fi detectarea articolelor de îmbrăcăminte până la înțelegerea limbajului natural pentru recenziile clienților.

Aceste soluții afectează milioane de clienți într-un mod semnificativ, făcând călătoria lor de cumpărături mai ușoară și mai plăcută.

Ce sfat ai da cuiva care vrea să lucreze în știința datelor?

Aș sugera să rămâneți curioși, să începeți prin a explora ceea ce se poate face folosind învățarea automată, modul în care companiile și institutele de cercetare o folosesc pentru a avea un impact, apoi vă aprofundați în fundamente folosind numeroasele resurse online disponibile, cum ar fi MIT sau Stanford. cursuri online.

Sunt un cursant foarte practic și îmi place să construiesc proiecte mici pentru a-mi consolida înțelegerea și a-mi pune cunoștințele în practică. Hackathon-urile sunt o modalitate excelentă de a începe în timp ce rezolvați o problemă de afaceri într-o perioadă scurtă de timp.

Nu ratați cunoștințele de care aveți nevoie pentru a reuși. Înscrieți-vă pentru Daily BriefRezumatul Silicon Republic al știrilor despre știință și tehnologie.

Leave a Comment