O zi din viața unui cercetător de date

Ghidul de carieră pentru Data Scientist de la BrainStation vă poate ajuta să faceți primii pași către o carieră profitabilă în știința datelor. Citiți mai departe pentru o prezentare generală a modului în care oamenii de știință în date își petrec zilele la serviciu.

Deveniți un Data Scientist

Discutați cu un consilier de învățare pentru a afla mai multe despre modul în care campurile și cursurile noastre vă pot ajuta să deveniți un Data Scientist.



Făcând clic pe Trimite, acceptați Termeni .



Trimite

Nu s-a putut trimite! Reîmprospătați pagina și încercați din nou?

Aflați mai multe despre Bootcamp-ul nostru pentru știința datelor

Mulțumesc!

Vom lua legătura în curând.



Vizualizați pagina Data Science Bootcamp

O zi din viața unui cercetător de date

Dintre toate disciplinele examinate în Sondajul de competențe digitale de la Brainstation, știința datelor poate cuprinde cea mai largă gamă de aplicații. Dar, deși știința datelor există de zeci de ani, ea a inflorit abia recent. Pe măsură ce disponibilitatea datelor s-a extins, companiile și-au dat seama cât de importantă poate fi știința datelor, spune Briana Brownell, fondator și CEO al Pure Strategy și un Data Scientist de 13 ani. Fiecare companie trebuie acum să se concentreze parțial pe tehnologie. Chiar în această săptămână, de exemplu, McDonald’s a plătit aproximativ 300 de milioane de dolari pentru a-și achiziționa propria firmă de big data.

Nu este de mirare, așadar, că competiția pentru Data Scientists este incredibil de mare. În doar doi ani, cererea este de așteptat să crească cu 28%, echivalentul a aproximativ 2,7 milioane de noi locuri de muncă. Sunt mai multe locuri de muncă decât vor putea ocupa noii absolvenți, ceea ce înseamnă că lucrătorii din domeniul tehnologiei din alte domenii vor trebui să-și perfecționeze abilitățile și să facă tranziția către date pentru a satisface această cerere.

De fapt, sondajul nostru sugerează că acest lucru se întâmplă deja. Aproximativ patru din cinci profesioniști în domeniul datelor și-au început cariera făcând altceva, iar 65 la sută din toți oamenii de știință în domeniul datelor lucrează în domeniu timp de cinci ani sau mai puțin. Acest aflux uriaș de minți noi are un efect cu două tăișuri, spune Brownell; pe de o parte, apar o mulțime de idei noi, spune ea. Când mă uit la o parte din conținutul care provine din comunitatea științei datelor, sunt surprins cât de multă inovație există. Flipside, totuși, este o tendință de a reinventa roata.



Cererea mare de cercetători ai datelor este grozavă dacă sunteți unul (sau vă gândiți să deveniți unul), dar pentru angajatori, recrutarea poate fi o provocare descurajantă. Aici, recalificarea este o soluție evidentă; poate fi mai eficient din punct de vedere al costurilor să reinstruiți un angajat actual în știința datelor decât să căutați unul nou.

Dar chiar dacă intenționați să angajați o nouă echipă de știință a datelor, organizația dvs. în ansamblu ar putea avea nevoie să-și perfectioneze cunoștințele de date, avertizează Brownell. Toată lumea vrea să lucreze la ceva care are un impact asupra locului de muncă, care face viața oamenilor mai bună, spune ea. Dacă cultura companiei tale nu este de așa natură încât [informatorii tăi] să aibă un impact, este aproape imposibil să angajezi. Conducerea trebuie să fie capabilă nu numai să comunice potențialilor angajați cum vor putea contribui, ci și să înțeleagă propunerile pe care echipa lor de știință a datelor le propune în cele din urmă.

Din păcate, spune Brownell, majoritatea incomode sunt companiile care nu și-au dat seama. Sondajul nostru susține acest lucru: majoritatea respondenților (52 la sută) au descris nivelul de cunoaștere a datelor în cadrul organizațiilor lor ca fiind de bază, cu cel mai frecvent răspuns intermediar (31 la sută). Acest lucru sugerează că o anumită formare de bază în știința datelor ar putea fi utilă pentru marea majoritate a companiilor, în special în conducere.



Această nevoie de alfabetizare a datelor și de comunicare îmbunătățită este sporită de modul în care sunt structurate majoritatea echipelor de știință a datelor: ca o echipă discretă, de obicei cu 10 persoane sau mai puțin (conform a 71 la sută dintre respondenți) și adesea cinci sau mai puțin (38 la sută). ). Aceste echipe unite nu își pot permite să fie izolate. Persoanele care lucrează în cadrul unor companii mai mari se află de obicei într-un grup mic, specific științei datelor, iar clienții lor sunt interni – alte părți ale organizației, explică Brownell, deci este o echipă care trebuie să opereze în multe domenii diferite ale organizației.

Ce este exact știința datelor?

Percepția obișnuită (că oamenii de știință de date strâng numerele) nu este prea departe de vedere, spune Brownell. Există o mulțime de seturi de date care trebuie să aibă informații dezvăluite din ele, iar asta implică o mulțime de pași, cum ar fi construirea de modele și curățarea datelor, și chiar doar deciderea de ce date aveți nevoie. În cele din urmă, totuși, acest efort este orientat către obiective: în esență, trebuie să faceți ceva cu datele.

De altfel, datele nu sunt întotdeauna numere. În timp ce majoritatea respondenților (73%) au indicat că lucrează cu date numerice, 61% au spus că lucrează și cu text, 44% cu date structurate, 13% cu imagini și 12% cu grafică (și minoritățile mici chiar lucrează cu video și audio —6 la sută, respectiv 4 la sută). Aceste rezultate ale sondajului sugerează că știința datelor se extinde cu mult dincolo de tabelele financiare, recrutând oameni pentru proiecte precum maximizarea satisfacției clienților sau obținerea de informații valoroase din furtunul de incendiu al rețelelor sociale.

Ca rezultat, există o varietate enormă în domeniul științei datelor, spune Brownell. Fiecare industrie are propria sa viziune asupra tipurilor de date la care lucrează oamenii de știință în date, a tipurilor de rezultate pe care le așteaptă și a modului în care acestea se potrivesc în structura de conducere a companiei lor. În orice caz, totuși, scopul este de a folosi date pentru a ajuta o companie să ia decizii mai bune. Aceasta ar putea fi îmbunătățirea produselor, înțelegerea pieței pe care doresc să intre, păstrarea mai multor clienți, înțelegerea utilizării forței de muncă, înțelegerea modului de a face angajări bune - tot felul de lucruri diferite.

Locuri de munca Data Science

În unele domenii ale tehnologiei, a deveni generalist poate fi cel mai bun picior în ușă – nu așa în cazul științei datelor. Angajatorii caută de obicei competențe specializate în industria lor. Deoarece știința datelor vine în atât de multe variante, sondajul nostru a analizat mai profund, examinând cinci categorii principale de locuri de muncă: analist de date, cercetător, analist de afaceri, manager de date și analize și cercetător de date propriu-zis.

În toate aceste titluri de post, disputele și curățarea datelor ocupă cea mai mare parte a timpului, dar cu ce scop? Cel mai adesea, scopul este de a optimiza o platformă, produs sau sistem existent (45 la sută) sau de a dezvolta altele noi (42 la sută). Săpând mai profund, am descoperit că optimizarea soluțiilor existente tinde să revină analiștilor de afaceri și analiștilor de date, în timp ce dezvoltarea de noi soluții revine mai des oamenilor de știință și cercetătorilor de date.

Tehnicile folosite de oamenii de știință în date variază și în funcție de specializare. Regresia liniară a fost un instrument comun în toate categoriile, citat de 54% dintre respondenți, dar au existat câteva surprize când ne-am uitat la software-ul pe care oamenii îl folosesc.

Excel – acel cal de bătaie al manipulării seturilor de date – este practic omniprezent, citat de 81% din toți respondenții și cel mai popular instrument din fiecare categorie, cu excepția Data Scientists propriu-zis (care se bazează cel mai frecvent pe Python – și a citat, de asemenea, un set de instrumente mai mare decât alte categorii). ). Ce face Excel atât de inevitabil, chiar și în 2019?

Lucrul care îmi place la Excel este modul în care vă permite să vedeți datele și să le simțiți intuitiv, a explicat Brownell. De asemenea, folosim mult Python și, în acest caz, atunci când faceți analize pe un fișier de date, acesta este ascuns; cu excepția cazului în care programați în mod special o parte din codul dvs. pentru a face o anumită vizualizare a datelor brute pe care le analizați, nu le vedeți. În timp ce cu Excel, este chiar în fața ta. Asta are o mulțime de avantaje. Uneori puteți observa probleme cu fișierul de date. Nu văd ca Excel să dispară niciodată din analiză.

Acestea fiind spuse, există încă o listă lungă de alte programe utilizate în domeniu - deloc surprinzător, având în vedere diversitatea sa. SQL (43 la sută) și Python (26 la sută) sunt lideri în popularitate, Tableau (23 la sută), R (16 la sută), notebook-uri Jupyter (14 la sută) și o mână de alții care obțin cifre semnificative - ca să nu mai vorbim de uimitoarea 32% dintre respondenți care au citat alte instrumente, chiar și având în vedere această listă deja lungă.

Care este viitorul științei datelor?

În cele din urmă, am întrebat ce tendințe vor modela peisajul digital în următorii cinci până la 10 ani. Învățarea automată și inteligența artificială – ambele având aplicații în domeniul științei datelor – au fost în mare măsură covârșitoare evoluțiile pe care respondenții se așteaptă să aibă cel mai mare impact, cu 80% și, respectiv, 79%. Asta în ciuda faptului că mai puțin de un sfert (23%) dintre ei lucrează în prezent cu AI.

Inteligența artificială poate transforma absolut știința datelor, confirmă Brownell, a cărei companie dezvoltă produse AI. Aceasta este cu adevărat gloria metodelor de învățare nesupravegheate. Avem doar atât de mult timp să ne uităm la aceste seturi de date și, mai ales în cazul celor mari, este foarte dificil să facem totul. Instrumentele AI vă pot ajuta să dezvălui ceva ce poate nu v-ați fi gândit să îl căutați. Cu siguranță ni s-a întâmplat asta.

Alte tendințe Oamenii de știință de date se așteaptă să domine în viitorul apropiat: Internetul lucrurilor (51 la sută), blockchain (50 la sută) și comerțul electronic (36 la sută), realitate augmentată și realitate virtuală (38 la sută și 27 la sută) și chiar și voce experiențele bazate (25 la sută) — toate manifestările semnificative și toate domeniile în care știința datelor poate fi folosită în mod corespunzător.

Kategori: Știri