Data Scientist

Ghidul de carieră pentru Data Scientist de la BrainStation vă poate ajuta să faceți primii pași către o carieră profitabilă în știința datelor. Citiți mai departe pentru o prezentare generală a domeniului științei datelor, precum și a rolului de job de Data Scientist.

Deveniți un Data Scientist

Discutați cu un consilier de învățare pentru a afla mai multe despre modul în care campurile și cursurile noastre vă pot ajuta să deveniți un Data Scientist.



Făcând clic pe Trimite, acceptați Termeni .



Trimite

Nu s-a putut trimite! Reîmprospătați pagina și încercați din nou?

Aflați mai multe despre Bootcamp-ul nostru pentru știința datelor

Mulțumesc!

Vom lua legătura în curând.



Vizualizați pagina Data Science Bootcamp

Ce este un Data Scientist?

Oamenii de știință ai datelor adună, organizează și analizează seturi mari de date mari - date structurate și nestructurate - pentru a crea soluții și planuri de afaceri acționabile bazate pe date pentru companii și alte organizații. Combinând un simț pentru matematică, informatică și afaceri, oamenii de știință în domeniul datelor trebuie să posede atât abilitățile tehnice de a procesa și analiza big data, cât și perspicacitatea afacerilor pentru a dezvălui informații acționabile ascunse în acele date.

Data Science vs. Data Mining

Există câteva diferențe între data science și data mining. Să aruncăm o privire mai atentă:

Știința datelor

  • Este un domeniu larg care tinde să includă învățarea automată, inteligența artificială, analiza cauzală predictivă și analiza prescriptivă
  • Se ocupă de toate tipurile de date, inclusiv date structurate și nestructurate
  • Își propune să construiască produse centrate pe date și să ia decizii bazate pe date
  • Se concentrează pe studiul științific al datelor și modelului

Exploatarea datelor

  • Este un subset al științei datelor care include curățarea datelor, analiza statistică și recunoașterea modelelor și, uneori, include vizualizarea datelor, învățarea automată și transformarea datelor
  • Se ocupă în principal de date structurate, nu de date nestructurate
  • Își propune să preia date din diverse surse și să le facă utilizabile
  • Se concentrează pe practicile de afaceri

Ce face un Data Scientist?

Un Data Scientist analizează seturi de date mari pentru a dezvălui modele și tendințe care duc la perspective de afaceri acționabile și ajută organizațiile să rezolve probleme complicate sau să identifice oportunități de venituri și creștere. Un Data Scientist poate lucra practic în orice domeniu și trebuie să fie expert în manipularea seturilor de date structurate și nestructurate. Este un loc de muncă multidisciplinar și pentru a deveni un Data Scientist, trebuie să aveți cunoștințe de matematică, informatică, afaceri și comunicare pentru a vă îndeplini munca în mod eficient.



Deși sarcinile și responsabilitățile specifice ale unui Data Scientist vor varia foarte mult în funcție de industrie, poziție și organizație, majoritatea rolurilor Data Scientist vor include următoarele domenii de responsabilitate:

Cercetare

Un Data Scientist trebuie să înțeleagă oportunitățile și punctele dureroase specifice atât unei industrii, cât și unei companii individuale.

Pregătirea datelor

Înainte de a putea găsi informații valoroase, un Data Scientist trebuie să definească care seturi de date sunt utile și relevante înainte de a colecta, extrage, curăța și aplica date structurate și nestructurate dintr-o varietate de surse.



Crearea de modele și algoritmi

Folosind principiile de învățare automată și inteligență artificială, un Data Scientist trebuie să fie capabil să creeze și să aplice algoritmii necesari pentru implementarea instrumentelor de automatizare.

Analiza datelor

Este important ca un Data Scientist să poată analiza rapid datele pentru a identifica modele, tendințe și oportunități.

Vizualizare și comunicare

Un Data Scientist trebuie să fie capabil să spună poveștile descoperite prin intermediul datelor creând și organizând tablouri de bord și vizualizări atractive din punct de vedere estetic, deținând în același timp abilitățile de comunicare pentru a convinge părțile interesate și alți membri ai echipei că rezultatele din date merită luate în considerare.

Cel mai recent sondaj de competențe digitale de la BrainStation a constatat că profesioniștii în domeniul datelor și-au petrecut cea mai mare parte a timpului pe disputele și curățarea datelor. Respondenții au concluzionat, de asemenea, că obiectivul muncii lor este cel mai adesea optimizarea unei platforme, produse sau sisteme existente (45%) sau dezvoltarea altora noi (42%).

Tipuri de știință a datelor

Domeniul mai larg al științei datelor încorporează multe discipline diferite, inclusiv:

Ingineria datelor

Proiectarea, construirea, optimizarea, întreținerea și gestionarea infrastructurii care acceptă datele, precum și fluxul de date în cadrul unei organizații.

Pregătirea datelor

Curățarea și transformarea datelor.

Exploatarea datelor

Extragerea (și uneori curățarea și transformarea) datelor utilizabile dintr-un set de date mai mare.

Analize predictive

Folosind date, algoritmi și tehnici de învățare automată pentru a analiza probabilitatea unor rezultate viitoare posibile pe baza analizei datelor.

Învățare automată

Automatizarea construirii de modele analitice în procesul de analiză a datelor pentru a învăța din date, a descoperi modele și a împuternici sistemele să ia decizii fără prea multă intervenție umană.

Vizualizarea datelor

Utilizarea elementelor vizuale (inclusiv grafice, hărți și diagrame) pentru a ilustra perspectivele găsite în date într-un mod accesibil, astfel încât publicul să poată înțelege tendințele, valorile aberante și modelele găsite în date.

Beneficiile științei datelor

Companiile din toate industriile din toate părțile globului dedică din ce în ce mai mulți bani, timp și atenție științei datelor și caută să adauge un Data Scientist în echipa lor. Cercetările arată că companiile care adoptă cu adevărat luarea deciziilor bazate pe date sunt mai productive, profitabile și mai eficiente decât concurența.

Știința datelor este crucială pentru a ajuta organizațiile să identifice problemele și oportunitățile potrivite, contribuind în același timp la formarea unei imagini clare a comportamentului și nevoilor clienților și a clienților, a performanței angajaților și a produsului și a potențialelor probleme viitoare.

Știința datelor poate ajuta companiile:

  • Luați decizii mai bune
  • Aflați mai multe despre clienți și clienți
  • Valorificați tendințele
  • Anticipează viitorul

Cum poate știința datelor să îmbunătățească valoarea pentru o companie?

Știința datelor este o investiție din ce în ce mai populară pentru companii, deoarece potențialul rentabilitate a investiției în deblocarea valorii datelor mari este uriaș. Știința datelor este o investiție demnă, deoarece:

    Îndepărtează presupunerile și oferă informații utile.Companiile iau decizii mai bune, bazate pe date și dovezi cuantificabile.Companiile înțeleg mai bine locul lor pe piață.Știința datelor va ajuta companiile să analizeze concurența, să exploreze exemple istorice și să facă recomandări bazate pe cifre.Poate fi folosit pentru a identifica talentele de top.În big data se ascund o mulțime de informații despre productivitate, eficiența angajaților și performanța generală. Datele pot fi folosite și pentru recrutarea și formarea talentelor.Veți afla totul despre publicul țintă, client sau consumator.Toată lumea generează și colectează date acum, iar companiile care nu investesc în mod corespunzător în știința datelor pur și simplu colectează mai multe date decât știu cu ce să facă. Perspectivele despre comportamentul, prioritățile și preferințele clienților sau clienții din trecut sau potențiali sunt neprețuite și pur și simplu așteaptă ca un Data Scientist calificat să le descopere.

Salariile pentru cercetătorii de date

În timp ce salariile pentru Data Scientists variază foarte mult în funcție de regiune și industrie, salariul mediu pentru un Data Scientist din S.U.A. este raportat ca fiind între 96.000 USD și 113.000 USD, în funcție de sursă. Un Data Scientist senior poate aduce în medie aproximativ 130.000 USD.

Cererea de oameni de știință ai datelor

Oamenii de știință de date au o cerere mare și o ofertă redusă în aproape toate industriile. Un raport al Deloitte Access Economics a constatat că 76% dintre companii plănuiau să mărească cheltuielile în următorii ani pentru capabilitățile de analiză a datelor, în timp ce IBM a prezis o creștere cu 28% a cererii pentru știința datelor la începutul deceniului.

Biroul de Statistică a Muncii din SUA a estimat o creștere de 31% a științei datelor în următorii 10 ani. Între timp, un raport privind piețele și piețele a constatat că piața globală a datelor mari se preconizează că va crește la 229,4 miliarde de dolari până în 2025, platforma de știință a datelor crescând cu 30% până în 2024.

Peste tot în lume, se pare, investițiile în știința datelor sunt de așteptat să crească și, odată cu aceasta, cererea de Data Scientists.

Ce instrumente folosesc oamenii de știință ai datelor?

Oamenii de știință de date folosesc o varietate de instrumente și programe diferite pentru activități, inclusiv analiza datelor, curățarea datelor și crearea de vizualizări.

Python este limbajul de programare de top pentru cercetătorii de date intervievați în cadrul Sondajului BrainStation Digital Skills. Un limbaj de programare de uz general, Python este util pentru aplicațiile de procesare a limbii naționale și analiza datelor. R este adesea folosit pentru analiza datelor și extragerea datelor. Pentru o strângere de numere mai grea, instrumentele bazate pe Hadoop precum Hive sunt populare. Pentru învățarea automată, cercetătorii de date pot alege dintr-o gamă largă de instrumente, inclusiv h2o.ai, TensorFlow, Apache Mahout și Accord.Net. Instrumentele de vizualizare sunt, de asemenea, o parte importantă din arsenalul unui Data Scientist. Programe precum Tableau, PowerBI, Bokeh, Plotly și Infogram îi ajută pe Data Scientists să creeze diagrame atractive din punct de vedere vizual, hărți termice, grafice, diagrame de dispersie și multe altele.

Oamenii de știință ar trebui, de asemenea, să fie extrem de confortabili atât cu SQL (utilizat pe o gamă largă de platforme, inclusiv MySQL, Microsoft SQL și Oracle), cât și cu programele de foi de calcul (de obicei Excel).

De ce abilități au nevoie oamenii de știință ai datelor?

Există o serie de abilități pe care toți cei care aspiră la știința datelor ar trebui să le dezvolte, inclusiv:

    Excela.Cel mai folosit instrument de 66% dintre profesioniștii în domeniul datelor intervievați în cadrul BrainStation Digital Skills Survey, Excel este încă crucial pentru oamenii de știință în domeniul datelor.SQL.Acest limbaj de interogare este indispensabil în gestionarea bazelor de date și este folosit de aproximativ jumătate dintre respondenții datelor.Programare statistică.Python și R sunt utilizate în mod obișnuit de oamenii de știință în date pentru a rula teste, a crea modele și a efectua analize de seturi mari de date.Vizualizarea datelor.Instrumente precum Tableau, Plotly, Bokeh, PowerBl și Matplotlib îi ajută pe Data Scientists să creeze reprezentări vizuale convingătoare și accesibile ale descoperirilor lor.

Trasee de carieră pentru Data Scientist

Fiind o profesie relativ nouă, cariera de Data Scientist nu este scrisă în piatră, iar mulți oameni își găsesc drumul către știința datelor din medii în informatică, IT, matematică și afaceri. Dar cele patru axe principale pentru cariera unui Data Scientist sunt, în general, datele, inginerie, afaceri și produse. Multe roluri multidisciplinare în știința datelor necesită stăpânirea mai multor sau a tuturor acestor domenii.

Oamenii care lucrează în știința datelor sunt chiar în fruntea schimbărilor tehnologice care vor avea cel mai mare impact asupra viitorului. Deoarece știința datelor poate contribui la progrese în aproape orice alt domeniu, oamenii de știință în domeniul datelor sunt în măsură să continue cercetări în orice, de la finanțe și comerț la statistici actuariale, energie verde, epidemiologie, medicină și produse farmaceutice, telecomunicații - lista este practic nesfârșită. Fiecare industrie face trafic cu propriile sale tipuri diferite de date, utilizându-le în moduri diferite pentru a atinge diferite obiective. Oriunde s-ar întâmpla asta, oamenii de știință în date pot ghida luarea deciziilor mai bune, fie că este vorba despre dezvoltarea de produse, analiza pieței, managementul relațiilor cu clienții, resursele umane sau cu totul altceva.

Nu numai că aplicațiile pentru știința datelor sunt largi, atingând multe sectoare diferite, dar există și diferite tipuri de știință a datelor. Ceea ce au în comun toate aceste activități este că toate încearcă să transforme datele în cunoștințe. Mai precis, oamenii de știință din date folosesc o abordare metodică pentru a organiza și analiza datele brute pentru a identifica tipare din care pot fi identificate sau deduse informații utile.

Având în vedere amploarea impactului lor, nu este de mirare că Data Scientists ocupă poziții foarte influente și foarte solicitate. Deși drumul pentru a deveni un Data Scientist poate fi solicitant, acum există mai multe resurse ca niciodată pentru aspiranții Data Scientist și mai multe oportunități pentru ei de a-și construi genul de carieră pe care și-l doresc.

Dar pentru toate modurile în care oamenii de știință de date pot contribui la diferite industrii și pentru toate căile de carieră diferite pe care un om de știință de date le poate urma, tipurile de muncă pe care le fac pot fi împărțite în câteva categorii principale. Nu toată știința datelor se încadrează perfect în aceste grupuri, în special în fruntea științei informaticii, unde noi terenuri sunt în mod continuu deschise – dar vă vor oferi o idee despre modurile în care oamenii de știință din date transformă datele în perspectivă.

Statistici

În centrul științei datelor, statistica este domeniul matematicii care descrie diferitele caracteristici ale unui set de date, fie că este vorba de numere, cuvinte, imagini sau alte tipuri de informații măsurabile. O mare parte din statistici se concentrează pe simpla identificare și descriere a ceea ce este acolo - în special în cazul seturilor de date foarte mari, doar a ști ce include și ce nu include informațiile este o sarcină în sine. În domeniul științei datelor, aceasta este adesea numită analiză descriptivă. Dar statisticile pot merge și mai departe, testând pentru a vedea dacă ipotezele tale despre ceea ce se află în date sunt corecte sau, dacă sunt corecte, dacă sunt semnificative sau utile. Acest lucru poate implica nu doar examinarea datelor, ci și manipularea acestora pentru a-și evidenția caracteristicile principale. Există multe moduri diferite de a face acest lucru – regresie liniară, regresie logistică și analiză discriminantă, metode diferite de eșantionare și așa mai departe – dar, în cele din urmă, fiecare dintre aceste tehnici este despre înțelegerea caracteristicilor unui set de date și cât de precise sunt aceste caracteristici. reflectă un adevăr semnificativ despre lumea căreia îi corespund.

Analiza datelor

Deși este construită pe baza statisticilor, analiza datelor merge puțin mai departe, în ceea ce privește înțelegerea cauzalității, vizualizarea și comunicarea constatărilor altora. Dacă statistica își propune să definească ce și când a unui set de date, analiza datelor încearcă să identifice de ce și cum. Analiștii de date fac acest lucru prin curățarea datelor, rezumandu-le, transformându-le, modelându-le și testându-le. După cum am menționat mai sus, această analiză nu se limitează doar la numere. În timp ce multe analize de date utilizează date numerice, este posibil să se efectueze analize și pe alte tipuri de date - feedback scris al clienților, de exemplu, sau postări pe rețelele sociale, sau chiar imagini, audio și video.

Unul dintre obiectivele principale ale analiștilor de date este de a înțelege cauzalitatea, care poate fi apoi utilizată pentru a înțelege și a prezice tendințele într-o gamă largă de aplicații. În analiza de diagnosticare, analiștii de date caută corelații care sugerează o cauză și un efect, care pot fi utilizate, la rândul lor, pentru a ajuta la modificarea rezultatelor. Analiza predictivă caută în mod similar modele, dar apoi le extinde și mai mult, extrapolând traiectoriile lor dincolo de datele cunoscute pentru a ajuta la prezicerea modului în care s-ar putea desfășura evenimentele nemăsurate sau ipotetice – inclusiv evenimentele viitoare. Cele mai avansate forme de analiză a datelor au scopul de a oferi îndrumări privind deciziile specifice prin modelarea și prezicerea rezultatelor diferitelor alegeri pentru a identifica cel mai potrivit curs de acțiune.

Inteligența artificială și învățarea automată

Unul dintre marile progrese care au loc în prezent în știința datelor – și unul care este gata să exercite o influență enormă în viitor – este inteligența artificială și, mai precis, învățarea automată. Pe scurt, învățarea automată implică antrenarea unui computer pentru a îndeplini sarcini pe care le-am considera de obicei că necesită o anumită formă de inteligență sau judecată, cum ar fi capacitatea de a identifica obiectele dintr-o fotografie. Acest lucru se realizează de obicei prin furnizarea de exemple copioase ale tipului de determinare pe care o antrenați rețeaua. După cum v-ați imagina, acest lucru necesită atât o mulțime de date (de obicei structurate), cât și capacitatea de a face ca un computer să dea sens acestor date. Abilități puternice de statistică și abilități de programare sunt obligatorii.

Efectele benefice ale învățării automate sunt practic nelimitate, dar în primul rând este capacitatea de a efectua sarcini complicate sau prelungite mai rapid decât ar putea orice om, cum ar fi identificarea unei anumite amprente dintr-un depozit de milioane de imagini sau referințe încrucișate. zeci de variabile în mii de dosare medicale pentru a identifica asociații care ar putea oferi indicii despre cauzele bolii. Cu suficiente date, experții în învățarea automată pot chiar antrena rețele neuronale pentru a produce imagini originale, pot extrage informații semnificative din corpuri masive de texte scrise, pot face predicții despre tendințele viitoare de cheltuieli sau alte evenimente de pe piață și pot aloca resurse care depind de distribuția extrem de complexă, cum ar fi energia. , cu eficienta maxima. Avantajul utilizării învățării automate pentru a îndeplini aceste sarcini, spre deosebire de alte forme de automatizare, este că un I.A. nesupravegheat. sistemul poate învăța și îmbunătăți automat în timp – chiar și fără o nouă programare.

Business intelligence

După cum probabil ați ghicit din referirea anterioară la evenimentele de pe piață, lumea afacerilor și a finanțelor este unul dintre locurile în care învățarea automată a avut unul dintre cele mai timpurii și profunde efecte. Datorită cantității enorme de date numerice disponibile – baze de date de marketing, anchete, informații bancare, cifre de vânzări și așa mai departe, dintre care majoritatea sunt foarte organizate și relativ ușor de lucrat cu – oamenii de știință în date sunt capabili să utilizeze statistici, analiza datelor și învățarea automată pentru a extrage informații despre nenumărate aspecte ale lumii afacerilor, ghidând luarea deciziilor și optimizând rezultatele, până la punctul în care business intelligence a devenit un domeniu al științei datelor în sine.

Destul de des, dezvoltatorii de Business Intelligence nu se uită pur și simplu la orice date care se întâmplă să fie disponibile pentru a vedea ce pot descoperi; urmăresc în mod proactiv colectarea datelor și dezvoltă tehnici și produse pentru a răspunde la întrebări specifice și a atinge obiective specifice. În acest sens, dezvoltatorii și analiștii de Business Intelligence sunt cruciali pentru dezvoltarea strategică în lumea afacerilor și finanțelor – ajutând conducerea să ia decizii mai bune și să le facă mai rapid, să înțeleagă piața pentru a identifica oportunitățile și provocările unei afaceri și să îmbunătățească eficiența generală a sistemele și operarea unei afaceri, toate cu scopul general de a obține un avantaj competitiv și de a crește profiturile.

Ingineria datelor

Ultimul domeniu major de studiu în care lucrează adesea oamenii de știință în date cuprinde o gamă întreagă de titluri diferite de post – Inginer de date, Arhitect de sisteme, Arhitect de aplicații, Arhitect de date, Arhitect de întreprindere sau Arhitect de infrastructură, pentru a numi doar câteva. Fiecare dintre aceste roluri are propriul set de responsabilități, unii dezvoltă software, alții proiectează sisteme IT, iar alții aliniază structura și procesele interne ale unei companii cu tehnologia pe care o folosește pentru a-și urmări strategiile de afaceri. Ceea ce le leagă pe toate este că oamenii de știință din domeniul datelor care lucrează în acest domeniu aplică tehnologia datelor și a informațiilor pentru a crea sau îmbunătăți sisteme cu o anumită funcție în minte.

Un arhitect de aplicații, de exemplu, observă modul în care o afacere sau o altă întreprindere utilizează soluții tehnologice specifice, apoi proiectează și dezvoltă aplicații (inclusiv software sau infrastructură IT) pentru o performanță îmbunătățită. Un arhitect de date dezvoltă în mod similar aplicații – în acest caz, soluții pentru stocarea, administrarea și analiza datelor. Un arhitect de infrastructură poate dezvolta soluțiile globale pe care o companie le folosește pentru a desfășura activități zilnice pentru a se asigura că aceste soluții îndeplinesc cerințele de sistem ale companiei, indiferent dacă este offline sau în cloud. Inginerii de date, la rândul lor, se concentrează pe procesarea datelor, conceperea și implementarea conductelor de date care colectează, organizează, stochează, recuperează și procesează datele unei organizații. Cu alte cuvinte, caracteristica definitorie a acestei categorii largi de știința datelor este că implică proiectarea și construirea de lucruri: sistemele, structurile și procesele prin care se realizează știința datelor.

Care sunt cele mai solicitate locuri de muncă în domeniul științei datelor?

Știința datelor în general este o abilitate foarte solicitată, așa că există o mulțime de oportunități de găsit în fiecare domeniu și specialitate a domeniului. De fapt, în 2019, LinkedIn a enumerat Data Scientist drept cel mai promițător job al anului, iar QuantHub a prezis o lipsă acută de Data Scientists calificați în anul următor.

Cuvântul cheie aici este calificat. Adesea, cerințele tehnice pe care trebuie să le îndeplinească un Data Scientist sunt atât de specifice încât poate dura câțiva ani de experiență de lucru în industrie pentru a construi gama necesară de competențe, începând ca generalist, apoi adăugând încet din ce în ce mai multe aptitudini și abilități la setul lor de aptitudini.

Acestea sunt doar câteva dintre cele mai comune moduri în care oamenii de știință în domeniul datelor pot face asta – există tot atâtea căi de carieră potențiale câte oameni de știință în date, dar, în fiecare caz, avansarea în carieră depinde de dobândirea de noi abilități și experiență în timp.

Analist de date

După cum sugerează și numele, analiștii de date analizează datele – dar acest titlu scurt surprinde doar o mică parte din ceea ce analiștii de date pot realiza de fapt. În primul rând, datele încep rareori într-o formă ușor de utilizat și, de obicei, analiștii de date sunt responsabili pentru identificarea tipului de date necesare, culegerea și asamblarea acestora, apoi curățarea și organizarea lor - transformându-le într-o formă mai mare. formă utilizabilă, determinând ce conține de fapt setul de date, eliminând datele corupte și evaluând acuratețea acestora. Apoi este analiza în sine – folosind diferite tehnici pentru a examina și modela datele, a căuta modele, a extrage semnificația din acele modele și a le extrapola sau modela. În cele din urmă, analiștii de date își pun informațiile la dispoziția celorlalți prezentând datele într-un tablou de bord sau într-o bază de date pe care alți oameni o pot accesa și comunicând constatările lor altora prin prezentări, documente scrise și diagrame, grafice și alte vizualizări.

Cariera de analist de date

Data Analyst este un excelent punct de intrare în lumea Data Science; poate fi un post entry-level, în funcție de nivelul de expertiză cerut. Noii analiști de date intră de obicei în domeniu imediat după școală - cu o diplomă în statistică, matematică, informatică sau similare - sau tranzitează la analiza datelor dintr-un domeniu conex, cum ar fi afaceri, economie sau chiar științe sociale, de obicei prin îmbunătățirea lor. abilități la mijlocul carierei printr-un bootcamp de analiză a datelor sau un program de certificare similar.

Dar, indiferent dacă sunt absolvenți recenti sau profesioniști experimentați care fac o schimbare la jumătatea carierei, noii Data Scientist încep de obicei prin a îndeplini sarcini de rutină, cum ar fi achiziționarea și manipularea datelor cu un limbaj precum R sau SQL, construirea bazelor de date, efectuarea de analize de bază și generarea de date. vizualizări folosind programe precum Tableau. Nu orice analist de date va trebui să știe cum să facă toate aceste lucruri – poate exista specializare, chiar și într-o poziție junior – dar ar trebui să poți îndeplini toate aceste sarcini dacă speri să progresezi în carieră. Flexibilitatea este un mare avantaj în această etapă incipientă.

Modul în care avansați ca analist de date depinde într-o oarecare măsură de industria în care lucrați – marketing, de exemplu, sau finanțe. În funcție de sector și de tipul de lucru pe care îl desfășurați, puteți alege să vă specializați în programare în Python sau R, să deveniți un profesionist în curățarea datelor sau să vă concentrați numai pe construirea de modele statistice complexe sau pe generarea de imagini frumoase; pe de altă parte, puteți alege, de asemenea, să învățați puțin din toate, determinându-vă să ocupați o poziție de conducere pe măsură ce luați titlul de Senior Data Analyst. Cu o experiență destul de largă și profundă, un analist senior de date este gata să preia un rol de conducere, supraveghend o echipă de alți analiști de date, devenind în cele din urmă un director de departament sau un director. Cu pregătire suplimentară de competențe, analiștii de date sunt, de asemenea, într-o poziție puternică pentru a trece la poziția mai avansată de Data Scientist.

Data Scientist

Oamenii de știință de date pot face în mod obișnuit toate lucrurile pe care le pot face analiștii de date, plus câteva lucruri în plus – de fapt, cu pregătirea și experiența potrivite, un analist de date poate avansa în cele din urmă la poziția de științific de date. Deci, da, oamenii de știință ar trebui să poată achiziționa, curăța, manipula, stoca și analiza date, dar și să înțeleagă și să lucreze cu diferite metode de învățare automată și să poată programa în Python, R sau un limbaj de programare statistic similar pentru construiți și evaluați modele mai avansate.

Cariera de Data Scientist

Mulți oameni intră în domeniu ca analiști de date înainte de a dobândi experiența și abilitățile suplimentare necesare pentru a se numi Data Scientists. Apoi, de la Junior Data Scientist, următorul pas este de obicei Senior Data Scientist – deși acea simplă schimbare a titlului contravine muncii necesare pentru a face acea tranziție; un Data Scientist senior va avea o înțelegere superioară a practic tuturor aspectelor științei datelor – IA, depozitarea datelor, datamining, cloud computing și așa mai departe – în plus față de familiaritatea cu un domeniu specific industriei, cum ar fi strategia de afaceri sau analiza sănătății , sau se vor specializa într-una dintre aceste domenii cu expertiză la nivel de guru.

Merită menționat faptul că, în timp ce unii cercetători ai datelor își încep cariera în analiză și își fac drumul către poziții mai înalte în domenii specializate, cum ar fi psihologie, marketing, economie și așa mai departe, alții încep ca profesioniști într-unul dintre acele domenii diferite înainte de a trece la date. rolul științei.

Pentru mulți, Senior Data Scientist este obiectivul final al carierei; acesta este deja un rol atât de avansat încât, cel puțin în domeniul științei datelor, este adesea cea mai înaltă poziție care poate fi atinsă - pur și simplu deveniți un Data Scientist senior mai bun, mai capabil, cu domenii mai mari de specializare. Pentru unii, totuși, în special cei care adoptă o abordare mai generalistă, este posibil să facă progrese suplimentare într-o poziție managerială precum Lead Data Scientist, conducerea unei echipe sau departament, sau chiar Chief Data Officer, conducând strategia de date a unei instituții la cel mai înalt nivel. și răspunzând doar CEO-ului.

Inginer de date

Ceea ce distinge inginerii de date de alți profesioniști care lucrează în domeniul datelor este faptul că ei proiectează și construiesc sisteme întregi, inclusiv infrastructura și procesele pe care compania le folosește pentru a profita la maximum de acele date. Adică, inginerii de date sunt oamenii care determină modurile în care alți cercetători de date își pot face treaba. Ce forme de date poate găzdui sistemul companiei? Ce metode sunt folosite pentru a colecta date din vânzări și marketing, sau rezultatele unui sondaj de asistență medicală și pentru a le pune la dispoziție pentru analiză? Pentru a face acest lucru, inginerii de date trebuie să fie foarte familiarizați cu tipurile de muncă pe care le fac alți profesioniști în știința datelor – administratori de baze de date, analiști de date, arhitecți de date și așa mai departe – până la punctul în care inginerii de date pot îndeplini adesea fiecare dintre aceste roluri ca bine. Dar, pentru că sunt constructori, inginerii de date petrec de obicei mai mult timp lucrând la dezvoltare decât alți profesioniști în știința datelor - scriind programe software, construind baze de date relaționale sau dezvoltă instrumente care permit companiilor să partajeze date între departamente.

Cariera de inginer de date

Ca și alte locuri de muncă care lucrează în domeniul datelor, primul pas pentru a deveni inginer de date este adesea o diplomă universitară (de obicei, o licență sau un master în inginerie, informatică sau matematică) - dar nu întotdeauna. Cineva cu multă experiență de lucru în IT sau în dezvoltarea de software poate descoperi că are deja toate abilitățile necesare pentru a deveni inginer de date, cu excepția abilităților de date în sine, caz în care unele abilități de recalificare, cum ar fi un bootcamp de date, le pot ajuta să le aducă. pana la viteza. Multe dintre abilitățile necesare unui inginer de date (cum ar fi SQL, UNIX și Linux, dezvoltarea ETL sau configurarea sistemelor IT) pot fi dezvoltate lucrând într-un domeniu adiacent; altele (cum ar fi învățarea automată sau construirea conductelor de date) vor necesita o învățare mai concentrată.

Acestea fiind spuse, majoritatea inginerilor de date își încep cariera lucrând într-un subdomeniu al informaticii înainte de a dobândi toate abilitățile necesare pentru a deveni un inginer de date junior – într-adevăr, majoritatea postărilor de locuri de muncă pentru ingineri de date junior necesită între unu și cinci ani de experiență de lucru. De acolo, următorul pas logic este inginer senior de date și inginer principal de date. Dar, având în vedere atât de multe aspecte ale IT, ingineria software și știința datelor, există o mulțime de alte poziții deschise și pentru inginerii de date - inclusiv Data Architect, Solutions Architect sau Applications Architect. Pentru cineva care dorește să facă mai puțină muncă practică și mai mult management al angajaților, alte opțiuni includ Managerul de dezvoltare a produselor – sau, în cele din urmă, având în vedere abilitățile potrivite ale oamenilor, chiar și Chief Data Officer sau Chief Information Officer.

Pot oamenii de știință să lucreze de acasă?

La fel ca multe locuri de muncă din domeniul tehnologiei, rolurile de Data Scientist pot fi adesea îndeplinite de la distanță, dar acest lucru depinde în cele din urmă de compania pentru care lucrați și de tipul de muncă pe care o faceți.

Când pot oamenii de știință să lucreze de la distanță?

Pozițiile în domeniul științei datelor care lucrează cu date și informații extrem de sensibile sau confidențiale (care includ un număr mare dintre acestea, chiar și în afara domeniilor grele de confidențialitate, cum ar fi bancare și asistență medicală, deoarece datele de proprietate pot fi unul dintre cele mai valoroase active ale unei companii mari) vor găsi că se confruntă cu mult mai multe restricții în ceea ce privește munca la distanță. În aceste cazuri, este posibil să vi se solicite să lucrați la birou în timpul programului de lucru.

Alți factori de luat în considerare:

  • Cât de tradițională este compania dvs. Companiile mai mari și mai vechi nu sunt de obicei la fel de prietenoase cu distanța – deși este posibil ca COVID-ul să fi adus schimbări majore în acest domeniu.
  • Cât de ușor poți lucra cu alți colegi de echipă și departamente de la distanță. Dacă munca dvs. este foarte colaborativă, este mai probabil să vi se solicite să vă prezentați personal.
  • Oamenii de știință de date care lucrează pe bază de contract – sau chiar pe bază de consultanță – pot avea, de asemenea, mai multă flexibilitate pentru a-și alege propria locație.

Kategori: Știri