Wolle jo in datawittenskipper wurde? Lear ien fan dizze talen

Fergees yn 'e datawittenskip troch ien fan dizze lukrative talen te learen

Elkenien wol har karriêre yn hege fraach wêze - om't fraach oersetten oan grutte betellingen en gjin tekoart oan wurk. Op dizze dagen is de grutte gegevensromte grutter mei dy soart wurkgelegenheid, as bedriuwen fan alle maatregels moatte sammelje en analysearje fan ynformaasje om akteurs en foarsizzings te dwaan (en resultaten komme).

Dat is krekt wat data wittenskippers dogge: ûntdekke ynformaasje, meitsje ferbiningen, meitsje gegevensfoarstellingen, en helpe bedriuwen effisjint operearje.

En in yngripend begryp fan 'e goede programmearjende talen is essinsjeel foar it ynterpretearjen fan statistiken en wurkje mei databestannen.

Neffens KDnuggets brûke 91% fan gegevenswittenskippen de folgjende fjouwer talen.

Taal 1: R

R is in statistysk-oriïnteare taal dy't populêr is tusken data-miners. It is in iepen boarne, objekt-oriïntearre ymplemintaasje fan S, en is net lestich lyts te learen.

As jo ​​leare hoe't statistyske software ûntwikkelje wol, is R in goede taal te witten. It liedt jo ek de manipulaasje en grafyske data te sjen.

As part fan har programma Data Science Specialization biedt Coursera in klasse op R dy't net allinich jo leart hoe't jo programma yn 'e taal programmearje, mar ek oer hoe't it yn it kontekst fan datawittenskip / analyse tapast wurdt.

Taal 2: SAS

Krekt lykas R, SAS wurdt foaral brûkt foar statistyske analyze. It is in machtich ark foar it ferwurkjen fan de gegevens fan databases en spreadsheets yn lêsbere formaat (lykas HTML en PDF-dokuminten), lykas de mear fisuele tabellen en grafiken.

Oarspronklik ûntwikkele troch akademyske ûndersikers, is it ien fan 'e populêre analytyske ark's wrâldwiid wrâldwiid foar bedriuwen en organisaasjes fan alle soarten. It is mear fan in grutte bedriuwstype fan software en wurdt net typysk brûkt troch lytsere bedriuwen of persoanen dy't har eigen wurkje.

Middels foar it learen fan SAS wurde opnommen yn dit dokumint .

De taal is net iepen-boarne, sadat jo wierskynlik net kinne kinne foar jo fergees te learen.

Taal 3: Python

Hoewol R en SAS binne meastentiids tinke as "de grutte twa" yn 'e analytyske wrâld, hat Python koartlyn in kontraster wurden. Ien fan har wichtichste fertsjinsten is de breed ferskaat fan biblioteken (eg Pandas, NumPy, SciPi, ensfh.) En statistyske funksjes.

Sûnt Python (lykas R) is in iepen-boarne taal, wurde aktualisaasjes rapper tafoege. (Mei oankeapke programma's lykas SAS, moatte jo wachtsje foar de folgjende ferzje útjûn.)

In oare faktor om te praten is dat Python faaks de maklikste te lezen is, troch syn ienfâld en de breed beskikber fan kursussen en boarnen op har. Dizze webside is in geweldich plak om te begjinnen.

Jo kinne ek in folweardere list fine fan Python learmateriaal hjir.

Taal 4: SQL

Oant no ta hawwe wy nei talen besjoen dy't yn deselde famylje binne en (mear of minder) hawwe deselde funksjes. SQL, dy't stiet foar "Struktureare Query Taal", is wêr't dizze wizigingen binne. Dizze taal hat neat te meitsjen mei statistiken; It rjochtet him op it behanneljen fan ynformaasje yn relaasjelike databestannen.

It is de meast brûkte database-taal en is iepen boarne, dus opfolgjende data wittenskippers moatte perfoarst net oersetten.

SQL learen moatte jo meitsje om SQL-databases te meitsjen, de gegevens yn har te behearen en relevante funksjes te brûken. Udemy biedt in opliedingskursus dy't alle basisfoarmen befettet en kin fluch en pynlik ferfolle wurde.

Konklúzje

Mei minimaal moatte jo wierskynlik SQL learje en op syn minst ien fan 'e statistyske talen kieze. Mar as jo de tiid hawwe (en yn 't gefal fan SAS, jild) en wolle jo earlik wêze oan jo merkberens, dan is neat te sizzen dat jo alle fjouwer net leare kinne!

Ryd it net, krij in protte praktiken, hone dyn feardichheden en genietsje fan de beropsfeiligens.