R-ohjelmointi: Aloita tilastollinen ohjelmointi

Disclosure: Tukisi auttaa pitämään sivuston toiminnassa! Ansaitsemme lähetysmaksun joistakin tämän sivun suosittelemista palveluista.


R on ohjelmointikieli ja kehitysympäristö, jota käytetään tilastolliseen analyysiin ja julkaisulaatuisten datavisuaalien luomiseen. R on täysin ilmainen, avoimen lähdekoodin osa GNU-projektia, ja sitä tukee R tilastollisen laskennan säätiö.

Mistä R tuli?

R: n suunnitteli ensimmäisen kerran vuonna 1992 kaksi Uuden-Seelannin Aucklandin yliopiston professoria: Ross Ihaka ja Robert Gentleman. Aivan ensimmäinen kielen versio julkaistiin vuonna 1994. Kuitenkin kuluu vielä kuusi vuotta ennen kuin vakaa R-version beetaversio saatettiin yleisön saataville helmikuussa 2000..

R on S-ohjelmointikielen toteutus, jonka John Chambers ja muut kehittivät 1970-luvulla alun perin kunniallisessa Bell -laboratoriossa. R ja S-PLUS, TIBCOn omistama kieli, ovat S-ohjelmointikielen kaksi nykyaikaista toteutusta..

Nykyään R on suosituin tilastollisen analyysin ohjelmointikieli, ja sitä käyttävät teollisuuden jättiläiset, kuten Facebook ja Google. Mielenkiintoista on, että S: n alkuperäinen luoja John Chambers on nyt osa R Development Core Teamia, jonka tehtävänä on jatkaa R: n kehittämistä. Tämä tarkoittaa, että R on S-ohjelmointikielen henkinen jatko, vaikka se ei olisi suoraa jälkeläinen.

Mikä on R käytetään tänään?

Noin puolet kaikista tietotieteilijöistä käyttää R: tä tiedon louhintaan ja tilastollisiin analyyseihin – se on valittu ohjelmointikieli melko sumuisella ”big data” -alalla, josta kuulet jatkuvasti. R sisältää sisäänrakennetut toiminnot ja muuttujat, jotka on suunniteltu helpottamaan tilastollista analysointia, ja se tarjoaa myös graafisen sukupolven työkaluja, jotka tuottavat julkaisulaatuisia tietojen visualisointeja.

R on erittäin laajennettavissa, ja monia paketteja on olemassa tiettyjen tietojen analysointitehtävien ja ongelmien ratkaisemiseksi. Se on osa suosionsa ansiota avoimen lähdekoodin tilasta, mikä tarkoittaa, että kuka tahansa voi käyttää R: tä ja käyttää maailmanlaatuisia tilastollisia analyysityökaluja.

R on suunniteltu toimimaan käytännössä missä tahansa ympäristössä, ja sitä voidaan käyttää järjestelmissä, joissa on Unix-, Linux-, Windows- tai Mac OS -käyttöjärjestelmä.

GU: t R: lle

Vakio R: tä käytetään komentorivillä. Käyttäjät, jotka haluavat helppokäyttöisen graafisen käyttöliittymän (GUI), ovat kuitenkin onnekkaita. R: lle on saatavana monia graafisia käyttöliittymiä, joista osa on ilmaista ja avointa lähdekoodia.

Jos haluat lisätietoja R GUI -sovelluksista, tässä on kuusi suosituinta vaihtoehtoa:

  • RStudio avoimen lähdekoodin versio
  • Helistin
  • Deducer
  • RKWard
  • JGR (lausutaan “Jaguar” ja tarkoittaa “Java Gui varten R”)
  • R komentaja

Ohjelmointi tyylillä

Ohjelmointi on melko vapaamuotoinen väline. Useimmissa ohjelmointikielissä rivinvaihdot ja sisennykset ovat täysin valinnaisia, ja koodia tulkitseva kone jättää ne huomioimatta, ja nimeämiskäytäntöjä, joita on noudatettava, on vähän.

Se, että voit kirjoittaa koodin millä tahansa tyylisi avulla, ei kuitenkaan tarkoita, että sinun pitäisi kirjoittaa sitä. Tyyli-koodisi on tärkeä ainakin kolmesta syystä:

  • Huonosti muotoiltua koodia on vaikea lukea ja ymmärtää.
  • Koska huonosti muotoillun koodin laajentaminen on vaikeaa lukea ja ymmärtää, se voi olla turhauttavaa.
  • Lisäksi, jos koodia on vaikea lukea eikä sitä ole muotoiltu selvyyden vuoksi, virheenkorjaus on vaikeampaa kuin on tarpeen.

Tästä syystä se, kuinka muotoilet koodia R: ssä, on tärkeä vain sen suhteen, toimiiko koodi todella vai ei. Oikean jalan aloittamisen helpottamiseksi tässä on kolme tärkeintä tyylisuositusta, joita sinun tulee noudattaa kirjoittaessasi koodia R: ssä:

  • Sisennä koodi: Mikään ei auta koodin selkeyttä enemmän kuin asianmukainen sisennys. R: ssä, et koskaan käytä välilehtiä sisennykseen, vaan käytä sen sijaan neljää tyhjää välilyöntiä jokaiselle sisennystasolle.
  • Käytä selkeitä ja ainutlaatuisia muuttujien ja funktioiden nimiä: Älä koskaan nimeä muuttujaa tai funktiota käyttämällä uudelleen jo käytettyä nimeä, ja tee parhaasi välttääksesi sekalaisia ​​nimiä. Kun debugroit koodikuukautta lähtien tai kun joku muu lukee koodiasi, luomiesi muuttujien ja toimintojen on oltava helppo valita.
  • Käyttää <- eikä =: Tasa-arvoa ei tule käyttää arvon määrittämiseen toiminnolle tai muuttujalle. Yhdistä sen sijaan vähemmän kuin symboli ja viiva (<-) tähän tarkoitukseen. Vaikka nykyaikainen R-järjestelmä hyväksyy yhtälömerkin, sen käyttö on teknisesti virheellinen, ja se toimii vain siksi, että R on mukautettu sopimaan uusien ohjelmoijien huonoihin syntaktisiin käytäntöihin. Tee se oikein. Käyttää <-.

R-tyyli on kiistanalainen aihe, ja tuskin pystymme tekemään siitä oikeudenmukaisuutta parissa sadassa. Vaikka olemme yrittäneet osua kolmeen korkeaan pisteeseen, aiheesta on vielä paljon opittavaa. Jos haluat hallita R-ohjelmointityyliä ja näyttää siltä kuin tiedät mitä teet kirjoittaessasi R: tä, tutustu R-tyyliin: Paul E Johnsonin Rchaeological Commentary (PDF) -lehteen sekä Googlen R Style Guide -oppaaseen..

voimavarat

Vaikka olemme kertoneet teille paljon R-ohjelmoinnista, emme ole opettaneet teille, kuinka ohjelmoida R-ohjelmassa. Emme voi tehdä sitä tällä foorumilla, mutta voimme ohjata sinut hienoimpaan R-ohjelmointikoulutukseen, jonka löydät web. Jos olet oppinut riittävästi R: stä ja olet valmis aloittamaan jonkin koodin kirjoittamisen ja joidenkin numeroiden murskaamisen, tässä on Webin parhaat R-ohjelmointiresurssit.

Oppaat

Verkossa on paljon R-oppaita, joiden avulla voit oppia R-ohjelmointia. Katsomme kuitenkin, että nämä kaksi ovat parasta:

  • R kissoille ja kissan ystäville: Hauska johdanto R: hen, joka ohittaa R-asennuksen, mutta ei edellytä aiempaa ohjelmointikokemusta. Java-kissojen innoittamana, tämä ilmainen opetusohjelma kattaa vain perusasiat. Jos olet aivan uusi tietotekniikan ohjelmointiin, tämä opetusohjelma auttaa sinua saamaan laakerit ennen siirtymistä haastavampaan materiaaliin.
  • Johdanto R: seen: Tämä johdanto on kaikkea muuta kuin kevyt ja yksinkertainen. Älä hyppää tähän opetusohjelmaan ensin terästämättä hermojasi ja asettamatta pitkäaikaista opintosuunnitelmaa. Tätä perusteellista ja perusteellista johdantoa R: hen hallinnoi R Core Team, mikä tarkoittaa, että asiantuntijat kouluttavat sinut työskentelemällä läpi yli 30 000 sanasisältöä. Jos tiedät jo jonkin verran R: tä ja haluat vain siirtyä tiettyihin aiheisiin, tämä opas sisältää myös hyödyllisen hakemiston toiminnoista ja muuttujista sekä käsitehakemiston.

Interaktiiviset oppaat

Jos haluat mieluummin oppia tekemällä, interaktiivinen opetusohjelma saattaa olla juuri etsimäsi asia. Tässä on kolme harkittavissa olevaa vaihtoehtoa:

  • Kokeile R Code Schoolista: Lyhyt interaktiivinen johdanto R-syntaksiin ja perusohjelmointiin R.: n kanssa. Ajattele sitä R: n interaktiivisena versiona kissoille, mutta vähemmän kissanviittauksia.
  • DataCamp Johdatus R: ään: Interaktiivinen perusohje R-ohjelmointiin, joka kattaa laskutoimituksen suorittamisen ja muuttujien käsittelyn sekä esittelee perustiedot.
  • Pyöritä: tämä on itse asiassa R-paketti. Tämä tarkoittaa, että käyt läpi interaktiivisia oppaita, joissa R on asennettu suoraan järjestelmään. Saatavilla on pyörrekursseja, jotka opastavat sinut läpi kaiken asennuksesta alkaen. Lisäksi johdantokurssin ulkopuolella on melko monia lisäkursseja, joiden otsikot ovat esimerkiksi “R-ohjelmointi”, “data-analyysi” ja “regressiomallit”.

Kirjat

Jos todella haluat oppia suorittamaan tilastollisen analyysin R: llä, virallisia oppikirjoja ei voida korvata. Kun otetaan huomioon R: n käyttö teollisuudessa ja yliopistoissa, laadukkaista R-teksteistä ei ole pulaa. Olemme kuitenkin ottaneet aikaa lajitella sotkua ja määritellä viisi suosituinta ja parhaiten arvioitua R-ohjelmointitekstiä, jotka ovat tänään saatavilla:

  • Robert Kabacoffin R toiminnassa (2015): yksi markkinoiden laajimmin tutkituista R-teksteistä, se esittelee R-ohjelmointikielen ja osoittaa R: n käyttöä liiketoimintaongelmien ratkaisemisessa.
  • Zumelin ja Mount: n käytännön tietotiede R: llä (2014): Kuten nimestä voi päätellä, tämä teksti opettaa tilastollisen analyysin teoriaa R: n kanssa, mutta keskittyy teorian käytännön soveltamiseen reaalimaailman ongelmiin. Kirjoittanut pari vaikuttavasti päteviä yksityisen sektorin tietotekijöitä, jos luet vain yhtä tekstiä R: stä, tee siitä tämä.
  • Tilastotietojen löytäminen R: n (2012) avulla, Field, et al: tätä epäkunnioittavaa tekstiä pidetään yleisesti viihdyttävinä johdannaisina tilastollisen analyysin tekemisessä R: n kanssa. Lisäksi teksti tarjoaa vankan teknisen perustan. Jos vihaat oppikirjoja, mutta ymmärrät niiden lukemisen tarpeen, tämä on etsimäsi oppikirja.
  • Norman Matloffin R-ohjelmoinnin Art (2011): Tämä kierros sovelletusta R-ohjelmoinnista vie lukijan reaalimaailman skenaarioiden läpi, joissa R: tä käytetään joka päivä. Soveltuu aloittelijoille ja kokeneille kehittäjille, tämä teksti on suunniteltu venyttämään käsitystäsi siitä, mitä data-analyysi voi tehdä opettaen samalla R-ohjelmointia.
  • Paul Teetorin R-keittokirja (2011): Jos olet enemmän huolissaan tiettyjen ongelmien ratkaisemisesta kuin R-ohjelmointikielen ja tilastollisen analyysin taustalla olevan teorian oppimisesta, tämä O’Reillyn keittokirja auttaa sinua ratkaisemaan ongelmat ja tuottamaan tuloksia nopeasti.

johtopäätös

R on ilmainen ja avoimen lähdekoodin ansiosta kaikilla on pääsy maailmanluokan tilastollisen analyysin työkaluihin. Sitä käytetään laajasti yliopistoissa ja yksityisellä sektorilla, ja se on nykyään suosituin tilastollisen analyysin ohjelmointikieli. R: n oppiminen ei ole helppoa – jos se olisi, datatutkijoilla ei olisi niin suurta kysyntää. Laadukkaista resursseista, joita voit käyttää oppimaan R: tä, ei kuitenkaan ole pulaa, jos olet halukas käyttämään aikaa ja vaivaa.

Lisää lukemista ja resursseja

Meillä on enemmän ohjelmointiin ja tilastoihin liittyviä oppaita, opetusohjelmia ja infografioita:

  • S-PLUS-ohjelmointiresurssit: tavanomainen kaupallinen kieli.
  • SAS-ohjelmoinnin esittely ja resurssit: SAS on data-analyysin markkinajohtaja.
  • Stata-ohjelmointi: Stata on koko kehitysympäristö tietojen analysoimiseksi.

Mitä koodia sinun pitäisi oppia?

Hämmentynyt siitä, mitä ohjelmointikieltä sinun tulisi oppia koodaamaan? Tutustu infografiaan, mitä koodia sinun tulisi oppia? Se ei keskustele vain kielten eri näkökohdista, vaan vastaa myös tärkeisiin kysymyksiin, kuten “Kuinka paljon rahaa teen Java-ohjelmointi elantonsa varten?”

Mitä koodia sinun tulisi oppia?
Mitä koodia sinun pitäisi oppia?

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map