Προγραμματισμός R: Ξεκινήστε με τον Στατιστικό Προγραμματισμό

Αποκάλυψη: Η υποστήριξή σας βοηθά στη διατήρηση της λειτουργίας του ιστότοπου! Κερδίζουμε ένα τέλος παραπομπής για ορισμένες από τις υπηρεσίες που προτείνουμε σε αυτήν τη σελίδα.


Το R είναι μια γλώσσα προγραμματισμού και περιβάλλον ανάπτυξης που χρησιμοποιείται για στατιστική ανάλυση και τη δημιουργία οπτικοποιήσεων δεδομένων ποιότητας δημοσίευσης. Το R είναι εντελώς δωρεάν, ανοιχτού κώδικα, μέρος του έργου GNU και υποστηρίζεται από το R Foundation for Statistics Computing.

Από πού προήλθε το R?

Το R σχεδιάστηκε για πρώτη φορά το 1992 από δύο καθηγητές στο Πανεπιστήμιο του Ώκλαντ στη Νέα Ζηλανδία: τον Ross Ihaka και τον Robert Gentleman. Η πρώτη έκδοση της γλώσσας κυκλοφόρησε το 1994. Ωστόσο, θα ήταν άλλα έξι χρόνια προτού διατεθεί στο κοινό μια σταθερή έκδοση beta του R τον Φεβρουάριο του 2000.

Το R είναι μια εφαρμογή της γλώσσας προγραμματισμού S που αναπτύχθηκε αρχικά τη δεκαετία του 1970 από τον John Chambers και άλλους στα σεβαστά Bell Laboratories. Οι R και S-PLUS, μια ιδιόκτητη γλώσσα που ανήκει στην TIBCO, είναι οι δύο σύγχρονες υλοποιήσεις της γλώσσας προγραμματισμού S.

Σήμερα, το R είναι η πιο δημοφιλής γλώσσα προγραμματισμού στατιστικής ανάλυσης και χρησιμοποιείται από γίγαντες του κλάδου, όπως το Facebook και το Google. Είναι ενδιαφέρον ότι ο αρχικός δημιουργός του S, John Chambers, είναι τώρα μέλος της R Development Core Team, η οποία είναι επιφορτισμένη με τη συνεχή ανάπτυξη του R. Αυτό σημαίνει ότι το R είναι η πνευματική συνέχεια της γλώσσας προγραμματισμού S, ακόμη και αν δεν είναι άμεση απόγονος.

Τι είναι το R που χρησιμοποιείται σήμερα?

Περίπου οι μισοί από τους επιστήμονες δεδομένων χρησιμοποιούν το R για εξόρυξη δεδομένων και στατιστική ανάλυση – είναι η γλώσσα προγραμματισμού της επιλογής στον μάλλον νεφελώδη κλάδο «big data» για το οποίο συνεχίζετε να ακούτε. Το R περιλαμβάνει ενσωματωμένες συναρτήσεις και μεταβλητές που έχουν σχεδιαστεί για να διευκολύνουν τη στατιστική ανάλυση και παρέχει επίσης εργαλεία δημιουργίας γραφικών που παράγουν οπτικοποιήσεις δεδομένων ποιότητας δημοσίευσης.

Το R είναι εξαιρετικά επεκτάσιμο και υπάρχουν πολλά πακέτα για την αντιμετώπιση συγκεκριμένων εργασιών και προβλημάτων ανάλυσης δεδομένων. Οφείλει ένα μέρος της δημοτικότητάς του στην κατάσταση ανοιχτού κώδικα, πράγμα που σημαίνει ότι οποιοσδήποτε μπορεί να χρησιμοποιήσει το R και να έχει πρόσβαση σε εργαλεία στατιστικής ανάλυσης παγκόσμιας ποιότητας.

Το R έχει σχεδιαστεί για να λειτουργεί σχεδόν σε οποιαδήποτε πλατφόρμα και μπορεί να εκτελεστεί σε συστήματα με λειτουργικό σύστημα Unix, Linux, Windows ή Mac OS.

GUI για R

Το πρότυπο R είναι προσβάσιμο μέσω της γραμμής εντολών. Ωστόσο, οι χρήστες που προτιμούν ένα εύχρηστο γραφικό περιβάλλον εργασίας χρήστη (GUI) είναι τυχεροί. Υπάρχουν πολλά GUI διαθέσιμα για R, μερικά από τα οποία είναι δωρεάν και ανοιχτού κώδικα.

Αν θέλετε να μάθετε περισσότερα σχετικά με τα R GUI, ακολουθούν έξι από τις πιο δημοφιλείς επιλογές:

  • Έκδοση RStudio Open Source
  • Κουδουνίστρα
  • Deducer
  • RKWard
  • JGR (προφέρεται “Jaguar” και σημαίνει “Ιava σολui για Ρ“)
  • Διοικητής R

Προγραμματισμός με στυλ

Ο προγραμματισμός είναι ένα μέσο ελεύθερης μορφής. Στην περίπτωση των περισσότερων γλωσσών προγραμματισμού, οι αλλαγές γραμμής και η εσοχή είναι εντελώς προαιρετικές και αγνοούνται από το μηχάνημα που ερμηνεύει τον κώδικα και υπάρχουν λίγες συμβάσεις ονομασίας που πρέπει να ακολουθηθούν.

Ωστόσο, απλώς και μόνο επειδή μπορείτε να γράψετε κώδικα χρησιμοποιώντας οποιοδήποτε στυλ θέλετε, δεν σημαίνει ότι πρέπει. Το πώς διαμορφώνετε τον κώδικα στυλ έχει μεγάλη σημασία για τουλάχιστον τρεις λόγους:

  • Ο κωδικός με κακή εμφάνιση είναι δύσκολο να διαβαστεί και να κατανοηθεί.
  • Επειδή είναι δύσκολο να διαβάσετε και να κατανοήσετε, ο κώδικας με κακές μορφές μπορεί να είναι απογοητευτικός.
  • Επιπλέον, εάν ο κώδικας είναι δύσκολο να διαβαστεί και δεν έχει στυλ για σαφήνεια, τότε θα είναι πιο δύσκολο από ό, τι είναι απαραίτητο να διορθωθεί.

Για αυτόν τον λόγο, ο τρόπος με τον οποίο διαμορφώνετε τον κώδικα στο R είναι δεύτερος σε σημασία μόνο για το εάν ο κώδικας λειτουργεί πραγματικά ή όχι. Για να σας βοηθήσουμε να ξεκινήσετε με το δεξί πόδι, ακολουθούν οι τρεις πρώτες στυλιστικές προτάσεις που πρέπει να ακολουθήσετε κατά τη σύνταξη κώδικα στο R:

  • Εσοχή του κωδικού σας: Τίποτα δεν βοηθά τη σαφήνεια του κώδικα περισσότερο από την σωστή εσοχή. Στο R, δεν χρησιμοποιείτε ποτέ καρτέλες για εσοχή, αλλά αντίθετα, χρησιμοποιείτε τέσσερα κενά διαστήματα για κάθε επίπεδο εσοχής.
  • Χρησιμοποιήστε σαφή και μοναδικά ονόματα μεταβλητών και λειτουργιών: Ποτέ μην ονομάζετε μια μεταβλητή ή μια συνάρτηση επαναχρησιμοποιώντας ένα όνομα που χρησιμοποιείται ήδη και κάντε το καλύτερο δυνατό για να αποφύγετε τη σύγχυση των ονομάτων. Κατά τον εντοπισμό σφαλμάτων κώδικα από μήνες από τώρα ή όταν κάποιος άλλος διαβάζει τον κωδικό σας, θα πρέπει να διαλέξετε εύκολα τις μεταβλητές και τις συναρτήσεις που δημιουργήσατε.
  • Χρήση <- αντί για =: Το σύμβολο ίσου δεν πρέπει να χρησιμοποιείται για την εκχώρηση τιμής σε μια συνάρτηση ή μεταβλητή. Αντ ‘αυτού, συνδυάστε ένα σύμβολο λιγότερο από το σύμβολο και μια παύλα (<-) για το σκοπό αυτό. Ενώ το σύγχρονο σύστημα R θα δεχτεί ένα σύμβολο ίσου, η χρήση του είναι τεχνικά λανθασμένη και λειτουργεί μόνο επειδή το R ήταν προσαρμοσμένο για να ταιριάζει στις κακές συντακτικές πρακτικές των νέων προγραμματιστών. Κάνε το σωστά. Χρήση <-.

Το στυλ R είναι ένα αμφιλεγόμενο θέμα και δύσκολα μπορούμε να το κάνουμε με μερικές εκατοντάδες λέξεις. Ενώ προσπαθήσαμε να κερδίσουμε τρία υψηλά σημεία, υπάρχουν πολλά περισσότερα για να μάθουμε για αυτό το θέμα. Αν θέλετε να κυριαρχήσετε στο στυλ προγραμματισμού R και μοιάζει να γνωρίζετε τι κάνετε όταν γράφετε R, ρίξτε μια ματιά στο R Style: An Rchaeological Commentary (PDF) του Paul E Johnson, καθώς και στον R Style Guide της Google.

Πόροι

Ενώ σας έχουμε πει πολλά για τον προγραμματισμό R, δεν σας έχουμε διδάξει πώς να προγραμματίζετε στο R. Δεν μπορούμε να το κάνουμε σε αυτό το φόρουμ, αλλά μπορούμε να σας κατευθύνουμε στην καλύτερη εκπαίδευση προγραμματισμού R που θα βρείτε στο ιστός. Αν έχετε μάθει αρκετά για το R και είστε έτοιμοι να αρχίσετε να γράφετε κάποιον κώδικα και να κάνετε ορισμένους αριθμούς, εδώ είναι οι καλύτεροι πόροι προγραμματισμού R που έχει να προσφέρει ο ιστός.

Σεμινάρια

Ο ιστός προσφέρει πολλά μαθήματα R που μπορείτε να χρησιμοποιήσετε για να μάθετε τον προγραμματισμό R. Ωστόσο, πιστεύουμε ότι αυτά τα δύο είναι τα καλύτερα:

  • R για Cats and Cat Lovers: Μια διασκεδαστική εισαγωγή στο R που παραλείπει την εγκατάσταση R, αλλά δεν έχει προηγούμενη εμπειρία προγραμματισμού. Εμπνευσμένο από το JavaScript για τις γάτες, αυτός ο δωρεάν οδηγός καλύπτει μόνο τα βασικά. Εάν είστε ολοκαίνουργιος στον προγραμματισμό της επιστήμης δεδομένων, αυτό το σεμινάριο θα σας βοηθήσει να αποκτήσετε τα ρουλεμάν σας πριν προχωρήσετε σε πιο απαιτητικό υλικό.
  • Εισαγωγή στο R: Αυτή η εισαγωγή δεν είναι τίποτα άλλο από ελαφριά και βασική. Μην προχωρήσετε σε αυτό το σεμινάριο χωρίς να ενισχύσετε πρώτα τα νεύρα σας και να ρυθμίσετε ένα μακροπρόθεσμο πρόγραμμα σπουδών. Αυτή η σε βάθος και εμπεριστατωμένη εισαγωγή στο R διαχειρίζεται από την ομάδα R Core Team, που σημαίνει ότι εκπαιδεύεστε από τους ειδικούς καθώς εργάζεστε με περισσότερες από 30.000 λέξεις περιεχομένου. Εάν γνωρίζετε ήδη λίγο R και θέλετε απλά να μεταβείτε σε συγκεκριμένα θέματα, αυτός ο οδηγός περιλαμβάνει επίσης ένα χρήσιμο ευρετήριο λειτουργιών και μεταβλητών, καθώς και ένα ευρετήριο εννοιών.

Διαδραστικά σεμινάρια

Αν προτιμάτε να το κάνετε, ένα διαδραστικό σεμινάριο μπορεί να είναι ακριβώς αυτό που ψάχνετε. Ακολουθούν τρεις επιλογές που πρέπει να λάβετε υπόψη:

  • Δοκιμάστε το R From Code School: Μια σύντομη διαδραστική εισαγωγή στη σύνταξη R και τον βασικό προγραμματισμό με τον R. Σκεφτείτε το ως τη διαδραστική έκδοση του R για γάτες, αλλά με λιγότερες αναφορές γάτας.
  • DataCamp Εισαγωγή στο R: Μια βασική διαδραστική εισαγωγή στον προγραμματισμό R που καλύπτει τον τρόπο εκτέλεσης αριθμητικής και εργασίας με μεταβλητές και εισάγει βασικούς τύπους δεδομένων.
  • Swirl: αυτό είναι στην πραγματικότητα ένα πακέτο R. Αυτό σημαίνει ότι θα ακολουθήσετε διαδραστικούς οδηγούς με το R εγκατεστημένο απευθείας στο σύστημά σας. Υπάρχουν διαθέσιμα μαθήματα στροβιλισμού για να σας καθοδηγήσουν σε όλα, ξεκινώντας από την εγκατάσταση. Επιπλέον, υπάρχουν αρκετά επιπλέον μαθήματα πέρα ​​από το εισαγωγικό μάθημα με τίτλους όπως “R Programming”, “Data Analysis” και “Regression Models.”

Βιβλία

Εάν θέλετε πραγματικά να μάθετε πώς να εκτελείτε στατιστική ανάλυση με το R, δεν υπάρχει υποκατάστατο για επίσημα εγχειρίδια. Λαμβάνοντας υπόψη τη χρήση του R στη βιομηχανία και στον ακαδημαϊκό χώρο, δεν υπάρχει έλλειψη ποιοτικών κειμένων R. Ωστόσο, έχουμε αφιερώσει χρόνο για να ταξινομήσουμε την ακαταστασία και να εντοπίσουμε πέντε από τα πιο προτεινόμενα και με υψηλότερη βαθμολογία κείμενα προγραμματισμού R που είναι διαθέσιμα σήμερα:

  • R in Action (2015) του Robert Kabacoff: ένα από τα πιο διαδεδομένα κείμενα R στην αγορά, παρουσιάζει τη γλώσσα προγραμματισμού R και αποδεικνύει τη χρήση του R για την επίλυση επιχειρηματικών προβλημάτων.
  • Practical Data Science with R (2014) by Zumel and Mount: όπως υποδηλώνει το όνομα, αυτό το κείμενο διδάσκει τη θεωρία της στατιστικής ανάλυσης με τον R, αλλά εστιάζει στην πρακτική εφαρμογή της θεωρίας σε πραγματικά προβλήματα. Γράφτηκε από ένα ζευγάρι επιστημόνων δεδομένων ιδιωτικού τομέα με εντυπωσιακά προσόντα, αν διαβάσετε μόνο ένα κείμενο στο R, κάντε το αυτό.
  • Ανακαλύπτοντας στατιστικά χρησιμοποιώντας το R (2012) από τους Field, et al: αυτό το ασεβές κείμενο θεωρείται παγκοσμίως ως η πιο διασκεδαστική εισαγωγή στη στατιστική ανάλυση με τον R. Επιπλέον, το κείμενο παρέχει μια σταθερή τεχνική βάση. Εάν μισείτε τα βιβλία αλλά καταλαβαίνετε την ανάγκη να το διαβάσετε, αυτό είναι το βιβλίο που αναζητάτε.
  • The Art of R Programming (2011) του Norman Matloff: αυτή η περιοδεία του εφαρμοσμένου προγραμματισμού R καθοδηγεί τον αναγνώστη σε πραγματικά σενάρια όπου το R χρησιμοποιείται καθημερινά. Κατάλληλο για αρχάριους και έμπειρους προγραμματιστές, αυτό το κείμενο έχει σχεδιαστεί για να διευρύνει την αντίληψή σας για το τι μπορεί να κάνει η ανάλυση δεδομένων, ενώ ταυτόχρονα διδάσκει βασικό προγραμματισμό R.
  • R Cookbook (2011) του Paul Teetor: αν ενδιαφέρεστε περισσότερο για την επίλυση συγκεκριμένων προβλημάτων από το να μάθετε τη θεωρία πίσω από τη γλώσσα προγραμματισμού R και τη στατιστική ανάλυση, αυτό το βιβλίο μαγειρικής από το O’Reilly θα σας βοηθήσει να λύσετε προβλήματα και να παράγετε γρήγορα αποτελέσματα.

συμπέρασμα

Το R είναι δωρεάν και ανοιχτού κώδικα, επιτρέποντας σε οποιονδήποτε να έχει πρόσβαση σε εργαλεία στατιστικής ανάλυσης παγκόσμιας κλάσης. Χρησιμοποιείται ευρέως στον ακαδημαϊκό και τον ιδιωτικό τομέα και είναι η πιο δημοφιλής γλώσσα προγραμματισμού στατιστικής ανάλυσης σήμερα. Η εκμάθηση του R δεν είναι εύκολη – αν ήταν, οι επιστήμονες δεδομένων δεν θα είχαν τόσο μεγάλη ζήτηση. Ωστόσο, δεν υπάρχει έλλειψη ποιοτικών πόρων που μπορείτε να χρησιμοποιήσετε για να μάθετε R εάν είστε πρόθυμοι να αφιερώσετε χρόνο και προσπάθεια.

Περαιτέρω ανάγνωση και πόροι

Έχουμε περισσότερους οδηγούς, σεμινάρια και γραφήματα που σχετίζονται με τον προγραμματισμό και τα στατιστικά στοιχεία:

  • Πόροι προγραμματισμού S-PLUS: η τυπική εμπορική γλώσσα.
  • SAS Προγραμματισμός Εισαγωγή και Πόροι: Η SAS είναι ο ηγέτης της αγοράς στην ανάλυση δεδομένων.
  • Προγραμματισμός Stata: Το Stata είναι ένα ολόκληρο περιβάλλον ανάπτυξης για την ανάλυση δεδομένων.

Τι κώδικα πρέπει να μάθετε?

Μπερδεμένοι με ποια γλώσσα προγραμματισμού πρέπει να μάθετε να κωδικοποιείτε; Ρίξτε μια ματιά στο infographic μας, τι κώδικα πρέπει να μάθετε; Δεν συζητά μόνο διαφορετικές πτυχές των γλωσσών, αλλά απαντά σε σημαντικές ερωτήσεις όπως, “Πόσα χρήματα θα κάνω προγραμματισμό Java για τα προς το ζην;”

Τι κώδικα πρέπει να μάθετε;
Τι κώδικα πρέπει να μάθετε?

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map