R nedir? - İstatistiksel
Hesaplamanın Gücüne Giriş
R, verileri ve daha
fazlasını işlemek için benzersiz bir donanıma sahip bir istatistiksel
programlama aracıdır.
Çok miktarda
bilgiyi bir araya getirmek ve yayına hazır grafikler ve görselleştirmeler üretmek
R ile kolaydır. Her türlü veri analizi, madencilik ve modelleme görevi de
öyle.
İlk olarak
istatistikçiler tarafından istatistiksel amaçlarla tasarlandığı için R, günümüz
dünyasında önemli bir alan olan veri bilimine son derece uygundur.
R'nin temel
işlevi istatistiksel analiz ve grafikler olsa da kullanımı bunların ötesine
geçerek yapay zeka, makine öğrenimi, finansal analiz ve daha fazlasını da
kapsar.
Sürekli olarak
dünyanın en popüler programlama dillerinden biri olarak sıralanan ve yüksek
maaşlar gerektiren bir dil olan R, 1990'ların başından beri ortalıkta ve hala
güçlü bir şekilde varlığını sürdürüyor.
R nedir?
R istatistiksel bir hesaplama ve grafik
sistemidir. Bu sistem iki bölümden oluşur: R dilinin kendisi (çoğu insanın R
hakkında konuşurken kastettiği budur) ve çalışma zamanı ortamı.
R, yorumlanan bir dildir; bu,
kullanıcıların R'nin işlevlerine bir komut satırı yorumlayıcısı aracılığıyla
eriştiği anlamına gelir.
Python ve Java gibi dillerin aksine R,
genel amaçlı bir programlama dili değildir. Bunun yerine, alana özgü bir dil
(DSL) olarak kabul edilir; bu, işlevlerinin ve kullanımının belirli bir
kullanım alanı veya etki alanı için tasarlandığı anlamına gelir.
R'nin durumunda bu istatistiksel
hesaplama ve analizdir. Ek olarak R, her türlü veri bilimi görevi için yaygın
olarak kullanılır.
R, veri görselleştirmelerine olanak
tanıyan çok sayıda işlevle donatılmıştır; böylece kullanıcılar verileri analiz
edebilir, gerektiği gibi modelleyebilir ve ardından grafikler oluşturabilir.
Dilin yerleşik grafik işlevlerine ek olarak bunu kolaylaştıran çok sayıda
eklenti veya modül bulunmaktadır.
R ve S ve Şema
R'yi tam olarak
anlamak için, gelişimini sağlayan ana dil olan S'yi anlamak faydalı olacaktır.
S programlama dili
S, 1970'lerin
ortasında John Chambers ve Bell Laboratuvarları için çalışan diğerleri
tarafından geliştirildi. Amacı istatistiksel hesaplamaya kullanıcı dostu ve
veri analizi görevlerini daha kolay ve hızlı hale getiren etkileşimli bir
yaklaşım sunmaktı.
2013 yılında
yapılan bir röprtada Chambers, Bell Laboratuvarları ekibinin
insanların "nereden geldiklerine bakılmaksızın var olan en iyi hesaplama
yöntemlerine erişmelerini" istediğini belirtiyor.
Ayrıca ekibin,
kullanıcıların "kendilerini bilinçli olarak programlama olarak
düşünmedikleri etkileşimli bir ortamda başlamalarını istediğini" söyledi .
Daha sonra ihtiyaçları netleştikçe ve karmaşıklıkları arttıkça, yavaş yavaş
programlamaya geçebilmelidirler."
S'nin genel
felsefesi R'ninkine çok benziyordu: hesaplamalı programlamayı ve istatistiksel
analizi kolaylaştıran, herkesin kullanmayı öğrenebileceği bir yazılım ortamı
sunmak.
R gibi S de
istatistiksel görevlere odaklanan daha uzun programlar yazmak için
kullanılabilir. Ancak R'den farklı olarak S ve onun sonraki sürümü S-PLUS
lisanslı ürünlerdi, yani bunların bir şirketten satın alınması gerekiyordu.
R'nin ayrı bir
dil olmadığını belirtmek önemlidir; daha ziyade S'nin bir lehçesidir.
Veri Biliminin Yükselişi
Veri biliminin
yükselişinden daha ayrıntılı olarak bahsetmeden R'nin evrimini planlamak yanlış
olur.
20. yüzyılın
sonlarında dünya analog sistemlerden dijitalleşmeye (mevcut sistemleri
dijitalleştirmeye) geçtikçe, veriler giderek daha değerli hale geldi. Bugün
altından daha değerli.
Tüm sektörlerdeki
ve sektörlerdeki işletmelerin rekabetçi kalabilmek için müşterilerini ve
potansiyel müşterilerini anlaması gerekir ve kamu kuruluşları mümkün olduğunca
fazla bilgiyle donatıldıklarında daha iyi iş çıkarabilirler.
Tüm bu veriler,
kuruluşların yararlanabileceği pek çok öngörü içeriyor; yalnızca doğru araçlara
ihtiyaçları var.
R, Python, SQL,
Power Bi, Tableau ve diğerleri gibi bu araçlardan biridir. Verilerin içinde
saklı olan bilgileri doğru bir şekilde anlayabilmek için veri bilimci ve
analist gibi profesyonellere ihtiyacımız var.
Modern dünyada
veri bilimi daha önemli hale geldikçe, verileri okuyup yorumlayabilecek teknik
becerilere sahip kişilere olan talep de buna bağlı olarak arttı. Örneğin bugün
veri bilimi, Indeed'e göre ortalama 120.000 ABD dolarının üzerinde maaşla en
yüksek maaş alan BT pozisyonlarından biridir .
R'yi Kim Kullanır?
Pek çok
profesyonel işlerinde R'yi kullanıyor ve dil çeşitli alanlarda kullanılıyor.
Bunlara bakmadan önce R becerilerine sahip birkaç olası kariyeri gözden
geçirelim.
R ile Kariyer
·
Veri bilimcisi
·
İstatistik mühendisi
·
Veri analisti
·
R programcısı
·
Veri mimarı
·
Veritabanı yöneticisi
·
Coğrafi istatistikçi
·
Araştırmacı
·
İş zekası
·
Finansal Analist
·
Makine öğrenimi bilimcisi
·
Nicel analist
·
İstatistikçi
R'yi mi yoksa Python'u mu seçmeliyim?
Gerçekte, veri bilimi ve analitiği ciddi bir
şekilde takip etmek istiyorsanız, sonunda her iki dili de öğrenmeniz
gerekecektir. Geniş bir ekosisteme sahip genel amaçlı bir dil olan Python,
bazen çok yönlülüğü nedeniyle tercih edilir; bu da onu makine öğrenimi, yapay
zeka ve diğer araçlarla entegrasyon için ideal kılar. Öte yandan R,
istatistiksel hesaplama ve grafikler için özel olarak tasarlanmış olduğundan,
özel istatistiksel analizler ve araştırmalar için tercih edilen bir seçimdir.
Hangi şirketler R kullanıyor?
İşte teknoloji
yığınlarında R'yi kullanan büyük şirketlerden sadece birkaçı:
·
Amerika Bankası
·
Amazon
·
Facebook
·
JP Morgan
·
Google
·
Accenture
·
LinkedIn
·
IBM'in
·
Über
·
Deloitte
·
New York Times
·
Ford
·
HP