Vinnaren i pepparkakshustävlingen!
  • 1
  • 2
2014-05-30, 00:52
  #1
Medlem
Tja!

1.
Om man arbetar med programmering R, är det mer inriktad mot programmerare än statistiker?

2.
Det är en sak som jag inte förstår om R. Vad kan R bidra med affärsnytta för ett företag gällande om att ta fram olika dataunderlag? Vilka för- och nackdelar finns det med användning av R?

3.
Vad är skillnaden av att använda sig av opensource R jämfört med kommersiella produkter med R t ex SPSS och SAS institute? Från min synsätt, tror jag att man behöver programmera i R medan i SPSS så räcker det med drop and click.

4.
Behöver man ha tunga kunskaper inom programmering för att kunna behärska R när man använder sig av SPSS och SAS?

// Fullmetalboy
Citera
2014-05-30, 12:48
  #2
Medlem
inneskos avatar
Citat:
Ursprungligen postat av fullmetalboy
Tja!

1.
Om man arbetar med programmering R, är det mer inriktad mot programmerare än statistiker?

2.
Det är en sak som jag inte förstår om R. Vad kan R bidra med affärsnytta för ett företag gällande om att ta fram olika dataunderlag? Vilka för- och nackdelar finns det med användning av R?

3.
Vad är skillnaden av att använda sig av opensource R jämfört med kommersiella produkter med R t ex SPSS och SAS institute? Från min synsätt, tror jag att man behöver programmera i R medan i SPSS så räcker det med drop and click.

4.
Behöver man ha tunga kunskaper inom programmering för att kunna behärska R när man använder sig av SPSS och SAS?

// Fullmetalboy

Jag kan inte direkt ge dig något bra svar på dina frågor men hur som helst skulle jag säga att

1. R är ett "språk" inriktat mot att utföra olika statistiska metoder. Exempelvis utföra olika hypotestester eller regressioner. R är inte inriktat mot att vara ett språk för generell programmering.

2. Som sagt, R är ett verktyg för att utföra olika statistiska metoder. Om man nu behöver det för att bidra till affärsnyttan så bidrar R på det sättet.

4. Nej du behöver absolut inte tunga programmeringskunskaper för att hantera R. Du behöver dock kunna programmera ytligt. Sedan beror det ju självklart på hur bra du vill bli på R, ju bättre programmerare du är desto bättre kommer du kunna programmera i R, men det är inte "tung" programmering man sysslar med i R utan det är mer som ett verktyg för statistik.
Citera
2014-05-30, 13:53
  #3
Medlem
VonFanderblads avatar
SPSS har också en syntaxtolk och det går att programmera i det. Men R är som sagt flexiblare och öppnare och börjar bli mer och mer använt i näringslivet. Ta fram dataunderlag är lite märkligt benämnt, R används snarare för statistisk modellering givet ett datamaterial. Även om detta datamaterial kan vara simulerat av R.

Hursomhelst behöver du nog inte tunga programmeringskunskaper om du endast använder färdiga paket och funktioner. Vill du skriva egna kan det förstås bli knivigare.
Citera
2014-05-30, 16:05
  #4
Medlem
Citat:
Ursprungligen postat av VonFanderblad
SPSS har också en syntaxtolk och det går att programmera i det. Men R är som sagt flexiblare och öppnare och börjar bli mer och mer använt i näringslivet. Ta fram dataunderlag är lite märkligt benämnt, R används snarare för statistisk modellering givet ett datamaterial. Även om detta datamaterial kan vara simulerat av R.

Hursomhelst behöver du nog inte tunga programmeringskunskaper om du endast använder färdiga paket och funktioner. Vill du skriva egna kan det förstås bli knivigare.

Har du ett konkret exempel på vad som är mer flexibel med R än SPSS?

Jag förstår inte, är det inte så att man kan använda SPSS för statistisk modellering?
Citera
2014-05-30, 17:18
  #5
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av fullmetalboy
Har du ett konkret exempel på vad som är mer flexibel med R än SPSS?

Jag förstår inte, är det inte så att man kan använda SPSS för statistisk modellering?
Citat:
One reason SPSS and SAS are so prevalent is because many older faculty and established research groups have been using it for years. Prior to R, these were clearly better than having to write your own programs. They provided easily repeatable and easy to verify results.

Flash forward to today, we have R which may require some programming skills; however, many packages are available that minimize this need. R is free, new packages are available as quickly as the theory is published, and it is now being accepted by a wider audience as a valid alternative to the commercial software. While SPSS and SAS are likely not going away, but as budget cuts encourage the use of open source and freeware, the younger generation of scientists who learn R will encourage its use in subsequent years.
Det fetade är viktigt. Detta samt.
Citat:
I would go for R if you know that all the statistical tools you need are available in R (through packages). This is because it is free (it doesn't cost a dime), multiplatform (this enables easy collaboration) and open source (it ensures the reproducibility of the analysis).

Någon gjorde en mycket bra jämförelse mellan transportmedel och programmen. SPSS är som en buss, det är enkelt att använda, du går bara på och betalar din biljett och låter någon annan köra. Men du har ingen påverkan (detta är inte helt sant men för metaforens skull) på var bussen tar dig utan du får hoppa av vid lämplig station.

R är som en bil, typ en 4x4 SUV med cykel och kajak på taket. Det är lite svårare att köra själv, men å andra sidan kan du ta dig nästan överallt. R kan göra en hel del som SPSS inte kan, men SPSS kan göra mycket få, eller inga, saker som R inte kan.

Ett konkret exempel är att R klarar av grafiska modeller bättre än vad SPSS gör. Dessutom finns flera paket dedikerade åt metoderna till skillnad från SPSS som endast kan göra det på ett sätt. Dessutom är R snyggare, bilderna ser ut som sådant som publiceras i vetenskapliga tidskrifter.

Jag har arbetat i Minitab, SPSS och R och just nu använder jag så gott som bara R.
__________________
Senast redigerad av VonFanderblad 2014-05-30 kl. 17:24.
Citera
2014-05-31, 00:50
  #6
Medlem
Citat:
Ursprungligen postat av VonFanderblad
Det fetade är viktigt. Detta samt.


Någon gjorde en mycket bra jämförelse mellan transportmedel och programmen. SPSS är som en buss, det är enkelt att använda, du går bara på och betalar din biljett och låter någon annan köra. Men du har ingen påverkan (detta är inte helt sant men för metaforens skull) på var bussen tar dig utan du får hoppa av vid lämplig station.

R är som en bil, typ en 4x4 SUV med cykel och kajak på taket. Det är lite svårare att köra själv, men å andra sidan kan du ta dig nästan överallt. R kan göra en hel del som SPSS inte kan, men SPSS kan göra mycket få, eller inga, saker som R inte kan.

Ett konkret exempel är att R klarar av grafiska modeller bättre än vad SPSS gör. Dessutom finns flera paket dedikerade åt metoderna till skillnad från SPSS som endast kan göra det på ett sätt. Dessutom är R snyggare, bilderna ser ut som sådant som publiceras i vetenskapliga tidskrifter.

Jag har arbetat i Minitab, SPSS och R och just nu använder jag så gott som bara R.

1.
Vilket verktyg för R använder du? Kanske Rstudio?

2.
Jag får en känsla att du har en tidigare utbildning inom statistik eller liknande. Undrar bara hur mycket av antal kurser behöver man lära sig för att kunna arbeta som statistiker?

3.
När du tog fram ett resultat med hjälp av R, hur gjorde du tillväga för att presentera resultatet till din slutanvändare/kund/chef? Behöver du kopiera data och grafer till en excel fil eller liknande?

4.
Har du några förslag av rekommenderade forum för R och statistik förutom denna Flashback?

Tack på förhand!
Citera
2014-05-31, 15:07
  #7
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av fullmetalboy
1.
Vilket verktyg för R använder du? Kanske Rstudio?

2.
Jag får en känsla att du har en tidigare utbildning inom statistik eller liknande. Undrar bara hur mycket av antal kurser behöver man lära sig för att kunna arbeta som statistiker?

3.
När du tog fram ett resultat med hjälp av R, hur gjorde du tillväga för att presentera resultatet till din slutanvändare/kund/chef? Behöver du kopiera data och grafer till en excel fil eller liknande?

4.
Har du några förslag av rekommenderade forum för R och statistik förutom denna Flashback?

Tack på förhand!
1. Just nu använder jag bara R, men Rstudio och sweave är ju faktiskt bra så jag borde nog börja använda dem också.

2. Oj, det är inte helt lätt att svara på. De flesta arbetsbeskrivningarna kräver bara "relevant utbildning" och det är lite svårt att veta vad det innebär jämt. Hur som helst så är en kandidatexamen dvs 90 hp i stat och 90 i något annat en bra början. Sedan kan man ju komplementera med intressanta kurser på högre nivå om man orkar och kan.

3. Eftersom det är sällan man visar själva datamaterialet (en lista med 5000+ observationer säger oftast inte så mycket) utan snarare en modell eller resultatet av beräkningar så är det inga problem att göra det i R, eftersom det ofta finns paket gjorda för att göra snygga grafer och så vidare. Annars kan man ju alltid göra tabeller och liknande i latex, det brukar bli snyggt.

4. Det finns väldigt många wiki och bloggar som är relaterade till R, till exempel http://www.inside-r.org/ och http://www.r-bloggers.com.
Citera
2015-02-22, 15:40
  #8
Medlem
JGGs avatar
Precis börjat lära mig R. I en uppgift ska man konvertera Male/Female till 1/0. Hur gör man detta?
Citera
2015-02-22, 16:39
  #9
Medlem
Farmstars avatar
Citat:
Ursprungligen postat av JGG
Precis börjat lära mig R. I en uppgift ska man konvertera Male/Female till 1/0. Hur gör man detta?


Du kan använda dig av gsub exempelvis. Annars funkar det säkert att köra allt genom en loop. Exempel finns nedan

Kod:
x <- c("Male", "Female", "Female", "Male", "Male", "Male", "Female")

for (i in 1:length(x)){
    if (x[i] == "Male")
        x[i] <- 1
    else
        x[i] <-0 
}
Citera
2015-11-16, 11:42
  #10
Medlem
Jag har ett datamaterial som består av namn, kön, ålder, vikt, längd.
Hur får jag ut top 10 observationerna som har högst vikt? Jag vill få ut all information om variablerna för dessa observationer och inte bara värdena för vikt.

Sedan har jag en plott där jag vill dra en linje mellan observationerna i den ordning som de ligger i grafen. Jag använder mig av lines och lty, problemet är att linjen dras efter observationsnummer, ser det ut som och det blir väldigt rörigt..
__________________
Senast redigerad av ogoj 2015-11-16 kl. 11:59.
Citera
2015-12-11, 05:30
  #11
Medlem
Stadsplanerares avatar
Ska läsa en kurs i statistik och R nu till våren. Den ges på distans av KI. Kursplan: http://ki.se/selma/syllabus/1QA098

Undrar om det finns tidigare kursare här, men förstås också vilka tips ni statistik-/R-kunniga har till en gröngöling. Vart börjar man?
Citera
2015-12-11, 09:25
  #12
Medlem
-taki-s avatar
Citat:
Ursprungligen postat av fullmetalboy
Tja!

1.
Om man arbetar med programmering R, är det mer inriktad mot programmerare än statistiker?

2.
Det är en sak som jag inte förstår om R. Vad kan R bidra med affärsnytta för ett företag gällande om att ta fram olika dataunderlag? Vilka för- och nackdelar finns det med användning av R?

3.
Vad är skillnaden av att använda sig av opensource R jämfört med kommersiella produkter med R t ex SPSS och SAS institute? Från min synsätt, tror jag att man behöver programmera i R medan i SPSS så räcker det med drop and click.

4.
Behöver man ha tunga kunskaper inom programmering för att kunna behärska R när man använder sig av SPSS och SAS?

// Fullmetalboy


Jag tycker VonFanderblad har givit mycket bra synpunkter men lägger till mina två cents of wisdom:

2 & 3:
Jag jobbar på ett större företag som har standardiserat på statistikprogrammet Minitab. Många på företaget kan inte/vill inte programmera men i deras arbetsuppgifter ingår att göra vissa analyser. Då är väl en menystyrd kommersiell programvara det enda alternativet. Jag tycker det är helt Ok att det fungerar så.

Minitab är en mycket bättre statistiker än jag och gör många moment snabbt och elegant och jag behöver oftast inte förstå bakgrunderna i detalj.

Men likväl, ofta stöter jag på patrull. T ex kanske Minitab bara gör 80 % av jobbet och så måste jag räkna själv ändå. Eller jag kanske vill skicka svaren från en analys in i en annan vilket inte alltid går. Eller jag vill få ut siffror på något som i Minitab bara visas som en kurva i ett diagram. Eller, ibland finns helt enkelt inte analysen jag vill göra som funktion i Minitab.

Detta har gjort att jag använder Minitab när funktionaliteten finns där och Mathcad annars. Mathcad har inte alls samma utbud av statistikfunktioner som R men dem jag behöver finns eller så programmerar jag dem från grunden. Detta är oftast bra eftersom jag lär mig metoden samtidigt. Min arbetsgivare kanske har en annan uppfattning...

Min grundmurade uppfattning är att jobbar man seriöst med dataanalys måste man ha tillgång till verktyg som R, Mathcad eller Matlab.

Varför använder just jag inte R så mycket? Tja, jag klarar mig med Mathcad, Minitab och SIMCA (och ibland även med Excel). Ibland använder jag dock R och det är för att få ett facit till mina egna algoritmer i Mathcad.


1 & 4:
Inte tunga men man måste kunna programmera lite. Men vad är "lite" och vad är "tungt"? Farmstar's inlägg visar en liten slinga. Jag tycker den är "lite", t o m under gränser för "mikro". Vissa andra kanske bara suckar och lämnar walk over direkt.

Eller, frågeställningen kanske snarare gäller tidsåtgången? Där kommer väl ens arbetssituation in. Men, programmerar man något själv lär man sig oftast också något. Detta måste räknas till pluskontot.


Jag har lyckats lägga radarn över Rstudio. Tack för tipset. Den ska jag titta på.
Citera
  • 1
  • 2

Stöd Flashback

Flashback finansieras genom donationer från våra medlemmar och besökare. Det är med hjälp av dig vi kan fortsätta erbjuda en fri samhällsdebatt. Tack för ditt stöd!

Stöd Flashback