Lineaarinen vs. logistinen regressio
Tilastollisessa analyysissä on tärkeää tunnistaa tutkimuksen kohteena olevien muuttujien väliset suhteet. Joskus se voi olla analyysin ainoa tarkoitus. Yksi vahva työkalu suhteen olemassaolon selvittämiseen ja suhteen tunnistamiseen on regressioanalyysi.
Regressioanalyysin yksinkertaisin muoto on lineaarinen regressio, jossa muuttujien välinen suhde on lineaarinen suhde. Tilastollisesti se tuo esiin selittävän muuttujan ja vastemuuttujan välisen suhteen. Esimerkiksi regressiota käyttämällä voidaan määrittää hyödykehinnan ja kulutuksen välinen suhde satunnaisesta näytteestä kerättyjen tietojen perusteella. Regressioanalyysi tuottaa tietojoukon regressiofunktion, joka on käytettävissä olevaan tietoon parhaiten sopiva matemaattinen malli. Tätä voidaan helposti edustaa sirontakuvaajana. Graafinen regressio vastaa parhaiten sopivan käyrän löytämistä annetulle tietojoukolle. Käyrän funktio on regressiofunktio. Matemaattisella mallilla hyödykkeen käyttö voidaan ennustaa tietylle hinnalle.
Siksi regressioanalyysiä käytetään laajasti ennustamisessa ja ennustamisessa. Sitä käytetään myös kokeellisten tietojen, fysiikan, kemian ja monien luonnontieteiden ja tekniikan alojen suhteiden luomiseen. Jos suhde tai regressiofunktio on lineaarifunktio, niin prosessi tunnetaan lineaarisena regressiona. Hajotuskaaviossa se voidaan esittää suorana viivanä. Jos funktio ei ole lineaarinen parametrien yhdistelmä, regressio on epälineaarinen.
Logistinen regressio on verrattavissa monimuuttuja regressioon, ja se luo mallin selittää useiden ennustajien vaikutukset vastemuuttujaan. Logistisessa regressiossa lopputulosmuuttujan tulisi kuitenkin olla kategorinen (yleensä jaettu; ts. Pari saavutettavissa olevia tuloksia, kuten kuolema tai selviytyminen, vaikkakin erikoistekniikat mahdollistavat luokiteltujen tietojen mallinnuksen). Jatkuva tulosmuuttuja voidaan muuntaa kategoriseksi muuttujaksi, jota käytetään logistiseen regressioon; jatkuvien muuttujien romahtaminen tällä tavalla on kuitenkin enimmäkseen lannistunut, koska se vähentää tarkkuutta.
Toisin kuin lineaarisessa regressiossa, kohti keskiarvoa, logistisen regression ennustemuuttujia ei tarvitse pakottaa olemaan lineaarisesti kytkettyjä, yleisesti jakautuneita tai että niiden varianssi on yhtä suuri jokaisessa klusterissa. Seurauksena ennustajan ja lopputulosmuuttujien välinen suhde ei todennäköisesti ole lineaarinen funktio.
Mikä on ero logistisen ja lineaarisen regression välillä??
• Lineaarisessa regressiossa oletetaan lineaarinen suhde selittävän muuttujan ja vastemuuttujan välillä ja mallia tyydyttävät parametrit saadaan analyysillä tarkan suhteen saamiseksi.
• Lineaarinen regressio suoritetaan kvantitatiivisille muuttujille, ja tuloksena oleva funktio on kvantitatiivinen.
• Logistisessa regressiossa käytetty tieto voi olla joko kategorinen tai kvantitatiivinen, mutta tulos on aina kategorinen.