Principal Alte Analiza datelor de timp până la eveniment

Analiza datelor de timp până la eveniment

Prezentare generală

Software

Descriere

Site-uri web

Lecturi

Cursuri

Prezentare generală

Această pagină descrie pe scurt o serie de întrebări care ar trebui luate în considerare atunci când se analizează datele din timpul evenimentului și oferă o listă de resurse adnotate pentru mai multe informații.

Descriere

Ce este unic în ceea ce privește datele privind timpul-eveniment (TTE)?

Datele despre timpul până la eveniment (TTE) sunt unice, deoarece rezultatul interesului nu este doar dacă a avut loc sau nu un eveniment, ci și când a avut loc acel eveniment. Metodele tradiționale de regresie logistică și liniară nu sunt potrivite pentru a putea include atât aspectul evenimentului, cât și aspectele temporale ca rezultat în model. De asemenea, metodele tradiționale de regresie nu sunt echipate pentru a gestiona cenzurarea, un tip special de date lipsă care apare în analizele de la un eveniment la altul, atunci când subiecții nu experimentează evenimentul de interes în timpul urmăririi. În prezența cenzurii, timpul real până la eveniment este subestimat. Au fost dezvoltate tehnici speciale pentru datele TTE, așa cum se va discuta mai jos, pentru a utiliza informațiile parțiale despre fiecare subiect cu date cenzurate și pentru a furniza estimări de supraviețuire imparțiale. Aceste tehnici încorporează date din mai multe puncte de timp între subiecți și pot fi utilizate pentru a calcula direct ratele, raporturile de timp și raporturile de pericol.

Care sunt considerațiile metodologice importante ale datelor referitoare la timpul evenimentului?

Există 4 considerații metodologice principale în analiza datelor privind timpul până la eveniment sau de supraviețuire. Este important să aveți o definiție clară a evenimentului țintă, originea timpului, scala timpului și să descrieți modul în care participanții vor părăsi studiul. Odată ce acestea sunt bine definite, atunci analiza devine mai simplă. De obicei, există un singur eveniment țintă, dar există extensii ale analizelor de supraviețuire care permit evenimente multiple sau evenimente repetate.

Care este originea timpului?

Originea timpului este punctul în care începe urmărirea. Datele TTE pot utiliza o varietate de origini de timp care sunt în mare parte determinate de proiectarea studiului, fiecare având beneficii și dezavantaje asociate. Exemplele includ timpul inițial sau vârsta inițială. Originile timpului pot fi, de asemenea, determinate de o caracteristică definitorie, cum ar fi debutul expunerii sau diagnosticul. Aceasta este adesea o alegere firească dacă rezultatul este legat de acea caracteristică. Alte exemple includ nașterea și anul calendaristic. Pentru studiile de cohortă, scara de timp este cel mai frecvent timpul de studiu.

Există o altă opțiune pentru scara timpului, altele decât timpul de studiu?

Vârsta este o altă scară de timp utilizată în mod obișnuit, în care vârsta de bază este originea timpului, iar indivizii ies la evenimentul lor sau la vârsta de cenzurare. Modelele cu vârsta ca scară de timp pot fi ajustate pentru efectele calendarului. Unii autori recomandă ca vârsta mai degrabă decât timpul studiat să fie folosită ca scară de timp, deoarece poate oferi estimări mai puțin părtinitoare.

Ce este cenzurarea?

Una dintre provocările specifice analizei supraviețuirii este că doar unii indivizi vor fi experimentat evenimentul până la sfârșitul studiului și, prin urmare, timpii de supraviețuire vor fi necunoscuți pentru un subgrup al grupului de studiu. Acest fenomen se numește cenzurare și poate apărea în următoarele moduri: participantul la studiu nu a experimentat încă rezultatul relevant, cum ar fi recăderea sau moartea, la încheierea studiului; participantul la studiu este pierdut pentru a urmări în timpul perioadei de studiu; sau, participantul la studiu experimentează un eveniment diferit care face imposibilă urmărirea ulterioară. Astfel de intervale de timp cenzurate subestimează timpul adevărat, dar necunoscut, până la eveniment. Pentru majoritatea abordărilor analitice, se presupune că cenzurarea este aleatorie sau neinformativă.

Există trei tipuri principale de cenzurare, dreapta, stânga și intervalul. Dacă evenimentele apar dincolo de sfârșitul studiului, atunci datele sunt cenzurate de dreapta. Datele cenzurate la stânga apar atunci când evenimentul este observat, dar timpul exact al evenimentului este necunoscut. Datele cenzurate pe intervale apar atunci când evenimentul este observat, dar participanții intră și ies din observație, astfel încât ora exactă a evenimentului este necunoscută. Majoritatea metodelor analitice de supraviețuire sunt concepute pentru observații cenzurate de dreapta, dar sunt disponibile metode pentru date cenzurate la intervale și stânga.

Care este problema interesului?

Alegerea instrumentului analitic ar trebui să fie ghidată de întrebarea de interes de cercetare. Cu datele TTE, întrebarea de cercetare poate lua mai multe forme, ceea ce influențează funcția de supraviețuire cea mai relevantă pentru întrebarea de cercetare. Trei tipuri diferite de întrebări de cercetare care pot fi de interes pentru datele TTE includ:

  1. Ce proporție de persoane va rămâne liberă de eveniment după un anumit timp?

  2. Ce proporție de persoane va avea evenimentul după un anumit timp?

  3. Care este riscul evenimentului într-un anumit moment, în rândul celor care au supraviețuit până în acel moment?

Fiecare dintre aceste întrebări corespunde unui tip diferit de funcție utilizată în analiza supraviețuirii:

  1. Funcția de supraviețuire, S (t): probabilitatea ca un individ să supraviețuiască dincolo de timp t [Pr (T> t)]

  2. Funcția de densitate a probabilității, F (t) sau Funcția de incidență cumulativă, R (t): probabilitatea ca un individ să aibă un timp de supraviețuire mai mic sau egal cu t [Pr (T≤t)]

  3. Funcția de pericol, h (t): potențialul instantaneu de a experimenta un eveniment la momentul t, condiționat de supraviețuirea până la acel moment

  4. Funcția de pericol cumulativ, H (t): integralul funcției de pericol de la momentul 0 la timpul t, care este egal cu aria de sub curba h (t) între timpul 0 și timpul t

Dacă una dintre aceste funcții este cunoscută, celelalte funcții pot fi calculate folosind următoarele formule:

S (t) = 1 - F (t) Funcția de supraviețuire și funcția de densitate a probabilității sunt la 1

h (t) = f (t) / S (t) Pericolul instantaneu este egal cu probabilitatea necondiționată de

experimentarea evenimentului la momentul t, scalat de fracția vie la momentul t

H (t) = -log [S (t)] Funcția de pericol cumulativ este egală cu logul negativ al supraviețuirii

funcţie

S (t) = e –H (t) Funcția de supraviețuire este egală cu riscul cumulativ negativ exponențiat

funcţie

Aceste conversii sunt utilizate adesea în metodele de analiză a supraviețuirii, așa cum se va discuta mai jos. În general, o creștere a h (t), pericolul instantaneu, va duce la o creștere a H (t), pericolul cumulativ, care se traduce printr-o scădere a S (t), funcția de supraviețuire.

Ce presupuneri trebuie luate pentru a utiliza tehnici standard pentru datele de la timpul evenimentului?

Principala ipoteză în analiza datelor TTE este aceea a cenzurii neinformative: indivizii care sunt cenzurați au aceeași probabilitate de a experimenta un eveniment ulterior ca indivizii care rămân în studiu. Cenzurarea informativă este analogă cu datele lipsă ignorabile, care vor influența analiza. Nu există o modalitate definitivă de a testa dacă cenzurarea este neinformativă, deși explorarea modelelor de cenzurare poate indica dacă o presupunere a cenzurării neinformative este rezonabilă. Dacă se suspectează cenzurarea informativă, analizele de sensibilitate, cum ar fi scenariile cele mai bune și cele mai nefavorabile, pot fi utilizate pentru a încerca să cuantifice efectul pe care cenzura informativă îl are asupra analizei.

O altă presupunere atunci când se analizează datele TTE este că există suficient timp de urmărire și număr de evenimente pentru o putere statistică adecvată. Acest lucru trebuie luat în considerare în faza de proiectare a studiului, deoarece majoritatea analizelor de supraviețuire se bazează pe studii de cohortă.

Ipoteze de simplificare suplimentare merită menționate, deoarece sunt adesea făcute în prezentări generale ale analizei supraviețuirii. În timp ce aceste ipoteze simplifică modelele de supraviețuire, nu sunt necesare pentru a efectua analize cu date TTE. Tehnici avansate pot fi utilizate dacă aceste ipoteze sunt încălcate:

cum să faci videoclipuri educaționale
  • Fără efect de cohortă asupra supraviețuirii: pentru o cohortă cu o perioadă lungă de recrutare, presupunem că indivizii care se alătură devreme au aceleași probabilități de supraviețuire ca și cei care se alătură târziu

  • Cenzurarea corectă doar în date

  • Evenimentele sunt independente una de cealaltă

Ce tipuri de abordări pot fi utilizate pentru analiza supraviețuirii?

Există trei abordări principale pentru analiza datelor TTE: abordări non-parametrice, semi-parametrice și parametrice. Alegerea abordării de utilizare ar trebui să fie determinată de chestiunea de interes a cercetării. Adesea, mai multe abordări pot fi utilizate în mod corespunzător în aceeași analiză.

Care sunt abordările non-parametrice ale analizei supraviețuirii și când sunt adecvate?

Abordările non-parametrice nu se bazează pe ipoteze despre forma sau forma parametrilor din populația subiacentă. În analiza supraviețuirii, abordările non-parametrice sunt utilizate pentru a descrie datele prin estimarea funcției de supraviețuire, S (t), împreună cu mediana și quartile timpului de supraviețuire. Aceste statistici descriptive nu pot fi calculate direct din datele datorate cenzurii, ceea ce subestimează timpul de supraviețuire real la subiecții cenzurați, ducând la estimări înclinate ale mediei, medianei și altor descriptive. Abordările non-parametrice sunt adesea folosite ca prim pas într-o analiză pentru a genera statistici descriptive imparțiale și sunt adesea utilizate împreună cu abordări semi-parametrice sau parametrice.

Estimatorul Kaplan-Meier

Cea mai comună abordare non-parametrică din literatură este estimatorul Kaplan-Meier (sau limita produsului). Estimatorul Kaplan-Meier funcționează prin împărțirea estimării lui S (t) într-o serie de pași / intervale pe baza timpilor de eveniment observați. Observațiile contribuie la estimarea lui S (t) până la apariția evenimentului sau până când sunt cenzurate. Pentru fiecare interval, se calculează probabilitatea de a supraviețui până la sfârșitul intervalului, dat fiind faptul că subiecții sunt expuși riscului la începutul intervalului (acest lucru este notat în mod obișnuit ca pj = (nj - dj) / nj). S (t) estimat pentru fiecare valoare a t este egal cu produsul supraviețuirii fiecărui interval până la timpul t inclus. Principalele ipoteze ale acestei metode, pe lângă cenzura non-informativă, este că cenzurarea are loc după eșecuri și că nu există niciun efect de cohortă asupra supraviețuirii, astfel încât subiecții au aceeași probabilitate de supraviețuire indiferent de momentul în care au intrat în studiu.

S (t) estimat din metoda Kaplan-Meier poate fi reprezentat grafic ca o funcție în trepte, cu timpul pe axa X. Acest complot este un mod frumos de a vizualiza experiența de supraviețuire a cohortei și poate fi, de asemenea, utilizat pentru a estima mediana (când S (t) ≤0,5) sau quartile timpului de supraviețuire. Aceste statistici descriptive pot fi, de asemenea, calculate direct folosind estimatorul Kaplan-Meier. Intervalele de încredere de 95% (CI) pentru S (t) se bazează pe transformările lui S (t) pentru a se asigura că IC de 95% este cuprinsă între 0 și 1. Cea mai comună metodă în literatură este estimatorul Greenwood.

Estimatorul tabelului de viață

Estimatorul tabelului de viață al funcției de supraviețuire este unul dintre primele exemple de metode statistice aplicate, fiind folosit de peste 100 de ani pentru a descrie mortalitatea la populații mari. Estimatorul tabelului de viață este similar cu metoda Kaplan-Meier, cu excepția faptului că intervalele se bazează pe timpul calendaristic în locul evenimentelor observate. Deoarece metodele tabelului de viață se bazează pe aceste intervale calendaristice și nu pe baza evenimentelor individuale / timpilor de cenzurare, aceste metode utilizează dimensiunea medie stabilită a riscului pe interval pentru a estima S (t) și trebuie să presupună că cenzurarea a avut loc uniform în intervalul de timp calendaristic. Din acest motiv, estimatorul tabelului de viață nu este la fel de precis ca estimatorul Kaplan-Meier, dar rezultatele vor fi similare în eșantioane foarte mari.

Estimator Nelson-Aalen

O altă alternativă la Kaplan-Meier este estimatorul Nelson-Aalen, care se bazează pe utilizarea unei abordări a procesului de numărare pentru a estima funcția de pericol cumulativ, H (t). Estimarea lui H (t) poate fi apoi utilizată pentru a estima S (t). Estimările S (t) derivate folosind această metodă vor fi întotdeauna mai mari decât estimarea K-M, dar diferența va fi mică între cele două metode în eșantioane mari.

Pot fi utilizate abordări non-parametrice pentru analize univariabile sau multivariabile?

Abordări non-parametrice, cum ar fi estimatorul Kaplan-Meier, pot fi utilizate pentru a efectua analize univariabile pentru factorii categorici de interes. Factorii trebuie să fie categorici (fie în natură, fie o variabilă continuă împărțită în categorii), deoarece funcția de supraviețuire, S (t), este estimată pentru fiecare nivel al variabilei categorice și apoi comparată între aceste grupuri. S (t) estimat pentru fiecare grup poate fi reprezentat grafic și comparat vizual.

Testele bazate pe ranguri pot fi, de asemenea, utilizate pentru a testa statistic diferența dintre curbele de supraviețuire. Aceste teste compară numărul observat și așteptat de evenimente la fiecare moment al grupurilor, sub ipoteza nulă că funcțiile de supraviețuire sunt egale între grupuri. Există mai multe versiuni ale acestor teste bazate pe rang, care diferă în ceea ce privește greutatea acordată fiecărui punct de timp în calculul statisticii testului. Două dintre cele mai frecvente teste bazate pe ranguri văzute în literatură sunt testul log rank, care oferă fiecare punct de timp greutate egală, și testul Wilcoxon, care ponderează fiecare punct de timp în funcție de numărul de subiecți cu risc. Pe baza acestei greutăți, testul Wilcoxon este mai sensibil la diferențele dintre curbe la începutul urmăririi, atunci când mai mulți subiecți sunt expuși riscului. Alte teste, cum ar fi testul Peto-Prentice, utilizează greutăți între testele de rang log și testele Wilcoxon. Testele bazate pe rang sunt supuse presupunerii suplimentare că cenzurarea este independentă de grup și toate sunt limitate de puterea mică de a detecta diferențele dintre grupuri atunci când curbele de supraviețuire se încrucișează. Deși aceste teste oferă o valoare p a diferenței dintre curbe, ele nu pot fi utilizate pentru a estima dimensiunile efectului (valoarea logică a testului de rang logaritmic este totuși echivalentă cu valoarea p pentru un factor categoric de interes într-un Cox univariabil model).

Modelele non-parametrice sunt limitate prin faptul că nu furnizează estimări ale efectului și nu pot fi utilizate în general pentru a evalua efectul mai multor factori de interes (modele multivariabile). Din acest motiv, abordările non-parametrice sunt adesea utilizate împreună cu modele semi- sau complet parametrice în epidemiologie, unde modelele multivariabile sunt de obicei utilizate pentru a controla confuzorii.

Se pot regla curbele Kaplan-Meier?

Este un mit comun că curbele Kaplan-Meier nu pot fi ajustate și acest lucru este adesea citat ca motiv pentru a utiliza un model parametric care poate genera curbe de supraviețuire ajustate covariabil. Cu toate acestea, a fost dezvoltată o metodă pentru a crea curbe de supraviețuire ajustate utilizând ponderarea inversă a probabilității (IPW). În cazul unei singure covariate, IPW-urile pot fi estimate non-parametric și sunt echivalente cu standardizarea directă a curbelor de supraviețuire la populația studiată. În cazul covariatelor multiple, trebuie utilizate modele semi- sau complet parametrice pentru a estima greutățile, care sunt apoi utilizate pentru a crea curbe de supraviețuire ajustate cu covariate multiple. Avantajele acestei metode sunt că nu este supusă presupunerii proporționale a pericolelor, poate fi utilizată pentru covariabile care variază în timp și poate fi folosită și pentru covariabile continue.

De ce avem nevoie de abordări parametrice pentru analiza datelor de la timpul evenimentului?

O abordare non-parametrică a analizei datelor TTE este utilizată pentru a descrie pur și simplu datele de supraviețuire în raport cu factorul investigat. Modelele care utilizează această abordare sunt denumite și modele univariabile. Mai frecvent, anchetatorii sunt interesați de relația dintre mai multe covariate și timpul până la eveniment. Utilizarea modelelor semi- și complet parametrice permite analizarea timpului evenimentului cu privire la mulți factori simultan și oferă estimări ale puterii efectului pentru fiecare factor constitutiv.

Ce este o abordare semi-parametrică și de ce este atât de frecvent utilizată?

Modelul proporțional Cox este cea mai frecvent utilizată abordare multivariabilă pentru analiza datelor de supraviețuire în cercetarea medicală. Este în esență un model de regresie de la un eveniment la altul, care descrie relația dintre incidența evenimentului, așa cum este exprimată de funcția de pericol și un set de covariabile. Modelul Cox este scris după cum urmează:

funcția de pericol, h (t) = h0 (t) exp {β1X1 + β2X2 + ... + βpXp}

Este considerată o abordare semi-parametrică, deoarece modelul conține o componentă non-parametrică și o componentă parametrică. Componenta neparametrică este pericolul de bază, h0 (t). Aceasta este valoarea pericolului atunci când toate covariabilele sunt egale cu 0, ceea ce evidențiază importanța centrării covariabilelor în model pentru interpretabilitate. Nu confundați pericolul inițial cu pericolul la momentul 0. Funcția pericolului inițial este estimată nemetric și, așadar, spre deosebire de majoritatea celorlalte modele statistice, nu se presupune că timpul de supraviețuire urmează o distribuție statistică particulară și forma liniei de bază. pericolul este arbitrar. Funcția de pericol de bază nu trebuie să fie estimată pentru a face inferențe despre pericolul relativ sau raportul de pericol. Această caracteristică face modelul Cox mai robust decât abordările parametrice, deoarece nu este vulnerabil la specificarea greșită a pericolului de bază.

Componenta parametrică este alcătuită din vectorul covariabil. Vectorul covariabil multiplică pericolul inițial cu aceeași cantitate, indiferent de timp, astfel încât efectul oricărei covariate este același în orice moment în timpul urmăririi și aceasta este baza ipotezei proporționale a pericolelor.

epidemiologia este studiul

Care este presupunerea proporțională a pericolelor?

Presupunerea proporțională a pericolelor este vitală pentru utilizarea și interpretarea unui model Cox.

Sub această ipoteză, există o relație constantă între rezultat sau variabila dependentă și vectorul covariabil. Implicațiile acestei presupuneri sunt că funcțiile de pericol pentru oricare două persoane sunt proporționale în orice moment și raportul de pericol nu variază în funcție de timp. Cu alte cuvinte, dacă un individ are un risc de deces la un moment dat inițial care este de două ori mai mare decât cel al unei alte persoane, atunci în toate momentele ulterioare, riscul de deces rămâne de două ori mai mare. Această presupunere implică faptul că curbele de pericol pentru grupuri ar trebui să fie proporționale și să nu se încrucișeze. Deoarece această presupunere este atât de importantă, ar trebui cu siguranță testată.

Cum testați ipoteza proporțională a pericolelor?

Există o varietate de tehnici, atât grafice, cât și bazate pe teste, pentru evaluarea validității presupunerii proporționale a pericolelor. O tehnică este reprezentarea simplă a curbelor de supraviețuire Kaplan – Meier dacă comparați două grupuri fără covariabile. Dacă curbele se încrucișează, presupunerea proporțională a pericolelor poate fi încălcată. O atenție importantă la această abordare trebuie ținută cont de studiile mici. Poate exista o cantitate mare de erori asociate cu estimarea curbelor de supraviețuire pentru studii cu o dimensiune mică a eșantionului, prin urmare curbele se pot încrucișa chiar și atunci când este îndeplinită ipoteza proporțională a pericolelor. Graficul log-log complementar este un test mai robust care trasează logaritmul logaritmului negativ al funcției supraviețuitorului estimat în raport cu logaritmul timpului de supraviețuire. Dacă pericolele sunt proporționale între grupuri, acest grafic va produce curbe paralele. O altă metodă obișnuită pentru testarea presupunerii proporționale a pericolelor este includerea unui termen de interacțiune temporală pentru a determina dacă HR se modifică în timp, deoarece timpul este adesea vinovat de neproporționalitatea pericolelor. Dovezi că termenul de interacțiune în grup * nu este zero este o dovadă împotriva riscurilor proporționale.

Ce se întâmplă dacă presupunerea proporțională a pericolelor nu se menține?

Dacă descoperiți că presupunerea PH nu este valabilă, nu trebuie neapărat să renunțați la utilizarea modelului Cox. Există opțiuni pentru îmbunătățirea non-proporționalității în model. De exemplu, puteți include alte covariabile în model, fie covariabile noi, termeni neliniari pentru covariabile existente sau interacțiuni între covariabile. Sau puteți stratifica analiza pe una sau mai multe variabile. Aceasta estimează un model în care pericolul inițial este permis să fie diferit în cadrul fiecărei straturi, dar efectele covariabilelor sunt egale între straturi. Alte opțiuni includ împărțirea timpului în categorii și utilizarea variabilelor indicator pentru a permite rapoartelor de pericol să varieze în timp și schimbarea variabilei de timp a analizei (de exemplu, de la timpul scurs la vârstă sau invers).

Cum examinați potrivirea modelului semi-parametric?

Pe lângă verificarea încălcărilor ipotezei de proporționalitate, există și alte aspecte ale potrivirii modelului care ar trebui examinate. Statistici similare celor utilizate în regresia liniară și logistică pot fi aplicate pentru a efectua aceste sarcini pentru modelele Cox cu unele diferențe, dar ideile esențiale sunt aceleași în toate cele trei setări. Este important să verificăm liniaritatea vectorului covariabil, care se poate face examinând reziduurile, la fel ca în regresia liniară. Cu toate acestea, reziduurile din datele TTE nu sunt la fel de simple pe cât sunt în regresie liniară, parțial deoarece valoarea rezultatului este necunoscută pentru unele dintre date, iar reziduurile sunt adesea distorsionate. Au fost dezvoltate mai multe tipuri diferite de reziduuri pentru a evalua modelul Cox potrivit pentru datele TTE. Exemple includ Martingale și Schoenfeld, printre altele. De asemenea, puteți analiza reziduurile pentru a identifica observații extrem de influente și slab potrivite. Există, de asemenea, teste de bună-potrivire care sunt specifice modelelor Cox, cum ar fi testul Gronnesby și Borgan și indicele de prognostic Hosmer și Lemeshow. De asemenea, puteți utiliza AIC pentru a compara diferite modele, deși utilizarea R2 este problematică.

De ce să folosim o abordare parametrică?

Unul dintre principalele avantaje ale modelelor semi-parametrice este că pericolul de bază nu trebuie specificat pentru a estima raporturile de pericol care descriu diferențele în pericolul relativ între grupuri. Se poate, totuși, că estimarea riscului de bază în sine este de interes. În acest caz, este necesară o abordare parametrică. În abordările parametrice, sunt specificate atât funcția de pericol, cât și efectul covariabilelor. Funcția de pericol este estimată pe baza unei distribuții presupuse în populația subiacentă.

Avantajele utilizării unei abordări parametrice a analizei supraviețuirii sunt:

  • Abordările parametrice sunt mai informative decât abordările non- și semi-parametrice. În plus față de calcularea estimărilor efectului relativ, acestea pot fi, de asemenea, utilizate pentru a prezice timpul de supraviețuire, ratele de pericol și timpul mediu și mediu de supraviețuire. Ele pot fi, de asemenea, utilizate pentru a face predicții de risc absolute în timp și pentru a trasa curbe de supraviețuire ajustate covariabil.

  • Când forma parametrică este specificată corect, modelele parametrice au mai multă putere decât modelele semi-parametrice. De asemenea, sunt mai eficiente, ducând la erori standard mai mici și estimări mai precise.

  • Abordările parametrice se bazează pe probabilitatea maximă maximă pentru a estima parametrii.

  • Reziduurile modelelor parametrice iau forma familiară a diferenței dintre observate și așteptate.

Principalul dezavantaj al utilizării unei abordări parametrice este că se bazează pe presupunerea că distribuția subiacentă a populației a fost specificată corect. Modelele parametrice nu sunt robuste pentru a specifica greșit, motiv pentru care modelele semi-parametrice sunt mai frecvente în literatură și sunt mai puțin riscante de utilizat atunci când există incertitudine cu privire la distribuția subiacentă a populației.

Cum alegeți forma parametrică?

Alegerea formei parametrice adecvate este cea mai dificilă parte a analizei de supraviețuire parametrice. Specificația formei parametrice ar trebui să fie condusă de ipoteza studiului, împreună cu cunoștințele anterioare și plauzibilitatea biologică a formei pericolului de bază. De exemplu, dacă se știe că riscul de deces crește dramatic imediat după operație și apoi scade și se aplatizează, ar fi inadecvat să se specifice distribuția exponențială, care presupune un risc constant în timp. Datele pot fi utilizate pentru a evalua dacă forma specificată pare să se potrivească cu datele, dar aceste metode bazate pe date ar trebui să completeze, nu să înlocuiască, selecțiile bazate pe ipoteze.

Care este diferența dintre un model de pericole proporționale și un model de timp de eșec accelerat?

Deși modelul de pericole proporționale Cox este semi-parametric, modelele de pericole proporționale pot fi, de asemenea, parametrice. Modelele de pericole proporționale parametrice pot fi scrise ca:

h (t, X) = h0 (t) exp (Xi β) = h0 (t) λ

unde pericolul de bază, h0 (t), depinde doar de timp, t, dar nu de X, iar λ este o funcție specifică a unității a covariabilelor, care nu depinde de t, care scalează funcția de pericol de bază în sus sau în jos. λ nu poate fi negativ. În acest model, rata de pericol este o funcție multiplicativă a pericolului de referință și raporturile de pericol pot fi interpretate în același mod ca și în modelul de pericole proporționale semiparametrice.

Modelele de timp de eșec accelerat (AFT) sunt o clasă de modele de supraviețuire parametrice care pot fi liniarizate luând jurnalul natural al modelului de timp de supraviețuire. Cel mai simplu exemplu de model AFT este modelul exponențial, care este scris ca:

ln (T) = β0 + β1X1 + .... + βpXp + ε *

Principala diferență între modelele AFT și modelele PH este că modelele AFT presupun că efectele covariabilelor sunt multiplicative pe scară de timp, în timp ce modelele Cox folosesc scala de pericol așa cum se arată mai sus. Estimările parametrilor din modelele AFT sunt interpretate ca efecte asupra scalei de timp, care poate accelera sau reduce viteza de supraviețuire. Exp (β)> 1 dintr-un model AFT înseamnă că factorul accelerează timpul de supraviețuire sau duce la o supraviețuire mai lungă. Exp (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Unele distribuții de erori pot fi scrise și interpretate atât ca modele PH, cât și ca modele AFT (adică exponențiale, Weibull), altele sunt doar PH (adică Gompertz) sau doar modele AFT (adică log-logistice) și altele nu sunt nici modele PH sau AFT (adică montarea unei spline).

Ce forme pot asuma modelele parametrice?

Funcția de pericol poate lua orice formă atâta timp cât h (t)> 0 pentru toate valorile t. În timp ce considerația principală pentru forma parametrică ar trebui să fie cunoașterea prealabilă a formei pericolului de bază, fiecare distribuție are propriile avantaje și dezavantaje. Unele dintre cele mai comune forme vor fi explicate pe scurt, cu mai multe informații disponibile în lista de resurse.

Distribuție exponențială

Distribuția exponențială presupune că h (t) depinde doar de coeficienții modelului și de covariabile și este constantă în timp. Principalul avantaj al acestui model este acela că este atât un model proporțional de pericole, cât și un model de timp de eșec accelerat, astfel încât estimările efectului pot fi interpretate fie ca raporturi de pericol, fie ca raporturi de timp. Principalul dezavantaj al acestui model este că este adesea neverosimil să se asume un pericol constant în timp.

Distribuție Weibull

Distribuția Weibull este similară cu distribuția exponențială. În timp ce distribuția exponențială presupune un pericol constant, distribuția Weibull presupune un pericol monoton care poate fi fie în creștere, fie în scădere, dar nu și în ambele. Are doi parametri. Parametrul de formă (σ) controlează dacă pericolul crește (σ1) (în distribuția exponențială, acest parametru este setat la 1). Parametrul scării, (1 / σ) exp (-β0 / σ), determină scara acestei creșteri / scăderi. Deoarece distribuția Weibull se simplifică la distribuția exponențială atunci când σ = 1, ipoteza nulă că σ = 1 poate fi testată folosind un test Wald. Principalul avantaj al acestui model este că este atât un model PH, cât și un model AFT, astfel încât pot fi estimate atât raporturile de pericol, cât și raporturile de timp. Din nou, principalul dezavantaj este că presupunerea monotoniei riscului inițial poate fi neverosimilă în unele cazuri.

Distribuția Gompertz

Distribuția Gompertz este un model PH care este egal cu distribuția log-Weibull, deci jurnalul funcției de pericol este liniar în t. Această distribuție are o rată de eșec în creștere exponențială și este adesea adecvată pentru datele actuariale, deoarece riscul de mortalitate crește, de asemenea, exponențial în timp.

Distribuție Log-Logistică

Distribuția log-logistică este un model AFT cu un termen de eroare care urmează distribuției logistice standard. Se poate potrivi pericolelor non-monotonice și, în general, se potrivește cel mai bine atunci când pericolul de bază crește până la vârf și apoi cade, ceea ce poate fi plauzibil pentru anumite boli precum tuberculoza. Distribuția log-logistică nu este un model PH, dar este un model proporțional al cotelor. Aceasta înseamnă că este supus presupunerii proporționale a cotelor, dar avantajul este că coeficienții de pantă pot fi interpretați ca rapoarte de timp și, de asemenea, ca rapoarte de cote. Un raport de probabilități de 2 dintr-un model logistic-logistic parametric, de exemplu, ar fi interpretat ca șansa de supraviețuire dincolo de timpul t la subiecții cu x = 1 este de două ori șansa la subiecții cu x = 0.

Distribuție Gamma Generalizată (GG)

Distribuția gamma generalizată (GG) este de fapt o familie de distribuții care conține aproape toate distribuțiile cele mai frecvent utilizate, inclusiv distribuțiile exponențiale, Weibull, log normal și gamma. Acest lucru permite comparații între diferitele distribuții. Familia GG include, de asemenea, toate cele patru tipuri comune de funcții de pericol, ceea ce face distribuția GG deosebit de utilă, deoarece forma funcției de pericol poate ajuta la optimizarea selecției modelului.

Abordarea Splines

Deoarece singura limitare generală a specificației funcției de pericol de bază este thath (t)> 0 pentru toate valorile t, spline pot fi utilizate pentru flexibilitate maximă în modelarea formei pericolului de bază. Splinele cubice restricționate sunt o metodă care a fost recent recomandată în literatură pentru analiza parametrică a supraviețuirii, deoarece această metodă permite flexibilitate în formă, dar restricționează funcția să fie liniară la capetele unde datele sunt rare. Spline-urile pot fi utilizate pentru a îmbunătăți estimarea și sunt, de asemenea, avantajoase pentru extrapolare, deoarece maximizează adaptarea la datele observate. Dacă este specificat corect, estimările efectelor din modelele potrivite folosind spline nu ar trebui să fie părtinitoare. La fel ca în alte analize de regresie, provocările legate de montarea spline pot include alegerea numărului și locației nodurilor și problemele legate de supra-montare.

Cum examinați potrivirea modelului parametric?

Cea mai importantă componentă a evaluării potrivirii modelului parametric este de a verifica dacă datele acceptă forma parametrică specificată. Acest lucru poate fi evaluat vizual prin reprezentarea grafică a pericolului cumulativ bazat pe model în funcție de funcția de pericol cumulativ estimat Kaplan-Meier. Dacă forma specificată este corectă, graficul ar trebui să treacă prin origine cu o pantă de 1. Testul bunătății de potrivire Grønnesby-Borgan poate fi folosit și pentru a determina dacă numărul observat de evenimente este semnificativ diferit de numărul așteptat de evenimente în grupuri diferențiate în funcție de scorurile de risc. Acest test este extrem de sensibil la numărul de grupuri alese și tinde să respingă ipoteza nulă a potrivirii adecvate prea liberal dacă sunt alese multe grupuri, în special în seturi de date mici. Testul nu are putere pentru a detecta încălcările modelului, cu toate acestea, dacă sunt alese prea puține grupuri. Din acest motiv, nu este recomandat să ne bazăm doar pe un test de bună-potrivire pentru a determina dacă forma parametrică specificată este rezonabilă.

AIC poate fi, de asemenea, utilizat pentru a compara modelele rulate cu diferite forme parametrice, cu cel mai mic indicativ AIC pentru cea mai bună potrivire. AIC nu poate fi folosit pentru a compara modele parametrice și semi-parametrice, totuși, deoarece modelele parametrice se bazează pe timpii de eveniment observați, iar modelele semi-parametrice se bazează pe ordinea timpilor de eveniment. Din nou, aceste instrumente ar trebui utilizate pentru a examina dacă forma specificată se potrivește cu datele, dar plauzibilitatea pericolului subiacent specificat este în continuare cel mai important aspect al alegerii unei forme parametrice.

Odată ce forma parametrică specificată a fost stabilită pentru a se potrivi bine datelor, metode similare cu cele descrise anterior pentru modelele de pericol semi-proporționale pot fi utilizate pentru a alege între diferite modele, cum ar fi parcelele reziduale și testele de bună-potrivire.

Ce se întâmplă dacă predictorii se schimbă în timp?

În declarațiile model scrise mai sus, am presupus că expunerile sunt constante pe parcursul urmăririi. Expunerile cu valori care se schimbă în timp sau covariabile care variază în timp pot fi incluse în modelele de supraviețuire prin schimbarea unității de analiză de la individ la perioada de timp în care expunerea este constantă. Acest lucru împarte timpul-persoană al indivizilor în intervale pe care fiecare persoană le contribuie la setul de riscuri ale celor expuși și neexpuși pentru acea covariabilă. Principala presupunere a includerii în acest mod a unei covariate care variază în timp este că efectul covariatei care variază în timp nu depinde de timp.

Pentru un model de pericol proporțional cu Cox, includerea unei covariate care variază în timp ar lua forma: h (t) = h0 (t) e ^ β1x1 (t). Covariabilele care variază în timp pot fi, de asemenea, incluse în modelele parametrice, deși este puțin mai complicată și mai greu de interpretat. Modelele parametrice pot, de asemenea, să modeleze covariabile care variază în timp folosind spline pentru o mai mare flexibilitate.

În general, ar trebui utilizate covariabile care variază în timp atunci când se presupune că pericolul depinde mai mult de valorile ulterioare ale covariatei decât de valoarea covariatei la momentul inițial. Provocările care apar cu covariate variabile în timp lipsesc date despre covariate în diferite momente de timp și o potențială prejudecată în estimarea pericolului dacă covariata variabilă în timp este de fapt un mediator.

Ce este analiza riscurilor concurente?

Metodele tradiționale de analiză a supraviețuirii presupun că apare un singur tip de eveniment de interes. Cu toate acestea, există metode mai avansate pentru a permite investigarea mai multor tipuri de evenimente din același studiu, cum ar fi decesul din cauze multiple. Analiza riscurilor concurente este utilizată pentru aceste studii în care durata de supraviețuire este încheiată de primul dintre mai multe evenimente. Sunt necesare metode speciale, deoarece analizarea timpului pentru fiecare eveniment separat poate fi influențată. Mai exact în acest context, metoda KM tinde să supraestimeze proporția subiecților care se confruntă cu evenimente. Analiza riscurilor concurente utilizează metoda incidenței cumulative, în care probabilitatea generală a evenimentului în orice moment este suma probabilităților specifice evenimentului. Modelele sunt, în general, implementate prin introducerea fiecărui participant la studiu de mai multe ori - câte unul pe tip de eveniment. Pentru fiecare participant la studiu, timpul până la orice eveniment este cenzurat în funcție de momentul la care pacientul a experimentat primul eveniment. Pentru mai multe informații, vă rugăm să consultați pagina advancedepidemiology.org la riscuri concurente .

Ce sunt modelele de fragilitate și de ce sunt utile pentru date corelate?

Datele de supraviețuire corelate pot apărea din cauza evenimentelor recurente experimentate de un individ sau atunci când observațiile sunt grupate în grupuri. Fie din cauza lipsei de cunoștințe, fie pentru fezabilitate, este posibil ca unele covariabile legate de evenimentul de interes să nu fie măsurate. Modelele de fragilitate explică eterogenitatea cauzată de covariabile nemăsurate prin adăugarea de efecte aleatorii, care acționează în mod multiplicator asupra funcției de pericol. Modelele fragile sunt în esență extensii ale modelului Cox cu adăugarea de efecte aleatorii. Deși există diferite scheme de clasificare și nomenclatură utilizate pentru a descrie aceste modele, patru tipuri comune de modele de fragilitate includ fragilitatea partajată, imbricată, comună și aditivă.

Există alte abordări pentru analiza datelor despre evenimente recurente?

Datele evenimentelor recurente sunt corelate, deoarece pot apărea mai multe evenimente în cadrul aceluiași subiect. În timp ce modelele de fragilitate sunt o metodă pentru a explica această corelație în analizele de evenimente recurente, o abordare mai simplă care poate explica și această corelație este utilizarea erorilor standard robuste (SE). Prin adăugarea de SE robuste, analiza evenimentelor recurente poate fi făcută ca o simplă extensie a modelelor semiparametrice sau parametrice.

Deși este simplu de implementat, există mai multe moduri de a modela date recurente despre evenimente folosind SE-uri robuste. Aceste abordări diferă prin modul în care definesc riscul stabilit pentru fiecare recurență. În acest fel, ei răspund la întrebări de studiu ușor diferite, astfel încât alegerea abordării de modelare care trebuie utilizată ar trebui să se bazeze pe ipoteza studiului și pe validitatea ipotezelor de modelare.

Procesul de numărare, sau Andersen-Gill, abordarea modelării evenimentelor recurente presupune că fiecare recurență este un eveniment independent și nu ia în considerare ordinea sau tipul evenimentului. În acest model, timpul de urmărire pentru fiecare subiect începe la începutul studiului și este împărțit în segmente definite de evenimente (recurențe). Subiecții contribuie la riscul stabilit pentru un eveniment atâta timp cât sunt sub observație la acel moment (nu sunt cenzurați). Aceste modele sunt simple pentru a se potrivi ca un model Cox cu adăugarea unui estimator robust SE, iar raporturile de pericol sunt interpretate ca efectul covariatei asupra ratei de recurență în perioada de urmărire. Totuși, acest model ar fi inadecvat dacă presupunerea independenței nu este rezonabilă.

Abordările condiționate presupun că un subiect nu este în pericol pentru un eveniment ulterior până când nu are loc un eveniment anterior și, prin urmare, iau în considerare ordinea evenimentelor. Se potrivesc folosind un model stratificat, cu numărul evenimentului (sau numărul de recurență, în acest caz), ca variabilă a stratelor și incluzând SE-uri robuste. Există două abordări condiționate diferite care utilizează scale de timp diferite și, prin urmare, au seturi de risc diferite. Abordarea probabilității condiționate utilizează timpul de la începutul studiului pentru a defini intervalele de timp și este adecvat atunci când interesul se află pe parcursul întregului proces de evenimente recurente. Abordarea gap time resetează în mod esențial ceasul pentru fiecare recurență utilizând timpul de la evenimentul anterior pentru a defini intervalele de timp și este mai adecvat atunci când estimările efectului specific evenimentului (sau recurenței) sunt de interes.

În cele din urmă, abordările marginale (cunoscute și sub numele de abordarea WLW - Wei, Lin și Weissfeld) consideră că fiecare eveniment este un proces separat, astfel încât subiecții sunt expuși riscului tuturor evenimentelor de la începutul urmăririi, indiferent dacă au experimentat o eveniment anterior. Acest model este adecvat atunci când se crede că evenimentele rezultă din diferite procese subiacente, astfel încât un subiect să poată experimenta un al treilea eveniment, de exemplu, fără a experimenta primul. Deși această presupunere pare neverosimilă cu unele tipuri de date, cum ar fi recidivele cancerului, ar putea fi utilizată pentru a modela recidivele leziunilor pe o perioadă de timp, când subiecții ar putea experimenta diferite tipuri de leziuni în perioada de timp care nu au o ordine naturală. Modelele marginale pot fi, de asemenea, potrivite folosind modele stratificate cu SE robuste.

Lecturi

Acest proiect și-a propus să descrie deciziile metodologice și analitice cu care se poate confrunta atunci când se lucrează cu date despre timpul până la eveniment, dar nu este deloc exhaustiv. Resursele sunt furnizate mai jos pentru a aprofunda aceste subiecte.

Manuale și capitole

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Metode de regresie în biostatistică, 2nd New York, NY: Springer.

  • Text introductiv la modelele liniare, logistice, de supraviețuire și măsuri repetate, cel mai potrivit pentru cei care doresc un punct de plecare de bază.

  • Capitolul Analiza supraviețuirii oferă o imagine de ansamblu bună, dar nu profunzime. Exemple sunt bazate pe STATA.

Hosmer DW, Lemeshow S, mai S. (2008) Analiza supraviețuirii aplicate: modelarea prin regresie a datelor timp-eveniment, ediția a II-a. Hoboken, NJ: John Wiley & Sons, Inc.

  • Prezentare detaliată a modelelor Cox non-parametrice, semi-parametrice și parametrice, cea mai bună pentru cele care sunt informate în alte domenii ale statisticii. Tehnicile avansate nu sunt acoperite în profunzime, dar sunt furnizate referințe la alte manuale de specialitate.

Kleinbaum DG, Klein M (2012). Analiza supraviețuirii: un text de auto-învățare, ediția a III-a. New York, NY: Springer Science + Business Media, LLC

  • Excelent text introductiv

Klein JP, Moeschberger ML (2005). Analiza supraviețuirii: tehnici pentru datele cenzurate și trunchiate, ediția a II-a. New York, NY: Springer Science + Business Media, LLC

  • concepută pentru studenții absolvenți, această carte oferă multe exemple practice

Therneau TM, Grambsch PM (2000). Modelarea datelor de supraviețuire: extinderea modelului Cox. New York, NY: Springer Science + Business Media, LLC

  • O bună introducere în abordarea procesului de numărare și analiza datelor de supraviețuire corelate. Autorul a scris și pachetul de supraviețuire în R.

Allison PD (2010). Analiza supraviețuirii folosind SAS: Un ghid de practică, ediția a II-a. Cary, NC: Institutul SAS

  • Un text aplicat excelent pentru utilizatorii SAS

Bagdonavicius V, Nikulin M (2002). Modele de viață accelerate: modelare și analiză statistică. Boca Raton, FL: Chapman & Hall / CRC Press.

  • Resursă bună pentru mai multe informații despre modelele de timp de avarie accelerate parametrice și semi-parametrice și cum se compară cu modelele de pericol proporționale

Articole metodologice

Articole introductive / de ansamblu

Hougaard P (1999). Bazele datelor de supraviețuire. Biometrie 55 (1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analiza supraviețuirii partea I: concepte de bază și prime analize. Br J Cancer 89 (2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analiza supraviețuirii partea II: analiza datelor multivariate - o introducere în concepte și metode. Br J Cancer 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analiza supraviețuirii partea II: analiza datelor multivariate - alegerea unui model și evaluarea adecvării și potrivirii acestuia. Br J Cancer 89 (4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analiza supraviețuirii partea IV: concepte și metode suplimentare în analiza supraviețuirii. Br J Cancer 89 (5): 781-6. PMID: 12942105

  • Seria de patru articole de mai sus este o prezentare introductivă excelentă a metodelor în analiza supraviețuirii, care este extrem de bine scrisă și ușor de înțeles - este foarte recomandată.

Vârsta ca scară de timp

Korn EL, Graubard BI, Midthune D (1997). Analiza timp-eveniment a urmăririi longitudinale a unui sondaj: alegerea scalei de timp. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • Lucrare care susține utilizarea vârstei ca scară de timp, mai degrabă decât ca timp de studiu.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Analiza timp-eveniment a urmăririi longitudinale a unui sondaj: alegerea scalei de timp. Am J Epidemiol 146 (6): 528-9. PMID: 9290515 .

  • Comentați lucrarea Korn care descrie măsurile de precauție pe care trebuie să le luați atunci când utilizați vârsta ca scară de timp.

Thiébaut AC, Bénichou J (2004). Alegerea scalei de timp în analiza modelului Cox a datelor epidemiologice de cohortă: un studiu de simulare. Stat Med 30; 23 (24): 3803-20. PMID: 15580597

  • Studiu de simulare care arată magnitudinea tendințelor pentru diferite grade de asociere între vârstă și covariata de interes atunci când se utilizează timpul pe studiu ca scară de timp.

Canchola AJ, Stewart SL, Bernstein L și colab. Regresia Cox utilizând diferite scale de timp. Disponibil la: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • O lucrare frumoasă care compară 5 modele de regresie Cox cu variații ale timpului de studiu sau al vârstei ca scară de timp cu codul SAS.

Cenzurare

Huang CY, Ning J, Qin J (2015). Diferența de probabilitate semiparametrică pentru datele trunchiate la stânga și cenzurate la dreapta. Biostatistică [epub] PMID: 25796430 .

  • Această lucrare are o introducere frumoasă în analiza datelor cenzurate și oferă o nouă procedură de estimare pentru distribuția timpului de supraviețuire cu date trunchiate la stânga și date cenzurate la dreapta. Este foarte dens și are un accent statistic avansat.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Bias datorită trunchierii la stânga și cenzurării la stânga în studiile longitudinale ale proceselor de dezvoltare și de boală. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • O resursă excelentă care explică părtinirea inerentă datelor cenzurate de stânga dintr-o perspectivă epidemiologică.

Sun J, Sun L, Zhu C (2007). Testarea modelului de cote proporționale pentru date cenzurate pe intervale. Analize de date pe viață 13: 37-50. PMID 17160547 .

  • Un alt articol dens din punct de vedere statistic despre un aspect nuanțat al analizei datelor TTE, dar oferă o explicație bună a datelor cenzurate pe intervale.

Robins JM (1995a) O metodă analitică pentru studii randomizate cu cenzurare informativă: Partea I. Analiza datelor pe toată durata vieții 1: 241-254. PMID 9385104 .

Robins JM (1995b) O metodă analitică pentru studii randomizate cu cenzurare informativă: Partea II. Analiza datelor pe viață 1: 417–434. PMID 9385113 .

  • Două lucrări care discută despre metodele de tratare a cenzurii informative.

Metode de supraviețuire non-parametrice

Borgan Ø (2005) Estimator Kaplan-Meier. Enciclopedia Biostatisticii DOI: 10.1002 / 0470011815.b2a11042

  • Privire de ansamblu excelentă asupra estimatorului Kaplan-Meier și a relației sale cu estimatorul Nelson-Aalen

Rodríguez G (2005). Estimarea non-parametrică în modelele de supraviețuire. Disponibil de la: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Introducere în metodele non-parametrice și modelul de pericol proporțional Cox care explică relațiile dintre metode cu formulele matematice

Cole SR, Hernan MA (2004). Curbe de supraviețuire ajustate cu greutăți de probabilitate inversă. Metode de calcul Programe Biomed 75 (1): 35-9. PMID: 15158046

  • Descrie utilizarea IPW pentru a crea curbe Kaplan-Meier ajustate. Include un exemplu și macro SAS.

Zhang M (2015). Metode robuste de îmbunătățire a eficienței și reducerea prejudecății în estimarea curbelor de supraviețuire în studiile clinice randomizate. Analiza datelor pe viață 21 (1): 119-37. PMID: 24522498

  • Metoda propusă pentru curbele de supraviețuire ajustate covariabil în ECA

Metode de supraviețuire semi-parametrice

Cox DR (1972) Modele de regresie și tabele de viață (cu discuție). J R Statist Soc B 34: 187-220.

buckley v valeo semnificație
  • Referința clasică.

Christensen E (1987) Analiză de supraviețuire multivariată utilizând modelul de regresie al lui Cox. Hepatologie 7: 1346-1358. PMID 3679094 .

  • Descrie utilizarea modelului Cox folosind un exemplu motivant. Revizuire excelentă a aspectelor cheie ale analizei modelului Cox, inclusiv modul de potrivire a unui model Cox și verificarea ipotezelor modelului.

Grambsch PM, Therneau TM (1994) Testele de riscuri proporționale și diagnosticarea pe baza reziduurilor ponderate. Biometrika 81: 515-526.

  • O lucrare aprofundată despre testarea presupunerii proporționale a pericolelor. Un amestec bun de teorie și explicații statistice avansate.

Ng’andu NH (1997) O comparație empirică a testelor statistice pentru evaluarea presupunerii proporționale a pericolelor modelului Cox. Stat Med 16: 611-626. PMID 9131751 .

  • O altă lucrare aprofundată cu privire la testarea ipotezei proporționale a pericolelor, aceasta include discutarea verificării reziduurilor și a efectelor cenzurii.

Metode de supraviețuire parametrice

Rodrguez, G (2010). Modele de supraviețuire parametrice. Disponibil de la: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • scurtă introducere la cele mai frecvente distribuții utilizate în analiza parametrică de supraviețuire

Nardi A, Schemper M (2003). Compararea modelelor Cox și parametrice în studii clinice.Stat Med 22 (23): 2597-610. PMID: 14652863

  • Oferă exemple bune de comparare a modelelor semi-parametrice cu modelele care utilizează distribuții parametrice comune și se concentrează pe evaluarea potrivirii modelului

Royston P, Parmar MK (2002). Modele flexibile parametrice proporționale de pericole și cote proporționale pentru datele de supraviețuire cenzurate, cu aplicare la modelarea prognostică și estimarea efectelor tratamentului. Stat Med 21 (15): 2175-97. PMID: 12210632

  • O explicație bună pentru elementele de bază ale modelelor de riscuri și cote proporționale și comparațiile cu spline cubice

Cox C, Chu H, Schneider MF, Muñoz A (2007). Analiza de supraviețuire parametrică și taxonomia funcțiilor de pericol pentru distribuția gamma generalizată. Statist Med 26: 4352–4374. PMID 17342754 .

  • Oferă o imagine de ansamblu excelentă asupra metodelor de supraviețuire parametrice, inclusiv o taxonomie a funcțiilor de pericol și o discuție aprofundată a familiei de distribuție gamma generalizată.

Crowther MJ, Lambert PC (2014). Un cadru general pentru analiza parametrică de supraviețuire. Stat Med 33 (30): 5280-97. PMID: 25220693

  • Descrie ipotezele restrictive ale distribuțiilor parametrice utilizate în mod obișnuit și explică metodologia restricționată a splinei cubice

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Modele de supraviețuire parametrice pentru date cenzurate pe intervale cu covariabile dependente de timp. Biometrie 7 (4): 599-614. PMID: 16597670

  • Extensie și exemplu de utilizare a modelelor parametrice cu date cenzurate pe intervale

Covariate variabile în timp

Fisher LD, Lin DY (1999). Covariabile dependente de timp în modelul de regresie a riscurilor proporționale Cox. Annu Rev Health Public 20: 145-57. PMID: 10352854

  • Explicație temeinică și ușor de înțeles a covariabilelor care variază în timp în modelele Cox, cu o apendice matematică

Petersen T (1986). Montarea modelelor parametrice de supraviețuire cu covariabile dependente de timp. Appl Statist 35 (3): 281-88.

  • Articol dens, dar cu un exemplu util aplicat

Analiza riscurilor concurente

Vezi Riscurile concurente

Tai B, Machin D, White I, Gebski V (2001) Analiza riscurilor concurente la pacienții cu osteosarcom: o comparație a patru abordări diferite. Stat Med 20: 661-684. PMID 11241570 .

  • O lucrare aprofundată bună care descrie patru metode diferite de analiză a datelor de riscuri concurente și utilizează datele dintr-un studiu randomizat al pacienților cu osteosarcom pentru a compara aceste patru abordări.

Checkley W, Brower RG, Muñoz A (2010). Inferință pentru evenimente concurente care se exclud reciproc printr-un amestec de distribuții gamma generalizate. Epidemiologie 21 (4): 557-565. PMID 20502337 .

  • Lucrare privind riscurile concurente folosind distribuția gamma generalizată.

Analiza datelor grupate și a modelelor de fragilitate

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Modele de pericole proporționale cu efecte aleatorii pentru a examina efectele centrale în studiile clinice cu cancer multicentric. Stat Methods Med Res 11: 221-236. PMID 12094756 .

  • O lucrare cu o explicație teoretică și matematică excelentă a luării în considerare a clusterizării atunci când se analizează datele de supraviețuire din studiile clinice multi-centru.

O'Quigley J, Stare J (2002) Modele de pericole proporționale cu fragilități și efecte aleatorii. Stat Med 21: 3219–3233. PMID 12375300 .

  • O comparație cap la cap a modelelor de fragilitate și a modelelor cu efecte aleatorii.

Balakrishnan N, Peng Y (2006). Model generalizat de fragilitate gamma. Statist Med 25: 2797-2816. PMID

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: Un pachet R pentru analiza datelor de supraviețuire corelate cu modele de fragilitate care utilizează estimarea probabilității penalizate sau estimarea parametrică. Journal of Statistical Software 47 (4): 1-28.

  • Vigneta pachetului R cu informații de fundal bune despre modelele de fragilitate.

Schaubel DE, Cai J (2005). Analiza datelor grupate de evenimente recurente cu aplicarea ratelor de spitalizare la pacienții cu insuficiență renală. Biostatistică 6 (3): 404-19. PMID 15831581 .

  • O lucrare excelentă în care autorii prezintă două metode pentru a analiza datele recurente de evenimente grupate și apoi compară rezultatele din modelele propuse cu cele bazate pe un model de fragilitate.

Gharibvand L, Liu L (2009). Analiza datelor de supraviețuire cu evenimente grupate. SAS Global Forum 2009 Document 237-2009.

  • Sursă simplă și ușor de înțeles pentru analiza datelor timp-eveniment cu evenimente grupate cu proceduri SAS.

Analiza evenimentelor recurente

Twisk JW, Smidt N, de Vente W (2005). Analiza aplicată a evenimentelor recurente: o privire de ansamblu practică. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Introducere foarte ușor de înțeles la modelarea evenimentelor recurente și la conceptul de seturi de riscuri

Villegas R, Juliá O, Ocaña J (2013). Studiu empiric al timpilor de supraviețuire corelați pentru evenimente recurente cu margini de pericole proporționale și efectul corelației și cenzurării.BMC Med Res Methodol 13:95. PMID: 23883000

  • Folosește simulări pentru a testa robustețea diferitelor modele pentru date de evenimente recurente

Kelly PJ, Lim LL (2000). Analiza supraviețuirii pentru datele evenimentelor recurente: o aplicație pentru bolile infecțioase ale copilăriei. Stat Med 19 (1): 13-33. PMID: 10623190

  • Exemple aplicate ale celor patru abordări principale pentru modelarea datelor de evenimente recurente

Wei LJ, Lin DY, Weissfeld L (1989). Analiza regresiei datelor de timp de eșec incomplete multivariate prin modelarea distribuțiilor marginale. Jurnalul Asociației Americane de Statistică 84 (108): 1065-1073

Articolul original care descrie modele marginale pentru analiza evenimentelor recurente

Cursuri

Epidemiologie și sănătatea populației Institutul de vară de la Columbia University (EPIC)

Statistical Horizons, furnizor privat de seminarii statistice de specialitate predate de experți în domeniu

Consorțiul interuniversitar pentru cercetare politică și socială (ICPSR) Program de vară în metode cantitative de cercetare socială, parte a Institutului pentru cercetări sociale de la Universitatea din Michigan

  • Seminar de 3 zile despre analiza supraviețuirii, modelarea istoricului evenimentelor și analiza duratei oferit în perioada 22-24 iunie 2015 la Berkeley, CA, predat de Tenko Raykov de la Michigan State University. Prezentare cuprinzătoare a metodelor de supraviețuire între discipline (nu numai sănătatea publică): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Institute for Statistics Research oferă două cursuri online pentru analiza supraviețuirii, oferite de mai multe ori pe an. Aceste cursuri se bazează pe manualul de analiză aplicată de Klein și Kleinbaum (vezi mai jos) și pot fi luate à la carte sau ca parte a unui program de certificat în Statistici:

Institutul pentru Cercetare Digitală și Educație de la UCLA oferă ceea ce ei numesc seminare prin intermediul site-ului web pentru analiza supraviețuirii în diferite programe statistice. Aceste seminarii demonstrează modul de efectuare a analizei supraviețuirii aplicate, concentrându-se mai mult pe cod decât pe teorie.

Articole Interesante

Alegerea Editorului

Programul de Biotehnologie M. A.
Programul de Biotehnologie M. A.
COVID-19: O Pandemie globală
COVID-19: O Pandemie globală
Centrul Național de Pregătire pentru Dezastre de la Institutul Pământului lucrează pentru a înțelege și a îmbunătăți capacitatea națiunii de a se pregăti, de a răspunde și de a se recupera după dezastre. NCDP se concentrează pe disponibilitatea sistemelor guvernamentale și neguvernamentale; complexitatea recuperării populației; puterea implicării comunității; și riscurile vulnerabilității umane, cu un accent deosebit pe copii.
Alumni lansează „Semper Fi”, cu Jai Courtney
Alumni lansează „Semper Fi”, cu Jai Courtney
Trei absolvenți Columbia au lansat Semper Fi, un lungmetraj cu Jai Courtney în rol principal și distribuit de Lionsgate, la începutul acestei luni. Filmul este produs de alumna Karina Miller ’04, co-scris de absolventul Sean Mullin ’06 și co-scris și regizat de absolventul Henry-Alex Rubin ’95.
Fumătorii de țigări sunt de cinci ori mai susceptibili de a fi consumatori zilnici de marijuana
Fumătorii de țigări sunt de cinci ori mai susceptibili de a fi consumatori zilnici de marijuana
Utilizarea zilnică a marijuanei a crescut în ultimul deceniu. Acum, un nou studiu realizat de cercetătorii de la Școala de Sănătate Publică Mailman a Universității Columbia și de la Școala Absolventă de Sănătate Publică și Politici de Sănătate, Universitatea din New York, a constatat că fumătorii de țigări sunt de 5 ori mai predispuși să consume marijuana zilnic. Utilizarea marijuanei a avut loc aproape exclusiv printre
Biostatistică
Biostatistică
Columbia Biostatistics îi pregătește pe studenți să facă cercetări corespunzătoare care să îmbunătățească lumea. Aflați mai multe despre departament astăzi.
Recenzie: „Până la sfârșitul timpului”
Recenzie: „Până la sfârșitul timpului”
Louis Armstrong Jazz Performance Program
Louis Armstrong Jazz Performance Program
De la fondarea sa în 2001, Louis Armstrong Jazz Performance Program (LAJPP) a crescut dramatic. Acest program vibrant cuprinde acum șaptesprezece ansambluri de jazz, paisprezece muzicieni de jazz profesioniști talentați care oferă lecții private și antrenor de ansamblu, un program de master artist în vizită, cursuri de improvizație și compoziție jazz și o concentrare specială în jazz.