Modele de separation

La séparation quasi-complète dans une régression logistique/probit se produit lorsque la variable de résultat sépare une variable de prédicteur ou une combinaison de variables prédictitrices à un certain degré. Voici un exemple. Nous voyons que SAS a utilisé les 10 observations et il a donné des avertissements à différents points. Il nous a informés qu`il a détecté une séparation quasi-complète des points de données. Il est intéressant de remarquer que ni l`estimation de paramètre pour x1 ou pour l`interception signifient beaucoup du tout. Une séparation complète se produit lorsque la variable de résultat sépare complètement une variable de prédicteur ou une combinaison de variables prédictitrices. Albert et Anderson (1984) définissent ceci comme, „il y a un vecteur α qui alloue correctement toutes les observations à leur groupe.“ Voici un petit exemple. SPSS a tenté d`itérer au nombre d`itérations par défaut et n`a pas pu atteindre une solution et a ainsi arrêté le processus d`itération. Il ne nous a rien dit sur la sépara tion quasi complète. C`est donc à nous de comprendre pourquoi le calcul n`a pas convergé.

Une évidence évidente dans cet exemple est la grande magnitude de l`estimation de paramètre pour x1. Il est vraiment grand et son erreur standard est encore plus grande. Sur la base de cet élément de preuve, nous devrions examiner la relation entre la variable de résultat y et x1. Par exemple, nous pouvons jeter un oeil à la tabulation croisée de x1 par y comme suit. Maintenant, nous avons une certaine compréhension de ce que la séparation complète ou quasi-complète est, une question immédiate est ce que les techniques sont pour traiter la question. Nous allons donner une description générale et brève sur quelques techniques pour traiter le problème avec l`exemple de code d`illustration dans SAS. Notez que ces techniques peuvent être disponibles dans d`autres paquets, par exemple, l`utilisateur de stata écrit la commande firthlogit. Disons que la variable de prédicteur impliquée dans la séparation complète quasi-complète est appelée X. Le seul avertissement que nous obtenons de R est juste après la commande GLM au sujet des probabilités prévues étant 0 ou 1. À partir des estimations de paramètre, nous pouvons voir que le coefficient pour x1 est très grand et son erreur standard est encore plus grande, une indication que le modèle peut avoir quelques problèmes avec x1. Sur la base de cet élément de preuve, nous devrions examiner la relation entre la variable de résultat y et x1 de façon descriptive, comme illustré ci-dessous.

L`inspection visuelle nous indique qu`il y a un problème avec la séparation quasi-complète impliquant la variable x1. Par exemple, si le prédicteur X est continu, et le résultat y = 1 pour tous les x > 2 observés. Si les valeurs de résultat sont parfaitement déterminées par le prédicteur (p. ex., y = 0 quand x ≤ 2), alors la condition «séparation complète» est dite se produire.

La séparation quasi-complète dans une régression logistique/probit se produit lorsque la variable de résultat sépare une variable de prédicteur ou une combinaison de variables prédictitrices à un certain degré. Voici un exemple. Nous voyons que SAS a utilisé les 10 observations et il a donné des avertissements à différents points. Il nous a informés qu`il […] , 2019