Αποσαφήνιση της έννοιας της «φορτώσεις» χρησιμοποιώντας Sklearn

ψήφοι
1

Έχω διαβάσει για το PCA στην sklearn, ειδικά τις σχέσεις μεταξύ των χαρακτηριστικών και των συστατικών του. Είμαι ιδιαίτερα ενδιαφέρονται για τον εντοπισμό χαρακτηριστικό σημασία σε σχέση με ένα ζευγάρι των κύριων συστατικών. Ωστόσο, βρήκα μερικές θέσεις που λένε διαφορετικά πράγματα.

Για παράδειγμα, στις 3 απαντήσεις σε αυτή τη θέση συζητούνται τα ιδιοδιανύσματα και φορτίσεις. Ιδιαίτερα, είναι αναφέρεται ότι pca.components_.T * np.sqrt(pca.explained_variance_)δείχνει τα φορτία συστατικό των χαρακτηριστικών. Γιατί sqrtχρησιμοποιείται εδώ;

Ωστόσο, σε αυτήν την απάντηση αναφέρεται ότι abs(pca.components_)σας δίνει τη δυνατότητα σημασία σε κάθε συστατικό. Αυτό φαίνεται να έρχονται σε αντίθεση με ό, τι αναφέρεται παραπάνω, ναι;

Επιπλέον, μου λείπει να κατανοήσουν πώς αυτή απαντά στο ερώτημα: I think what you call the loadings is the result of the projection for each sample into the vector space spanned by the components. Those can be obtained by calling pca.transform(X_train) after calling pca.fit(X_train).Αλλά αυτό δεν είναι σωστό: φορτίσεις αφορούν το συντελεστή του κάθε χαρακτηριστικό γνώρισμα για τα κύρια συστατικά, και όχι δείγματα. Συμφωνώ?

Θα εκτιμούσα πραγματικά κάποια διευκρίνιση εδώ.

Δημοσιεύθηκε 09/10/2019 στις 18:57
πηγή χρήστη
Σε άλλες γλώσσες...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more