Αναπαραγωγή αποτελεσμάτων από το pd.merge στο SQL;

ψήφοι
18

Παίζω με ορισμένα σύνολα δεδομένων τοπικά στο Python, και τώρα προσπαθώ να επαναλάβω τα ίδια αποτελέσματα σε ένα περιβάλλον cloud με SQL.

Έχω 3 πίνακες, ο καθένας με πολλαπλά διπλά αναγνωριστικά. Για παράδειγμα, ο πίνακας Α θα περιέχει αναγνωριστικά a, b, c, d, ... , ο πίνακας B θα περιέχει αναγνωριστικά a, c, e, a1, a2 ... και ο πίνακας Γ θα περιέχει αναγνωριστικά d, f, a2, b1, b2, ...

Τώρα κάνω pd.merge για τον πίνακα Α και τον πίνακα Β στην ταυτότητα a και τον πίνακα Γ με τον πίνακα που προκύπτει από την πρώτη συγχώνευση στο ID a2 . Κατά τη χρήση του pd.merge, παρατήρησα ότι θα προσθέσει ένα _x ή α _y στα διπλότυπα αναγνωριστικά (από αυτό, εννοώ στην πρώτη pd.merge του πίνακα Α και του πίνακα Β, c από τον πίνακα Α θα γινόταν c_x , και c από τον πίνακα Β θα γινόταν c_y και ούτω καθεξής για οποιαδήποτε άλλη διπλή ταυτότητα. Το ίδιο θα ισχύει για οποιαδήποτε άλλη διπλή ταυτότητα για τυχόν συνδέσεις.

Πώς θα μπορούσα να επαναλάβω αυτήν τη διαδικασία και να παρακάμψω το πρόβλημα με διπλότυπα αναγνωριστικά στο SQL;

Δημοσιεύθηκε 26/05/2020 στις 03:30
πηγή χρήστη
Σε άλλες γλώσσες...                            


1 απαντήσεις

ψήφοι
0

Νομίζω ότι μπορείτε να μετονομάσετε τις υπόλοιπες συνδεδεμένες στήλες με νέα ονόματα:

SELECT table_A.ID_a, table_A.c_ID as c_ID_from_A, table_B.c_ID as c_ID_from_B
FROM table_A
JOIN table_B ON(table_A.ID_a = table_B.ID_a)

Ελπίζω να το βρείτε χρήσιμο.

Απαντήθηκε 10/06/2020 στις 15:51
πηγή χρήστη

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more