THMMY.gr

Μαθήματα Κύκλου Ηλεκτρονικής & Υπολογιστών => Ανάλυση Δεδομένων => Topic started by: Starki on October 01, 2022, 23:05:40 pm



Title: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: Starki on October 01, 2022, 23:05:40 pm
Σχολιασμός και απορίες πάνω στις διάφορες ασκήσεις του μαθήματος.


Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: MajorTom on November 10, 2022, 01:50:16 am
Στις ασκήσεις 3.10 και 3.11 ποια η διαφορά της τυχαίας αντιμετάθεσης με τη bootstrap μέθοδο;


Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: noreason on November 11, 2022, 14:55:33 pm
Στη δημιουργία των δειγμάτων bootstrap, η επιλογή τιμών από το αρχικό δείγμα γίνεται με επανάθεση, ενώ στην τυχαία αντιμετάθεση χωρίς.


Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: MajorTom on November 11, 2022, 15:09:44 pm
Στη δημιουργία των δειγμάτων bootstrap, η επιλογή τιμών από το αρχικό δείγμα γίνεται με επανάθεση, ενώ στην τυχαία αντιμετάθεση χωρίς.

Για την bootstrap άρα μπορώ να κάνω τη δειγματοληψία έτσι;

Code:
     bootX = bootstrp(B, @mean, X);
    bootY = bootstrp(B, @mean, Y);
    bootZ = bootX - bootY;      
    r = find(bootZ == muX(j)-muY(j));
   [...]

Ενώ για την τυχαία αντιμετάθεση:

Code:
    [~, index] = sort(rand(n+m, M));
   sampled_data = zeros(n+m, M);
    for i=1:M
        sampled_data(:,i) = data(index(:,i));
        samplesX(:,i) = sampled_data(1:n,i);
        samplesY(:,i) = sampled_data(n+1:n+m,i);
    end



Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: noreason on November 11, 2022, 23:29:20 pm
Εγώ αυτό που κατάλαβα είναι ότι για κάθε bootstrap διαλέγεις n+m τιμές από τις συνολικές n+m (δηλαδή είτε από χ είτε από y) και οι πρώτες n που διάλεξες είναι τα bootX και οι υπόλοιπες τα bootΥ
Στην αντιμετάθεση δεν κατάλαβα ακριβώς τι έκανες, αλλά είναι σαν το bootstrap χωρίς επανάθεση


Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: Black Velvet on January 20, 2023, 14:42:17 pm
στην 3.10, έχω φτιάξει τον πίνακα X - x_bar + m0 και τον έχω κάνει bootstrap. Πρέπει να προσθέσω σε κάθε στήλη το στατιστικό το οποίο είναι η δειγματική μέση τιμή κάθε στήλης του Χ; Και μετά από αυτό κάνω sort και βρίσκω το index της μέσης τιμής σε κάθε στήλη και συγκρίνω με τα όρια; ή έχω καταλάβει κάτι λάθος;


Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: MajorTom on January 20, 2023, 15:44:50 pm
στην 3.10, έχω φτιάξει τον πίνακα X - x_bar + m0 και τον έχω κάνει bootstrap. Πρέπει να προσθέσω σε κάθε στήλη το στατιστικό το οποίο είναι η δειγματική μέση τιμή κάθε στήλης του Χ; Και μετά από αυτό κάνω sort και βρίσκω το index της μέσης τιμής σε κάθε στήλη και συγκρίνω με τα όρια; ή έχω καταλάβει κάτι λάθος;

Εγώ αυτό είχα κάνει:

Code:
           bootMean = NaN(B+1, M); 
            X_norm = X - mu - m0;
            bootMean(1:B, :) = bootstrp(B, @mean, X_norm);
            bootMean(B+1, :) = mu;
            bootMean = sort(bootMean);
            rejection = 0;
            for k=1:M
                r = find(bootMean(:,k) == mu(k));
                if r < (B+1)*alpha(i)/2 || r > (B+1)*(1-alpha(i)/2)
                    rejection = rejection + 1;
                end
            end