Print Page - [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023

Title: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: Starki on October 01, 2022, 23:05:40 pm

Σχολιασμός και απορίες πάνω στις διάφορες ασκήσεις του μαθήματος.

Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: MajorTom on November 10, 2022, 01:50:16 am

Στις ασκήσεις 3.10 και 3.11 ποια η διαφορά της τυχαίας αντιμετάθεσης με τη bootstrap μέθοδο;

Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: noreason on November 11, 2022, 14:55:33 pm

Στη δημιουργία των δειγμάτων bootstrap, η επιλογή τιμών από το αρχικό δείγμα γίνεται με επανάθεση, ενώ στην τυχαία αντιμετάθεση χωρίς.

Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: MajorTom on November 11, 2022, 15:09:44 pm

Quote from: noreason on November 11, 2022, 14:55:33 pm

Για την bootstrap άρα μπορώ να κάνω τη δειγματοληψία έτσι;

Code:

     bootX = bootstrp(B, @mean, X);
    bootY = bootstrp(B, @mean, Y);
    bootZ = bootX - bootY;       
    r = find(bootZ == muX(j)-muY(j)); 
   [...]

Ενώ για την τυχαία αντιμετάθεση:

Code:

    [~, index] = sort(rand(n+m, M));
   sampled_data = zeros(n+m, M);
    for i=1:M
        sampled_data(:,i) = data(index(:,i));
        samplesX(:,i) = sampled_data(1:n,i);
        samplesY(:,i) = sampled_data(n+1:n+m,i);
    end

Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: noreason on November 11, 2022, 23:29:20 pm

Εγώ αυτό που κατάλαβα είναι ότι για κάθε bootstrap διαλέγεις n+m τιμές από τις συνολικές n+m (δηλαδή είτε από χ είτε από y) και οι πρώτες n που διάλεξες είναι τα bootX και οι υπόλοιπες τα bootΥ
Στην αντιμετάθεση δεν κατάλαβα ακριβώς τι έκανες, αλλά είναι σαν το bootstrap χωρίς επανάθεση

Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: Black Velvet on January 20, 2023, 14:42:17 pm

στην 3.10, έχω φτιάξει τον πίνακα X - x_bar + m0 και τον έχω κάνει bootstrap. Πρέπει να προσθέσω σε κάθε στήλη το στατιστικό το οποίο είναι η δειγματική μέση τιμή κάθε στήλης του Χ; Και μετά από αυτό κάνω sort και βρίσκω το index της μέσης τιμής σε κάθε στήλη και συγκρίνω με τα όρια; ή έχω καταλάβει κάτι λάθος;

Title: Re: [Ανάλυση Δεδομένων] Απορίες στις Ασκήσεις 2022/2023
Post by: MajorTom on January 20, 2023, 15:44:50 pm

Quote from: Black Velvet on January 20, 2023, 14:42:17 pm

Εγώ αυτό είχα κάνει:

Code:

           bootMean = NaN(B+1, M); 
            X_norm = X - mu - m0;
            bootMean(1:B, :) = bootstrp(B, @mean, X_norm);
            bootMean(B+1, :) = mu;
            bootMean = sort(bootMean);
            rejection = 0;
            for k=1:M
                r = find(bootMean(:,k) == mu(k));
                if r < (B+1)*alpha(i)/2 || r > (B+1)*(1-alpha(i)/2)
                    rejection = rejection + 1;
                end
            end

THMMY.gr

Μαθήματα Κύκλου Ηλεκτρονικής & Υπολογιστών => Ανάλυση Δεδομένων => Topic started by: Starki on October 01, 2022, 23:05:40 pm