• Downloads
  • ! Read Me !
  • Μαθήματα
  • Φοιτητικά
  • Τεχνικά Θέματα
  • Συζητήσεις
  • Happy Hour!
  • About THMMY.gr
 V  < 
Search:  
Welcome, Guest. Please login or register.
June 16, 2025, 20:46:02 pm

Login with username, password and session length
Links
  Thmmy.gr portal
   Forum
   Downloads
   Ενεργ. Λογαριασμού
   Επικοινωνία
  
  Χρήσιμα links
   Σελίδα τμήματος
   Βιβλιοθήκη Τμήματος
   Elearning
   Φοιτητικά fora
   Πρόγραμμα Λέσχης
   Πρακτική Άσκηση
   Ηλεκτρονική Εξυπηρέτηση Φοιτητών
   Διανομή Συγγραμμάτων
   Ψηφιακό Καταθετήριο Διπλωματικών
   Πληροφορίες Καθηγητών
   Instagram @thmmy.gr
   mTHMMY
  
  Φοιτητικές Ομάδες
   ACM
   Aristurtle
   ART
   ASAT
   BEAM
   BEST Thessaloniki
   EESTEC LC Thessaloniki
   EΜΒ Auth
   IAESTE Thessaloniki
   IEEE φοιτητικό παράρτημα ΑΠΘ
   SpaceDot
   VROOM
   Panther
  
Πίνακας Ελέγχου
Welcome, Guest. Please login or register.
June 16, 2025, 20:46:02 pm

Login with username, password and session length

Αναζήτηση

Google

THMMY.gr Web
Πρόσφατα
[Σ.Π.Η.Ε.] Γενικές απορίε...
by Nikos_313
[Today at 19:49:00]

[ΘΤΠΑ] Γενικές απορίες κα...
by Nikos_313
[Today at 16:56:56]

[Εφ.Θερμοδυναμική] Γενικέ...
by Λαμπτήρας
[Today at 15:55:08]

[Αρχές Οικονομίας] Να επι...
by _Trob
[Today at 13:28:21]

[Σ.Α.Π.Γ.] Εργασία 2025
by Nikos_313
[Today at 12:13:45]

Αποτελέσματα Εξεταστικής ...
by Nikos_313
[Today at 12:01:53]

Πρακτική Άσκηση ΤΗΜΜΥ 201...
by George_RT
[Today at 10:22:18]

[Διανεμημένη Παραγωγή] Γε...
by Διάλεξις
[Today at 01:56:37]

Ισραήλ - Ιράν: Πόλεμος στ...
by Katarameno
[June 15, 2025, 20:08:49 pm]

Αντικατάστασης πυκνωτή σε...
by nmpampal
[June 15, 2025, 16:25:56 pm]

[Σ.Π.Η.Ε.] Παλιά θέματα -...
by nmpampal
[June 15, 2025, 06:43:15 am]

Το thmmy.gr στο instagram...
by Mr Watson
[June 15, 2025, 00:50:23 am]

[Λογισμός ΙΙ] Απορίες σε...
by el mariachi
[June 14, 2025, 20:47:07 pm]

ΠΡΟΣΟΧΗ στο ανέβασμα θεμά...
by tzortzis
[June 14, 2025, 16:54:08 pm]

Ρυθμίσεις Θεμάτων της Ανώ...
by el mariachi
[June 14, 2025, 11:56:45 am]

Πότε θα βγει το μάθημα; -...
by Nikos_313
[June 14, 2025, 10:00:55 am]

Αρχείο Ανακοινώσεων [Arch...
by Nikos_313
[June 14, 2025, 09:58:14 am]

Αλέξης Τσίπρας, η επιστρο...
by Yamal
[June 14, 2025, 04:42:23 am]

Έναρξη Δηλώσεων Συμμετοχή...
by IEEE SB
[June 14, 2025, 00:10:19 am]

[Δυναμική Συμπεριφορά ΣΗΕ...
by soko_freta
[June 13, 2025, 01:05:36 am]
Στατιστικά
Members
Total Members: 9960
Latest: valco08
Stats
Total Posts: 1426676
Total Topics: 31711
Online Today: 226
Online Ever: 2093
(April 17, 2025, 08:47:49 am)
Users Online
Users: 80
Guests: 100
Total: 180
jim_sklab
Reidemption
fischer03
nikos123321
EiriniGeo
George_RT
kzmekos
immo
mixkats
fafafa
Athinaaz
ekyriakos
Giannis_Kako
Mr Z
tasos gourd
elias_farhood
Geoth
Zaxarenia
mimaki
Tasaras
Maria Golia
tzortzis
pdiamantis
kpapama
george14
A-TheITGuy
Christina07
gkg
Tsomp
coyg
parzival
JoHn!
Konstantina Karamani
andrkott
ggalamat
nick_slendy
PrepeiNaDiavasw
Ampajohn
mkakale
NickSpan
Papadopoulosthanos
vmanousi
Giopan
smoul
Captain
Ioakeim Zisis
freskoulhs
vaggelis.ntokas
abiki
Η ΤΡΑΠΟΥΛΑ ΤΟΥ ΠΑΠΠΟΥ ΜΟΥ
sterlouk
Saint_GR
Leou
pave
myrto
LambisTr
stavr0s16
mpournaz
fkacori
WeirdAlex
georkala
manolitsis
ligditsa
Aris★
skopsinos
tzimika
Farmakis Aggelos
Vromofona Kathikia
nikolakys
Andreas04
Guts
DimKaratzas
Εμφάνιση

Νέα για πρωτοετείς
Είσαι πρωτοετής;... Καλώς ήρθες! Μπορείς να βρεις πληροφορίες εδώ. Βοήθεια για τους καινούργιους μέσω χάρτη.
Κατεβάστε εδώ το Android Application για εύκολη πρόσβαση στο forum.
Ανεβάζετε τα θέματα των εξετάσεων στον τομέα Downloads με προσοχή στα ονόματα των αρχείων!

Νέα!
Πληροφορίες Καθηγητών
THMMY.gr > Forum > Μαθήματα Κύκλου Ηλεκτρονικής & Υπολογιστών  > 7ο Εξάμηνο > Παράλληλα και Διανεμημένα Συστήματα (Moderators: geo66, Elliot Alderson, sassi) > [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
0 Members and 1 Guest are viewing this topic.
Pages: 1 [2] 3 4 Go Down Print
Author Topic: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3  (Read 6536 times)
chrimour
Καταξιωμένος/Καταξιωμένη
***
Posts: 112


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #15 on: January 17, 2015, 17:30:14 pm »

Για τον kernel με τα πολλαπλα κελια ανα thread με χρηση της shared memory εχει καποιος να προτεινει πως να γινει; Τουλαχιστον την λογικη. Επειδη εχω ψιλομπερδευτει.
« Last Edit: January 17, 2015, 17:32:46 pm by chrimour » Logged
Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #16 on: January 17, 2015, 17:49:46 pm »

Quote from: chrimour on January 17, 2015, 17:30:14 pm
Για τον kernel με τα πολλαπλα κελια ανα thread με χρηση της shared memory εχει καποιος να προτεινει πως να γινει; Τουλαχιστον την λογικη. Επειδη εχω ψιλομπερδευτει.

Αντί να τα threads ενός block όλες τις τιμές που χρειάζονται για να προσδιορίσουν την επόμενη τους κατάστασης από την global memory, θα πρέπει πρώτα να γεμίσεις τον πίνακα της shared memory με αυτές τις τιμές και έπειτα τα threads του κάθε block να διαβάζουν από εκεί τις τιμές που χρειάζονται.
Logged

chrimour
Καταξιωμένος/Καταξιωμένη
***
Posts: 112


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #17 on: January 17, 2015, 18:10:01 pm »

Αυτο που με μπερδευει ομως ειναι οτι αφου θα αντιγραφω στον καθε πινακα της shared memory του καθε block απο την global, τους γειτονες στις ακρες των πινακων πως θα τους βρισκω; Αφου ενα thread δεν μπορει να "δει" τιμες σε αλλο block.

π.χ
block 1         block 2
111001        001010
001010        100101
100101        100110
100101        100110
100110        100110

Πως ας πουμε θα βρουμε τον γειτονα του τελευταιου της δευτερης γραμμης στο block 1 αφου το thread δεν μπορει να δει στο block 2;
Logged
jimPster
Θαμώνας
****
Posts: 331


η ταν η arctan!!!


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #18 on: January 17, 2015, 18:34:25 pm »

Χωρις να εχω ασχοληθει με την εργασια,  καθε thread ανεξαρτητου block εχει προσβαση σε ολη την global memory. H shared memory εχει block scope.Δηλ στην shared memory φορτωνεις οτι θελεις
απο global memory, αν κτλβα ποιος ειναι ο προβληματισμος σου
Logged
Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #19 on: January 17, 2015, 18:59:32 pm »

Quote from: jimPster on January 17, 2015, 18:34:25 pm
Χωρις να εχω ασχοληθει με την εργασια,  καθε thread ανεξαρτητου block εχει προσβαση σε ολη την global memory. H shared memory εχει block scope.Δηλ στην shared memory φορτωνεις οτι θελεις
απο global memory, αν κτλβα ποιος ειναι ο προβληματισμος σου

Αυτό βασικά. Επίσης, η shared memory του κάθε block μπορεί να είναι και μεγαλύτερη από το αντίστοιχο κομμάτι του πίνακα με το οποίο θα ασχοληθεί το block.
Logged

chrimour
Καταξιωμένος/Καταξιωμένη
***
Posts: 112


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #20 on: January 17, 2015, 19:07:28 pm »

οχι οχι. αυτο που λεω ειναι εχουμε ενα πινακα 250000 στοιχεια ο οποιος σιγουρα δεν χωραει στην shared memory. Το παιχνιδι game of life ειναι βασισμενο αποκλειστικα στο τι γινεται με τους γειτονες σε καθε γενια. Αρα αφου η λογικη λεει για να δουλεψω μεσω της shared memory πρεπει να αντιγραψω σε καθε shared memory του καθε block ενα κομματι απο τον μεγαλο πινακα και μετα να βρισκω τους ζωντανους και νεκρους γειτονες μεσω του καθε shared πινακα. Αυτο που ρωτω εγω ειναι αφου  ενα thread στο block 1 δεν γινεται να βλεπει τον πινακα στο block 2 οπως στο παραδειγμα μου πως ας πουμε θα δει τους γειτονες των ακρινων στοιχειων αφου αυτοι βρισκονται στο block 2; Η δεν εχω καταλαβει καλα την shared memory;

Αυτο που λες νομιζω ειναι για το συνολικο πινακα με τις κυκλικες οριακες συνθηκες. Εγω μιλαω για τις ακρες των μικροτερων πινακων που αποθηκευονται στην shared memory. Σε αυτους δεν μπορουμε να πουμε οτι ισχυουν κυκλικες οριακες συνθηκες αφου οι γειτονες τους ειναι πραγματι διπλα τους και οχι στην αλλη πλευρα του πινακα ας πουμε.
« Last Edit: January 17, 2015, 19:10:08 pm by chrimour » Logged
Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #21 on: January 17, 2015, 19:54:55 pm »

Quote from: chrimour on January 17, 2015, 19:07:28 pm
οχι οχι. αυτο που λεω ειναι εχουμε ενα πινακα 250000 στοιχεια ο οποιος σιγουρα δεν χωραει στην shared memory. Το παιχνιδι game of life ειναι βασισμενο αποκλειστικα στο τι γινεται με τους γειτονες σε καθε γενια. Αρα αφου η λογικη λεει για να δουλεψω μεσω της shared memory πρεπει να αντιγραψω σε καθε shared memory του καθε block ενα κομματι απο τον μεγαλο πινακα και μετα να βρισκω τους ζωντανους και νεκρους γειτονες μεσω του καθε shared πινακα. Αυτο που ρωτω εγω ειναι αφου  ενα thread στο block 1 δεν γινεται να βλεπει τον πινακα στο block 2 οπως στο παραδειγμα μου πως ας πουμε θα δει τους γειτονες των ακρινων στοιχειων αφου αυτοι βρισκονται στο block 2; Η δεν εχω καταλαβει καλα την shared memory;

Αυτο που λες νομιζω ειναι για το συνολικο πινακα με τις κυκλικες οριακες συνθηκες. Εγω μιλαω για τις ακρες των μικροτερων πινακων που αποθηκευονται στην shared memory. Σε αυτους δεν μπορουμε να πουμε οτι ισχυουν κυκλικες οριακες συνθηκες αφου οι γειτονες τους ειναι πραγματι διπλα τους και οχι στην αλλη πλευρα του πινακα ας πουμε.

Κατάλαβα ακριβώς τι λες και ποιό είναι το πρόβλημα σου. Το θέμα είναι ότι εσύ σκέφτεσαι πως η shared memory πρέπει να είναι ένας πίνακας που να περιέχει μόνο τα cells των thread του block, στο οποίο ανήκει. Γιατί, όμως, να μην αυξήσεις τον πίνακας στη shared memory λίγο για να αποθηκεύσεις και τις γειτονικές τιμές που θα χρειαστεί το κάθε block;
Logged

Σα τανυστής
Καταξιωμένος/Καταξιωμένη
***
Gender: Male
Posts: 254


Arian Asllani


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #22 on: January 17, 2015, 19:56:50 pm »

Hi it's me again,

Για το global memory..

Στο game of life για να υλοποιησεις τις αλλαγες θελεις 2 πινακες, εναν που ταιζεις στην συναρτηση του παιχνιδιου σου και εναν με τις νεες καταστασεις για να τις αντιγραψεις ολες μαζι στο τελος. Στο σειριακο ολα μια χαρα.

Στο kernel μεσα αυτη η αντιγραφη κανει οτι να ναι, προφανως. Εχετε βρει καποιον κομψο τροπο να αντιγραφετε αυτους τους 2 πινακες μεσα στο kernel? Το κανω στo host μου και μου φαινεται πολυ hack γι αυτο ρωταω..
Logged

Quote from: Mathematica on January 12, 2015, 02:54:18 am
Η ΚΑΡΜΠΟΝΑΡΑ ΔΕΝ ΕΧΕΙ ΚΡΕΜΑ ΓΑΛΑΚΤΟΣ
ΕΧΕΙ ΑΥΓΑ, PARMIGGIANO, GUANCIALE (Η PANCETTA H BACON KAΠΝΙΣΤΟ) KAI ΠΙΠΕΡΙ

ΔΕΝ ΣΠΑΜΕ ΤΑ ΜΑΚΑΡΟΝΙΑ ΤΟ ΚΕΡΑΤΟ ΜΟΥ ΑΜΑ ΗΤΑΝ ΘΑ ΤΑ ΠΟΥΛΟΥΣΑΝ ΠΙΟ ΜΙΚΡΑ
ΔΕΝ ΒΑΖΟΥΜΕ ΛΑΔΙ ΣΤΟ ΝΕΡΟ
ΔΕΝ ΒΑΖΟΥΜΕ ΒΟΥΤYΡΟ ΣΤΑ ΜΑΚΑΡΟΝΙΑ, ΘΑ ΚΟΛΛΗΣΟΥΝ ΑΜΑ ΤΑ ΕΒΡΑΣΕΣ 100 ΜΙΝ ΚΑΙ ΕΙΝΑΙ ΛΑΠΑΣ, ΟΧΙ ΑΝ ΕΙΝΑΙ ΣΟΣΤΑ ΒΡΑΣΜΕΝΑ
ΤΗΝ ΚΡΕΜΑ ΓΑΛΑΚΤΟΣ ΤΗ ΖΕΣΤΑΙΝΟΥΜΕ ΠΡΙΝ ΣΕΡΒΙΡΟΥΜΕ
Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #23 on: January 17, 2015, 20:12:33 pm »

Quote from: Σα τανυστής on January 17, 2015, 19:56:50 pm
Hi it's me again,

Για το global memory..

Στο game of life για να υλοποιησεις τις αλλαγες θελεις 2 πινακες, εναν που ταιζεις στην συναρτηση του παιχνιδιου σου και εναν με τις νεες καταστασεις για να τις αντιγραψεις ολες μαζι στο τελος. Στο σειριακο ολα μια χαρα.

Στο kernel μεσα αυτη η αντιγραφη κανει οτι να ναι, προφανως. Εχετε βρει καποιον κομψο τροπο να αντιγραφετε αυτους τους 2 πινακες μεσα στο kernel? Το κανω στo host μου και μου φαινεται πολυ hack γι αυτο ρωταω..

Η κλήση μιας συνάρτηση της Cuda θα υλοποιεί ένα generation του Game of Life, και θα καλείς αυτή τη συνάρτηση πολλές φορές. Οπότε δε θα χρειαστεί να κάνεις κάποια αντιγραφή δεδομένων μέσα στη συνάρτηση.
Logged

Σα τανυστής
Καταξιωμένος/Καταξιωμένη
***
Gender: Male
Posts: 254


Arian Asllani


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #24 on: January 18, 2015, 20:55:08 pm »

Για την υλοποιηση πολλα κελια/νημα vs ενα κελι/νημα , ενω περιμενα διαφορα στους χρονους δεν ειδα σχεδον τιποτα.

Το εχετε και εσεις αυτο?

Σε ενα blog της nvidia διαβασα οτι με strides εχεις ιδιο instruction cost οταν εχεις ενα grid-stride loop και ενα απλο if, απλα δε μου καθεται καλα και ειπα να επιβεβαιωσω..
Logged

Quote from: Mathematica on January 12, 2015, 02:54:18 am
Η ΚΑΡΜΠΟΝΑΡΑ ΔΕΝ ΕΧΕΙ ΚΡΕΜΑ ΓΑΛΑΚΤΟΣ
ΕΧΕΙ ΑΥΓΑ, PARMIGGIANO, GUANCIALE (Η PANCETTA H BACON KAΠΝΙΣΤΟ) KAI ΠΙΠΕΡΙ

ΔΕΝ ΣΠΑΜΕ ΤΑ ΜΑΚΑΡΟΝΙΑ ΤΟ ΚΕΡΑΤΟ ΜΟΥ ΑΜΑ ΗΤΑΝ ΘΑ ΤΑ ΠΟΥΛΟΥΣΑΝ ΠΙΟ ΜΙΚΡΑ
ΔΕΝ ΒΑΖΟΥΜΕ ΛΑΔΙ ΣΤΟ ΝΕΡΟ
ΔΕΝ ΒΑΖΟΥΜΕ ΒΟΥΤYΡΟ ΣΤΑ ΜΑΚΑΡΟΝΙΑ, ΘΑ ΚΟΛΛΗΣΟΥΝ ΑΜΑ ΤΑ ΕΒΡΑΣΕΣ 100 ΜΙΝ ΚΑΙ ΕΙΝΑΙ ΛΑΠΑΣ, ΟΧΙ ΑΝ ΕΙΝΑΙ ΣΟΣΤΑ ΒΡΑΣΜΕΝΑ
ΤΗΝ ΚΡΕΜΑ ΓΑΛΑΚΤΟΣ ΤΗ ΖΕΣΤΑΙΝΟΥΜΕ ΠΡΙΝ ΣΕΡΒΙΡΟΥΜΕ
Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #25 on: January 18, 2015, 20:59:46 pm »

Quote from: Σα τανυστής on January 18, 2015, 20:55:08 pm
Για την υλοποιηση πολλα κελια/νημα vs ενα κελι/νημα , ενω περιμενα διαφορα στους χρονους δεν ειδα σχεδον τιποτα.

Το εχετε και εσεις αυτο?

Σε ενα blog της nvidia διαβασα οτι με strides εχεις ιδιο instruction cost οταν εχεις ενα grid-stride loop και ενα απλο if, απλα δε μου καθεται καλα και ειπα να επιβεβαιωσω..

Εξαρτάται και από τα πόσα κελιά ανά νήμα χρησιμοποιείς. Τα strides επίσης κοστίζουν σε χρόνο, ισχύει αυτό. Τα ifs επίσης κοστίζουν σε χρόνο.
Logged

Σα τανυστής
Καταξιωμένος/Καταξιωμένη
***
Gender: Male
Posts: 254


Arian Asllani


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #26 on: January 18, 2015, 21:17:20 pm »

Quote from: Exomag on January 18, 2015, 20:59:46 pm
Quote from: Σα τανυστής on January 18, 2015, 20:55:08 pm
Για την υλοποιηση πολλα κελια/νημα vs ενα κελι/νημα , ενω περιμενα διαφορα στους χρονους δεν ειδα σχεδον τιποτα.

Το εχετε και εσεις αυτο?

Σε ενα blog της nvidia διαβασα οτι με strides εχεις ιδιο instruction cost οταν εχεις ενα grid-stride loop και ενα απλο if, απλα δε μου καθεται καλα και ειπα να επιβεβαιωσω..

Εξαρτάται και από τα πόσα κελιά ανά νήμα χρησιμοποιείς. Τα strides επίσης κοστίζουν σε χρόνο, ισχύει αυτό. Τα ifs επίσης κοστίζουν σε χρόνο.

thanks για καποιο λογο ειχα στο μυαλο μου οτι πολλα κελια/thread = grid strides αποκλειστικα. Καλη φαση που το αφηνει ανοιχτο στην εκφωνηση.
Logged

Quote from: Mathematica on January 12, 2015, 02:54:18 am
Η ΚΑΡΜΠΟΝΑΡΑ ΔΕΝ ΕΧΕΙ ΚΡΕΜΑ ΓΑΛΑΚΤΟΣ
ΕΧΕΙ ΑΥΓΑ, PARMIGGIANO, GUANCIALE (Η PANCETTA H BACON KAΠΝΙΣΤΟ) KAI ΠΙΠΕΡΙ

ΔΕΝ ΣΠΑΜΕ ΤΑ ΜΑΚΑΡΟΝΙΑ ΤΟ ΚΕΡΑΤΟ ΜΟΥ ΑΜΑ ΗΤΑΝ ΘΑ ΤΑ ΠΟΥΛΟΥΣΑΝ ΠΙΟ ΜΙΚΡΑ
ΔΕΝ ΒΑΖΟΥΜΕ ΛΑΔΙ ΣΤΟ ΝΕΡΟ
ΔΕΝ ΒΑΖΟΥΜΕ ΒΟΥΤYΡΟ ΣΤΑ ΜΑΚΑΡΟΝΙΑ, ΘΑ ΚΟΛΛΗΣΟΥΝ ΑΜΑ ΤΑ ΕΒΡΑΣΕΣ 100 ΜΙΝ ΚΑΙ ΕΙΝΑΙ ΛΑΠΑΣ, ΟΧΙ ΑΝ ΕΙΝΑΙ ΣΟΣΤΑ ΒΡΑΣΜΕΝΑ
ΤΗΝ ΚΡΕΜΑ ΓΑΛΑΚΤΟΣ ΤΗ ΖΕΣΤΑΙΝΟΥΜΕ ΠΡΙΝ ΣΕΡΒΙΡΟΥΜΕ
Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #27 on: January 18, 2015, 21:29:02 pm »

Quote from: Σα τανυστής on January 18, 2015, 21:17:20 pm
Quote from: Exomag on January 18, 2015, 20:59:46 pm
Quote from: Σα τανυστής on January 18, 2015, 20:55:08 pm
Για την υλοποιηση πολλα κελια/νημα vs ενα κελι/νημα , ενω περιμενα διαφορα στους χρονους δεν ειδα σχεδον τιποτα.

Το εχετε και εσεις αυτο?

Σε ενα blog της nvidia διαβασα οτι με strides εχεις ιδιο instruction cost οταν εχεις ενα grid-stride loop και ενα απλο if, απλα δε μου καθεται καλα και ειπα να επιβεβαιωσω..

Εξαρτάται και από τα πόσα κελιά ανά νήμα χρησιμοποιείς. Τα strides επίσης κοστίζουν σε χρόνο, ισχύει αυτό. Τα ifs επίσης κοστίζουν σε χρόνο.

thanks για καποιο λογο ειχα στο μυαλο μου οτι πολλα κελια/thread = grid strides αποκλειστικα. Καλη φαση που το αφηνει ανοιχτο στην εκφωνηση.

Ε ναι, δεν σου λέει η εκφώνηση πως ακριβώς να το υλοποιήσεις. Οπότε η λογική είναι ότι θα δοκιμάσεις διάφορα να δεις τι είναι γρηγορότερο/καλύτερο.
Logged

spira mirabilis
Καταξιωμένος/Καταξιωμένη
***
Gender: Female
Posts: 105



View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #28 on: January 19, 2015, 01:58:10 am »

Να ρωτήσω κάτι κι εγώ:
Όταν πάω να μετρήσω την επιτάχυνσή μου πρέπει να συνυπολογήσω και τον χρόνο που χρειάζεται η μεταφορά των δεδομένων από την CPU στην GPU? Δεν έχω τεστάρει πολύ το πρόγραμμά μου  και δεν είμαι σίγουρη για τα νούμερα, αλλά σε αυτήν την φάση παρατήρησα τα ακόλουθα: τρέχοντας την παράλληλη εκδοχή μου στον διάδη για τον πίνακα 500x500  χρειάζομαι 0.67 secs για την εντολή Memcpy() και οι υπολογισμοί που γίνονται στην GPU διαρκούν ελάχιστα . Το σειριακό πρόγραμμα για 10 γενιές θέλει 0.09 secs,για 100 0.9 και για 1000 9 , οπότε μόνο από εκεί και πέρα παρατηρώ σοβαρή επιτάχυνση.
Το λογικό είναι να συνυπολογίσω και τον χρόνο της μεταφοράς, αλλά αν θέλω να πετύχω επιτάχυνση σε αυτήν την περίπτωση, πρέπει να στέλνω ένα μικρό κομμάτι του πίνακα και να επικαλύπτω την μεταφορά του επόμενου με υπολογισμούς στην Gpu , αντί να στέλνω με την μία τα 250000 στοιχεία...
Μήπως η επιτάχυνση που ζητείται δεν αφορά τον συνολικό χρόνο, αλλά κάποιον δείκτη της μορφής evaluated cells/second? Θα με βόλευε πολύ  Cheesy
Logged
Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Παράλληλα και Διανεμημένα Συστ.] Εργασία 3
« Reply #29 on: January 19, 2015, 03:12:11 am »

Quote from: elena_numb on January 19, 2015, 01:58:10 am
Να ρωτήσω κάτι κι εγώ:
Όταν πάω να μετρήσω την επιτάχυνσή μου πρέπει να συνυπολογήσω και τον χρόνο που χρειάζεται η μεταφορά των δεδομένων από την CPU στην GPU? Δεν έχω τεστάρει πολύ το πρόγραμμά μου  και δεν είμαι σίγουρη για τα νούμερα, αλλά σε αυτήν την φάση παρατήρησα τα ακόλουθα: τρέχοντας την παράλληλη εκδοχή μου στον διάδη για τον πίνακα 500x500  χρειάζομαι 0.67 secs για την εντολή Memcpy() και οι υπολογισμοί που γίνονται στην GPU διαρκούν ελάχιστα . Το σειριακό πρόγραμμα για 10 γενιές θέλει 0.09 secs,για 100 0.9 και για 1000 9 , οπότε μόνο από εκεί και πέρα παρατηρώ σοβαρή επιτάχυνση.
Το λογικό είναι να συνυπολογίσω και τον χρόνο της μεταφοράς, αλλά αν θέλω να πετύχω επιτάχυνση σε αυτήν την περίπτωση, πρέπει να στέλνω ένα μικρό κομμάτι του πίνακα και να επικαλύπτω την μεταφορά του επόμενου με υπολογισμούς στην Gpu , αντί να στέλνω με την μία τα 250000 στοιχεία...
Μήπως η επιτάχυνση που ζητείται δεν αφορά τον συνολικό χρόνο, αλλά κάποιον δείκτη της μορφής evaluated cells/second? Θα με βόλευε πολύ  Cheesy

Πρέπει να συμπεριλάβεις και τον χρόνο που κάνει το Memcpy στον συνολικό χρόνο, από τον οποίο θα υπολογίσεις την επιτάχυνση. Λογικό είναι άλλωστε, αν σκεφτείς ότι για να λύσεις το πρόβλημα σου τα Memcpy είναι απαραίτητα steps, και το να υπολογίσεις απλά τον χρόνο που κάνει για να τρέξει ο κώδικας στη GPU δεν χρησιμεύευει σε κάτι πρακτικό.
Logged

Pages: 1 [2] 3 4 Go Up Print
Jump to:  

Powered by SMF | SMF © 2006-2009, Simple Machines LLC
Scribbles2 | TinyPortal © Bloc | XHTML | CSS
Loading...