• Downloads
  • ! Read Me !
  • Μαθήματα
  • Φοιτητικά
  • Τεχνικά Θέματα
  • Συζητήσεις
  • Happy Hour!
  • About THMMY.gr
 V  < 
Search:  
Welcome, Guest. Please login or register.
June 16, 2025, 21:33:49 pm

Login with username, password and session length
Links
  Thmmy.gr portal
   Forum
   Downloads
   Ενεργ. Λογαριασμού
   Επικοινωνία
  
  Χρήσιμα links
   Σελίδα τμήματος
   Βιβλιοθήκη Τμήματος
   Elearning
   Φοιτητικά fora
   Πρόγραμμα Λέσχης
   Πρακτική Άσκηση
   Ηλεκτρονική Εξυπηρέτηση Φοιτητών
   Διανομή Συγγραμμάτων
   Ψηφιακό Καταθετήριο Διπλωματικών
   Πληροφορίες Καθηγητών
   Instagram @thmmy.gr
   mTHMMY
  
  Φοιτητικές Ομάδες
   ACM
   Aristurtle
   ART
   ASAT
   BEAM
   BEST Thessaloniki
   EESTEC LC Thessaloniki
   EΜΒ Auth
   IAESTE Thessaloniki
   IEEE φοιτητικό παράρτημα ΑΠΘ
   SpaceDot
   VROOM
   Panther
  
Πίνακας Ελέγχου
Welcome, Guest. Please login or register.
June 16, 2025, 21:33:49 pm

Login with username, password and session length

Αναζήτηση

Google

THMMY.gr Web
Πρόσφατα
[Σ.Π.Η.Ε.] Γενικές απορίε...
by Nikos_313
[Today at 19:49:00]

[ΘΤΠΑ] Γενικές απορίες κα...
by Nikos_313
[Today at 16:56:56]

[Εφ.Θερμοδυναμική] Γενικέ...
by Λαμπτήρας
[Today at 15:55:08]

[Αρχές Οικονομίας] Να επι...
by _Trob
[Today at 13:28:21]

[Σ.Α.Π.Γ.] Εργασία 2025
by Nikos_313
[Today at 12:13:45]

Αποτελέσματα Εξεταστικής ...
by Nikos_313
[Today at 12:01:53]

Πρακτική Άσκηση ΤΗΜΜΥ 201...
by George_RT
[Today at 10:22:18]

[Διανεμημένη Παραγωγή] Γε...
by Διάλεξις
[Today at 01:56:37]

Ισραήλ - Ιράν: Πόλεμος στ...
by Katarameno
[June 15, 2025, 20:08:49 pm]

Αντικατάστασης πυκνωτή σε...
by nmpampal
[June 15, 2025, 16:25:56 pm]

[Σ.Π.Η.Ε.] Παλιά θέματα -...
by nmpampal
[June 15, 2025, 06:43:15 am]

Το thmmy.gr στο instagram...
by Mr Watson
[June 15, 2025, 00:50:23 am]

[Λογισμός ΙΙ] Απορίες σε...
by el mariachi
[June 14, 2025, 20:47:07 pm]

ΠΡΟΣΟΧΗ στο ανέβασμα θεμά...
by tzortzis
[June 14, 2025, 16:54:08 pm]

Ρυθμίσεις Θεμάτων της Ανώ...
by el mariachi
[June 14, 2025, 11:56:45 am]

Πότε θα βγει το μάθημα; -...
by Nikos_313
[June 14, 2025, 10:00:55 am]

Αρχείο Ανακοινώσεων [Arch...
by Nikos_313
[June 14, 2025, 09:58:14 am]

Αλέξης Τσίπρας, η επιστρο...
by Yamal
[June 14, 2025, 04:42:23 am]

Έναρξη Δηλώσεων Συμμετοχή...
by IEEE SB
[June 14, 2025, 00:10:19 am]

[Δυναμική Συμπεριφορά ΣΗΕ...
by soko_freta
[June 13, 2025, 01:05:36 am]
Στατιστικά
Members
Total Members: 9960
Latest: valco08
Stats
Total Posts: 1426676
Total Topics: 31711
Online Today: 226
Online Ever: 2093
(April 17, 2025, 08:47:49 am)
Users Online
Users: 72
Guests: 106
Total: 178
Roidos
cealexop
Notac
christinabisdeki
eleftheria
Spyros.kleanthous
KZerenidis
superkolios
Nikos_313
mixkats
grethem
bougatsa
xarisagraf
nmpampal
whatdoesthefoxsay
Fotis
BossiTsif
itsikou
qwertyuiop
mike1996
AA RE LEWN
mmikelo
DK06
christina02
thomassamaras
valco08
gpap
Deviate
vaggelis.ntokas
johnnypap
amprozos
manos_diakakis
georkala
BENEDICTVS
IBOURAS
krith
gorilaki
DimKaratzas
diamantis
Argiris
moutdimi
mrotskos
NickSpan
Retroman07
mimaki
sassi
xarabalios
giannisd
aalmpanb
mdimitrig
tasakis
andreaspaper
airam
vagk
sigklitiki
jim_sklab
skopsinos
ddantono
thenoface
dimchin
sterlouk
dimitrisblioumis
Nefeli Nikita
pdiamantis
andyy
iropap
chrysaep
Εμφάνιση

Νέα για πρωτοετείς
Είσαι πρωτοετής;... Καλώς ήρθες! Μπορείς να βρεις πληροφορίες εδώ. Βοήθεια για τους καινούργιους μέσω χάρτη.
Κατεβάστε εδώ το Android Application για εύκολη πρόσβαση στο forum.
Ανεβάζετε τα θέματα των εξετάσεων στον τομέα Downloads με προσοχή στα ονόματα των αρχείων!

Νέα!
Ανεβάζετε τα θέματα των εξετάσεων στον τομέα Downloads
με προσοχή στα ονόματα των αρχείων!
THMMY.gr > Forum > Μαθήματα Κύκλου Ηλεκτρονικής & Υπολογιστών  > 7ο Εξάμηνο > Παράλληλα και Διανεμημένα Συστήματα (Moderators: geo66, Elliot Alderson, sassi) > [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
0 Members and 1 Guest are viewing this topic.
Pages: 1 2 [3] 4 Go Down Print
Author Topic: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20  (Read 9105 times)
alekosts
Καταξιωμένος/Καταξιωμένη
***
Posts: 106


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #30 on: August 26, 2020, 15:24:14 pm »

Quote from: thanosthehuge on August 26, 2020, 14:58:06 pm
Κι εγώ που το υλοποίησα έτσι βγάζω αρκετά κακούς χρόνους πάντως, χειρότερους και από τη σειριακή υλοποίηση....
Χρησιμοποίησες κάποια παράλληλη υλοποίηση της quickselect;
Logged
thanosthehuge
Ανερχόμενος/Ανερχόμενη
**
Posts: 58


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #31 on: August 26, 2020, 15:30:33 pm »

Quote from: alekosts on August 26, 2020, 15:24:14 pm
Χρησιμοποίησες κάποια παράλληλη υλοποίηση της quickselect;

Μπα, δεν ξέρω αν έχει πολύ νόημα, θεωρώ πως αλλού γίνεται η "βαριά" δουλειά (π.χ. στον υπολογισμό του distance matrix ή στον διαχωρισμό των σημείων σε inner και outer κάθε φορά).
Logged
alekosts
Καταξιωμένος/Καταξιωμένη
***
Posts: 106


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #32 on: August 26, 2020, 15:38:32 pm »

Χωρίς να είμαι σίγουρος νομίζω ότι έτσι χάνεις  χρόνο στην μεταφορά των δεδομένων απο device σε host για να κάνεις την quickselect. Δες το λιγο. Πάντως η υλοποίηση μιας quickselect για gpu μου φαίνεται αρκετά δύσκολη. Εγώ  βρήκα μια υλοποίηση για gpu της bucketselect,αλλά αρχικά δεν λειτουργεί καλά και επίσης καθυστερεί περισσότερο από την σειριακή όταν έχει να κάνεις με λίγα στοιχεία.
Logged
thanosthehuge
Ανερχόμενος/Ανερχόμενη
**
Posts: 58


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #33 on: August 26, 2020, 15:52:55 pm »

Μισό ρε. Εγώ την quickselect την έχω κάνει __device__ συνάρτηση και την καλώ απευθείας μέσα από την GPU. Δε νομίζω ότι μεταφέρονται δεδομένα σε CPU και πίσω κάθε φορά που την καλώ. Κάνω λάθος??
Logged
alekosts
Καταξιωμένος/Καταξιωμένη
***
Posts: 106


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #34 on: August 26, 2020, 16:14:35 pm »

Quote from: thanosthehuge on August 26, 2020, 15:52:55 pm
Μισό ρε. Εγώ την quickselect την έχω κάνει __device__ συνάρτηση και την καλώ απευθείας μέσα από την GPU. Δε νομίζω ότι μεταφέρονται δεδομένα σε CPU και πίσω κάθε φορά που την καλώ. Κάνω λάθος??
Όχι αν την έχεις κάνει device συνάρτηση δεν μεταφέρονται δεδομένα αλλα ίσως είναι χειτότερη σε ταχύτητα σε σχέση με την σειριακή. Δες λίγο τους χρόνους της quickselect έτσι όπως την έχεις κάνει και τους χρόνους από τα υπόλοιπα όταν κάνουν πράξεις για μικρό αριθμό στοιχείων. Εγώ εκεί έχω δει ότι έχω πρόβλημα.
Logged
mano_lee
Καταξιωμένος/Καταξιωμένη
***
Gender: Male
Posts: 151


meh'


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #35 on: September 01, 2020, 01:15:30 am »

2o Project (RCM)

Αρκεί να υπολογίσουμε μόνο το permutation, ή πρέπει να βγάζουμε σαν output και τον νέο πίνακα με το μικρότερο πλέον bandwidth (άρα να φτιάχνουμε τον γράφο και στο τέλος να υπολογίζουμε και το adjacency matrix του);
« Last Edit: September 01, 2020, 20:27:09 pm by mano_lee » Logged

Allah allah allah will pray for you
mikalaki
Καταξιωμένος/Καταξιωμένη
***
Posts: 164


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #36 on: September 01, 2020, 05:53:07 am »

Ο αλγόριθμος εξ ορισμού δίνει μονο το permutation order array , εγώ προσωπικά μονο αυτό το τμήμα συμπεριέλαβα στην συνάρτηση του αλγορίθμου , βέβαια έχω υλοποιήσει και μια μικρη συναρτηση (εκτος του αλγοριθμου φυσικά), η οποία δίνει τον νέο πίνακα, για λόγους επαλήθευσης περισσότερο.

Quote from: mano_lee on September 01, 2020, 01:15:30 am
Για όσους κάνουν το 2ο project

Αρκεί να υπολογίσουμε μόνο το permutation, ή πρέπει να βγάζουμε σαν output και τον νέο πίνακα με το μικρότερο πλέον bandwidth (άρα να φτιάχνουμε τον γράφο και στο τέλος να υπολογίζουμε και το adjacency matrix του);
Logged
mano_lee
Καταξιωμένος/Καταξιωμένη
***
Gender: Male
Posts: 151


meh'


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #37 on: September 01, 2020, 20:21:32 pm »

2o Project (RCM)

1. Προφανώς δεν υπάρχει πάντα μία λύση καθώς η ποιότητα του αποτελέσματος επηρεάζεται κάθε φορά από επιλογές των nodes (π.χ. όταν πολλά nodes έχουν το ίδιο degree). Ωστόσο παρατηρώ πως για μεγάλους πίνακες, το νέο bandwidth που προκύπτει δεν είναι και πολύ ικανοποιητικό, οπότε εκεί νομίζω πως αν εφαρμόσω πολλές φορές τον αλγόριθμο τείνει πιο πολύ προς τη διαγώνιο. Είναι λογικό αυτό; Ή πρέπει να περιμένουμε με το ένα iteration να έχουμε σχετικά καλό αποτέλεσμα;

EDIT: Τελικά με τα παραπάνω iterations μάλλον δεν υπάρχει επιπλέον βελτίωση του bandwidth.

EDIT 2: Έβαζα καταλάθος density 10% αντί για 1%  crap
« Last Edit: September 02, 2020, 22:24:21 pm by mano_lee » Logged

Allah allah allah will pray for you
mano_lee
Καταξιωμένος/Καταξιωμένη
***
Gender: Male
Posts: 151


meh'


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #38 on: September 03, 2020, 13:42:25 pm »

Quote from: athanasps on August 21, 2020, 16:38:12 pm
Εχει ασχοληθεί κάποιος με Sparse Graph Matrix Reordering? Αν ναι, κάνει ανάγνωση τους πίνακες από συμπιεσμένη μορφή? Γιατί ο όγκος των πινάκων σε πλήρη μορφή από παραδείγματα που βρήκα είναι τεράστιος.

+1
Logged

Allah allah allah will pray for you
superdonut
Νεούλης/Νεούλα
*
Gender: Male
Posts: 31



View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #39 on: September 03, 2020, 16:37:26 pm »

Ναι το λογικο ειναι να τα διαβαζεις απο συμπιεσμενη μορφη γιατι αλλιως γινονται εξωφρενικα μεγαλα τα νουμερα Tongue . Αλλωστε και για αυτο τον λογο αποθηκευονται συμπιεσμενα. Υπαρχουν βιβλιοθηκες ετοιμες που διαβαζουν το συμπιεσμενο αρχειο και το κανουν πινακες στην c για να μπορεσεις να τον  επεξεργαστεις.

Quote from: mano_lee on September 03, 2020, 13:42:25 pm
+1
Logged
mano_lee
Καταξιωμένος/Καταξιωμένη
***
Gender: Male
Posts: 151


meh'


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #40 on: September 03, 2020, 19:31:52 pm »

Quote from: superdonut on September 03, 2020, 16:37:26 pm
Ναι το λογικο ειναι να τα διαβαζεις απο συμπιεσμενη μορφη γιατι αλλιως γινονται εξωφρενικα μεγαλα τα νουμερα Tongue . Αλλωστε και για αυτο τον λογο αποθηκευονται συμπιεσμενα. Υπαρχουν βιβλιοθηκες ετοιμες που διαβαζουν το συμπιεσμενο αρχειο και το κανουν πινακες στην c για να μπορεσεις να τον  επεξεργαστεις.


Ωστόσο το ίδιο πρόβλημα έχω και σε ματλαμπ. Ακόμα και αν το κάνω σε c, θέλω εν τέλει να δω και το αποτέλεσμα σε plot, για να δω οτι είναι ικανοποιητικό. Ξέρεις μήπως ποια είναι η καλύτερη δυνατή μορφή αρχείου ώστε να διαβάζεις πoλύ μεγάλους πίνακες σε matlab?

Μέχρι στιγμής έχω καταφέρει να διαβάζω από csv και να το απεικονίζω, αλλά για size>10.000 κρασάρει.
Logged

Allah allah allah will pray for you
kalopana
Νεούλης/Νεούλα
*
Posts: 33


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #41 on: September 03, 2020, 20:44:17 pm »

Για την 1η εκδοχη της εργασιας, ξεκινησα να φτιαξω εναν απλο kernel που να υπολογιζει παραλληλα την αποσταση του καθε σημειου απο το τελευταιο σημειο για εναν δεδομενο πινακα. Ακομα και για 8.000.000 στοιχεια με 8 διαστασεις, ο σειριακος υπολογισμος των αποστασεων βγαινει 3 φορες πιο γρηγορος ( με -Ο3 flag). Εσεις δοκιμασατε κατι αντιστοιχο; Το θεωρειτε λογικο;
Logged
dim2712
Καταξιωμένος/Καταξιωμένη
***
Posts: 274


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #42 on: September 04, 2020, 04:18:54 am »

Δες ενδεχομένως τα accesses στη global memory που έχεις τον πινακα με τα σημεία. Φρόντισε να είναι coalesced γιατί αυτό μπορεί να σε καθυστερήσει πολύ.
Logged
kalopana
Νεούλης/Νεούλα
*
Posts: 33


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #43 on: September 04, 2020, 15:38:45 pm »

Αυτό που με εκνευρίζει πιο πολυ απόλα, είναι ότι προσπαθώ να κάνω τον kernel πιο γρήγορο με διάφορες τεχνικές όπως  coalesced memory accesses, χρήση shared memory και δημιουργία πολλαπλών streams, και όλα βγαίνουν πιο αργά από τον ήδη αργό kernel σε σχέση με τον σειριακό υπολογισμό των αποστάσεων.

Υπάρχει κάποιος που πάνω στους πειραματισμούς του να έχει δοκιμάσει τον ίδιο απλό kernel και να δίνει αποτέλεσμα γρηγορότερα από τον σειριακό υπολογισμό αποστάσεων;

Να ξέρω αν χωράει να το ψάξω κι άλλο ή αν δεν επιτυγχάνεται βελτίωση στο συγκεκριμένο κομμάτι του προβλήματος και πρέπει να το προσεγγίσω αλλιώς.

EDIT*** Τελικά η coalesced memory access δίνει καλύτερο αποτέλεσμα για διαστάσεις σημείου περισσότερες από 8. Πάλι όμως πιο αργό από σειριακό....!
« Last Edit: September 04, 2020, 16:21:05 pm by kalopana » Logged
dim2712
Καταξιωμένος/Καταξιωμένη
***
Posts: 274


View Profile
Re: [Παράλληλα και Διανεμημένα Συστήματα] Εργασία 4 - 2019/20
« Reply #44 on: September 04, 2020, 16:24:05 pm »

Κάνεις invoke αρκετα blocks και threads ώστε να αξιοποιήσεις πλήρως τη gpu; Επίσης στα datasets που λέει να χρησιμοποιήσουμε οι διαστάσεις είναι αρκετά μεγάλες όπως 79-80 και λιγότερα σημεία στην τάξη των εκατοντάδων χιλιάδων, οπότε για τέτοια νούμερα έχουν νόημα οι δοκιμές θεωρώ.
Logged
Pages: 1 2 [3] 4 Go Up Print
Jump to:  

Powered by SMF | SMF © 2006-2009, Simple Machines LLC
Scribbles2 | TinyPortal © Bloc | XHTML | CSS
Loading...