• Downloads
  • ! Read Me !
  • Μαθήματα
  • Φοιτητικά
  • Τεχνικά Θέματα
  • Συζητήσεις
  • Happy Hour!
  • About THMMY.gr
 V  < 
Search:  
Welcome, Guest. Please login or register.
June 16, 2025, 17:17:32 pm

Login with username, password and session length
Links
  Thmmy.gr portal
   Forum
   Downloads
   Ενεργ. Λογαριασμού
   Επικοινωνία
  
  Χρήσιμα links
   Σελίδα τμήματος
   Βιβλιοθήκη Τμήματος
   Elearning
   Φοιτητικά fora
   Πρόγραμμα Λέσχης
   Πρακτική Άσκηση
   Ηλεκτρονική Εξυπηρέτηση Φοιτητών
   Διανομή Συγγραμμάτων
   Ψηφιακό Καταθετήριο Διπλωματικών
   Πληροφορίες Καθηγητών
   Instagram @thmmy.gr
   mTHMMY
  
  Φοιτητικές Ομάδες
   ACM
   Aristurtle
   ART
   ASAT
   BEAM
   BEST Thessaloniki
   EESTEC LC Thessaloniki
   EΜΒ Auth
   IAESTE Thessaloniki
   IEEE φοιτητικό παράρτημα ΑΠΘ
   SpaceDot
   VROOM
   Panther
  
Πίνακας Ελέγχου
Welcome, Guest. Please login or register.
June 16, 2025, 17:17:32 pm

Login with username, password and session length

Αναζήτηση

Google

THMMY.gr Web
Πρόσφατα
[ΘΤΠΑ] Γενικές απορίες κα...
by Nikos_313
[Today at 16:56:56]

[Σ.Π.Η.Ε.] Γενικές απορίε...
by nmpampal
[Today at 16:30:35]

[Εφ.Θερμοδυναμική] Γενικέ...
by Λαμπτήρας
[Today at 15:55:08]

[Αρχές Οικονομίας] Να επι...
by _Trob
[Today at 13:28:21]

[Σ.Α.Π.Γ.] Εργασία 2025
by Nikos_313
[Today at 12:13:45]

Αποτελέσματα Εξεταστικής ...
by Nikos_313
[Today at 12:01:53]

Πρακτική Άσκηση ΤΗΜΜΥ 201...
by George_RT
[Today at 10:22:18]

[Διανεμημένη Παραγωγή] Γε...
by Διάλεξις
[Today at 01:56:37]

Ισραήλ - Ιράν: Πόλεμος στ...
by Katarameno
[June 15, 2025, 20:08:49 pm]

Αντικατάστασης πυκνωτή σε...
by nmpampal
[June 15, 2025, 16:25:56 pm]

[Σ.Π.Η.Ε.] Παλιά θέματα -...
by nmpampal
[June 15, 2025, 06:43:15 am]

Το thmmy.gr στο instagram...
by Mr Watson
[June 15, 2025, 00:50:23 am]

[Λογισμός ΙΙ] Απορίες σε...
by el mariachi
[June 14, 2025, 20:47:07 pm]

ΠΡΟΣΟΧΗ στο ανέβασμα θεμά...
by tzortzis
[June 14, 2025, 16:54:08 pm]

Ρυθμίσεις Θεμάτων της Ανώ...
by el mariachi
[June 14, 2025, 11:56:45 am]

Πότε θα βγει το μάθημα; -...
by Nikos_313
[June 14, 2025, 10:00:55 am]

Αρχείο Ανακοινώσεων [Arch...
by Nikos_313
[June 14, 2025, 09:58:14 am]

Αλέξης Τσίπρας, η επιστρο...
by Yamal
[June 14, 2025, 04:42:23 am]

Έναρξη Δηλώσεων Συμμετοχή...
by IEEE SB
[June 14, 2025, 00:10:19 am]

[Δυναμική Συμπεριφορά ΣΗΕ...
by soko_freta
[June 13, 2025, 01:05:36 am]
Στατιστικά
Members
Total Members: 9959
Latest: valco08
Stats
Total Posts: 1426674
Total Topics: 31711
Online Today: 201
Online Ever: 2093
(April 17, 2025, 08:47:49 am)
Users Online
Users: 69
Guests: 109
Total: 178
hacky
fkagk
Petran25
eleftheria
xristodoulou
sterlouk
nikitask
Kv
lina_zs
sofaki
Nicotre
Nikos.Ts
VengeX
mrodi
Panagismark
ArsenD
mmikelo
Angelos Asim
tasos_ntv
DJ Stefzia
Mr Z
gp6
chriskazakos
petikas
stloukas
npalami
Evripidis
Ponan
Petross
moutdimi
dimitrisblioumis
jimalexoud
Chrisvb17
gcheristanidhs
Ast
Belafonte
Chaidec
manos_diakakis
daphnenik
malogeor
nmpampal
Haralampos
JoHn!
maestros
aalmpanb
Dimosthenis
Sotirisbikos
tank
witchingHour
kstavroulis
noimaginationforthis
freskoulhs
DespoinaKarategou
meni
Giopan
John120196
Farmakis Aggelos
alice
papajohnn06
tasakis
xdallas
Nikos_313
George_RT
marf10
teeeoooo
mdimitrig
bit11
Εμφάνιση

Νέα για πρωτοετείς
Είσαι πρωτοετής;... Καλώς ήρθες! Μπορείς να βρεις πληροφορίες εδώ. Βοήθεια για τους καινούργιους μέσω χάρτη.
Κατεβάστε εδώ το Android Application για εύκολη πρόσβαση στο forum.
Ανεβάζετε τα θέματα των εξετάσεων στον τομέα Downloads με προσοχή στα ονόματα των αρχείων!

Νέα!
Για οποιοδήποτε πρόβλημα με register/login, στείλτε email στο contact@thmmy.gr.
THMMY.gr > Forum > Ηλεκτρονικοί Υπολογιστές και Τεχνικά Θέματα > Περί Υπολογιστών... > Software (Moderators: chatzikys, PolarBear) > machine learning question
0 Members and 1 Guest are viewing this topic.
Pages: [1] 2 Go Down Print
Author Topic: machine learning question  (Read 3705 times)
heavy melon
Μόνιμος κάτοικος ΤΗΜΜΥ.gr
******
Gender: Female
Posts: 1386


making things complex


View Profile
machine learning question
« on: April 17, 2018, 16:05:54 pm »

Ποστάρω μια απορία σε machine learning που δε μπόρεσα να τη λύσω στο ινετ.
Πειραματίζομαι με ένα classification. Αρχικά από το dataset μου διαχωρίζω σε train & data sets.

Με κάποιους διαχωρισμούς κάνω train models που έχουν 90κάτι % test accuracy
ενώ με άλλο τυχαίο διαχωρισμό των δεδομένων μπορεί να έχω 70κάτι % test accuracy

Μήπως δε θα έπρεπε να υπάρχει τόσο μεγάλη απόκλιση όπως κι αν έπαιρνα τα δεδομένα?
Γενικά είναι σωστό να πω πχ ότι διαλέγω το τάδε μοντέλο που δίνει 90κάτι% ή ειναι λάθος? Από την άλλη δεν ξέρω φυσικά τι ποσοστό θα έδινε αν διαλέγαμε αλλιώς τα sets αλλά ούτε κι αν τέσταρα με περισσότερα test data (που δεν έχω διαθέσιμα)

Logged

Μη γκρινιάζεις που δε σου 'ρθε η ζαριά
τζογάρισες στο όνειρο κι είσαι έτοιμος για όλα
Vlassis
Veteran
Μόνιμος κάτοικος ΤΗΜΜΥ.gr
******
Posts: 2162


εφακ


View Profile
Re: machine learning question
« Reply #1 on: April 17, 2018, 16:28:29 pm »

Νομιζω οτι ειναι λογικο να υπαρχει τετοια διαφορα. Λογικα θα υπαρχει καποια σχεση αναμεσα στα data σου, ετσι οπως εγινε ο διαχωρισμος, που δινει τετοιο σφαλμα στο τελος.
Για το τι ειναι σωστο να πεις, δεν ξερω να σου πω την αληθεια.
Θα μπορουσες νομιζω για το training να χρησιμοποιησεις αλγοριθμους k-fold crossvalidation, για να παρεις ουσιαστικα καθε δυνατη (ή εστω αρκετες) περιπτωσεις διαχωρισμου και να σου δωσει καλυτερα αποτελεσματα
Logged

πρόπελ
Is any of it real? I mean, look at this. Look at it! A world built on fantasy! Synthetic emotions in the form of pills, psychological warfare in the form of advertising, mind-altering chemicals in the form of food, brainwashing seminars in the form of media, controlled isolated bubbles in the form of social networks. mr.robot s01e10
heavy melon
Μόνιμος κάτοικος ΤΗΜΜΥ.gr
******
Gender: Female
Posts: 1386


making things complex


View Profile
Re: machine learning question
« Reply #2 on: April 17, 2018, 16:32:58 pm »

Ναι όταν κάνω training χρησιμοποιώ 5 cross validation με το train-data και μετά όταν αποφασίζω το μοντέλο, testάρω στα δεδομένα μου. Αλλά αν αλλάξω πχ τα δεδομένα με τα οποία θα κάνω training (% 5 cross validation) ενώ το accuracy του training δε διαφοροποιείται σημαντικά, το test accuracy σκαμπανεβάζει πολύ
Logged

Μη γκρινιάζεις που δε σου 'ρθε η ζαριά
τζογάρισες στο όνειρο κι είσαι έτοιμος για όλα
iason1907
Εθισμένος στο ΤΗΜΜΥ.gr
*****
Gender: Male
Posts: 827


vive le sport!


View Profile
Re: machine learning question
« Reply #3 on: April 17, 2018, 17:26:55 pm »

οταν κάνεις 5fold cross-validation βγάζεις μέσο όρο accuracy 90% ή σε κάποιο fold?
Ποσο είναι το train set error?
Logged

heavy melon
Μόνιμος κάτοικος ΤΗΜΜΥ.gr
******
Gender: Female
Posts: 1386


making things complex


View Profile
Re: machine learning question
« Reply #4 on: April 17, 2018, 17:35:51 pm »

Καταρχάς, κάνω το 5fold cross validation με έναν κώδικα generated από ένα classification app του MATLAB. Εκεί απ' ότι είδα διαχωρίζει σε train & test set, και δε χρησιμοποιεί ένα 3ο, validation set που προτείνουν γενικά. 'Ετσι εγώ, χωρίς να είμαι βέβαιη ότι είναι σωστό, παίρνω το 80% πχ του συνολικού dataset, κάνω training με το 5fold cross validation, δίνει accuracy πχ με cubic SVM συνήθως το καλύτερο, γύρω στο 98%. Μετά κάνω prediction με new data με αυτό το μοντέλο κ τότε στην καλύτερη έχω δει 93% test accuracy. Αλλά μάλλον έχει να κάνει με το διαχωρισμό των set. Γιατί αν το ξαναχωρίσω randomly, μπορεί να πάρω 73% test accuracy.
Logged

Μη γκρινιάζεις που δε σου 'ρθε η ζαριά
τζογάρισες στο όνειρο κι είσαι έτοιμος για όλα
iason1907
Εθισμένος στο ΤΗΜΜΥ.gr
*****
Gender: Male
Posts: 827


vive le sport!


View Profile
Re: machine learning question
« Reply #5 on: April 17, 2018, 17:45:59 pm »

μπορεις να κανεις το εξής.

Από το σύνολο των δεδομένων σου κράτα στην άκρη ένα ποσοστό για τεστ και μόνο. Random επιλογή δειγμάτων (test set).

Με τα υπόλοιπα (train set) εκπαίδευσε ένα μοντέλο και δες τι accuracy πετυχαίνεις με αυτό το μοντέλο στο train set?.

Χώρισε μετά το train set σε 5 κομμάτια και πάρε διαδοχικά τα 4 για εκπαίδευση ενός μοντέλου και το άλλο κομμάτι κράτα το για τεστ. Με αυτό τον τρόπο θα βγάλεις 5 τιμές accuracy, ποια είναι η μέση τιμή?

προτείνω να χρησιμοποιήσεις αν δεν το κάνεις ήδη τις συναρτήσεις της libsvm για την matlab. Η svmtrain κάνει κατευθείαν και cv με όσα folds θες
Logged

Dealan
Veteran
Μόνιμος κάτοικος ΤΗΜΜΥ.gr
******
Gender: Male
Posts: 1404


python was a mistake


View Profile
Re: machine learning question
« Reply #6 on: April 17, 2018, 18:02:52 pm »

Quote from: iason1907 on April 17, 2018, 17:45:59 pm

Αυτό που περιγράφεις δεν είναι ακριβώς το 5fold cross validation που εφαμρόζει η heavy melon; Ή λάθος θυμάμαι;
Logged
heavy melon
Μόνιμος κάτοικος ΤΗΜΜΥ.gr
******
Gender: Female
Posts: 1386


making things complex


View Profile
Re: machine learning question
« Reply #7 on: April 17, 2018, 18:09:59 pm »

Quote from: iason1907 on April 17, 2018, 17:45:59 pm
μπορεις να κανεις το εξής.

Από το σύνολο των δεδομένων σου κράτα στην άκρη ένα ποσοστό για τεστ και μόνο. Random επιλογή δειγμάτων (test set).

Με τα υπόλοιπα (train set) εκπαίδευσε ένα μοντέλο και δες τι accuracy πετυχαίνεις με αυτό το μοντέλο στο train set?.

Χώρισε μετά το train set σε 5 κομμάτια και πάρε διαδοχικά τα 4 για εκπαίδευση ενός μοντέλου και το άλλο κομμάτι κράτα το για τεστ. Με αυτό τον τρόπο θα βγάλεις 5 τιμές accuracy, ποια είναι η μέση τιμή?

προτείνω να χρησιμοποιήσεις αν δεν το κάνεις ήδη τις συναρτήσεις της libsvm για την matlab. Η svmtrain κάνει κατευθείαν και cv με όσα folds θες

Ευχαριστώ πολύ καταρχάς για τις απαντήσεις Smiley
Αλλά μπερδεύτηκα. Τα 2 bold που αναφέρεις είναι διαφορετικά; Επίσης ναι, αυτό το κάνει η fitcsvm (η svmtrain έχει γίνει removed)
Logged

Μη γκρινιάζεις που δε σου 'ρθε η ζαριά
τζογάρισες στο όνειρο κι είσαι έτοιμος για όλα
iason1907
Εθισμένος στο ΤΗΜΜΥ.gr
*****
Gender: Male
Posts: 827


vive le sport!


View Profile
Re: machine learning question
« Reply #8 on: April 17, 2018, 18:22:10 pm »

@dealan, αυτό που περιγράφω είναι το c.v., απλά προτείνω να δούμε την μεση τιμή.

@βαρυπεπόνι, αν θες κατέβασε από εδώ τον κώδικα που δίνει για matlab και τρέξε. Δεν έχω χρησιμοποιήσει την fit

τα 2 bold ειναι διαφορετικά. Το δεύτερο τεστ αναφέρεται στο 1/5 που αφήνεις εκτός σε κάθε fold.
Logged

heavy melon
Μόνιμος κάτοικος ΤΗΜΜΥ.gr
******
Gender: Female
Posts: 1386


making things complex


View Profile
Re: machine learning question
« Reply #9 on: April 17, 2018, 18:28:42 pm »

Quote from: iason1907 on April 17, 2018, 18:22:10 pm
@dealan, αυτό που περιγράφω είναι το c.v., απλά προτείνω να δούμε την μεση τιμή.

@βαρυπεπόνι, αν θες κατέβασε από εδώ τον κώδικα που δίνει για matlab και τρέξε. Δεν έχω χρησιμοποιήσει την fit

τα 2 bold ειναι διαφορετικά. Το δεύτερο τεστ αναφέρεται στο 1/5 που αφήνεις εκτός σε κάθε fold.

οκ, κοίτα ο ΜΟ που προτεινεις (accuracy στο training), επειδη το εχω τρεξει αρκετες φορες υψηλος θα ειναι. τυπου 96-97-98%
To πρόβλημα είναι ότι στο test είναι μεγάλη η απόκλιση. Εμάς στο test δε μας νοιάζει τι συμβαίνει περισσότερο?
Logged

Μη γκρινιάζεις που δε σου 'ρθε η ζαριά
τζογάρισες στο όνειρο κι είσαι έτοιμος για όλα
iason1907
Εθισμένος στο ΤΗΜΜΥ.gr
*****
Gender: Male
Posts: 827


vive le sport!


View Profile
Re: machine learning question
« Reply #10 on: April 20, 2018, 10:06:22 am »

Quote from: heavy melon on April 17, 2018, 18:28:42 pm
οκ, κοίτα ο ΜΟ που προτεινεις (accuracy στο training), επειδη το εχω τρεξει αρκετες φορες υψηλος θα ειναι. τυπου 96-97-98%
To πρόβλημα είναι ότι στο test είναι μεγάλη η απόκλιση. Εμάς στο test δε μας νοιάζει τι συμβαίνει περισσότερο?
πριν κάνεις τον αρχικό διαχωρισμό σε train και test set, ανακατεύεις τα δεδομένα ή όχι?
Logged

adiaforos
Καταξιωμένος/Καταξιωμένη
***
Posts: 236


View Profile
Re: machine learning question
« Reply #11 on: April 20, 2018, 12:00:18 pm »

Quote from: heavy melon on April 17, 2018, 18:28:42 pm
οκ, κοίτα ο ΜΟ που προτεινεις (accuracy στο training), επειδη το εχω τρεξει αρκετες φορες υψηλος θα ειναι. τυπου 96-97-98%
To πρόβλημα είναι ότι στο test είναι μεγάλη η απόκλιση. Εμάς στο test δε μας νοιάζει τι συμβαίνει περισσότερο?

ναι στο τεστ σετ σε ενδιαφερει,το προβλημα ισως ειναι οτι γινεται οβερφιτινγκ στο τρεινινγκ σετ
Logged
heavy melon
Μόνιμος κάτοικος ΤΗΜΜΥ.gr
******
Gender: Female
Posts: 1386


making things complex


View Profile
Re: machine learning question
« Reply #12 on: April 20, 2018, 12:04:27 pm »

Quote from: iason1907 on April 20, 2018, 10:06:22 am
πριν κάνεις τον αρχικό διαχωρισμό σε train και test set, ανακατεύεις τα δεδομένα ή όχι?

"ανακατεύεις" τι εννοείς;
Τα διαλέγω αναλογικά από κάθε κλάση (περισσότερα από την κλάση με τα περισσότερα δεδομένα)
με μια randsample().

Επίσης το κουλό είναι ότι έκανα στατιστική ανάλυση (t-test) για να διώξω features, κι ενώ μου έμειναν μόνο 55 από τα 1300κάτι,
έχω ίδια test accuracy  Shocked
Logged

Μη γκρινιάζεις που δε σου 'ρθε η ζαριά
τζογάρισες στο όνειρο κι είσαι έτοιμος για όλα
c0ndemn3d
Veteran
Αbsolute ΤΗΜΜΥ.gr
******
Posts: 4804


Yarr!


View Profile
Re: machine learning question
« Reply #13 on: April 20, 2018, 13:21:44 pm »

Precision και recall τι έχεις; Το accuracy δεν είναι το μόνο που μετράει αν δεν είναι γενικά καλό το train set που έχεις. Καλύτερα είναι να βλέπεις σε πίνακα τα FP και FN και να συγκρίνεις από εκεί. Αλλιώς πρέπει να δώσεις παραπάνω πληροφορίες για το set που έχεις, διότι θα μπορούσε να είναι το οτιδήποτε. Φυσικά με ένα train set που καλύπτει μεγαλύτερο μέρος του χώρου θα έχεις καλύτερο accuracy σε ένα πιθανό test set. Ή από την άλλη αν το test set που έχεις έχει πολύ τετριμμένες τιμές είναι πολύ πιθανό να παίρνεις καλό accuracy χωρίς να έχεις κάνει καλό training.


precision kai recall ti exeis? to accuracy den einai to mono pou metraei an den einai genika kalo to train set pou exeis. Kalitera einai na vlepeis se pinaka ta FP kai FN kai na sigkrineis apo ekei. alliws prepei na dwseis parapanw plirofories gia to set pou exeis, dioti tha mporouse na einai to otidhpote. fisika me ena train set pou kaliptei megalitero meros tou xwrou tha exeis kalitero accuracy se ena pithano test set. i apo tin allh an to test set pou exeis exei poli tetrimmenes times einai poli pithano na pairneis kalo accuracy xwris na exeis kanei kalo training.


(sry den exw ellhnika)


mod: greeklish to greek, το original είναι τα ψιλά γράμματα
« Last Edit: April 20, 2018, 13:34:22 pm by Apostolof » Logged

In response, the pirates had to adhere to a doctrine of their own...
war against the world

They took my home, I can't walk away from that; can you?
 Forget me, forget Teach, forget loyalty, compacts, honours, debts, all of it.
The only question that matters is this: Who are you?
iason1907
Εθισμένος στο ΤΗΜΜΥ.gr
*****
Gender: Male
Posts: 827


vive le sport!


View Profile
Re: machine learning question
« Reply #14 on: April 20, 2018, 22:55:39 pm »

Quote from: heavy melon on April 20, 2018, 12:04:27 pm
"ανακατεύεις" τι εννοείς;
Τα διαλέγω αναλογικά από κάθε κλάση (περισσότερα από την κλάση με τα περισσότερα δεδομένα)
με μια randsample().

Επίσης το κουλό είναι ότι έκανα στατιστική ανάλυση (t-test) για να διώξω features, κι ενώ μου έμειναν μόνο 55 από τα 1300κάτι,
έχω ίδια test accuracy  Shocked

Αυτό εννοώ για την επιλογή των δεδομένων. Ότι διαλέγεις τυχαία  και όχι fv στην σειρά 

Logged

Pages: [1] 2 Go Up Print
Jump to:  

Powered by SMF | SMF © 2006-2009, Simple Machines LLC
Scribbles2 | TinyPortal © Bloc | XHTML | CSS
Loading...