• Downloads
  • ! Read Me !
  • Μαθήματα
  • Φοιτητικά
  • Τεχνικά Θέματα
  • Συζητήσεις
  • Happy Hour!
  • About THMMY.gr
 V  < 
Search:  
Welcome, Guest. Please login or register.
June 16, 2025, 12:21:27 pm

Login with username, password and session length
Links
  Thmmy.gr portal
   Forum
   Downloads
   Ενεργ. Λογαριασμού
   Επικοινωνία
  
  Χρήσιμα links
   Σελίδα τμήματος
   Βιβλιοθήκη Τμήματος
   Elearning
   Φοιτητικά fora
   Πρόγραμμα Λέσχης
   Πρακτική Άσκηση
   Ηλεκτρονική Εξυπηρέτηση Φοιτητών
   Διανομή Συγγραμμάτων
   Ψηφιακό Καταθετήριο Διπλωματικών
   Πληροφορίες Καθηγητών
   Instagram @thmmy.gr
   mTHMMY
  
  Φοιτητικές Ομάδες
   ACM
   Aristurtle
   ART
   ASAT
   BEAM
   BEST Thessaloniki
   EESTEC LC Thessaloniki
   EΜΒ Auth
   IAESTE Thessaloniki
   IEEE φοιτητικό παράρτημα ΑΠΘ
   SpaceDot
   VROOM
   Panther
  
Πίνακας Ελέγχου
Welcome, Guest. Please login or register.
June 16, 2025, 12:21:27 pm

Login with username, password and session length

Αναζήτηση

Google

THMMY.gr Web
Πρόσφατα
[Σ.Α.Π.Γ.] Εργασία 2025
by Nikos_313
[Today at 12:13:45]

Αποτελέσματα Εξεταστικής ...
by Nikos_313
[Today at 12:01:53]

Πρακτική Άσκηση ΤΗΜΜΥ 201...
by George_RT
[Today at 10:22:18]

[Διανεμημένη Παραγωγή] Γε...
by Διάλεξις
[Today at 01:56:37]

[Σ.Π.Η.Ε.] Γενικές απορίε...
by nmpampal
[Today at 00:16:23]

Ισραήλ - Ιράν: Πόλεμος στ...
by Katarameno
[June 15, 2025, 20:08:49 pm]

Αντικατάστασης πυκνωτή σε...
by nmpampal
[June 15, 2025, 16:25:56 pm]

[Σ.Π.Η.Ε.] Παλιά θέματα -...
by nmpampal
[June 15, 2025, 06:43:15 am]

Το thmmy.gr στο instagram...
by Mr Watson
[June 15, 2025, 00:50:23 am]

[Λογισμός ΙΙ] Απορίες σε...
by el mariachi
[June 14, 2025, 20:47:07 pm]

ΠΡΟΣΟΧΗ στο ανέβασμα θεμά...
by tzortzis
[June 14, 2025, 16:54:08 pm]

Ρυθμίσεις Θεμάτων της Ανώ...
by el mariachi
[June 14, 2025, 11:56:45 am]

Πότε θα βγει το μάθημα; -...
by Nikos_313
[June 14, 2025, 10:00:55 am]

Αρχείο Ανακοινώσεων [Arch...
by Nikos_313
[June 14, 2025, 09:58:14 am]

Αλέξης Τσίπρας, η επιστρο...
by Yamal
[June 14, 2025, 04:42:23 am]

Έναρξη Δηλώσεων Συμμετοχή...
by IEEE SB
[June 14, 2025, 00:10:19 am]

[Δυναμική Συμπεριφορά ΣΗΕ...
by soko_freta
[June 13, 2025, 01:05:36 am]

[Εφ.Θερμοδυναμική]Παλιά θ...
by Giannis Masterio
[June 12, 2025, 22:30:38 pm]

Paid Internships in a Eur...
by okan
[June 12, 2025, 22:30:02 pm]

[ΔΣΗΕ] Γενικές απορίες, α...
by tasos_ntv
[June 12, 2025, 21:38:52 pm]
Στατιστικά
Members
Total Members: 9959
Latest: valco08
Stats
Total Posts: 1426668
Total Topics: 31711
Online Today: 201
Online Ever: 2093
(April 17, 2025, 08:47:49 am)
Users Online
Users: 65
Guests: 109
Total: 174
apostolose
fpapat
hevidis3524
sterxz
dsaragiotis
narcos
mikrosdia
cpapast
vaggelisx
programmer2004
μιλτοςμ
asemas
Kont
Nikos_313
thomasdt
makato
bit11
bax
Chaidec
maranageo
chatzikys
faidonchatz
stefanos hios
MarakiT
Xontroulis
George_RT
serafeim
stelinas
abcdefg
Thalasotsanta
Psycher
theodoradr
DimitrisKouk
cchristodoulou
tsaliki
apob
Mr Watson
Mari0s
mkakale
Annapar
Mihalist
petikas
Giorgosap
despoina15
adelaine
antontsiorvas
jimalexoud
Laris
zerielea
andreasbr
Saint_GR
Reidemption
sapounas
Thanasis_pap
eli_k
matrozos
arisap
ganasto
mgrivab
DLHERRO
eplysia
Εμφάνιση

Νέα για πρωτοετείς
Είσαι πρωτοετής;... Καλώς ήρθες! Μπορείς να βρεις πληροφορίες εδώ. Βοήθεια για τους καινούργιους μέσω χάρτη.
Κατεβάστε εδώ το Android Application για εύκολη πρόσβαση στο forum.
Ανεβάζετε τα θέματα των εξετάσεων στον τομέα Downloads με προσοχή στα ονόματα των αρχείων!

Νέα!
Πρόγραμμα Χειμερινής Εξεταστικής 2024-2025
THMMY.gr > Forum > Μαθήματα Κύκλου Ηλεκτρονικής & Υπολογιστών  > 9ο Εξάμηνο > Αναγνώριση Προτύπων (Moderator: diesel) > [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
0 Members and 1 Guest are viewing this topic.
Pages: 1 [2] 3 4 5 Go Down Print
Author Topic: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016  (Read 11079 times)
Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #15 on: November 08, 2015, 19:04:01 pm »

Quote from: themis93 on November 08, 2015, 18:59:41 pm
Γιατί δεν έχουμε τα bugs για τα δεδομένα του test set? Πως θα μπορεσουμε να ελέγξουμε αν την ακρίβεια των αποτελεσμάτων?

Γιατί τα δεδομένα στο αρχείο "source-code-metrics_test.csv" δεν είναι για να τεστάρεις εσύ κάτι, είναι απλά για να εφαρμόσεις το μοντέλο σου σε αυτά τα δεδομένα και να παράγεις τα αντίστοιχα bugs, τα οποία θα παραδώσεις σε ένα .csv αρχείο. Είναι για να τεστάρουν αυτοί, δηλαδή, πόσο καλό είναι το τελικό μοντέλο που έφτιαξες.
Logged

themis93
Θαμώνας
****
Posts: 303


View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #16 on: November 08, 2015, 19:12:52 pm »

Quote from: Exomag on November 08, 2015, 19:04:01 pm
Quote from: themis93 on November 08, 2015, 18:59:41 pm
Γιατί δεν έχουμε τα bugs για τα δεδομένα του test set? Πως θα μπορεσουμε να ελέγξουμε αν την ακρίβεια των αποτελεσμάτων?

Γιατί τα δεδομένα στο αρχείο "source-code-metrics_test.csv" δεν είναι για να τεστάρεις εσύ κάτι, είναι απλά για να εφαρμόσεις το μοντέλο σου σε αυτά τα δεδομένα και να παράγεις τα αντίστοιχα bugs, τα οποία θα παραδώσεις σε ένα .csv αρχείο. Είναι για να τεστάρουν αυτοί, δηλαδή, πόσο καλό είναι το τελικό μοντέλο που έφτιαξες.
ευχαριστούμε πολύ!
Logged
Gru
Εθισμένος στο ΤΗΜΜΥ.gr
*****
Posts: 915



View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #17 on: November 11, 2015, 15:57:07 pm »

Μπορεί κάποιος να εξηγήσει τι είναι το κάθε αρχείο που έχει το Dataset?
Logged

http://www.youtube.com/watch?v=4b-GDNrmWqI
et3rn1ty
Καταξιωμένος/Καταξιωμένη
***
Gender: Male
Posts: 219


View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #18 on: November 11, 2015, 16:20:34 pm »

Quote from: Gru on November 11, 2015, 15:57:07 pm
Μπορεί κάποιος να εξηγήσει τι είναι το κάθε αρχείο που έχει το Dataset?
  • source-code-metrics_train.csv: περιέχει τις 18(?) μετρικές που περιγράφει το dataset.pdf για 800(?) έργα λογισμικού (training examples)
  • source-code-metrics_test.csv: τα ίδια για 198 διαφορετικά έργα λογισμικού (testing set)
  • bugs_train.csv : περιέχει την "απάντηση" στα 800 training examples, δηλαδή το παράδειγμα της 1ης γραμμής του source-code-metrics_train.csv έχει bug αν η 1η γραμμή του bugs_train.csv είναι 1, αλλιώς δεν έχει bugs.

Απαντήσεις για το test set δεν μας δίνει. Λογικά, πρέπει να εκπαιδεύσουμε αλγορίθμους με ένα μέρος του training set και να κάνουμε cross-validation στα υπόλοιπα. Αφού βρούμε τις πιο αποτελεσματικές παραμέτρους και επιλέξουμε μοντέλα, τα εκπαιδεύουμε με ολόκληρο το training set και του τα παραδίνουμε ώστε να βγάλει το accuracy, το οποίο προέρχεται από τα source-code-metrics_test.csv ως είσοδο.

Σχόλιο: Το formatting είναι λίγο κακό. Σε python, weka και matlab (R δεν ξέρω, excell είναι οκ) τα csv χωρίζουν εγγραφές με κόμμα, και τα αρχεία έχουν semicolon. Οπότε ή κάνεις replace all με άλλο εργαλείο ή ρυθμίζεις το πρόγραμμα να χωρίζει στο ; και όχι στο ,
« Last Edit: November 11, 2015, 17:18:19 pm by et3rn1ty » Logged
Gru
Εθισμένος στο ΤΗΜΜΥ.gr
*****
Posts: 915



View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #19 on: November 11, 2015, 16:56:28 pm »

Quote from: et3rn1ty on November 11, 2015, 16:20:34 pm
Quote from: Gru on November 11, 2015, 15:57:07 pm
Μπορεί κάποιος να εξηγήσει τι είναι το κάθε αρχείο που έχει το Dataset?
  • source-code-metrics_train.csv: περιέχει τις 18(?) μετρικές που περιγράφει το dataset.pdf για 800(?) έργα λογισμικού (training examples)
  • source-code-metrics_test.csv: τα ίδια για 198 διαφορετικά έργα λογισμικού (testing set)
  • bugs_train.csv : περιέχει την "απάντηση" στα 800 training examples, δηλαδή το παράδειγμα της 1ης γραμμής του source-code-metrics_train.csv έχει bug αν η 1η γραμμή του bugs_train.csv είναι 1, αλλιώς δεν έχει bugs.

Απαντήσεις για το test set δεν μας δίνει. Λογικά, πρέπει να εκπαιδεύσουμε αλγορίθμους με ένα μέρος του training set και να κάνουμε cross-validation στα υπόλοιπα. Αφού βρούμε τις πιο αποτελεσματικές παραμέτρους και επιλέξουμε μοντέλα, τα εκπαιδεύουμε με ολόκληρο το training set και του τα παραδίνουμε ώστε να βγάλει το accuracy, το οποίο προέρχεται από τα source-code-metrics_test.csv ως είσοδο.

Σχόλιο: Το formatting είναι λίγο κακό. Σε python, weka και matlab (R δεν ξέρω, excell είναι οκ) τα csv χωρίζουν γραμμές με κόμμα και τα αρχεία έχουν semicolon. Οπότε ή κάνεις replace all με άλλο εργαλείο ή ρυθμίζεις το πρόγραμμα να χωρίζει στο ; και όχι στο ,

ευχαριστωω..
Logged

http://www.youtube.com/watch?v=4b-GDNrmWqI
rspappas
WebSlave
Αbsolute ΤΗΜΜΥ.gr
***
Posts: 2709



View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #20 on: November 12, 2015, 16:04:01 pm »

περιπου τι confusion matrices βγαζετε παιδια? εμεις τα καλυτερα που εχουμε καταφερει (με πινακες κοστους και fine tuning) ειναι περιπου:

620 120
60  100

θεωρειται καλο αυτο το νουμερο?
Logged


http://en.wikipedia.org/wiki/Lopadotemachoselachogaleokranioleipsanodrimhypotrimmatosilphioparaomelitokatakechymenokichlepikossyphophattoperisteralektryonoptekephalliokigklopeleiolagoiosiraiobaphetraganopterygon

Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #21 on: November 12, 2015, 16:24:53 pm »

Quote from: rspappas on November 12, 2015, 16:04:01 pm
περιπου τι confusion matrices βγαζετε παιδια? εμεις τα καλυτερα που εχουμε καταφερει (με πινακες κοστους και fine tuning) ειναι περιπου:

620 120
60  100

θεωρειται καλο αυτο το νουμερο?

Αφήνοντας στην άκρη τα απόλυτα νούμερα, τα ποσοστά κάπου εκεί βρήκαμε και εμείς να κυμαίνονται (με fine-tuning). Τώρα αν είναι καλά αυτά τα νούμερα, είναι άλλη υπόθεση Tongue
Logged

pikachu93
Καταξιωμένος/Καταξιωμένη
***
Gender: Male
Posts: 254



View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #22 on: November 12, 2015, 18:15:03 pm »

Το preprocessing εχει νοημα μονο για να μειωσεις τον ογκο των δεδομενων που θα επεξεργαστεις?
Logged
Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #23 on: November 12, 2015, 18:49:30 pm »

Quote from: pikachu93 on November 12, 2015, 18:15:03 pm
Το preprocessing εχει νοημα μονο για να μειωσεις τον ογκο των δεδομενων που θα επεξεργαστεις?

Όχι, μπορείς να βοηθήσει και κατά τη διαδικασία του training με αποτέλεσμα να οδηγήσει σε καλύτερο μοντέλο (που θα κάνει καλύτερο classification και, επομένως, θα έχεις καλύτερα αποτελέσματα).
Logged

Ragnar
Ανερχόμενος/Ανερχόμενη
**
Posts: 85



View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #24 on: November 13, 2015, 17:30:00 pm »

Παιδια η ερώτηση που έχω είναι "σχετική". Μπορεί κάποιος που έχει δουλέψει να μας πει περίπου σε πιο ποσοστό μπορούμε βάση των δεδομένων μας να οδηγηθούμε στο accuracy?
Logged
rspappas
WebSlave
Αbsolute ΤΗΜΜΥ.gr
***
Posts: 2709



View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #25 on: November 13, 2015, 17:46:43 pm »

το γενικό ποσοστό ως νουμερο δεν λεει και πολλα, αποσο εχω καταλαβει
δηλαδη, στα δικα μας δεδομενα, αν τα προβλεψεις ολα ως οτι δεν εχουν μπαγκς, τοτε εχεις ποσοστο επιτυχιας 79%, το οποιο ακουγεται καλο, αλλα δεν ειναι

αυτο που κοιταμε στην δικη μας ομαδα τουλαχιστον ειναι ο πινακας συγχυσης, εξεταζοντας ποσα false positives και ποσα false negatives εχουμε καθε φορα. εμεις θεωρησαμε σωστο και εστιαζουμε στο να εξαλειφθουν περισσοτερο τα false negatives (δηλαδη να προβλεψει ο αλγοριθμος οτι δεν εχουν λαθη τα αντικειμενα, ενω οντως εχουν), κατι που μπορει να προσαρμοστει σχετικα ευκολα με τους πινακες κοστους.
Logged


http://en.wikipedia.org/wiki/Lopadotemachoselachogaleokranioleipsanodrimhypotrimmatosilphioparaomelitokatakechymenokichlepikossyphophattoperisteralektryonoptekephalliokigklopeleiolagoiosiraiobaphetraganopterygon

απλυτος
Μόνιμος κάτοικος ΤΗΜΜΥ.gr
******
Posts: 1317



View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #26 on: November 14, 2015, 17:18:33 pm »

χρήσιμο εργαλείο για online convertion αρχείων από csv μορφή σε arff μορφή για να χρησιμοποιηθεί στο weka
Logged

http://arage-e-a-a-k.blogspot.gr/
Gru
Εθισμένος στο ΤΗΜΜΥ.gr
*****
Posts: 915



View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #27 on: November 14, 2015, 19:38:14 pm »

χρησιμοποίησε κάποιος smote?
Logged

http://www.youtube.com/watch?v=4b-GDNrmWqI
dimi93gr
Καταξιωμένος/Καταξιωμένη
***
Posts: 115



View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #28 on: November 14, 2015, 20:30:59 pm »

Οι εγγραφές είναι περιπου 650 μηδέν και 150 άσσοι.
Θα δουλεψουμε με όλο το dataset  ή θα κάνουμε εξισορρόπηση όπως λέει και στην εκφώνηση π.χ με υποδειγματοληψία ή υπερδειγματοληψία ?
Logged
Exomag
Veteran
Διεστραμμένος
******
Gender: Male
Posts: 22045


unfortunate...


View Profile
Re: [Aναγνώριση Προτύπων] 1η Εργασία 2015-2016
« Reply #29 on: November 14, 2015, 20:45:56 pm »

Quote from: dimi93gr on November 14, 2015, 20:30:59 pm
Οι εγγραφές είναι περιπου 650 μηδέν και 150 άσσοι.
Θα δουλεψουμε με όλο το dataset  ή θα κάνουμε εξισορρόπηση όπως λέει και στην εκφώνηση π.χ με υποδειγματοληψία ή υπερδειγματοληψία ?

Όπως θες γενικά, δεν υπάρχει μία σωστή λύση. Ότι σου βγάζει καλύτερα αποτελέσματα.

Όταν λες υπερδειγματοληψία, τι φάση;
Logged

Pages: 1 [2] 3 4 5 Go Up Print
Jump to:  

Powered by SMF | SMF © 2006-2009, Simple Machines LLC
Scribbles2 | TinyPortal © Bloc | XHTML | CSS
Loading...