Title: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: Time_Tripper on November 03, 2011, 19:28:52 pm Το παρόν τόπικ δημιουργήθηκε για απορίες σχετικά με τις εργασίες στην αναγνώριση προτύπων. Οποιουδήποτε άλλου είδους δημοσίευση θα μεταφέρεται από το θέμα άνευ προειδοποίησης.
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: miaou on November 22, 2011, 15:35:52 pm Το παρόν τόπικ δημιουργήθηκε για απορίες σχετικά με τις εργασίες στην αναγνώριση προτύπων........... μα κανείς δεν απόρρησε...? Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: Time_Tripper on November 22, 2011, 22:27:10 pm Ασε ρε, τζαμπα το εκανα το τοπικ :-[
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: sarovios on November 22, 2011, 22:28:49 pm καντε αποριες γιατι ο Συμεωνιδης θα νομιζει οτι μας εβαλε ευκολα και θα κλαψουμε στην επομενη
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: Time_Tripper on November 22, 2011, 22:33:11 pm Εμενα η απορια μου ειναι η εξης: την παλευει ο Συμεω? Ειχε ιδεα τι μας ζητησε (απο αποψη ογκου) να κανουμε ή αντε γιουρια?????
Ε ρε μας βλεπω η αναφορα να βγαινει πιο μεγαλη απο την τεχνολογια λογισμικου.... :o Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: 4Dcube on November 22, 2011, 23:31:05 pm τι θα γράψεις;;;
μη μου πεις ότι υλοποίησες τους knn και kmeans από την αρχή...! Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: aggalitsas on November 23, 2011, 15:35:11 pm βγάλατε άκρη με τον KNN?
tutorial links are welcome Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: aggalitsas on November 23, 2011, 15:54:17 pm βγάλατε άκρη με τον KNN? tutorial links are welcome βγάλατε άκρη με το β ερώτημα? μπορεί ο KNN να απομακρύνει τιμές? το μονο που σκεφτήκαμε είναι να φτιάξουμε κάποιο κανόνα με κάποιο Distance πίνακα κ ετσι αν τα Κ κοντινότερα σημεία ειναι μεγαλύτερο απο Χ distance να απομακρύνονται ΒΤW o πραγματικός - default -wellknown knn δεν είναι για το 4ο ερώτημα? Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: miaou on November 24, 2011, 18:44:35 pm υπάρχει κάποια οδηγία για το μέγεθος της αναφοράς????? ;)
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: 4Dcube on November 24, 2011, 21:01:10 pm μόνο ότι θέλει περισσότερα διαγράμματα και λίγα γράμματα :P
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: aggalitsas on November 24, 2011, 22:17:13 pm μόνο ότι θέλει περισσότερα διαγράμματα και λίγα γράμματα :P τι σκατά ολοι την ξεπετάξατε? κανείς δεν σκάλωσε πουθενά? Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: 4Dcube on November 25, 2011, 12:23:19 pm your powers of inference are powerful
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: conquer on November 25, 2011, 14:47:26 pm Μπορεί κάποιος να ανεβάσει κανένα διάγραμμα να δούμε τι παίζει?!
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: aggalitsas on November 25, 2011, 17:49:26 pm Μπορεί κάποιος να ανεβάσει κανένα διάγραμμα να δούμε τι παίζει?! /yellre pragmatika ti epaikse kyklwma k meroisthkan at arxeia .m?? to precourse gia thn ergasia egine kai htan toso gamato?? Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: Time_Tripper on November 26, 2011, 15:57:33 pm η δυσκολια της ασκησης ηταν προς την κατανοηση της :P
και για αυτο εγιναν πολλες ερωτησεις και διευκρινισεις μεσα στις βδομαδες στα μαθηματα (και μη). Αποτελεσματα δεν υπαρχουν σωστα και λαθος, ειναι να καταλαβεις τι απεικονιζουν και να βγαλεις τα αντιστοιχα συμπερασματα. Τεσπα, τωρα τελειωσε, αναμενουμε μεσα στο ΣΚ να ανεβει και η 2η εργασια που θα εχει διορια μεχρι 12 Δεκ (συμφωνα με τον Συμεω προχθες). Ας ελπισουμε να ειναι καλυτερη. Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: mysterious on December 03, 2011, 22:39:36 pm Όποιος καταφέρει να περάσει τα δεδομένα από τα arff στο matlab, ας μοιραστεί το μυστικό...
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: Kylries on December 04, 2011, 00:08:27 am Μετά από ψάξιμο κατάλαβα ότι κάτι τέτοιo δε γίνεται αν δεν έχεις κατεβάσει και εγκαταστήσει το weka http://www.cs.waikato.ac.nz/ml/weka/ (http://www.cs.waikato.ac.nz/ml/weka/)..( εκτός αν κάνεις parse στα αρχεία μόνος σου με ένα ωραίο πρόγραμμα που θα κάνεις μόνος σου στο Matlab :D). Στο site της Mathworks υπάρχει ένα πολύ χρήσιμο πακέτο που προσφέρει το interface μεταξύ Matlab και Weka (http://www.mathworks.com/matlabcentral/fileexchange/21204-matlab-weka-interface (http://www.mathworks.com/matlabcentral/fileexchange/21204-matlab-weka-interface)).
Απο το πακέτο αυτό θα χρειαστείς μόνο 2 functions: - Την loadARFF η οποία φορτώνει τα δεδομένα από το .arff σε ένα αντικείμενο java - Την weka2matlab που τελικά επιστρέφει δεδομένα σε μορφή Matlab πλέον Για να καταφέρεις όμως να τις τρέξεις πρέπει να περάσεις στο classpath.txt του Matlab το path του weka.jar που είναι και υπέυθυνο για το transition weka-> matlab. Και για να έχεις το δικαίωμα να το κάνεις αυτό πρέπει να τρέξεις το Matlab ως admin στα Windows.. Από εκεί και ύστερα δουλέυεις στο γνωστό και αγαπημένο σου περιβάλλον.. Το θέμα είναι τι ακριβώς κάνεις μετά...Αυτό ακόμα το ψάχνω Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: Kylries on December 04, 2011, 00:22:06 am Btw έχει καταλάβει κανείς τι συμβολίζουν τα εξτρά attributes του dataset?? Αυτά εδώ δηλαδή:
'wv_have' 'wv_patch' 'wv_use' 'title_in' 'title_with' 'tag_2' 'tag_3' 'tag_patch' Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: b@ki on December 05, 2011, 13:25:39 pm Ο Συμεωνίδης μόλις μας είπε οτι μπορούμε να χρησιμοποιήσουμε απευθείας το weka αν θέλουμε ;)
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: mysterious on December 05, 2011, 15:35:35 pm Μετά από ψάξιμο κατάλαβα ότι.... Ούτε έτσι μου δουλεύει γμτ. Μήπως μπορείς να το εξηγήσεις λίγο βήμα-βήμα? Βρήκε κανείς κανέναν άλλο τρόπο? Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: ripper_george on December 05, 2011, 16:24:54 pm για να μπορέσω να το τρέξω, έπρεπε να γράψω επίσης στο MATLAB
javaaddpath('E:\Program Files\Weka-3-6\weka.jar'); (Η τελος πάντων όπου έχετε κανει install το weka.) Πριν απο τη χρηση των weka2matlab και loadARFF Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: mysterious on December 05, 2011, 16:41:50 pm Λοιπόν...
- Κατέβασα και εγκατέστησα το weka και το πακέτο με τις συναρτήσεις loadARFF κλπ - Πέρασα στο classpath.txt του matlab το weka.jar - Γράφω javaaddpath('E:\Program Files\Weka-3-6\weka.jar'); - Δίνω εντολή π.χ wekaOBJ = loadARFF(Topics5NoRuby.arff) και μου βγάζει: ??? Undefined variable "Topics5NoRuby" or class "Topics5NoRuby.arff". - Αν δοκιμάσω χωρις την κατάληξη, δλδ wekaOBJ = loadARFF(Topics5NoRuby) τότε βγάζει: ??? Undefined function or variable 'Topics5NoRuby'. Τι δε κάνω σωστά; Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: ripper_george on December 05, 2011, 18:15:59 pm [A, datasetA]=weka2matlab(loadARFF('Topic25NoRuby.arff'));
grapse auyto kai pes mou ti ginetai. Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: mysterious on December 05, 2011, 18:56:30 pm [A, datasetA]=weka2matlab(loadARFF('Topic25NoRuby.arff')); grapse auyto kai pes mou ti ginetai. Δούλεψε! Ευχαριστώ πολύ. Αντε να δούμε από εδώ και πέρα τώρα.... Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: AgentCain on December 08, 2011, 15:31:09 pm Απο το πακέτο αυτό θα χρειαστείς μόνο 2 functions: - Την loadARFF η οποία φορτώνει τα δεδομένα από το .arff σε ένα αντικείμενο java - Την weka2matlab που τελικά επιστρέφει δεδομένα σε μορφή Matlab πλέον Βασικά όλες τις χρειάζεσαι, γιατί μερικές αλληλοκαλούνται (δλδ πρέπει να αντιγραφεί όλο το πακέτο) Επίσης θα χρειαστεί λογικά και η trainWekaClassifier όπου για να έχουμε πχ χρήση του αλγορίθμου C4.5 πρέπει να ορίσουμε τύπο classifier weka.classifiers.trees.j48.* όπου * ένα από τα BinC45ModelSelection Class for selecting a C4.5-like binary (!) split for a given dataset. BinC45Split Class implementing a binary C4.5-like split on an attribute. C45ModelSelection Class for selecting a C4.5-type split for a given dataset. C45PruneableClassifierTree Class for handling a tree structure that can be pruned using C4.5 procedures. C45PruneableClassifierTreeG Class for handling a tree structure that can be pruned using C4.5 procedures and have nodes grafted on. C45Split Class implementing a C4.5-type split on an attribute. υποθέτω το 3ο ή το 6ο? :P Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: tomshare3 on December 08, 2011, 22:49:29 pm παντως καμια σχεση τα δεδομενα οπως τα δειχνει το matlab και οπως πραγματικα ειναι στο weka :o
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: aggalitsas on December 08, 2011, 23:51:36 pm παντως καμια σχεση τα δεδομενα οπως τα δειχνει το matlab και οπως πραγματικα ειναι στο weka :o ρε μας δουλεύει? πιο μεγάλους πίνακες δεν είχε να μας δώσει? Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: aggalitsas on December 09, 2011, 00:43:29 am Απο το πακέτο αυτό θα χρειαστείς μόνο 2 functions: - Την loadARFF η οποία φορτώνει τα δεδομένα από το .arff σε ένα αντικείμενο java - Την weka2matlab που τελικά επιστρέφει δεδομένα σε μορφή Matlab πλέον Βασικά όλες τις χρειάζεσαι, γιατί μερικές αλληλοκαλούνται (δλδ πρέπει να αντιγραφεί όλο το πακέτο) Επίσης θα χρειαστεί λογικά και η trainWekaClassifier όπου για να έχουμε πχ χρήση του αλγορίθμου C4.5 πρέπει να ορίσουμε τύπο classifier weka.classifiers.trees.j48.* όπου * ένα από τα BinC45ModelSelection Class for selecting a C4.5-like binary (!) split for a given dataset. BinC45Split Class implementing a binary C4.5-like split on an attribute. C45ModelSelection Class for selecting a C4.5-type split for a given dataset. C45PruneableClassifierTree Class for handling a tree structure that can be pruned using C4.5 procedures. C45PruneableClassifierTreeG Class for handling a tree structure that can be pruned using C4.5 procedures and have nodes grafted on. C45Split Class implementing a C4.5-type split on an attribute. υποθέτω το 3ο ή το 6ο? :P classifier = weka.classifiers.trees.J48.C45Split(); αυτο δουλευει κομπλέ και φτιαχνει classifier οποιος ειναι editable (http://i18.photobucket.com/albums/b111/fragostafylo/classifier.jpg) πως ομως τον χρησιμοποιούμε? δείτε μια αυτό http://stackoverflow.com/questions/6952315/how-to-load-arff-format-file-to-matlab Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: tomshare3 on December 09, 2011, 23:11:25 pm πως χωρισατε τα δεδομενα σε εκπαιδευσης και ελεγχου και σε τι ποσοστο?? τυχαια επιλογη και 60-40% ειναι καλα??? ειχε αναφερει κατι ο συμεω?
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: mitsos_dlx on December 10, 2011, 18:30:22 pm Είχε πει σε κάποια στιγμή ότι αυτός θα έκανε cross-validation, που είναι εύκολο να το επιλέξεις μέσα από το γραφικό περιβάλλον στο weka αλλά δεν βρήκα ακόμα πως γίνεται μέσω matlab...
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: AgentCain on December 10, 2011, 22:09:13 pm πως χωρισατε τα δεδομενα σε εκπαιδευσης και ελεγχου και σε τι ποσοστο?? τυχαια επιλογη και 60-40% ειναι καλα??? ειχε αναφερει κατι ο συμεω? Στις διαλέξεις αναφέρει οτι συνήθως χρησιμοποιείς τα 2/3 για εκπαίδευση και το 1/3 για έλεγχο (όσο περίπου τα πήρες εσύ δλδ) Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: AgentCain on December 11, 2011, 21:05:15 pm Στο περιβάλλον του weka, πως εφαρμόζουμε φίλτρα?
Επέλεξα ενα φίλτρο για τις missing values, πατησα apply αλλα δε βλέπω να κάνει τίποτα. Άσε που χρησιμοποιεί λεει το training data (το οποίο ορίζεις ποιο είναι σε επόμενο βήμα) Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: elenaD on December 12, 2011, 16:10:48 pm και εγώ δοκίμασα και αυτό και το "Remove useless" και δεν φαίνεται να αλλάζει κάτι. Αντίθετα αν δοκιμάσεις οποιοδήποτε άλλο κάνει κανονικά αλλαγές. :( Έκανε κανείς καθαρισμό από weka;
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: johnnysp on December 12, 2011, 18:03:50 pm Τα δεδομένα που μπαίνουν στη Matlab αναφέρονται στις γραμμές των πραγματικών δεδομένων που βρίσκονται στον πίνακα του weka. Υπάρχει κάποιος τρόπος να εισάγουμε τα πραγματικά δεδομένα στη Matlab;
Και επίσης, ο αλγόριθμος C4.5 δεν υπάρχει έτοιμος στη Matlab ε;;; Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: mysterious on December 12, 2011, 19:00:45 pm Κάντε μια χάρη στην ψυχική σας υγεία και μη μπλέκεστε με matlab στη συγκεκριμένη εργασία. Κάντε τα όλα στο weka να ξεμπερδεύετε.
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: aggalitsas on December 12, 2011, 19:03:35 pm Κάντε μια χάρη στην ψυχική σας υγεία και μη μπλέκεστε με matlab στη συγκεκριμένη εργασία. Κάντε τα όλα στο weka να ξεμπερδεύετε. +100000000000 Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: AgentCain on December 12, 2011, 19:35:23 pm Τα δεδομένα που μπαίνουν στη Matlab αναφέρονται στις γραμμές των πραγματικών δεδομένων που βρίσκονται στον πίνακα του weka. Υπάρχει κάποιος τρόπος να εισάγουμε τα πραγματικά δεδομένα στη Matlab; Και επίσης, ο αλγόριθμος C4.5 δεν υπάρχει έτοιμος στη Matlab ε;;; κάποιοι λένε οτι το classregtree εφαρμοζει καποια μορφή C4.5 Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: tomshare3 on December 12, 2011, 19:48:26 pm Στο περιβάλλον του weka, πως εφαρμόζουμε φίλτρα? Επέλεξα ενα φίλτρο για τις missing values, πατησα apply αλλα δε βλέπω να κάνει τίποτα. Άσε που χρησιμοποιεί λεει το training data (το οποίο ορίζεις ποιο είναι σε επόμενο βήμα) νομιζω οτι δεν κανει τιποτα γιατι αντιμετωπιζει τα ? ως κανονικα instances.. αν επιλεξεις το χαρακτηριστικo milestone_title γραφει διπλα missing 0 (0%) >>με μεγαλη επιφυλαξη! :-\ Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: AgentCain on December 12, 2011, 19:58:42 pm και γω αυτό ψυλλιάζομαι, καμια ιδεα? :-\
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: AgentCain on December 12, 2011, 21:26:59 pm και εγώ δοκίμασα και αυτό και το "Remove useless" και δεν φαίνεται να αλλάζει κάτι. Αντίθετα αν δοκιμάσεις οποιοδήποτε άλλο κάνει κανονικά αλλαγές. :( Έκανε κανείς καθαρισμό από weka; Ελα μου ήρθε φλασιά Ισχύει αυτό που λέει ο tomshare3, δεν υπάρχουν missing values. Το uninitialized variable που με μπέρδευε εμένα δεν είναι πρόβλημα στα δεδομένα αλλά τύπος bug. Προς το παρόν δλδ δε μου φαίνεται ότι χρειάζεται κάποιου είδους καθαρισμός. Από κανονικοποίηση δε ξέρω τι παίζει βεβαια... Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: miaou on December 12, 2011, 23:04:15 pm hey
Από κανονικοποίηση δε ξέρω τι παίζει βεβαια... βασικά αν κάνεις κανονικοποίηση δε βλέπω κι εγώ να αλλάζουν τα δεδομένα αλλά έχει διαφορά στο αποτέλεσμα. Λογικά έχει γίνει η κανονικοποίηση γτ πάνω πάνω στα αποτέλεσματα γράφει "........-weka.filters.unsupervised.attribute.Reorder-R1-10,12-21,11-weka.filters.unsupervised.instance.Normalize-N1.0-L2.0" ψέμματα.... unsupervised.attribute.Normalize-N1.0-L2.0 πρέπει Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: AgentCain on December 13, 2011, 10:57:55 am αλλάζουν τα δεδομένα πχ δες το wv_have
και τωρα συνειδητοποίησα ότι για να νιώσει το παλιοweka πρέπει το αρχείο που προεπεξεργάζεσαι να το σώσεις πρώτα όταν το περάσεις από φίλτρο. Σε μένα αν δε το σώσεις, στη ταξινόμηση θεωρεί το αρχικό αρχείο >:( Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: Time_Tripper on December 13, 2011, 13:58:03 pm στην εκφωνηση λεει εχει 10 σετ δεδομενων και στο ζιπ εχει 8, am I missing something? :???:
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: Kylries on December 13, 2011, 15:19:01 pm στην εκφωνηση λεει εχει 10 σετ δεδομενων και στο ζιπ εχει 8, am I missing something? :???: Not at all... Τυπογραφικό λάθος again... :P Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: aggalitsas on December 13, 2011, 17:59:37 pm άγιε βασίλη για φέτος το δώρο μου θέλω να είναι αλλαγή της δήλωσης μαθημάτων μου
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: tomshare3 on December 13, 2011, 21:26:16 pm στο βημα 4 θέλει να επιλέξουμε τον καλύτερο αλγόριθμο ή το καλύτερο εκ των 5-10-20-25(Νο)Ruby ???
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: johnnysp on December 13, 2011, 22:15:46 pm αλλάζουν τα δεδομένα πχ δες το wv_have Ποιο φίλτρο Normalize χρησιμοποιείς;; Από τον φάκελο attribute ή από το instance;;και τωρα συνειδητοποίησα ότι για να νιώσει το παλιοweka πρέπει το αρχείο που προεπεξεργάζεσαι να το σώσεις πρώτα όταν το περάσεις από φίλτρο. Σε μένα αν δε το σώσεις, στη ταξινόμηση θεωρεί το αρχικό αρχείο >:( Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: AgentCain on December 13, 2011, 23:12:46 pm attribute
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: ripper_george on December 14, 2011, 06:56:32 am Υπάρχει λόγος για normalise όταν καλούμε τους J48 και Bayes απο το WEKA? Η γίνεται αυτόματα η δουλειά?
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: AgentCain on December 14, 2011, 10:17:56 am να μη θίξω κανένα, αλλά δε το εμπιστεύομαι το weka :P
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: miaou on December 14, 2011, 11:33:49 am REMINDER: 0,75!!!!!!!!!!!!!!!
Title: Re: Αναγνώριση Προτύπων: Εργασίες 2011-2012 Post by: ripper_george on December 14, 2011, 20:24:43 pm να μη θίξω κανένα, αλλά δε το εμπιστεύομαι το weka :P In GOD we trust! :P Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: johnnysp on December 14, 2011, 21:45:03 pm Έχουμε τελικά ιδέα αν πρέπει να γίνει καθαρισμός των δεδομένων με κάποιο φίλτρο ή όχι;;; :???:
Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: AgentCain on December 14, 2011, 22:59:41 pm Προσωπικά είμαι back to point zero
Ρε ξέρει κανείς κατά πόσο έχουμε δικαίωμα να "παραμερίσουμε" attributes στο όνομα της καλύτερης ταξινόμησης? :P Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: Time_Tripper on December 16, 2011, 23:29:50 pm Ο Συμεώ είπε ότι δεν ήταν αυτός ο λόγος που μας έβαλε την εργασία και θα δώσει 100% του βαθμού και σε όποιον κόψει attributes και σε όποιον δεν κόψει. Αν τώρα πιστεύουμε ότι κάποια από αυτά τα attributes δεν συνεισφέρουν (δικαιολογηθεί δηλαδή μέσα στην αναφορά) μπορούμε να τα κόψουμε no prob.
Επίσης να πω ότι η εργασία πήρε παράταση για την Τρίτη νομίζω. Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: ripper_george on January 07, 2012, 19:05:43 pm κατάφερε κανένας να περάσει τα δεδομένα στο ΜΑΤLAB στην καινούργια εργασία?
Και βασικά τα αρχεία τι κατάληξη έχουν κανονικά? εγώ τα έβαλα csv, και μπορώ να τα ανοίξω με Excel, αλλά με importdata() του MATLAB δουλειά δεν γίνεται, και επίσης δεν μπορούν να ανοίξουν με Weka... Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: AgentCain on January 08, 2012, 12:17:54 pm Καταρχάς μη παιδεύεσαι με το συνολικό αρχείο. Απόπειρες να το φορτώσω στο weka δείχνουν ότι απαιτεί 20GB μνήμης RAM μόνο για να φορτώσει! :P
Από κει και πέρα με email στον Συμεωνίδη για το θέμα αυτό μου είπε ότι μπορουμε να χρησιμοποιήσουμε το 10% subset αν δε γίνεται αλλιώς ή να κάνουμε ένα data stream (το οποίο δε ξέρω πως γίνεται, λογικά σε matlab ή άλλη γλώσσα προγραμματισμού) ώστε να τραβάμε όσα θέλουμε. Να ξέρεις πάντως ότι το συνολικό αρχείο έχει κάπου 5.000.000 εγγραφές :P Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: mitsos_dlx on January 08, 2012, 14:21:00 pm Εχω δοκιμάσει και εγώ όλους τους loaders του Weka και δεν ανοίγει τίποτα (ούτε το 10%). :(
Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: mysterious on January 08, 2012, 17:50:26 pm Σε εμένα δούλεψε το εξής σχετικά με το φόρτωμα, οπότε το παραθέτω...
Αρχικά κατεβάζουμε από εδώ: http://tunedit.org/repo/KDD_Cup/KDDCup99.arff το 10% subset σε μορφή arff. (Θέλει registration στο site.) Λογικά ομως δε θα το διαβάζει το weka και θα λεει out of memory. Για να το διαβάσει, ανοίγουμε με το notepad το C:\Program Files\Weka-3-6\RunWeka.ini και αλλάζουμε τη γραμμή "maxheap=256m" σε μεγαλύτερη τιμή. Σε εμένα δούλεψε το 1024m. Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: ripper_george on January 09, 2012, 10:09:32 am Καταρχάς μη παιδεύεσαι με το συνολικό αρχείο. Απόπειρες να το φορτώσω στο weka δείχνουν ότι απαιτεί 20GB μνήμης RAM μόνο για να φορτώσει! :P Από κει και πέρα με email στον Συμεωνίδη για το θέμα αυτό μου είπε ότι μπορουμε να χρησιμοποιήσουμε το 10% subset αν δε γίνεται αλλιώς ή να κάνουμε ένα data stream (το οποίο δε ξέρω πως γίνεται, λογικά σε matlab ή άλλη γλώσσα προγραμματισμού) ώστε να τραβάμε όσα θέλουμε. Να ξέρεις πάντως ότι το συνολικό αρχείο έχει κάπου 5.000.000 εγγραφές :P To μόνο που κατάφερα είναι περάσω το 10% στο ΜΑΤΛΑΒ, αλλά η δουλειά έγινε μετά από κανένα 20λεπτο! (Με importdata), τα οποία όμως δυσκολεύομαι να χειριστώ για μου τα έχει περάσει σαν [494021Χ1] char, και όποτε γράφω a(1), τότε λέει ότι είναι [1Χ124], αλλά δεν μου τις παρουσιάζει τις τιμές. Σε εμένα δούλεψε το εξής σχετικά με το φόρτωμα, οπότε το παραθέτω... Αρχικά κατεβάζουμε από εδώ: http://tunedit.org/repo/KDD_Cup/KDDCup99.arff το 10% subset σε μορφή arff. (Θέλει registration στο site.) Λογικά ομως δε θα το διαβάζει το weka και θα λεει out of memory. Για να το διαβάσει, ανοίγουμε με το notepad το C:\Program Files\Weka-3-6\RunWeka.ini και αλλάζουμε τη γραμμή "maxheap=256m" σε μεγαλύτερη τιμή. Σε εμένα δούλεψε το 1024m. Και άντε τα περάσαμε. Μετά μπορούμε να τα στείλουμε στο ΜΑΤΛΑΒ με τις γνωστές συναρτήσεις, η θα βγάλει και πάλι σφάλμα? PS. δεν ανεβάζεισ και το αρχείο KDDCup99.arff, να μην κάνουμε register? Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: b@ki on January 09, 2012, 12:35:38 pm PS. δεν ανεβάζεισ και το αρχείο KDDCup99.arff, να μην κάνουμε register? http://www.multiupload.com/PN38OA41E6 p.s. οσοι έχουν θέμα με την μνήμη του weka se mac Open up a terminal window and type: > > cd /Applications/weka-3-5-7.app/Contents > > Now type: > > open Info.plist > > This will start OSX's Property List Editor application. Expand first > the "root" and then the "Java" entries in the list. Under "Java" > you will find an entry called "VMOptions" with the value "-Xmx256M". > Edit this (by double clicking on the value) and enter a higher value > for the heap size. με 1024 απλα το φόρτωσε απο επεξεργασια δεν κανει τιποτα.. Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: tomshare3 on January 09, 2012, 13:57:49 pm To μόνο που κατάφερα είναι περάσω το 10% στο ΜΑΤΛΑΒ, αλλά η δουλειά έγινε μετά από κανένα 20λεπτο! (Με importdata), τα οποία όμως δυσκολεύομαι να χειριστώ για μου τα έχει περάσει σαν [494021Χ1] char, και όποτε γράφω a(1), τότε λέει ότι είναι [1Χ124], αλλά δεν μου τις παρουσιάζει τις τιμές. αυτο που δουλεψε για το ματλαμπ (αλλα δεν ξερω κατα ποσο ειναι ευχρηστο) ειναι να τα περασω πρωτα σε ενα xlsx. Ιmport data σε καινουριο exel και μετα import το exel στο μτλαμπ.. για να διατηρησει ομως την μορφη των αλφαριθμητικων δεδομενων επρεπε να τα βαλω ως cell στο ματλαμπ και ο χειρισμος των cell ειναι αρκετα δυστροπος! αα και επισης σε δυο κομματια γιατι δεν μπορουσε να χειριστει 500.000 εγγραφες το ματλαμπ και πετουσε σφαλμα! :o :o :o :o Αρα.. καλυτερα weka και ξεμπερδευουμε! Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: mitsos_dlx on February 28, 2012, 17:17:30 pm Τόσο καιρό πίστευα από αυτά που άκουγα στα μαθήματα ότι η κλάση θα έχει 5 τιμές: normal, dos attack, κλπ.
Τελικά σύμφωνα με τη περιγραφή στη σελίδα του διαγωνισμού αυτά είναι κατηγορίες επιθέσεων, το dateset έχει 24 διαφορετικές τιμές για την κλάση, που αντιστοιχίζονται σε 4 κατηγορίες σύμφωνα με αυτή τη λίστα: http://kdd.ics.uci.edu/databases/kddcup99/training_attack_types (http://kdd.ics.uci.edu/databases/kddcup99/training_attack_types). Οπότε τι κάνουμε εμείς? Αντικαθιστούμε στην αρχή τους τύπους των επιθέσεων με τις κατηγορίες τους και στη συνέχεια δουλεύουμε με 5 τιμές για τη κλάση? Ή φτιάχνουμε classifiers για 24 τιμές και μετά ομαδοποιούμε τις αντίστοιχες γραμμές στον confusion matrix? Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: AgentCain on February 28, 2012, 20:59:40 pm Ότι θες κάνεις
Αν μπορεσεις να κανεις μοντέλλο που αναγνωρίζει εκτός από τον τύπο (τι απο τα 5) και το είδος (τι απο τα 24) μαγκιά σου Το καλύτερο που έχεις να κάνεις είναι να δοκιμάσεις και τις 2 επιλογές και να δεις ποια από τις 2 συμπεριφέρεται καλύτερα (την 2η μπορεις να την ανάγεις στη 1η) και επιλέγεις ανάλογα Αν θες να play safe, κάνε ότι κάναν στο διαγωνισμό Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: tomshare3 on March 01, 2012, 01:11:40 am οταν αποθηκευω ενα μοντελο στο weka, μετα πως μπορω να το ελέγξω με ενα αλλο σετ ελεγχου??
Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: miaou on March 01, 2012, 18:11:26 pm βρέθηκε ο άνθρωπος που θα μας λύσει όλες τις απορίες!!! Friend Request ΤΩΡΑ!!!!!
κ. Συμεωνίδη ίσως γνωρίζετε λιγότερα από τον... https://www.facebook.com/people/WeKa-Lee/100000576273278 Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: miaou on March 04, 2012, 11:55:25 am Καλημέρα!
Χρησιμοποίησε κανείς CVParameterSelection για να βρει το C για το SMO?? Έκανα 10,5 ώρες για να κάνει built το μοντέλο και τώρα μου βγάζει όλο not responding κι επανέρχεται μόνο του χωρίς όμως καμία εξέλιξη.... Στην αρχή είχα το num folds -1 και τώρα το έκανα 5 μήπως βγάλω κανένα αποτέλεσμα... Καμιά καλύτερη ιδέα? Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: neon on March 04, 2012, 12:34:18 pm Καλημέρα! Χρησιμοποίησε κανείς CVParameterSelection για να βρει το C για το SMO?? Έκανα 10,5 ώρες για να κάνει built το μοντέλο και τώρα μου βγάζει όλο not responding κι επανέρχεται μόνο του χωρίς όμως καμία εξέλιξη.... Στην αρχή είχα το num folds -1 και τώρα το έκανα 5 μήπως βγάλω κανένα αποτέλεσμα... Καμιά καλύτερη ιδέα? SMO ? Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: zeus90 on March 04, 2012, 12:35:06 pm Είναι ο svm στο weka ;)
Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: miaou on March 04, 2012, 13:32:34 pm ΞεDone!
Αν μπόρεσε κανείς να βρει το C ας το πει και σε μένα :-) Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: elenaD on March 04, 2012, 18:22:04 pm ΞεDone! γιατί δεν δουλεύεις με το default c=1;Αν μπόρεσε κανείς να βρει το C ας το πει και σε μένα :-) Title: Re: [Αναγνώριση Προτύπων] Εργασίες 2011-2012 Post by: miaou on March 07, 2012, 11:05:57 am Το C τελικά βρέθηκε... το θέμα είναι ότι στο bagging και boosting (είχε καλά αποτελέσματα η ταξινόμηση), αργεί τρομακτικά να τρέξει....
Διάλεξε κανείς τον svm για να κάνει boosting και bagging? |