I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   1 4 ,   N o .   2 M a y   201 9 ,   pp .   1 025 ~ 1029   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 4 .i 2 . pp 102 5 - 1029             1025       Jou r n al   h o m e pa ge ht t p: / / i ae s c or e . c om / j our na l s / i nde x . php/ i j e e c s   A   d a t a   m i n i n g   p r o c e ss us i n g   c l a ss i f i c a t i o n   t e c h n i q u e f o r   e m p l o y a b i l i t y   p r e d i c t i o n       S aou ab i   M o h am e d A b d e l l ah   E z z ati   U ni v e r s i t y   H a s s a n   t he   1s t ,   F S T ,   L A V E T E   L a b o r a t o r y ,   M o r o c c o       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e d   S e 23,   2 018   R e v i s e N o v   11,   2018   A c c e pt e D e c   15,   2 018       T he   u s e   o f   t he   da t a   m i ni ng   h a s   be c o m e   w i d e r   t o da y ;   i t   c a n   be   a ppl i e i s e v e r a l   f i e l d s   l i k e   m a r ke t i ng ,   c us t o m e r   r e l a t i o ns hi m a n a g e m e nt ,   m e di c i n e ,   e ng i ne e r i ng ,   e t c .   I t   c a n   be   us e d   a l s o   i n   e m pl o y a bi l i t y ,   t h e   us e   o f   d a t a   m i ni ng   i n   t hi s   f i e l d   w i l l   g i v e   o ppo r t un i t i e s   a nd   s o l ut i o f o r   de c i s i o m a k e r s   i n   t hi s   f i e l d   i n   o r de r   t o   i m p r o v e   t h e   e m p l oy a bi l i t y   a nd   p r o po s e   s o l ut i o ns .   I t hi s   p a pe r ,   w e   p r o po s e   a   da t a   m i n i ng   pr o c e s s   f o r   e m p l oy a bi l i t y   da t a   us i ng   c l a s s i f i c a t i o n   t e c hni que s ,   pr e s e nt i ng   i d e t a i l s   a l l   t h e   pha s e s   i t he   pr o c e s s   a nd   w ha t   s ho ul be   do ne   i e v e r y   pha s e .   W e   us e R a p i M i ne r   S t ud i o   E duc a t i o na l   V e r s i o 8. 1 . 00 0,   us i ng   a e m pl o y a bi l i t y   da t a s e t .   Ke y w or d s :   Cl a s s i f i c a t i o n   D a t a   m i ni n g   D a t a   m i ni n p r o c e s s   E m p l oy a b i l i t y   R a pi M i n e r   C opy r i gh t   ©   2019  I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   S a o ua b i   M o h a m e d,     D e pa rt m e n t   o f   E l e c t ri c a l   a nd  Co m p ut e r   E n g i n e e r i ng,   F S T ,   L A V E T E   L a b o r a t o r y ,   S e t t a t ,   M o r o c c o ,   U n i v e r s i t y   H a s s a n   t h e   1s t ,   B P   :   577 ,   R o ut e   de   Ca s a ,   S e t t a t ,   M o r o c c o .   E m a i l :   m o ha m e d. s a o ua b i @ g m a i l . c o m       1.   I N TR O D U C TI O N     D a t a   m i n i ng  i s   a b o ut   us i ng  d a t a   a na l y s i s   t oo l s   t o   f i n o ut   n e w   un k n o w n   k n o w l e dge ,   hi dde n   r e l a t i o n s h i ps   b e t w e e n   t h e   l a rge   da t a   s e t   w e   ha v e   o n   h a nds .   T h e s e   t o o l s   c a n   h a ndl e   m a t h e m a t i c a l   a l go ri t hm s ,   s t a t i s t i c a l   m o de l s   a nd   m a c hi n e   l e a rn i ng   m e t h o ds .   D a t a   m i ni ng   i t ’s   n o t   j us t   a b o ut   c o l l e c t i o n   a n d   m a na g i n g   t h e   da t a ,   i t   i n c l ude s   d a t a   a n a l y s i s   a n d   p r e di c t i o n.     In  t hi s   pa pe r ,   w e ’l l   p r e s e nt   t h e   w h o l e   d a t a   m i ni n g   p r o c e s s   i de t a i l s a n d   a l l   t h e   p ha s e s   i t hi s   p r o c e s s .   R e a s e a r c h e r s   m a y   f i n i t   qui t e   di f f i c ul t   t o   c o m e   up   w i t h   a   da t a   m i n i ng  p r o c e s s   a n f o l l ow i n i t   i o r de r   t o   r e s o l v e   a   s o l ut i o n.   W e   p r o po s e a   da t a   m i ni n g   p r o c e s s   a n d   w e   t o o a s   e xa m pl e   e m pl o y a b i l i t y   da t a   t o   a pp l y   o n   t h e   p r o c e s s .   F o r   t ha t ,   w e   us e R a pi M i n e S t u di o   E duc a t i o n a l   V e r s i o 8 . 1. 000,   us i ng  a e m p l oy a b i l i t y   da t a s e t .       2.   R ES EA R C H   M ET H O D   In  t h i s   p ha s e ,   w e   p r e s e n t   t h e   d a t a   m i n i ng   t o o l   w e   us e e xpl a i n i n g   w hi   w e   c h o o s e   t hi s   t o o l .   H e r e   w e   pr e s e nt   a   b r i e f   o ve r v i e w   a bo ut   ra pi m i n e r   a nd  f e w   o t h e t o o l s   de di c a t e f o r   da t a   m i n i ng  i o r de r   t o   c h o o s e   w h i c t o o l   t o   w o r w i t h .       K a l p a n a   R a n g ra   a n d   K . L .   B a n s a l   [1]   p r e s e nt e a   c o m pa ra t i v e   s t udy   of   da t a   m i n i n g   t o o l s ,   i n   o r de r   t pr e s e nt   t h e   a dv a n t a ge s   a n d   t h e   l i m i t a t i o n s   f o r   e a c h ,   a n d   t h e   r e s ul t   o f   t hi s   c o m pa ra t i v e   h a v e   s h o w n   t ha t   t h e   c h o i c e   de pe n ds   o t h e   na t u r e   o f   t h e   e xpe ri m e nt   n e e de d.   F o e x a m p l e ,   W e ka   i s   f o pe o pl e   w h o   a r e   hi g h l y   s ki l l e d,   b e c a us e   i t   i s   v e r y   r o b us t   w i t h   b ui l t - i f e a t u r e s   a n d   o f f e r s   a d di t i o n a l   f u n c t i o n a l i t i e s .   R a p i d   M i n e a n d   O ra n ge   a r e   de di c a t e f o r   a dv a n c e us e r s ,   pa rt i c ul a r l y   i t h e   ha r s c i e n c e s ,   b e c a us e   i t   r e qu i r e s   a ddi t i o n a l   p r o g r a m m i n g   s ki l l s ,   a n t h e   l i m i t e v i s ua l i z a t i o s uppo rt .   R a pi d   M i n e r   i s   t h e   o nl y   t oo l   w h i c h   i s   i nd e pe n de n t   o f   l a n gua ge   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 4 ,   N o .   2 M a y   201 9   :     1025     1029   1026   l i m i t a t i o n   a n d   h a s   s t a t i s t i c a l   a nd  p r e d i c t i v e   a n a l y s i s   c a pa b i l i t i e s ,   s o   i t   c a n   b e   e a s i l y   us e a nd  i m p l e m e n t e o a n y   s y s t e m ,   a l s o   i t   i nt e gra t e s   m a xi m u m   a l go ri t hm s   o f   a n y   o t he m e n t i o n e d   t o o l s   a nd   m o r e   i m po r t a n t ,   i t   c a b e   us e f o r   b i da t a ,   a s   s h o w n   i T a b l e   1 .       T a b l e   1 .   D a t a   M i ni n g   T o o l s   D e s c r i pt i o n   T o o l   N a m e   T y p e   A d v a n t a g e s   L i m i t a t i o n s   Ra p i d   M i n e r   S t a t i s t i c a l   a n a l y s i s ,   d a t a   m i n i n g ,   p r e d i c t i v e   a n a l y t i c s   V i s u a l i z a t i o n ,   S t a t i s t i c a l ,   A t t ri b u t e   S e l e c t i o n ,   O u t l i e d e t e c t i o n ,   p a ra m e t e o p t i m i z a t i o n   Re q u i r e s   p ro m i n e n t   k n o w l e d g e   o d a t a b a s e   h a n d l i n g   O ra n g e   M a c h i n e   l e a r n i n g ,   D a t a   m i n i n g ,   D a t a   v i s u a l i z a t i o n   Be t t e r   d e b u g g e r ,   S h o rt e s t   s c ri p t s ,   p o o s t a t i s t i c s ,   s u i t a b l e   fo n o v o i c e   E x p e rt s   Bi g   i n s t a l l a t i o n ,   L i m i t e d   r e p o r t i n g   c a p a b i l i t i e s   R   S t a t i s t i c a l   C o m p u t i n g   P u re l y   s t a t i s t i c a l   L e s s   s p e c i a l i z e d   fo d a t a   m i n i n g ,   re q u i re s   k n o w l e d g e   o f   a rra y   l a n g u a g e   W e k a   M a c h i n e   L e a r n i n g   E a s e   o f   u s e ,   c a n   b e   e x t e n d e d   i n   RM   P o o d o c u m e n t a t i o n ,   w e a k   c l a s s i c a l   s t a t i s t i c s ,   p o o p a ra m e t e o p t i m i z a t i o n ,   w e a k   c s v   re a d e r       3.   R ES U LTS   A N D   D I S C U S S I O N   In  t hi s   p a r t ,   w e   pr e s e n t e d   t h e   d a t a   m i ni n g   p r o c e s s   w e   pr o po s e .   D a t a   m i ni n g   i s   a i t e ra t i v e   p r o c e s s   t h a t   t y pi c a l l y   i n v o l v e s   t h e   de s c r i b e p ha s e s   b e l l ow .   F i gu r e   1   s h o w s   t h e   d a t a   m i ni g   ge n e ra l   p r o c e s s .         F i gu r e   1 D a t a   m i ni n g   ge n e ra l   p r o c e s s       H e r e   p r e s e n t e d   b e l ow   t h e   de s c ri pt i o o f   t h e   d i f fe r e nt   p ha s e s   of   t h e   da t a   m i n i ng  p r o c e s s .     3. 1 .       P r o b l e m   u n d e r s tan d i n g   A   da t a   m i n i ng  p r o j e c t   s t a r t s   w i t h   t h e   u nde r s t a n d i n g   o f   t h e   pr o b l e m .   T h e   p r o j e c t   ob j e c t i ve   i s   t h e t r a n s l a t e d   i nt o   a   da t a   m i ni n g   p r o b l e m   de f i ni t i o n.   I t h e   p r o b l e m   de f i ni t i o p ha s e ,   da t a   m i ni n g   t o o l s   a r e   n o t   y e t   r e qui r e d   o f   c o ur s e .     3. 2 .       D at e x p l o r ati o n   o r   D ata  u n d e r s tan d i n g   C o l l e c th e   d ata :   W e   c o l l e c t e t h e   da t a   us e i n   o u r   e xpe ri m e n t   f r o m   a   s u r v e y   of   e m pl oy a b i l i t y   c o n duc t e by   H a s s a n   t h e   1s t   U n i v e r s i t y   i n   2016   i pa rt n e r s hi w i t t h e   N a t i o n a l   E v a l u a t i o n   O f f i c e   (N E O unde t h e   H i g h e r   Co un c i l   f o r   E duc a t i o n.   D e s c r i b e   th e   d a ta W e   n e e t o   u nde r s t a n d   t h e   m e a ni n o f   t he   da t a   w e   ha v e .   S o ,   w e   e xpl o r e   t h i s   da t a .   A n d   t h e n ,   w e   i de n t i fy   qua l i t y   p r o b l e m s   o f   t h e   d a t a   s o   w e   c a f i x   i t   i t h e   n e xt   p ha s e ,   w h i c i s   t h e   p r e pa ra t i o n   pha s e .   D ata  p r e p ar ati o n I t hi s   p ha s e ,   w e   c o l l e c t ,   c l e a n s e ,   a n d   f o r m a t   t h e   d a t a   b e c a us e   s o m e   of   t h e   m i ni n g   t e c hn i q ue s   a c c e pt   da t a   o nl y   i n   a   c e rt a i n   f o r m a t .   W e   c a n   a l s o   c r e a t e   n e w   de r i v e a t t ri b ut e s   i f   n e e de d,   f o r   e xa m pl e ,   a n   a v e r a ge   v a l ue .   D ata  s e l e c t i o n H e r e ,   w e   s e l e c t   t h e   da t a   w e   n e e i o r de t o   a ns w e r   t h e   p r o b l e m   i ha n d ,   s o   w e   e xpl o r e   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   da t a   m i n i ng   pr oc e s s   us i n c l as s i f i c at i on   t e c hn i qu e s   f or   e m pl oy a bi l i t y   pr e di c t i on   ( Saouabi   Mo ham e d )   1027   t h e   da t a   a nd  w e   s e l e c t   o n l y   t h e   d a t a   w e   w a nt   t o   us e   i o ur  c l a s s i f i c a t i o n   p r o b l e m .   R e m ov e   c o l u m n s We   r e m o v e   a l l   t h e   i rr e l e v a nt   c o l um n s   t ha t   h a v e   n o t h i n g   t o   do   w i t o ur  c l a s s i f i c a t i o p r o b l e m ,   s uc h   us   na m e ,   p h o n e ,   e t c .   R e p l ac e   m i s s i n v al u e s M i s s i n g   v a l ue s   l e a d   t o   i n a c c u r a t e   m o de l   ge n e r a t i o n,   w h i c m e a f a l s e   r e s ul t s   w h i c h   w e   c a nn o t   r e l y   o n ,   s o   w e   r e m a de   t o   t h i s   p r o b l e m   t hr o ug i m pu t a t i o t e c hni que s ,   o r   w e   r e m o v e   t h e   i n s t a n c e s   c o m pl e t e l y .   R e o r d e r   att r i b u te s :   W e   r e - o r de r   t h e   a t t r i b ut e s   o f   t h e   da t a   s e t ,   j us t   f o r   b e t t e r   o r g a n i z a t i o n   o f   t h e   da t a .   N ow   a f t e r   t h e s e   s t e ps ,   t h e   f i n a l   d a t a   c o n t a i n s   1 208  i n s t a n c e s   o f   13  a t t r i b ut e s ;   w e ’l l   gi v e   s o m e   gr a p h   e xa m pl e s   v i s ua l i z i n g   t h e   da t a .   T h i s   g ra p r e p r e s e n t s   t h e   num b e o f   gra du a t e s   g ra du a t e d   f ro m   di f f e r e n t   u ni v e r s i t i e s ,   a s   w e   c a s e e   F S T   h a s   m o r e   g r a d ua t e s .   F i gu r e   i s   s h o w n   i n   N u m b e r   o f   gra dua t e s   g ra du a t e f r o m   di f f e r e n t   u n i v e r s i t i e s .   T hi s   gra p i l l us t ra t e s   t h e   n u m b e r   o f   g r a du a t e s   g r o upe b y   gr a de   i s   s h o w n   i F i gu r e   3.               F i gu r e   2 N u m b e r   o f   gra du a t e s   g ra du a t e f r o m   di f fe r e nt   u ni v e r s i t i e s   F i gu r e   3 N u m b e r   o f   gra du a t e s   g r o upe by   gra de         F i gu r e   4   s h o w s   t h e   gra du a t e s ’  e m pl o y a b i l i t y   o f   e v e r y   un i v e r s i t y ,   w e   c a n   s e e   t h e   u ni v e r s i t i e s   w h o m   ha v e   m o r e   g ra du a t e s   w o r ki n g ,   a n d   n o t   w o r ki n g .           F i gu r e   4 G ra du a t e s ’  e m p l oy a b i l i t y   of   e ve r y   un i v e r s i t y     3. 3 .       M o d e l i n g   T h e   m o de l i n g   p ha s e   a nd  t h e   e v a l u a t i o p ha s e   a r e   c o upl e d.   T h e y   c a b e   r e pe a t e d   s e v e r a l   t i m e s   t c h a nge   p a r a m e t e r s   u nt i l   o pt i m a l   v a l ue s   a r e   a c h i e v e d.   W h e t h e   f i na l   m o de l i ng   p h a s e   i s   c o m pl e t e d,   a   m o de l   of  hi g qua l i t y   h a s   b e e n   b ui l t .   D e fi n e   tar ge t N o w ,   w e   de f i n e   t h e   t a r ge t ,   w h i c h   m e a n s   t h e   v a ri a b l e   w e   w a n t   t o   p r e di c t ;   e m pl o y a b i l i t y   i s   o ur  v a r i a b l e ,   w i t h   t w o   c l a s s e s ,   w o r ki n g   a nd  n o t   w o r ki ng.   Wh i c h   m o d e l   s h ou l d   w e   ap p l y?  (D e c i s i o n   Tr e e ,   Lo gi s ti c   r e gr e s s i o n   an d   N v e   B aye s ) B a s e o n   t h e   t y p e   o f   t h e   da t a   w e   h a v e   a n d   t h e   t y pe   o f   t h e   v a ri a b l e   w e   w a nt   t o   p r e di c t ,   w e   c h o o s e   t h e   m o de l s   w e   w i l l   a ppl y   duri n g   t hi s   p ha s e .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 4 ,   N o .   2 M a y   201 9   :     1025     1029   1028   W e   w i l l   w o r w i t a   s upe r v i s e l e a rni n g ,   s i n c e   w e   h a v e   a   t a r g e t ,   w hi c i s   t h e   v a r i a b l e   t o   p r e di c t ,   e m p l oy a b i l i t y ,   w i t t w o   c l a s s e s :   w o r ki n g   a n d   n o t   w o r ki n g .   T h e   t y pe   o f   o ur   v a r i a b l e   t o   p r e di c t   i s   qu a l i t a t i v e ,   c o n t a i ni n g   t w c l a s s e s ,   w h i c m e a t h e   t y pe   of   t h e   v a r i a b l e   i s   b i n a r y ;   w e   w i l l   w o r w i t a   c l a s s i f i c a t i o t e c hni que .   W e   w i l l   a ppl y   t h e   c l a s s i f i c a t i o a l go ri t hm   D e c i s i o n   T r e e ,   L o gi s t i c   re gr e s s i o n   a n d   N a ï v e   B a y e s ,   w e   w i l l   a s s e s s   e a c h   m o de l ,   a n d   f i na l l y   w e   c h o os e   w h i c h   m o de l   p r e s e n t   t o   b e s t   a n a c c ur a t e   m o de l   by   e v a l ua t i ng  t h e   m o de l s ’  pe r f o r m a n c e s   i t h e   n e xt   p h a s e .   S p l i D a ta N o w   w e   n e e t o   a ppl y   t h e   m o de l s ,   D e c i s i o T r e e ,   L o gi s t i c   r e g r e s s i o a n d   N a ï v e   B a y e s ,   w e   w i l l   s pl i t   t h e   d a t a   i nt o   t w o   s e t s ,   t r a i n i ng  d a t a   w i t h   80%   a n d   a   t e s t   da t a   w i t 20 %.     I t h e   t r a i n i ng  d a t a ,   w e   b ui l t h e   m o de l s   a nd  t h e n   a ppl i e o n   t h e   t e s t   d a t a .   B e c a us e   t h e   t e s t   d a t a   ha s   n e v e r   b e e n   s e e n   by   t h e   m o de l ,   s o   t h e   pe r f o rm a n c e   w i l l   b e   a   go o gui de   t o   w h a t   w i l l   b e   s e e n   w h e n   t h e   m o d e l   i s   a pp l i e t o   u n s e e n   da t a .     3. 4 .       Ev al u ati o n   N ow ,   w e   w i l l   e v a l ua t e   t h e   s t r e ngt h s   a nd   w e a kn e s s e s   o f   o ur   c l a s s i f i c a t i o a l go r i t hm s .   I t hi s   p h a s e ,   w e   e v a l ua t e   t h e   m o de l s .   If   t h e   m o de l s   do   n o t   s a t i s fy   t h e   e xpe c t a t i o n s ,   w e   go   b a c t o   t h e   m o de l i n p ha s e   a n d   r e b ui l d   t h e   m o de l   by   c h a n g i n g   i t s   pa ra m e t e r s   u n t i l   o pt i m a l   v a l ue s   a r e   a c h i e v e d.     C o n f u s i o n   M atr i x :   A   b i n a r y   c l a s s i f i c a t i o n   m a ke s   p r e d i c t i o n s   w h e r e   t h e   o ut c o m e   h a s   t w o   po s s i b l e   v a l ue s :   po s i t i v e   a n d   n e ga t i v e .   M o r e o ve r ,   t h e   p r e di c t i o n   f o r   e a c e xa m pl e   m a y   b e   r i g ht   o r   w r o n g,   l e a di n g   t o   a   2x2  c o n f us i o n   m a t r i a s   e xpl a i n e d   i T a b l e   2 .       T a b l e   2 .   2X 2   Co n f us i o M a t r i x     P o s i t i v e   Cl a s s   N e g a t i v e   Cl a s s   P re d i c t e d   P o s i t i v e   Cl a s s   T ru e   p o s i t i v e   (T P )   F a l s e   n e g a t i v e   ( F N )   P re d i c t i v e   N e g a t i v e   C l a s s   F a l s e   p o s i t i v e   (F P )   T ru e   n e g a t i v e   (T N )       T P :   t h e   n u m b e r   o f   t rue   po s i t i v e s ,   po s i t i v e   i n s t a n c e s   t ha t   ha v e   b e e n   c o rr e c t l y   i de n t i f i e by   t h e   a l go r i t h m .   F P :   t h e   num b e o f   f a l s e   po s i t i v e s ,   n e ga t i v e   i n s t a n c e s   t ha t   ha v e   be e n   i n c o rr e c t l y   i de nt i f i e by   t h e   a l go r i t h m .   F N :   t h e   num b e o f   f a l s e   n e ga t i v e s ,   po s i t i v e   i n s t a n c e s   t ha t   ha v e   be e n   i n c o rr e c t l y   i de nt i f i e by   t h e   a l go r i t h m .   T N :   t h e   num b e r   o f   t rue   n e ga t i v e s ,   n e ga t i v e   i n s t a n c e s   t ha t   ha v e   be e n   c o rr e c t l y   i de n t i f i e b y   t h e   a l go ri t hm .   M e t r i c s :   D i f fe r e nt   m e t r i c s   c a b e   us e i o r de r   t o   e v a l ua t e   t h e   m o de l s ’  pe r f o r m a n c e   a n d   t o   c h o o s e   w h i c h   p r o v i de   t h e   b e s t   a c c ur a t e   m o de l :   A c c ura c y ,   c l a s s i f i c a t i o n   e rr o r,   r e c a l l ,   k a pp a   s t a t i s t i c s ,   f - m e a s u r e ,   s e n s i t i v i t y ,   pr e c i s i o n,   R O c u r v e   a n d   t h e   t i m e   t o   b ui l d   t h e   m o de l .   H i s   i s   a e xa m pl e   o f   a   r o c   c u r v e   c o m pa r i s o b e t w e e n   t w o   c l a s s i f i e r s .   B a s e o n   R O c ur v e ,   i t   c l e a rl y   i l l us t ra t e s   t h a t   t h e   D e c i s i o n   T r e e   c l a s s i f i e r   i s   m o r e   a c c u r a t e   t h a n   L o gi s t i c   r e g r e s s i o n   a n d   N a ï v e   B a y e s ,   t h e   c l o s e r   t h e   c ur v e   f o l l o w s   t h e   l e f t - ha n d   b o r de a n d   t h e t h e   t o b o r de of   t h e   R O s pa c e ,   t h e   m o r e   a c c u r a t e   t h e   m o de l ,   w hi c h   m e a ns   t h a t   t h e   de c i s i o t r e e   m o de l   i s   m o r e   a c c ura t e .   A s   r e s ul t   o f   t h e   e v a l ua t i o p ha s e ,   w e   e v a l ua t e   t h e   m o de l s ,   D e c i s i o t r e e ,   L o gi s t i c   r e g r e s s i o n   a n d   N a ï v e   B a y e s ,   a n d   w e   c h o o s e   t h e   m o de l   w i t t h e   b e s t   a c c u r a t e   m o de l   b a s e o t h e   d i f fe r e nt   m e t r i c s .   F i gu r e   5   i s   s h o w n   i n   R O c o m pa ri s o n   b e t w e e n   t h e   c l a s s i f i e r s .           F i gu r e   5 R O c o m pa ri s o n   b e t w e e n   t h e   c l a s s i f i e r s       V a r i a b l e s   p r e di c t i ng  g ra du a t e s :   I t hi s   s t e p,   w e   pr e s e n t   t h e   v a r i a b l e s   w h i c h   ha v e   a n   i m po r t a nt   r o l e   pr e di c t i n g   g r a dua t e s ’  e m pl o y a b i l i t y .   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   da t a   m i n i ng   pr oc e s s   us i n c l as s i f i c at i on   t e c hn i qu e s   f or   e m pl oy a bi l i t y   pr e di c t i on   ( Saouabi   Mo ham e d )   1029   3. 5 .       D e p l o ym e n t   A f t e r   a l l   t h e s e   p ha s e s ,   t h i s   i s   t h e   f i n a l   p ha s e ,   w h e r e   w e   us e   m e t h o ds   f o r   i nt e g r a t i ng  d a t a   m i n i ng  di s c ov e r i e s   i nt o   us e .   T h e   e xpe r t s   a n d   de c i s i o m a ke r s   w i l l   b e   a b l e   t o   us e   t h e   r e s ul t s   b y   e xpo r t i n g   i nt o   d a t a b a s e s   o r   a ppl i c a t i o n s   f o r   r e po rt i n g   a n r e v i e w i n g.       4.   C O N C LU S I O N     D a t a   m i ni n g   o ff e r s   m a n y   t e c hn i que s   i o r de t o   d i s c ov e r   hi dde n   p a t t e r s   b e t w e e n   t h e   da t a .   T h e s e   hi dde n   p a t t e rn s   c a b e   us e t o   p r e di c t   f ut u r e   b e h a v i o r.   I n   t h i s   pa pe r,   w e   p r e s e n t e t h e   p r o c e s s   of   da t a   m i ni n g   f r o m   da t a   c o l l e c t i o n   p ha s e   t o   t h e   de pl oy m e n t   p ha s e   us i n R a pi M i n e r   S t ud i o   E duc a t i o na l   V e r s i o 8. 1. 0 00,   us i n g   a e m pl oy a b i l i t y   da t a s e t .   W e   a l s o   p r e s e nt e d   a   b ri e f   o v e r v i e w   a b o ut   R a pi d   M i n e a n d   f e w   o t h e t o o l s   de di c a t e f o r   d a t a   m i ni n g   i o r de t o   c h o o s e   w h i c h   t o o l   t o   w o r w i t h.         R EF ER EN C ES   [ 1]   C o m pa r a t i v e   S t udy   o f   D a t a   M i ni ng   T o o l s   -   K a l pa na   R a ng r a   D r .   K .   L .   B a ns a l   [ 2]   ht t ps : / / o r a ng e . bi o l a b. s i /   [ 3]   ht t p: / / w w w . r da t a m i ni ng . c o m /   [ 4]   ht t p: / / r a pi dm i ne r . c o m /     [ 5]   ht t ps : / / w w w . c s . w a i ka t o . a c . nz / m l / w e ka /   [ 6]   H a ndbo o o f   D a t a   M i n i ng   -   Y e ,   N o ng   [ 7]   D a t a   M i n i ng   a nd   S t a t i s t i c s   f o r   D e c i s i o M a k i ng   -   T uf f é r y ,   S t é p ha ne   [ 8]   H a ndbo o o f   S t a t i s t i c a l   A na l y s i s   a nd  D a t a   M i ni ng   A ppl i c a t i o ns   -   N i s b e t ,   R o be r t , E l de r ,   J o hn ,   I V , M i ne r ,   G a r y   [ 9]   D i s t r i bu t i o p a t t e r ns   o f   e ne r g y   c o ns um e i c l a s s i f i e d   pub l i c   bui l di ng s   t h r o ug t he   da t a   m i n i ng   pr o c e s s   -   Y i bo   C he na , b   ,   J i a nz ho ng   W u   [ 10]   A   ne w   w e b - ba s e d   s o l u t i o f o r   m o de l l i ng   da t a   m i n i ng   p r o c e s s e s   -   V i k t o r   M e dv e d e v a ,   O l g a   K u r a s o v a a ,   J o l i t a   B e r na t a v i c i e n,   P o v i l a s   T r e i gy s ,   V i r g i n i j us   M a r c i n ke v i c i us ,   G i n t a ut a s   D z e m y da   [ 11]   E xt r a c t   B us i ne s s   P r o c e s s   P e r f o r m a nc e   us i ng   D a t a   M i ni ng   -   F a i s a l   M .   N a f i e ,   M e r g a n i . A . E l t a h i r   [ 12]   A   D a t a   M i ni ng   &   K no w l e dg e   D i s c o v e r y   P r o c e s s   M o de l   -   Ó s c a r   M a r n ,   G o nz a l o   M a r i s c a l   a n J a v i e r   S e g o v i a   [ 13]   A ppl y i ng   pr o c e s s   m i n i ng   t e c hn i qu e s   i s o f t w a r e   pr o c e s s   a pp r a i s a l s   -   A r t hu r   M .   V a l l e a , b,   E du a r do   A . P .   S a n t o s ,   E dua r do   R .   L o ur e s   [ 14]   A   s ur v e y   o f   K no w l e dg e   D i s c o v e r y   a nd  D a t a   M i ni ng   pr o c e s s   m o de l s     L uka s z a   K ur g a n   a n P e t r m us i l e k   [ 15]   U s i ng   S e m a nt i c   L i f t i ng   f o r   i m p r o v i ng   P r o c e s s   M i n i ng :   a   D a t a   L o s s   P r e v e nt i o S y s t e m   c a s e   s t udy   -   A nt o ni a   A z z i ni ,   C hi a r a   B r a g hi n ,   E r ne s t o   D a m i a ni ,   F r a nc e s c o   Z a v a t a r e l l i   [ 16]   A ppl y i ng   pr o c e s s   m i n i ng   t e c hn i qu e s   i s o f t w a r e   pr o c e s s   a pp r a i s a l s   -   A r t hu r   M .   V a l l e a , b,   E du a r do   A . P .   S a n t o s ,   E dua r do   R .   L o ur e s     Evaluation Warning : The document was created with Spire.PDF for Python.