I ndo ne s i a n J o ur na l  o f  E l e c t r i c a l  E ng i ne e r i ng  a nd C o m p u t e r   S ci en ce   V ol .  9,  N o.   2,  F e br u a r y  2018,   pp.  4 47~ 4 59   I S S N :  2502 - 4752,  D O I :  10. 11 591/ i j e e c s . v 9. i 2. pp4 47 - 459          447       Jou r n al  h om e p age h ttp : //ia e s c or e . c om / j our nal s / i nde x . php/ i j e e c s   E duca t io na l Da t a  M ining  a nd Ana l y s is  o f  St uden t s   Aca de m ic  P erf o r m a nce  Us i ng  WE K A       Sa di q H us s a i n 1 ,  N e a m a A b d u l az i z  D ah an 2 ,  F a dl  M ut a he r  B a - A lw i 3 ,  N aj ou a  R i b at a 4   1 E x a m i na t i on B r a nc h ,   D i br ug a r h U ni v e r s i t y ,   I ndi a   2, 3 D ep ar t m en t  o f  C o m p u t er  S ci en ce,  S an a’ a U n i v er s i t y ,  S an a’ a,  Y em en   4 Li r o s a   L ab o r at o r y ,  A b d el m al e k  E s s aâd i  U n i v er s i t y ,  T et u an ,  M o r o cco         A rt i cl e I n f o     AB S T RAC T     A r tic le  h is to r y :   R ecei v ed   Se p   2 ,  201 7   Re v i se d   De c   25 ,  2 01 7   A ccep t ed   J an   11 ,  2 01 8       I n  t h i s  co m p et i t i v e s cen ar i o   o f  t h e ed u cat i o n al  s y s t e m ,  t h e h i g h er   ed u cat i o n   i ns t i t u t e s  us e   da t a  m i ni ng  t o ol s  a nd  t e c hni que s  f or  a c a de m i c  i m pr ov e m e nt  of   t he  s t ude nt  pe r f or m a nc e   a nd t o p r e v e nt  dr op ou t .  T he  a ut hor s  c ol l e c t e d da t a   f r o m  t h r ee co l l eg es  o f   A s s a m ,  I ndi a .  T he   da t a  c ons i s t s   of  s oc i o - eco n o m i c,   de m og r a phi c  a s   w e l l  a s   a c a de m i c  i nf or m a t i on of  t hr e e  hun dr e d s t u de nt s  w i t t we n t y - f our  a t t r i but e s .   F o ur  c l a s s i f i c a t i on m e t hods ,  t he  J 4 8,   P A R T ,  R a ndom   F o r es t  an d  B ay es  N et w o r k  C l as s i f i er s   w er e u s ed .  T h e d at m i ni ng   t ool  us e d   w a s  W EK A .   T h e  h ig h  in f lu e n tia l  a ttr ib u te s  w e r e  s e le c t e d  u s in g  th e  to o l.  T h e   i nt e r na l  a s s e s s m e nt   a t t r i but e  i n t he  c ont i n uo us  e v a l ua t i on pr oc e s s   m a k e s  t he   h ig h e s t im p a c t in  th e  f in a l s e m e s te r  r e s u lts  o f  th e  s tu d e n ts  in  o u r  d a ta s e t.   T h e   r es u l t s  s how e d t ha t  r a nd om  f or e s t  o ut pe r f or m s  t he  ot he r  c l a s s i f i e r s  ba s e d o a c c ur a c y  a nd c l a s s i f i e r  e r r or s .   A pr i or i  a l g or i t hm   w a s  a l s o us e d t o f i nd t he   a s s o c ia tio n  r u le  m in in g  a m o n g  a ll th e  a ttr ib u te s  a n d  th e   b e s t r u le s  w e r e  a ls o   di s pl a y e d.   Ke y wo rd s :   E d u c a tio n a d at m in in g   C la s s i f ic a tio n   a l g o r ith m s   W E KA   S t ud e nt s   a cad e m i p er f o r m a n ce   C opy r i g ht   ©  201 8   I ns t i t ut e  o f  A d v anc e d E ngi ne e r i ng  an Sc i e nc e   A l l  ri g h t s re se rv e d .   Co rre sp o n d i n g  Au t h o r :   S a d i q  H u s sa i n   E xa m i na t i o n B r a nc h,  D i b r u ga r h U ni ve r s i t y,  I nd i a   E m a il:  s a d iq @ d ib r u . a c . in       1.   I NT RO D UCT I O N     D at Mi n i n g   ( D M )   i s   o n o f   t h ac t i v e   f i el d s   i n   t h C o m p u t er   S ci e n ces   ( C S s ) .   I t   i s   y o u n g   an d   p r o m i s i n f i e l d .  D ue  t o  t he  e x t e ns i vi t y a nd  t he  h u ge  a va i l a b i l i t y  o f  t he  a m o u nt s  o f  d a t a  a nd  t he   ur ge nt   ne e d  t o   c o nve r t  s uc h d a t a  i nt o   u s e f ul   i n f o r m a t i o n a nd  k no w l ed g e,  D at m i n i n g   h as  e n t i ced  a g r eat  i m p o r t an ce o f   i n t er es t  i n  t h e i n f o r m at i o n  i n d u s t r y  an d  i n  s o ci et y  a s   w el l  i n   r ecen t   y ear s  [ 1 ] .  D M f o cu s es   o n  t h e e x t r act i o n  o f   h i d d en   k n o w l ed g e f r o m  v ar i o u s  d at w ar e h o u s e s ,  d at m ar t s ,  an d  r ep o s i t o r i es .   L ar g e d at a b eco m e s  u s el es s   w it h o u t p r o p e r  u tiliz a tio n .     S o m et i m es   D M can  b n a m e d  al s o  K n o w l ed g e d at d i s co v er y  ( K D D ) .   T h e y   ar e s i m i l a r   i n   m a n y   th i n g s  b u t t h e y  a r e  r e a ll y  d i f f e r e n t i n  a n  e s s e n tia l  p o in t.  D M  is   to  f in d  a  s u b s e D i o f  D  th a t   m e t a   lo g ic a l   f o r m ul a  w i t hi n   t h s co p e o f  D i  r ed u ced   m at r i x .  I f  D M  ca n n o t  d ed u ced  an y  r es u l t s  f r o m  t h at  l o g i cal   f o r m u l a,   K D D   w ill b e  f o u n d ,  in  c o n tr a s t,  e v e n  i f  t h a t lo g ic a f o r m u la   c a n  c o v e r  a ll th e  d a ta  a s   w e ll  a s  th e  p o s s ib ili t y  o f   t h k n o w l ed g e d i s co v er y .  T h m ai n   f eat u r e o f  b o t h   da t a   m i n i ng  a n d kn o w l e dg e  di s c ov e r y  i s  t o de r i v e   co m m o n  ex p r es s i o n s  o f  c h ar act er i s t i cs  t h at  ar e s h ar ed  b y  al l  el e m en t s  i n  a s et  [ 2 ] .  K D D  an d  D M  h av e   t ech n i q u es   t h at  ar u s ed  t o  e x t r act  u s e f u l  i n f o r m at i o n   f r o m   l ar g e a m o u n t  o f  d at a i n  t h e d at ab as e [ 3 ,  4 ] .   T he   r e s ul t s  o f  a p p l y i n t he  D M  a l go r i t h m s  o n a n y   gi ve n o r   m a nua l - g e n er at ed  d at as et  can  b n a m ed  t h R u l e   D i s co v er y  [ 5 ] .  T h er e ar e t w o   m ai n  t y p es  o f  t h es e  r u l e s ,  t h e  p r o d u ct i o n  r u l es  a n d  t h e as s o ci at i o n  r u l es .   A c c or di ng  t o Q u i nl a n  [ 6] ,  t h e  pr o du c t i on  r u l e s  a r e a co m m o n  f o r m al i s m   f o r  ex p r es s i n g  k n o w l ed g e i n  e x p er t   s y s t e m s .  D eci s i o n  T r ees  r u l e s   can  b e al s o  t r a n s f o r m ed  i n t o  t h e p r o d u ct i o n  r u l es  [ 6 ] .  T h e as s o ci at i o n  r u l es   w as   f ir s tl y  a d d r e s s e d  to   f i n d  a  r e la t io n s h ip  a m o n g  s a le s  o f  d if f e r e n t ite m s   f r o m  t h e  a n a l y s i s  o f a  b i g  d a t a  [7 ]. T h e re   ar e m a n y  f i e l d s  t h a t  D M h a s  b een  ap p l i ed  i n ,  O n e o f  t h e m  i s   t h e ed u cat i o n al  D M  ( E D M ) .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SSN :   25 02 - 4752   I nd o ne s i a n J  E l e c  E ng  &  C o m p  S c i ,   V o l.   9 , N o 2 F e b r u a r y   2018 :    44 7     459   448   E d u cat i o n al  d at m i n i n g   i s  a n  e m er g i n g   f i el d  i n  t h e ar ea o f  d at m i n i n g .  I n  t h i s  co m p e t i t i v w o r l d ,   t h e ed u cat i o n al  s e t t i n g  al s o  u s es  d at a m i n i n g  t o o l s  t o  ex p l o r e an d  an al y ze s t u d en t  p er f o r m an ce,  p r ed i ct  t h ei r   r e s u l t s  t o pr e v e n t  dr op ou t  a n d f oc us  on  bot h  g ood a n d a c a de m i c a l l y  poor  pe r f or m e r s ,  f e e dba c k  f or  t he   f acu l t i es  a n d  i n s t r u ct o r s ,  v i s u a l i zat i o n  o f  d at a an d  t o   h a v e a  b et t er  as s es s m e n t  o f  l ear ni n p r o c e s s .  T he  q ua l i t of  e du c a t i on   n e e ds  t o be  i m pr ov e d a n d e du c a t i o n a l  da t a   m i n i ng i s  a  t ool   f or  t h i s  i m p r ov e m e n t .  M ode r ed u cat i o n al  i n s t i t u t es   n eed  d at m i n i n g   f o r  t h ei r   s t r at eg y  a n d  f u t u r e p l a n s .  S t u d en t s  p er f o r m an ce d ep en d s  o n   v a r io u s   f a c to r s  lik e p er s o n al ,   s o ci al ,  eco n o m i c an d  o t h er  en v i r o n m en t al  o n es [ 8 ,  9 ] .   T h e t o p - l ev el  ed u cat i o n al   in s t itu te s  a u th o r itie s   m a y   u t iliz e  th e  o u tc o m e  o f  t h e  e x p e r im e n ta l r e s u l ts  to   u n d e r s t a n d  th e  tr e n d s  a n d   b eh av i o r s  i n  s t u d en t s  p er f o r m an ce  w h i c h   m a y  l ead  t o  d es i g n   n e w  p ed ag o g i cal  s t r at e g i es  [ 1 0 ] .   T h er e ar e a n u m b er  o f  cl as s i f i cat i o n  al g o r i t h m s :  D eci s i o n   T r ee ,  N eu r al  N et w o r k ,  N v e  B ay e s ,  K - N ear es t  n e i g h b o r ,  R an d o m  F o r es t ,   A d aB o o s t ,  S u p p o r t  V ect o r  M ach i n es  et c.  [ 1 1 ] .  I n  t h i s  r e s ear ch ,  a u t h o r s  ar e   g oi ng  t o u s e  n ot a bl y   s o m e o f  t h e m   f o r   m i n i n g  t h e acad e m i c s t u d en t s  p er f o r m an ce :  J 4 8 ,  B ay es N et ,  P A R T   a n d  R a n d o m   F o r e s t c la s s if ic a tio n  a lg o r it h m s .   A p r io r i a lg o r ith m ,  a s  a  p a r t o f  th e  u n s u p e r v is e d  le a r n i n g  a n d   on e  of  t h e   m o s t  popu l a r  a l g o r i t hm s   f or  a s s oc i a t i on r u l e   m i n i ng  w a s  u s e d  a d d itio n a ll y  to  r e v e a th e  h id d e n   r u l es  f r o m  o u r  d at as et  [ 1 2 ] .   T h e y  co m p ar ed  each  o f  t h e al g o r i t h m s  b as ed  o n  i t s  accu r ac y  t o  s el ect  t h e b es t   pe r f or m e d a l g or i t hm   f or  t h e  j o b.      C l as s i f i cat i o n  i s  o n e o f  t h p r ed i ct i v e t as k s  [ 1 ]  an d  i s  t h m o s t  co m m o n l y   u s e d da t a   m i n i ng  t ech n i q u e i n  p r ed i ct i n g  t h e s t u d en t s  p er f o r m a n ce i n  ed u c at i o n al   i n s t i t u t es  [ 1 1 ,  1 3 ,  1 4 ] .  S ev er al  a t t r i b u t e s   w er e co n s i d er ed  i n  o u r  s t u d y .   T o  f i n d  t h e h i g h  i n f l u e n ce at t r i b u t es ,  f eat u r e s el ect i o n   w as  co n d u ct ed  f i r s t .   F eat u r s el ect i o n  r e m o v es   t h e u n n ece s s ar y  at t r i b u t es   f r o m  t h e d at as e t  t o  e x t r act   u s e f u l  a n d   m ea n i n g f u l   i n f o r m a t i o n.  I t   m a ke s  t he   m i ni ng  p r o c e s s   f a s t e r ,   va l ua b l e  a nd   m e a ni n g f u l .  I n  t he  s t ud y ,   s t ud e nt s  e nd   s e m e s t er  p er cen t ag e i s  s el ec t e d  as  t h e d ep en d en t  p ar a m et er .  T h e p er cen t ag e s  ar e cat eg o r i z ed  as  ‘ B es t ,  ‘ V er y   G ood’ ,  ‘ G ood’ ,  ‘ P a s s ,   F a i l .   T h e  da t a  m i ni ng  t ool  u s e d f or  t h e  s t u d y   w a s  W E K A  ( W a i k a t o E n v i r onm e nt  f or   K n o w l ed g A n al y s i s ) .  W E K A  i s  an  o p en  s o u r ce t o o l   w r i t t en  i n  J av a t h at  i s   w i d el y   u s ed  b y  t h e d at m i n er s   [1 5 ].  W E K A   i m p le m e n ts   m o s t  o f  th e   m a c h i n e  le a r n in g  a l g o r ith m s  a n d  v is u a liz e s  its  r e s u lt s  a s   w e l l.   T h e p ap er  i s  o r g an i zed  as   f o l l o w s :  i n  S ect i o n  I I  a r ev i e w  o f   r el at ed  l i t er at u r e i s  p r es en t ed ,   S ect i o n  I I I   i n t r o d u ces   C l a s s i f i er  e v al u at i o n s  a n d  E r r o r  M eas u r e m en t  T ech n i q u es  u s ed  i n  t h i s  r es ear ch .  S ect i o n  I V   p r o v i d es  A p p l i ed   D at m i n i n g  al g o r i t h m s  o n   t h e s el ect ed   d at as et .  S ect i o n   V   s h o w ed  ex p er i m e n t al   r es u l t s ,   S e c t i o n V I  p r e s e nt s  t he   A s s o c i a t i o n r ul e   m i ni n w o r k,  a nd  s e c t i o n V I I  c o nc l ud e s  t he   w o r k.         2.   LI TER A TU R E R EV I EW   A h ma d  et  al  [ 16 ]  d es i g n ed   a f r a m e w o r k   t o  p r ed i ct  t h e   acad em i c p er f o r m a n ce o f  t h e  f i r s t   y ear   b ach el o r  s t u d e n t s  o f  co m p u t er  s ci e n ce co u r s e.  T h e d at a s et  c o n t ai n ed  8   y ear s  d at s t ar t i n g   f r o m  J u l y  2 0 0 6 - 07  t o J u l y  2013 - 1 4 .  T h e d at a co l l ec t ed  co n t ai n ed   v ar i o u s   as p ect s  o f  s t u d en t s '  r eco r d s   i n cl u d i n g  p r ev i o u s   acad em i c r eco r d s ,  f a m i l y  b ac k g r o u n d  a n d  d e m o g r ap h i cs .  T h r ee cl as s i f i er s   v i z.  D eci s i o n   T r ee ,  N v e B a y e s   a nd  R ul e - B as ed  cl as s i f i er s  a r e ap p l i ed  t o  f i n d  t h e acad e m i c p er f o r m an ce o f  s t u d e n t s .  T he  e xp e r i m e nt s   s h o w ed   t h at   R u l B as ed   cl a s s i f i er   w as   t h e   b es t   a m o n g   t h e   o t h er   cl a s s i f i er s   an d   i t s   acc u r acy   w as   f o u n d   as   7 1 . 3 % .   T h e f i r s t  y ear  s t u d en t s  l ev el  o f  s u cces s   w as  p r ed i ct ed  b y  t h m o d el .  S u m i t h a et .  al .  [ 17 de v e l ope d a   d at a m o d el  t o  p r ed i ct  s t u d en t s   f u t u r e l ear n i n g  o u t co m e s  u s i n g  s e n i o r  s t u d en t s  d at as et .   T h ey  co m p ar ed  t h d a ta  m i n i n g  c la s s i f ic a tio n  a lg o r ith m s  a n d  f o u n d  th a t J 4 8  a lg o r ith m   w a s  b e s t s u ite d  f o r  s u c h   j o b  b a s e d  o n  th e ir   d at a.   K ha s a na h e t .  a l .  [ 18 ]  co n d u ct ed  a s t u d y  t o   f i n d  t h at   h i g h  i n f l u e n ce at t r i b u t es   m a y  b e s el ect ed   car ef u l l y   t o   p r ed i ct   s t u d en t   p er f o r m an ce.   F eat u r e s el ect i o n   m a y   b u s ed   b ef o r cl as s i f i c at i o n   f o r   s u c h   j o b .   T h e s t u d en t  d at w a s  f r o m   D ep ar t m en t  o f  I n d u s t r ia l E n g in e e r in g  U n iv e r s ita s  I s la m  I n d o n e s ia .  T h e y   u s e d   B ay e s i an  N et w o r k  an d  D eci s i o n  T r ee  al g o r i t h m s  f o r  cl as s i f i cat i o n  an d  p r ed i ct i o n  o f  s t u d en t  p er f o r m a n ce.   T h e F eat u r e S el ect i o n   m et h o d s  s h o w ed  t h at  s t u d en t s  at t en d an ce an d  G r ad e P o i n t  A v er ag e i n  t h f i r s t   s e m e s t er  t o p p ed  t h e l i s t  o f  f eat u r es .  W h e n  t h e acc u r a c y  r at w a s  co n s i d er ed ,  t h e  B ay es i an  N et w o r k   o u t p er f o r m ed  t h e D ec i s i o n  T r ee cl as s i f i cat i o n  i n  t h ei r  cas e.  A n k i t A  N i c h at  et .  al .  [ 19 ]  b u ilt  c la s s i f ic a tio n   m ode l s  us i ng  de c i s i o n  t r ee an d  ar t i f i ci al  n e u r al  n et w o r k  t ec h n i q u es .  T h e y   u s ed  s e v er al  at t r i b u t es  t o  acces s  t h s t r e n gt h a nd   w e a k ne s s  o f  t he  s t ud e nt s  t o  i m p r o ve  t he  p e r f o r m a nc e  o f  t he   s t ud e nt s .     H i l al   A l m ar ab eh  [ 20 ]  u s e d  W E K A  to o l to  e v a lu a te  t he  p e r f o r m a nc e  o f   t he   u ni ve r s i t y s t u d e nt s .  H e   f o u n d  t h at  t h e acc u r ac y  o f  t h e cl as s i f i er  al g o r i t h m s  d ep en d s  u p o n   s i ze a n d  n at u r e o f  d at a.  T h e au t h o r  u s ed   N v e B a y es ,  B a y es i a n   N et w o r k ,  N eu r al  N et w o r k ,  I D 3  an d  J 4 8  cl as s i f i ca t i o n  t ech n i q u e s .  I t   w a s   f o u n d  t h at   B ay e s i an  N et w o r k  o u t p er f o r m s  t h e o t h er s  i n  t er m s  o f  acc u r a c y .   A m j ad   A b u  S aa [ 21 ]   w o r k e d  o u t a  q u a lita ti v e   m o d el  t o  an al y ze t h s t u d e n t  p er f o r m an ce  b as ed  o n   s t u d e n t s  p er s o n al  an d   s o ci al   f act o r s .  T h e a u t h o r  e x p l o r ed   th e o r e tic a ll y   v ar i o u s  f act o r s  o f  t h e s t u d en t s  p er f o r m an ce i n  t h e f i e l d  o f  h i g h er  ed u ca t i o n .   P e d r o  S tr e c h t e t.  a l.  [ 10 ]  p r e di c t e d  s t ud e nt s '  r e s ul t s  ( p a s s / f a i l )  a nd  t he i r   gr a d e s  i n t he i r   w o r k.  T he u s e d   c la s s i f ic a tio n   m o d e f o r   th e  s tu d e n ts '   r es u l t s   an d   a   r eg r es s i o n   m o d el   f o r   t h e   p r ed i ct i o n   o f   t h g r ad es .   Evaluation Warning : The document was created with Spire.PDF for Python.
I nd o ne s i a n J  E l e c  E ng  &  C o m p   Sc i     I SSN :   2502 - 4752       E duc at i on al  D at a M i ni n g an A nal y s i s  of  St ude nt s  A c ade m i c  P e r f or m anc e  U s i ng W E K A   ( Sadi q H us s ai n )   449   T h ey  car r i ed  o u t  t h e ex p er i m e n t s   u s i n g  t h e 7 0 0  co u r s es  s t u d en t s '  d at w h o  s t u d i ed  at  t h U n i v er s i t y  o f  P o r t o .   T h ey   u s ed   d eci s i o n   t r ees   an d   S V M   f o r   cl as s i f i cat i o n   w h i l S V M ,   R a n d o m   F o r es t ,   an d   A da B oos t . R w e r e   b es t  s u i t ed  f o r  r eg r es s i o n  an al y s i s .  T h e cl as s i f i cat i o n   m o d el   w as  ab l e t o  ex t r act  u s e f u l  p at t er n s ,  b u t  t h e   m o d el s   f o r  r eg r es s i o n   w er e n o t  ab l t o   b eat   a s i m p l b as e l i n e.  F a h i m   S i k d er   et .  al .   [ 13 ]   us e d   C u m ul a t i ve   G r ad e P o i n t  A v er a g e ( C G P A )  f o r  p r ed i ct i o n  o f  s t u d e n t s   y ear l y  p er f o r m an ce.  T h e d at as et  u s ed   w a s   f r o m   B a nga b a nd hu  S he i k M uj i b u r  R a h m a n S c i e nc e  a nd   T e c hno l o g y  U ni ve r s i t y   s t ud e nt s   r e c o r d s .   T he   a ut ho r s   us e d  ne ur a l  ne t w o r k t e c h ni q ue  f o r  p r e d i c t i o n a nd  i t   w as  co m p ar ed  w i t h  t h e r eal  C G P A  o f  t h e s t u d en t .     2. 1   C l a s s i f i er E v a l u a t i o n s  a n d  erro m ea s u re m e n t  t ech n i q u es :   T h e p er f o r m a n ce  m eas u r es  ar e d er i v ed  f r o m  co n f u s i o n   m at r i x  [ 22 ] .  A  c o n f u s io n   m a tr ix   is  f o r m e d   b a s e d  o n t he   f o ur  o ut c o m e s  o f  b i n ar y  cl a s s i f i cat i o n .  I n  b i n ar y  cl as s i f i cat i o n ,  t h e  d at as et   u s u al l y  h a s  t w o  l ab el s   p o s itiv e  ( P )  a n d   n e g a tiv e  ( N ) .  T h e  o u tc o m e s  a r e  tr u e  p o s iti v e  ( T P )  i. e .  c o r r e c t p o s itiv e  p r e d ic tio n ,  tr u e   n eg at i v e ( T N )  i . e.  co r r ect  n eg at i v e p r ed i ct i o n ,  f a l s e p o s i t i v e ( F P )  i . e.  i n co r r ect  p o s i t i v e p r ed i ct i o n  an d  f al s e   n eg at i v e ( F N )  i . e.  i n co r r ect  n e g at i v e p r ed i ct i o n .       a.    S e n s iti v it y  ( R e c a l l o r  T r u e  p o s itiv e  r a te )   R e c a l l  i s  t h e  num be r  of  c or r e c t  c l a s s i f i c a t i o n s  di vi de d by  t h e  t ot a l  n um be r  of  pos i t i v e s .  S o,       R=  T P /   ( T P  +  FN )  =   T P /  P   (1 )     b .   P r e c is io n     P r e c is io n  is  th e   n u m b e r  o f  c o r r e c t p o s itiv e  c la s s if ic a tio n s  d iv id e d  b y  to ta n u m b e r  o f  p o s it iv e  c la s s i f ic a tio n s .     So ,       P =   T P /  ( T P +  F P)   (2 )     c.    F - sc o r e   F - s co r e i s  h ar m o n i m ean  o f  p r eci s i o n  an d  r ecal l .   So ,       F=   2 P R /  ( P + R)   (3 )     d .   A ccu r ac y  [ 23 ]   A cc u r ac y  i s  t h n u m b er  o f  al l   co r r ect  cl as s i f i cat i o n s  d i v i d ed  b y  t h e t o t al  n u m b er s  o f  cas e s .   So ,       A c c u ra c y  =  (T P + T N ) /   ( T P + T N + F N + F P ) =  (T P + T N ) /   (P + N )   (4 )     T h e f o l l o w i n g   s ect i o n  e x p l ai n s  d i f f er en t  er r o r   m eas u r es  u s e d  f o r  cl as s i f i cat i o n   m et h o d s .       e.    M e a n  A b s o l u t e  E rro r (M A E ) [ 24 ]   M A E  es t i m at es   h o w   f ar  t h e p r ed i ct i o n s  o r  f o r ecas t s  d i f f er   f r o m  t h e act u al  v a l u e s .           (5 )     w h er e n  =   t h e  num be r  of  e r r or s ,   | xi i     x |  = t h e ab s o l u t e er r o r s .     f.    R o o t  M e a n  S q u a re  E rro r (R M S E ) [ 24 ]   R M S E  i s  a n  ev a l u at o r  o f  t h e d i f f er en ces  b et w ee n  t h e p r ed i ct o r  v al u es  a n d  t h e act u al  o b s er v ed  v al u es .           (6 )     w he r e  X obs  i s   o b s er v ed  v al u e s  an d  X m o d el  i s   m o d el ed  v al u es  at  t i m e / p l ace i .               Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SSN :   25 02 - 4752   I nd o ne s i a n J  E l e c  E ng  &  C o m p  S c i ,   V o l.   9 , N o 2 F e b r u a r y   2018 :    44 7     459   450   g.    R e l a t i v e   A b s o l u t e  E rro r (R A E ) [ 20 ] [ 15 ]   R A E  i s  d ef i n ed  as  t h e r at i o  o f  ab s o l u t e er r o r  b y  t h m a g n i t u d e o f  t h e act u al  v a l ue .  I t   i s  r ep r es en t ed  as  b el o w ,               (7 )     w h er e p i  i s  t h f o r ecas t  v a l u e,   ai   i s  t h e act u al  v al u e a n d     i s  t h e av er a g e o f  act u a l  v al u es .   h.    R o o t  R e l a t i v e  S q u a re d  E rro r (R R S E ) [ 20 ] [ 15 ]   I t is  d e n o te d  a s   m ean  ab s o l u t e er r o r  ( MA E )  d i v i d ed  b y  t h e cl as s i f i ca t i o n   m o d el  er r o r .  I t  can  b e   r ep r es en t ed  as  b el o w ,               (8 )     A v o id in g  b ia s  i n  th e  a l g o r ith m s  s e le c tio n :   T h er e w er m a n y   s t u d i es  f o r  a cces s i n g  t h e s t u d e n t  acad e m i c  p er f o r m a n ce a n d  p r ed i ct i o n  o f  d r o p  o u t   of  s t u de n t s  a n d t h e i r  j ob  pr o s pe c t s  [ 25 ] .   T he  go a l  o f  s uc h t y p e  o f   s t ud y   w a s  t o  i m p r o ve  t he  q ua l i t y  o f   ed u cat i o n  i n   h i g h er  ed u cat i o n al  i n s t i t u t es .   M o s t  o f  t h e s t u d i es  co n s i d er  t h g r ad e p o i n t  a v er ag es  ( G P A )  [ 26 27 ] ,  as  t h ei r  r es p o n s v ar i ab l e an d  t h e e x p l an a t o r y  v ar i ab l es  ar e v ar i ed .  I n  o u r   s t u d y ,   w h ad  u s ed  f i n al   s e m e s t er  p er cen t a g e as  o u r  r e s p o n s v ar i ab l e as   t h g r ad i n g  s y s t e m  ar e n o t   y et   i n t r o d u c ed  at  u n d er g r ad u at e   l e ve l  i m o s t  o f  t he  c o ur s e s  i A s s a m .     T h er w er e al s o   v ar i o u s   c l as s i f i ca t i o n   m et h o d s  ap p l i ed  f o r   s t u d en t   acad e m i c  p er f o r m a n ce  s t u d i es   [ 16 20 ] .   T h e d i f f er en t  s t u d i es  s h o w ed  t h at  o n  t h ei r  d at as et  t h e r es u l t s   f o u n d  o n  accu r ac y   v ar i es .  S o m e o f  t h e   s t u d i e s  f o u n d  t h at  t h e d eci s i o n  t r ees  ar e t h e b es t  a m o n g  o t h er  cl as s i f i cat i o n  al g o r i t h m s   w h er eas  s o m e f o u n d   th a t B a y e s  N e t w o r k  p e r f o r m e d  b e tte r  th a n  o th e r s .     T h e  a u t h or s   h a d a ppl i e d f ou r   of  t h e  c l a s s i f i c a t i on   m e t h ods   on e  b y  on e   un t i l   t h e  a c c u r a c y   f oun d t o be   99%  i n c a s e  o f  r a n do m   f or e s t .  T h e  f i r s t   m e t h od us e d b y  t h e   a u t h or s   w a s  B a y e s i a n N e t w or k  ( B N ) .   A c c or di n t o   A l m ar ab eh   [ 20 ]   ha d   a na l yz e d   t he   p e r f o r m a nc e   o f   s t ud e nt s   o f   K i n S a ud   B i A b d ul a z i z   U ni ve r s i t f o r   H eal t h  S ci e n ces .  H f o u n d  t h at  B N   w a s  t h e b es t - s u i t ed  cl a s s i f i cat i o n   m et h o d s .  D i r ect ed   ac y cl i g r ap h s  ar e   u s e d i n B a y e s i a n n e t w or k s  t o de pi c t  t h e  de pe n de n c i e s  a m o ng  r a n do m   v ar i ab l es .   R a n d o m  v ar i ab l es  ar r ep r es en t ed  as  n o d es .  I f  t h e n o d es  ar e co n n ect ed  b y  a n  ar c,  t h en   t h e s e v ar i ab l es  ar e d ep en d en t  o n  each  o t h er .   B N  h a s  be e n  us e d f or  pe r f or m i n g  bi - di r e c t i on a l  i nf e r e n c e  s i n c e  1980.  I t  i s  a l s o us e d f or  r e a s on i ng  un de r   u n cer t ai nt y.     T he  a ut ho r s  t he n t r i e d  t he  r ul e - b as ed  cl as s i f i cat i o n  t ech n i q u es  av ai l ab l e as  P A R T  i n  W E K A .   A h m ad   e t a l [ 16 ]  a ls o   u s e d  th is  te c h n iq u e  f o r  c la s s i f ic a tio n  a n d   f o u n d  t h a t  it  w a s  th e  b e s t  te c h n iq u e   f o r  s tu d e n t   acad em i c p er f o r m a n ce as s e s s m en t  a m o n g   N v e B a y es ,  d e ci s i o n  t r ees ,  a n d  r u l e - b a se d  c l a ss i f i e r s.  P A RT  i r ul e s - b as ed  cl as s i f i er   w h i c h  c o m b i n es  s ep ar at e a n d  co n q u er   m et h o d   w i t h  d i v i d e an d  co n q u er  s t r at e g y .  T h i s   c la s s i f ic a tio n   m e t h o d  b u ild s  a  p a r tia l tr e e  w ith  t h e  a v a ila b le  s e t  o f  r eco r d s .  I t  t h en  cr eat es  a r u l e f r o m  t h e t r ee.   A f t er  d i s car d i n g   t h e  d eci s i o n  t r ee an d  d el et i n g  r eco r d s  co v er ed  b y   t h e  r u l e,  i t  ag a i n  b u i l d s   t h e p ar t i al  d eci s i o n   t r ee i n  an  i t er at i v m an n er .   T h e au t h o r s  t h en   u s ed  t h e d eci s i o n  t r ee cl as s i f i cat i o n   m e t h o d .   P a til e t a l [ 28 ]  es t ab l i s h ed  t h at   d eci s i o n  t r ee al g o r i t h m  p er f o r m s  b et t er  t h a n  N v e B a y e s   m et h o d s .  T h e ad v an t ag e o f   u s i n g  d eci s i o n  t r ee   cl as s i f i er  i s  t h at   t h e  t r ee ca n  b e v i s u al i zed ,  u n d er s t o o d  an d  i n t er p r et ed  eas i l y  b y   t h e   us e r s  [ 29 ] .  T h e t r ee   p er f o r m s   w el l  i n  ca s e o f  b o t h   n u m er i cal  a n d  cat e g o r i cal  v ar i ab l es .  T h e d eci s i o n  t r ee  h as  a  t r ee - l i ke  s t r uc t ur e   s ta r w it h  r o o t n o d e  a n d  e n d s   w it h  le a f  a t tr ib u te s .   S o ,  it is  o n e  o f   th e  p o w e r f u l a s   w e ll a s   p o p u l ar  cl as s i f i er s .   W E K A  i m p l e m e n t s  C 4. 5 de c i s i on  t r e e  us i ng  J 48 c l a s s i f i c a t i on   m e t h od.   T h e au t h o r s  u s ed  r an d o m   f o r es t  cl as s i f i er  as  t h ei r  n ex t  at t e m p t .  R an d o m   f o r es t s  ( R F )   [ 11 ]  r ed u ce   o ve r f i t t i n g,  b i a s ,  a nd  va r i a nc e .  S o ,  R F  i s   m or e  a c c u r a t e  a n d r obu s t .  R F   w or ks  on  ba gg i ng  a l g or i t hm .  R F   r ep l aces  d at a t o  co n s t r u c t  t h e t r ee an d  t h e  p ar t i t i o n  i s  n o t  d o n e o n  t h e  s a m e i m p o r t an t   v ar i ab l e as  t h e   ex p l an at o r y   v ar i ab l es  ar e b o o t s t r ap p ed .  R F  cr eat es  l o t s  o f  i n d i v i d u al  d eci s i o n  t r ees  f r o m   th e  t r a in in g  s e t .  I t  is   g o o d  a t p r e d ic tin g  th e  ta r g e t v a lu e s .       Evaluation Warning : The document was created with Spire.PDF for Python.
I nd o ne s i a n J  E l e c  E ng  &  C o m p   Sc i     I SSN :   2502 - 4752       E duc at i on al  D at a M i ni n g an A nal y s i s  of  St ude nt s  A c ade m i c  P e r f or m anc e  U s i ng W E K A   ( Sadi q H us s ai n )   451   4 .   A P P LY IN G  D A TA  M I N I N G  A LG O R ITH M S  TO  TH E S E L EC T ED  D A TA S E T   T h e  da t a s e t  c on t a i n e d 300 i ns t a n c e s   w i t h  24 a t t r i b u t e s .  T h e   pr op os e d f r a m e w or k  i s  s h o w n  i F i gur e   1 be l ow .       4 .1 D a t a  P rep ro ces s i n g   pha s e   T h e d at a f o r  t h i s  r es ear ch   w a s  co l l ect ed  f r o m  t h r ee d i f f er e n t  co l l eg es ,  t h o s e ar e D u l i aj an  C o l l eg e,   D oom doo m a  C ol l e g e  a n d D i g boi  C ol l e g e  of   A s s a m ,  I n di a .  I n i t i a l l y ,  da t a  of  t w e n t y - f o u r  a ttr ib u te s   w e r e   c o lle c te d .  A s  th e  a ttr ib u te  n a m e  o f  th e   s tu d e n t d o e s  n o t c a r r y  a n y   s ig n i f ic a n c e ,   w e  r e m o v e d  it f r o m  t h e  lis t o f   t h e at t r i b u t es .  T h e at t r i b u t e " m ar k s  i n  p r act i cal  p ap er "  w as   al s o  r e m o v ed  at  t h e p r e - p r o ces s i n g  p h as e,  b ecau s e   o f  t he  i nt e r e s t i n n u m b e r  o f  t he   m i s s i n va l ue s .   F i na l l y ,  t w e n t y - t w o   a ttr ib u te s  w e r e  s e l ect ed  a f t er  d at a   cl ean i n g .  T ab l e - 1  s h o w s  t h e  s e le c te d  a ttr ib u te s   w it h  t h e ir  p o s s ib le  v a l u e s .              F i g u r e 1 :  F r a m e w o r k   f o r  S t u d en t s   A cad e m i c P er f o r m an ce  C l as s i f i cat i o n                             Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SSN :   25 02 - 4752   I nd o ne s i a n J  E l e c  E ng  &  C o m p  S c i ,   V o l.   9 , N o 2 F e b r u a r y   2018 :    44 7     459   452   T a b le   1 : D a ta s e t D e s c r ip tio n   A ttr ib u te   D e s c r ip t io n   V a l u es   GE   G en d er   ( M a l e,  F em a l e)   C ST   C a st e   ( G e n e r al ,S C ,S T ,O B C ,M O B C )   TN P   C l as s  X  P e r ce n t ag e   ( B e s t , V e r y   G o o d , G o o d , P as s , F ai l )   I f  p er c en t a g e > = 8 0   t h en  B es t   I f  p e r c e n t a g e  > =  6 0   b u t  l e s s  t h a n   8 0  t h e n  V e r y   G o o d   I f  p e r c e n t a g e  > =  4 5   b u t  l e s s  t h a n   6 0  t h e n  G o o d   I f  P er c en t a g e > =   3 0  bu t  l e s s  t h a n  4 5   t h e n  P a s s   I f  P er c en t a g e <  3 0   t h en  F a i l   T W P   C l as s  X I I  P e r ce n t ag e   ( B e s t , V e r y   G o o d , G o o d , P as s , F ai l )   S am e  as  T N P   IA P   I n t er n a l  A s s es s m en t   P er c en t a g e   ( B e s t , V e r y   G o o d , G o o d , P as s , F ai l )   S am e  as  T N P   E SP   E n d  S em es t er  P er c en t a g e   ( B es t ,  V e r y   G o o d , G o o d , P as s , F ai l )   S am e  as  T N P   AR R   W h e t h e r   t h e   s t u d e n t  h a s  b a c k   o r  a r r e a r   p ap er s   ( Ye s ,  No )   MS   M a r it a l S ta tu s   (M a rri e d ,  U n m a rri e d )   LS   L i v e d  i n  T o w n  or  V i l l a g e   ( T o w n , V i l l ag e)   AS   A d m i s s i o n  C a t e go r y   ( F r ee , P ai d )   FM I   F a m ily  M o n t h l y   I n c o m e   ( i n  I N R )   ( V e r y  H i g h ,  H i g h ,  A b o v e  M e d i u m ,   M e d i u m ,  L o w )   I f   F M I  > =  3 0 0 0 0   t h e n  V e r y  H i g h   I f   F M I  > =  2 0 0 0 0   b u t  l e s s  t h a n   3 0 0 0 0   t h e n  H i g h   I f   F M I  > =  1 0 0 0 0   b u t  l e s s  t h a n   2 0 0 0 0   t h e n   A b o v e  M e d i u m   I f   F M I  > =  5 00 0 b ut  l e s s  t ha n 10 0 0 0   t he n  M e d i u m   I f   F M I  i s   l e s s  t h a n  50 0 0  t h e n   Lo w   T h e f i g u r es  a r e ex p r es s ed  i n  I N R .   FS   F a m ily  S i z e   ( L ar g e , A v e r ag e , S m al l )   I f   F S  >  1 2   t h e n  L a r g e   I f   F S  > =  6   b u t  l e s s  t h a n   1 2  t h e n  A v e r a g e   I f   F S  <  6  t h e n  S m a l l   FQ   F at h e r  Q u al i f i cat i o n   ( I L ,  U M ,  1 0 , 1 2   ,  D eg r ee,  P G  )   I L =   I l l i te r a te   U M=  U n d e r  C l a s s  X   MQ   Mo t h e r  Q u a l if i c a t io n   ( I L ,  U M ,  1 0 , 1 2   ,  D eg r ee,  P G  )   I L =   I l l i te r a te   U M=  U n d e r  C l a s s  X   FO   F at h e r  O ccu p a t i o n   ( S er v i c e,  B u s i n es s ,   R et i r ed , F a r m er ,  O t h er s )   MO   Mo t h e r  O c c u p a tio n   ( S er v i c e,  B u s i n es s ,   R et i r ed , F a r m er ,  O t h er s )   NF   N u m b e r  o f  F r i e n d s   ( L ar g e A v e r ag e , S m al l )   S am e  as  F am i l y  S i z e   SH   S t ud y  H ou r s   ( G o od ,  A v e r a ge ,  P o o r )   > =  6  h o u r s   G o o d     > =  4  h o u r s   A v e r a g e   <  2  h o u r s   P o o r   SS   S t u d e n t  S c h o o l  a t t e n d e d   a t   C l a s s  X   l ev e l   (  G o v t. ,  P r iv a t e )   ME   M e d i u m   ( E n g , A s m , H i n , B e n )   TT   H o m e t o  C o l l eg e T r a v el   T i m e   L ar g e A v e r ag e , S m al l  )   > =   2   h o u r s  L a r g e  > = 1   h o u r s  A v e r a g e  <  1  h o u r  S m a l l   A TD   C l as s  A t t e n d an ce  P e r ce n t ag e   ( G o od ,  A v e r a ge ,  P o o r )   I f  p e r c e n t a g e  > =  8 0   t h e n  G o o d   I f  p e r c e n t a g e  > =  6 0   b u t  l e s s  t h a n   8 0  t h e n  A v e r a g e   I f  P e r c e n t a ge  <  60   t h e n  p o or   D e s c r ip tio n s  o f   s o m e o f  t h e at t r i b u t es  o f  t h e d at as et       C S T:   I t  i s  cas t e o f  t h e s t u d en t .  T h e p o s s i b l e v al u es  o f  t h i s   at t r i b u t e ar e ‘ G  ( G e n er al  cat e g o r y  o r  u n r es er v e d   cat eg o r y ) ,  ‘ S C  ( S ch ed u l e C as t e cat eg o r y ) ,  ‘ S T  ( S ch ed u l e T r i b e  C at eg o r y ) ,  ‘ O B C  ( O t h er  B ack w ar d   Cl a s s e s ) ,  ‘ M O B C  ( M i n o r i t i es  an d  o t h er  b ack w ar d  cl as s es )   s t u d en t s .  T h es e cat eg o r i es  ar b as ed  o n  t h e I n d i an   C o n s titu tio n .     TN P :   I t  i s  t h e p er cen t a g e at t ai n ed  b y  t h s t u d e n t  i n   C l as s  X .   T h e ex a m i n at i o n  i s  cal l ed  H S L C  E x a m i n at i o n  i n   A s s a m ,  I n d i a.  T h e au t h o r s   h a d  cat eg o r i zed  t h e r es u l t s  a s  B es t ,  V er y  G o o d ,  G o o d ,  P as s ,   F ai l .  T h e ‘ B es t '  i s   cal l ed   w h e n  t h e s t u d en t  s ec u r ed   m o r e t h a n  o r  e q u al  t o  8 0 %  ( i t  i s  t er m ed  as   S t ar  p er cen t a g e) ,  ‘ V er y  G o o d '   i s   l a be l e d a s   w h e n  t h e  s t u de n t  s e c u r e s   m or e  t h a n  or  e qu a l  t o 60%  bu t  l e s s  t h a n  80%  ( m or e  t ha n  or  e qu a l  t o 60%   i s a l w a y s  t e r m e d  a s  F i r st  D i v i s i o n  o r  Cl a s s i n   m o st  o f  t h e  e x a m i n a t i o n s ) ,  ‘ G o o d '  i s t e r m e d  a s   w he n t he   s tu d e n t s e c u r e s   m o r e  t h a n  o r  e q u a l to  4 5 %  b u t le s s   th a n  6 0 %  ( in   m o s t o f  t h e  U n iv e r s itie s  i n  A s s a m  i t is  c a lle d   a s  S e c o n d  D i v is io n  o r  c la s s ) ,  ‘ P a s s  is  c a lle d   w h e n  t h e  s tu d e n t g o t le s s  t h a n  o r  e q u a l to  3 0 %  b u t le s s  th a n   4 5 % .   I is  te r m e d   a s   F ai l   w h en   t h s t u d e n t  s ec u r ed   l es s   t h an   3 0 % .   T h s a m i s   t r u f o r   T W P   ( C l as s  X I   p er cen t ag e s ec u r ed  b y  t h e s t u d en t ) ,  I A P  ( I n t er n al  A s s e s s m en t  p er cen t ag e s ec u r ed  b y  t h e  s t u d en t  at  D e g r ee   l ev el   ( 1 0 +2 +3 ) )   an d  E S P   ( E n d   S e m es t er  E x a m i n at i o n   p er cen t ag s ecu r ed   b y   t h e s t u d en t   at  D eg r ee l ev el ) .     E S P  i s  t h e r es p o n s v ar i ab l e.   Evaluation Warning : The document was created with Spire.PDF for Python.
I nd o ne s i a n J  E l e c  E ng  &  C o m p   Sc i     I SSN :   2502 - 4752       E duc at i on al  D at a M i ni n g an A nal y s i s  of  St ude nt s  A c ade m i c  P e r f or m anc e  U s i ng W E K A   ( Sadi q H us s ai n )   453   IA P   ( I n t er n a l   A s s es s m e n t  p er cen t ag e  s ec u r ed  b y  t h e s t u d en t  at  D eg r ee  l ev el  ( 1 0 +2 +3 ) ) :  I n t er n al   A s s es s m e n t   i s  pa r t  o f  c ont i nu ous  e v a l u a t i on .  I t  c o m pr i s e s  o f   s e s s i on a l  e x a m i n a t i ons ,   s u r pr i s e   t e s t s,   a s s i g n m e n t s,   f i e l d   w o r k ,  q u i zze s  et c.  I t  i s  cat eg o r i zed  as  t h e s a m w a y  a s  T N P , T W P  an d  E S P .   ARR:   I t  i s  cat eg o r i zed  as  ‘ Y es  o r   N o .  T h i s  at t r i b u t e co l l ect ed  t h e d at a b as ed  o n  t h f act  t h at   w h e t h er  t h e   s t u de n t  h a d a ny   f a i l e d pa pe r  i n  a ny  of  t h e  pr e v i ou s s e m e st e r s.   M E:   I t  i s  cat eg o r i zed  as  ‘ E n g  ( E n g l i s h ) ,  ‘ A s m  ( A s s a m es e ) ,  ‘ H i n  ( H i n d i )  an d  B en  ( B en g al i ) .   A s s a m e s e,   H i n d i  an d  B en g al i  ar e t h m o d er n  I n d i an  l an g u ag e s .  I t  i s  t h e l an g u ag e o r   m ed i u m   o f   i n s t r u ct i o n s   f o r  t h s t ud e nt s  i w h i c h l a n gua ge s  t h e y   w er e b ei n g  t a u g h t  o r  ap p ea r ed  i n  an  ex a m i n at i o n .   F Q:   T h e p o s s i b l e v al u es  o f  t h i s  at t r i b u t e ar e ‘ I l  ( i l l i t er at e) ,  ‘ U m  ( U n d er  cl as s  X  l ev el ) ,  ‘ 1 0  ( P as s ed  C l as s  X   E x a m i n at i o n ) ,  ‘ 1 2  ( P as s ed   C l as s  X I I  E x a m i n at i o n ) ,    D eg r ee’  ( P as s ed  B ach el o r  o f   A r t s  o r  S ci en ce o r   C o m m er ce E x a m i n at i o n ) ,  ‘ P G  ( p as s ed  M as t er s  o f   A r t s   o r  S ci en ce o r  C o m m er ce E x a m i n at i o n ) .  I t  i s  t h e   e d u c a tio n a l q u a li f ic a t io n  o f  f a th e r  o f  s tu d e n t.  M Q  s ta n d s   f o r  m o t h e r  q u a li f ic a tio n .  T h e  p o s s ib le  v a lu e s  o f  th i s   at t r i b u t e ar e s a m e a s  f at h er  q u al i f i cat i o n.     4. 2   F e a t u re S el ect i o n   U s i n g  W ek a,  t h e f eat u r e s el e ct i o n  d i s co v er s  t h m o s t  i n f l u en t i al  at t r i b u t es   u s i n g  co r r el at i o n - b as ed   a ttr ib u te  e v a l u a tio n ,  g a in - r a ti o  a ttr ib u te  e v a lu a tio n ,  in f o r m a tio n - g a i n  a ttr ib u te  e v a l u a t io n ,  r e lie f  a ttr ib u te   e va l ua t i o n,  s ym m e tr ic a u n c e r ta in t y  a ttr ib u te  e v a lu a t io n .    C o r r e la tio n - b as ed  at t r i b u t e e v al u at i o n   i s  a  g r eed y   s ear ch   m e t h o d   w h i l e o t h er s  ar e r an k  s ear c h   m et h o d s  [ 18 ].   U s i n g   t h e s f eat u r s e l ect i o n   m et h o d s ,   t o t al   el e v en   at t r i b u t es   w er f o u n d   t o   b e   h i g hl i nf l ue nt i a l .   T h e s el ect ed  at t r i b u t es  ar e s h o w n  as  b o l d  i n  T ab l e 2 .   T h ey   w er u s ed  f o r  cl as s i f i cat i o n   an d  o t h er  at t r i b u t e s   w er e r e m o v ed .  T h e e n d  s e m e s t er  p er cen t ag e  ( es p )  i s  t h e  r es p o n s v ar i ab l e.  F i g u r e 2  s h o w s   t h e d at i n  t h e  ar f f   f o r ma t .       T ab l e   2 : A ttr ib u te  S e le c tio n   u s in g   f e a t u r e  s e le c tio n   m e t h o d s   F ea t u r e S el ec t i o n  M et h o d   H ig h  I n f l u e n c e   A tt r ib u te s   C or r e l a t i on - b a s e d  A ttr ib u te  E v a l u a t io n   Ga i n - R a ti o  A ttr i b u te  E v a l u a t i o n   I n f o r m a t i on - G a i n  A t tr i b u t e  E v a l u a t io n   R e l ie f   A ttr ib u te  E v a l u a t io n   S y m m e t r ic a l  U n c e r ta i n ty  A ttr ib u te   ar r , i ap ,t n p ,as , t w p ,s h ,m e ,f s , n f , a t d ,f o ,f m i ,f q ,t t ,s s   i a p ,m s , ar r ,t n p ,t w p , as ,m e ,s h ,a t d ,f m i ,f q ,n f ,f o ,m q ,f s   i a p ,t n p ,t w p , ar r ,f m i , as ,f q ,m e ,a t d ,s h ,f o , m q , n f ,cs t , t t   i a p ,t n p ,ar r , t n p , n f , as ,a t d ,m e ,f o ,s h ,f m i ,f s ,l s ,g e ,t t   i a p ,t n p ,t w p , ar r ,as , m e ,f m i , at d ,s h ,f q ,f o , m q , n f ,f s , t t           Fi g u r e 2 :  D at a F i l e i n  ar f f  f o r m at           Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SSN :   25 02 - 4752   I nd o ne s i a n J  E l e c  E ng  &  C o m p  S c i ,   V o l.   9 , N o 2 F e b r u a r y   2018 :    44 7     459   454   4. 3   Spe ci f y i n g  t h e s el ect ed  a l g o ri t h m s   A f t er   f eat u r s el ect i o n ,   t h e cl as s i f i cat i o n  al g o r i t h m s   w er ap p l i ed .   T h er e ar e v ar i o u s  cl as s i f i cat i o n   m et h o d s :  D eci s i o n  T r ee,  N eu r al   N et w o r k ,  N v e B a y e s ,   K - N e a r e s t  n e i gh bor ,  R a n do m  F or e s t ,   A da B oos t ,   S u p p o r t  V ect o r  M ach i n e s  e t c.  [ 13 ] .   T h e au t h o r s   u s ed   s p eci f i c  al g o r i t h m s ,   f o r   m i n i n g  t h e acad e m i p e r f o r m a nc e   o f   t he   s t ud e nt s ,   t ho s e  a r e   f o u nd   i t he  W E K A   pr og r a m :   J 48,   P A R T ,  B a y e s N e t   a n R a n do m   F o r e s t c la s s i f ic a t io n  a l g o r ith m s .   A c c o r d in g  to  th e  W E K A   a lg o r ith m s   s p e c if ic a tio n  [ 30 ] : J 4 8  is  a n  a lg o r ith m   t h at   g e n er at es  a p r u n ed  o r   u n p r u n ed  C 4 . 5  d eci s i o n  t r ee.  P A R T  i s  an  al g o r i t h m  t h at   us e s  d i vi d e - a nd - c o nq ue r   m e c h a n i s m   to  b u ild  a  p a r tia l C 4 . 5  d e c is io n  tr e e  in  e a c h  ite r a tio n ,  i. e .  it g e n e r a te s  a  P A R T   d e c is io n  lis t,  a n d   m ak e s   t h b es t   l ea f   i n t o   a r u l e.   B ay e s N et   p r o d u ces   r a n d o m   i n s t a n ce s   b as ed   o n   a   B a y e s   n et w o r k   t h at   u s e s   v ar i o u s  s ear c h  al g o r i t h m s  an d  q u al i t y   m eas u r es .  I t  al s o  o f f e r s  d at a s t r u ct u r es  ( n et w o r k  s t r u ct u r e,  co n d i t i o n al   p r o b a b ilit y  d is tr ib u tio n s ,  e tc . )   a n d  f a c ilitie s  p u b lic  to  B a y e s   N e t w o r k  le a r n in g  a l g o r it h m s .    R a n d o m  F o r e s t  is   a  g r ou p of  un pr un e d c l a s s i f i c a t i on  or  r e g r e s s i on  t r ee s  t h at  ar e cr eat ed  u s i n g  b o o t s t r ap  ex am p l es  o f  t h e t r ai n i n g   d at a an d  r an d o m   f eat u r e s el ec t i o n  i n  t r ee  i n d u ct i o n  t h at  i s   f i n al l y  co n s t r u ct i n g  a  f o r es t  o f  r an d o m   t r ees  [ 30 31 ] .   T he t he   a ut ho r s   c o m p a r ed   each   o f   t h al g o r i t h m s   b as ed   o n   i t s   accu r ac y   t o   s el ect   t h b es t - pe r f or m e a l g or i t hm   f or  t h e  j ob.       5 .   EX P ER IM EN TS  A N D  R ES U LT S     5. 1   C la s s if ic a t io n  R e s u lt s :   T h e s t ag e i s   s et   f o r  t h e e x p er i m en t s .  W E K A   h as  v ar i o u s  cl as s i f i cat i o n  al g o r i t h m s .  T h e a u t h o r s  h ad   u s ed  J 4 8 ,  B ay es N et ,  P A R T  an d  R a n d o m  F o r es t  cl a s s i f i cat i o n   m et h o d s  av a i l ab l e i n  W E K A .  T h es m et h o d s   ar e s u p er v i s ed  l ear n i n g   al g o r i t h m s   w h i c h  u s e t h t r ai n i n g   d at t o   t es t   t h co r r ect n e s s   o f   t es t i n g   d at [ 20 ] F i g ur e  4  s ho w s  t h e co m p ar i s o n  b et w ee n  t h es f o u r  cl as s i f i er s .     J48 C l as s i f i e r :   T h i s  c l a s s i f i e r  i s   u s e f or  g e n e r a t i ng  de c i s i on  t r e e  ba s e d on C 4. 5 a l g or i t hm .  R os s  Q u i n l a n   de v e l ope d t h i s  a l g or i t hm  [ 20 ] .  I t s  p e r f o r m a nc e  i s   s ho w n  i n f i gur e  6 .     B a y es N et  C l a s s i f i er:   T h i s  cl as s i f i er   d el i v er s  h i g h er  accu r ac y  o n  l ar g d at ab as e.   I t  al s o  m a k e s  t h e   co m p u t at i o n al  t i m e l e s s  t h a n  b et t er  s p eed .  B ay es i an  N e t w o r k   u s es  co n d i t i o n al  d ep en d en ci es   u s i n g  d i r ect   gr a p h [ 20 ]   R a ndo m  F o r e s t   C la s s if ie r :   T h is  c la s s i f ie r  u s e d  b o o ts tr a p  s a m p lin g   m e th o d  o n  th e  tr a in in g  d a ta s e t to   co n s t r u ct   m a n y   u n p r u n ed  cl a s s i f i cat i o n   t r ees .  I n   t h t e s t i n g   p h as e,   t h m ea n   o f  al l   u n p r u n ed   cl as s i f i cat i o n   t r ees  f o r  a r a n d o m l y  s e l ect ed  f eat u r e p r o v i d es  t h f i n al  p r ed ic te d  o u tp u t [ 32 ].  It s  p e rf o rm a n c e  i s  s h o w n  i n   f i gur e  7  a nd  8 .   P A R T  C la s s if ie r :   T h is  r u e  le a r n in g  c la s s i f ie r  c o m b in e s  th e   d iv id e - a nd - co n q u er  s t r at e g y   w i t h  s ep ar at e - a nd   c o n q u e r s  s tr a te g y .  I t b u i ld s  a  p a r tia l d e c is io n  tr e e  o n  th e   c u r r en t  s et  o f  i n s t an ce s  an d  cr eat e s  a r u l e f r o m  t h d eci s i o n  t r ee [ 33 ]   T h er ar 3 0 0  s t u d en t   r eco r d s   f r o m   t h r ee  d i f f er en t   co l l e g e s   w i t h   1 2   s el ect ed   at t r i b u t es .   T ab l 3   s h o w s   t h e   p er f o r m a n ce o f  t h e 4  cl as s i f i c at i o n   m et h o d s   b as ed  o n  t h ei r  a ccu r ac y .       T ab l 3 :  C o m p ar i s o n  o f  d i f f er en t  cl as s i f i er s  b as ed  o n  accu r a c y .   C l a s s i fi e rs   A ccu r acy   C o r r e c tly  C l a s s if ie d  I n s ta n c e s   I n c o r r e c tly  C l a s s if ie d   I n s ta n c e s   R an d o m  F o r es t   9 9 %   2 9 7   3   P AR T   7 4 . 33 %   2 2 3   7 7   J4 8   7 3 %   2 1 9   8 1   B a y es N et   6 5 . 33 %   1 9 6   1 0 4       B as ed  o n  t h e accu r ac y  o f  t h f o u r  cl as s i f i er s ,  t h e R a n d o m  F o r es t  h as   m o r e co r r ect l y  cl a s s i f i ed  i n s t an ce s  t h a n   o t h er  cl as s i f i cat i o n   m et h o d s .  I t s  accu r ac y  p er cen t ag e i s  9 9 % .  F i g u r e 4  an d  5  s h o w s  t h a t  t h e R a n d o m  F o r es t   C l a s s if i e r  h a s  th e   m in im u m   e rro rs  i n  t e r m s  o f  M e a n   A b s o l u t e  E rro r (M A E ),  R o o t   M e a n  S q u a re  E rro r   (R M S E ),  R e l a t i v e   A b s o l u t e   E rro (R A E ) a n d  R o o t  R e l a t i v e  S q u a re d  E rro r (R R S E w h e n  c o m p a re d   w i t h   ot h e r  m e t h ods .                 Evaluation Warning : The document was created with Spire.PDF for Python.
I nd o ne s i a n J  E l e c  E ng  &  C o m p   Sc i     I SSN :   2502 - 4752       E duc at i on al  D at a M i ni n g an A nal y s i s  of  St ude nt s  A c ade m i c  P e r f or m anc e  U s i ng W E K A   ( Sadi q H us s ai n )   455       F i g ur e  3 .   C o m p a r is o n  o f   C la s s if ie r s             F i gu r e  4:  M A E  a n R M S E  M et r i cs     F i g u r e 5 :  R A E  an d  R R S E  Met r i cs           F i g ur e  6 .   J 4 8  T r ee  V i s u al i zat i o n       T h e  K a p p a  s ta tis tic  v a l u e  is  0 . 9 8 5 9  w h ic h  s h o w s  t h a t t h e   m o d e l is  s ta tis tic a ll y   s i g n if ic a n t.   T h e s i g n i f i ca n ce i s  r at h er  h i g h  acco r d i n g  t o  t h i s   v al u e.  S o ,   t h i s   m o d el   m a y   be  us e f or  t he  pr e di c t i on  of  f i n a l   s e m e s t er  p er cen t ag e o f  t h e s t u d en t .     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SSN :   25 02 - 4752   I nd o ne s i a n J  E l e c  E ng  &  C o m p  S c i ,   V o l.   9 , N o 2 F e b r u a r y   2018 :    44 7     459   456   T h e au t h o r s  h ad  al s o  co m p ar ed  t h e r an d o m  f o r es t  cl a s s i f i er   w i t h   f eat u r e s el ect i o n  a n d   w i t h o u t   f eat u r e s el ect i o n .  T h e r an d o m   f o r es t  cl a s s i f i er   w i t h   f eat u r s el ect i o n  o u t p er f o r m s  t h o t he r .  T a b l e  4  s ho w s  t he   co m p ar i s o n .           F ig u r e  7 : R a n d o m   F o r e s t V is u a liz a tio n  o f   C o s t C u r v e  o f  ‘ B e s t’   C la s s  o f   e n d  s e m e s te r  p e r c e n ta g e  a ttr ib u te       T a b le   4 : C o m p a r is o n  o f  R a n d o m   F o r e s t C la s s i f ie r   w it h  a n d   w it h o u t s e le c te d  a ttr ib u te s   C l a s s i fi e rs   A ccu r acy   C o r r e c tly  C l a s s if ie d  I n s ta n c e s   I n c o r r e c tly  C l a s s if ie d   I n s ta n c e s   R an d o m  F o r es t   W it h   1 2  s e l e c te d  a t tr i b u te s   9 9 %   2 9 7   3   R an d o m  F o r es t   W i t h  a ll th e  a tt r ib u t e s   8 4 . 33 %   2 3 3   6 7           F i g ur e  8 .   R a n d o m  F o r e s t V is u a liz a tio n  o f   C o s t/B e n e f it  A n a l y s i s  f o r  ‘ G o o d   C la s s  o f   e n d  s e m e s te r   p e r c e n ta g e  a ttr ib u te             Evaluation Warning : The document was created with Spire.PDF for Python.