I A E S   I n t e r n at io n al  Jou r n al  of   A r t if ic ia I n t e ll ig e n c e   ( I J - AI )   V ol .   10 , N o.   2 J une   202 1 , pp.  324 ~ 331   I S S N 2252 - 8938 ,   D O I 10.11591/ ij a i. v 10 .i 2 .pp 324 - 331           324       Jou r n al  h om e page ht tp : // ij ai . ia e s c or e .c om   A  c om p ar i son  b e t w e e n  d e e p  l e ar n i n g, n ve  b aye s an d  r an d om   f or e st   f or  t h e  ap p l i c at i on  of  d at a m i n i n g on  t h e  ad m i ss i o n  of   n e w  st u d e n t s       N u r h ac h it a 1 , E d S u r ya N e gar a 2   1 Universitas Islam  Negeri Raden Fatah Pal embang,  Indonesia   2 Universitas Bi na Darma, Indonesia       A r t ic le  I n f o     A B S T R A C T   A r ti c le  h is to r y :   R e c e iv e d   F e b   2 1 , 20 20   R e vi s e J a n 5,   20 21   A c c e pt e M a r   2 9 , 20 21       The  process  of  admitting  new  students  at  Universitas  Islam  Negeri   Raden  Fatah  each  year  produces  lot   of  new  student   data.  So  that   ther is  an  accumulati on  of  student   data  continu ously.   The  purpose  of  this  study  is  to  compare  deep  learning,   naïve  bayes,  and  random  forest  on  the  admis sion  of  new  students  as  well  as  being  one  of  the   bases  for  making  decis ions  to  determine  the  promotion  strategy   of  each  study  program.  The   data  mining  method  used  is  knowledge  discovery  in   database  (KDD).  The   tools  u sed  are  rapid  miner.  The  attributes  used  are  student   ID  number,  name,  p rogram  study,  faculty,  gender,  place   of  birth,   date  of  birth,   year  of   entry,   school  origin,  national  examination,  type  of  payment,  and   nominal  payme nt.  The  new  student  data  used  from   2016  to   2019  was  an   18.930  item.  The   re sults  of  this  s tudy  used  deep   learning  bayes   results  resulted   in  an  accuracy   v alue  of  52.65%,  naïve  bayes  results  resulted   in  an  accuracy   value  of  99.79 %,  and   random forest  results res ulted in  an accuracy value of  44.65%.   K e y w o r d s :   D a ta  m in in g   D e e p l e a r ni ng   N a ïv e  ba ye s   N e w  s tu de nt s   R a ndom f or e s t   This is an  open  acce ss artic le unde r the  CC BY - SA   license.     C or r e s pon di n g A u th or :   E di  S ur ya  N e ga r a   D a ta  S c ie nc e  I nt e r di s c ip li na r y R e s e a r c h C e nt e r   C om put e r  S c ie nc e  F a c ul ty   U ni ve r s it a s  B in a  D a r m a , I ndone s ia   E m a il e .s .ne ga r a @ bi na da r m a .a c .i d       1.   I N T R O D U C T I O N   I nf or m a ti on  te c hnol ogy  ha s   a im por ta nt   r ol e   in   m os or ga ni z a ti on  th a m a ni pul a te s   a nd  c ol le c ts   da ta   in   la r ge   d a ta ba s e s .   D e c i s io m a ki ng  i s   ge ne r a te d   by  u s e f ul   in f or m a ti on  f r om   s to r in da ta D a ta   s to r a ge   pa tt e r ns   th a ha ve   be e di s c ove r e by  us e r s   to   he lp   th e   da ta   a n a ly s is   pr oc e s s   is   c a ll e da ta   m in in [ 1] A lo ng   w it th e   de ve lo pm e nt   of   th e   in te r ne t,   th e   da ta   s to r e d,  bot in   t he   f or m   of   te xt im a ge s ,   s ound,  a nd  vi de o   a ls o   in c r e a s e ve r qui c kl a nd  s ig ni f ic a nt ly I n   I ndone s ia in te r ne us e r s   in   1998  w e r e   onl y   500,000  us e r s   w he r e a s   by  2015  it   w a s   pr oj e c te th a in te r ne us e r s   ha r e a c he 139  m il li on  [ 2] in f or m a ti on  c a id e nt i f ie d   by  c ha r a c te r is ti c s   [ 3] T h e   la r ge   vol um e   of   da ta   vol um e   w il be c om e   " ga r ba ge "   in   s to r a ge   if   it   is   not   pr oc e s s e in to   us e f ul   in f or m a ti on.  D a ta   m in in te c hnol ogy  pr ovi de s   a   us e r - or ie nt e a ppr oa c to   nove a nd  hi dde pa tt e r ns   in   th e   da ta   [ 4] M ix e da ta   m ode ls   th a ha ve   m a ny  to pi c s   c a f or m   a   te xt   da ta   s e m ode l   [ 5] .   T hi s   is   c on s is te nt   w it th e   de f in it io of   da ta   th a da ta   is   a   f a c th a is   r e c or de but   ha s   no  m e a ni ng.  M a ny   uni ve r s it ie s   ha ve   u s e in f or m a ti on  te c hnol ogy  to   s uppor th e   a dm is s io pr oc e s s   [ 6] T h e   a ppl ic a ti on  o in f or m a ti on  te c hnol ogy  to   e duc a ti on  c a a ls pr oduc e   a bunda nt   s tu de nt   da ta   a nd  le a r ni ng  p r oc e s s e s   [ 7] A uni ve r s it ie s , da ta  c a n be  obt a in e d f r om  da ta ba s e s , da ta  w il c ont in ue  t o gr ow , s uc h a s  s tu de nt  da ta . H ope  a f te r   th is  da ta  m in in g t e c hni que  c a n be  u s e d a nd u s e f ul  a nd he lp  a n a ly z e  da ta  i n hi ghe r  e duc a ti on i ns ti tu ti ons .   Evaluation Warning : The document was created with Spire.PDF for Python.
I nt  J  A r ti f  I nt e ll   I S S N 2252 - 8938       A  c om par is on be tw e e n de e p l e a r ni ng, naïv e  bay e s  and r andom  fo r e s fo r  t he  appli c at io n of  ( N u r hac hi ta )   325   T he  pr oc e s s  of  a dm it ti ng ne w  s tu de nt s  a U ni ve r s it a s  I s la m  N e ge r R a de n F a ta h e ve r y ye a r  pr oduc e s   a   lo of   ne w   s tu de nt   da t a T hi s   ha pp e ns   c ont in uous ly   s o   th a t he r e   is   a n   a c c um ul a ti on   of   s tu de nt   d a ta   w hi c h   w il c ont in uous ly  i nc r e a s e  i n t he  s e a r c h f or  s tu de nt  i nf o r m a ti on . B a s e d on the  a m ount  of  ne w  s tu de nt  da ta , by   m a na gi ng  th e   da ta in f or m a ti on  th a c a be   s e e c a be   done   by  th e   U ni ve r s it y.  B a s e on  th e   num be r   of   ne w   s tu de nt   da ta by  or g a ni z in th e   da ta   s th a in f or m a ti on  c a b e   a c c e s s e a nd  a c c e pt e by   th e   uni ve r s it y,  f or   e xa m pl e a   c om pi la ti on  of   uni ve r s it pr om ot io ns   or   out r e a c a nd  s tu dy  pr ogr a m s   in   s c hool s   to   a c c e pt   ne w   s tu de nt s uni ve r s it ie s   a c c e s s   s c hool s   f or   pr om ot io n.  T hi s   c a u s e s   a   w a s te   of   budge t   be c a u s e   to o   m a ny  s c hool s   w il be   vi s it e d,  a nd  not   ti m e   e f f ic ie nt T hi s   r e s e a r c w il c l a s s i f y   a n d   c l a r if y   d a t a   o t h e   a dm i s s i o o f   n e w   s t u d e n t s   a t   U n iv e r s i t a s   I s l a m   N e g e r i   R a d e n   F a t a h   b y   u ti l i z in g   t he   d a t a   m i n i ng   p r o c e s s   b y   a p pl y i ng   c l a r i f i c a t i o n   t e c h n i q u e s .   B c o m p a r i n t h e   t h r e e   a l g or i t hm s ,   d e e p   l e a r n in g ,   n a ïv e   b a y e s ,   a n d   r a n d om   f or e s t .   T h e   t o o l s   u s e d   a r e   r a p i d   m i n e r .   T h e   a t tr i b ut e s   u s e d   a r e   s tu d e n t   I D   n um b e r n a m e ,   pr o g r a m   s tu d y ,   f a c u l ty ,   p l a c e   o f   bi r th ,   g e n d e r ,   d a t e   o f   b ir t h ,   s c h o ol   o r i g i n ,   y e a r   o f   e nt r y,   n a t i on a l   e x a m in a t i on ,   t y p e   of   p a y m e n t,   a n d   n o m i n a l   p a ym e n t .   B a s e d   o n   t h e   r e s u l t s   o f   d e e l e a r n i n g,   n a ï v e   b a y e s a n r a n do m   f or e s c a n   de t e r m in e   th e   p r om o t io n   s t r a t e gy   o f   e a c h   s tu d p r o gr a m .   B a s e d   o n   t h e   r e s u l t s   of   d e e p   l e a r n i n g,   n a ï v e   b a y e s ,   a n d   r a n d o m   f or e s t   c a n   s e e   c o u r s e s   o f   i n t e r e s t   i n   e a c s c h o o l .   T h e  f i n a r e s u lt s   o f  t h e   c lu s t e r   c a h e l t h e   U ni ve r s it y [ 8 ] .   D a ta   m in in c onc e pt   is   to   e xt r a c hi dde pa tt e r ns   a nd  to   di s c ove r   r e la ti ons hi ps   be twe e pa r a m e te r s   in   a   va s a m ount   of   da ta   [ 9] D a ta   m in in is   th e   pr oc e s s   of   e xt r a c ti ng  da ta   ( pr e vi ous ly   unknown,  im pl ic it , a nd  c ons id e r e us e le s s )   in to   in f or m a ti on  or   knowle dge   or   pa tt e r ns   f r om   la r ge   a m ount s   of   da ta   [ 10] D a ta   th a is   c ons id e r e d " ga r ba ge "  be c a us e  i is  not  pa tt e r ne d/ not  s tr uc tu r e d   a nd i s  not  us e f ul , i s  p r oc e s s e d ( f il te r )  s o t ha t  i t   f or m s   in f o r m a ti on  or   knowle dge   or   ne w   pa tt e r ns   th a a r e   us e f ul   [ 9] .   D a ta   m in in is   a   pr oc e s s   to   e xpl or e   th e   e xc e s s   va lu e   of   in f or m a ti on  th a w a s   not   pr e vi ous ly   known  to   e xi s in   a   da ta ba s e T he   pa tt e r n s   th a a r e   ve r y   us e f ul   a nd  ha ve   m or e   va lu e   th a th e   d a ta   c ont a in e in   th e   da ta ba s e   a r e   obt a in e by  r e c ogni z in th e   in f or m a ti on  obt a in e [ 11 ] F r om   th e   e xpl a na ti on  a bove   it   c a be   c onc lu de th a da ta   m in in is   a   s te of   a na ly z in th e   pr oc e s s   of   knowl e dge   di s c ove r in   th e   da ta ba s e D a ta   m in in is   a   pr oc e s s   th a e m pl oys   on e   or   m or e  m a c hi ne  l e a r ni ng t e c hni que s  ( m a c hi ne  l e a r ni ng)  t o a na ly z e  a nd e xt r a c knowle dge  a ut om a ti c a ll y [ 12] .   A   m e th od  ba s e on  le a r ni ng  f r om   a   f e a tu r e   th a is   not   not ic e is   c a ll e de e le a r ni ng  [ 13] N a ïv e   b a ye s   a lg or it hm   is   one   of   th e   c la r if ic a ti on  a lg or it hm s   ba s e on  th e   b a ye s ia th e or e m   in   s ta ti s ti c s T h e   a va il a bi li ty   of   a   c la s s   c a be   pr e di c te by  th e   na ïv e   ba y e s   a l gor it hm   [ 14] .   T he   na ïv e   ba ye s   m e th od  is   th e   be gi nni ng  to   bui ld   a   m e th od  th a ha s   be e de s ig ne u s in a   c or pus   th a ha s   be e f or m e [ 15] N a iv e   b a ye s   i s   of te n c a ll e d t he   b a ye s '   r ul e  w hi c h i s  a  pr e f ix  f or  da ta  m in in m e th ods  a nd ma c hi ne  l e a r ni ng. I bui ld s  a  m ode l   w it pr e di c ti ons T hi s   i s   a   ne w   w a to   f in out   da ta  a nd  le a r n m or e   [ 16] M ode li ng  da ta   obt a in e by  w or ki ng  w it bi na r da ta a nd  is   a   c a te gor of   da ta   c a ll e r a ndom  f or e s [ 17] C la r if ic a ti on  te c hni que s   on  na ïv e   ba ye s   c a n be  us e d a ve r y l a r ge  i npu di m e ns io ns . T hi s  i s  a  s im pl e  a lg or it hm  but  c a n pr oduc e  ve r y  good   r e s ul ts  t ha n   ot he r  a lg or it hm s  [ 18] .       2.   R E S E A R C H  M E T H O D   T he   f ie ld   of   s tu dy  th a f oc us e s   on  a   m e th odol ogy  to   a dd  kno w le dge   th a is   ve r m uc us e f ul   f r om   th e   da ta   is   c a ll e knowl e dge   di s c ove r in   da ta b a s e   ( K D D ) T he   r a pi de v e lo pm e nt   of   onl in e   da ta   on  a n   ongo in ba s is   due   to   th e   w id e s pr e a us e   of   th e   in te r ne a nd  d a ta ba s e s   ha s   m a de   a   ve r la r ge   ne e f r om   th e   K D D   m e th odol ogy  [ 19] O bs ta c le s   to   a ddi ng  knowl e dge   f r om   da ta   to   da ta b a s e   r e s e a r c h,  m a c hi ne   le a r ni ng,  knowing  pa tt e r ns s ta ti s ti c s a nd  in c r e a s in pe r f or m a nc e   to   be c om e   s m a r a nd   s ophi s ti c a te bus in e s s   s ol ut io ns   [ 20] I th is   s tu dy,  th e   m e th od  us e f or   da ta   pr oc e s s in is   th e   a dm is s io da ta   by  us in th e  s ta ge s   of   knowle dge   di s c ov e r in   da ta ba s e   ( K D D )   a s   il lu s tr a te in   F ig ur e   1 K now le dge   di s c ov e r in   da ta ba s e   ( K D D )   is   th e   pr oc e s s   of   de t e r m in in us e f ul   in f or m a ti on  a nd  pa tt e r ns   i da ta T hi s   i nf or m a t io i s   c on ta in e d   in   a   la r ge   da t a b a s e   t ha w a s   pr e vi ou s l un kno w n   a nd   p ot e nt i a l ly   u s e f ul .   D a t a   m in i ng   i s   on e   s t e p   i a   s e r i e s   of   K D D   it e r a t iv e   pr oc e s s e s  [ 21] .     2.1.    D at a s e le c t io n   I th is   pr oc e s s   th e   s e l e c ti on  of   da ta  s e ts   i s   done , c r e a ti ng  a   ta r g e da ta   s e t,   or   f oc us in on  a   s ubs e of   va r ia bl e s  ( da ta  s a m pl e s )  w he r e  t he  di s c ove r y w il be  pe r f o r m e d  [ 22] . T he  r e s ul ts  of  t he  s e le c ti on a r e  s to r e d i n   a   s e pa r a te   f il e   f r om   th e   ope r a ti ona da ta ba s e T he   a tt r ib ut e s   us e a r e   s tu de nt   I D   n um be r na m e pr og r a m   s tu dy,  f a c ul ty ge nde r s c hool   or ig in ye a r   of   e nt r y,  na ti ona l   e xa m in a ti on,  ty pe   of   pa ym e nt a nd  nom in a l   pa ym e nt T he   da ta   in   th is   s tu dy  w e r e   s our c e f r om   U ni ve r s it a s   I s la m   N e ge r R a de F a t a w he r e   th is   da ta   i s   s e c onda r da ta   c ons is ti ng  of   ne w   s tu de nt   da ta   f or   2016  up  to   2 019.  T he   a m ount   of   da ta   obt a in e w a s   18,930   c ons is ti ng  of   s tu de nt   I D   n um be r na m e pr ogr a m   s tu dy,  f a c ul ty pl a c e   of   bi r th ge nde r da te   of   bi r th s c hool   or ig in ye a r   of   e nt r y,  na ti ona e xa m in a ti on,  ty pe   of   pa ym e nt a nd  nom in a pa ym e nt T he   f ol lo w in a r e   s om e   e xa m pl e s   of   ne w   s tu de nt s   da ta   T a bl e   1.  T he   s ta g e s   of   th e   knowle dge   di s c ove r in   da ta ba s e   ( K D D )   pr oc e s s   c ons is of :   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I S S N :   2252 - 8938     I nt  J  A r ti f   I nt e ll ,   V ol 10 , N o.  2 J une   20 2 1   324     331   326       F ig ur e  1. S ta ge s  i n K D D       T a bl e   1 . N e w   s tu de nt  da ta   obt a in e d   No   S t ude nt  I D   N um be r   N a m e   S t udy P r ogr a m   G e nde r   Y e a  of   E nt r y   S c hool   O r i gi n   N a t i ona l   E xa m i na t i on   T ype  of   P a ym e nt   N om i na l   P a ym e nt   1   1683600004   S i s ka   A pr i ya nt i   H a di t h S c i e nc e   F   2016   I s l a m i c   s c hool   N ur ul   H i km a h   77   G r oup 3   R p.  1.800.000   2   1683600003   S i f a ul   H a s a na h   Q ur a ni c  S c i e nc e s   a nd I nt e r pr e t a t i on   M   2016   I s l a m i c   s c hool   N ur ul   H i km a h   67   G r oup 3   R p.  1.800.000   3   1683600002   M a ul i di A na m   Q ur a ni c  S c i e nc e s   a nd I nt e r pr e t a t i on   M   2016   I s l a m i c   s c hool   N ur ul   H i km a h   83   G r oup 3   R p.  1.800.000   4   1683400008   B a yu  P ut r a   A qe e da h a nd  I s l a m i c   P hi l os ophy   F   2016   S e ni or  H i gh  S c hool   P us pi t a   85   G r oup 3   R p.  1.800.000       2.2.  P r e - p r oc e s s in g an d  c le an in g   D a ta  pr e - pr oc e s s in g a nd da ta  c le a ni ng a r e  done   by   r e m ovi ng i nc ons is te nt  da ta  a nd nois e , dupli c a ti ng  da ta , c or r e c ti ng  da ta   e r r or s , a nd c a n be   e nr ic he d w it h r e le va nt  e xt e r na da ta  [ 23] .     2.3.  T r an s f o r m at io n   T hi s   pr oc e s s   tr a ns f or m s   or   c om bi ne s   da ta   in to   a   m or e   a ppr opr ia te   w a to   do  th e   m in in pr oc e s s   by  su m m a r iz in g ( a ggr e ga ti on ).     2.4.  Dat a m in in g   A   c yc le   t o   o b t a i a   p a t t e r n   or   in f or m a ti o t h a i s   v e r y   i n t e r e s t e d   i n   d a t a   a n d   u s e d   b a   te c hni que   [ 24] ,   m e th ods , or   a lg or it hm s   unde r  t he  obj e c ti ve s  of  t he  K D D  pr oc e s s  i s  c a ll e d d a ta  m in in g pr oc e s s  [ 10] .     2.5.  I n t e r p r e t at io n /e val u at io n   T he   pr oc e s s   f or   tr a ns la ti ng  p a tt e r ns   ge ne r a t e f r om   da ta   m in in g E va lu a te   ( te s t)   w he th e r   th e   p a tt e r ns   or   in f or m a ti on  f ound  a r e   by  or   c ont r a di c to r to   pr e vi ous   f a c ts   or   hypothe s e s K now le dge   obt a in e d   f r om   th e   pa tt e r ns  f or m e d i s   pr e s e nt e d   in  t he  f or m  of  vi s u a li z a ti on.       3.   R E S U L T S   A ND  A N A L Y S I S   3.1.  De e p  l e ar n in g   T he   da ta   pr oc e s s in of   ne w   s tu de nt s   us in de e le a r ni ng   w it r a pi dm in e r   s of twa r e   is   s how i n   F ig ur e   2.   D e ta il   of   th e   va li da ti on  pr oc e s s   in   de e p   le a r ni ng  a s   s how n   in   F ig ur e   3.  U s in de e le a r ni ng  m ode li ng  a s   s how n   in   F ig ur e   2 w it h   th e   a m ount   of   tr a in in d a ta   ( ne w   s tu de nt   a dm is s io n   da ta   f r om   2016   to   2019)   r e c e iv in 18.930  it e m s T he   a c c ur a c of   u s in de e l e a r ni ng  is   52.65%   a s   s how in   F ig ur e   4.  B e s id e s   Evaluation Warning : The document was created with Spire.PDF for Python.
I nt  J  A r ti f  I nt e ll   I S S N 2252 - 8938       A  c om par is on be tw e e n de e p l e a r ni ng, naïv e  bay e s  and r andom  fo r e s fo r  t he  appli c at io n of  ( N u r hac hi ta )   327   pr oduc in a a c c ur a c va lu e de e le a r ni ng  a ls pr oduc e s   a   ka ppa   va lu e   of   0.511,  a   c or r e la ti on  va lu e   of   0.804, a nd a  c r os s - e nt r opy va lu e  of  1.793 a s  s how n i n F ig ur e  5.           F ig ur e  2. D e e p l e a r ni ng mode li ng on   r a pi dm in e r           F ig ur e   3 . V a li da ti on de e p l e a r ni ng            F ig ur e   4 . V ie w  a c c ur a c y   de e p l e a r ni ng        3.2.  Naïve   b aye s     T he   da ta   pr oc e s s in of   ne w   s tu de nt s   us in na ïv e   ba ye s   w it r a pi dm in e r   s of twa r e   is   s how in   F ig ur e   6 U s in na ïv e   ba ye s   m ode li ng  a s   s how in   F ig ur e   6 w it th e   a m ount   of   tr a in in da ta   ( ne w   s tu de nt   a dm is s io da ta   f r om   2016  to   2019)   r e c e iv in 18.930  it e m s   a nd   te s ti ng  da ta   us in 2019  n e w  s t u d e n t  a d m i s s i o n   d a t a   w i t h   a   t o t a l   o f   4 7 6 2   i t e m s .   T h e   a c c ur a c y   of   u s i n g   n a ï v e   ba y e s   i s   9 9 . 7 9%   a s   s h o w n   i F ig u r e   7.  B e s id e s   pr oduc in a a c c ur a c va lu e na ïv e   b a ye s   a l s pr oduc e s   a   k a pp a   va lu e   of   0.998,  a   c or r e la ti on  va lu e   of   0.998,   a nd a  c r os s - e nt r opy va lu e  of  0.029 a s  s how n i n F ig ur e  8.     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I S S N :   2252 - 8938     I nt  J  A r ti f   I nt e ll ,   V ol 10 , N o.  2 J une   20 2 1   324     331   328   3.3.  Ran d om  f or e s t   T he   da ta   pr oc e s s in g   of   ne w   s tu de nt s   us in r a ndom  f or e s t   w i th   r a pi dm in e r   s of twa r e   is   s how in   F ig ur e   9.   U s in r a ndom  f or e s m ode li ng  a s   s how in   F ig ur e   9 w it th e   a m ount   of   tr a in in da ta   ( ne w   s tu de nt   a dm is s io da ta   f r om   2016   to   2019  r e c e iv in 18,930  a nd  te s ti n da ta   us in 2019  ne w   s tu d e nt   a dm is s io da t a   w it h a  t ot a of  4762.   T he  a c c ur a c y of  u s in g r a ndom f or e s 44.65%  a s  s how n i n F ig ur e  10.           F ig ur e   5 . V ie w   ka ppa  de e p l e a r ni ng            F ig ur e  6. N a ïv e  ba ye s  m ode li ng on r a pi dm in e r           F ig ur e   7 . V ie w   a c c ur a c y   na ïv e  ba y e s       Evaluation Warning : The document was created with Spire.PDF for Python.
I nt  J  A r ti f  I nt e ll   I S S N 2252 - 8938       A  c om par is on be tw e e n de e p l e a r ni ng, naïv e  bay e s  and r andom  fo r e s fo r  t he  appli c at io n of  ( N u r hac hi ta )   329       F ig ur e   8 . V ie w   ka ppa  na ïv e  ba ye s           F ig ur e   9 .   R a ndom f or e s t   m ode li ng on r a pi dm in e r           F ig ur e   10 . V ie w  a c c ur a c y   r a ndom f or e s t       B e s id e s   pr oduc in a a c c ur a c v a lu e r a ndom  f or e s a ls o   p r oduc e s   a   ka pp a   va lu e   of   0.421,  a   c or r e la ti on  va lu e   of   0.729,  a nd  a   c r o s s - e nt r opy  va lu e   of   2.003 ,   a s   s ho w in   F ig ur e   11.   T he   pa r a m e te r   r e s ul ts   of   a c c ur a c y,  pr e c is io n,  r e c a ll   c a be   s a id   to   pr oduc e   go o c la s s if ic a ti on  r e s ul ts   or   not   by  us in th e   c la s s if ic a ti on  r e s ul p a r a m e te r   gui de li ne s   s how in   T a bl e   [ 2 5] T he   r e s ul ts   of   th e   c om pa r is on  be tw e e th e   th r e e  a lg or it hm s  na m e ly  de e p l e a r ni ng, na ïv e  ba y e s , a nd r a ndo m  f or e s t,  a s  s how n i n T a bl e  2.   T he   hi ghe s a c c ur a c y   va lu e   is   n a ïv e   ba y e s   w it a   va lu e   of   99.7 9% w hi le   f or   th e   hi ghe s ka pp a   va lu e   is   na ïv e   ba ye s   w it a   va lu e   of   0.998,  w hi le   f or   th e   hi ghe s c o r r e la ti on  va lu e   is   n a ïv e   b a ye s   w it a   va lu e   of   0.998, a nd f or  t he  hi ghe s c r os s - e nt r opy va lu e  t ha is  r a ndom f o r e s w it h a  va lu e  of  2.003.     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I S S N :   2252 - 8938     I nt  J  A r ti f   I nt e ll ,   V ol 10 , N o.  2 J une   20 2 1   324     331   330       F ig ur e   11 . V ie w  a c c ur a c y   r a ndom f or e s t       T a bl e  2. R e s ul ts  c om p a r is on of  a ll  t hr e e  a lg or it hm s   R e s ul t   T he  a l gor i t hm   D e e p l e a r ni ng   N a ï ve  ba ye s   R a ndom  f or e s t   A c c ur a c y   52.65%   99.79%   44.65%   K a ppa   0.511   0.998   0.421   C or r e l a t i on   0.804   0.998   0.729   C r os s - e nt r opy   1.793   0.029   2.003       4.   C O N C L U S I O N     B a s e on  th e   r e s e a r c a nd  di s c us s io th a ha s   be e c a r r ie o ut it   c a be   c onc lu de th a f r om   th e   th r e e   m e th ods   of   de e le a r ni ng,  na ïv e   ba ye s a nd  r a ndom  f or e s in   de te r m in in th e   be s s tu de nt   r e c r ui tm e nt   pr om ot io s tr a te gy  a th e   R a d e F a ta h   S ta te   I s la m ic   U ni ve r s i ty   in   P a le m ba ng  a nd  r e f e r r in to   th e   or ig in a da ta D a ta   of   ne w   s tu de nt s   us e f r om   2016  to   2019  w e r e   18.930  it e m s   a s   da ta   tr a in in a nd  da ta   te s ti ng  us e d   da ta   of   ne w  s tu de nt s   f r om   2019  w e r e   4762  it e m s . T he   r e s ul t s   o f   th is   s tu dy  u s e de e le a r ni ng  r e s ul ts   r e s ul te d   in   a a c c ur a c va lu e   of   52.65% na ïv e   ba ye s   r e s ul ts   r e s ul te in   a a c c ur a c va lu e   of   99.79% a nd  r a ndom   f or e s r e s ul ts   r e s ul te in   a a c c ur a c va lu e   of   44.65% S of   th e   th r e e   a lg or it hm s   th a s how   th e   be s r e s ul ts   f or   th e   pr om ot io s tr a te gy   of   in c om in ne w   s tu d e nt s   th a a r e   us in na iv e   b a ye s   w it th e   hi ghe s a c c ur a c va lu e  of  99.79% .       R E F E R E N C E S   [1]   U.  Fayyad,  G.  Piatetsky - Shapiro ,   and  P.   Smyth,  “From   data  minin to  knowle dge  discove ry   in  databa ses,”  AI  Magazine , vol. 17, no. 3, pp. 37 - 53, 1996.   [2]   Nurhachita  and  E.  S.  Negara,  “A  Comparison  Between  Naïve  Bayes   and  the   K - Means  Clustering  Algorithm  fo r   The Application of Data Mi ning on The Admission of New Students,”  Jurnal  Intelektu alita:  Keisla man, Sos ial, d an   Sains , vol. 9, no. 1, pp. 51 - 62, 2020 https://doi.org/10.19109/intelektualita.v9i1.5574 .   [3]   D.  F.  Brianna,  E.   Surya  Negara,   and  Y.   N.  Kunang,  “Network   Centr alization  Analys is  Approach  in   the  Spread   of  Hoax  News  on  Social  Media,”   2019  International  Conference   on  El ectrical  Engineering  and  Computer  Science   (ICECOS) , Batam, Indonesia, 2019, pp. 303 - 308, doi: 10.1109/ICECOS47637.2019.8984526.   [4]   J.  Soni U.  Ansari,  D.  Sharma,  and  S.  Soni,  “Predictive  Data  Mining  f or  Medical  Diagnosis:  An  Overview  of  Heart  Disease  Prediction,”  Internati onal  Journal  of   Computer  Applicati ons vol.  17,  no.  8,   pp.  43 - 48,  2011,   doi:  10.5120/2237 - 2860.   [5]   E.  S.  Negara,   D.  Triadi,  and  R.  Andry ani,  “Topic   Modelling  Tw itter  Data  with   Latent  Dirichlet   Allocation  Method,”  2019  International  Conferen ce  on  Electrical  Engineering   and  Computer  Scienc (ICECOS) B atam,  Indonesia, 2 019, pp. 3 86 - 390, doi: 10.1109/icecos47637.2019.8984523.   [6]   W.  Y athongchai C.  Yathongch ai,  K.   Kerdprasop,   and  N.   Kerdprasop,   “Factor  analysis   with  data   mining   techniqu e   in higher e ducational  student drop  out,”  Latest A dvanc es in E ducatio nal Tec hnologie s , pp. 111 - 116, 2012.   [7]   A.  P.  Wibawa,  et  al.,   “Naïve  Bayes  Classifier   for   Journal  Quartile  Cl assification,”  Internati onal  Journal  of  Recent  Contributions  from Engin eering,  Scienc e & IT ( iJES) , vol. 7, no. 2, pp. 91 - 99, 2019.   [8]   A.  Cutler,  D.  R.  Cutler,  and   J.  R.  Stevens,   “Random  Forests,”  Spri nger  Science+ Business  Media pp.  1 57 - 175 ,   2012, doi: 10.1007/978 - 1 - 4419 - 9326 - 7.   [9]   F.  Ahmad,  N.  H.  Ismail,   and  A.  A.  Aziz,   “The  prediction  of  student s’  academic  performance  using  classificatio n   data  mining  techniques,”  Applied  Mathematical  Sciences vol.   9,  no.  129,  pp.  6415 - 6426,  2015,  doi:  10.12988/ams.2015.53289.   Evaluation Warning : The document was created with Spire.PDF for Python.
I nt  J  A r ti f  I nt e ll   I S S N 2252 - 8938       A  c om par is on be tw e e n de e p l e a r ni ng, naïv e  bay e s  and r andom  fo r e s fo r  t he  appli c at io n of  ( N u r hac hi ta )   331   [10]   T.  Marnoto,  “Drying  of   Rosella  (Hibiscus   sabdariffa Fl ower  Pe tals   using  Sola Dryer  wi th  Doub le  Glass  C ove r   C o l l e c to r ,   In t e r na t i o na l   J ou r n a l   o f   S ci e n c e   a n d   En g i n e er i n g v o l .   7 ,   n o .   2,   p p .   1 5 5 - 16 0 ,   2 01 4 ,   do i 10.12777/ijse.7.2.150 - 154.   [11]   F.  A.  Rahman,  M.  I.  Desa,  A.  Wibowo,  and  N.  A.   Haris,  “Knowle dge  discovery  database  (KDD) - data  mining  applicati on  in  transport ation,”  Proceeding  of  International  Conference  on  Electrical  Engineering,  Computer   Science and Informat ics (EECSI  2014) , Yogyakarta, pp. 116 - 119, 2014, doi: 10.11591/eecsi.1.357.   [12]   B.  Kolukisa,  et  al.,   “Diagnosi of  Coronary   Heart  Disease  via   Cl assificat ion  Algorit hms  and  New   Feature   Select ion Met hodology ,”   Internati onal Journ al of Dat a Mining  Science (IJDA T) , vol. 1, no. 1, pp. 1 - 8, 2019.   [13]   F.  Zhou,  Y.  Gao,   and  C.   Wen,  “A   Novel  Multimode   Fault  Classi fication  Method  Based  on   Deep  Learning,   Journal  of Co ntrol  Science and  Engineer ing , vol. 2017, no. 1, 2017, doi: 10.1155/2017/3583610.   [14]   B.  Kolukisa,  et  al.,   “Eval uation  of  Classification  Algorithms,  Linear  Discriminant  Analysis  and  New  Hybrid  Featur Select ion  Methodo logy  for   the  Diagno sis   of  Corona ry   Arter Disea se,”  2018  IEEE   International   Conferenc e on Big  Data (Big  Data),   Seattle , WA,  USA, 20 18, pp.  2232 - 2238 , doi: 10.1109/BigData.2018.8622609.   [15]   T.  Sutabri,  A.  Suryatno,  D.  Setiadi,   and  E.  S.  Negara,   “Improving  naïve  bayes  in  sentiment  analysis  for   hotel   industry  in  Indonesia, ”  2018   Third  International  Conference   on  Info rmatics  and  Computing  (ICIC) Pal embang,  I ndonesia, 2018, pp. 1 - 6, doi: 10.1109/IAC.2018.8780444.   [16]   S.  Mujawar  and  H.  P.  R.  Devale,  “Prediction   of  Hear  Disease  us ing  Modified  K - means  and  by  using  Naiv e   Bayes,”   Internati onal Journ al of Inn ovative Research  in Comp uter an d Communi cation Eng ineering vol. 3, no. 11 ,   pp. 039 - 0400, 2015, doi: 10.15680/IJIRCCE.2015.   [17]     Jehad  A.,  Khan,  Rehanullah,  N.  Ahmad,   I.  Maqsood,  “Random  Fore sts  and  Decision  Trees,”  IJCSI  International   Journal  of Co mputer S cience Issu es , vol. 9, no. 5, pp. 272 - 278, 2012.   [18]   M.  Doshi  and  S K.   Chaturvedi,  “Correlation  Based   Feature  Sel ection  (CFS)  Technique  to  Predict   Student   Perfr omance ,”  Internati onal  journal  of  Computer  Networks  Comm unication s vol.  6,  no.  3,  pp.  197 - 206,  2014,   doi: 10.5121/ijcnc.2014.6315.   [19]   M.  Ramageri,  Bharati,  M.,  “D ata   Mining  Techniques  and   Applications,”  Indian  Journal  of  Computer   Science  an d   Engineering , vol. 1, no. 4, pp. 301 - 305, 2010.   [20]   P.  V.  P.  Sundar,  “A  Comparative  Study  for   Predic ting  Student’ Aca demic  Perfor mance   Using  Bayesia Networ k   Classifie rs,”  IOSR Jou rnal of Engineering , vol. 3, no. 2, pp. 37 - 42, 2013, doi: 10.9790/3021 - 03213742.   [21]   N.  Kumar,  S.  Jain,  and  K.  Chauhan,  “Knowledge  Discovery  from  Dat Mining  Techniques,”   Internati onal  Journal   of Engineering Research & Technology (IJ ERT) , vol. 7, no. 12, pp. 1 - 3, 2019.   [22]   E.  S.  Egara,  D.   Kerami,  I.   M.  Wiryana,   and  T.  B.   Maulana  Kusum a,  “Researchgate  data  analysis   to  measure  t he   s t r e n g th   o f   I n d o ne s i a n   re s e a r ch ,   F a r   Ea s t   J o u rn a l   o f   E le c t r o ni c s   a n d   Co m m u n i ca t i o ns ,   v o l .   1 7,   n o .   5 ,   p p .   11 7 7 - 1183 ,   2017, doi: 10.17654/E C017051177 .   [23]   R.  Amanda,  E.   S.  Negara,   A.  Info,   D.  Mining,   E.  Method,   and  Y.   D.  Classification,  “Analysis  and   Implementation  Machine  Learning  for  YouTube  Data  Classification  by   Comparing  th Performance   of  Classification  Algorithms,”  Jurnal  Online In format ik a   vol. 5, no. 1, pp. 61 - 72, 2020, doi: 10.15575/join.v5i1.505.   [24]   R.  Dieng,  O.  Corby,  and  S.  Lapalut,  “Acquisition  of  gradual  know ledge,”  Lect.  Notes  Comput.  Sci.  (including   Subser.  Lect.  Notes  Artif.  Intell.  Lect.  Notes  Bioinformatics) vol.  723  LNAI,  no.  3,   pp.  407 426,  1993,  doi:  10.1007/3 - 540 - 57253 - 8_65.   [25]   Florin  Gorunescu,  “Data  m i n i n t e c hn i q u es   a nd   m o de l s , ”  I n t el l i g en t   Sys t e m s   Re f e r en c e   L i b r ar y ,   vo l .   1 2 ,   pp .   1 85 - 317,   2011, doi: 10.1007/978 - 3 - 642 - 19721 - 5_5.       B I O G R A P H I E S   O F  A U T H O R S       Nurhachita  has  obtained  her   bachelor’s  of   Information  System   from   Universitas  Islam  Negeri   Raden  Fatah  Palembang.  She  is  master  student  majoring  in  I nformatics  Engineering  at  Universitas  Bina  Darma.  And  then,  she  works  at  Universitas   Is lam  Negeri  Raden  Fatah  Palemb ang.         Edi  Surya  Negara   has   obtained  his   bachelor’s  and   master  of   informa tics  from  Universitas  Bina   Darma  and  Doctor  of  Information   Technology  from  Gunadarma   Uni versity.  He  has  10  years   of   teaching a nd resea rch expe rience.  He publishe s 9 resea rch pape rs at the in ternationa l level.         Evaluation Warning : The document was created with Spire.PDF for Python.