Int ern at i onal  Journ al of Ele ctrical  an d  Co mput er   En gin eeri ng   (IJ E C E)   Vo l.   9 , No .   5 Octo ber   201 9 , pp.  3584 ~3 590   IS S N: 20 88 - 8708 DOI: 10 .11 591/ ijece . v9 i 5 . pp3584 - 35 90          3584       Journ al h om e page http: // ia es core .c om/ journa ls /i ndex. ph p/IJECE   Perform ance ev alu atio of di fferen t classifi ca ti on techni qu es  usin g different d atasets       Ab d ulka dir Ö z demi r, U ğur  Yavu z , F ares  Ab d ulha fidh Dael   Depa rtment  o f M ana gement Inf orm at ion  S y s te m s,  Atat urk   Unive rsit y ,   Turkey       Art ic le  In f o     ABSTR A CT    Art ic le  history:   Re cei ved   N ov   27 , 201 8   Re vised  A pr   5 ,  201 9   Accepte Apr   14 , 201 9       Now aday data  m ini ng  bec om one  of  the   techn ologi es  that  paly  m aj or  eff ec t   on  business  int ellige n ce .   How ev e r,   to  be  ab le   to  u se  the   data  m ining  outc om the   user  should  go  through  m an y   proc esses   such  as  cl assifie da ta.   Cla ss ifi c at ion   o data  is  pro ces sing  dat a   and   orga ni ze   the m   in  spe ci fi c   ca t egor ize  to   be   use  in  m ost  eff ec t ive   and  eff ic i ent   use .   In  d at a   m ini ng  on te chn ique   is  not  appl i ca bl to  be  appl i ed  to  al th dat ase ts.  Man dat users   wasting   lot   of   ti m tr y ing  m a n y   class ifi c at ion   te chni qu es  in  orde to  find   the   m ost  an   ap propria t t ec hn i que  to   be   used .   Th is  pap er  sh owing  the  diffe ren ce  resul of  apply ing   diffe re n t ec hn i ques  on  th s ame  data.   Thi pape ev aluate the   per for m anc of  diffe r ent   class ifi catio te chni qu es  using  diffe r ent   d at ase ts.  In  thi st ud y   four   data  class ifi cation  te ch nique hav e   chose n.   They   ar as  foll ow,  Ba y esNet ,   Naiv eBay es,   Multi lay e r   per ce ptron   and  J48.  The   sel ec t ed  data  class ifi cation  techniqu es  per form anc t este unde r   two  par amete rs,   the   ti m ta k en   to  buil the   m odel   of  the   da tas et   and  th e   per ce n ta g of  a cc ura c y   to   c la ss if y   th da ta set   i the  cor re ct  class ifi cation .   The   exp eri m ent s   are   c arr ie ou using  W eka   3. software .   Th re sults  in  the   pape demons trate  that  the   eff ici ency   of  Multi lay er  Per ce p tron  cl assifi er  in   over all  the   b est  ac cur acy   per form anc to   cl assif y   the  insta nce s ,   and  Naiv eBay e cl assifi ers  were   the   wors t   outc om of   ac cur acy   t o   cl assif y ing   the i nstanc e   for ea ch dat ase t.   Ke yw or d s :   Ba ye sNet   Cl assifi cat ion   Data m ining   J4 8   Mult il ay er p er ceptr on   NaiveBay es    Wek a     Copyright   ©   201 9   Instit ut o f Ad vanc ed   Engi n ee r ing  and  S cienc e   Al l   rights re serv ed .   Corres pond in Aut h or :   Fares A bdulh a fid h Dael   Dep a rtm ent o f M anag em ent Inf or m at ion  Sys tem s,   Atat urk U niv er sit y,   Ün i ver sit e Ma halle si, A ta r k Ün i ver sit esi   Kam sü,  25030, E rzur um , Tu r key .   Em a il far esal ariqi@ gm ai l.com       1.   INTROD U CTION     Data  m ining   is  way  of   extr act   us efu kn owle dge  out  of  huge  volum e   of   data.  T he  disco ver i ng   knowle dge  co m through  m any  m ining   to   be  us e f ul  kn ow le dg e T c o nve rt  the  ra data  to  knowle dge   the  data  sho uld   be  inte gr at e d,  cl eaned,  cl assifi ed  or  cl us te r ed  an so   on.  To  util iz the  process  o e xtr act ing  data  m ining m any  te chn iq ue an sta nd a r ds   s houl be  use d.   O ne  of   t he   process   of  da ta   m ining   is  how  t cl assify   the  da ta   and  orga niz them   in  the  correct   cat eg ori es  [1 2].  Eve ry  data  has  it s   own  c ha racter ist ic s,   so m of   them   no m inal  data  and   oth e are  num erical   data  and   s f or t h.   Accor ding  to  the  data  cha rac te risti cs   the  data  sho uld  be  cl assifi ed Howe ver,  it   is  no r eseal able  to  be  c hec the  data  co ntain  li ne  by  li ne  to  cl assify   the  data.  I da ta   m ining   the r are  sever al   te chn i qu e to  be   us ed   to  cl as sify  the  data.  Howe ver   not  al the   te chn iq ues  ca cl assify   cor rec tl the  data  give   the  sam res ult  or   ou tc om of   the  data.  E ve ry  te chn i qu has  it s   own  m od el  a nd alg ori thm  an the  w ay   of  how  to  cl assi fy the  data [ 3 - 6] .   To  fin ou the  dif fer e nces   of   the  cl assif ic at ion   te chn i ques  an the  r easo ns   of  the   diff e ren ce s,   four   cl assifi ca ti on   te ch nique hav sel ect ed.   T hey  are   as  fo ll ow  Ba ye sNet,  Naiv eB ay es,  Mult i la ye r   per ce ptr on   a nd  J48.  T te st  the  diff e re nc es  of   the  four  sel ect ed  cl assifi cat ion   te ch ni qu es ,   three  diff e ren t   dataset hav e   colle ct ed,   C on gr essi onal   voti ng  rec ords Ca e valuati on  a nd  C on t raceptiv m et ho c ho i ce.  T Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       Perf orma nce e valu ation of  d if fe rent classif ic ation t ech niqu es  …  ( Fares  A bdulhafi dh  Dael )   3585   m easur the  ef fecti ven es of   t he  te chn i qu e two  par am et ers  hav te ste d,   th tim ta kin of  each  te chn i que  to   bu il the  m odel   fo the  sel ect ed  dataset ,   and   the  accu racy  of   cl assify ing   the  data  by  each  te chn iq ue .   Wek a  s of twa re  h as  selec te as  p la tf or m  o a pply ing  t he  cl as sific at ion  tec hniqu es  and t he d at aset s.   The  pap e r’s  fl ow   is  orga nize as  fo ll ows.  Sect ion   as  in tro du ct io of   t he  pa pe r.   Se ct ion   II  co vers   li te ratur re vi ew  of   data  m ining  an cl as sific at ion   te c hniq ues.   As   w el about  the  Wek a   s of twa r an m et ho dolo gy.  I the  sect io I I Re su lt an Discussi on  we re  il lustrate d.   I the  la st  sect ion   IV   C oncl us i on   a nd   su m m ariz ing   t he  c om par at ive r es ults.       2.   BACKG ROU ND    2.1   Data   mi nin g   Data  m ining   is  pr oce ssin of   the  ra da ta   to  get  of   the  us e f ul  inf or m at ion or  to  disc ove r   the  kn ow le dg e   from   huge  da ta bases.   The  ou t pu of  the  data  m ining   is   the  patte rn   w hich  is  t ide ntif y   po te ntial ly   us efu l,   valid ulti m at ely  under st and a ble  a nd  no vel  patte r i t he  m ining   data Mostl data  m ining  app ly in in  business s th com pan ie can  m ake  eff ec ti ve  m ark et ing  strat egies  by   knowin w ha their   custom ers  wa nt   to  bu y.  Data  m ining   outc om dep en ds   on  the  way  of  c ollec ti ng   data  and   how  t he  da ta   are   processe d [1,   3 , 7 ] .     2.2   Data  w are ho u sing   Data  W are ho usi ng   is  cente r   of   m any  data  colle ct ion   f rom   m any  places The  c om pan ie or   sect or s   colle ct   their  da ta   from   diff ere nt  places  a nd  br a nc hes  in   on place  cal le data  wa reho us i ng.  T he  data  in  data  war e hous i ng   a re  integ rated  f ro m   al places cl eaned   from   m issi ng   data  and   noise   data The  data  in  data   war e hous i ng ar e o r ga nized  a nd  pr e par e d for  fu t ur us or in  d em and  fr om  t he users . T he d at a w are hous e   us e to s upport  the   decisi on  of  m anag em ent m aki ng pr ocess [1].     2.3 .     Clas sific at i on   Cl assifi cat ion   in  data  m ining   are  so m te chn iqu es  us to  predict cl assify   and   orga nized  the  data  in  their  s uitable   cat egories  [ 8 ] .   Each   cl ass  ha it ow r ul es  an al go rithm s.  So m of   th e   cl assifi c at ion  te chn iq ues   are   f ollow  decisi on  tree   r ules  s uch  as   J48,   s om oth er   cl ass es  are   f ollo wing  Ba ye sia N et wor su c as  Ba ye sNet  an Nai ve Ba ye s,  and   ot her   are  f ollo wing  A rtific ia intel li gen ce  a nd   Ne ur al   Net work.  Cl assifi cat ion   te chn iq ues  have  di ff e ren ap pl ic at ion and   wh ic dataset   sh o ul be  ap pl ie on.  I ad di ti on ,   al cl assifi cat io te ch niques  will   no be  abl to  predict   co rr ect ly   the  cl assifi cat ion   of   da ta   com par to  othe r   cl assifi cat ion   t echn i qu e s.  T fin ou t he  be st  cl assifi cat ion   te ch niq ues   f or  the  te sti ng  da ta the  data  s houl be  a com patible  wi th the s el ect ed  classi ficat ion  t echn i qu e  rules,  algorit hm s etc [ 9 ].       2.4 .     J48   J4 cl assifi er  i an  op ti m iz ver si on   of  C4 . 5.   T he  J 48  is  base on  Deci sion   tr ee.  J 48  is  on of   the  data  cl assifi cat ion   te chn i ques  us e in  da ta   processin a nd   data  m ining.  The  J48  r ules   and   al gorithm are  us in decisi on  tree  te ch niques   w hich   co ntain of  m ai le af  and  bra nch e s.  Each  of  the   br anch  or  le a c onta in     decisi on  that l ead  to  di ff e rent   ou tc om e.  Som of   the d at aset hav e v ery b ig  tree  m od el   wh ic co ntains   m any  le afs  le ads  to   diff e ren resul co m par in to  fe le afs  of  decisi on  tree   wh e ap plyi ng  J48  cl assifi c at ion  te chn iq ue [ 10, 11 ].     2.5   Multila yer  pe rceptr on   Mult il ay er  Per ceptr on  cl assif ie is  based  on  Ar ti fici al   in te ll igence  an Ne ur al   Netw ork  with ou t   qu al ific at io n.   Mult i - Lay e Perce ptr on  ( MLP)  ha as   m ini m u m   as   th ree  la ye rs.  On la ye as   input,   the  seco nd  as  hidden   la ye a nd  the  la st  as  t he  ou t pu la ye r MLP  is  fee dforwa rd   ne ural   netw ork,   t he   hidde la ye can  be  on la ye or   m or e.  In   MLP  eac node  in  eac la ye are  co nn e ct ed  to  al la ye r’ nodes.   M ulti la ye r   per ce ptr on  is  on e   of  t he  dat cl assifi cat ion   te c hn i qu es   us e in   ne ural   netw ork dee le ar ning  an oth e r   app li cat io ns   of d at processi ng  [ 12 ].     2 .6 .     Bay es Ne t   Ba ye sNet  cl assifi er  one  of   t he  cl assifi ers  in  W e ka  softw are.  The  Ba ye sNet  is  based   on   Ba ye sia Netw ork  w hich  is  based   on  Ba ye theor em The  Ba ye sia netw ork  is  m os tly  wo rk i ng  w hen   the re  m igh be    a p r ob a bili ty  o uncertai nty,  or com plexity  a n d (eve m or e i m po rtantl y) ca us al it y si tuati on .   Ba ye sia n ne twork   consi st  of   two  par ts:   set   of   co ndit ion al   pr oba bili ty   d ist ribu ti ons  an directed  a cy cl ic   gr aph   DAG .   Ba ye sia netw orks,   eac node   represe nts  Var ia ble.  va riable  m igh be  discrete  or  m igh t   be  co ntinuo us.   Ba ye sNet  cl assifi er  one  of   the  data  cl assifi cat ion   te chni qu es  a pp li ed   in  m any  areas  of   pro ba bili ty   or  un ce rtai nty co nd it io ns   [ 13 ].   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  9 , N o.   5 Oct ober  20 19  :   3 5 8 4   -   3 5 9 0   3586   2.7 .     Na i veBa yes   NaiveBay es  cl assifi ers  is  a   c ollec ti on   of  al gorithm that  sh are   com m on  pri nciples   bas ed  on  B ay es   The or em In   NaïveBay es  cl assifi ers  each   pair  of   featu res  cl assifi ed  is  ind epe ndent   fr om   oth er  pairs .   NaïveBay es  cl assifi ers  is   one   of  the   data  cl assifi cat ion   te c hn i qu e us ed   i Weka  s of t w are  or  can   be   us e in   oth e area of   processi ng d at a u si ng d if fe re nt s of twa re  [1 4,  1 5 ].     2.8 .     Data  mi nin p rocess   The  data m ining  pro ce ss brea ks  in  m any sta ges.  T he  fir st st age it’s call ed  the integ rati on   sta ge  w hic is  colle ct   the  data  from   m an so urces  as  r aw  data  with  diff e re nt  form at The  sec ond  sta ge  it ’s  cal le data   cl eaning   i thi sta ge  after  r ecei vin t he  da ta   fr om   the  first  sta ge  so m of   the  data  are  incom patible   or   inco ns ist ency  and   oth e data   are  m issi ng   va lue  and   oth e r   data  are  il log ic al   entered S o,  it   the  data  clean in sta ge  will   cl ean  al these  data.  Th thir sta ge   of   data  m ining   it   is  to  colle ct   the  cl eaning  d at in  one  pla ce  cal l   Data  War e housi ng.  I the  da ta   war e housi ng  m os tl y,  the  data  rea dy  t be  us e a nd  a naly zed.   H owe ver,  the   a m ou nt  of  t he data  in data  w a reho us in is h uge size  of  data to d eal   wit it  an a naly ze th e w hole  dat a at on ce ,   for  this  reas on  nex sta ge  is  presente d.   The  f ourth  sta ge  is  t he  sel ect io st age,  w hich  is  t sel ect   the  rel evan data  f ro m   data  war e hous i ng  that  will   work  on  it T he  la st  sta ge  of  data  m ining   is  a pply ing   the   al gori thm an te chn iq ues  of  data  m ining   to   get  the  patte r n,   th at   the  us e lo ok i ng   f or .   The  ou tc om of   t he  a pp ly in data  m ining  tec hn i ques  will  b represente as  gra ph or ta ble or  ot her   form at  o f ou t pu re pr ese ntati on   [ 1 1 6 ].       3.   RELATE D  W ORKS    Ther a re  va riou relat ive  stud ie of   the  di ff ere nt  cl assif ic at ion   te chn i ques,  ye it   has  no bee disco ver e t ha on e   sin gle  m et ho is  sup erior  com par e to   ot her s I ssu es  li ke   acc ur acy t rainin tim e,   scal abili ty   and   m any  oth ers  c on t rib ute  to  ch oo si ng  the  best  te chn iq ue  t o   c la ssify  data  f or  m ining T he  s earc for  best  te ch ni qu for  cl assifi cat ion   rem ai ns   researc sub je ct Cl assifi cation   is  data  m ining   te c hn i que  us ed   to  predict   group  m e m ber sh ip   for  data  insta nces.  The re  ar nu m erous  tr aditi on al   cl assi ficat ion   m et hods   li k decisi on  tree  ( DT)   i nductio n,  k - near est   neighb or   cl assifi e r,   Ba ye sia ne t work s sup por vector   m achines,   ru le - base cl as sific at ion case - base reasoni ng,  ge netic   al gorithm fu zzy   l og ic   te c hn i qu e s,  r ough  set   ap proac and  oth er s.  Th basic   dif fer e nce  betwe e t he   al gorithm de pends   on  w he ther  t hey  are   l azy   le arn e rs  or  eage r   le arn er s [1 7 ]   pre dicti ve  KNIME  m od e was  de velo pe an t hr ee  da ta   m ining   al gorithm s;  the  N ve  Ba ye s,  PNN  P red ic to an Decisi on  T ree  w ere  t raine usi ng  70%  of  the   total   sam ples  wh ic h   wer r andom ly  sel ect ed.   T he  knowle dge  ac qu i red  f ro m   the  trai ning  w as  ap plied  i pr e dicti ng  the   ty pe  of  s uppl that  pro du ce t he  r e m ai nin 30%  of  the  m oto r   operati onal   data   sam ples.  The   pr e dicti ve  acc uracy   achie ved  i the  pap e is i nd ic at ive of t he  s uitabi li ty  o f data  m ining ap proac h f or  m oto r  p e rfor m ance m on it or i ng [1 8 ].   In   [ 8],  the  aut hor  points  out   about  Decisi on  Tree  ( DT or  J48,  that  ad va ntages  of   D T   are  easy   t o   unde rstan d,   ea sy  to  gen e rate  and   reduce  pro blem   capaci t y.  The  lim it a ti ons  of   DT  are:  R equ i r ed  se parat te st   set trai ning  t i m is  so   ex pensi ve,   does   no ha nd le   con ti nu ous  va riab le   an s uffer   from   ov er fitt ing .   The  a ppli cat ion s t hat f it  DT a re: Text Cat e gorizat io a nd Im age Cla ssific at ion .   In  [ 1 9 ] ,   MSS QL  2005  data base  was   util iz ed  t gathe thr oug s urve ys  or  I nter net   an t st or e   inf or m at ion   order e under  31  crit eria  in  f our  m ai gro up s   co ntains  total   of   100  stu de nts  rec ei ving   vo cat io nal  trai ning  in  var i ous  energy  app li cat ion   fiel ds who  are  al so   i the  process  of   vocat io nal  gu i dan ce .   This  pap e r   a pp li ed  al gorithm us e in   m any  cl assifi cat ion   t echn i qu e to   gro up   of  in div i du al w ho  are   in  the  process  of   vo c at ion al   guida nc and   c on cl uded  t hat  the  m os ap pro pr ia te   al go rithm   to  be  us e f or   st udie in  this  area  is  the  Naive  Ba ye al gorithm   der ived  fr om   s ta ti sti cal  est i m ation   m od el   that  is  cal le the  Ba ye s’  theo rem Since  us in m achine  le arn in (ML)   te chn iq ues  in  cl assifi cat ion   s tud ie res ults  in  accu rate  ou tc om e s   with  sign ific ant  savin in  te rm of   tim a nd   c os t,  it   is  re com m end ed  to   m ake  us of   t ho s al gorithm us ed   in d at a m ining  and m achine learn i ng tech niques  for  t he  s of t war e  to be  de ve lop e in  this  f ie ld.   In   [ 20 ] the   data  set   us ed  in  t hi researc is  the  trai ni ng   data  set   of   the  K DD   C up   2009  or a nge  sm all   data  set T he  data  set   c on ta i ns   190  nu m eri featu res  a nd   40  no m inal  featur es.   O ut  of  these   19 num eric  featur e s,  16  a re  em pty  and   132  are  s parse  with  highe than  90%  m issi ng   rate.  The  aut hors  use   four  cl assifi cat ion   t echn i gu e s,  J 48 Nai veBay es,  SV a nd  KNN.   The   aut hors   pointed pro pose feat ur e   se le ct ion   m et ho re so l ve the  real - world  CR cl assifi cat ion   pro bl e m with  no is and   hi gh ly   im balanced  data  set .   The  var io us   cl assifi ers  are  use f or   cl assi ficat ion As  re s ult,  the  S VM  ha highest  acc uracy   an sen sit ivit y,  Naïve Bay es  ha s h i gh est  R O C an S pecific it y .           Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       Perf orma nce e valu ation of  d if fe rent classif ic ation t ech niqu es  …  ( Fares  A bdulhafi dh  Dael )   3587   4.   BACKG ROU ND    4.1 .     WEKA   The  We ka  s oft war e   is  a   m achine - le ar ni ng  platf orm   fo r   ap plyi ng  m achine  le ar ni ng .   Wek a   is   abbre viati on   of  W ai kat En vi ronm ent  fo Kno wled ge  A naly sis  ( W E K A) T he  W e ka ’s  nam al so   r efers   to   nam of   bir in  Ne Zeal an d.   Wek is  m a chine  le ar ning  wh ic it colle ct ion   of  m achine  le ar ning  al gorithm and  sta ndar ds   for  processi ng   data  m ining I n   Wek a   the  al gorithm and   t echn i qu e ca be  a pp li ed   f rom   inp ut   file   su ch  as  E xc el   file s,  Java  form at  and   ot he rs  or  can  be  a pp li ed  directl fr om   the  so ft war it sel f.   A s   sh ows  in  Fig ure   1.   T he  Wek E xpl or e wi ndow  div ide i to  ta bs,  each   ta ha di ff e re nt  ta sk s.   Tab   cal ls   Pr e process:  Pe proce ss’s  f unct ion   is  to  l oad  dataset   f ro m   diff e re nt  sour ces  an m anipu la te   the  data  i nto   a   desire  f orm T ab  cal ls  Cl assify is  to  sel ec cl assifi er  to  process  the  da ta set   that  has  sel ect ed  in  pr e proce s s   sta ge.   Tab   c al ls  Cl us te r:  is  to  sel ect   a   cl ust er  to   proce ss   the  dataset   th at   has  sel ect ed   in  pr e proces sta ge.    Tab 4 call s A s so ci at e:  is to r un ass ociat ion  a lgorit hm s r ules to  extract i nsi gh ts  from  d at aset . Tab   cal ls Sel ect   Attrib utes:  it   t r un   at trib ute  sel ect ion   al gor it h m on   datas et   to  sel ect   tho se  at tribu te th at   are  relevan to  the  desire  featu re t o pr e dict. Ta b 6 call Visu al i ze:  is to  visu al i ze the  relat ion s hip   betwee at t rib utes [ 21 ].           Figure  1.  W e ka  interf a ce e xplorer       4.2   Datasets  inf or mat i on   Fo r   this  pa per,  th ree  data  se hav e   sel ect e d.   Eve ry  data  set   ha it own   cha racteri s ti cs  and  the   par am et ers  tha dif fer e ntiat it   from   oth er   two  data   set s.   The  T able  il lustrate   t he  differences   betwe en  eac of   t he  dataset .   The  dataset hav te ste one  by  on with   sam setting s   in  W e ka  s of t war for  al da ta set s.   Each  on of  da ta set has  te ste agai ns the  four   cl assi fiers The  outp ut  de te rm ines  by  the  pa ram et ers  of   t he   tim ta ken   to  bu il t he  m od el   of   the  datas et   and   the  pe r centage  of   acc ur acy   to  cl assi fy  the   ta rg et   da ta set s.  Each  dataset   ha s test ed fo ur ti m es f or the  four classi fiers .       Table  1.   Illustr at e the d i ff e rence s b et ween ea ch of  the  datas et   Na m e  of  datas ets/  Para m eters   Co n g ressio n al Vot in g  Reco rds   Car E v alu atio n   Co n trace p tiv e M et h o d  Ch o ice   Data Set   Ch arac te r istics   Multiv ariate   Multiv ariate   Multiv ariate   Attribu te Ch arac te ristics   Categ o rical   Categ o rical   Categ o rical   Ass o ciated Task s   Clas sif icatio n   Clas sif icatio n   Clas sif icatio n   Nu m b e o f  I n stan c es   435   1728   1473   Nu m b e o f  Attr ib u tes   16   6   9   Missin g   Valu es   Yes   No   No           Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  9 , N o.   5 Oct ober  20 19  :   3 5 8 4   -   3 5 9 0   3588   5.   RESU LT S  AND A N ALYSIS    com par iso of   eval uatio perform ance  of   cl assifi ers  for  diff e re nt  dataset based   on  the  accu rac y   of  each   cl assifi er  a nd  ti m ta k en  t bu il the  m od el Acc ur a cy   is  de fine a the num ber  of  insta nces   cl assifi ed   correct ly The  T able  s ummari ze  the  ou t put  o the  cl assifi cat ion   data  te chn i qu e for  the   three  dataset ba s e on   t he  ti m tak en  t buil t he   m od el It  is  ob s er ved   f or   t he  fir st  dataset   of   Ca Eval ua ti on   the  J 48  cl assifi er  giv the  best  r esult  of   the  ti m ta ken   to  bu il the  m od el In   the  sec ond  and   t he  thir dataset Con tr acepti ve   Me thod  Cho ic and   Co ngres sion al   V otin Re cords  res pe ct ively   sh ow NaiveBay es  cl assifi ers  gi ve  the  best   ou tc om e.  Ho wev e r,   the  M ulti la ye Percep tr on   cl assifi e is  the  lon ge s tim ta ken   to  bu il the   m od el   for  eac h datase t.       T able  2.  C om par iso n of t i m e t aken f or v a rio us cl assifi ers   Na m e  of  datas ets/  class if icatio n  techn iq u es   Co n g ressio n al  Vo tin g  Reco rds   Car  Evalu atio n   Co n trace p tiv Metho d  Ch o ice   BayesNet     0  Sec   0 .03  Sec   0 .03  Sec   Naiv eBayes   0  Sec   0 .03  Sec   0  Sec   Multilaye Pe rcept ron   0 .69  Sec   4 .49  Sec   3 .56  Sec   J4 8   0 .03  Sec   0 .01  Sec   0 .09  Sec       In   t he  T a ble  sh ow  t he  Com par is on  of  Acc ur acy   of  cl assifi ers  for  diff e r ent  dataset s.   From   F igu re  and  T a ble  It   is  obser ve t hat,  for  the   fir st  an the   sec ond  dataset   of  Ca E valuati on  a nd  Co ntrac eptive   Me thod  Ch oice  resp ect ively ,   the  Mult il ayer   Perce ptr on   cl assifi er  give   the  best  res ult  of   the  Ac cur ac y   com par to  othe cl assifi ers.   I the  third   dataset C on gressi on al   V otin Re cords  sho ws  J 48   cl assifi er  giv the   best  outc om of   acc ur a cy   to   cl assify ing   th instance.  H oweve r,   t he  Nai veBay es  cl assifi ers  wer t he  worst  ou tc om e o acc ur acy  t cl assif yi ng  the  insta nc e f or  eac h dat aset .       Table  3.  C om par iso n of t i m e t aken f or v a rio us cl assifi ers   Na m e  of  datas ets/  class if icatio n  techn iq u es   Co n g ressio n al  Vo tin g  Reco rds   Car  Evalu atio n   Co n trace p tiv Metho d  Ch o ice   BayesNet     9 0 .11 4 9  %   8 5 .70 6  %   5 1 .05 2 3  %   Naiv eBayes   9 0 .11 4 9 %   8 5 .53 2 4  %   5 0 .78 0 7  %   Multilaye Pe rcept ron   9 4 .71 2 6 %   9 9 .53 7  %   5 2 .34 2 2  %   J4 8   9 6 .32 1 8 %   9 2 .36 1 1  %   5 2 .13 8 5  %           Figure  2. G raphical  v ie w  of a ccur acy   for dif fer e nt classi fie rs on di ff e ren dataset s       6.   CONCL US I O N   This  pa per   s ho wed   t he  pe rform ance  evaluati on   of   dif fer e nt  data  cl assifi er te chn iq ues  on  dif fer e nt   dataset s.  It  f ou nd   t hat  the  out com of   the  da ta   te ste are  di ff e ren f r om   dataset   to  ano t he r.   T her a re  r easo ns   for  the d if fer e nt  o utput becaus e the d at aset s ch rem at ist ic s  are  diff er ent f r om  each  ano the r  d at aset .   Fact ors that   m ay   aff ect   the  cl ass ifie r’ perform ance  as  fo ll ow  1.  D at set 2.   N um ber   of   insta nce  an at trib utes,  3.   Com patibil i ty   of   t he  data  with  the   cl assifi er 4.  Ty pe  of   at tribu te s,   5.  Mi ssing  data  a nd   data  in structi ons,  6.  Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       Perf orma nce e valu ation of  d if fe rent classif ic ation t ech niqu es  …  ( Fares  A bdulhafi dh  Dael )   3589   Syst e m   con fig ur at io n.   Mult il ay er  Percep t ron  cl assifi er  shows   in  ov e rall   the  best  accuracy  perform a nce  t cl assify   the  i nst ances,   an NaiveBay es  cl assifi ers  were  the  w orst  ou tc om of   acc ur a cy   to  cl assify i ng  the   instance  f or   e ach  dataset .   F uture  wor m ay   fo cus  on   s pecific  dataset that  wo r king  in  har m on y   with   cl assif ie rs  sho uld   be  sel ect ed The  f ut ur w ork  m ay   fo cus   on   im pr ovin the  perf or m ance  of   eac cl as sifie rs   by an al yz in t heir  al gorithm s  and the  rules.       ACKN OWLE DGE MENTS   We  w ould  li ke   to  express  our   gr at it ude  to  Wek s oft ware   dev el op e rs  a nd  m ake  it   as  a ope source  so ft war without  it   ou w ork  would  be  m uc dif ficult   to  achieve  the  ou t com of   this  pap er W al so   woul li ke  to  t hank  t he   creato of  “C on t raceptive   M et hod  C ho ic e”  dataset Mr.   T je n - Sien  Lim   (li m t@st at .w isc .ed u)  and  the   D onor:   Tj e n - Sien   Li m   (li m t@st at . wisc.e du )   with   res pect  to   the   or i gin al   s ource   of  the   1987  N at ion al   Ind on esi Co nt raceptive  P re valence  S urve fo s har in the  dataset and   m akes  it   a vaila ble  for  ev eryo ne.   We  al so   woul li ke  to  tha nk  the  cr eat or   of   “C a Eval ua ti on   Data base s”   dataset Mr Ma rko  Bo ha nec  an d   the  D onors:  Ma rko  Bo ha ne (m ark o.b ohanec@i j s.si) and  Bl az  Zu pa ( blaz.z upa n@ i j s.si)   f or  sh ari ng   the d at aset an m akes it avai la ble for  e ve ryon e .       REFERE NCE S     [1]   Jiawe Han ,   Mi che l ine   Kam ber   and  Jian  Pe i ,   Data  Mini ng:  Conce pts  and  Techni ques,   3rd   edi t ion,   Morga Kaufm ann,   2011 .   [2]   Saouabi   Moham ed ,   Abdel la E z za t i ,   " dat m ini ng  proc ess  u sing  cl assificat i on  te chni qu es  for  emplo y ab il i t y   pre diction ,"   Ind onesian  Journal   of  E le c tric al   Engi ne ering  an Computer  Scienc e   ( IJE E C S ),   v ol.   14 ,   n o .   2 ,     pp.   1025 - 1029 ,   2019.   [3]   Akibu  Mahm ou Abdulla hi,   M okhai ri  Makht ar ,   Suhail an  Saf ie ,   " The   pat t ern of  ac c essing  le ar ning  m ana geme nt  s y stem  among  student s ,"   Indon e sian  J ournal  of   El e ct rica Eng in ee ring  and   Computer  Sc ie nc e   ( IJE ECS) ,   v ol .   13   no.   1 ,   pp 15 - 21 ,   2019.   [4]   Longa dge  R . ,   D ongre   S. ,   La t esh  Mali k ,   " Cl ass i m bal an ce   prob le m   in  data  m ini ng :   rev ie w , In te rna ti onal Journal  o f   Computer  Scien ce   and   Ne twork ( IJCSN ) ,   vol.   2,   no.   1 ,   Feb   2013 .     [5]   Alm oham m edi   Akram   A.,   Nor  K.  Noordin  and  Sabri  Saee d ,   " E val ua ti ng  th Im pac of   Tr ansm is sion  Range   on  t h e   Perform anc of  VA NET ,"   Inte rnational   Journal   of  El e ct rica and  Computer  Engi nee ring   ( IJE C E) ,   vol.   6 ,   no .   2 ,     pp.   800 - 809 ,   20 16 .   [6]   J abba W ahe A.,   e al .   "D esi gn  and  Im ple m ent at ion  o IoT - B ase Autom at io S y stem  for  Sm art   Hom e , 2018   Inte rnational   Sy mpos ium  on  Networ ks,   Compute rs   and  Comm unic ati ons ( ISNCC) ,   IE EE ,   2018 .   [7]   Alm oham m edi   Akram   A.,   et   al . ,   " An  ac cur ate  p erf orm anc ana l y sis  of   h y brid  ef fic i ent   and  r elia ble   MA protocol  in  VA NET  und er  non - satura t ed   condi ti ons ,"   Inte rnational   Jou rnal  of  El ec tri c al  and  Comput er  Engi nee rin g   ( IJE CE) ,   vol.  7 ,   no.   2 ,   pp 999 - 1 011 ,   2017 .   [8]   Mus ta kim  Mus ta kim,  Novia  Kum al a   Sari,  Jasril   Ja sril,   Ism Kus um ant o,   Nurul  G a y a tri  Inda R eza ,   " Ei g envalue   of   Anal y tic  Hier ar c h y   Proce ss   as  The   Dete rm ina nt  for  Cla ss   Ta rge on  Cla ss ifi cation   Algorit hm ,"   Indone sian  Journal  of  E le c tric al   En gine ering   and  C omputer  Scienc e   ( IJE ECS) ,   vol .   12,   n o .   3 ,   pp .   12 57 - 1264,   2018 .   [9]   Deulka M.  D.   S.  and   Deshmukh  R.   R. ,   " Da ta   Mining  Cl assific a ti on ,"   Imp erial   Journal  of   Inte rdisciplinar y   Re search vol .   2 ,   no.   4,   2016.   [10]   Kaur  G.,   Chh abr A. ,   " Im prove J48  cl assifi ca t io al gori thm  for  t he  pre di ction  of  dia be te s ,"   Int ern ati onal  Journal  of  Computer  Ap pli cations,   vo l.  98 ,   no .   22 ,   2014 .   [11]   Koturwar  Praful, Shee tal  Gira se   a nd  Deba j y ot Mukhopadh y a y ,   " A surve y   of cl assific a ti on  t ec hn i ques  in  the a r ea   of   big  da ta ,"   IJ AF R C,   v ol .   1 ,   no .   11 ,   Nov 2014 .   [12]   Gardne M.  W .   and   Dorling  S .   R. ,   " Artif icial  ne ura l   n et works   (t he  m ult ila y er   pe rce ptron)   r evie of  appl i cation s   in  th e at m ospheric   sc ie nc es ,"   At m ospheric  en vi ron ment vo l.  32 ,   no .   14 - 15 ,   pp .   262 7 - 2636,   1998 .   [13]   Vait hi y a nat h an  V.,   Rajesw ari   K. ,   Ta j ane   K.  and   Pita le   R . ,   " Com par ison  of  diffe r ent   class ifi c at ion   te chni qu es  using  diffe ren d at ase t s ,"   Inte rnatio nal   Journal  o f Adv a nce s in   Eng ine er ing  &   Technol ogy vo l.  6 ,   no.   2,   p p.   764 ,   2013 .   [14]   Sharm A.  and   Kaur  B. ,   " rese arc r evi ew  on  compara ti v e   ana l y sis  of  data  m ini ng  tool s,   te chni qu es  and   par amete rs ,"   Int ernat ional J ourn al  of   Adv an ce d   Re search in Co mputer  Scienc e vol.   8 ,   no .   7 ,   201 7.   [15]   Nur’A in  Maula t   Sam sudin,   Cik  Fere sa  bint M ohd  Fooz y ,   Na bil ah  Ali as,   Pal ani app an  Sham al a,   Nur  Fadzila Othm an,   W an  Isni  Sofiah  W an  Din ,   " Youtube  spam   det ec t ion  fra m ework  using  naï ve  ba y es  and  logi st ic   reg ression ,"   Indone sian  Journal  of  El ec tri cal   Engi ne ering  and  Computer  Sci enc e   ( IJE ECS) ,   vol.   14,   n o.   3,     pp.   1508 - 1517 ,   2019 .   [16]   Alal wan  S.   A.   D. ,   " Diab et i an aly tics:  Propos e conc ep tual  da t m ini ng  appr o a che in  t y pe  d ia be te da ta set ,"   Indone sian J our nal  of   Elec tric al   Engi ne ering  and   Computer  Sc ie n ce   ( IJEECS) .   v ol .   14 ,   no .   1 ,   p p 92 - 99,   2019 .   [17]   K .   Sara n y a ,   " Su rve y   on  Cl assifi ca t ion  T ec hniqu es  Us ed  in  Da ta  Mining  and   th e ir  Re ce nt   Advan ce m ent s ,   I JSE T R ,   vol.   3 ,   pp .   2380 - 2385,   2014 .   [18]   Adekit an  A .   I. ,   Adewal Ade y i nka  and   Al ashir Olaitan ,   " Determ ini ng  the   op e rat ion al   sta tus  o Thr ee   Phase  Induc ti on  Motor   using  pre di ctive  da ta   m ini ng   m odel ,   Inte rna ti onal  Journal  of  Powe Elec tronic and  Dr ive   Syste ms   ( IJP ED S) ,   v ol.   10 ,   no .   1 ,   pp 93 - 103 ,   20 19.   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  9 , N o.   5 Oct ober  20 19  :   3 5 8 4   -   3 5 9 0   3590   [19]   Bulbul   Hal il   Ibr ahi m   and  Özka Uns al ,   " Com par ison  of  c la ss if ic a ti on  t ec hn iqu es  used  in  m achine   l ea rn ing  as   appl i ed  on  voca t iona guida n ce   d at a ,"   2011  10th  Inte rnational   Co nfe renc on  Mac hine   Learning  and  Appl ic at ion s   and  Workshops ,   IEE E ,   2011 , v o l. 2.   [20]   Natc hi ar  S.  Um m ugult hum   and  S.  Baul kan i ,   " C ustom er  rel ation ship  m ana gement  class ifi cation  using  dat m ini n te chn ique s ,"   20 14  Inte rnationa Confe ren ce   o Sci en ce   Enginee ring  and  M anageme nt  R ese arch  ( ICSEMR ) ,     IEE E ,   2014 .   [21]   Jagta S.   B. ,   " C ensus  Data   m ining  and  d at a   anal y sis  using  W EK A ,"   Inte rnationa Confe ren ce  in  Eme rging  Tr ends  in  Sc ie nc e, Tec h nology   and   Man ageme nt - 2013 ,   S inga pore ,   2013 .       BIOGR AP H I ES   OF  A UTH ORS       As soc.   Prof.  Dr   Abdulkadi r   ÖZDEMIR,  Le ct ur e at   Atat urk  Univer sit y ,   Facu lty   of  Ec onom ic and   Adm ini strat ive  Scie nc es,   Dep ar tment  of  Man a gement  Inform a ti on  S y s te m s,  Turkey .   Area   of   rese arc h   intere st Com pute Hardware ,   Vir tua l izati on  and  Cloud   Com puti ng,   Co m pute Networks   and  Mana ge m ent ,   Dat aba se   Mana gement   Sy st ems ,   M ana gement  Inf orm at ion  S y ste m s.     htt ps:// ww w.ata uni. edu . tr/abdul kadi r - ozd emir ,   a bdulka dir@atau ni. edu . tr ,   /   +90   4 42  231  1961 .             Prof.  Dr  Uğur  Y AV UZ,   Lectu r er   at  Atat urk   Univ ersity ,   Facult y   o Ec onom ic and   Adm ini strat iv Scie nc es,   Depa r tment  of  Mana gement  Inform at i on  Sy st ems ,   Turkey .   Area   of  r ese arc in te r ests   Inform at ion  Te c hnologi es,   Mana gement  Scie nc e,  W eb  Design,   M ana gement  Infor m at ion  S y stems ,   Graphi D esign   and  Anim at ion ,   Artifi c ia l   Int el l i genc e .   h ttp ://www.ataun i.edu .tr /# p erso n el=u g u r - y av u z u g u r@ atau n i.edu .tr  /  +9 0  44 2  23 1  5752 .            Fare Abdulhaf idh  Dae l ,   PhD   ca ndid at e   at   Atat urk  Univer sit y ,   Facu lty   of   Ec onom ic an Adm ini strat ive   Scie nc es,   Depa r tment  of  Mana gement  Inform at i on  Sy st ems ,   m aste r’s  degr ee   in  comm unic at ion  and  computer   E ngine er ing  from   UK Univer sity ,   Mal a y s ia .   Ba c hel or’s  degr ee   i comm unic at ion   engi n ee ring   f rom   IIUM   un ive rsit y   Ma lay si a.   Ar ea   of   re sea rch   int e rests  Mana gement  In form at ion  S y st ems ,   Artifi cial   int ellige n ce,  Radi comm unic a ti ons  W ire less   comm unic at ion,  Data   Ne twork  a nd  Com pute r. fa resa la r iqi @gm ail. com       Evaluation Warning : The document was created with Spire.PDF for Python.