I nd o ne s ia n J o urna l o f   E lect rica l En g ineering   a nd   Co m p u t er   Science   Vo l.   1 2 ,   No .   1 Octo b er   201 8 ,   p p .   4 0 6 ~ 4 1 1   I SS N:  2502 - 4752 ,   DOI : 1 0 . 1 1 5 9 1 / i j ee cs . v 1 2 .i 1 . p p 406 - 4 1 1           406       J o ur na l ho m ep a g e h ttp : //ia e s co r e. co m/jo u r n a ls /in d ex . p h p / ijeec s   Co m pa ra tive  Ana ly sis  f o r To pic Cl a ss ificatio   in Ju z  Al - Ba qa ra h       M o ha m a d Izzu dd i n Ra h m a n,  No o Aza h Sa m s ud in ,   Ai d a   M us t a ph a ,   Adelek A bd u ll a hi   F a c u lt y   o f   Co m p u ter S c ien c e   a n d   In f o rm a ti o n   T e c h n o l o g y Un iv e rs it T u n   Hu ss e in   On n   M a lay sia ,   8 6 4 0 0   P a rit   Ra ja,  Ba t u   P a h a t ,   Jo h o r,   M a lay sia       Art icle  I nfo     AB ST RAC T   A r ticle  his to r y:   R ec eiv ed   Ma y   1 ,   2 0 1 8   R ev i s ed   J u l 1 0 ,   2 0 1 8   A cc ep ted   Ju l 2 5 ,   2 0 1 8     In   Isla m ,   Qu ra n   is  th e   h o ly   b o o k   th a w a s   r e v e a led   to   th e   P ro p h e t   M u h a m m a d .   It  f u n c ti o n a c o m p lete   c o d e   o f   li f e   f o th e   M u sli m s.  Re m a r k s   f ro m   A ll a h   w h ich   c o n tain m o re   th a n   7 7 , 0 0 0   w o rd th a w a p a ss e d   d o w n   th ro u g h   P ro p h e M u h a m m a d   to   th e   m a n k in d   f o 2 3   y e a rs   sta rted   in   6 1 0   c e .   T h e   Qu ra n   w a d i v id e d   in t o   1 1 4   c h a p ters .   A ra b ic  lan g u a g e   is  th e   o rig in a l   tex t.   T h e   n e e d   f o th e   M u sli m s   a c ro ss   th e   w o rld   to   f in d   th e   m e a n in g   to   u n d e rsta n d   th e   c o n ten in   t h e   Qu ra n   is  n e c e ss a r y .   Ne v e rth e les s,   u n d e rsta n d i n g   th e   Q u ra n   is   a n   in tere st  f o t h e   M u slim a w e ll   a th e   a tt e n ti o n   o f   m il li o n s o f   p e o p le f ro m   th e   f a it h s.    F o ll o w in g   th e   g e n e r a ti o n ,   l o ts  o f   c o n ten t   th a t   re late d   t o   t h e   Qu r a n   h a b e e n   b ro a d c a st  b y   M u sli m sc h o lars   in   th e   w a y   o f   th e   ta f sirs,  tr a n sla ti o n   a n d   th e   b o o k   o f   h a d it h s.  P r o b lem   h a s   h a p p e n e d   a c u rre n is  m o st  M u sl im   in   M a la y sia   d o   n o u n d e rsta n d   se n ten c e in   t h e   Qu ra n   d u e   t o   lan g u a g e   b a rrier.  T h e   p u r p o se   o f   th is  re se a rc h   is   c las si f ied   to p ic  in   e a c h   v e rse s   o f   th e   Qu ra n   se n ten c e   b a se d   o n   i ts  sp e c i f ic   th e m e .   It  in v o lv e th e   o b jec ti v e   o f   te x m in in g   w h ic h   a re   b a se d   o n   li n g u isti c   in f o rm a ti o n   a n d   d o m a in .   T h e   u sa g e   o f   c o rp u h e lp s   to   p e rf o rm   v a rio u d a ta   m in in g   tas k in c lu d in g   in f o rm a ti o n   e x trac ti o n ,   tex c a teg o riz a ti o n ,   t h e   re latio n sh i p   o f   c o n c e p ts,   a ss o c iat io n   d isc o v e ry ,   th e   e v a lu a ti o n   o f   p a tt e rn   a n d   a ss e s s e d .   T h is  re se a rc h   p ro jec is  a i m in g   to   c re a te   c o m p u ti n g   e n v iro n m e n th a e n a b le  u u se   to   tex m in in g   th e   Qu ra n .   T h e   c las sif ica ti o n   e x p e rime n is   u sin g   th e   S u p p o rt   V e c to r   M a c h in e   to   f in d   th e m e in   Ju z ‟  Ba q a ra h .   T h e   S V M   p e rf o r m a n c e   is  th e n   c o m p a re d   a g a in st   o t h e c las sif ica ti o n   a lg o rit h m su c h   a Na iv e   Ba y e s,  J4 8   De c isio n   T re e   a n d   K - Ne a re st  Ne i g h b o u rs.  T h i re se a rc h   p ro jec a im a c re a ti n g   a n   e n a b li n g   c o m p u tati o n a e n v ir o n m e n f o tex t   m in in g   th e   Qu r‟a n   a n d   t o   f a c il it a te  u se rs  to   u n d e rsta n d   e v e r y   v e rse   in   J u z ‟  Ba q a ra h .   K ey w o r d s :   Qu r an   Ver s C las s i f icatio n   T ex t M in in g   Co p y rig h ©   2 0 1 8   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e   Al rig h ts  re se rv e d .   C o r r e s p o nd ing   A uth o r :   No o r   A za h   Sa m s u d i n   Facu lt y   o f   C o m p u ter   Scien ce   an d   I n f o r m atio n   T ec h n o lo g y ,   Un i v er s iti T u n   H u s s ei n   On n   Ma la y s ia ,   8 6 4 0 0   P a r it R aj a,   B atu   P ah at,   J o h o r ,   Ma lay s ia .   E m ail:  az a h @ u t h m . ed u . m y       1.   I NT RO D UCT I O N   Al - Q u r an   [ 1 ]   w as  p as s ed   d o w n   f o r   2 3   y ea r s   in   6 1 0   ce ,   w h e n   P r o p h et  Mu h a m m ad   w as   at   th a g o f   40.   First  s en te n ce   w as  p as s ed   d o w n   i n   Mecca   cit y .   P r o p h et  Mu h a m m ad   b eg i n   to   s p r ea d   th ese  h o l y   v er s e s   s ec r etl y   a n d   t h e n   o p en l y .   A l - Qu r an   th e m e   o f   h o l y   v er s es  is   e m p h asi s   i n   d o ctr in o f   m o n o th eis m   w h ic h   o n l y   w o r s h ip   to   A lla h   an d   f i g h t a g a in s t p o l y th e is tic  b elie f   i n   Me c ca   p eo p le.   T h er ef o r e,   m a n y   a m o n g   Me cc p eo p le  at  th at   ti m o p p o s in g   t h n e w   r eli g io n   a n d   g r ad u al l y   h i s   f o llo w er   i n cr ea s e.   P r o p h et  Mu h a m m ad   m is s io n   co n tin u ed   f u r th er   f o r   1 3   y ea r s   in   Me cc a.     Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       C o mp a r a tive  A n a lysi s   fo r   To p ic  C la s s i fica tio n   in   Ju z   A l - B a q a r a h   ( Mo h a ma d   I z z u d d in   R a h ma n )   407   Af ter   P r o p h et  Mu h a m m ad   d ie s ,   A l - Qu r a n ,   A l - S u n n a h   a n d   o ld   b o o k   I s la m ic  h as  b ec o m e   t h s o u r ce   fo r   th e   I s la m   f o llo w er   to   m ak s o u r ce   o f   k n o w led g e,   w is d o m   a n d   la w .     T h c h alle n g f o r   C o m p u ter   Scie n ce   is   w a y   to   e x tr ac an d   r ep r esen k n o w led g e,   w is d o m   a n d   la in   co m p u ter   s y s te m   w h ic h   ar th s m ar s y s te m   th at  ca n   a n s w er   t h v ar io u s   q u esti o n s   b ased   o n   k n o w le d g f r o m   A Q u r an   a n d   als o   A Su n n ah .   T h i s   ap p licatio n   w ill  h elp   th s o cie t y   eit h er   th e   Mu s li m   o r   n o t,  to   u n d er s ta n d   an d   g r o w   th lo v e   f o r   th r eli g io n   o f   I s la m .   T ec h n ical l y ,   t h is   p r o j ec is   to   u n d er s tan d   h o w   t h n e w   tec h n iq u in   m i n i n g   tex ca n   ex tr ac t   I s la m   k n o w led g f r o m   th e   s o u r ce   a n d   r ep r esen t t h is   k n o w led g e.   C an   h elp   s o ciet y ,   b o t h   M u s l i m   an d   n o n - Mu s li m ,   to   u n d er s ta n d   an d   ap p r ec iate  th I s la m ic  r eli g io n .     W b eliev ed   th at  A l - Q u r an   b th o n l y   h o l y   d o cu m e n in   h is to r y   to   p r eser v its   co n te n t ,   s tr u ctu r e,   w o r d s ,   p o in t s ,   a n d   ac ce n t s   c o n s er v ati v el y .   M u s li m s   ac r o s s   t h g lo b e,   r eg ar d less   o f   th e ir   n ati v lan g u ag e ,   s h o u ld   r ec ite  th Qu r a n   in   A r ab ic,   in cl u d in g   d u r i n g   p r a y er s .   T h is   asp ec is   ex tr e m e l y   i m p o r tan w h e n   an al y z in g   t h Q u r an ,   a s   t h s e o f   w o r d s   i n   Q u r an   is   f i x ed   a n d   w id el y   m e m o r ized .   E ac h   v er s in   th c h ap ter s   o f   th Q u r a n   h a s   s i g n if ica n m ea n i n g .   Hen ce ,   t h m as s iv n u m b er   o f   Q u r a n   in ter p r etatio n   b o o k s   an d   s tu d ie s .   A ll  t h ese  f ea t u r es  m a k A l - Q u r an   a s   te m p t in g   tar g e to   co m p u tes   th tex ad d itio n   w h ic h   is   to   ai m   to   lo o k   f o r   n e w   i n f o r m atio n   f r o m   A l - Qu r a n   i n   ter m s   o f   r e latio n s h ip ,   p atter n ,   co in cid e n ce ,   ass o ciatio n   a n d   h id d en   tr en d .   C o m p ar ed   to   o th er   tex t u al  d at a,   th er ar f e w   r esear ch   s t u d ies in   Q u r an ic  v er s cla s s i f ic atio n   b ased   o n   th tr an s latio n   o f   E n g li s h   [ 2 ] [ 3 ] .   Sev er al  s tu d ies  f o cu s e d   o n   A l - Q u r an   v er s clas s i f y i n g   i n   A r ab ic  [ 4 ] - [ 6 ] .   J am i et   al.   [ 7 ]   p r o p o s ed   th u s e   o f   ter m   f r eq u e n c y   i n   s u b ject  id en ti f icat io n   in   o r d er   to   class i f y   te x g r o u p s   in to   ce r tai n   s u b j ec t.  T h eir   d at aset  f o r   th e x p er i m e n co n s i s ted   o f   2 8 6   A l - Q u r an   v er s e   an d   th v er s co n ta in s   1 6   k e y w o r d s .   L ab el  th at   ar p r ep ar ed   f o r   class i f y   v er s c h o s en   i s   I ma n ,   I b a d a h   an d   A kh la k .   T h p er f o r m an ce   m etr ics  u s ed   in cl u d ed   th r a n k in g   s co r an d   clas s i f icatio n   ac cu r ac y   o f   th e   v er s e s   id en ti f i ed   as  s u b j ec in   th e   Al - B aq ar ah   ch ap ter .   T h is   r esear ch   f o c u s e s   o n   A l - Q u r an   w eb   p o r tal  ch ec k i n g   a n d   f o r ec ast b y   u s i n g   d ata  m i n i n g   ap p r o ac h .   T h d ataset  u s ed   is   s o u r ce d   f r o m   th W eb   A le x a ' s   co m p a n y   o f   Am az o n . co m ,   w h ic h   p r o v i d es  an al y s i s   to   all  w eb s i tes.  T h o b j ec tiv f o r   th s tu d y   is   to   s ee   ac ce s s   p atter n   o f   s o m w eb s ite  t h at  u s d at m i n i n g   to o b ased   o n   class i f icat io n .   T o   ca r r y   o u t h i s   tas k ,   1 0 0 0   Qu r an   v er s f r o m   d atab ase  wer d iv id ed   in to   t w o   s ets  o f   tr ain i n g   a n d   test i n g   d ataset,   r esp ec ti v el y .   T h tr ain in g   s et  co n s is t s   o f   8 0 0   s en ten ce s   an d   th te s ti n g   s et  co n s i s ts   o f   2 8 6   s en te n ce s .   T h r ee   class e s   w er ch o s e n   ( I m an ,   I b ad ah ,   A k h lak )   af ter   tr an s f o r m i n g   f r o m   A r ab ic  to   Ma la y   lan g u a g e.   R es u lt s   ar e v al u at ed   b ased   o n   P r ec is io n   a n d   R ec all  m etr ics   w it h   S u p p o r v ec to r   m ac h in e   t h e   h ig h e s t r ec all  v al u o f   8 6 % a n d   Naïv B a y es  h as t h lo w e s r ec all  v alu o f   7 1 %.       2.   RE S E ARCH   M E T H O D   C R I SP - DM   r ef er s   to   cr o s s   p r o ce s s   i n d u s tr y   f o r   d ata  m i n i n g .   C R I SP - DM   m et h o d o lo g y   [ 1 7 ]   p r o v id es  s tr u ct u r ap p r o ac h   to   p lan   p r o j ec esp ec ially   d a ta  m in i n g .   I is   m et h o d o lo g y   t h at  r i g h an d   s u itab le.   I h as   th s tr en g t h   t h at   is   d is ti n cti v e,   f le x ib ilit y   a n d   u s ed   to   an al y s e s   to   r e s o lv e   is s u e s   t h at   co m p licated .   T h e   Fo llo w i n g   is   C R I SP - D m o d el  s a m p le  s h o w n   i n   F ig u r 1 .           Fig u r 1 .   C R I SP - DM   m et h o d o lo g y       Fig u r 2   s h o w s   t h o r d er   o f   in cid en th at  i s   id ea l.  I n   m o s ta s k s   it  ca n   b d o n in   v ar io u s   a r r ay s   th a t   ar d if f er e n a n d   n ee d ed   to   g o   to   tas k s   p r ed ec ess o r   an d   r ep ea th e   ac tio n .   T h i s   m o d el   w ill   n o b lo ck   a n y   r o u te   w il l th r o u g h   p r o ce s s   d ata  m i n i n g .     T h class if icatio n   m et h o d o lo g y   i n   Fi g u r 2   w ill   b eg i n   w it h   co llectio n   o f   Q u r an ic   v er s e s   f r o m   t h e   s u r a h   A l - B aq ar ah   in   t h Qu r a n .   Nex t,  t h tr an s latio n   f o r   t h e   v er s es  ar p r ep ar ed   f o r   tex p r o ce s s in g   i n clu d i n g   to k en izat io n ,   s te m m i n g ,   an d   p ar t - of - sp ee ch   tag g i n g .   Ne x t,   th v er s es  ar cla s s f ied   i n to   th r ee   ca te g o r ies  o r   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l 1 2 ,   No .   1 Octo b er   201 8     4 0 6     411   408   class   lab els,  w h ic h   ar ' I m an '   ( f aith ) ,   ' I b ad ah '   ( w o r s h ip ) ,   an d   'A k h la k '   ( v ir t u es).   T h class if icatio n   alg o r it h m s   u s ed   ar Naiv B a y e s ,   K - Nea r est Ne ig h b o r ,   Dec is io n   T r ee   J 4 8 ,   an d   Su p p o r t   Vec to r   Ma ch i n ( SVM) .     2 . 1   Da t a s et   T h d ataset  co n s is t s   o f   2 8 6   v er s es  f r o m   c h ap ter   t w o   Su r a h   al - B aq ar ah   o f   t h Ho l y   Q u r a n .   Data s et  tak en   f r o m   t h is   i s   tr an s lati o n   f r o m   A l - Q u r an   cla s s ical   b y   A b d u lla h   Y u s u f   Ali.  I ac h iev ed   f r o m   www . q u r an d atab s e. o r g   w eb s it e.   C u r r en tl y ,   t h er is   n o   d atase t A l - Q u r an   f o r   m ac h in lear n i n g .           Fig u r 2 .   T h p r o p o s ed   g r o u p - b ased   class if icatio n   al g o r ith m .       2 . 2   E v a lua t io n M e t ric   T h o b j ec tiv o f   th s t u d y   is   t o   d is tin g u i s h   i n f lu e n ce   al g o r ith m   cla s s i f icat io n   t h at  w h er s ig n if ican t   in   cla s s i f icatio n   p r o ce s s .   C las s if icatio n   e x p er i m e n t t h at  w a s   ca r r ied   o u t is to   m ea s u r ac c u r ac y   a n d   ar ea   u n d er   r ec ip ien t o p er atio n   ch ar ac ter is tic  cu r v ( A U C )   w h ic h   e x ce ed ed   alg o r ith m   in   cla s s i f icatio n   [ 8 ] .     2 . 1 . 1   Cla s s if ica t io n Ac cura cy   C las s i f icatio n   ac cu r ac y   s h o wn   i s   p er ce n ta g o r   p r o p o r tio n   f r o m   f o r ec ast   th a h a v b ee n   class i f ied .   T h ac cu r ac y   ca n   b ca lcu late d   w it h   th f o r m u la  as s h o w n   i n   E q u atio n   1 .     ac cu r ac y                                             ( 1 )     w h e n   t h T P   is   p o s itiv e   tr u e,   i co u ld   b ca te g o r ized   as  p o s it iv e,   w h ile  if   th e   T is   n eg at iv T r u e,   it  co u ld   b e   ca teg o r ized   co r r ec as  n eg ati v e.   FP   is   p o s itiv f al s e,   it  ca n n o b ca teg o r ized   as  p o s itiv e,   f o r   FN  is   n eg at iv e   f alse,  it c ate g o r ized   f alse  w i ll  b s ep ar ated   as n eg ati v e.     2 . 1 . 2   Are a   un der  ( RO C)   curv ( AUC)   R OC   h as  b e s p er f o r m a n ce   f o r   th class i f icat io n   p r o b le m .   R o v al u s h o w s   t h o v er all   r esu lt  f o r   class i f icatio n   p er f o r m a n ce .   T h is   p er f o r m an ce   s h o w   th at  m etr ic  ev al u ati n g   cla s s i f icat io n   p er f o r m a n ce .   T h is   v alu co u ld   b s ee n   b et w ee n   0   an d   1 ,   w h er R OC   =1   eq u i v alen to   class if ica tio n   t h at  r i g h t,  w h ile  R O C =0 . 5   co n s id er ed   in   b et w ee n   o f   ac c u r ate  an d   n o ac cu r ate  a n d   R O C =0   s u itab le  class if y   b y   o v er t u r n ed   clas s i f icatio n .   I f   R O C   v al u i n cli n ed   to w ar d s   1 ,   th is   m ea n   t h alg o r it h m   cla s s i f icatio n   is   r ig h t a n d   co r r ec t.     2 . 1 . 3   C la s s if ica t io n Alg o rit h m   T h co m p ar ativ e x p er i m e n ts   in   th is   r esear ch   u s ed   f o u r   alg o r ith m s ,   w h ich   ar Nai v B a y e s ,   J 4 8   an d   K - Nea r est Ne ig h b o r   ap ar t f r o m   th p r o p o s ed   Su p p o r t V ec to r   Ma ch in e.   a)   Naïv B a y es   Naïv B a y e s   m eth o d   is   o n o f   th s ets  a lg o r it h m   lear n i n g   tak e n   b ased   o n   u s a g f r o m   t h eo r y   t h at  g iv e n   b y   B a y e s '   th eo r e m   n a m b y   i m p l y i n g   n v e‟   i n d ep en d en ce   to   ev er y   f ea t u r e.   Giv e n   b y   clas s   v ar iab le  an d   v ec to r   f ea t u r d ep en d   o n   x 1 ,   b ay e s   th eo r e m   s h o w s   t h r elatio n s h ip   as s h o w n   i n   E q u ati o n   2 ,   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       C o mp a r a tive  A n a lysi s   fo r   To p ic  C la s s i fica tio n   in   Ju z   A l - B a q a r a h   ( Mo h a ma d   I z z u d d in   R a h ma n )   409     (   |               )       (   )   (               |   )   (               )               ( 2 )     u s i n g   th i s   n v i n d ep en d en ce   ass u m p tio n   in   E q u a tio n   3   f o r   all  i.       (     |                                               (     |   )               ( 3 )     T h s i m p li f ied   r elatio n s h ip   is   s h o w n   a s   E q u atio n   4 .       (   |               )       (   )   (     |   )           (               )               ( 4 )     Sin ce   th e   p r o b ab ilit y   o f   x 1   t h r o u g h   x n   i s   co n s ta n g i v en   th in p u t,  w ca n   u s t h e   f o llo w i n g   class i f icatio n   r u le  i n   E q u atio n   5 .       (   |               )       (   )   (     |   )             ̂                (   )   (     |   )             ( 5 )     Naiv B a y es  lear n er s   an d   cla s s if ier s   ca n   b e x tr e m el y   f ast  c o m p ar ed   to   m o r s o p h i s ticate d   m et h o d s .   T h d ec o u p lin g   o f   th cla s s   co n d itio n al  f ea t u r d is tr ib u tio n s   m ea n s   th a ea ch   d is tr ib u tio n   ca n   b e   in d ep en d en tl y   esti m ated   as  o n e - d i m en s io n al  d is tr ib u tio n .   T h is   in   tu r n   h elp s   to   allev iate  p r o b lem s   s te m m i n g   f r o m   t h cu r s o f   d i m e n s io n ali t y .   b)   Dec is io n   T r ee   J 4 8   A   d ec is io n   tr ee   ( C 4 . 5   alg o r it h m )   i s   an   a lg o r it h m   th at  u s e s   tr ee - li k s tr u ct u r to   r ep r esen t h f ea t u r es/attrib u tes  as  w ell  as  t h clas s   lab els.  I n   W e k a,   th C 4 . 5   alg o r ith m   is   ca lled   J 4 8   [ 1 2 ] .   C 4 . 5   h as  s ev er al   p ar am eter s ,   b y   th d e f au l t v i s u aliza tio n   ( w h e n   y o u   in v o k t h clas s if ier )   o n l y   s h o w s   C .   C   is   C o n f id e n ce   v al u e   ( d ef au lt   2 5 %):  lo w er   v al u es  in cu r   h ea v ier   p r u n in g .   T h en   M   i s   Mi n i m u m   n u m b er   o f   i n s ta n c es  i n   t h e   t w o   m o s t   p o p u lar   b r an ch es ( d ef au l t 2 ) .   T h ex p er im e n u s e s   all  th d e f au lt p ar a m eter   s etti n g s   f o r   th i s   class i f ier .   c)   Su p p o r t V ec to r   Ma ch in e   Su p p o r Vec to r   Ma ch in ( SV M)   [ 1 3 ]   is   s u p er v i s ed   m ac h i n lear n i n g   alg o r it h m   th at  i s   w ell - k n o w n   f o r   b o th   class if icatio n   o r   r eg r ess io n   p r o b le m s .   T h SVM  alg o r ith m   w ill  p lo ea ch   d ata  ite m   o r   in s tan ce   as  a   p o in i n   a n   n - d i m e n s io n al  s p ac w h er n   is   n u m b er   o f   f ea t u r es  w it h   t h v al u o f   ea c h   f ea t u r b ein g   th e   v a lu e   o f   p ar ticu lar   co o r d in ate.   Nex t,  th alg o r it h m   p er f o r m s   class i f icatio n   b y   f i n d in g   th h y p er - p lan th a t   s ep ar ates th t w o   clas s es a s   s h o w n   in   F ig u r 3 .       Fig u r 3 .   SVM  H y p er p lan e       d)   K - n ea r est n e ig h b o r s   class i f ier   n ea r est  n eig h b o r s   is   s i m p le  alg o r ith m   th a s to r es  all  av ailab le  ca s es  a n d   clas s i f ies   n e w   ca s e s   b ased   o n   s i m ilar it y   m ea s u r e.   KNN  h as  b ee n   u s ed   in   s tatis ti ca esti m a tio n   a n d   p atter n   r ec o g n itio n   alr ea d y   in   th b eg i n n i n g   o f   1 9 7 0 s   as  n o n - p ar a m etr ic  tech n iq u e.   W h en   KNN  is   u s ed   f o r   class i f icat io n ,   th o u tp u ca n   b ca lcu lated   as  th class   w i t h   th h ig h es f r eq u e n c y .   E ac h   in s ta n ce   in   es s e n ce   v o tes  f o r   th eir   class   an d   t h class   w it h   t h m o s t v o tes a n d   it tak en   a s   th p r ed ictio n .   C las s   p r o b ab ilit ies  ca n   b ca lcu lated   as  t h n o r m a lized   f r e q u en c y   o f   s a m p les  t h at  b elo n g   to   ea ch   class   i n   th s et  o f   m o s s i m ilar   in s ta n ce s   f o r   n e w   d ata  i n s ta n ce .   Fo r   ex a m p le  in   E q u a tio n   6 ,   in   b in ar y   class i f icatio n   p r o b lem   ( clas s   i s   0   o r   1 ) .     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l 1 2 ,   No .   1 Octo b er   201 8     4 0 6     411   410   p   clas s     )   c ount  c las s       c ou n c las s         c ou n c las s                   ( 6 )       3.   RE SU L T A ND  AN AL Y SI S   T h is   p ar p r esen ts   r esu lt s   o f   th r esear ch   w o r k   w i th   f o u r   clas s if ica tio n s   alg o r it h m s ,   w h ic h   ar Naïv e   B ay e s ,   J 4 8 ,   SVM,   an d   k - NN.   T h r esu lts   ar p r esen ted   in   te r m s   o f   clas s i ca t io n   ac cu r ac y   an d   A U C .   T ab les  1   to   5   s h o w   t h co m p ar ativ r es u lts   i n   ter m s   o f   ac c u r ac y .       T ab le   1 .   R esu lts   f o r   Naïv B ay es  C las s if ier   C l a ss   P r e c i si o n   R e c a l l   F - M e a su r e   R O C   A r e a   I man   0 . 8 3 9   0 . 8 9 7   0 . 8 6 7   0 . 8 3 7   I b a d a h   0 . 4 1 7   0 . 3 7 5   0 . 3 9 5   0 . 7 5 6   A k h l a k   0 . 5 3 1   0 . 4 0 5   0 . 4 5 9   0 . 8 2 8   W e i g h t e d   A v g   0 . 7 3 5   0 . 7 5 2   0 . 7 4 1   0 . 8 2 4       T ab le   2 .   R esu lts   f o r   J 4 8   C lass if ier   C l a ss   P r e c i si o n   R e c a l l   F - M e a su r e   R O C   A r e a   I man   0 . 7 8 0   0 . 9 0 2   0 . 8 3 6   0 . 6 2 1   I b a d a h   0 . 2 6 1   0 . 1 5 0   0 . 1 9 0   0 . 4 8 3   A k h l a k   0 . 4 0 7   0 . 2 6 2   0 . 3 1 9   0 . 6 6 4   W e i g h t e d   A v g   0 . 6 5 2   0 . 7 0 3   0 . 6 7 0   0 . 6 0 8       T ab le   3 .   R esu lts   f o r   SVM  C la s s i f ier   C l a ss   P r e c i si o n   R e c a l l   F - M e a su r e   R O C   A r e a   I man   0 . 8 2 7   0 . 9 3 6   0 . 8 7 8   0 . 7 3 0   I b a d a h   0 . 7 0 8   0 . 4 2 5   0 . 5 3 2   0 . 7 0 8   A k h l a k   0 . 6 1 3   0 . 4 5 2   0 . 5 2 1   0 . 7 8 5   W e i g h t e d   A v g   0 . 7 7 9   0 . 7 9 4   0 . 7 7 7   0 . 7 3 5       T ab le   4 .   R esu lts   f o r   K - NN  C l ass i f ier   C l a ss   P r e c i si o n   R e c a l l   F - M e a su r e   R O C   A r e a   I man   0 . 8 0 0   0 . 8 2 4   0 . 8 1 2   0 . 6 5 5   I b a d a h   0 . 3 5 6   0 . 4 0 0   0 . 3 7 6   0 . 6 3 0   A k h l a k   0 . 3 8 7   0 . 2 8 6   0 . 3 2 9   0 . 5 9 2   W e i g h t e d   A v g   0 . 6 7 7   0 . 6 8 5   0 . 6 8 0   0 . 6 4 2       T ab le  5 .   C o m p ar ativ r es u lt s   f o r   all  class if ica tio n   al g o r ith m s   A l g o r i t h m   P r e c i si o n   R e c a l l   F - M e a su r e   R O C   A r e a   N a ï v e   B a y e s   0 . 7 3 5   0 . 8 9 7   0 . 7 4 1   0 . 8 2 4   J4 8   0 . 6 5 3   0 . 7 0 3   0 . 6 7 0   0 . 6 0 8   S V M   0 . 7 7 9   0 . 7 9 4   0 . 7 7 7   0 . 7 3 5   K - NN   0 . 6 7 7   0 . 6 8 5   0 . 6 8 0   0 . 6 4 2       B ased   o n   th ex p er i m e n tal  r esu lt s ,   th p r o p o s ed   alg o r ith m   ac h iev ed   class if icatio n   ac cu r ac y   ab o v e   8 5 u s in g   th t w o   class i f icat i o n   alg o r ith m s S VM   an d   J 4 8   class i er s .   No n eth e less ,   r elativ el y   lo w   ac cu r ac y   r esu lt  w a s   ac h ie v ed   w h e n   u s i n g   th Naï v B a y e s   an d   th K - NN  class i fier s .         4.   CO NCLU SI O N S   C las s i f y n g   Al - Qu r a n   s en ten ce   in to   ca teg o r y   t h at  h ad   b ee n   g i v en   i s   i m p o r tan ta s k   i n   al - Q u r an   s tu d y .   I n   th i s   p r o j ec t,  w d is p la y   al g o r ith m   cla s s i f icat io n   to   lab el  Qu r an   v er s e s   b y   au to m atic  to   co n n ec s en te n ce s   w it h   th r ee   f u n d a m e n tal   asp ec t s   i n   I s la m   n a m el y   I m an ,   ' r eli g io u s   w o r s h ip     r elig io u s   w o r s h ip   ' ,   an d   Ak h lak .   Data s et  co n s is ti n g   o f   2 8 6   s en te n ce s   f r o m   A l - B aq ar ah ' s   s u r a h ,   h ad   d en o r m ali za tio n   b y   u s i n g   Strin g T o W o r d Vec to r   in   W E KA  w it h   I D F - T m et h o d .   Fo u r   d if f er e n al g o r ith m   th a w as   ch o s e n   f o r   class i f icat io n   th at  u s u al  a n d   s u b s et  s elec tio n   ap p r o ac h   h as b e en   u s ed   to   ai m   ex p er i m en t i n   c lass i f icatio n   tas k .     Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       C o mp a r a tive  A n a lysi s   fo r   To p ic  C la s s i fica tio n   in   Ju z   A l - B a q a r a h   ( Mo h a ma d   I z z u d d in   R a h ma n )   411   I n   co n cl u s io n ,   Naï v B a y es,  Su p p o r Vec to r   Ma ch i n e,   K - Nea r est  Nei g h b o u r ,   a n d   J 4 8   d ec is io n   tr e e   w a s   i m p le m e n ted   ac co r d in g   t o   alg o r ith m   clas s if icatio n   to   d e ter m i n class   m e m b er s h ip   to   ev er y   s e n te n ce   an d   co u n d ec is io n   i n   ter m s   o f   ac c u r ac y   a n d   ar ea   u n d er   A U C   cu r v o p er atio n   f ea t u r e.   Dec is io n   f r o m   ex p er i m en t   th at  w er ca r r ied   o u b y   t h c l ass i f icatio n   r es u lt s ,   s u p p o r v e cto r   m ac h in e   ( SVM)   a n d   J 4 8   class i f ier   al g o r ith m   h av e   th e   o v er all   b est  ac c u r ac y   p er f o r m a n ce   o f   8 5 w h ile   Naïv B a y es  h ad   t h la s ac c u r ac y   r e s u l o f   7 1 %.  T h is   s h o w s   t h at  th er is   n o   s p ec if ic  b est  clas s i f icatio n   al g o r ith m .   L a s b u n o leas t,  w h o p th at  ca n   ex p an d   d ataset's  co m p lete  s et  Ko r an   a n d   co n s eq u e n tl y   w id e n   al - Q u r an   h o l y   v er s es  i n to   lab el  as   was  ex p lai n ed   b y   al - Qu r an .   B esid es t h at,   th is   m et h o d   is   ca n   b u s ed   f o r   Had ith .       ACK NO WL E D G E M E NT   T h is   p r o j ec is   s u p p o r ted   b y   t h F u n d a m e n tal  R e s ea r ch   Gr an Sc h e m e,   v o 1 6 0 9   f r o m   Min i s tr y   o f   Hig h er   E d u ca tio n ,   Ma la y s ia.       RE F E R E NC E S   [1 ]   A b d u Ba q u e e   M u h a m m a d ,   2 0 1 2 ,   A n n o tatio n   o f   c o n c e p t u a Co - re f e r e n c e   a n d   T e x M in in g   th e   Q u ra n .   [2 ]   Ha m e d ,   S . K.,   A b   A z iz,  M . J.:  A   q u e stio n   a n sw e rin g   s y st e m   o n   h o l y   Qu ra n   tran sla ti o n   b a se d   o n   q u e stio n   e x p a n si o n   tec h n iq u e   a n d   n e u r a n e tw o rk   c las sifi c a ti o n .   J.   Co m p u t.   S c i.   1 2 ,   1 6 9 1 7 7   (2 0 1 6 )   [3 ]   Ha m o u d ,   B. ,   A twe ll ,   E. Qu ra n   q u e stio n   a n d   a n sw e c o rp u f o d a ta  m in in g   w it h   W EK A ,   p p .   2 1 1 2 1 6 .   I EE E   Co n f e re n c e   o f   Ba sic   S c ien c e s an d   En g in e e rin g   S t u d ies ,   L e e d s (2 0 1 6 )   [4 ]   S id d iq u i,   M . K.,   Na a h id ,   S . ,   K h a n ,   M . N.I . A   re v ie o f   Qu ra n ic   w e b   p o rtals  th ro u g h   d a ta  m in in g .   V A WKUM   T ra n s.  Co m p u t.   S c i.   5 ,   1 7   (2 0 1 4 )   [5 ]   Hilal,   A . ,   S rin iv a s,  N.:   A n a ly ti c a o f   th e   i n it ial  h o ly   Qu ra n   letters   b a se d   o n   d a ta  m in in g   stu d y .   Am .   In t.   J.  Re s.   F o rm a A p p l.   Na t.   S c i.   1 0 ,   1 ( 2 0 1 5 )   [6 ]   Ak o u r,   M . ,   A lsm a d i,   I. ,   A laz z a m ,   I. M QV C:   m e a su rin g   Qu ra n ic  v e rse si m il a rit y   a n d   S u ra h   c las sifi c a ti o n   u sin g   N - G ra m .   W S E A S   T ra n s.  Co m p u t.   1 3 ,   4 8 5 4 9 1   (2 0 1 4 )   [7 ]   Ja m il ,   N.S . ,   Ku - m a h a m u d ,   K.R. ,   Din ,   A . M . ,   A h m a d ,   F . ,   Ch e p a ,   N.,   Ish a k ,   W . H.W . ,   Din ,   R. ,   A h m a d ,   F . K.:   su b jec id e n ti c a ti o n   m e th o d   b a se d   o n   term   f re q u e n c y   tec h n iq u e .   J.  A d v a n c .   Co m p u t.   Re s.  7 ,   [8 ]   S a n tra,  A . K.,   Ch risty ,   C. J.:  G e n e ti c   a lg o rit h m   a n d   c o n f u sio n   m a tr ix   f o d o c u m e n c lu ste rin g .   I n t.   J.  Co m p u t.   S c i .   Iss .   9 ,   3 2 2 3 2 8   (2 0 1 2 )   [9 ]   Ya n g ,   J.,   Qu ,   Z. ,   L iu ,   Z. Im p ro v e d   F e a tu re   S e lec ti o n   M e th o d   Co n si d e rin g   th e   Im b a lan c e   P ro b lem   in   T e x Ca teg o riza ti o n .   S c ien t ifi c   W o rld   J.  1 1 7   (2 0 1 4 )   [1 0 ]   Ho ss in ,   M . ,   S u laim a n ,   M . N.:   A   r e v ie w   o n   e v a lu a ti o n   m e tri c f o d a ta  c las sifi c a ti o n   e v a lu a ti o n s .   I n t.   J.  Da ta  M i n in g   Kn o w led g e   M a n a g .   P r o c e ss .   5 ,   1 1 1   (2 0 1 5 )   [1 1 ]   sc ik it - lea rn   h tt p : // sc ik it - lea rn . o rg / sta b le/m o d u les /n a ïv e   _ b a y e s.h t m l   [1 2 ]   W e k a   De c isio n   T re e   h tt p :/ /sc ik it - lea rn . o rg /stab le/  m o d u les /n a iv e _ b a y e s.h t m l   [1 3 ]   Am a ra p p a ,   S . ,   S a th y a n a ra y a n a ,   S . V . :   Da ta  c las sifi c a ti o n   u sin g   su p p o rt   v e c to m a c h in e    S V M  ,   a   sim p li e d   a p p ro a c h .   J.  El e c tro n .   C o m p u t.   S c i.   En g in e e rin g .   3 ,   4 3 5 4 4 5   ( 2 0 1 4 )   [1 4 ]   G h a re h c h o p o g h ,   F . S . ,   Kh a z e ,   S . R. ,   M a lek i,   I. n e w   a p p ro a c h   in   b lo g g e rs  c las si c a ti o n   w it h   h y b rid   o f   k - n e a re st  n e ig h b o r   a n d   a rti c ial  n e u ra n e t w o rk   a l g o rit h m s.  I n d ian   J.   S c i. T e c h n o l .   8 ,   2 3 7 2 4 6   (2 0 1 5 )   [1 5 ]   De y ,   L . ,   Ch a k ra b o rt y ,   S . ,   Bisw a s,  A . ,   Bo se ,   B. ,   T iw a ri,   S . S e n t im e n a n a l y sis  o f   re v ie w   d a ta se t u sin g   Na ïv e   Ba y e s‟ an d   k -   NN   c las si e rs.  J.  In f o rm a t.   En g .   El e c tro n .   B u sin e ss .   4 ,   5 4 6 2   (2 0 1 6 )   [1 6 ]   Ja so n   Bro w n lee ,   K - N e a re st   Ne i g h b o rs  f o M a c h in e   Lea rn in g ‟,   h tt p s:/ /m a c h in e lea rn in g   m a st e r y .   c o m /k - n e a re st - n e ig h b o rs - f o r - m a c h in e - lea rn in g /   [1 7 ]   S m a rt  V isio n - E u ro p e ,   h tt p s:/ /www . s v - e u ro p e . c o m /     Evaluation Warning : The document was created with Spire.PDF for Python.