I n d on e s ian   Jou r n al   o f   E lec t r ica l   E n gin e e r in a n d   Com p u t e r   S c ience   Vo l .   25 ,   N o .   3 M a r c h   20 22 ,   pp.   1469 ~ 148 0   I S S N:  2502 - 4752,   DO I 10 . 11591/i j e e c s . v 25 .i 3 . pp 1469 - 148 0             1469       Jou r n al  h o m e page ht tp: // ij e e c s . iaes c or e . c om   T e xt  m i n i n g ap p r oac h e s f or  a n al y z in g an   In d on e si an   t af se e r   an d  t r an sl at io n  of  t h e  Hol y  Qu r an       M e d ia  An u ge r ah   Ayu ,   E d i   I r awan,   T e d d M an t or o   D e pa r tm e nt   of  C o mput e r  S c i e n c e F a c ul t y   of  E ngi n e e r in g a nd  T e c hn o l o g y , S a mp oe r na  U ni ve r s it y , J a ka r ta , I ndo n e s ia         Ar t ic l e   I n f o     AB S T RA CT     A r ti c le  h is tor y :   R e c e i ve S e p   14 2021   R e vi s e J a n   5 202 2   A c c e pt e J a n   12 202 2       T h e   I n d o n e s i an   t afs ee r   a n d   t ran s l at i o n   o H o l y   Q u ran   i s   an   i m p o rt an t   s o u r ce  o i n f o r m at i o n   an d   k n o w l e d g e   fo I n d o n e s i an   m u s l i m s ,   s i n ce   n o t   m a n y   I n d o n e s i an   m u s l i m s   u n d e rs t an d   A rab i c   l an g u ag e   i n   t h e   Q u ran .   H o w ev e r,   t h t afs e e i s   fu l l   o f   t h e   c o mmen t ari e s   an d   e x p l an at i o n   o e a c h   s u rah   ( ch ap t e r)   an d / o a y ah   ( v e rs e ),   w h i ch   fo r m   a   l arg d o c u men t   an d   n o t   s o   e as y   t o   b acce s s e d .   T h u s ,   t h e   c h a l l en g e   i s   h o w   t o   re f e t o   b o t h   t a fs e e a n d   t ran s l at i o n   i n   fas t e an d   a cc u rat e   w a y s   as   o n e   n ee d s   t o   al w a y s   re f e t o   t h em   b ack   an d   fo rt h .   H e n ce ,   t h i s   s t u d y   p ro p o s e s   s e v e ra l   t e x t   mi n i n g   a p p ro ac h e s ,   i . e .   mo s t   fre q u e n t   w o rd s ,   K - me an s   c l u s t e ri n g ,   a n d   as s o c i at i o n   ru l e s ,   t o   an a l y z e   a n   I n d o n e s i an   t afs ee an d   t ran s l at i o n   o Q u ran   an d   p ro v i d e   i n s i g h t s   o h i d d en   k n o w l ed g an d   r e l at i o n s h i p s   b as e d   o n   s t at i s t i c al   i n fo r mat i o n   d e ri v e d   fr o m   i t .   T h e s e   i n s i g h t s   c o u l d   b e   u s e fu l   fo m u s l i m s   i n   g en e ral   an d   fo p eo p l e   t h at   d o i n g   r e s e ar ch   i n   r e l at e d   ar e as .   T h i s   s t u d y   s h o w s   i n t e r e s t i n g   r e s u l t s   fro c o m b i n e d   a n al y s i s   o t h e   ap p ro ach e s   u s ed   w h i ch   c a n   h e l p   p eo p l e   acce s s i n g   i n fo r m at i o n   i n   t afs ee mo r e   e ff i c i en t l y .   A s   w e l l ,   i n t ere s t i n g   r el at i o n s h i p s   h av e   b een   d ra w n   fro m   t e r m s   i n   t h e   t afs e e w h i ch   co u l d   p ro v i d e   fu rt h e an d   d ee p e k n o w l e d g e   o n   me s s ag e s   i n   t h e   Q u ran .   K e y w o r d s :   As s o c i a t i o n   r u l e   K - m e a n s   c l u s t e r i n g   M o s f r e que n t   w o r ds   m i n i ng   T a f s e e r   t e x t   m i n i ng   T e x t   m i n i ng   Th i s   i s   a n   o p en   a c ces s   a r t i c l u n d e r   t h CC  B Y - SA   l i cen s e.     C or r e s pon din A u th or :   M e d i a   An ug e r a h   Ay u   De pa r t m e n t   o f   C o m put e r   S c i e n c e ,   F a c u l t y   o f   E n g in e e r i ng  a n T e c hn o l o g y ,   S a m po e r n a   Uni ve r s i t y   L Av e n u e   B u i l d i ng,   S t r e e t   R a y a   P a s a r   M i nggu  Ka v .   16  P a n c o r a n ,   S o u t h   J a ka r t a ,   I n do n e s i a   E m a i l m e d i a . a y u @ s a m po e r n a u ni ve r s i t y . a c . i d       1.   I NT RODU C T I ON     I n   t h e   r e c e n t   y e a r s n a t ur a l   l a n gua ge   pr o c e s s i ng   ( NL P )   h a s   be e n   w i de ly   us e f o r   t h e   a uto m a t i o r e l a t e w i t h   t r a n s l a t i o n   o r   i n t e r pr e t a t i o n .   W i t hi NL P   t h e r e   i s   t e x t   m i n i ng  whi c h   c o ns i d e r e a s   on e   o f   i t s   b r a n c h es   a s   i t   i s   us i ng  s o m e   f u n da m e n t a l   m e t h o ds   i n   NL P   b ut   wi t h   d if f e r e n t   go a l s .   Unli ke   NL P   w hich   c a r e s   a b o ut   s e m a n t i c s   i nf o r m a t i o n   i n   t h e   t e x t ,   i n   t h e   t e x t   m i ni ng  t h e r e   i s   a l s o   a   m e t h o whi c h   t r e a t s   t h e   t e x t   a s   t h e   b a o f   wo r d’ ,   m e a ni n g   t h e   s e m a n t i c s   i nf o r m a t i o n   i s   n o t   e x p l o r e d.   T h e   m a i go a l   i t e x t   m i n i ng   i s   t o   a n a ly z e   b o t h   uns t r uc t ur e a n s t r uc t u r e l a r ge   t e x t   da t a s e s o   t h a t   o n e   do e s   n o t   h a v e   t o   r e a t h e   wh o l e   t e x t   [ 1] T hi s   h a s   l e a T e x t   M i ni ng   i be c o m i ng  a   v a l ua bl e   r e s e a r c h   a r e a   a s   t h e   e xi s t i ng  i m pr o v e m e n t   o f   a r t i f i c i a i n t e ll i ge n c e   ( A I )   ha s   b e e n   o n   t he   l e v e l   w h e r e   t h e   e x t r a c t i o n   o f   i nf o r m a t i o n   i a   t e x t ua l   da t a   ha s   t o   b e   a uto m a t e d.   T h e   r e s u l t   f r o m   t e x t   m i n i ng  i s   t h e   i nf o r m a t i o n   o f   t h e   t e r m s   a n wo r ds   a n a ly s i s .   M a ny   lar ge   t e x da t a   a r t i f a c t s   h a v e   be c o m e   t h e   da t a   s o ur c e   f o r   r e s e a r c h   i t h e   t e x t   m i ni ng  a r e a .   On e   o f   t h o s e   l a r ge   t e x t   da t a   s o ur c e s   i s   t h e   Ho l y   Qur a n .   T h e   Ho l y   Qur a n   i s   t h e   m o s t   v a l ua bl e   b o o f o r   m us l im s ,   i . e .   pe o pl e   w i t h   I s l a mi c   r e li g i o n ,   a s   t h e y   b e li e v e   i t   i s   c o n t a i ni ng  t h e   wo r ds   o f   Go d.   I n s i de   t h e   Qur a n ,   t h e r e   a r e   f u n da m e n t a l   c a t e gor i e s   o f   k no wl e dg e   whi c h   h a v e   t o   b e   un de r s too a n r e c i t e by   a l l   m u s l im s   [ 2] .   T h e   o r i g i n a l   l a n gu a ge   o f   Qur a n   i s   A r a bic.   S i n c e   m a ny   m us li m s   do   n o t   un de r s t a n A r a bi c   pr o pe r l y ,   Qur a n   h a s   be e n   t r a n s l a t e i n t o   m a ny   l a n gua ge s ,   i n c l ud i ng   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i Vo l .   25 ,   N o .   3 M a r c h   20 22 :   1469 - 148 0   1470   I n do n e s i a l a n gua ge ,   t o   m a ke   i t s   c o n t e n t s   e a s i e r   to   b e   u n de r s t oo d .   Ho we v e r ,   to   s o m e   e x t e n t ,   t r a n s l a t i o n   o f   A r a bi c   Qur a n   o nl y   i s   n o t   e n o ugh   f o r   ge n e r a l   pe o p l e   t r e a l ly   u n de r s t a n t h e   e x a c t   m e a ni ng  o f   m e s s a ge s   in  t h e   Qur a n .   T h a t   i s   w hy   t h e r e   a r e   s o m e   h o n o r a bl e   a n k n o w l e dg e a bl e   p e o pl e   w h o   wr i t e   a n c r e a t e   s o m e   c o m m e n t a r y   b o o ks   o t h e   Qur a n   c a ll e d   m u f a s s ir   a n d   t h e   b o o ks   c a l l e d   a s   t a f s e e r .   T he   e x p l a n a t i o n   a nd   c o m m e n t a r y   i ns i de   t h e   t a f s e e r   m u s t   n o t   b a s e   o n   t h e   i n d i v i dua l   o p i ni o n .   T h e   c o n t e n t s   o f   t h e   Qur a n   mus t   s t a y   t h e   s a m e   s o   a l l   t h e   c o m m e n t a r y   m u s t   r e f e r   to  t h e   e x p l a n a t i o n   f r o m   t h e   P r o ph e t   M uh a m m a [ 3]   As   t a f s e e r   a n t r a n s l a t i o n   o f   t h e   Qur a n   de a li ng   w i t h   l o n s e n t e n c e s   a n wo r ds ,   i t   b e c o m e s   a   c h a ll e n g e   t o   e x t r a c t   t h e   v a l ua bl e   i n f o r m a t i o f r o m   b o t h   o f   t h e m .   I n   t hi s   t e c hn o l o g i c a l   e r a ,   pe o p l e   t e n t l e a v e   c o nve n t i o na l   t hi ng  s uc h   a s   r e f e r   to   a   t hi c boo by   o pe ni n o n e   pa ge   t o   a n ot h e r   pa ge .   T h e   i nve n t i o n   o f   i n f o r m a t i o n   r e t r i e v a l   a l go r i t hm   a n t e x t   m i ni ng  i n   n a t ur a l   l a n gua ge   pr o c e s s i ng  ( NL P )   h a s   e n a bl e d   p e o pl e   to  mi ne   v a l ua bl e   i n f o r m a t i o n   i ns i de   l a r ge   t e x t   do c um e n t s   f a s t e r   a uto m a t i c a ll y   a n mi g h t   b e   a   po s s i b l e   a n s we r   to  t h e   r e f e r e n c i ng  t a f s e e r   a n t r a n s l a t i o n   c h a l l e nge .   T h e r e   a r e   s e v e r a l   Qur a n - r e l a t e NL P   s t ud i e s ,   f o r   e x a m p l e s   t h e   o n e s   by   [ 4] - [ 6] .   H o we v e r ,   t h e r e   a r e   r a r e l y   f o un N L P   s t ud i e s   o n   t h e   I n do n e s i a n   t a f s e e r   o f   t he   Qur a n ,   wh e r e a s   t hi s   t a f s e e r   h a s   gr e a t   i m po r t a n c e   f o r   m us li m s   i n   u n de r s t a n d i ng  t h e   c o n t e n t s   o f   t h e   Qur a n ,   e s pe c i a ll t h e   o n e s   w i t l i t t l e   a r a bi c   l a n gua ge   k n o w l e dge .   T h us ,   t hi s   r e s e a r c h   s t ud y   a im s   t o   ut i l i z e   t e x t   m i n i ng   t e c h ni que s   t o   r e t r i e v e   t h e   i ns i g h t s   o f   t h e   I n do ne s ian   t a f s e e r ,   to   un c o v e r   hi dde n   k n o w l e dge   a n r e l a t i o n s hi p s   o f   m a t e r i a l s   d i s c u s s e i n   t h e   Qur a n .   T h e   o r ga ni z a t i o n   o f   t hi s   pa pe r   s t a r t s   wi t h   a n   i n t r o duc t i o n   i n   s e c t i o n   1 whi c h   t h e n   f o l l o we b s e c t i o n   whi c h   pr e s e n t s   r e vi e ws   o n   s o m e   r e l a t e d   wo r ks   f r o m   pr e vi o us   r e s e a r c h   i t h e   li t e r a t ur e .   A f t e r   t h a t,   m e t h o do l o g y   a pp l i e i n   t h e   s t udy   i s   d i s c u s s e i s e c t i o n   3,   a n t h e n   s e c t i o n   pr e s e n t s   t h e   r e s u l t s   o f   t h e   c o n duc t e r e s e a r c h   c o m p l e t e   w i t h   i t s   d i s c us s i o n s .   L a s t   s e c t i o n   i s   t h e   c o n c l us i o n   w hi c h   pr e s e n t s   t h e   s u m m a r y   o f   t h e   ke y   f i nd i ngs   a n i t s   t a ke a wa y s .         2.   L I T E RA T UR E   RE VI E   Ge n e r a ll y ,   t h e r e   a r e   t h r e e   t y pe s   o f   r e s e a r c h   a r e a s   i t h e   t e x t   m i n i ng,   i . e .   t e c hni que s   f o r   pr e pr o c e s s i ng,   c o m pa r a t i v e   s t udi e s   a b o ut   m a c hi n e   l e a r ni n g   f o r   b o t h   c l a s s if i c a t i o n   a n d   c l us t e r i n a s   we ll   a s   t h e   f e a t ur e   e x t r a c t i o n   a l go r i t hm   c o m pa r i s o n ,   a n t h e   s t ud y   a b o ut   t h e   t e x t   da t a s e t   e x p l o r a t i o n   r e s u l t   f o r   t h e   mi n i ng.   M a ny   o f   t h e   s t ud i e s   o n   t e x t   m i n i ng  i n   ge ne r a l   a r e   c o n c e n t r a t e d   o n   t h e   pr e pr o c e s s i ng  s t a ge   o f   t h e   t e x t   mi n i ng.   T hi s   i s   due   to   t h e   n e e ds   f o r   f ur t h e r   i m pr o v e m e n t   i n   pr e pr o c e s s i n s i nc e   i t   i s   a   c r uc i a l   s t a ge   whi c h   c a a f f e c t   to   t h e   r e s ul t   s i g nif i c a n t l y .   T h e   pr e pr o c e s s i n i nc l ude s   to ke ni z a t i o n ,   n o r m a li z a t i o n   a n s u bs t i t ut i o n .   B e s i de s   t h e   pr e pr o c e s s i n g,   t h e   s e l e c t i o n   o f   t h e   m e t h o ds   a l s o   i s   o n e   o f   t h e   t r e n ds   i t h e   r e s e a r c h   a r e a .   T h e   r e s e a r c h e r s   u s ua ll y   c o m pa r e   t w o   o r   m o r e   c o m m o m e t h o i n   t e x t   m i n i ng,   w h e t h e r   i t   i s   a b o ut   c l u s t e r i n g   o r   c l a s s i f i c a t i o [ 7] ,   [ 8] .   An o t h e r   r e s e a r c h   a r e a   f o r   t e x t   m i n i ng  i s   t o   i m p l e m e n t   t h e   t e x t   m i n i ng  t o   a   s pe c if i c   da t a s e t   w i t t h e   f o c u s   o n   t h a t   da t a s e t   l i ke   a   r e s e a r c h   wo r do n e   by   Al ha wa r a t   e al [ 9]   o n   A r a bi c   l a n gua ge   da t a s e t   a n d   c o n duc t e r e s e a r c h   by   M a t s u m o to   e al [ 10]   o n   c o m bi ni ng   n u m e r i c a l   a n t e x t   da t a s e t .   M or e o v e r ,   t h e r e   a r e   a l s o   s t ud i e s   in  c o m pa r i ng  t wo   o r   m o r e   d i s t a n c e   c a l c u l a t i o n   t e c hniques   i de t e r m i ni ng   t h e   s im il a r i t i e s   w h e n   do i n g   c lus t e r i n g   o r   c l a s s if i c a t i o n   [ 11]   Qur a n   ha s   a l s o   be e n   a   s u bj e c t   o f   t e x t   m i n i ng   a s   o n e   o f   da t a s e t   s o ur c e s .   Ho we v e r ,   t e x t   m i n i ng   r e s e a r c h   i n   Qur a n   a r e   n o o nl y   f o c us   o n   t h e   da t a s e t,   i t   c a n   a l s o   a c c o m m o da t e   a l l   o f   t h o s e   ge n e r a l   t h r e e   t y pe s   m e n t i o n e e a r li e r   a n a   c o m bi na t i o n   b e t we e n   t h e m .   R e s e a r c h e r s   c a n   s t udy   t he   a l go r i t hm   us e f o r   t h e   Qur a t e x t   m i n i ng.   W i t hi t hi s   t y p e   o f   r e s e a r c h ,   t h e   r e s e a r c h e r s   c a n   c o m pa r e   t wo   o r   m o r e   a l go r i t hm   t o   e x t r a c t   t h e   m o s t   v a l u a bl e   i nf o r m a t i o n   i ns i de   t h e   Qur a n .   S e v e r a l   t e x t   m i n i ng  s t ud i e s   o n   Qur a n   e x p l o r e a n a n a ly z e t h e   c l a s s if i c a t i o n   o f   i t s   c o n t e n t   a s   r e po r t e by   [ 12] - [ 16] .   An o t h e r   t y pe   o f   r e s e a r c i Qur a n   t e x t   mi ni ng   i s   f o c u s   i t h e   s pe c i f i c   da t a s e t   a n a n a ly z i ng  t h e   t e x t   m i ni n r e s u l t   a c t e to   t h e   da t a s e t s ,   whi c h   a r e   I n do n e s i a T a f s e e r   a n T r a ns l a t i o n .   T h e r e   a r e   a l s o   pr e vi o us   r e l a t e wo r ks   a b o u t   t e x t   m i ni ng  f o r   Qur a n   a n T a f s e e r   r e l a t e wi t d i f f e r e n t   go a l s   a m o n t h e m   a s   t h e   wo r ks   by   [ 2] ,   [ 5 ] ,   [ 17] ,   [ 18 ] .     As   t h e   Qur a n   c o n t a i n s   c h a pt e r s   a n a l r e a d y   d e c i de i n   t h e   pa s t ,   r e s e a r c h e r s   wa n t   to   e x p l o r e   t h e   r u l e   t h a t   m a de   t h e   d i v i s i o n   o f   t h e   Qur a n .   A   goo e x a m p l e   i s   t h e   wo r d o n e   i n   [ 5]   w i t h   t h e   go a l   t o   d o   t h e   a n a ly s i s   o n   t h e   f r e que n t   pa tt e r n s   t h a t   c a n   b e   f o u n i n   t h e   c h a pt e r s   o f   a   M a l a y   t r a n s l a t e t a f s e e r   o f   Q ur a n;   t h e   t e c h ni que s   a r e   f r e que n t   pa tt e r n   m i ni ng ,   n o n - t r i vi a l   pa t t e r n s   a n i n t e r e s t i n r e l a t i o n s .   T h e   f i nd i ng s   o f   t h e   s t udy   we r e   t h e   pr o c e s s e da t a s e t do c um e n t s   a nd  17  t e r m s .   T h e   t e r m   we i g h t i n g   i s   t e r m   f r e que n c y i nv e r s e   do c um e n t   f r e que n c y   ( T F - I DF ) .   T h r e e   m o s t   f r e qu e n t   t e r m s   a r e   All a h ,   M u h a mm a d ,   a n d   wa ha i .   T he   d i f f e r e n t   t y p e   o f   r e s e a r c h   i s   pr e s e n t e by   Kha da n g i   e al ,   [ 4]   w hi c h   i n t e n de d   t o   s t udy   t h e   s im i l a r i t y   o f   t o pi c s   i Qur a ni c   s ur a hs ;   t h e   m e t h o do l o gy   wa s   n a t ur a l   l a n gua ge   pr o c e s s i ng  m e t h o ds   w hi c a r e   wo r d2v e c   a n r o ot s a c c o m p a ni m e n t   i n   Ve r s e s .   T h e   f i nd i ng  wa s   t h e   kn o w l e dge   t h a t   t h e   c h o i c e   o f   t h e   s ur a h' s   t i t l e   i s   b a s e o n   r a t i o n a l   l o g i c ,   t h e   s ur a hs   h o l t h e   i nne r   c o h e r e n c e   b e t we e n   t h e   c o n c e pt s   s o   t h a t   t h e y   h a ve   f o r m e o n   a   s i n g le   to pi c   o r   a   f e t o pi c s   t i g h t l y   r e l a t e to   e a c h   ot h e r   [ 4 ] .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       T e x mining  appr oac he s   f or   analyz ing  an   indones i an  ta f s e e r   and   …  ( M e dia  A nuge r ah  A y u )   1471   An  a n a ly s i s   o f   a   t e x t   m i n i ng   a l go r i t hm   o Qur a n   i s   pr e s e n t e by   Q i   e al .   [ 19]   l o o ke t h r o ugh   t h e   s e m a n t i c   i nf o r m a t i o n   i ns i de   t h e   Qur a n .   T h e   o bjec t i v e   w a s   t o   c o n tr i b ut e   i n   b u il d i ng  a n   a l go r i t h m   w i t s e m a n t i c   a n a ly s i s   a n a ut o m a t i c   i de n t i f i c a t i o n   a r e a s .   T h e   r e s e a r c h   c o m pa r e a n a na l y z e s e man t i c a ll b e t we e n   C hi ne s e   a n A r a bi c   wr i t t e n   l a n gua ge   o f   Qur a n .   T h e   a l go r i t hm   us e i t h e   r e s e a r c h   s t ud y   wa s   S e m a n t i c   a nn o t a t e d   c or pus   a n s e m a n t i c   kn o w l e dg e   b a s e .   T h e r e   wa s   a l s o   a   s t ud y   w hi c e x p l o r e t h e   Qur a n   T a f s e e r   i M a l a y   L a n gu a ge .   T h e   a im   wa s   t pr o vi de   c l a s s if i c a t i o n   a l go r i t hm   f o r   Qur a n   T a f s e e r   v e r s e s   a ut o m a t i c a ll y .   T hi s   r e s e a r c h   s t ud y   by   Ha mo ud  a n d   A t we l l   [ 18]   us e K - ne a r e s t   n e i g hb o r   ( K NN )   o r   c l a s s if i e r   a n c o s i n e   s im il a r i t y   a s   t h e   d i s t a n c e .   T h e   r e s u l t   o f   t h e   s t udy   wa s   a   c o n t r i b ut i o n   t o   M a l a y   Qur a n   t a f s e e r   c a t e g o r y   c l a s s i f i c a t i o n .   F r o m   t hi s   s t udy   w e   c a n   lea r n   t h a o n e   wa y   t o   c o n tr i b ut e   i NL P   s t ud y   o f   Qur a n ,   i s   t o   s tr e n g t h e n   t h e   a l go r i t hm   i b u il d i ng  a   go o t i d c o r pus .   An o t h e r   s t udy   we n t   to   t h a di r e c t i o n   a n d i r e s e a r c h   i n   t h e   e x p l o r a t i o n   o f   m a k i n t h e   c o r pus   to   b u i l t h e   t a ggi n a l go r i t hm   f o r   c r e a t i n g   a   pr o tot y pe   w hi c i s   a bl e   to   e x t r a c t   c o l l o c a t i o n   o f   N - gr a m   wo r ds   [ 17] .   T hi s     N - gr a m   wo r ds   c o n s i s t   o f   un t i l   wo r ds   f r o m   A r a bi c   Qur a n   c o r pus   o r de r e by   pa r t   o f   s pe e c h   t a ggi ng .   T h e   r e s u l t   s h o we t h a t   t h e   pr o p o s e s y s t e m   s uc c e e de d   to   m a k e   t h e   us e r s   s e l e c t   a   s e qu e n c e   o f   t a gs   ( 2 - gr a m )   a n d   s c o pe   o f   t h e   c o r pus   s o ur c e .   I n   a dd i t i o n ,   a   s t ud y   t o   r e v e a l   f r e que n t   pa tt e r n s   i n   Ho l y   Qur a n   ( A r a bi c )   us i ng   t e x t   mi n i ng  h a s   be e n   r e po r t e d   i n   [ 20]   t h a c a n   b e   us e t o   a n a l y z e   f ur t h e r   t h e   Qur a n   a n b r i ng  m o r e   c o m pr e h e ns i ve   un de r s t a n d i ng.   Am o n t h o s e   e x p l o r e r e s e a r c h   s t ud i e s   w i t hi N L P - t e x t   m i n i ng  r e l a t e to  Qur a n ,   we   h a v e   n o f o u n t h e   o n e   w hi c f o c us e s   i I n do n e s i a n   t a f s e e r   o f   Qur a n .   S i nc e   I n do n e s i a   i s   a   c o un t r y   w i t h   t h e   bi gg e s t   n u m be r   o f   m us li m s   i t h e   wo r l d,   a n n o t   m a ny   I n do n e s i a   c a u n de r s t a n A r a bi c   we ll ,   t h e a   t e c hn o l o g y - b a s e a ppr o a c h   li ke   t e x t   m i n i ng  t h a t   c a n   h e l i e x t r a c t i n hi dde n   k n o w l e dge   f r o m   Qur a n   t h r o ugh   i t s   t a f s e e r   w i ll   b e   b e n e f i c i a l .       3.   M E T HO DOL OG   T h e r e   a r e   s e v e r a l   s t e ps   c o n duc t e f o r   t h e   t e x t   m i ni ng  pr o c e s s   a pp li e i t hi s   s t ud y ,   a s   pr e s e n t e i F i gur e   1 .   T hi s   w h o l e   pr o c e s s   wa s   c o n duc t e f o r   t a f s e e r   a n t r a n s l a t i o n   w i t h   t h e   s a m e   s t e ps .   T h e   da t a s e t   us e wa s   f r o m K E M E NA I n do n e s i a n   t a f s e e r   a n t r a n s l a t i o n ,   t a hli l i   2011  v e r s i o n   a ll   J u z .   T h e   too l   us e f o r   f e a t ur e   s e l e c t i o n   un t i l   f r e que n t   t e r m   mi n i ng  i s   R   a nd  R S t udi o   3 . 6. 3   a s   t h e   I DE .           F i gur e   1.   T h e   t e x t   m i ni ng  pr o c e s s   f o r   t h e   I n do n e s ian   t a f s e e r   a n t r a n s l a t i o n   o f   t h e   Qur a n       3. 1.     P r e p r oc e s s in o r   f e at u r e   s e l e c t ion   T h e   pr e pr o c e s s i n o r   f e a t ur e   s e l e c t i o n   s t a ge   i nc l ude s   c a s e   f o l d i ng,   to ke ni z a t i o n ,   s t e m mi ng  wo r ds   a n s t o w or ds   e l im i na t i o n .   P r e pr o c e s s i n i s   n e e d e to   r e duc e   t h e   u n wa n t e wo r ds   whi c h   h a v e   n o   s igni f i c a n m e a ni ng,   n o i s e ,   i n t t e x t   m i n i ng.   T hi s   s t e a l s o   d on e   t r e duc e   t h e   r e dun da n c y   a n r e pe t i t i o n .   T h o s e   s t e ps   a r e   r e v e r s i b l e   a n c a n   go   b a c to   a ny   s t e i f   i t   i s   r e qu i r e d.       3. 2   F e at u r e   e x t r ac t ion   u s in T F - I DF   T h e   T F I DF   i s   c o ns i d e r e a s   o n e   o f   t h e   m o s t   p o w e r f u l   f e a t ur e   e x t r a c t i o ns   [ 21] ;   i t   i s   b e c a u s e   u nl i k e   t h e   b a o f   wo r m e t h o d,   t hi s   m e t h o i s   n o t   o nl y   s e e i n t h e   m o s t   f r e que n t   t e r m s   s o   t h a t h e   un do m i n a n t   wo r d   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i Vo l .   25 ,   N o .   3 M a r c h   20 22 :   1469 - 148 0   1472   i s   e l im i na t e d;   t h e   T D I DF   i s   a l s o   we i g h t i n t he   t e r m s   ba s e o n   h o f r e que n t   t h e   t e r m   i a   d o c um e n t   c o m pa r e t o   h o f r e que n t   t h e   t e r m   i t h e   w h o l e   do c um e n t s .   B y   do i n T F I DF ,   t h e   m o s t   f r e que n t   wo r i s   r e s c a l e d.   T h e   m a t h e m a t i c a l   m o de l   f o r   t h e   T F I DF   i s   s h o w n   in   ( 1 )   [ 21]   F o r   a   t e r m   i   i n   t h e   do c um e n t   j :     , =   ,   ×   log ( )     ( 1)     w h e r e :     , =                    =                   =             3. 3   M os t   f r e q u e n t   wor d s   m in in g   I n   t hi s   s t a ge ,   t h e   m o s t   f r e que n t   wo r ds   a r e   e x t r a c t e f r o m   b o t h   t a f s e e r   a n t r a n s l a t i o n .   T h e   r e s u l t   o f   t h e   m o s t   f r e que n t   wo r ds   m e a s ur e by   T F   is   r e pr e s e n t e a n vi s ua li z e i n   t h e   f o r m   o f   wo r c l o uds .   T h e   o t h e r   pr e s e n t a t i o n   o f   t h e   r e s u l t ,   whi c h   i s   t h e   f r e qu e n c y   m e a s ur e by   T F I DF   is   i t h e   f o r m   o f   t h e   b a r   p l o t   o f   e a c h   t a f s e e r   a n t r a n s l a t i o n   r e s u l t .   No t   o nl y   s e e i ng  t h e   m o s t   f r e que n t   wo r ds ,   t h e   r e s u l t   i s   a l s o   e v a l ua t e i t e r m s   o f   i t s   c o r r e l a t i o n   us i ng  pe a r s o n   c o r r e l a t i o n   c o e f f i c i e n t     3. 4   K - m e an s   c l u s t e r in g   T h e   c l u s t e r i n g   i n   t hi s   s t ud y   wa s   pe r f o r m e b a s e o n   E uc l i d i a n   d i s t a n c e   b e t we e n   t e r m s   o r   w o r d s .   T h e   E uc l i d i a n   d i s t a n c e   i ( 2 ) .     =   ( ) 2 = 1   ( 2)     w h e r e   A   a n B   a r e   po i n t s   i n   d i m e n s i o n a l   s p a c e   s uc h   t h a t :   A   =   [ a 1 ,   a 2 ,   ,   a d ]   a n B   =   [ b 1 , b 2 ,   ,   b d ] .     Af t e r   ge t t i n e a c h   d i s t a nc e ,   t h e n   t h e   c l us t e r i n met h o ds   a r e   a pp l i e d.   T h e   K - m e a ns   a l go r i t hm   i s   o n e   o f   t h e   pa r t i t i o n a l   c l us t e r i n g,   m e a ni ng  t h e   c l us t e r s   da t a s e t   a r e   f u ll y   d i v i de f r o m   t h e   o t h e r s   a n t r e a t e a s   d i f f e r e n t   c l us t e r .   T h e   f i r s t   t hi n t d o   i n   K - m e a n s   c l us t e r i n i s   a s s i g ni ng  t h e   n u m be r   o f   c l u s t e r i n g,   k.   Af t e t h a t,   i ni t i a ll y ,   t h e   r a n do m   c e n t r o i f o r   c l u s t e r   i s   c h o s e n .   T h e   i t e r a t i o n   o f   K - M e a ns   i s   do n e   u n t i l   t h e   m e a n   o f   e a c h   t r a i ni ng  da t a   to   t h e   c e n t r o i m e t   t h e   s t o ppi n g   c r i t e r i o n ,   w h e r e a s   t h e   s m a ll e s t   E uc l i d e a n   d i s t a n c e   f r o m   a   s a m p l e   i s   t h e   n e a r e s t   c e n t r o i f o r   t h e   s a m p l e   to   b e   t h e   o n e   wi t h   [ 22] ,   [ 23 ] .   I n   o r de r   to   pr e s e n t   t h e   b e s t   c l us t e r i n r e s u l t s ,   pr e l im i na r y   e x pe r i m e n t s   we r e   do n e .   O n e   o f   t h e   ap pr o a c h e s   t o   kn o t h e   o p t i m a l   n u m be r   o f   i s   by   s e e i ng  t h e   e l b o o f   s u m   s qua r e   o f   e r r o r   ( S S E )   o f   c l us t e r   c e n t e r   p l o t.   T h us i n   t h e   k - m e a ns   c l us t e r i n s t a ge ,   pr e l im i na r y   e x pe r i m e n t s   we r e   c o n duc t e to   ge t   t h e   b e s t   v a l ue r   o f   k ,   b e f o r e   t h e   m a i c l us t e r i n pr o c e s s   wa s   do n e .     3. 5   As s oc iat ion   r u l e s   m in in g   Or i g i na ll y ,   f r e que n t   pa tt e r n   ( F P )   g r o w t h   a l go r i t hm   i s   us e f o r   kn o w i n t h e   a s s o c i a t i o n   r u l e s   i n   t he   r e l a t i o n a l   da t a b a s e   o f   t r a n s a c t i o n .   T h e   f o r m a l   de f ini t i o n   o f   a s s o c i a t i o n   r u l e   wa s   pr e s e n t e by   A gr a wa l   e al [ 24]   a s   t h e   f o l l o w i n g   de s c r i pt i o n .   L e t   I   I 1   I 2   +   …  +   I m   b e   a   s e t   o f   i t e m s   o r   bi na r y   a t tr i b ut e s .   L e t   be   a   s e o f   a ll   t r a ns a c t i o n s   w h e r e   e a c h   t r a n s a c t i o n   T   i s   a   s e t   o f   i t e m s   s uc h   t h a t   T     I .   L e t   X,   be   a   s e t   o f   i t e m s   s uc t h a t   X ,   Y     I .   F r o m   t h o s e   de f i ni t i o ns ,   t h e r e   i s   t h e   a s s o c i a t i o n   r u l e   i m p li c a t i o n   w hi c h   pr e s e n t e i n   t h e   f o r m       Y,   wh e r e     I ,     I ,   ∩  Y   =     [ 24] .   W h e n   de a li ng  w i t h   a s s o c i a t i o n   r u l e s ,   t h e r e   a r e   two   v a l ue s   w hi c h   n e e to   b e   a n a ly z e d,   whi c h   a r e   s uppo r t   a n c o nf i de n c e   v a l ue s .   I t h e   c a s e   o f   S uppor t,   i f   s %   o f   t r a n s a c t i o ns   i c o n t a i n   X     t h e a s s o c i a t i o n   r u l e   f o r     b e   h a vi ng  s   a s   t h e   s uppo r v a l ue ;   w h e r e a s   f o r   t h e   c a s e   o f   C on f idenc e ,   i f   c %   o f   t h e   t r a n s a c t i o ns   i n   t h a t   c o n t a i n   a l s o   c o n t a i n   t h e n   t h e   a s s o c i a t i o n   r u l e   f o r     Y   b e   h a vi ng  c   a s   t h e   c o nf i de n c e   v a l ue .   A s s o c i a t i o n   r u l e s   mi n i ng  c a a l s o   b e   u s e t o   c a pt ur e   p o s i t i ve   a n ne ga t i v e   a s s o c i a t i o n   a m o n t h e   i t e m s   b a s e o n   t h e i r   f r e que n c y   o f   a pp e a r a n c e ,   e v e n t h o ugh   m a j o r   a s s o c i a t i o n   r u l e s   t e n to   g o   f o r   t h e   po s i t i v e   a s s o c i a t i o n   [ 25] .       4.   RE S UL T S   AN DI S CU S S I ON     T hi s   s e c t i o n   pr e s e n t s   t h e   r e s u l t s   o f   t h e   c o n duc t e r e s e a r c h   a n d i s c u s s i o n   r e l a t e to  i t .   T h e r e   a r e   f i v e   s ub - s e c t i o n s   he r e ,   wh e r e   e a c h   s u b - s e c t i o n   d i s c us s e s   r e s u l t s   f r o m   e a c s t e pe r f o r m e i t h e   t e x t   m i n i ng  o f   t h e   t a f s e e r   a n d   t r a n s l a t i o n   o f   Qur a n .   T h e   f i ve   s ub - s e c t i o n s   a r e   pr e pr o c e s s i ng  r e s u l t s ,   f e a t ur e   e x t r a c t i o r e s u l t s ,   m o s t   f r e que n t   w o r ds   m i n i ng  r e s u l t s ,   K - m e a ns   c l u s t e r i n r e s u l t s ,   a n a s s o c i a t i o n   r u l e s   r e s u l t s .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       T e x mining  appr oac he s   f or   analyz ing  an   indones i an  ta f s e e r   and   …  ( M e dia  A nuge r ah  A y u )   1473   4 . 1.     P r e p r oc e s s in o r   f e at u r e   s e l e c t ion   r e s u l t s   W h e n   i t   c o m e s   t o   f e a t ur e   s e l e c t i o n   r e s u l t ,   t h e   da t a s e t s   w o ul n o t   f o r m   a ny   m e a ni ng f u l   s e n t e n c e s   a nym o r e   a s   s o m e   wo r ds   t a ke n   a wa y   f r o m   t h e   da tas e t s .   F i gur e   s h o ws   s a m p l e s   o f   t h e   r e s u l t s   f r o m   f e a t ur e   s e l e c t i o n   s t a ge   o n   da t a   f r o m   t a f s e e r   i F i gur e   2( a )   a n t r a n s l a t i o n   i F i gur e   2( b ) I t   c a n   b e   s e e n   f r o m   t h e   pr e s e n t e s a m p l e s   t h a t   e a c h   wo r h a s   b e e n   t o ke ni z e d,   c a s e f o l de i n t o   uppe r c a s e ,   a n d   s t e m m e d.   T he   da t a   i F i gur e   a l s o   s h o ws   t h a t   t h e r e   a r e   s o m e   d i f f e r e n t   wor ds   a n s o m e   s im il a r   wo r ds   a s   t h e   r e s u l t s   o f   t h e     pr e - pr o c e s s i n o n t o   t h e   T a f s e e r   a n t h e   T r a n s l a t i o n .   F ur t h e r   pr o c e s s e s ,   l i ke   c l us t e r i n ( i n   S e c t i o n   4. 4)   a n a s s o c i a t i o n   r u l e s   ( i n   S e c t i o 4. 5)   w i ll   b e   a bl e   t s h o w h a t   c a n   b e   r e v e a l e d   f r o m   t h o s e   d i f f e r e nc e s   a n d   s i mi l a r i t i e s .         ( a )       ( b )     F i gur e   2 S a m p l e s   o f   pr e pr o c e s s i n g   o r   f e a t ur e   s e l e c t i o n   r e s u l t s   o f   t a f s e e r   a n t r a n s l a t i o n ,   ( a )   f e a t ur e   s e l e c t e s a m p l e s   o f   t a f s e e r   a n ( b )   f e a t ur e   s e l e c t e s a m p l e   t r a n s l a t i o n       4 . 2.     F e at u r e   e x t r ac t ion   r e s u l t s   TF I DF   a l go r i t hm   wa s   us e d   i t hi s   f e a t ur e   e x t r a c ti o n   pr o c e s s .   T a bl e   1   s h o ws   t h e   m a t r i x   pr o pe r t y   o f   t h e   t e r m   do c u m e n t   m a t r i c e s   ( T DM )   o f   t h e   t a f s e e r   a n t r a ns l a t i o n   da t a s e t .   T h e   t a f s e e r   c o n t a i ns   488  s i gnif i c a n t   t e r m s   f o r   t h e   T F I DF   c a l c u l a t i o n   w hil e   t r a n s l a t i o n   h a v e   116  t e r m s .   T h e s e   t e r m s   a r e   pr e s e n t e nd  a s   t h e   c o l u m n s   o f   t h e   t e r m   do c u m e n t   m a t r i x   a n t h e   o c c ur r e n c e   o f   e a c h   t e r m   i s   w e i g h t e f r o m   e a c h   do c um e n t .   T h e   tot a l   do c u m e n t s ,   o r   i n   t hi s   c a s e   s e n t e nc e s ,   o f   t he   t a f s e e r   wa s   18450  a n t h e   t r a n s l a t i o n   wa s   6234.   T h e     n o n - s pa r s e   e n t r i e s   o f   e a c h   m a t r i x   s h o a s   t he   n o nz e r o   e n t r i e s   a n t h e   s pa r s e   e n t r i e s   a r e   a s   t h e   z e r o s   e n t r i e s .   T h e   m a xim a l   l e n gt h   i t a f s e e r   wa s 14  wo r ds   o f   e a c h   do c u m e n t   a n 13  wo r ds   o f   e a c h   do c um e n t   f o r   t r a n s l a t i o n .   T h e   vi s ua li z a t i o n s   o f   wo r T F I DF   a r e   pr e s e n t e i F i gur e   f o r   b o t h   t a f s e e r   i F i gur e   3( a )   a n d   t r a n s l a t i o n   i F i gur e   3( b ) .   T h e   t wo   f i gur e s   s h o s i mi l a r   c ur v e   f o r   t h e   T F I D F   v a l ue s .   T h e r e   a r e   a r o un wo r d s   o r   t e r m s   w hi c h   h a v e   s i g ni f i c a n t   di f f e r e n c e   v a l ue s   c o m pa r e t o   t h e   ot h e r s .   F ur t h e r   di s c u s s i o n   a b o ut  t h o s e   n u m b e r s   is   pr e s e n t e o n   t h e   n e x t   s e c t i o n ,   i . e .   m o s t   f r e que n t   w o r m i ni ng  r e s u l t s .     4 . 3 .     M os t   f r e q u e n t   wor d s   m in in r e s u l t s   S i n c e   i t h e   f e a t ur e   e x t r a c t i o n   s t a ge   TF I DF   wa s   us e f o r   we i g h t i n t h e   t e r m   f r e que n c y ,   t h e n   t hi s   m o s t   f r e que n t   wo r ds   m i ni ng   i s   a n o t h e r   a uto m a t i c   r e s u l t   f r o m   t h e   T F I D F   a l go r i t hm .   F i gur e   s h o ws   t h e   b a r   p l o t   o f   t h e   30  m o s t   f r e que n t   wo r ds   i t h e   t a f s e e r   F i gur e   4( a )   a n d   t r a n s l a t i o n   F i gur e   4( b )   m e a s ur e b   TF I DF ,   r e s pe c t i v e ly .   B a s e o n   t h e   T F I DF   de f ini t i o n ,   t h o s e   w o r ds   a r e   t h e   m o s t   l i ke ly   t a ppe a r   i n   e a c s e n t e n c e   o f   t h e   t a f s e e r   a n t r a n s l a t i o n .   P r e vi o us   wo r k   s t udy i ng  f r e que n t   i t e m s   i n   t a f s e e r   o f   t h e   Qur a n   i M a l a y   [ 6]   ha s   r e po r t e 17  w or ds   t h a t   f r e que nly   a ppe a r e i n   t h e   t a f s e e r ,   whi c h   we r e a ku,   All a h ,   a pa bil a ,   b e r li ndu n g,   ka t a ka nl a h ,   ke j a h a t a n ,   m a k hl uk,   m a n u s i a ,   m a s uk,   m e n gua s a i ,   M u h a mm a d,   o r a n g,   pu l a ,   s e ka l i a n ,   t uh a n ,   uga m a ,   da n   w a h a i .   T h e   s t ud y   a l s o   r e po r t e t h a t   All a h ,   m u h a mm a d” ,   a n wa h a i   a r e   th e   m o s t   f r e qu e n t   o n e s   a m o n t h o s e   17  i t e m s .   C o m pa r i n g   to   o ur   r e s ul t s   a s   pr e s e n t e i n   F i gur e   4,   t h e r e   a r e   s o m e   wo r ds   whi c h   a r e   i n t e r s e c t i o n   b e t we e n   t h e m Al l a h ,   M u h a mm a d,   t uh a n ,   m a n us i a ,   a ga m a   ( n o t e uga m a   i n   M a l a y ) .   Only   t h o s e   f i ve   wo r ds   a r e   f o un i n   b o t h   w o r ks .   T hi s   i n d i c a t e s   t h e   i m po r t a n c e   o f   t h o s e   f i ve   wo r d s   i n   t h e   Qur a n   a n i t s   t a f s e e r   i n   d i f f e r e n t   l a n gua ge s .   W he r e a s   f o r   ot h e r   wor d s   whi c h   a r e   n o t   i n   t h e   i n t e r s e c t i o n ,   i t   c o ul b e   due   t o   t h e   d i f f e r e n c e   i t h e   wa y   o f   e x p l a ini ng  t h e   m e a ni ng  o f   t h e   a y a h ,   w hi c h   m a de   t h e   wo r ds   us a ge   wa s   n o t   t h e   s a m e   a s   we ll .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i Vo l .   25 ,   N o .   3 M a r c h   20 22 :   1469 - 148 0   1474   R e s u l t s   i F i gur e   pr e s e n t   f r e que n t   wo r ds   i t a f s e e r   F i gur e   4( a )   a n d   t r a n s l a t i o n   F i gur e   4( b )   o f   Qur a n .   I n   o r de r   to   kn o t h e   l e v e l   o f   c o r r e l a t i o b e t we e n   t a f s e e r   a n t r a n s l a t i o n ,   t h e   c a l c u l a t i o n   o f   pe a r s o n   c o r r e l a t i o n   c o e f f i c i e n t   n e e ds   t b e   do n e .   T h e   c or r e l a t i o n   o b s e r v a t i o n   i s   pe r f o r m e o n   t h e   m ut ua l   wo r ds   b e t we e n   t h e   t a f s e e r   a n d   t r a n s l a t i o n ,   t o   s e e   w h e t h e r   t h e   pa t t e r n   i s   t h e   s a m e   o r   n ot .   T h e   pa t t e r n   o b s e r v a t i o n   is   o n   h o m uc h   t h e   t e n d e n c y   o f   t he   f r e que n c y   o f   a   pa r t i c u l a r   wo r i n   t a f s e e r   a n t r a n s l a t i o n   b e i ng   a f f e c t ed   b y   e a c h   ot h e r .       T a bl e   1.   T h e   m a t r i x   pr o pe r t y   o f   T DM   o f   t h e   t a f s e e r   a n tr a n s l a t i o n   D a ta  s o ur c e   T e r ms   D oc um e nt s   N o n - s pa r s e   e nt r i e s   S pa r s e  e n tr i e s   M a x im a le ngt h   T a f s e e r   488   18450   234693   8768907   14   T r a ns la ti o n   116   6234   18815   704329   13           ( a )   ( b )     F i gur e   3.   T F - I DF   t e r m   f r e que n c y   p l o t s   o f   t h e   t a f s e e r   a n t r a n s l a t i o n ,   ( a )   t a f s e e r   T F I DF   p l o t   a n   ( b )   t r a n s l a t i o n   T F - I DF   p l o t           ( a )   ( b )     F i gur e   4.   T h e   30  m o s t   f r e que n t   wor ds   i n   t h e   t a f s e e r   a n tr a n s l a t i o n ,   ( a )   m o s t   f r e que n t   wor ds   i n   t a f s e e r   a n   ( b )   m o s t   f r e que n t   wor ds   i n   t r a n s l a t i o n   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       T e x mining  appr oac he s   f or   analyz ing  an   indones i an  ta f s e e r   and   …  ( M e dia  A nuge r ah  A y u )   1475   T h e   r e s u l t   o f   t h e   pe a r s o n   c o r r e l a t i o n   c o e f f i c i e n t   va l ue   i s   0. 5306.   T he   0. 5306  v a l ue   m e a n s   a   po s i t i ve   m o de r a t e   c o r r e l a t i o n   o f   wo r ds   o c c ur r e i n s i d e   b o t h   t h e   t a f s e e r   a n t h e   t r a n s l a t i o n .   T hi s   m e a n s   t h a t   t h e r e   i s   t e n de n c y   t h a t   t h e   hi g h e r   f r e que n c y   o f   t h e   wo r d   o c c ur r e i n   t a f s e e r ,   t h e   hi g h e r   f r e que nc y   o f   t ha t   w o r d   o c c ur r e i n   t r a ns l a t i o n ,   a n d   vi c e   ve r s a .   T h u s ,   e v e n   t h o ugh  t h e r e   a r e   s o m e   d i f f e r e n c e s   o t h e   m o s t   f r e qu e n wo r ds   b e t we e n   t h e   t a f s e e r   a n t r a ns l a t i o n ,   t h e r e   i s   a l wa y s   t e n de n c y   t h a t   t h e   s a m e   wo r ds   o c c ur r e i b o t h   o f   t h e m .   T hi s   i nf o r m a t i o n   i s   b e ne f i c i a l   in   e ns ur i n g   th a t   t h e   t a f s e e r   a n t r a n s l a t i o n   v e r s i o n   a r e   ha vi ng  t h e   s a m e   d i r e c t i o n s .   I n   o t h e r   wo r ds ,   o n e   c a n   t r us t   to   r e f e r   f r o m   b o t h   t a f s e e r   a n t r a n s l a t i o n   o f   t hi s   v e r s i o n   d ue   to   t h e   s a m e   pa tt e r n   o f   t h e   w o r ds .     4 . 4   K - m e an s   c l u s t e r in g   r e s u l t s   I n   t h e   K - m e a n s   c l u s t e r i n p ha s e ,   t h e   i n i t i a l   s t e wa s   t o   de t e r m i ne   t he   K   v a l ue   t h a t   wo ul b e   u s e in  t h e   c l us t e r i n pr o c e s s .   T h e   de t e r m i na t i o n   o f   t h e   b e s t   K   v a l ue   wa s   do n e   b a s e o n   i t s   S S E   e v a l ua t i o n .   F i gur e   s h o ws   t h e   S S E   C l us t e r   C e n t e r   P l o t   f o r   t a f s e e r   i n   F i gur e   5( a )   a n t r a n s l a t i o n   i F i gur e   5( b ) ,   r e s pe c ti ve ly .   As   c a n   b e   s e e n   o n   pr e s e n t e gr a ph s   i n   F i gur e   5 t h e   be s t   K   v a l ue   f o r   t h e   t a f s e e r   i s   o n   K = 1 a n f o r   t r a n s l a t i o n   i s   o n   K = 8.   T h us ,   t hi s   s t ud y   f o c us e s   o n   a n a ly z i ng  t h e   r e s u l t s   o f   a n 10  c l us t e r s   f o r   b ot h   o f   t h e   da t a s e t s .           ( a )   ( b )     F i gur e   5.   S S E   v s   c l us t e r   c e n t e r s   pl o t   f o r   t a f s e e r   a nd  t r a n s l a t i o n ,   ( a )   t a f s e e r   a n ( b )   tr a n s l a t i o n       T a bl e   s h o ws   t h e   c l us t e r i n r e s u l t   f o r   K = o f   t h e   t a f s e e r   a n t r a n s l a t i o n .   I s h o u l b e   n o t e t h a t   t h e   c l u s t e r i n n u m be r   i s   n ot   or de r e a n do e s   n o t   m a tt e r   i n   t h e   c l u s t e r i n c a s e .   T h e   c l us t e r   o f   t h e   t a f s e e r   s h o ws   wo r ds   k i t a b” ,   a n a k” ,   s i h i r ,   m e s i r ,   a ga m a ,   h a r u n ,   T uh a n ,   F i r a u n ,   B a ni   I s r a il ,   a n M us a .   T hi s   s h o ws   a   go o e x a m p l e   o f   o ne   c l us t e r i n g.   R e f e r r e to   t h e   Qur a n ,   t h e   P r o ph e t   M us a   s t or y   i s   n a r r a t e d.   T h e   s to r y   i s   a b o u t   t h e   du t y   o f   P r o ph e M us a   to  r e m i nd  F i r a u n   a n a c c o m pa ni e by   P r o ph e t   Ha r un .   T h e   p l a c e   wa s   i n   E g y pt   o r   M e s i r   wh e r e   t h e   b a m a g i c   o r   S i hi r   wa s   po pul a r   a t   t h a t i m e .         T a bl e   2.   C l us t e r i n r e s u l t s   w i t h   K = c l u s t e r s   C lu s te r   T a f s e e r   T r a ns la ti o n   1   K it a b, A na k, M ukj iz a t,  S ih i r , M e s ir , A ga ma , H a r un,  T uha n, F ir a un, I s r a il B a ni , M us a   P e tu nj uk, R a s ul , B e na r , M e ngi ngka r i,   K a f ir A z a b,  M e ndus ta ka n, K it a b, Q ur a n.   2   H a ti , P e r in ga ta n, A ja r a n,  H ukum, P e tu nj uk, Aga ma , K i ta b, Q ur a n   K it a b,  K ia ma t,  P e r in ga ta n, R a s ul , M us a K a f ir , N e r a ka , A z a b.   3   T a na h, P la n e t,   G unung, S ia ng,  H uj a n,  K e kua s a a n, B ul a n, M a la m, B e nda A la m, T a nda , M a ta ha r i,  A ir M e n c ip ta ka n, B in ta ng, M a hl uk, M a la ik a t,   L a ngi t,   B umi   B a ik , K e b e s a r a n, H uj a n,  T a nda , A ir G unung,  L a ngi t,   B umi   4   T ir mi d z i,  I ma m,  I bnu, I s ma il , A hma d, B ukha r i,   H ur a i r a h, A bu.   K a r uni a K a f ir H a ti , P e tu nj uk, M uha mm a d,  H a mba , R a s ul , B e r i ma n.   5   B a la s a n,  P a ha la , K e hi dupa n, B e r ha la , D o s a , H a mba K a f ir , N ik ma t,  N e r a ka S ur ga , A ma l,  A z a b, A khi r a t,  D uni a .   K e ni kma ta n, B e r ta qw a K e ba ji ka n,  K e ka l,   P e tu nj uk,  L ur us , S unga i,  S ur ga , M a nus ia .   6   H a ti , P e r in ga ta n, A ja r a n,  H ukum, P e tu nj uk, Aga ma , K i ta b, Q ur a n   P e tu nj uk,  J a nj i,  J a la n, A z a b, F ir a un,  K it a b,  R a s ul , M uh a mm a d, T a nda , B e na r   7   D o s a , K ia ma t,  P e r e mpua n,  L a ki T e mpa t,   K a f i r .   B e r d o a , R a hma t,  Q ur a n, A z a b, P e nga mpun,  P e nga s ih , P e n y a y a ng.   8   I s ti dr a j,  I s ti a da t,  I s r a f i l,  I s r a il , I s ta na , I s ti la h, I s te r i,   P e tu nj uk,  M a la ik a t   B e r im a n, I s tr i,  A z a b, A khi r a t,  Y a ti m, Dunia H a r ta , N ik ma t,  P e r e mpua n,  L a ki     Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i Vo l .   25 ,   N o .   3 M a r c h   20 22 :   1469 - 148 0   1476   S e e i n t h e   m e m be r s   o f   t h e   c l u s t e r   3   i n   t h e   t a f s e e r ,   t h i s   c l u s t e r   c o n t a i n s   a s t r o n o m i c a l   t e r m s ,   f o r   e x a m p l e   P l a ne t ,   B u l a n ,   B i n t a n g” ,   M a t a ha r i ,   L a n g i t   a n B u mi .   T hi s   c l u s t e r   m i g h t   b e   a   pa r t i t i o a b o ut   t h e   pe r s pe c t i v e   o f   u ni ve r s e   c r e a t i o f r o m   Qur a n .   An o t h e r   i n t e r e s t i n c l u s t e r   r e s u l t   i n   t a f s e e r   i s   t h e   c l u s t e r   whi c h   a r e   t h e   n a m e   o f   h a d i t h   n a r r a to r s ,   whi c h   m a ke   a   go o c l u s t e r   a s   we l l .   I n   c l us t e r   o f   t h e   t a f s e e r ,   t h e   wo r ds   qui t e   i n t e r e s t i n g,   a s   i t   c o n t a i ns   pa i r   o f   o ppo s i t e   wo r ds ,   s uc h   a s   n e r a ka   a n s ur ga ,   h a m ba   a n ka f i r ,   o r   pa h a l a   a n do s a .   I t   c a n   b e   s e e n   h e r e   t h a t   i n   t h e   t a f s e e r ,   t h e   b a a n t h e   goo a r e   n a r r a t e to ge t h e r   i n   o n e   c a s e   s o   t h e y   b e c o m e   c l o s e   a n ge t   i n t o   o n e   c l us t e r .   C l us t e r   a l s o   s h o ws   a   goo d   e x a m p l e   o f   o n e   c l us t e r   t h e m e   b e c a u s e   o f   t h e i r   top i c   c l o s e n e s s ,   a b o ut   Qur a n   a n d   Ki t a b   a s   l a ws   o f   M us li m s   whi c h   a l r e a d y   d i s c us s e i n   t h e   l i t e r a t ur e   r e vi e w.   T h e   r e s u l t s   o f   c l u s t e r i n g   f r o m   t h e   t r a n s l a t i on   a r e   n o t   a s   c l e a r   a s   t h e   t a f s e e r .   T h e r e   a r e   s o m e   s a m e   wo r ds   a ppe a r e o n   e a c h   c l us t e r ,   f o r   e x a m p l e ,   t h e   wor A z a b   a n P e t unj uk”   w hi c h   m a ke s   i t   d i f f i c u l t   to  de c i de   t h e   m a i t o pi c   o f   e a c h   c l u s t e r .   T h e n ,   t h e   i n f o r m a t i o n   w hi c c a n   be   a c qu i r e d   i s   t h a t   t h e   d i s t a n c e   o f   e a c h   wo r i n   t r a n s l a t i o n   a r e   n o t   r e a l ly   f a r   f r o m   e a c h   o t h e r .   M e a ni ng,   us i ng  T F     I DF   w e i g h t i n m e t h o d,   t h e   t e r m   m o s t   l i ke ly   a pp e a r s   o n   e a c h   do c u m e n t   t h e   s a m e   a m o u n t   o f   t i m e s .     Ne x t ,   o b s e r v a t i o n   wa s   do ne   t o   t h e   r e s u l t s   pr e s e n t e i T a bl e   3   f o r   K = 10.   F o r   t h e   c a s e   o f   t a f s e e r ,   t h e r e   a r e   f i ve   c l us t e r s   w hi c a r e   s im il a r   w i t h   t he   p r e vi o us   r e s u l t .   W h e r e a s   f o r   t h e   c a s e   o f   t r a ns l a t i o n ,   i t   s t a r t s   to   ge t   c l e a r e r   f o r   s a m e   c l us t e r s .   A s   f o r   e x a m p les ,   t h e   wo r ds   m a t a ,   a i r ,   b a l a s a n ,   b a i k” ,   t a m a n” ,   b ua h” ,   pe n g h u ni ,   ke ni k m a t a n ,   m e n g a l i r ,   ke k a l ,   s u n ga i ,   a n d   s ur ga   a r e   go   to   o n e   c l us t e r   in  t r a n s l a t i o n .   Ho we v e r ,   o v e r a l l ,   de t e r m i n i ng  t h e m e   o f   t h e   t r a n s l a t i o n   c l u s t e r   r e s u l t   i s   s t i l l   n o t   e a s y   t o   b e   de c i de d .         T a bl e   3.   C l us t e r i n r e s u l t s   w i t h   K = 10  c l u s t e r s   C lu s te r   T a f s e e r   T r a ns la ti o n   1   M una f ik L a r a nga n,  K e me na nga n, M us uh, Ya hudi , I br a hi m, M e ka h,  P e r a ng, M us y r ik K a f ir .   H a ti L a ngi t,   H a mba T o ba t,   B umi , Q ur a n,  M uha mm a d, B e r im a n   2   I s ti dr a j,  I s te r i,   I s r a f il , I s r a il I s ta na , P e tu nj uk, M a la ik a t   G e mbi r a , P e r ja la na n,  K a f ir , C e la ka la h, M a nus ia B e r im a n,  K e b e na r a n, P e r in ga ta n.   3   N e ge r i,   T a nda , N uh, S e ta n, N ik ma t,  H a ti K ia ma t,   K a f i r , N e r a k a .   M a la ik a t,  H a mba , B e na r , S a ha y a , I s tr i,  A na k,  P e r e mpua n,  L a ki .   4   N ik ma t,  H a mba , Q ur a n, A ja r a n, S ur ga , U ma t,  B a ik K e s e na nga n,  K e ba ha gi a a n, N e r a ka , K a f i r K e hi dupa n, A z a b, H id up, Akhir a t,   D uni a .   S a pi T a kut , B umi , M a la m, F ir a un,  H a r un,  K e kua s a a n, K e b e s a r a n,  T a nda .   5   I s a , H ud, E s a , M us y r ik , S e mba h, B e r ha la , P a tu ng,  T uha n.   D iu tu s A z a b, U ma t,  Y a ti m, Nuh, H a r ta , A na k, R a s ul .   6   D a w ud, Abdullah, U ma r , T ir m id z i,   I ma m, Ahma d, I bnu, B ukh a r i,   M us li m, Abu, H ur a ir a h, S a bda .   M a ta , A ir , B a la s a n, B a ik , T a ma n, B ua h, P e nghuni,  K e ni kma ta n, M e nga li r K e ka l,  S unga i,  S ur ga .   7   J a la n, K e ba ji ka n, B u r u k, B a la s a n, S i f a t,  I s te r i,  I bu, S u r ga , S a le h,  P a ha la , P e r e mpua n,  L a ki H a mba , H a r ta , A ma l,  D o s a , A na k.   A ir , G o l o nga n, D uni a G unung, W a kt u, N e g e r i,   M uha mm a d, M a l a ik a t,  B a ik , K ia ma t,  M a nus ia , A z a b,  N e r a ka .   8   H a r un,  H a ti , S ih i r , U ma t,  P e tu nj uk,  K a um,  M ukj iz a t,   K e be na r a n,  T a u r a t,  F ir a un, B a ni I s r a il , K it a b, M us a .   P e tu nj uk, Nikmat, M uha mm a d, D us ta ka n, A z a b,  K a f ir .   9   T u mbuha n, P la ne t,   B ul a n,  K e kua s a a n,  T a nda , B e nda T a na h,  G unung, Ala m, M a ta ha r i,  H uj a n, C ip ta , M a hl uk, B in a ta ng, Air ,   L a ngi t,   B umi .   A z a b,  K a f i r K e r a ja a n,  T a nda , J a nj i,  R a s ul , B umi L a ngi t,   B e s a r   10   I br a hi m, M e n y a mpa ik a n, H a mba , M a hl uk, Utus a n, L a ki , W a h yu,  J ib r il L ut , A da m, M a la ik a t.   P uj i,  Z a li m, Dis e mba h,  E s a , L a ngi t,   B umi , A z a b,  P e nga s ih .       R e s u l t s   f r o m   K - m e a n s   c l u s t e r i n ha v e   s h o wn  t h a t   wi t h   K = t h e   c r e a t e c l us t e r s   f r o m   t h e   t a f s e e r   h a v e   c o nv e r ge t o b vi o us   t h e m e s .   Ho we v e r ,   t h e   c a s e   f o r   t r a n s l a t i o n   wa s   d i f f e r e n t wh e r e   t h e   c r e a t e d   c l u s t e r s   h a v e   n o t   s h o wn   c l e a r   t h e m e s .   T h e   m a j o r   r e a s o n   f o r   t a f s e e r   t o   s h o c l e a r   gr o up i n i e a c h   c l u s t e r   i s   t ha t a f s e e r   us ua ll y   na r r a t e a n de s c r i be s i mi l a r   t o pi c s   i n t o   o n e   s t o r y ,   s uc a s   s t o r y   o f   M us a   a n F i r a u n ,   Qur a a s   M us li m s   L a w,   a n d   As t r o n o m i c a l   C r e a t ur e s .   T he s e   k i nd s   o f   s t r uc t ur e s   we r e   n o t   t h e   c a s e   f o r   t h e   t r a n s l a t i o n .   T r a n s l a t i o n   m o r e   i n t o   j us t   tr a n s l a t i n t h e   s a yi ng  f r o m   A r a bi c   to   I n do n e s i a n   f o r   e a c h   a y a h   i t h e   s ur a h ,   whi c n o a l wa y s   c o nv e r ge   to   s i mi l a r   to pi c .       4 . 5   As s oc iat ion   r u l e s   r e s u l t s   R e s u l t s   o f   i n t e r e s t i n a s s o c i a t i o n   w i t hi n   t h e   t a f s e e r   a n t r a n s l a t i o n   a r e   pr e s e n t e i n   t hi s   s e c t i o n .   F i gur e   s h o ws   t h e   a s s o c i a t i o n   o f   t h e   wo r All a h   f r o m   t r a n s l a t i o n   da t a s e t .   E x c e pt   t h e   wo r d   ka f ir ,   a l l   o f   a s s o c i a t i o ns   a r e   s h o w i n po s i t i v e   s e n t i m e n t s .   H i g h   s upp o r v a l ue s   a r e   s h o wn   f r o m   t h e   a s s o c i a t i o n   o f   wo r d   All a h   w i t h   m e m be r i   w hi c h   m e a ns   t o   gi v e ,   pe t unj uk”   w hi c h   m e a ns   gu i d a n c e ,   a n pe ny a y a n g ”  whi c h   m e a ns   l o vi ng .   T h e   s uppo r t   v a l ue   o f   t h e   a s s o c i a t i o n   w i t h   wo r ka f i r   w hi c h   m e a n s   n o n - b e li e v e r   i s   0. 004  a n t h e   c o nf i de n c e   i s   0. 957,   m e a ni ng  f r o m   th e   w h o l e   t r a n s l a t i o n   do c u m e n t s ,   0. 4%   o c c ur r e n c e   to ge t h e r   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       T e x mining  appr oac he s   f or   analyz ing  an   indones i an  ta f s e e r   and   …  ( M e dia  A nuge r ah  A y u )   1477   t h e   t e r m   All a h”   a n ka f i r   i n   o n e   do c u m e n t .   I n   a dd i t i o n ,   95. 7%   o f   t h e   do c um e n t s   i n   t h e   t r a n s l a t i o n   c o n t a i n   t e r m   All a h   a l s o   c o n t a i n   k a f i r .   T o   s e e   t h e   m e a ni ng  o f   t hi s ,   f ur t h e r   r e f e r e n c i ng  i s   do ne   by   l o o k i ng  up  i n to  t h e   t r a n s l a t i o n   da t a s e t .   On e   s a m p l e   f r o m   t hi s   a s s o c i a t i o n   i s   S ur a h   An - Na hl   Ay a h   106 107.   T h e   a y a h s   s h o w   t h a t   Al l a h   a l wa y s   n a r r a t e   o n   h o t h e   b a f a t e   wo u l c o m e   t o   ka f e e r ,   whi c h   a r e   p e o pl e   w h o   de ny   t h e   t r u t h   o f   All a h .   T h e   ot h e r   t hi n i s ,   t h e r e   a r e   wor ds   h a vi ng  s e v e r a l   d i f f e r e n t   s uppo r t   a n c o n f i d e n c e   v a l ue s   w h e n   t h e a r e   a s s o c i a t e w i t h   d i f f e r e n t   wo r ds   a s   we l l .   F o r   e x a m p l e ,   w h e n   t h e   wo r d   j a l a n   a s s o c i a t e w i t h   o nl y   t he   wo r All a h ,   t h e   s up po r t   a n c o nf i de n c e   va l u e   i s   0. 005  a n 0. 810.   Ho we v e r ,   wh e t h e   wo r j a l a n”   a s s o c i a t e w i t h   wo r All a h   a n a l s o   wo r ke b a i ka n” ,   t h o s e   v a l ue s   a r e   0. 003  a n 0. 833.   T h e   o t h e r   a s s o c i a t i o n   o f   t h e   wo r j a l a n   i s   w i t h   ka f i r   by   va l ue s   0. 04  a n 0. 957.   T hi s   k i nd  o f   o c c ur e n c e s   a l s o   a pp l i e d   to  s o m e   ot h e r   wor ds .             F i gur e   6.   A   r e s u l t   o f   a s s o c i a t i o n   r u l e s   pr o c e s s   o n   tr a ns l a t i o n   da t a s e t       F o r   t h e   c a s e   o f   t a f s e e r ,   F i gur e   7   s h o ws   t h e   r e s u l t s   f r o m   t h e   a s s o c i a t i o n   r u l e s .   T h e   wo r i s r a i l ,   m u s a ,   a n d   b a ni   a r e   i n   t h e   s a m e   va l u e s   o f   s uppo r t   a n c o nf i de n c e ,   w hi c h   i s   0. 1%   o f   t h e   wh o l e   do c um e n t s   c o n t a i n   t h e i r   u ni o n   a n 54%   o f   t h e   do c um e n t s   c o n t a i n s   t h o s e   wo r ds .   T o   c o m pa r e   w i t h   t h e   pr e vi o us   c l u s t e r i n r e s u l t ,   t hi s   i s   a l s o   r e l a t e to  t h e   c l us t e r   1   whi c h   c o n t a i n s   t h o s e   wo r ds   a n th e   wo r Ha r u n .     F r o m   b o t h   a s s o c i a t i o r u l e   r e s u l t s ,   i t   c a n   be   o bs e r v e d   t h a t   t h e r e   a r e   r e l a t i o n s   w i t h   t h e   pr e vi o us   r e s u l t s ,   f r e que n t   pa tt e r n   m i n i ng  a n c l u s t e r i n r e s u l t .   T h e   s e que n c e   e x a m p l e   o f   t h e   i nf o r m a t i o n   r e t r i e v a l   f r o m   t hi s   r e s u l t   i s ,   a f t e r   kn o w i n t h a t   M u s a   i s   o n e   o f   t h e   m o s t   f r e que n t   w o r i n   t h e   t a f s e e r   a n t r a n s l a t i o n ,   t h e o n e   c a n   f i nd  t h e   c l us t e r   M us a   i n   t h e   c l u s t e r i n g   r e s u l t .   Ne x t ,   f ur t h e r   i nf o r m a t i o n   a b o ut   t h e   a s s o c i a t i o n   o f   e a c h   wo r i n   t h a t   c l us t e r   c a n   be   de t e r m i ne by  t hi s   r e s u l t .   B y   do i n t hi s   s e qu e n c e ,   kn o w l e dge   t h a t   t h e   P r o ph e t   M us a   d i a   dut y   f r o m   All a t o   r e m i nd  t h e   F i r a u n   c a n   b e   r e v e a l e d A s   w e l l ,   a b o ut   M us a   wh o   t h e Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i Vo l .   25 ,   N o .   3 M a r c h   20 22 :   1469 - 148 0   1478   a s ke All a h   A z z a   W a   J a l l a ,   t h a t   h e   w a n t e hi s   b r ot h e r ,   P r o ph e t   Ha r un   to   ac c o m pa ny   him   i t h i s   du t y .   Al s o ,   i n f o r m a t i o n   t h a t   t h o s e   too k   pl a c e   i n   M e s i r   w hi c h   i s   E gy pt   n o w.     S e v e r a l   b e n e f i t s   c a n   b e   dr a wn   f r o m   k n o w i n t h e s e   a s s o c i a t i o n   r u l e s   r e s u l t s .   T h e   f i r s t   po s s i bl e   b e n e f i t   i s   t o   e n a bl e   t h e   I s l a mi c   s c h o l a r s   a n m u s li m s   t o   kn o a n d/o r   r e v e a l   c o nn e c t i o n s   in   a   c e r t a i n   to pi c   t h a t   t h e y   wo u l li ke   t o   l e a r n   f ur t h e r .   F o r   e x a m p l e ,   s a y   o n e   w a n t s   to   kn o a b o u t   P r o ph e t   M us a   by   r e f e r r i n t I n do n e s i a T a f s e e r .   W i t h o u t   kn o w i n t h e   a s s o c i a t i o n   r u l e ,   h e /s he   mi g h t   j us t   f o c us   o nly   t o   t h e   wo r d   M us a   i t h e   t a f s e e r   a n ha v e   t o   r e a t h e   wh o l e   s e n t e n c e s   i t h e   t a f s e e r   a b o ut   M us a   t o   b e   a bl e   t o   d r a v a l ua bl e   i n f o r m a t i o n   a b o ut  P r o ph e t   M us a .   H o we v e r ,   by   k n o w i n g   a n ha vi ng   t h e   a s s o c i a t i o n   r u l e s   l i s t   o f   t h e   wo r d   M us a ,   i ns i g h t   kn o w l e dge   w il l   be   a bl e   to   b e   ga i n e f a s t e r .   F o r   i ns t a n c e ,   us i ng  ( M us a ,   M e s i r ) - A ga m a   o r   ( M us a ,   B a n i   I s r a il ) - >   A ga m a ,   o n e   c a n   t a ke   a   l o o a t   t h o s e   w o r ds   to  f o c us   i n   s e a r c hi ng   i n f o r m a t i o n   a b o ut  P r o ph e M us a .     An o t h e r   b e n e f i t   i s   i n   b us i ne s s ,   s pe c if i c a ll y   o nli ne   b o o ks to r e s   or   l i b r a r i e s .   S a y   o n e   us e r   a c c e s s e s   t a n   o nli ne   b o o k   s tor e   o r   l i br a r y   a n i s   i n t e r e s t e i n   b o o k   t a gge M us a   a s   t h e   ke y wo r d.   T h e n ,   t h e   s y s t e m s   c o ul b e   a bl e   t o   gi v e   w h a t   k i n o f   b o o ks   t h a t   m igh t   i n t e r e s t s   t h e   us e r   a n c r e a t e   a   pr e f e r e n c e   b o ok  f o r   t h e   us e r .   B e c a us e   i t a f s e e r   t h e   wo r M us a   ha s   a s s o c i a t i o n   r u l e   w i t h   M e s i r   a n d/o r   B a ni   I s r a i l ,   t h e   s y s t e m s   c a n   g i ve   s ugge s t i o n   a n r e c o m m e n da t i o n   f o r   b ooks   whi c h   t a gge w i t h   wo r ds   M e s i r   a n d/o r   B a ni   I s r a i l .   O f   c o ur s e ,   t o   b e   a bl e   t o   do   t h a t ,   i t   n e e ds   f ur t h e r   pr o c e s s .   Ho we v e r ,   t h a t   i s   t h e   ge n e r a l   t hi n g   t h a t   t h e   a s s o c i a t i o n   r u l e s   c a n   pr o vi de   f ur t h e r   a s s i s t a n c e   i n   b us i ne s s   a r e a .           F i gur e   7.   A   r e s u l t   o f   a s s o c i a t i o n   r u l e s   pr o c e s s   o n   ta f s e e r   da t a s e t       5.   CONC L USI ON   T hi s   r e s e a r c h   s t ud y   ha s   c o n duc t e a   t e x t   m i n i ng   o n   I n do n e s i a n   t a f s e e r   a n t r a n s l a t i o n   o f   Qur a t h r o ugh   s e v e r a l   a ppr o a c he s ,   i . e .   m o s t   f r e que n t   wo r ds ,   K - m e a n s   c l u s t e r i n g,   a n a s s o c i a t i o n   r u l e s V a l ua bl e   i n f o r m a t i o n   f r o m   t a f s e e r   a n d   t r a n s l a t i o n   i s   s uc c e e d e to   b e   o b t a i n e d   t h r o ugh   t h e   t e x t   m i n i ng  pe r s pe c ti ve .   T he   30  m o s t   f r e que n t   wo r ds   i ns i de   t h e   t a f s e e r   a n t r a n s l a t i o n   we r e   pr e s e n t e a n d   s h o w i n 17  m ut ua l   wo r ds   f r o m   t a f s e e r   a n t r a n s l a t i o n   o c c ur r e i n   t h e   30  r a n k i n g.   T h e   c o r r e l a t i o n   r e s u l t   s h o ws   t h a t   t h e   m ut ua l   wo r ds   f r o m   t a f s e e r   a n t r a n s l a t i o h a vi ng  0. 5306  v a l u e ,   m e a nin t he r e   i s   t e n de n c y   t ha t   t h e   hi g he r   f r e que nc y   o f   t h e   wo r d   o c c ur r e i n   t a f s e e r ,   t h e   hi g h e r   f r e que n c y   a l s o   o c c ur r e i n   t r a n s l a t i o n ,   vi c e   v e r s a .   T hi s   r e s u l t   t e l l s   us   t h a t h e   t a f s e e r   a n t r a n s l a t i o n   o f   t hi s   ve r s i o n   m o s t   l i ke ly   t o   e x c h a n ge   i n f o r m a t i o n   w i t t h e   s im il a r   m e a ni ng  a n t h e r e   i s   l e s s   n a t ur a l   l a n gua ge   pr o c e s s i ng  pr o bl e m   i n   b o t h   da t a s e t s .   T h e n ,   t h e   c l us t e r i n r e s u l t s   o f   t a f s e e r   a nd   t r a n s l a t i o n   a r e   o b t a i ne us i ng  t h e   K - M e a ns   t e c hni que .   T he   b e s t   pa r t i t i o n   r e s u l t   s h o w n   by   t h e   t a f s e e r   w i t Evaluation Warning : The document was created with Spire.PDF for Python.