I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   18 ,   N o .   2 M a y   20 20 ,   pp .   100 4 ~ 1014   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 8 .i 2 . pp 100 4 - 1014             1004       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   W e i g h t e d   i n v e r s e   d o c u m e n t   f r e q u e n c y   a n d   v e c t o r   sp a c e   m o d e l   f o r   h a d i t h   s e a r c h   e n g i n e       S e p tya  E gh o   P r atam a 1 ,   Wah yu d i n   D ar m al a k s an a 2 ,   D i an   S a’ad i l l ah   M ayl aw ati 3   H am d an   S u gi l ar 4 ,   Te d d y   M an to r o 5 ,   M u h amm ad   A l i   R a m d h an i 6   1 , 3 , 6 D e pa r t m e n t   o f   I n f o r m a t i c s ,   U I N   S un a G unung   D j a t i   B a n dung ,   I nd o ne s i a   2 D e pa r t m e n t   o f   l l m H a d i t s ,   U I N   S una n   G unu ng   D j a t i   B a ndung ,   I ndo ne s i a   4 D e pa r t m e n t   o f   M a t h e m a t i c   E d uc a t i o n,   U I N   S una G u nung   D j a t i   B a ndung ,   I ndo ne s i a   5 D e pa r t m e n t   o f   C o m put e r   S c i e nc e ,   S a m po e r na   U n i v e r s i t y ,   I ndo ne s i a       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e A ug   24 ,   201 9   R e v i s e O c t   25 ,   2 019   A c c e pt e N o v   1 1 ,   201 9       H a di t i s   t h e   s e c o nd  s o ur c e   o f   I s l a m i c   l a w   a f t e r   Q ur a w h i c m a ke   m a ny   t y pe s   a nd  r e f e r e nc e s   o f   ha d i t h   ne e t o   be   s t ud i e d.   H o w e v e r ,   t he r e   a r e   no t   m a ny   M us l i m s   kno w   a bo u t   i t   a nd  m a ny   e v e ha v e   di f f i c ul t i e s   i s t udy i n g   ha di t hs .   T hi s   s t udy   a i m s   t o   bu i l a   ha d i t s e a r c e ng i ne   f r o m   r e l i a b l e   s o ur c e   b y   ut i l i z i ng   I nf o r m a t i o n   R e t r i e v a l   t e c hn i que s .   T he   s t r uc t ur e d   r e p r e s e n t a t i o n   o f   t he   t e x t   t ha t   us e d   i s   B a g   o f   W o r d   (1 - t e r m )   w i t h   t h e   W e i g ht e d   I nv e r s e   D o c um e nt   F r e q ue nc y   ( W I D F )   m e t ho t o   c a l c u l a t e   t he   f r e que nc y   o f   oc c ur r e n c e   o f   e a c t e r m   be f o r e   b e i ng   c o n v e r t e d   i v e c t o r   f o r m   w i t h   t h e   V e c t o r   S pa c e   M o de l   ( V S M ) .   B a s e d   o t he   e x pe r i m e nt   r e s u l t s   us i ng   38 t e x t s   o f   ha d i t h,   t h e   r e c a l l   v a l ue   o f   W I D F   a nd  V S M   i s   9 6% ,   w hi l e   p r e c i s i o v a l ue   i s   j u s t   a r o und  35 . 4 6% .   T hi s   i s   be c a u s e   t he   s t r uc t ur e d   r e pr e s e nt a t i o f o r   t e x t   t h a t   u s e d   i s   ba g   o f   w o r ds   (1 - g r a m )   t h a t   c a no t   m a i n t a i n   t h e   m e a n i ng   o f   t e x t   w e l l ) .   Ke y w or ds :   Cl a s s i f i c a t i o n   Co n v o l ut i o n a l   n e u ra l   n e t w o r k   D e e l e a rni n g   G l o ve   In do n e s i a l a n gu a ge   p r o c e s s   N a t u ra l   l a n gu a ge   p r o c e s s i n g   T e xt   m i ni n g   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   D i a S a a di l l a h   M a y l a w a t i   D e p a rt m e n t   o f   In f o r m a t i c s ,     U IN   S un a G u n u ng  D j a t i   B a n du n g ,     J l .   A . H .   N a s u t i o n   10 5,   B a n du n g ,   40614 ,   I n do n e s i a   E m a i l :   di a n s m @ ui n s gd. a c . i d       1.   I N TR O D U C TI O N     H a di t h   a r e   a l l   t h e   w o r ds ,   de e ds ,   de c r e e s   a n d   a pp r o v a l s   o f   t he   P r o p h e t   M u ha m m a d   w h i c h   a r e   m a de   pr o v i s i o n s   o l a w s   i n   Is l a m .   H a di t h   i s   us e d   a s   a   s o ur c e   o f   l a w   i n   Is l a m   b e s i de s   t h e   Q u r' a n,   Ij m a’   ( t h e   a g r e e m e n t   of   t h e   s c h o l a r s   i n   e s t a b l i s h i ng  a   l e ga l   l a w   i n   r e l i gi o n   b a s e on   t h e   Q u r ' a n   a nd  H a di t i n   a   c a s e   t h a t   o c c ur r e d)   a n Q i y as   (e s t a b l i s a   l a w   fo r   a   n e w   c a s e   t h a t   do e s   n o t   e xi s t   y e t ),   w h e r e   i n   t h i s   c a s e ,   t h e   po s i t i o n   o f   t h e   h a di t i s   t h e   s e c o n d   s o ur c e   o f   l a w   a f t e t h e   Q u r ' a [1 - 5] .   S t udy i n g   a n d   p r a c t i c i n g   t h e   c o n t e nt s   o f   t h e   ha di t c o n t e n t   i d a i l y   l i f e   i s   hi g hl y   i m po r t a n t   f o r   M us l i m s   [6] .   H ow e v e r ,   m a ny   f a ke   h a di t h s   t ha t   a ppe a r,   i t   i s   n e c e s s a r y   t o   h a v e   a   s e l e c t i v e   i s t udy i n ha d i t h.   M a n y   w e a a n f a ke   h a di t h s   a re   c i r c ul a t i ng  a m o n M us l i m s   b e c a us e   of   t h e   l a c k   of   s e l e c t i v e   n a t u r e   i h e a r i ng  t h e   ha di t h,   a s   a   r e s ul t   t h e r e   a r e   i rr e gu l a ri t i e s   i s o c i a l   l i f e .   It   i s   n e c e s s a r y   t o   s t ud y   t h e   h a di t r e qu i r e by   a   m o r e   e xpe rt   t o   e xpl a i t h e   ha d i t a nd  r e f e r e n c e s   t h a t   ha v e   b e e n   g ua ra n t e e c o rr e c t .   S e a r c h   e n gi n e   t e c hn o l o gy   a s   o n e   o f   In f o r m a t i o T e c hn o l o g y   i m pl e m e n t a t i o i s   a   c o m pu t e p r o gra m   t h a t   de s i g n e t o   s e a r c s pe s i f i c   da t a   b a s e o n   i n pu t   ke y w o r ds   [7 - 9] .   M o s t   o f   t h e   s e a r c h   e n gi n e s   t h a t   a l r e a dy   e xi s t   a nd  a r e   w i de l y   us e t o da y   pr o v i de   t h e   r e s ul t s   o f   da t a   a c qui s i t i o n   t h a t   ha s   b e e n   s o rt e b a s e o n   t h e   l e v e l   of   r e l e v a n c e   o f   t h e   ke y w o r ds   w e   i n pu t .   T o da y ,   s e a r c e n g i n e   t e c hn o l o g y   i s   m o r e   t h a d a t a b a s e   que r y .     T o   i n c r e a s e   t h e   l e v e l   of   r e l e v a n c e   of   da t a ,   s e a r c e ngi n e s   c a n o t   b e   s e pa ra t e f r o m   t h e   I n f o r m a t i o n   R e t ri e v a l   (IR a nd  T e xt   M i n i ng   ( T M ).   IR   i s   r e l a t e w i t h   T M   m e t h o d,   e i t h e r   t e xt   c l a s s i f i c a t i o n   o r   t e xt   c l a s t e ri z a t i o n t o   f i nd  t h e   b e s t   r e s ul t   b a s e o n   i n pu t   ke y w o r ds   [8,   10 ,   1 1] .   E v e n,   G oo gl e   S e a r c h   E n gi n e   [12] ,   G o o gl e   S c h o l a r   [ 1 3] Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       W e i ght e i nv e r s e   doc um e n t   f r e qu e nc y   and   v e c t or   s pa c e   m od e l   f or   hadi t h   s e ar c h…   ( Se pt y a   E g ho  P r at am a )   1005   a n a n o t h e r   b us s i n e s s   a n d   m a r ke t i n g   us i n g   S e a r c h   E n g i n e   O pt i m i z a t i o (S E O )   [9 ,   14 ,   1 5] ,   c o n t i n ue s   t o   g r o w   a n d   i n c r e a s i n g l y   s o ph i s t i c a t e d.   N o t   o nl y   us e   t e xt   d a t a ,   b ut   a l s o   us e   a n o t h e u n s t r uc t u r e   da t a   s uc a s   i m a ge   a n d   s o un a s   a   ke y w o r d s.   P r o duc i n t h e   b e s t   r e s ul t   f r o m   s e a r c e n gi n e   i s   v e r y   r e l a t e w i t h   t h e   a l go ri t hm   t h a t   us e d.   I t h e   pr e v i o us   r e s ul t .   T h e r e   a r e   s o   m a n y   IR   t e c hn i q ue   f o r   s e a r c h   e n gi n e   r e s e a r c h   w i t h   v a ri o us   a l go ri t hm s ,   s uc a s   P r i n c i pa l   Co m po n e n t   A na l y s i s   [16] ,   N a i v e   B a y e s   Cl a s s i f i c a t i o n   [17] ,   a n t h e   w i de l y   us e i s   V e c t o r   S pa c e   M o de l   (V S M [18 - 23 ] .   T hi s   a l go r i t h m   i s   us e t o   m e a s u r e   t he   s i m i l a ri t y   b e t w e e n   a   do c um e nt   a n d   a   q ue r y   b y   w e i ght i n g   t h e   w o r ds .   T h e   do c um e n t   i s   s e e n   a s   a   v e c t o r   t ha t   ha s   di s t a n c e   a nd  d i r e c t i o [24] .   I n   t h e   V S M ,   a   t e rm   i s   r e p r e s e n t e b y   a   v e c t o r   s pa c e   di m e n s i o n.   T h e   s i m i l a ri t y   p r e s e n t a t i o n   r e s ul t s   f r o m   c a l c ul a t i n t h e   m a t c b e t w e e n   t h e   v e c t o r   o f   a   que r y   a n d   a   do c um e nt   t ha t   ha s   p r e v i o us l y   un de r go n e   a   p r o c e s s   of   T M   a nd  w e i ght i n g   of   t h e   w o r f i r s t .   W o r w e i ght i ng  i s   r e l a t e t o   t h e   w o r ki n gs   of   t h e   V S M   a l go r i t hm .   W o rd  w e i gh t   i s   o b t a i n e f r o m   t h e   c a l c ul a t i o o f   t h e   n u m b e r   o f   w o r ds   c o n t a i n e d   i t he   do c um e n t   d i v i de by   t h e   n u m b e r   o f   doc um e n t s   c o n t a i ni n g   t h e   w o r s e a r c h e d.     Co m m o n l y ,   w o r d   w e i gh t i n g   a n d   f r e que n c y   i s   c o un t e d   us i ng   T e rm   F r e que n c y   a n d   I n v e r s e   D o c um e nt   F r e que n c y   (T F - ID F m e t h o d.   H ow e v e r ,   t hi s   r e s e a r c t r y   t o   us e W e i gh t e I n v e r s e   D o c um e n t   F r e que n c y   (W ID F i n s t e a d   T F - ID F .   W ID F   w e i g h t i ng  i s   a   de v e l o pm e n t   o f   T F - ID F ,   w h e r e   t h e   w e a k n e s s   o f   T F - ID F   m e t h o i s   t ha t   a l l   do c um e nt s   c o n t a i ni n c e rt a i n   t e rm s   a r e   t r e a t e t he   s a m e   a s   b i n a r y   c a l c ul a t i o n s ,   w h i l e   t h e   W ID F   m e t h o a dds   f r e que n c y   fe a t ur e s   a n d   do c um e n t   c o l l e c t i o n s   [2 5] .   W ID F   w o r w e i ght   c a l c ul a t i o n   i s   c o n s i de r e m o r e   s pe c i f i c   b e c a us e   i t   c o unt s   a l l   e xi s t i n g   do c um e nt   c o l l e c t i o n s   w h i l e   T F - ID F   t r e a t s   a l l   e xi s t i n g   do c um e nt s   w i t b i na r y   c a l c ul a t i o n s   (0   a nd   1)   r e ga r d l e s s   o f   t h e   nu m b e o f   t i m e s   a   do c um e n t   a ppe a r s .   T h e r e f o r e ,   t hi s   r e s e a r c a i m s   t o   ut i l i z e   s e a r c e ngi n e   t e c hn o l o g y   us i n IR   w i t h   W ID F   a s   do c um e nt   f r e que n c y   a l go r i t hm   a n d   V S M   a s   v e c t o r i z a t i o n   m e t h o t o   s e a r c h   ha d i t do c um e n t   b a s e o n   i n pu t   ke y w o r ds .       2   R ES EA R C H   M ET H O D   Re s e a r c a c t i v i t y   of   t h i s   r e s e a r c h   t ha t   p r o v i de i n   t h e   F i gu r e   i s   b e gi n   f r o m   p r e p a r i n g   d a t a   c o l l e c t i o n   of   H a di t h,   i m p l e m e nt i ng  IR   a n d   T M   t e c hni que   t ha t   p r e pa r i n t e xt   d a t a   w hi c i s   u n s t r uc t u r e i nt o   s t r uc t u r e r e p r e s e n t a t i o n   i n   t e xt   p r e - p r o c e s s i n p r o c e s s ,   t h e n   c o unt i ng  W ID F   a nd  c o n duc t i ng  V S M   a l go ri t m .   N e xt ,   t h e   pe r f o r m a n c e   o f   W ID F   a nd  V S M   a l go ri t hm   i s   t e s t e w i t s o m e   s c e n a r i o s   a nd   t h e   r e s ul t   i s   e v a l ua t e d   us i ng  R e c a l l ,   P r e c i s i o n ,   a nd  A c c u r a c y   v a l ue .       F i gu r e   1 .   R e s e a r c a c t i v i t i e s       2. 1 .      I n fo r m ati o n   R e tr i e v al   an d   T e x M i n i n g     In f o r m a t i o R e t ri e v a l   (IR i s   a   t e c hn i q ue   f o f i ndi n g   r e l e v a n t   i n f o r m a t i o a c c o r di n g   t o   t h e   ke y w o r ds   e n t e r e [2 6 - 29] .   W hi l e   T e xt   M i ni n g   ( T M )   i s   a   t e c hni qu e   f o r   f i n d i n g   i n s i g h t   k n o w l e dge   o r   i m po r t a n t   i n f o r m a t i o f r o m   a   c o l l e c t i o n   o f   t e xt   do c um e n t s   [30 - 32] .   A c t ua l l y ,   IR   a n d   T M   a r e   v e r y   r e l a t e d,   i t   c a b e   s a i t h a t   IR   i s   a   p a r t   o f   T M ,   b ut   IR   i s   n o t   y e t   T M .   B e c a us e   IR   d o e s   n o t   a l w a y s   i m p l e m e nt   a   D a t a   M i n i ng  (D M t e c hn i q ue   s uc h   a s   c l a s s i f i c a t i o o c l us t e r i ng  [10] .   H ow e v e r ,   t h e   IR   c e r t a i nl y   do e s   s e ve r a l   T M   s t a ge s ,   e s pe c i a l l y   a t   t h e   P r e - p r o c e s s i n s t a ge .     2. 2 .       We i gh te d   I n v e r s e   D o c u m e n F r e q u e n c (WI D F )   In  IR   t e c hn i que s   t ha t   a pp l y   t h e   c o n c e pt   o f   T e xt   M i n i ng,   a l l   t h e   w o r ds   t ha t   s e a r c h e d   do   n o t   h a v e   t h e   s a m e   w e i gh t .   G i v i n a   w e i ght   t o   a   w o r i s   do n e   by   gi v i n g   t h e   f r e que n c y   v a l ue   of   a   w o r a s   a   w e i ght .     T h e   g r e a t e t h e   a ppe a ra n c e   o f   w o r ds   i t h e   do c um e n t   w i l l   pr o v i de   g r e a t e v a l ue   r e l e v a n c e .   T h e   w e i ght i n g   m e t h o us e i n   t hi s   s t udy   i s   W e i gh t e I n v e r s e   D o c um e nt   F r e que n c y   (W ID F ).   T h e   W ID F   m e t h o i s   a   de ve l o pm e n t   o f   t h e   T e r m   F r e que n c y   a n d   I n v e r s e   D o c um e n t   F r e que n c y   (T F - ID F m e t h o w h e r e   t h e   w e a k n e s s   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   25 02 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   2 M a y   20 2 :     1004   -   1 014   1006   of   t h e   T F - ID F   m e t h o i s   t h a t   a l l   do c um e nt s   c o n t a i ni n g   c e r t a i t e r m s   a r e   t r e a t e t h e   s a m e   a s   b i na r y   c a l c ul a t i o n s ,   w h i l e   t h e   W ID F   m e t h o a dds   f r e que n c y   f e a t ur e s   a n d   do c um e n t   c o l l e c t i o n s   [ 25,   2 7,   3 3 ,   34] .   T h e   f o r m ul a   f o r   t h e   W ID F   m e t h o i s   s h o w n   i ( 1).       ( , ) =    ( , )  ( , )   (1)     W h e r e   d   i s   a   do c um e n t   c o l l e c t i o n ,   t   i s   w o r o r   t e rm ,   i   i s   a   r e l a t e do c um e n t .   T h e n ,   T F   ( d,   t )   i s   t h e   a p pe a r a n c e   of   a   w o r ( t )   i a   do c um e nt   di v i de d   by   T F   ( i ,   t ) ,   w h i c i s   t h e   t o t a l   num b e o f   w o r ds   ( t )   i t h e   r e l a t e   do c um e n t   ( i ) .     2. 3 .       V e c to r   S p ac e   M o d e l   (V S M )   S i m i l a ri t i e s   b e t w e e n   do c um e nt s   t h a t   de f i n e b a s e o n   bag - of - w or ds   r e pr e s e nt a t i o n s   i t hi s   r e s e a r c a r e   c o n v e r t e t o   a   v e c t o r   s pa c e   m o de l .   T h i s   m o de l   w a s   i nt r o duc e by   S a l t o a nd  ha s   b e e n   us e w i de l y   [35]   In   V S M ,   e a c h   do c um e nt   i t h e   d a t a b a s e   a nd  i nput   ke y w o r ds   a r e   r e p r e s e nt e by   a   m ul t i - d i m e n s i o na l   v e c t o r   o r   v e c t o r   s pa c e   d i m e n s i o n ,   w h e r e   t h e   d i m e n s i o n s   c o rr e s po n d   t o   t h e   n u m b e o f   w o r ds   i t h e   do c um e n t   i n v o l v e d   [23,   35 ,   36 ] .   T h e   do c um e n t   i s   r e p r e s e n t e d   a s   a   v e c t o r   t ha t   ha s   di s t a n c e   a nd   di r e c t i o n .   I t h e   VSM ,   a   t e rm   i s   r e p r e s e n t e d   by   a   v e c t o s pa c e   d i m e n s i o n.   A   d j   do c um e n t   a n d   a   q   que r y   a r e   r e p r e s e n t e d   a s   t - di m e n s i o n a l   v e c t o r s   a s   s h o w n   i F i gu r e   2.             F i gu r e   2 .   V e c t o r   r e p r e s e nt a t i o n       T h e   V S M   c a l c ul a t i o n   p r o c e s s   goe s   t hr o ug h   t h e   w o r w e i ght i n c a l c ul a t i o s t a ge s ,   us ua l l y   us i n g   t h e   TF - ID F   m e t h o d.   T F   ( T e rm   F r e que n c y i s   t h e   num b e o f   w o r d s   a p pe a r i n g   i a   do c um e n t   w hi l e   t h e   ID F   (I n v e r s e   D o c um e n t   F r e que n c y i s   t h e   n u m b e r   o f   do c um e n t s   t a ke n   by   t h e   s y s t e m   w h e r e   t h e   t e rm   a ppe a r s   i n   i t .   H ow e v e r ,   i n   t h i s   r e s e a r c us e   W ID F .   A f t e r   t h a t ,   c a l c ul a t e   t h e   l e n gt o f   e a c h   w o r w e i ght   i t h e   que r y   a n d   do c um e nt .   Ca l c ul a t i o o f   t h e   l e n g t o f   t h e   que r y   a n do c um e n t   w e i gh t s   us i n ( 2)  a n d   (3) .     | | =   (  ) 2 = 1   (2)     | | =   (  ) 2 = 1   (3)     W i t h   | q |   i s   t h e   l e n g t h   o f   t h e   que r y ,   a n W iq   i s   t h e   i th   que r y   w e i ght   o f   t h e   do c um e nt ,   s o   t h e   l e n gt o f   t h e   que r y   (| q | i s   c a l c ul a t e t o   ge t   t h e   l e n gt o f   t h e   que r y   f r o m   t h e   do c um e nt   que r y   w e i ght   ( W iq c a l l e b y   t h e   s y s t e m .   T h e   l e n gt o f   a   que r y   c a n   b e   c a l c ul a t e b y   t h e   r o o t   e qua t i o n   o f   t h e   n u m b e r   o f   s qua r e s   o f   t h e   que r y .   W i t h   | d j |   i s   t h e   l e n g t h   o f   t h e   do c um e nt ,   a nd  W ij   i s   t h e   w e i ght   o f   t h e   i   do c um e nt ,   t h e t h e   l e n gt o f   t h e   do c um e n t   (| d j | i s   c a l c ul a t e t o   ge t   t h e   l e n gt o f   t h e   do c um e n t   f r o m   t h e   w e i ght   o f   t h e   do c um e n t   ( W ij )   c a l l e by   t h e   s y s t e m .   T h e   l e n gt o f   a   do c um e n t   c a n   b e   c a l c ul a t e by   t h e   r o o t   e qua t i o n   o f   t h e   n u m b e r   o f   s qua r e s   o f   t h e   do c um e n t .   Ca l c ul a t i o n   o f   m e a s u r e m e nt   o f   t h e   s i m i l a r i t y   of   que r y   doc um e n t s   ( i nn e r   p r o duc t ) ,   us i ng  (4 ).   S i m i l a r i t y   b e t w e e n   que r y   a n d   do c um e nt   o S i m ( q d j i s   d i r e c t l y   pr o po r t i o na l   t o   t h e   num b e r   o f   que r y   w e i gh t s   ( q )   m u l t i pl i e by   do c um e n t   w e i g h t   ( d j a n i n v e r s e l y   pr o po r t i o n a l   t o   t h e   r o o t   of   t h e   n u m b e r   o f   s qua r e s   q   (| q | )   m u l t i pl i e by   t h e   r o o t   o f   t h e   n u m b e r   o f   s qua r e s   o f   t h e   do c um e n t   (| d j | ).   S i m i l a ri t y   c a l c ul a t i o n s   p r o duc e   do c um e n t   w e i ght s   t ha t   a r e   c l o s e   t o   v a l ue   1   o p r o duc e   do c um e n t   w e i ght s   t h a t   a r e   g r e a t e r   t ha n   t h e   v a l ue s   ge n e ra t e d   f r o m   i nn e r   p r o duc t   c a l c ul a t i o n s .      ( , ) =   . | | . | | =    .  = 1 (  ) 2 = 1 . (  ) 2 = 1     (4)     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       W e i ght e i nv e r s e   doc um e n t   f r e qu e nc y   and   v e c t or   s pa c e   m od e l   f or   hadi t h   s e ar c h…   ( Se pt y a   E g ho  P r at am a )   1007   2. 4 .       R e c a l l   an d   P r e c i s i o n   Ev al u ati o n   R e c a l l   a n d   P r e c i s i o e v a l ua t i o a i m s   t o   o b t a i i n f o r m a t i o n   o s e a r c h   r e s ul t s   o b t a i n e d   by   t h e   s y s t e m .   P r e c i s i o i s   t h e   l e v e l   o f   a c c ur a c y   o r   r e l e v a n c y   b e t w e e n   t h e   i n f o r m a t i o n   t ha t   r e que s t e w i t i nput   ke y w o r ds   a nd  t h e   i n f o r m a t i o n s   t h a t   gi v e b y   t h e   s y s t e m , w h i l e   t h e   R e c a l l   v a l ue   i s   t h e   l e v e l   o f   s uc c e s s   of   t h e   s y s t e m   i f i n d i n b a c i n f o r m a t i o n   [37 - 39] .       =                                (5)       =                        (6)     B a s e o n   (5)   a n d   (6) ,   R   b e i ng  R e c a l l ,   w h e r e   R   v a l ue   i s   o b t a i ne by   c o m pa ri n g   t h e   N um b e o f   r e l e v a nt   i t e m s   r e t ri e v e w i t t h e   T o t a l   num b e r   o f   r e l e v a nt   i t e m s   i n   t h e   c o l l e c t i o n .   R e c a l l   i s   a   do c um e nt   t ha t   i s   c a l l e f r o m   t h e   s y s t e m   a c c o r di n g   t o   us e r e que s t s   t h a t   f o l l ow   t h e   pa t t e rn  o f   t h e   s y s t e m .   T h e   g r e a t e R e c a l l   v a l ue   c a nn o t   b e   s a i o f   a   go o s y s t e m   o r   n o t .   T h e n ,   P   b e i n P r e c i s i o n ,   w h e r e   P   v a l ue   i s   o b t a i n e d   by   c o m pa r i n g   t h e   N um b e r   o f   r e l e v a n t   i t e m s   r e t r i e v e w i t h   t h e   T o t a l   n u m b e r   o f   i t e m s   r e t r i e v e d.   P r e c i s i o n   i s   t h e   n u m b e r   o do c um e n t s   t h a t   a r e   c a l l e d   f r o m   t h e   r e l e v a n t   d a t a b a s e   a f t e b e i n g   a s s e s s e by   t h e   us e w i t t h e   r e qu i r e i n f o r m a t i o n.   T h e   g r e a t e r   t h e   v a l ue   o f   pr e c i s i o n,   t h e   s y s t e m   c a n   b e   s a i d   t o   b e   go o d .       3   R ES U LT   A N D   A N A L Y S I S   In   t h i s   s e c t i o n,   t h e   r e s ul t s   o f   t h i s   s t udy   b a s e o n   t h e   r e s e a rc h   a c t i v i t i e s   i s   p r e s e nt e a s   i t   s h o w n   i n   F i gu r e   1 ,   a n d   t h e   c o m p r e h e n s i v e   a na l y s i s   i s   a l s o   di s c us s e d.       3. 1 .       C o l l e c t i n Te x D ata   o H ad i th   T h e   da t a   us e i n   t h i s   r e s e a r c i s   i n   t h e   f o r m   o f   In do n e s i a n   t ra n s l a t i o n   ha d i t t e xt   da t a   t ha t   o b t a i n e f r o m   t h e   B o o of   B ul ugh u l   M a ra m   [40] w h i c c o n t a i n s   a b o ut   1, 5 96   h a di t h s   (b ut   i t hi s   r e s e a r c o nl y   us e   380  ha di t h s ) .   T h e   b o o of   B ul ughul   M a ra m   i s   a   t h e m a t i c   h a d i t b o o c o n t a i n i ng   t h e   h a di t h s   w hi c a r e   us e a s   s o ur c e s   of   Is l a m i c   l a w   m a k i n g   by   f i qh   e xpe r t s ,   e s pe c i a l l y   f r o m   t h e   Im am   Shaf i 'i   a n d   w r i t t e by   Ibn  H a j ar   A l - A qs al an i   b a s e o h i s   m e m o r i z a t i o w i t h o ut   l o o ki n g   a t   t h e   o ri gi na l   b oo k.   T h i s   b oo i n c l ude s   t h e   b oo of   f i qh  w h i c r e c e i v e gl o b a l   r e c o gn i t i o n   a n d   i s   a l s o   w i de l y   t r a n s l a t e t hr o ug h o ut   t h e   w o r l d   i t h e   f o r m   o f   boo ks   a n d   e boo ks .   S o   f a r ,   t h e   B oo of   B ul ughul   M a r a m   i s   o n l y   i n   t h e   b oo o r   e bo o v e r s i o n ,   t h e r e   i s   n o   i n f o r m a t i o s y s t e m   t ha t   c a n   c o l l e c t   t h e   d a t a   o f   t h e   ha di t h ,   m a ki ng  i t   di f f i c ul t   f o r   us   t o   s e a r c h   f o r   t h e   ha di t h s   t h a t   w e   w a n t   b a s e o n   c e r t a i ke y w o r ds .     3. 2 .       T e x P r e - p r o c e s s i n g     T e s t   p r e - p r o c e s s i n i s   a n   i m po r t a n t   p ha s e   i n   T e xt   M i n i ng  t o   pr e pa r e   t e xt   da t a   w e l l   b e fo r   c o n duc t i n g   t h e   m i ni n g   p r o c e s s   [41,   42] ,   a m o n g   o t h e r s   t o ke n i z i n g ,   c a s e f ol di n g ,   c l e a ni n t e xt   d a t a ,   s t o pw o r ds   r e m o v a l   a nd  s t e m m i ng.   T o ke n i z i ng  a nd  c a s e fo l di n p r e pa r e   t e xt   d a t a   t o   b e   e a s y   t o   c h a n ge   i nt o   s t r uc t u r e r e p r e s e n t a t i o n   w i t s pe c i f i c   a n u n i f o r m   t e rm .   S t o pw o r ds   r e m o v a l   c a r e du c e   t h e   di m e n s i o o f   t e xt   d a t a   w i t r e m o v e   a l l   a n   uni m po r t a n t   w o r ds .   W h i l e   s t e m m i n g   p r o c e s s   i s   a l s o   i m po r t a nt   p r e - p r o c e s s i n p ha s e .   F o I n do n e s i a n   l a ngua ge ,   s t e m m i ng   p r o c e s s   c a b e   m a i nt a i t h e   m e a n i n g   o f   t e xt   w e l l ,   b e c a us e   t h e   w o r d   w i t a f f i xe s   i s   a   v e r b s   t ha t   c o n t a i t h e   m a ni n g   o f   t e xt   [43 ,   44] .   E v e n   t o ug h ,   i s e v e r a l   r e s e a r c h   i t e xt   m i ni n g ,   t h e   s t e m m i n g   p r o c e s s   do e s   n o t   gi v e   a   b i e f f e c t   i a c c u r a c y   [45] .   S t e m m i n g   p r o c e s s   i s   de pe n o t h e   l a ngua ge ,   f r o m   m a n y   I n do n e s i a s t e m m i ng  a l go r i t h m   [46 - 49] ,   t h i s   r e s e a r c us e   a i m p r o v e P o r t e a l go rt hm   t h a t   m o di f i e b a s e o n   I n do n e s i a l a n gu a ge   [ 50] .   T h e   e xa m pl e   r e s ul t   o f   t e xt   p r e - p r o c e s s i n i s   a v a i l a b l e   i T a b l e   2   w h i c h   i s   p r e - p r o c e s s i n g   r e s ul t   f r o m   t h e   t e xt   ha d i t s   e x a m p l e   f r o m   T a b l e   t ha t   p r o v i de i I n do n e s i a L a n gu a ge .     3. 3 .       A n a l ys i s   o We i gh te d   I n v e r s e   D o c u m e n F r e q u e n c y   A f t e r   t e xt   p r e - p r o c e s s i n g ,   a s   b a g - of - w o r ds   r e p r e s e n t a t i o n ,   e v e r y   w o r i s   a   t e rm .   U s i ng  ( 1),   f r e que n c y   of   e a c h   t e r m   i s   c a l c ul a t e d .   T h e   e x a m p l e   r e s ul t   o f   W ID F   fo r   ha d i t h   t e xt   i s   a v a i l a b l e   i n   t h e   T a b l e   w h i c h   i s   c o un t e f r o m   t h e   t e rm s   i f r o m   t h e   r e s ul t   o f   t e xt   p r e - p r o c e s s i ng  i T a b l e   2 .   I a d di t i o t o   do c um e n t s ,   w o r w e i ght   c a l c ul a t i o n s   a r e   a l s o   pe r f o r m e o n   ke y w o r ds ,   o f   c o u r s e   b e fo r e   t h e   t e x t   m i ni n p r o c e s s   i s   pe r f o r m e f i r s t .   B e c a us e   i n   ke y w o r ds ,   t h e   w o r us e i s   a l r e a dy   i n   a   s i m pl e   f o r m ,   t h e n   j us t   c a l c u l a t e   t h e   w e i gh t   o f   t h e   w o r d.   F o e xa m pl e ,   t h e   ke y w o r i s   s e de ka h” ,   w i t t h e   s a m e   p r o c e s s   t h e   W ID F   v a l ue   o f   s e de ka h     i s   0 . 125 .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   25 02 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   2 M a y   20 2 :     1004   -   1 014   1008   T a b l e   1 .   T h e   E xa m pl e   o f   H a di t D a t a   T e xt   N u m b e r   H a d i t h   T e x t   1   D a ri   A b u   H u ra i ra h   Ra d l i y a l l a a h u   ‘a n h u   b a h w a   Ra s u l u l l a h   S h a l l a l l a a h u   ‘a l a i h i   w a   S a l l a m   p e r n a h   d i t a n y a :   W a h a i   Ra s u l u l l a h   S h a l l a l l a a h u   ‘a l a i h i   w a   S a l l a m ,   s e d e k a h   a p a k a h   y a n g   p a l i n g   m u l i a ?   Be l i a u   m e n j a w a b :   S e d e k a h   o ra n g   y a n g   t a k   p u n y a ,   d a n   m u l a i l a h   m e m b e ri   s e d e k a h   a t a s   o ra n g   y a n g   b a n y a k   t a n g g u n g a n n y a .   D i k e l u a rk a n   o l e h   A h m a d   d a n   A b u   D a w u d .   2   D a ri   A b u   S a i d   A l - K h u d r y   Ra d l i y a l l a a h u   ‘a n h u   b a h w a   Z a i n a b ,   i s t ri   A b u   M a s ’u d ,   b e rt a n y a :   W a h a i   Ra s u l u l l a h ,   b a g i n d a   t e l a h   m e m e r i n t a h k a n   u n t u k   b e r s e d e k a h   h a ri   i n i ,   d a n   a k u   m e m p u n y a i   p e r h i a s a n   u rg e   y a n g   h e n d a k   s a y a   s e d e k a h k a n ,   n a m u n   I b n u   M a s ’u d   m e n g a n g g a p   b a h w a   d i ri n y a   d a n   a n a k n y a   l e b i h   b e r h a k   u n t u k   a k u   b e ri   s e d e k a h .   L a l u   N a b i   S h a l l a l l a a h u   ‘a l a i h i   w a   S a l l a m   b e r s a b d a :   I b n u   M a s ’u d   m e m a n g   b e n a r,   s u a m i m u   d a n   a n a k m u   a d a l a h   o ra n g   y a n g   l e b i h   b e r h a k   u n t u k   e n g k a u   b e ri   s e d e k a h .   R i w a y a t   Bu k h a ri .     3   D a ri   S a m u ra h   I b n u   J u n d a b   Ra d l i y a l l a a h u   ‘a n h u   b a h w a   Ra s u l u l l a h   S h a l l a l l a a h u   ‘a l a i h i   w a   S a l l a m   b e r s a b d a :   M e m i n t a - m i n t a   a d a l a h   c a k a ra n   s e s e o ra n g   t e rh a d a p   m u k a n y a   s e n d i r i ,   k e c u a l i   m e m i n t a   k e p a d a   p e n g u a s a   a t a u   k a re n a   s u a t u   h a l   y a n g   a m a t   p e rl u .   H a d i t s   s h a h i h   ri w a y a t   T i r m i d z i .   4   D a ri   A b u   H u ra i ra h   Ra d l i y a l l a a h u   ‘a n h u   b a h w a   Ra s u l u l l a h   S h a l l a l l a a h u   ‘a l a i h i   w a   S a l l a m   b e r s a b d a :   U m ra h   k e   u m ra h   m e n g h a p u s   d o s a   a n t a ra   k e d u a n y a ,   d a n   t i d a k   a d a   p a h a l a   b a g i   h a j i   m a b ru k e c u a l i   u rg e .   M u t t a f a q   A l a i h i .   5   D a ri   U q b a h   Ib n u   A m i b a h w a   d i a   m e n d e n g a r   Ra s u l u l l a h   S h a l l a l l a a h u   ‘a l a i h i   w a   S a l l a m   b e r s a b d a :   S e t i a p   o ra n g   b e rn a u n g   d i   b a w a h   s e d e k a h n y a   s e h i n g g a   i a   d i p u t u s k a n   a m a l   p e r b u a t a n n y a   a n t a ra   m a n u s i a .   Ri w a y a t   I b n u   H i b b a n   d a n   H a k i m .       T a b l e   2 .   T h e   E xa m pl e   of  T e xt   P r e - P r o c e s s i n R e s ul t   f r o m   t h e   H a di t h   T e xt   i T a b l e   1   D o c u m e n t   1   ( d1 )   D o c u m e n t   2   ( d2 )   D o c u m e n t   3   ( d3 )   D o c u m e n t   4   ( d4 )   D o c u m e n t   5   ( d1 )   a b u   a b u   s a m u ra h   a b u   u q b a h   h u ra i ra h   s a i d   i b n u   h u ra i ra h   i b n u   ra d i y a l l a a h u a n h u   a l k h u d ry   j u n d a b   ra d i y a l l a a h u a n h u   a m i r   ra s u l u l l a h   ra d i y a l l a a h u a n h u   ra d i y a l l a a h u a n h u   ra s u l u l l a h   d e n g a r   s h a l l a l l a a h u a l a i h i   z a i n a b   ra s u l u l l a h   s h a l l a l l a a h u a l a i h i   ra s u l u l l a h   s a l l a m   i s t ri   s h a l l a l l a a h u a l a i h i   s a l l a m   s h a l l a l l a a h u a l a i h i   ...   ...   ...   ...   ...   j a w a b   s e d e k a h   d i ri   t i d a k   a m a l   s e d e k a h   h a ri   k e c u a l i   a d a   b u a t   o ra n g   p u n y a   m i n t a   p a h a l a   m a n u s i a   p u n y a   p e r h i a s a n   p e n g u a s a   h a j i   ri w a y a t   m u l a i   s e d e k a h   h a l   m a b ru r   i b n u       T a b l e   3 .   T h e   E xa m pl e   o f   W ID F   Ca l c ul a t i o f o r   H a di t T e xt   W o r d   ( t)   T F ( d , t )   T F ( i , t )   T F ( d , t ) / T F (i , t )   d1   d2   d3   d4   d5   d1   d2   d3   d4   d5   a b u   2   2   0   1   0   5   0 , 4   0 , 4   0   0 , 2   0   h u ra i ra h   1   0   0   1   0   2   0 , 5   0   0   0 , 5   0   ra d i y a l l a a h u a n h u   1   1   1   1   0   4   0 , 2 5   0 , 2 5   0 , 2 5   0 , 2 5   0   ra s u l u l l a h   2   1   1   1   1   6   0 , 3 3 3   0 , 1 6 7   0 , 1 6 7   0 , 1 6 7   0 , 1 6 7   s h a l l a l l a a h u a l a i h i   2   1   1   1   1   6   0 , 3 3 3   0 , 1 6 7   0 , 1 6 7   0 , 1 6 7   0 , 1 6 7   s a l l a m   2   0   1   1   1   5   0 , 4   0   0 , 2   0 , 2   0 , 2   t a n y a   1   1   0   0   0   2   0 , 5   0 , 5   0   0   0   s e d e k a h   3   4   0   0   1   8   0 , 3 7 5   0 , 5   0   0   0 , 1 2 5   ...   ...   ...   ...   ...   ...   ...   ...   ...   ...   ...   ...   m u l i a   1   0   0   0   0   1   1   0   0   0   0   j a w a b   1   0   0   0   0   1   1   0   0   0   0   o ra n g   2   1   1   0   1   5   0 , 4   0 , 2   0 , 2   0   0 , 2   p u n y a   1   1   0   0   0   2   0 , 5   0 , 5   0   0   0   m u l a i   1   0   0   0   0   1   1   0   0   0   0   b e ri   1   2   0   0   0   3   0 , 3 3 3   0 , 6 6 7   0   0   0   ...   ...   ...   ...   ...   ...   ...   .. .   ...   ...   ...   ...   h a d i t s   1   0   1   0   0   2   0 , 5   0   0 , 5   0   0   s h a h i h   1   0   1   0   0   2   0 , 5   0   0 , 5   0   0   i b n u   1   2   1   0   2   6   0 , 1 6 7   0 , 3 3 3   0 , 1 6 7   0   0 , 3 3 3   h i b b a n   1   0   0   0   1   2   0 , 5   0   0   0   0 , 5   h a k i m   1   0   0   0   1   2   0 , 5   0   0   0   0 , 5       3. 4 .       A n a l ys i s   o V e c to r   S p ac e   M o d e l   A f t e r   w e i ght i n g   t h e   w o r ds ,   t h e   n e x t   s t e i s   t o   c a l c ul a t e   t h e   m a t c b e t w e e n   t h e   ke y w o r ds   a n d   do c um e n t s   us i ng  t h e   V S M   a l go r i t hm .   T h e   f i r s t   s t e i t hi s   a l go r i t hm   i s   t o   c a l c ul a t e   t h e   m u l t i pl i c a t i o n   o f   t h e   w e i ght   s c a l e   by   m ul t i pl y i n g   t h e   ke y w o r w e i gh t s   w i t t h e   d o c um e n t   a nd  t h e a d di n g   t h e m   up .   T h e   n e xt   s t e p   i s   t o   c a l c ul a t e   t h e   l e n gt o f   t h e   v e c t o r   by   s qua r i n g   a l l   t h e   w o r w e i gh t s   a n d   a ddi n g   t h e m   t o ge t h e r.   T h e   f i n a l   s t e i s   t o   f i n d   a   m a t c h / s i m i l a ri t y   v a l ue   b e t w e e n   t h e   ke y w o r a n d   t h e   do c um e n t   b y   di v i di ng   t h e   v a l ue   o f   t h e   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       W e i ght e i nv e r s e   doc um e n t   f r e qu e nc y   and   v e c t or   s pa c e   m od e l   f or   hadi t h   s e ar c h…   ( Se pt y a   E g ho  P r at am a )   1009   s c a l a r   w e i gh t   m u l t i pl i c a t i o by   t h e   l e ngt o f   t h e   v e c t o r .   E x a m p l e s   o f   r e s ul t s   f r o m   s c a l a m u l t i pl i c a t i o a nd  v e c t o r   l e n g t h   c a l c ul a t i o n s   a r e   i n   T a b l e   (t h e   f i na l   r e s ul t   v a l ue   ha s   b e e n   r o unde d).   T h e   r e s ul t s   a r e   o b t a i n e f r o m   c a l c ul a t i o n s   us i ng  ( 2),   (3 ),   a nd   (4) .   F o c o unt i n g   s i m i l a ri t y   v a l ue   b e t w e e n   i n pu t   ke y w o r d   a n d   do c um e nt   i s   c a l c ul a t e us e   Co s i n e   S i m i l a ri t y   w i t h   (4) .   T h e   s i m i l a ri t y   v a l ue   i s   pr o v i de i n   T a b l e   w i t t h e   h i g h e s t   o r de r   v a l ue   i s   D o c um e n t   2 ,   f o l l ow e by   D o c um e n t   a n D o c um e nt   5 .   S o ,   s y s t e m   w i l l   b e   pr o duc e D oc um e n t   1,   2,   a n t h a t   r e l a t e d   w i t ke y w o r s e de ka h” .       T a b l e   4 .   T h e   E xa m pl e   o f   S c a l a M ul t i p l i c a t i o a n V e c t o L e n gt i V S M   W o r d   ( t)   S c a l a r   M u l t i p l i c a t i o n   V e c t o L e n g h t   Ca l c u l a t i o n   W e i g h t   (W )   ( d , q )   W 2   d1   d2   d3   d 4   d5   q   d1   d2   d3   d4   d5   d1   d2   d3   d4   d5   q   a b u     0 , 4   0 , 4   0   0 , 2   0   0   0   0   0   0   0   0 , 1 6   0 , 1 6   0   0 , 0 4   0   0   h u ra i ra h   0 , 5   0   0   0 , 5   0   0   0   0   0   0   0   0 , 2 5   0   0   0 , 2 5   0   0   ra d i y a l l a a h u a n h u   0, 3   0 .3   0, 3   0, 3   0   0   0   0   0   0   0   0 , 0 6   0 , 0 6   0 , 0 6   0 , 0 6   0   0   ra s u l u l l a h   0, 3   0, 2   0, 2   0, 2   0, 2   0   0   0   0   0   0   0 , 1 1   0 , 0 3   0 , 0 3   0 , 0 3   0 , 0 3   0   s h a l l a l l a a h u a l a i h i   0 , 3   0, 2   0, 2   0, 2   0, 2   0   0   0   0   0   0   0 , 1 1   0 , 0 3   0 , 0 3   0 , 0 3   0 , 0 3   0   s a l l a m     0 , 4   0   0 , 2   0 , 2   0 , 2   0   0   0   0   0   0   0 , 1 6   0   0 , 0 4   0 , 0 4   0 , 0 4   0   t a n y a     0 , 5   0 , 5   0   0   0   0   0   0   0   0   0   0 , 2 5   0 , 2 5   0   0   0   0   s e d e k a h     0 ,4   0 , 5   0   0   0 , 1   0 ,1   0, 1   0, 1   0   0   0   0 , 1 4   0 , 2 5   0   0   0 , 0 1   0   ...   ...   ...   ...   ...   ...   ...   ...   ...   ..   ..   ...   ...   ...   ...   ...   ...   ...   m u l i a   1   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0   j a w a b     1   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0   o ra n g   0 , 4   0 , 2   0 , 2   0   0 , 2   0   0   0   0   0   0   0 , 1 6   0 , 0 4   0 , 0 4   0   0 , 0 4   0   pu n y a     0 , 5   0 , 5   0   0   0   0   0   0   0   0   0   0 , 2 5   0 , 2 5   0   0   0   0   m u l a i   1   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0   b e ri     0 , 3   0, 7   0   0   0   0   0   0   0   0   0   0 , 1 1   0 , 4 5   0   0   0   0   ...   ...   ...   ...   ...   ...   ...   ...   ...   ..   ..   ...   ...   ...   ...   ...   ...   ...   h a d i t s     0 , 5   0   0 , 5   0   0   0   0   0   0   0   0   0 , 2 5   0   0, 25   0   0   0   s h a h i h     0 , 5   0   0 , 5   0   0   0   0   0   0   0   0   0 , 2 5   0   0 , 2 5   0   0   0   i b n u     0, 2   0 , 3   0, 2   0   0 , 3   0   0   0   0   0   0   0 , 0 3   0 , 1 1   0 , 0 3   0   0 , 1 1   0   h i b b a n     0 , 5   0   0   0   0 , 5   0   0   0   0   0   0   0 , 2 5   0   0   0   0 , 2 5   0   h a k i m     0 , 5   0   0   0   0 , 5   0   0   0   0   0   0   0 , 2 5   0   0   0   0 , 2 5   0   ...   ...   ...   ...   ...   ...   ...   ...   ...   ..   ..   ...   ...   ...   ...   ...   ...   ...   .     0, 1   0, 1   0   0   0         1 0 , 7 94   1 5 , 0 47   8 , 3 9 96   9 , 7 6 1   9 , 9 3 6   0 , 0 16       3 , 2 8 5   3 , 8 7 9   2 , 8 9 8   3 , 1 2 4   3 , 1 5 2   0 , 1 25       T a b l e   5 .   T h e   S i m i l a ri t y   V a l ue   o f   t h e   E x a m pl e   H a di t D o c um e n t s   T e rm   2   .   . ( ) 2 . ( ) 2   d1   3 , 2 8 5   0 , 0 4 7   0 , 047 0 , 125   .     3 , 285   =   1 , 2 3 2   d2   3 , 8 7 9   0 , 0 6 3   0 , 063 0 , 125   .     3 , 879   =   1 , 9 3 9   d3   2 , 8 9 8   0   0 0 , 125   .     2 , 8 9 8   =   0   d4   3 , 1 2 4   0   0 0 , 125   .     3 , 124   =   0   d5   3 , 1 5 2   0 , 0 1 6   0 , 016 0 , 125   .     3 , 152   =   0 , 3 9 3       3. 5 .       R e s u l o H ad i th   S e a r c h   En gi n e   Te s ti n g   T h e   e xpe r i m e nt   i s   c o n duc t e d   us i ng   380   o f   H a di t t e xt   d a t a   f r o m   t h e   B oo o f   B ul ugh u l   M a ra m .     F i gu r e   3   s h o w s   t h e   i m pl e m e n t a t i o o f   H a di t s e a r c e n g i ne   w i t w e b - b a s e s y s t e m .   T h e r e   a r e   5   ke y w o r ds   w i t d i f fe r e nt   n um b e o f   t e r m   f o t e s t i ng   s c e n a ri o   t ha t   c o nduc t e t o   e v a l ua t e   t h e   o ut put   o f   s y s t e m ,   a m o n g   o t h e r s   s e de ka h” ,   z a ka t   f i t ra h” ,   z a ka t   ha rt a   r i k a z ,   s e de ka h   hut a n g   a na k   y a t i m ,   a nd  z a ka t   h e w a t e rn a k   da t a n a m a n” .   T h e   r e s ul t   o f   t h o s e   e xpe r i m e n t s   us e   R e c a l l   a nd  P r e c i s i o v a l ue   t h a t   p r o v i de s   i t h e   T a b l e   6   a nd  F i gu r e   4 .   T h e   a na l y s i s   a n d   e v a l ua t i o o f   e xe r i m e n t   r e s ul t   i s   e xpl a i n e i n   S e c t i o 4 . 6.       Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   25 02 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   2 M a y   20 2 :     1004   -   1 014   1010             F i gu r e   3 .   T h e   e xa m pl e   o f   H a di t s e a r c e ngi n e   i m p l e m e n t a t i o n       T a b l e   6 .   T h e   E xpe ri m e nt   R e s ul t   o f   H a di t h   S e a r c E n g i n e   T o t a l   o f   T o t a l   H a d i t h   1 st   T e s t i n g   2 nd   T e s t i n g   3 rd   T e s t i n g   4 th   T e s t i n g   5 th   T e s t i n g   " S e d e k a h "   " Z a k a t   F i t ra h "   " Z a k a t   H a rt a   Ri k a z "   " S e d e k a h   H u t a n g   A n a k   Y a t i m "   " Z a k a t   H e w a n   t e r n a k   d a n   Ta n a m a n "   D a t a   c a l l e d   12   35   58   44   51   Re l e v a n t   d a t a   t h a t   i s   c a l l e d   12   5   3   11   15   Irre l e v a n t   d a t a   c a l l e d   12   30   55   33   36   Re l e v a n t   d a t a   t h a t   i s   n o t   c a l l e d   3   0   0   0   0   T h e   s u m   o f   a l l   r e l e v a n t   d a t a   15   5   3   11   15   Re c a l l   80%   100%   100%   100%   100%   P re c i s i o n   100%   1 4 , 2 8%   8 , 6 2 %   25%   2 9 , 4 1 %           F i gu r e   4 .   G ra p h i c s   o f   e xpe r i m e nt   r e s ul t       3. 6 .       A n a l ys i s   an d   Ev al u ati o n   o Ex p e r i m e n an d   T e s ti n g   R e s u l t   B a s e o n   t h e   e xpe r i m e n t   r e s ul t ,   t h i s   r e s e a r c h   f o un d   t ha t :   1.   H a di t h   s e a r c h   e n gi n e   us i n g   W ID F   a n d   V S M   s uc c e s s   i f i n d i n g   t h e   i n f o r m a t i o n   ( i n   t h i s   c a s e   i s   h a di t h s i a c c o r da n c e   w i t t h e   i n p ut   ke y w o r ds   w e l l .   It   i s   p r o v e n   by   t h e   a v e r a ge   o f   Re c a l l   v a l ue   w h i c h   i s   qu i t e   hi g Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       W e i ght e i nv e r s e   doc um e n t   f r e qu e nc y   and   v e c t or   s pa c e   m od e l   f or   hadi t h   s e ar c h…   ( Se pt y a   E g ho  P r at am a )   1011   a r o un d   96 f r o m   t y pe s   of   e xpe r i m e nt .   W h i l e ,   t h e   r e l e v a n c y   of   h a d i t h s   t ha t   p r o duc e i s   l o w ,   b e c a us e   t h e   a v e r a ge   o f   P r e c i s i o v a l ue   i s   s m a l l ,   j us t   a r o u n d   35 . 46% .     2.   T h e   s m a l l   P r e c i s i o n   v a l ue   t ha t   s h o w   t ha t   r e s ul t   o f   ha di t h s   f r o m   s e a r c h   e n g i n e   m o s t   o f   t h e a r e   n o t   r e l e v a nt   o r   n o t   r e l a t e w i t h   t h e   pu r po s e   of   t h e   h a di t t ha t   t h e   us e i s   l o o ki ng  f o r .   T h i s   c a b e   c a us e by   t h e     fo l l ow i n g   t hi n gs :   a.   T h e   s e a r c e n g i n e   i s   us e b a g - of - w o r a s   s t ruc t u r e t e x t   r e p re s e n t a t i o n.   B a g - of - w o r r e p r e s e nt a t i o i s   a   s t r uc t u r e r e p r e s e nt a t i o n   f r o m   t e xt ,   w h e r e   t e x t   da t a   i s   r e pr e s e nt e by   c o l l e c t i o n   o f   w o r d,     o n e   w o r o n e   t e rm   [ 51,   52] .   S o   t ha t ,   i f   t h e   ke y w o r t ha t   m o re   t ha o n e   w o r d,   i t   w i l l   b e   s e pa ra t e pe r   w o r a n d   n o t   i n - g ra m   f o r m .   T hi s   a n a l y s i s   i s   s uppo rt e by   t he   r e s ul t   o f   p r e c i s i o n   t ha t   t h e   l o w   pr e c i s o n   v a l ue   o c c ur s   i t h e   i nput   ke y w o r ds   w i t h   n - t e rm / n - g ra m .   F o e xa m p l e ,   i f   t h e   i n pu t   ke y w o r i s   z a ka t   f i t ra h ,   t h e   s y s t e m   w i l l   p r o duc e   t h e   ha di t h s   t h a t   c o n t a i z a k a t   a n f i t ra h ,   w h e r e a s   z a k a t   f i t r a h”   i s   a   s i ngl e   e n t i t y ,   s o   w h e n   t h e r e   i s   a   ha d i t t ha t   c o n t a i n s   t h e   w or d   " f i t r a h"   e v e n   t h o ugh  i t   i s   n o t   r e l a t e d   t o   z a k a t   i t   w i l l   s t i l l   b e   p r o duc e d.   b.   In do n e s i a n   l a ngua ge   i s   u ni que ,   s t i l l   a   l o t s   o f   pr o b l e m   i n   I n do n e s i a n   l a ngua ge   b e s i de s   pun c t u a t i o n,   a b b r e v i a t i o n ,   a n d   c ha ra c t e r   i n   t h e   b r a c ke t ,   o n e   o f   t h e m   i n   w o r w i t h   a f f i xe s   [53] .   T h e   l o w   pr e c i s o n   v a l ue   c a n   b e   a f f e c t e by   t h e   r e s ul t   o f   s t e m m i ng  p r o c e s s .   T h e re   a r e   l e t t e r s   t ha t   m e l t   w h e g i v e n   c e rt a i n   a f f i xe s ,   i n c l ud i n g   " k" ,   " p" ,   " t " ,   a nd   " s "   [ 54,   55] .   S o ,   i f   t h e re   i s   a   w o r d   " pu ri fy   y o ur s e l f "   w h e do n e   s t e m m i ng  i t   w i l l   b e c o m e   " pur e   s e l f " ,   s o   t h e   s e a r c e n gi n e   s h o ul d   p r o duc e   t r a di t i o n s   r e l a t e t o   puri f i c a t i o n .   B a c t o   t h e   a na l y s i s   i n   po i n t   1 ,   s e a r c h   e n gi n e s   w i l l   p r o duc e   t ra di t i o n s   t ha t   c o n t a i " h o l y "   a n " s e l f " ,   w hi c a r e   n o t   a l l   i a c c o r da n c e   w i t h   t h e   i nt e n t   o f   t h e   ke y w o r ds   e nt e r e d ,   i n c l udi ng  t r a di t i o n s   t h a t   o n l y   c o n t a i t h e   w o r " s e l f . "   H ow e v e r ,   i f   t h e   p r o c e s s   s t e m m i n g   i s   r e m o v e d,   t h e   t r a d i t i o n s   w i l l   pr o duc e   t ra di t i o n s   c o nt a i ni n g   " p u r i f y "   a n d   " s e l f " .   T h e r e   w i l l   b e   t ra di t i o n s   r e l a t e d   t o   pu ri f i c a t i o t ha t   a r e   p r o duc e a n r e l e v a n t ,   b ut   s e a r c e n g i n e s   w i l l   n o t   p r o duc e   t ra di t i o n s   r e l a t e t o   puri f i c a t i o n   t ha t   do  n o t   c o n t a i t h e   w o r " p u r i fy " .   F o e xa m pl e   t h e   t ra di t i o n s   a b o ut   pu ri f i c a t i o b ut   c o n t a i w o r ds   o t h e r   t h a " pu ri fy " ,   s uc a s   c o nt a i n i ng  t h e   w o r ds   " s a n c t i f i e d" ,   " pu ri f i e d" ,     e ve n   " h o l y "   i t s e l f   w i l l   n o t   b e   di s pl a y e d,   s o   t ha t   m o r e   t r a d i t i o n s   a r e   w a s t e i f   t h e   s t e m m i n p r o c e s s   i s   n o t   do n e .   3.   P oo r   r e s ul t s   i t e rm s   o f   t h e   p r e c i s i o o r e l e v a n c e   o f   t h e   i n f o r m a t i o n   t h a t   p r o duc e e doe s   n o t   m e a t ha t   t h e   W ID F   a n d   V S M   a l go r i t hm s   a r e   w r o n g ,   H ow e v e r ,   i t   i s   b e c a us e   t h e   t e xt   r e p r e s e nt a t i o t h a t   us e (b a g - of   w o r o 1 - g r a m )   i s   n o t   go o i m a i nt a i n i ng  t h e   m e a n i ng  o f   t e xt   do c um e nt s .   N o w a da y s ,   t h e r e   a r e   m a n y   T e xt   M i ni n r e s e a r c h e s   t ha t   p r o v e   a n us e   m ul t i p l e   o f   w o r ds   o r   n - g r a m s   t ha t   c a n   m a i nt a i n   t h e   m e a ni n o t e xt   b e t t e [56 - 61] .   E v e n   G o o gl e   s e a r c e n g i n e s   t ha t   i m p l e m e nt   IR   a n d   T M   t e c hn o l o g y   do   n o t   us e   1 - g ra m ,   b e c a us e   w h e n   w e   s e a r c h   f o r   t h e   w o r " I n f o r m a t i o R e t r i e v a l "   (w i t h o ut   quo t i ng  a s   i n pu t   ke y w o r ds o G oo gl e   s e a r c e ngi n e s ,   t h e   i n f o r m a t i o t ha t   w i l l   b e   ge n e ra t e i s   r e l a t e t o   " In f o r m a t i o n " ,   " R e t ri e v a l "   a nd  " In f o r m a t i o R e t r i e v a l " .       4   C O N C LU S I O N   T h i s   s t udy   us e   W e i g h t e d   I n v e r s e   D o c um e n t   F r e que n c y   a n d   V e c t o r   S pa c e   M o de l   a s   a l go r i t hm s   t o   b ui l s e a r c h   e n gi n e   o f   H a di t w h i c h   i s   a n   i m po r t a n t   s o ur c e   f o r   M us l i m .   B a s e o t h e   e xpe r i m e nt s   t h a t   w e r e   c o n duc t e d,   t h i s   s t udy   ha s   h i g R e c a l l   t ha t   m e a n s   s uc c e s s   t o   p ro duc e   i n f o r m a t i o n   o f   H a di t h s   i a c c o r da n c e   w i t h   i n put   ke y w o r ds .   H ow e ve r ,   t h e   p r e c i s i o v a l ue   i s   s m a l l   t h a t   m e a n s   m o s t   o f   t h e   i n f o r m a t i o t ha t   i s   p r o duc e a r e   n o t   r e l e v a n t   w i t h   t h e   i nt e nt   o f   t h e   ke y w o r ds   e n t e r e d.   It   i s   c a us e by   s e v e r a l   f a c t o r s ,   w hi c h   n o t   d ue   t o   t h e   a l go ri t hm   us e d,   b ut   due   t o   t h e   t e xt   r e p r e s e n t a t i o us e d.   T h e r e fo r e ,   f o r   t h e   f urt h e r e s e a r c h,   b e s i de s   ha di t da t a   t h a t   n e e ds   t o   b e   c o m pl e t e s o   t ha t   i t   i s   r i c h   i i n f o r m a t i o n ,   t h e   t e xt   r e p r e s e n t a t i o n   us e i s   a l s o   b e t t e r   w hi c i n c l ud e s   m ul t i p l e   o f   w o r ds   t o   m a i n t a i t h e   m e a ni n g   o f   be t t e r   a n d   t h e   r e s ul t i n g   ha di t i n f o r m a t i o i s   m o r e   r e l e v a nt .   I n   a ddi t i o n ,   f u r t h e r   r e s e a r c h   i s   a l s o   n e e de r e l a t e t o   t h e   e f fe c t   of   W ID F   o n   s e a r c h   r e s ul t s .   b e s i de s   t h a t   a l go r i t hm s   c a n   a l s o   b e   a ppl i e i a ddi t i o n   t o   V S M   f o r   t he   s e a r c h   e n g i n e   ha di t h .       A C K N O WL ED G E M EN T   A ut h o r s   w i s h i ng   t o   a c k n o w l e dg e   R e s e a r c a n d   P ub l i c a t i o n   Ce n t r e   o f   U IN   S una G u n u n g   D j a t i   B a n du ng  t ha t   s uppo r t s   a n d   f un ds   t hi s   r e s e a r c pub l i c a t i o n .       R EF ER EN C ES   [ 1]   A .   C .   M una ,   P e r ke m b a ng a S t ud i   H a di t s   K o nt e m po r e r   [ D e v e l o pm e nt   o f   C o nt e m po r a r y   H a di t S t u di e s ] ,   R e l i gi a v o l .   14,   no .   2 ,   2012 .   [ 2]   M a r da n i ,   H uk um   I s l am ;   P e ngant a r   I l m H uk um   I s l am   di   I nd one s i a   [ I s l am i c   l aw ;   I nt r odu c t i on   t o   I s l am i c   L aw   i I ndo ne s i a ] .   Y o gy a ka r t a :   P us t a ka   P e l a j a r ,   2015 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   25 02 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   2 M a y   20 2 :     1004   -   1 014   1012   [ 3]   R o hi di n ,   P e ngant ar   H uk um   I s l am   ( D ar i   Se m e nanj ung  A r ab i a   Sam p ai   I nd one s i a)   [ I nt r odu c t i on   t I s l am i c   L aw   ( F r om   t he   A r abi an   P e ni ns ul t o   I n done s i a) ] ,   1 s t   e d .   Y o gy a ka r t a :   L i nt a ng   R a s i   A ks a r a   B o o ks ,   20 16.   [ 4]   F.   D j a m i l ,   F i l s a f a t   H uk um   I s l am   [ P hi l o s oph y   of   I s l am i c   L aw ] .   J a k a r t a :   L og o s   W a c a na   I l m u,   19 97 .   [ 5]   A bd  a l - W a ha K ha l l a f ,   I l m   U s ul   a l - F i qh .   K a i r o :   D a r   A l - H a di t h,   2 0 03.   [ 6]   A .   W a h y udi ,   M e ng ur a i   P e t a   K i t a b - K i t a H a di t s   ( K a j i a n   R e f e r e ns i   a t a s   K i t a b - ki t a H a d i t s)   [ U N D E R S T A N D I N G   T H E   M A P   O F   T H E   B O O K S   O F   H A D I T S   ( R e f e r e nc e   S t u dy   o f   t he   B oo ks   o f   H a di t h) ] ,   AL - I H K A M   J .   H uk .   P r an at Sos . ,   20 15.   [ 7]   P .   W .   H a n da y a ni ,   I .   M .   W i r y a na ,   a n J . - T .   M i l de ,   M e s i P e nc a r i   B e r ba s i s ka n   S e m a nt i U nt u B a ha s a   I ndo ne s i a   [ S e a r c hi ng   M a c h i ne   B a s e d   O n   S e m a nt i c s   F o r   I ndo ne s i a L a ng u a g e s ] ,   J u r na l   Si s t e m   I n f or m as i ,   v o l .   4,   no .   2 .     pp.   11 0 11 4,   20 12.   [ 8]   J .   M .   K a s s i m   a nd   M .   R a hm a ny ,   I nt r odu c t i on   t o   Se m ant i c   Se ar c h   E ngi ne ,   20 09   I nt .   C o nf .   E l e c t r .   E ng .   I nf o r m a t i c s v o l .   02,   no .   A ug us t ,   pp .   38 0 386 ,   200 9.   [ 9]   J .   B .   K i l l o r a n,   H o w   t o   u s e   s e a r c e ng i ne   o pt i m i z a t i o t e c hn i qu e s   t o   i nc r e a s e   w e bs i t e   v i s i b i l i t y ,   I E E E   T r a ns .   P r o f .   C om m un. ,   v o l .   56 ,   no .   1,   pp .   50 66,   2 013 .   [ 10]   S .   M .   W e i s s ,   N .   I ndur khy a ,   T .   Z ha ng ,   a nd   F .   J .   D a m e r a u ,   I nf o r m a t i o n   R e t r i e v a l   a nd   T e xt   M i n i ng ,   Spr i nge r   B e r l i n   H e i de l b. ,   no .   F u nda m e nt a l s   o f   P r e di c t i v e   T e x t   M i ni ng ,   pp .   75 90 ,   2 010.   [ 11]   C .   D .   M a nn i ng ,   P .   R a g a hv a n,   a nd   H .   S c hut z e ,   A I n t r od uc t i on  t o   I n f or m a t i on   R e t r i e v al ,   no .   c .   20 09 .   [ 12]   P .   R .   A g r a w a l ,   G o o g l e   S e a r c h,   2 016 .   [ 13]   C .   C .   B r o w n,   G o o g l e   S c ho l a r ,   C har l e s t .   A dv i s . ,   2 017 .   [ 14]   A .   H a s s a n   a nd   S .   S .   D a dw a l ,   S e a r c E ng i ne   M a r ke t i ng ,   i n   D i gi t a l   M ar k e t i ng   a nd  C ons um e r   E n gage m e nt ,   20 17.   [ 15]   A .   A .   M a a r i f ,   P e ne r a p a n   A l g o r i t m a   T F - I D F   unt uk   P e nc a r i a n   K a r y a   I l m i a h   [ A ppl i c a t i o o f   T F - I D F   A l go r i t hm   f o r   S c i e nt i f i c   W o r S e a r c h] ,   D o k .   K a r y a   I l m .   |   T ugas   A k hi r   |   P r ogr .   S t ud.   T e k .   I nf o r m .   -   S1   |   F ak .   I l m u   K om p ut .   |   U ni v .   D i an   N us w ant or o   Se m ar a ng ,   2 015 .   [ 16]   A .   A .   O kf a R i z a l   F e r di a ns y a h,   E m a   U t a m i ,   I m pl e m e nt a s i   P r i nc i p a l   C o m po ne n t   A na l y s i s   U nt u S i s t e m   T e m u   B a l i k   C i t r a   D i g i t a l   [ I m pl e m e n t a t i o o f   P r i nc i pa l   C o m po ne nt   A na l y s i s   f o r   D i g i t a l   I m a g e   R e t r i e v a l   S y s t e m s ] ,   C r e at .   I n f .   T e c hnol .   J . ,   v o l .   2 ,   no .   3,   20 15.   [ 17]   C .   S l a m e t ,   R .   A ndr i a n,   D .   S .   M a y l a w a t i ,   W .   D a r m a l a k s a n a ,   a nd   M .   A .   R a m dh a ni ,   W e S c r a pi ng   a nd  N a ï v e   B a y e s   C l a s s i f i c a t i o f o r   J o S e a r c h   E ng i ne ,   v o l .   288 ,   no .   1 ,   pp .   1 7 ,   201 8.   [ 18]   F .   A m i n ,   S i s t e m   T e m K e m ba l i   I nf o r m a s i   de ng a n   P e m e r i ng ka t a n   M e t o de   V e c t o r   S pa c e   M o de l   [ I nf o r m a t i o R e t r i e v a l   S y s t e m   w i t h   V e c t o r   S p a c e   M o de l   R a nk i ng   M e t ho d] ,   J .   T e k nol .   I nf .   D i n . ,   v o l .   18 ,   no .   2 ,   pp .   122 129 ,   2013 .   [ 19]   G .   K a r y o n o ,   F .   S .   U t o m o ,   A .   S i s t e m ,   a nd   T .   B a l i k ,   T e m u   B a l i k   I nf o r m a s i   P a da   D o kum e n   T e ks   B e r b a ha s a   I ndo ne s i a   D e ng a M e t o de   V e c t o r   S pa c e   R e t r i e v a l   M o de l   [ I nf o r m a t i o R e t r i e v a l   i n   I ndo ne s i a n   L a ng ua g e   T e x t   D o c um e nt s   U s i ng   t he   V e c t o r   S pa c e   R e t r i e v a l   M o de l ] ,   Se m i n.   N a s .   T e k n ol .   I n f .   dan   T e r a p.   20 12 ,   v o l .   20 12,   no .   S e m a n t i k ,     pp.   28 2 28 9,   20 12.   [ 20]   F .   S a nj a y a ,   P e m a nf a a t a S i s t e m   T e m K e m ba l i   I nf o r m a s i   d a l a m   P e nc a r i a D o kum e n   M e ng g una ka n   M e t o de   V e c t o r   S pa c e   M o de l   [ U t i l i z a t i o n   o f   I nf o r m a t i o n   R e t r i e v a l   S y s t e m   i n   F i n di ng   D o c um e nt s   U s i ng   t he   V e c t o r   S pa c e   M o de l   M e t ho d] ,   J .   I nf .   T e c hno l . ,   20 18.   [ 21]   P .   E .   M a s udi a ,   M .   D .   A t m a dj a ,   a nd   L .   D .   M us t a f a ,   I nf o r m a t i o R e t r i e v a l   T ug a s   A khi r   D a n   P e r h i t u ng a K e m i r i pa D o kum e M e ng a c u   P a d a   A bs t r a k   M e ng g una ka n   V e c t o r   S pa c e   M o de l   [ I nf o r m a t i o n   R e t r i e v a l   O f   F i na l   P r o j e c t   A nd  C a l c ul a t i o O f   R e f l e c t i ng   D o c um e nt s   I A bs t r a c t   U s i ng   V e c t o r   S p a c e   M o de l ] ,   Si m e t r i s   J .   T e k .   M e s i n ,   E l e k t r d an  I l m u   K om p ut . ,   2 017 .   [ 22]   I .   I r m a w a t i ,   I nf o r m a t i o R e t r i e v a l   i D o c um e nt s   u s i ng   V e c t o r   S pa c e   M o de l ,   J .   I l m .   F I F O ,   20 17.   [ 23]   C .   V a G y s e l ,   M .   d e   R i j ke ,   a nd   E .   K a no ul a s ,   L e a r ni ng   L a t e n t   V e c t o r   S pa c e s   f o r   P r o duc t   S e a r c h,   2016 .   [ 24]   T .   N a du ,   T e x t   P r o c e s s i ng   I I nf o r m a t i o R e t r i e v a l   S y s t e m   U s i ng   V e c t o r   S pa c e   M o de l ,   no .   9 78 ,   p p.   0 5,   20 14 .   [ 25]   D .   S us a nd i   a nd   U .   S ho l a hud i n ,   P e m a nf a a t a n   V e c t o r   S p a c e   M o de l   pa da   P e n e r a p a n   A l g o r i t m a   N a z i e f   A dr i a ni ,   K N N   da F u ng s i   S i m i l a r i t y   C o s i ne   u nt uk  P e m bo bo t a I D F   da W I D F   pa da   P r o t o t i pe   S i s t e m   K l a s i f i k a s i   T e ks   B a ha s a   I nd o ne s i a   [ U t i l i z a t i o o f   V e c t o r   S pa c e   M o de l   i t he   A ppl i c a t i o o f   N a z i e f   A dr i a n i ,   K N N   a nd  S i m i l a r i t y   C o s i ne   F unc t i o ns   f o r   I D F   a nd   W I D F   W e i g ht i ng   i n   t he   I ndo ne s i a n   T e x t   C l a s s i f i c a t i o n   S y s t e m   P r o t o t y pe ] ,   v o l .   3,   no .   1 ,     pp.   22 29 ,   2016 .   [ 26]   C .   D .   M a nn i ng ,   P .   R a g ha v a n,   a nd   H .   S c hut z e ,   I n t r o duc t i on  t o   I nf o r m at i on  R e t r i e v al .   2008 .   [ 27]   A .   M .   S i r e g a r   a nd   A .   P us p a bh ua n a ,   I m p r ov e m e nt   o f   t e r m   w e i ght   r e s ul t   i t he   i n f o r m at i on   r e t r i e v a l   s y s t e m s ,     i P r o c e e di ng s   o f   2017   4 t h   I nt e r na t i o n a l   C o nf e r e nc e   o n   N e w   M e di a   S t udi e s ,   C O N M E D I A   2017 ,   201 8.   [ 28]   F .   N a d i r m a n,   A .   R i dha ,   a n A .   A nni s a ,   S e a r c hi ng   a n V i s u a l i z a t i o o f   R e f e r e nc e s   i n   R e s e a r c D o c um e nt s ,   T E L K O M N I K A   ( T e l e c om m un i c a t i on   C om pu t .   E l e c t r on .   C ont r o l . ,   2 014.   [ 29]   Y .   W a ng ,   D e s i g o f   I nf o r m a t i o R e t r i e v a l   S y s t e m   U s i ng   R o ug F u z z y   S e t ,   T E L K O M N I K A   I nd one s .   J .   E l e c t r .   E n g. 2014 .   [ 30]   H .   J i a w e i ,   M .   K a m be r ,   J .   H a n ,   M .   K a m be r ,   a nd  J .   P e i ,   D at a   M i ni n g :   C o nc e pt s   a nd   T e c hn i que s .   2 006 .   [ 31]   Y .   E .   Z o ha r ,   I nt r o duc t i o n   t o   T e x t   M i ni ng ,   A u t om a t e d   L e ar ni n G r oup ,   U n i v e r s i t y   o f   I l l i noi s ,   2002 .   [ O nl i n e ] .   A v a i l a b l e :   ht t p: / / w w w . do c s t o c . c o m / doc s / 2544 3990 / I nt r o duc t i o n - to - T e xt M i n i ng .   [ 32]   I .   H .   W i t t e n ,   T e x t   m i n i ng ,   i T he   P r ac t i c al   H and boo k   o f   I n t e r ne t   C om put i ng ,   200 4.     [ 33]   T .   T o kuna g a ,   T .   T o kuna g a ,   I .   M a ko t o ,   a nd   I .   M a ko t o ,   T e x t   c a t e g o r i z a t i o b a s e d   o w e i g ht e d   i nv e r s e   do c um e nt   f r e que nc y ,   Spe c .   I n t e r e s .   G r oup s   I n f .   P r oc e s s   So c .   J apan   ( SI G - I P S J ,   199 4.   [ 34]   K ur n i a w a t i   a nd   A .   S y a uqi ,   T e r m   w e i ght i ng   ba s e c l a s s   i nde x e s   u s i ng  s pac e   de ns i t y   f or   A l - Q u r an  r e l e v an t   m e an i ng   r ank i ng ,   i n   20 16   I nt e r n a t i o na l   C o nf e r e nc e   o A dv a nc e C o m put e r   S c i e nc e   a nd   I nf o r m a t i o n   S y s t e m s ,     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       W e i ght e i nv e r s e   doc um e n t   f r e qu e nc y   and   v e c t or   s pa c e   m od e l   f or   hadi t h   s e ar c h…   ( Se pt y a   E g ho  P r at am a )   1013   I C A C SI 2 016 ,   201 7.   [ 35]   G .   S a l t o n,   A .   W o ng ,   a nd   C .   S .   Y a ng ,   A   v e c t o r   s pa c e   m o de l   f o r   a u t o m a t i c   i n de x i ng ,   C om m u n.   A C M ,   19 75 .   [ 36]   C .   S l a m e t ,   A .   R .   A t m a d j a ,   D .   S .   M a y l a w a t i ,   R .   S .   L e s t a r i ,   W .   D a r m a l a ks a na ,   a n M .   A .   R a m dha ni ,   A ut om at e T e x t   Sum m ar i z a t i on  f o r   I nd one s i a A r t i c l e   U s i ng   V e c t o r   S pac e   M o de l ,   I O P   C o nf .   S e r .   M a t e r .   S c i .   E ng . ,   v o l .   288 ,   no .   1 ,   pp.   0 6,   20 18.   [ 37]   L .   T .   S u ,   T he   r e l e v a nc e   o f   r e c a l l   a n pr e c i s i o n   i n   u s e r   e v a l ua t i o n ,   J .   A m .   Soc .   I n f .   S c i . ,   1994 .   [ 38]   L .   T o r g o   a nd  R .   R i be i r o ,   P r e c i s i o a nd   r e c a l l   f o r   r e g r e s s i o n,   i n   L e c t ur e   N o t e s   i n   C om put e r   S c i e nc e   ( i nc l ud i ng   s ubs e r i e s   L e c t ur e   N o t e s   i n   A r t i f i c i al   I nt e l l i ge nc e   an L e c t u r e   N o t e s   i B i o i n f or m at i c s ) ,   2009 .   [ 39]   M .   J unk e r ,   R .   H o c h,   a nd   A .   D e ng e l ,   O n   t he   e v a l ua t i on   o f   doc um e nt   ana l y s i s   c om p one nt s   by   r e c a l l ,   p r e c i s i on ,   an ac c u r ac y ,   i n   P r o c e e di ng s   o f   t h e   I nt e r na t i o na l   C o nf e r e nc e   o D o c um e nt   A na l y s i s   a nd   R e c o g ni t i o n ,   I C D A R ,   1 999 .   [ 40]   I .   H .   A l - A s qa l a n i ,   B u l ug hul   A l - M a r am ,   T e r j e m ah  o l e A . H as an .   B a ng i l :   P us t a ka   T a m a m ,   199 7.   [ 41]   S .   V i j a y a r a ni ,   J .   I l a m a t hi ,   a nd  M .   N i t hy a ,   P r e p r o c e s s i ng   T e c hn i qu e s   f o r   T e x t   M i n i ng   -   A O v e r v i e w ,   I n t .   J .   C om p ut .   Sc i .   C om m un .   N e t w or k s ,   v o l .   5 ,   no .   1,   p p.   7 16,   2 015 .   [ 42]   D .   S .   M a y l a w a t i ,   H .   A ul a w i ,   a nd   M .   A .   R a m d ha n i ,   F l e x i b i l i t y   o f   I n do ne s i a t e x t   p r e - pr o c e s s i ng   l i br a r y ,   I n done s .   J .   E l e c t r .   E ng .   C om pu t .   S c i . ,   2 019 .   [ 43]   T .   M a r d i a na ,   T .   B ha r a t a   A dj i ,   a n I .   H i d a y a h,   S t e m m i ng   I nf l ue nc e   o S i m i l a r i t y   D e t e c t i o o f   A bs t r a c t   W r i t t e i n   I nd o ne s i a ,   T E L K O M N I K A   ( T e l e c om m un i c a t i on   C om pu t .   E l e c t r on .   C on t r o l . ,   20 16.   [ 44]   A .   S .   R i z ki ,   A .   T j a hy a nt o ,   a n R .   T r i a l i h ,   C o m pa r i s o o f   s t e m m i ng   a l g o r i t hm s   a nd  i t s   e f f e c t   o I ndo ne s i a n   t e x t   pr o c e s s i ng ,   T E L K O M N I K A   ( T e l e c om m uni c at i on   C om p ut .   E l e c t r on .   C o nt r o l . ,   2019 .   [ 45]   A .   F .   H i da y a t ul l a h ,   C .   I .   R a t na s a r i ,   a nd   S .   W i s n ug r o ho ,   A na l y s i s   o f   S t e m m i ng   I nf l ue nc e   o I ndo ne s i a T w e e t   C l a s s i f i c a t i o n,   T E L K O M N I K A   ( T e l e c om m uni c at i o C om put .   E l e c t r on .   C o nt r ol . ,   2016 .   [ 46]   J .   A s i a n ,   H .   E .   W i l l i a m s ,   a n S .   M .   M .   T a h a g ho g hi ,   S t e m m i ng   I n do ne s i an ,   i n   C o nf e r e nc e s   i R e s e a r c a nd  P r a c t i c e   i I nf o r m a t i o T e c hno l o gy   S e r i e s ,   2 005 .   [ 47]   M .   A dr i a n i ,   J .   A s i a n ,   S .   M .   M .   T .   N a z i e f ,   a nd  H .   W i l l i a m s ,   S t e m m i ng   I nd o ne s i a n:   A   C o nf i x - s t r i p pi ng   a pp r o a c h,   A C M   T r a ns .   A s i an  L ang .   I n f .   P r oc e s s . ,   v o l .   6 ,   no .   1 ,   pp .   1 33 ,   200 7 .   [ 48]   L .   A g us t a ,   P e r ba nd i ng a n   A l g o r i t m a   S t e m m i ng   P o r t e r   D e ng a A l go r i t m a   N a z i e f   &   A dr i a n i   U n t uk   S t e m m i ng   D o kum e T e k s   B a ha s a   I ndo ne s i a ,   K on f .   N a s .   S i s t .   d an  I n f or m .   200 9 ,   200 9.   [ 49]   R .   S e t i a w a n ,   A .   K u r n i a w a n,   W .   B ud i h a r t o ,   I .   H .   K a r t o w i s a s t r o ,   a n H .   P r a bo w o ,   F l e xi b l e   A f f i C l a s s i f i c a t i o f o r   S t e m m i ng   I ndo ne s i a n   L a ng ua g e ,   i n   E l e c t r i c al   E ng i ne e r i ng / E l e c t r on i c s ,   C om put e r ,   T e l e c om m un i c a t i ons   and   I nf or m a t i on  T e c hno l og y   ( E C T I - C O N ) ,   2 01 6.   [ 50]   D .   S .   M a y l a w a t i ,   W .   B .   Z ul f i ka r ,   C .   S l a m e t ,   a nd   M .   A .   R a m dha n i ,   A n   I m p r ov e d   o f   S t e m m i ng   A l go r i t hm   f or   M i ni ng  I ndo ne s i an   T e x t   w i t h   S l ang   o n   Soc i a l   M e d i a ,   i T he   6 t h   I nt e r na t i o na l   C o nf e r e nc e   o C y be r   a n I T   S e r v i c e   M a n a g e m e nt   ( C I T S M   2018 ) ,   2 018 .   [ 51]   H .   M .   W a l l a c h,   T o pi c   M o de l i ng :   B e y o nd  B a g - of - W o r ds ,   I C M L ,   no .   1 ,   pp.   9 77 9 84,   2 006 .   [ 52]   D .   S a A di l l a M a y l a w a t i ,   M .   I r f a n,   a nd   W .   B udi a w a n   Z u l f i ka r ,   C om p ar i s on   be t w e e B I D E ,   P r e f i x Sp an ,   a nd  T R ul e G r ow t f o r   M i n i ng   o f   I ndo ne s i a T e x t ,   i n   J o ur n a l   o f   P hy s i c s :   C o nf e r e nc e   S e r i e s ,   2 017 ,   v o l .   801 ,   no .   1.   [ 53]   S .   J .   P u t r a ,   M .   N .   G una w a n,   I .   K ha l i l ,   a nd  T .   M a nt o r o ,   S e nt e nc e   bo unda r y   di s a m b i g ua t i o f o r   I ndo ne s i a l a ng ua g e ,   pp.   58 7 59 0,   20 18.   [ 54]   P us a t   B a ha s a   K e m d i kbu d,   K a m us   B e s a r   B a ha s a   I ndo ne s i a   (   K B B I   ) ,   K e m e nt e r i .   P e ndi di k .   da B uday a ,   20 16 .   [ 55]   E .   S e t i a w a n ,   K B B I   -   K a m us   B e s a r   B a h a s a   I ndo ne s i a   [ I ndo ne s i a D i c t i o na r y ] ,   K am u s   B e s ar   B a has I nd one s i ( K B B I ) ,   20 19 .     [ 56]   D .   S .   M a y l a w a t i   a nd   G .   A .   P .   S a pt a w a t i ,   Se t   of   F r e que nt   W or d   I t e m   s e t s   a s   F e at ur e   R e pr e s e nt at i on   f o r   T e x t   w i t I ndo ne s i an   S l an g ,   i n   I nt e r n a t i o na l   C o nf e r e nc e   o C o m put i ng   a nd   A ppl i e d   I nf o r m a t i c s ,   2016 ,   pp .   1 6.   [ 57]   S .   A l i a s ,   S .   K .   M o ha m m a d,   G .   K .   H o o n,   a nd  T .   T .   P i ng ,   A   t e x t   r e p r e s e n t a t i o m o de l   us i n g   S e q ue n t i a l   P a t t e r n - G r o w t h   m e t ho d,   P at t e r A nal .   A pp l . ,   v o l .   2 1,   no .   1 ,   p p.   23 3 24 7,   20 18 .   [ 58]   H .   A ho ne n - M y ka ,   F i nd i ng   A l l   M a x i m a l   F r e que nt   S e qu e nc e s   i n   T e xt ,   P r oc .   I C M L   W or k .   M a c h.   L e ar n .   T e x t   D a t a   A nal . ,   p p.   11 17 ,   1999 .   [ 59]   H .   A ho ne n - M y ka ,   D i s c o v e r y   of   F r e qu e nt   W o r S e q ue nc e s   i T e xt ,   P r o c .   E SF   E x p l or .   W or k .   P at t e r n   D e t e c t .   D i s c ov . ,   v o l .   { L N C S }   ( 24 ,   no .   T e o l l i s uu s ka t u   23 ,   pp .   180 189 ,   200 2.   [ 60]   R .   A .   G a r c í a - H e r n á nd e z   a nd   Y .   L e d e ne v a ,   W or d   s e que nc e   m o de l s   f or   s i ng l e   t e x t   s um m a r i z at i o n ,   P r o c .   2n I nt .   C o nf .   A dv .   C o m put .   I nt e r a c t .   A C H I   2009 ,   pp .   4 4 48 ,   200 9.   [ 61]   S .   J .   P ut r a ,   T .   M a n t o r o ,   a nd  M .   N .   G una w a n ,   T e x t   m i n i n f or   I n done s i a t r an s l at i on  of   t he   Q ur an:   A   s y s t e m at i c   r e v i e w ,   i 3 r d   I nt e r n a t i o na l   C o nf e r e nc e   o C o m put i ng ,   E ng i ne e r i n g ,   a nd   D e s i g n,   I C C E D   2017 ,   2018 .       B I O G R A P H I ES   O F   A U T H O R S       S e pt y a   E g ho   P r a t a m a   i s   a   g r a du a t e   s t u de n t   f r o m   D e pa r t m e n t   o f   I nf o r m a t i c s ,   U I N   S una n   G unung   D j a t i   B a nd ung .       Evaluation Warning : The document was created with Spire.PDF for Python.