I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   17 ,   N o .   3 M a r c 20 20 ,   pp.   1 1 65 ~ 11 71   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 7 .i 3 . pp 116 5 - 1171       1165       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   Phishi n g   d e t e c t i o n   s y st e m   u si n g   m a c h i n e   l e a r n i n g   c l a s si f i e r s       N u r   S h o l i h ah   Zai n i 1 ,   D e r i s   S t i aw an 2 ,   M o h d   F ai z a l   A b   R a z a k 3 ,   A h m ad   F i r d au s 4   Wan   I s n i   S o fi ah   Wan   D i n 5 ,   S h ah r e e n   K as i m 6 To l e   S u ti k n o 7   1 , 3 , 4 , 5 F a c ul t y   of   C o m put e r   S y s t e m s   &   S o f t w a r e   E ng i n e e r i ng ,   U n i v e r s i t y   M a l a y s i a   P a h a ng ,   M a l a y s i a   2 D e pa r t m e n t   o f   C o m put e r   E ng i ne e r i ng ,   U n i v e r s i t a s   S r i w i j a y a ,   I ndone s i a   6 F a c ul t y   of   C o m put e r   S c i e nc e   &   I nf o r m a t i o T e c hno l o gy ,   U ni v e r s i t i   T un   H u s s e i n   O nn   M a l a y s i a ,   M a l a y s i a   7 D e pa r t m e n t   o f   E l e c t r i c a l   a nd   C o m put e r   E ng i n e e r i ng ,   U ni v e r s i t a s   A hm a D a hl a n ,   I ndo ne s i a       A r ti c l e   I n fo     A B S TR A C T   Ar t i c l e   h i s t or y :   R e c e i v e Ju l   2 9,   20 19   R e v i s e S e p   2 0 ,   201 9   A c c e pt e O c t   11 ,   2 01 9       T he   i nc r e a s i ng   de v e l o pm e n t   o f   t he   I nt e r ne t ,   m o r e   a nd  m o r e   a pp l i c a t i o ns   a r e   put   i n t o   w e bs i t e s   c a b e   d i r e c t l y   a c c e s s e t h r o ug t he   ne t w o r k.     T hi s   d e v e l o pm e nt   h a s   a t t r a c t e a a t t a c ke r   w i t phi s h i ng   w e bs i t e s   t o   c om pr o m i s e   c o m put e r   s y s t e m s .   S e v e r a l   s o l ut i o ns   ha v e   be e pr o po s e t de t e c t   a   ph i s h i ng   a t t a c k.   H o w e v e r ,   t he r e   s t i l l   r o o m   f o r   i m pr o v e m e nt   t o   t a c kl e   t hi s   ph i s hi ng   t h r e a t .   T h i s   p a pe r   a i m s   t o   i nv e s t i g a t e   a nd  e v a l ua t e   t he   e f f e c t i v e ne s s   o f   m a c hi ne   l e a r ni ng   a ppr o a c i t he   c l a s s i f i c a t i o o f   phi s hi ng   a t t a c k.   T h i s   pa p e r   a pp l i e a   he u r i s t i c   a pp r o a c w i t m a c h i ne   l e a r n i ng   c l a s s i f i e r   t o   i de n t i f y   phi s h i ng   a t t a c ks   no t e d   i n   t h e   w e s i t e   a p pl i c a t i o ns .     T he   s t udy   c om pa r e s   w i t f i v e   c l a s s i f i e r s   t o   f i nd   t h e   b e s t   m a c hi n e   l e a r ni ng  c l a s s i f i e r s   i n   de t e c t i ng   ph i s h i ng   a t t a c ks .   I i de nt i f y i ng   t he   ph i s h i n g   a t t a c ks ,     i t   d e m o ns t r a t e s   t ha t   r a ndo m   f o r e s t   i s   a b l e   t o   a c hi e v e   h i g de t e c t i o n   a c c ur a c y   w i t t r u e   po s i t i v e   r a t e   v a l u e   o f   94. 79%   us i ng   w e bs i t e   f e a t u r e s .   T he   r e s ul t s   i nd i c a t e   t h a t   r a n do m   f o r e s t   i s   e f f e c t i v e   c l a s s i f i e r s   f o r   de t e c t i ng     phi s hi ng   a t t a c ks .   Ke y w or ds :   Int r us i o n   de t e c t i o n   M a c hi n e   l e a rni n g   M a l w a r e   P h i s hi n g   W e b s i t e   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   A hm a d   F i r d a us ,     F a c ul t y   of   Co m put e r   S y s t e m s   &   S of t w a r e   E n g i n e e ri n g ,   U n i v e r s i t y   M a l a y s i a   P a ha n g ,   L e b uhr a y a   T u R a z a k,   26 300  G a m b a ng,   K ua nt a n,   P a ha n g ,   M a l a y s i a .   E m a i l :   f i r d a us z a @ um p . e du. m y       1.   I N TR O D U C TI O N     T h e   P h i s h i ng  de f i n e a s   a   w a y   of   a t t e m pt i ng  t o   a c qui r e   i n f o rm a t i o s uc a s   us e rna m e s ,   pa s s w o r ds ,   a n c r e di t   c a rd  de t a i l s   b y   m a s que r a d i n a s   a   t r us t w o r t h y   e n t i t y   i n   e l e c t r o n i c   c o m m u ni c a t i o n .   It   i s   a   t o o l   us e d   by   c y be r   c r i m i na l s   t o   s t e a l   pe r s o n a l   i n f o r m a t i o n   f r o m   t h e   us e r .   T h e   c ri m i n a l s   w i l l   c r e a t e   a   f a ke   w e b s i t e   t ha t   l o o ks   t h e   s a m e   a s   t h e   r e a l   w e b s i t e s .   T h e   us e r   w i l l   ge t   f r a u by   e n t e r i n t h e i r   c o n f i de n t i a l   i n f o r m a t i o n   s uc h   a s   pa s s w o r d,   b a n de t a i l s   a n d   a c c o un t   c r e de nt i a l s   i n t o   t h e   f a ke   w e bs i t e s   [1 - 3] .   T h e   c r i m i n a l   w i l l   t h e n   us e   t h e   i n f o r m a t i o n   p r o v i de t o   a c c e s s   t h e   a c c o un t   t o   b u y   s t u ff ,   t r a n s f e r   m o n e y ,   o r   o t h e r   da m a g i n a c t i v i t i e s   [ 3 ,   4 ]   F o r   e xa m pl e ,   i n   20 16  t h e   p h i s hi n a t t a c up  t o   65%  w o r l dw i de   w h i c h   c o s t s   a bo ut   $1. m i l l i o n   [ 5 ]   T h e   n u m b e r   o f   ph i s hi n a t t a c ks   ha s   i n c r e a s e s i g n i f i c a n t l y   i n   r e c e n t   y e a r s ,   w h e r e   2. m i l l i o n   s i t e s   c r e a t e   i n   M a y   2017  [ 6 ] .   A ppr o xi m a t e l y   n e a rl y   1. m i l l i o n   p hi s h i ng   s i t e s   c r e a t e e a c h   m o n t [ 6 ] .   O v e r   t h e   y e a r s ,   phi s h i n a t t a c ks   h a v e   i n c r e a s e gl o b a l l y .   T h e   t o t a l   num b e r   of   ph i s h e s   de t e c t e w a s   263, 538  i n   f i r s t   qu a r t i l e   2018.   T h i s   i n c r e a s e by   46  pe r c e n t   c o m pa r e t o   t h e   180, 5 77  o b s e r v e i n   f o ur t h   qu a r t i l e   201 7.   I t   w a s   a l s o   c o n s i de r a b l y   m o r e   t h a n   i n   t hi r qu a r t i l e   2017  i n   190 , 942  [ 7 ] .   F i gu r e   i l l us t ra t e s   t h e   s t a t i s t i c   of    phi s h i n g   a t t a c ks .       Evaluation Warning : The document was created with Spire.PDF for Python.
            IS S N :   2 502 - 47 52   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   17 ,   N o .   3 M a r c 20 20  :   1 1 6 5   -   1 1 7 1   1166   F i gu r e   de m o n s t r a t e s   t h e   i n c r e a s i n o f   phi s h i n w e b s i t e s   f r o m   t h e   y e a r   201 u nt i l   M a r c h   20 18.     T h e   i n c r e a s i n o f   w e b s i t e s   a l s o   be c a us e   t h e r e   a   l o t   o f   ph i s hi n g   t o o l ki t s   s uc a s   R o c P h i s h   a nd  S upe r   P h i s h e r   t h a t   m a ke   e a s y   fo r   a t t a c ke r s   t o   c r e a t e   f r a udu l e nt   w e b s i t e s   [ 8 ] T h i s   f ra udu l e nt   w e b s i t e   a b l e   t o   s t e a l   t h e   s o ur c e   c o d e   n o r m a l   w e b s i t e s   [ 8 ] .   T h e r e f o r e ,   t h e r e   i s   a   n e e f o r   a n   e f fe c t i ve   a n t i - p h i s hi n s o l ut i o n   f o r   de t e c t i ng  phi s h i n g   w e b s i t e s   a n c o nt r o l   t hi s   i nt e rn e t   t hr e a t .   T h e r e   a re   s e v e r a l   a nt i - p h i s hi n de t e c t i o n s   t ha t   ha s   b e e n   de ve l o pe by   t h e   p r e v i o us   r e s e a r c h e r   s uc h   a s   us i n g   he ur i s t i c   [ 9 ] ,   b l a c kl i s t   [ 10 ] ,   a n c o n t e n t - b a s e d     a pp r o a c h   [ 11 ] .   E v e n   t h o ug h   t h e s e   a nt i - p hi s h i ng   s o l ut i o n s   ha v e   be e n   s o l v i n p h i s hi n a t t a c ks ,   b ut   t h e   us e r s   s t i l l   p r o n e   t o   n e w   ph i s hi n g   a t t a c ks .   T h i s   ha ppe n s   b e c a us e   a t t a c ke r s   a r e   n o t   s t a t i c   i t h e i a c t i v i t i e s ;   a t t a c ke r s   a l w a y s   c h a n ge   t h e i r   m o de   a c t i v i t i e s   a s   o f t e n   a s   po s s i b l e   t o   s t a y   un de t e c t e [ 12,   13 ] .   T hi s   m o t i v a t e s   t hi s   pa pe i n t o   s e e ki ng  a   n e w   s o l ut i o t o   s o l v e   kn o w n   a nd  u nk n o w n   p h i s h i ng  w e b s i t e s .             F i gu r e   1 .   S t a t i s t i c   o f   ph i s hi n a t t a c k       A l t h o ug h   t h e y   a r e   m a n y   e xi s t i ng  s y s t e m s   fo r   de t e c t i ng  p h i s h i ng  w e b s i t e ,   h o w e v e r ,   t h e r e   a r e   s t i l l   ha v e   r o o m   fo r   i m p r o v e m e n t   i n   de t e c t i n g   p h i s hi n w e b s i t e s .   E v e n   t h o ug h   p r o pe rl y   a ppl i e t e c hn o l o g y ,     a l o n w i t h   s e c ur i t y   a w a r e n e s s   a b l e   t r e duc e   t h e   ph i s hi n a t t a c ks ,   b ut   i t   di f f i c ul t   t o   a ppl y   i n   da i l y   l i f e   [14]   F o r   e xa m pl e ,   e m a i l   ha s   t h e i r   o w n   pr o t e c t i o n   a pp r o a c h   f r o m   a   p hi s h i n g   a t t a c k,   b ut   u na b l e   t o   pr o t e c t   f r o m   e m e r gi ng  p hi s h i n g   a t t a c pa t t e rn s   [ 11 ,   15 ] .   T h i s   i s   b e c a us e   e m a i l   us e e xi s t i n p h i s hi n p a t t e rn s ,   t h us   m a k i n us e r s   p r o n e   t o   n e w   ph i s hi n a t t a c ks .   T h i s   l e t o   t h e   di s c o ve r y   of   m a c h i n e   l e a rni n c l a s s i f i e r s   t o   de t e c t   phi s h i ng  a t t a c ks .   M a c hi n e   l e a rni n i s   a   pa rt   o f   a r t i f i c i a l   i n t e l l i ge n c e   (A I)  t ha t   a ppl y   da t a   m i n i n g   a p p r o a c h   t o   di s c ov e r   unk n o w n   o r   e xi s t i n g   f e a t ur e s   f r o m   t h e   d a t a s e t   [ 16 ,   17 ] .   T h e n   t h e   f e a t ur e s   w i l l   b e   us e w i t a   c l a s s i f i c a t i o n   a l go ri t hm   t o   c l a s s i fy   e i t h e r   p h i s hi n o r   n o r m a l .   T h i s   pa pe p r o po s e s   a   p hi s h i n g   de t e c t i o s y s t e m   w h i c h   i s   us e t i de n t i f y   ph i s h i ng  a t t a c ks   a s   w e l l   a s   t o   e xa m i n e   t h e   pr e s e n c e   of  da n ge r o us   i n   w e b s i t e s .   T h e   p r o po s e d   s t udy   a ppl i e s   a   h e u r i s t i c   b a s e a pp r o a c h   a nd  us i ng  f e a t u r e s   f r o m   t h e   w e b s i t e s .   H e n c e ,   t h e   f o c us   of   t h i s   pa pe r   i s   t o   de t e c t   a   p hi s h i ng   a t t a c o n   t h e   w e bs i t e ,   t h e   m a i c o n t ri b ut i o n s   o f   t hi s   p a pe a r e   t h e   f o l l o w i n g:   a)   T h e   e v a l ua t i o n   s t udy   a ppl i e p h i s hi n w e b s i t e   fe a t u r e s   fo r   a   m a l i c i o us   a nd  b e n i g n   s a m p l e   f r o m   P h i s hT a nk  da t a s e t .   b)   T h e   p r o po s e pa r t i c l e   s w a rm   o pt i m i z a t i o h a s   i m p r o v e t he   o pt i m i z a t i o o f   ph i s h i ng  w e b s i t e   f e a t ur e s   us i n t e n f o l c r o s s - v a l i da t i o n .   c)   T h e   p r o po s e n a ï v e   r a ndo m   f o r e s t   ha s   i n c r e a s e t h e   a c c u ra c y   i n   c l a s s i fy i n t h e   p hi s h i ng  a t t a c ks   o n   w e bs i t e s   a ppl i c a t i o n s .   T h e   r e s t   o f   t h e   pa pe r   i s   o r g a ni z e a s   f o l l ow s .   In  S e c t i o n   di s c us s e s   r e l a t e d   w o r ks   of   t h e   r e s e a r c h .   S e c t i o n   de s c r i b e s   t h e   m e t h o do l o g y   w h i c h   i n c l ude s   f e a t ur e s   o pt i m i z a t i o n   a nd  ge n e ra l   a r c h i t e c t ur e .   S e c t i o n   4   e v a l ua t e s   t h e   e f f e c t i v e n e s s   of   ph i s h i ng  de t e c t i o n   s y s t e m .   L a s t l y ,   S e c t i o n   5   c o n c l us i o o f   t hi s   p a pe r.       2.   R ELA TED   WO R K   T h e r e   a r e   c u rr e n t l y   v a r i o us   t y p e s   of   ph i s h i ng  a t t a c ks .   It   ha s   be e n   c a t e go r i z e i n t o   t hr e e   di f fe r e nt   t y p e s   w h i c h   a r e   de c e pt i v e   ph i s hi n g ,   m a l w a r e   b a s e ph i s hi n a nd  c o n t e nt   i n j e c t i o n   p h i s h i ng.   D e c e pt i v e   phi s h i n i s   t h e   m e s s a ge s   r e qui r e t o   v e r i fy   a c c o un t   i n f o r m a t i o n ,   r e que s t i n t ha t   us e r s   r e - e n t e r   t h e i Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       P hi s hi ng  de t e c t i on  s y s t e m   us i n m a c hi ne   l e ar ni ng   c l as s i f i e r s   ( Nur   Shol i hah   Z ai ni )   1167   i n f o r m a t i o n,   b o gus   a c c o un t   c ha r ge s ,   u n w a n t e a c c o un t   c ha n ge s ,   n e w   f r e e   s e r v i c e s   r e qui r i ng  i m m e di a t e   a c t i o n,   a n m a n y   o t h e m a l i c i o us   s i t e s   a r e   s e nt   t o   m a n y   r e c i pi e n t s   i n   t h e   h o pe   t ha t   t h e   u n s us p e c t i ng  pe r s o n   w i l l   r e a c t   b y   c l i c ki ng  o n   a   l i nk  t o   o r   s i g ni n o a   f a ke   s i t e   [ 15 ].   M a l w a r e - b a s e d   p h i s h i ng  r e f e r s   t o   a t t a c ks   t ha t   l e a t o   t h e   i n s t a l l a t i o n   a n e xe c ut i o n   o f   m a l i c i o us   s of t w a r e   o n   c o m put e r s   o f   us e r s   [ 18 19 ] .   M a l w a r e   i s   ge n e ra l l y   i n t r o duc e a s   a n   e m a i l   a t t a c hm e nt   t ha t   c a n   b e   dow n l o a de d.   M a l w a r e   c o m m o n l y   i n s t a l l e i phi s h i n a t t a c ks   i n c l ude s   ke y l o gge r s   a n s c r e e n   g r a b b e r s ,   s p y w a r e   t h a t   c a pt u r e s   a n l o gs   i n pu t   ke y bo a r ds   o r   di s pl a y   t h e   s c r e e n   a n s e n ds   i n f o r m a t i o n   t o   t h e   p h i s h e r .   I n   o t h e r   c a s e s ,   t h e   t a rge t   of   t h e   a t t a c i s   t o   c o n t r o l   t h e   c o m put e r   o f   t h e   v i c t i m   [ 20 ] .   T h e   i n j e c t i o n   o f   c o n t e n t   i s   a   t e c hni que   i w h i c h   t h e   p h i s h e r   c h a nge s   a   p a r t   o f   t h e   c o n t e n t   o n   a   r e l i a b l e   w e b s i t e   pa ge .   T h i s   i s   do n e   i n   o r de r   t o   m i s l e a t h e   us e r   t o   go  t a   pa ge   o ut s i de   t h e   l e gi t i m a t e   w e bs i t e   w h e r e   pe r s o na l   i n f o r m a t i o n   i s   t o   b e   e n t e r e d   [ 15 21 ].   T hr e e   t y pe s   o a ppr o a c h e s   a r e   us e t o   ph i s h i ng  a t t a c ks   w h i c h   a r e   b l a c kl i s t   b a s e a ppr o a c h ,   c o n t e n t - b a s e d   a pp r o a c h,   a n h e u ri s t i c - b a s e d   a pp r o a c h .   A   b l a c kl i s t   i s   a   l i s t   o f   m a l i c i o us   U RL s   [ 17 ] .   B l a c kl i s t   i s   ob t a i n e us i ng  a   num b e r   o m e t h o ds ,   s uc h   a s   h e uri s t i c s   f ro m   w e c r a w l e r s ,   m a n ua l   v o t i n g ,   a n d   h o n e y p o t s .   W h e n   a   w e b s i t e   i s   v i s i t e d,   t h e   b r o w s e r   r e f e r s   i t   t o   t h e   b l a c kl i s t   t o   c h e c w h e t h e r   t h e   c u rr e n t   U RL   i s   i n c l ude i n   t h e   l i s t   [ 21 ] .   T h e   dra w b a c k   of  t h i s   a pp r o a c h   i s   t h a t   b l a c kl i s t s   c a nn o t   n o r m a l l y   c ov e r   a l l   p h i s hi n w e b s i t e s   b e c a us e   a   n e w l y   c r e a t e f r a udu l e nt   w e b s i t e   t a ke s   a   c o n s i d e r a b l e   a m o u n t   o f   t i m e   b e fo r e   i t   i s   a dde d   [ 16 ] Co n t e n t - b a s e d   t e c hni que   f o r   t h e   de t e c t i o n   o f   ph i s hi n w e b s i t e s   us i n t h e   t e r m -   f r e que n c y - i n v e r s e   do c um e n t -   f r e que n c y   (T F ID F m e a s u r e m e n t s   [22 ] H e ur i s t i c - b a s e d   a ppr o a c h e s   c o l l e c t   f e a t ur e s   f r o m   t h e   w e b s i t e   t i de nt i fy   t h e m   a s   e i t h e r   p hi s h i n g   o r   l e gi t i m a t e   [ 20 ] .   U n l i k e   t h e   b l a c kl i s t   m e t h o d,   a   h e u r i s t i c   s o l ut i o n   c a n   i de nt i fy   i n   r e a l   t i m e   n e w l y   c r e a t e p h i s h i ng  w e b s i t e s .   T h e   e ff i c i e n c y   of  t h e   h e u ri s t i c   m e t h o ds   de pe n ds   o n   t h e   s e l e c t i o n   o f   a   s e t   o f   di s c r i m i na t i v e   f e a t ur e s   t ha t   c o ul h e l p   t o   di s t i n gu i s h   t h e   w e bs i t e   t y pe .       3.   R ES EA R C H   M ET H O D   E xpl a i ni n g   T h e   p hi s h i ng  de t e c t i o n   s y s t e m   c o n s i s t s   o f   f i v e   c o m po n e n t s   t ha t   a r e   c o l l e c t   da t a ,     de f i n e   ph i s hi n f e a t ur e s ,   c r e a t e   a   m o de l ,   t e s t i n a nd  f i n a l l y ,   t h e   r e s ul t   w i l l   b e   c o m pa r e d .   F i gu r e   s h o w s   t h e   c o m po n e n t   o f   t h e   p hi s h i ng   de t e c t i o s y s t e m .           F i gu r e   2 .   Co m po n e nt   o f   p h i s h i ng  de t e c t i o n   s y s t e m       3. 1 .       D at C o l l e c t i o n   T h e   f i r s t   pa rt   o f   t h e   i m p l e m e n t a t i o n   i s   t o   c o l l e c t   da t a s e t .   T h e   da t a s e t   p h a s e   i s   i m po r t a n t   f o r   m a i n t a i ni n r e s u l t   a c c ura c y .   T h e   d a t a s e t   w i l l   gi v e   m o r e   u n d e r s t a ndi n g   a nd  e xp l a na t i o n   o f   p h i s h i ng  a n d   l e gi t   a c t i v i t i e s .   F o f urt h e e xa m i n a t i o n ,   t h e   da t a s e t   i s   t h e n   a na l y z e d   a n t h e   r e s ul t s   a r e   us e t o   fo r e s e e   o r   p r e di c t   t h e   f ut u r e   e v e n t s   i p hi s h i ng.     A l l   t h e   f e a t ur e s   w e r e   c o l l e c t e f r o m   (M o h a m m a d,   M c Cl us k e y ,   &   T ha b t a h,   20 12).   T h e r e   a r e   a   t o t a l   of   30  ph i s hi n w e b s i t e   f e a t ur e s   t ha t   ha v e   be e n   c o l l e c t e d.   T hi s   da t a s e t   c o l l e c t e m a i n l y   f r o m   a   w e l l - kn o w n   phi s h i n d a t a b a s e ,   P hi s hT a n a r c h i v e ,   M i l l e r S m i l e s   a r c h i v e   a n G o o gl e   s e a r c h   o pe r a t o r s .   T h e   c o l l e c t e d   da t a s e t   h o l ds   c a t e go r i c a l   v a l ue s   t h o s e   a r e   L e gi t i m a t e ,   S u s pi c i o us   a n P hi s h y ,   t h e s e   v a l ue s   h a v e   be e n   t r a n s f o r m e t o   n u m e r i c a l   v a l ue s   by   r e pl a c i n g   t h e   v a l ue s   1” ,   0”   a nd  - 1”   i n s t e a o f   L e gi t i m a t e ,   S us pi c i o u s   a n P h i s h y   r e s pe c t i v e l y   [ 19 20 ] .       3. 2 .       M a c h i n e   L e ar n i n g   A p p r o ac h     M a c hi n e   l e a rni n a p p r o a c h   i s   us e t o   e n s ur e   t ha t   w e b s i t e   us e r s   a r e   a b l e   t o   o pt i m i z e   t h e   p h i s h i ng  f e a t ur e s   t hr o ug h   t h e   f e a t u r e   o pt i m i z a t i o n   a p p r o a c h.   T hi s   a p pr o a c h   p r o v i de s   s h o r t e r   t ra i ni n a n t e s t i n t i m e   t h us   i t   s i m pl i f i e s   t h e   phi s h i n de t e c t i o n   s y s t e m .   T hi s   s t udy   a ppl i e W E K A   t o o l s   (W a i ka t o   E n v i r o nm e nt   f o r   K n o w l e dge   A n a l y s i s ).   It   i s   a   po pul a r   m a c h i n e   l e a rni n s o f t w a r e   pr o g r a m   de v e l o p e i n   J a v a   a t   W a i ka t U n i v e r s i t y ,   N e w   Z e a l a n [2 3,   2 4] .   W E K A   s u ppo rt s   a   n u m b e r   o f   s t a n da rd  d a t a   m i ni n t a s ks ,   i n c l udi ng  d a t a   pr e - p r o c e s s i n g,   c l us t e r i ng,   c l a s s i f i c a t i o n,   r e g r e s s i o n,   v i s ua l i z a t i o n   a n d   s e l e c t i o n   o f   f e a t ur e s   [ 4 ,   19 25 ] .   Evaluation Warning : The document was created with Spire.PDF for Python.
            IS S N :   2 502 - 47 52   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   17 ,   N o .   3 M a r c 20 20  :   1 1 6 5   -   1 1 7 1   1 168   F e a t u r e   s e l e c t i o n   m e t h o ds   w e r e   us e t o   i de n t i fy   a n r e m o v e   i rr e l e v a n t   a nd  r e du n d a n t   a t t r i b ut e s   f r o m   da t a   t h a t   do   n o t   c o n t ri b ut e   t o   t h e   a c c ura c y   of   a   p r e di c t i v e   m o de l   [26 ] . T h e   f e a t u r e s   o f   t h e   p hi s h i ng  w e b s i t e   w e r e   f i r s t   t r a i n e a n t h e n   c l a s s i f i e by   us i n s i g n i f i c a n t   f e a t u r e s .   I n   o r de r   t o   c h o o s e   t h e   s i gni f i c a nt   f e a t ur e s   fo r   e f fe c t i ve   ph i s hi n g   w e b s i t e   de t e c t i o n ,   t h i s   s t udy   a ppl i e s   t he   f e a t ur e   s e l e c t i o n   a pp r o a c h .   H e n c e ,   t h e   n u m b e r   of   phi s hi n g   f e a t u r e s   w a s   r e duc e f r o m   30   f e a t u r e s   t o   15  f e a t ur e s   o nl y .   T h i s   i s   t o   e n s u r e   t ha t   t h e r e   i s   a   u ni que   pa t t e rn   a ppe a r i ng  b e t w e e n   t h e   n o rm a l   a n p h i s hi n g   w e b s i t e s .   T h e n   t h i s   f e a t u r e s   t r a i n e a n t e s t i ng  us i n m a c h i n e   l e a rn i ng  c l a s s i f i e r.   T h e   r e s ul t   f r o m   t h e   m a c h i n e   l e a rn i ng  c l a s s i f i e r s   w i l l   b e c o m e   t h e   p hi s h i ng  de t e c t i o n   m o de l .   L a s t l y ,   t h i s   m o de l   us e fo r   t e s t i ng  t h e   phi s h i n w e bs i t e s .   T a b l e   pr e s e n t s   t h e   l i s t   of  phi s h i n g   w e bs i t e   f e a t ur e s   us e b y   t h e   s t u dy .       T a b l e   1 .   P hi s hi n g   W e b s i t e   F e a t ur e s   P h i s h i n g   F e a t u r e s   D e s c ri p t i o n   S S L F i n a l _ S t a t e   S S L   C e rt i f i c a t e s   a re   s m a l l   d a t a   f i l e s   t h a t   d i g i t a l l y   b i n d   a   c ry p t o g ra p h i c   k e y   t o   a n   o r g a n i z a t i o n s   d e t a i l s .   W h e n   i n s t a l l e d   o n   a   w e b   s e r v e r,   i t   a c t i v a t e s   t h e   p a d l o c k   a n d   t h e   h t t p s   p ro t o c o l   a n d   a l l o w s   s e c u re   c o n n e c t i o n s   f r o m   a   w e b   s e r v e r   t o   a   b r o w s e r.     U R L _ o f _ A n c h o r   A n   a n c h o i s   a n   e l e m e n t   d e f i n e d   b y   t h e   < a >   t a g .   T h i s   fe a t u re   i s   t re a t e d   e x a c t l y   a s   R e q u e s t   U R L .   W e b s i t e   T ra ff i c   T h i s   fe a t u r e   m e a s u r e s   t h e   p o p u l a ri t y   o f   t h e   w e b s i t e   b y   d e t e r m i n i n g   t h e   n u m b e o f   v i s i t o r s   a n d   t h e   n u m b e o f   p a g e s   t h e y   v i s i t .   P re fi x _ S u ffi x   T h e   d a s h   s y m b o l   i s   ra r e l y   u s e d   i n   l e g i t i m a t e   U R L s .   P h i s h e r s   t e n d   t o   a d d   p re f i x e s   o s u ff i x e s   s e p a ra t e d   b y   ( - t o   t h e   d o m a i n   n a m e   s o   t h a t   u s e r s   fe e l   t h a t   t h e y   a re   d e a l i n g   w i t h   a   l e g i t i m a t e   w e b p a g e .   P a g e _ Ra n k   P a g e Ra n k   i s   a   v a l u e   ra n g i n g   fro m   0   t o   1 .   P a g e Ra n k   a i m s   t o   m e a s u r e   h o w   i m p o r t a n t   a   w e b p a g e   i s   o n   t h e   In t e rn e t .   T h e   g r e a t e t h e   P a g e Ra n k   v a l u e   t h e   m o r e   i m p o r t a n t   t h e   w e b p a g e .   H a v i n g _ S u b _ d o m a i n   A   s u b d o m a i n   i s   a   d o m a i n   t h a t   i s   a   p a r t   o f   a   l a rg e d o m a i n   u n d e t h e   D o m a i n   N a m e   S y s t e m   (D N S )   h i e ra rc h y .   It   i s   u s e d   a s   a n   e a s y   w a y   t o   c r e a t e   a   m o r e   m e m o ra b l e   W e b   a d d re s s   f o s p e c i f i c   o u n i q u e   c o n t e n t   w i t h   a   w e b s i t e .     A g e _ o f _ d o m a i n   T h i s   fe a t u re   c a n   b e   e x t ra c t e d   f r o m   W H O I S   d a t a b a s e   (W h o i s   2 0 0 5 ).   M o s t   p h i s h i n g   w e b s i t e s   l i v e   f o a   s h o r t   p e ri o d   o t i m e .   D o m a i n _ r e g i s t ra t i o n _ l e n g t h   Ba s e d   o n   t h e   f a c t   t h a t   a   p h i s h i n g   w e b s i t e   l i v e s   f o a   s h o r t   p e ri o d   o f   t i m e ,   i t   w a s   b e l i e v e d   t h a t   t ru s t w o rt h y   d o m a i n s   a r e   r e g u l a rl y   p a i d   f o r   s e v e ra l   y e a r s   i n   a d v a n c e .   Re q u e s t _ U R L   Re q u e s t   U RL   e x a m i n e s   w h e t h e t h e   e x t e r n a l   o b j e c t s   c o n t a i n e d   w i t h i n   a   w e b p a g e   s u c h   a s   i m a g e s ,   v i d e o s   a n d   s o u n d s   a r e   l o a d e d   f r o m   a n o t h e r   d o m a i n .   I n   l e g i t i m a t e   w e b p a g e s ,   t h e   w e b p a g e   a d d r e s s   a n d   m o s t   o f   t h e   o b j e c t s   e m b e d d e d   w i t h i n   t h e   w e b p a g e   a re   s h a ri n g   t h e   s a m e   d o m a i n .   L i n k s _ i n _ t a g s   It   i s   c o m m o n   fo l e g i t i m a t e   w e b s i t e s   t o   u s e   < M e t a >   t a g s   t o   o ffe m e t a d a t a   a b o u t   t h e   H T M L   d o c u m e n t ;   < S c r i p t >   t a g s   t o   c r e a t e   a   c l i e n t - s i d e   s c ri p t ;   a n d   < L i n k >   t a g s   t o   r e t ri e v e   o t h e w e b   r e s o u rc e s .   It   i s   e x p e c t e d   t h a t   t h e s e   t a g s   a r e   l i n k e d   t o   t h e   s a m e   d o m a i n   as   t h e   w e b p a g e .   D N S R e c o r d   D N S   r e c o r d s   a r e   b a s i c a l l y   m a p p i n g   f i l e s   t h a t   t e l l   t h e   D N S   s e r v e w h i c h   I P   a d d r e s s   e a c h   d o m a i n   i s   a s s o c i a t e d   w i t h ,   a n d   h o w   t o   h a n d l e   r e q u e s t s   s e n t   t o   e a c h   d o m a i n   G o o g l e _ I n d e x   T h i s   f e a t u re   e x a m i n e s   w h e t h e a   w e b s i t e   i s   i n   G o o g l e s   i n d e x   o n o t .   L i n k s _ p o i n t i n g _ t o _ p a g e   T h e   n u m b e o l i n k s   p o i n t i n g   t o   t h e   w e b p a g e   i n d i c a t e s   i t s   l e g i t i m a c y   l e v e l ,   e v e n   i f   s o m e   l i n k s   a r e   o t h e   s a m e   d o m a i n   (D e a n ,   2 0 1 4 ).   SFH   S e r v e F o r m   H a n d l e r   (S F H t h a t   c o n t a i n   a n   e m p t y   s t ri n g   o r   a b o u t :   b l a n k ”  is   c o n s i d e r e d   d o u b t f u l   b e c a u s e   a c t i o n   s h o u l d   b e   t a k e n   u p o n   t h e   s u b m i t t e d   i n f o rm a t i o n .   I n   a d d i t i o n ,   i f   t h e   d o m a i n   n a m e   i n   S F H s   i s   d i ffe r e n t   f ro m   t h e   d o m a i n   n a m e   o f   t h e   w e b p a g e ,   t h i s   r e v e a l s   t h a t   t h e   w e b p a g e   i s   s u s p i c i o u s   b e c a u s e   t h e   s u b m i t t e d   i n f o r m a t i o n   i s   ra r e l y   h a n d l e d   b y   e x t e r n a l   d o m a i n s .   U R L _ L e n g t h   T o   e n s u r e   t h e   a c c u ra c y   o f   o u s t u d y ,   i t   h a s   b e e n   c a l c u l a t e d   t h e   l e n g t h   o U R L s   i n   t h e   d a t a s e t   a n d   p ro d u c e d   a n   a v e ra g e   U RL   l e n g t h .   T h e   r e s u l t s   s h o w e d   t h a t   i f   t h e   l e n g t h   o t h e   U RL   i s   g r e a t e t h a n   o r   e q u a l   5 4   c h a ra c t e r s   t h e n   t h e   U R L   c l a s s i f i e d   a s   p h i s h i n g .   B y   r e v i e w i n g   o u d a t a s e t   w e   w e re   a b l e   t f i n d   1 2 2 0   U R L s   l e n g t h s   e q u a l s   t o   5 4   o m o r e   w h i c h   c o n s t i t u t e   4 8 . 8 %   o f   t h e   t o t a l   d a t a s e t   s i z e .       4.   R ES U LTS   A N D   A N A L Y S I S   T h i s   r e s e a r c h   a ppl i e s   t h e   s upe r v i s e m a c h i n e   l e a rni n a p pr o a c h   s i n c e   t h e   s a m p l e   da t a   s e t   ha v e   l a b e l s   (ph i s hi n a n n o rm a l ) .   In   a ddi t i o n,   s upe r v i s e m a c h i n e   l e a rn i ng  o ffe r s   goo r e s ul t s   t hr o ug h   t h e   r e duc t i o n   o e r r o r s .   T hi s   s t udy   i m pl e m e nt s   f o ur   c l a s s i f i e r s   i n   o r de r   t o   ob s e r v e   t h e   di s t i n c t i v e   r e s ul t s   n o t e i t h e   v a ri o us   m a c h i n e   l e a rni n g   c l a s s i f i e r s .   T h e   f o ur   c l a s s i f i e r s   a r e   R a n do m   F o r e s t   (R F ),   J 48 ,   M u l t i - L a y e r   P e r c e pt r o n   (M L P a n K - N e a r e s t   N e i g h b o r s   (K N N ).   T hi s   s t udy   us e t h e   pa ra m e t e r s   f o r   e v a l ua t i o n   s uc h   a s   a c c ur a c y ,   F P R ,   pr e c i s i o n,   r e c a l l ,   a nd   f - m e a s u r e   t o   i n v e s t i ga t e   t h e   di f f e r e n t   m e a s u r e m e n t s .   T a b l e   s h o w s   t h e   r e s ul t s   a c h i e v e a f t e t ra i ni n g   a nd  t e s t i n g   t h e   d a t a s e t   us i n g   f our  c l a s s i f i e r s .         T a b l e   2 .   P e r f o r m a n c e   o f   E a c C l a s s i f i e r s   Cl a s s i fi e r s   A c c u ra c y   ( % )   FPR   P re c i s i o n   ( % )   Re c a l l   (% )   F - m e a s u r e   ( % )   Ra n d o m   F o re s t   9 4 . 7 9   5 . 3   9 4 . 8   9 4 . 8   9 4 . 8   J 4 8   9 3 . 9 3   6 . 0   9 4 . 0   9 3 . 9   9 3 . 9   M L P   9 3 . 2 8   7 . 0   9 3 . 3   9 3 . 3   9 3 . 3   K N N   9 3 . 0 8   6 . 8   9 3 . 1   9 3 . 1   9 3 . 1   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       P hi s hi ng  de t e c t i on  s y s t e m   us i n m a c hi ne   l e ar ni ng   c l as s i f i e r s   ( Nur   Shol i hah   Z ai ni )   1169   T h e   r e s ul t s   i n d i c a t e t ha t   ra n do m   f o r e s t   c l a s s i f i e r s   ha a c hi e v e t h e   h i g h e s t   a c c ura c y   r e s ul t   o f   94. 79  pe r c e n t   w h e n   c o m pa r e t o   K N N   w h i c h   a c h i e v e o n l y   93. 08  pe r c e n t .   T h i s   o ut c o m e   s h o w s   t ha t   t h e   ra n do m   fo r e s t   c l a s s i f i e r s   a r e   m o r e   e f fe c t i ve   t h a n   o t h e r   s e l e c t e c l a s s i f i e r s   i n   de t e c t i n p h i s hi n w e b s i t e .   It   a l s o   s h o w s   t h a t   f e a t u r e   s e l e c t i o n   pl a y s   a   c r uc i a l   r o l e   i n   de t e rm i ni n t h e   e f fe c t i ve n e s s   of   ph i s h i ng  w e b s i t e   de t e c t i o n .     T h e   h i g h   p r e c i s i o n   ra t e   s h o w s   t h a t   t h e   c l a s s i f i e r   p r o duc e m o r e   r e l e v a n t   r e s ul t s   a n p r o duc i ng    a c c ur a t e   r e s ul t s .     4. 1 .       C o n fu s i on   M atr i x   A   c o n f us i o n   m a t ri i s   a   t e c hni que   f o r   s u m m a r i z i ng  t h e   pe r f o r m a n c e   o f   a   c l a s s i f i c a t i o n   m o de l .     T h e   t a b l e   s h o w s   t w o   po s s i b l e   c l a s s e s ’  pr e di c t i o n,   n o rm a l   a n p h i s hi n g .   F o e xa m pl e ,   i f   a   m o de l   p r e di c t s   t h e   pr e s e n c e   o f   ph i s h i ng  a c t i v i t i e s ,   t h e   r e s ul t   w i l l   s h o w   p hi s h i n g   a n v i c e   v e r s a .   T a b l e   s h o w s   t h e   pe r f o r m a n c e   o f   t h e   f o ur   c l a s s i f i e r s .   T h e   T a b l e   3   s h o w s   t h a t   t h e   s t udy   pr o duc e c o r r e c t e a n d   m a g ni f i c e n t   r e s ul t s   by   pr e di c t i n t h e   unk n o w n   p h i s h i ng  w i t h   10 33  f o r   t h e   J 48  c l a s s i f i e r s .   I n   t h e   i n c o rr e c t l y   pr e di c t e pe r s pe c t i v e ,   t h e   J 48  s h o w s   t h e   m o s t   m i ni m a l   v a l ue .   H e n c e ,   t h e   o ut c o m e s   s h ow   t h a t   J 48  c l a s s i f i e r s   a b l e   t o   pr e di c t   u nk n o w n   phi s h i n g   m o r e   a c c u r a t e l y .       T a b l e   3 .   Co n f us i o n   M a t ri o f   Cl a s s i f i e r s   Cl a s s i fi e r s   A c t u a l   P re d i c t e d   P re d i c t e d   n o r m a l   P re d i c t e d   p h i s h i n g   RF   A c t u a l   n o r m a l   1032   62   A c t u a l   p h i s h i n g   66   1296   J 4 8   A c t u a l   n o r m a l   1033   61   A c t u a l   p h i s h i n g   88   1274   M L P   A c t u a l   n o r m a l   1005   89   A c t u a l   p h i s h i n g   76   1286   K N N   A c t u a l   n o r m a l   1023   71   A c t u a l   p h i s h i n g   99   1263       4. 2 .       R e c e i v e r   O p e r ati n g   C h ar a c te r i s t i c s   C u r v e   (R O C )   In   t h i s   s t udy ,   b a s e o n   t h e   p hi s h i n w e b s i t e   f e a t ur e s ,   t h e   p r o c e s s e s   w e r e   c l a s s i f i e a s   n o rm a l   a nd  phi s h i n g .   A s i de   f r o m   us i ng  t h e   pe r f o r m a n c e   m a t r i x,   t h i s   s t udy   a l s o   c a l c ul a t e t h e   r e c e i ve r   o pe r a t i n g   c h a ra c t e ri s t i c s   (R O C)  c ur v e   fo r   e a c h   of  t h e   m a c h i n e   l e a r ni ng  c l a s s i f i e r s .   I n   t h i s   p h a s e ,   t h e   T P R   w a s   r e ga r de a s   t h e   de t e c t i o n   ra t e   w h i c h   w i l l   c o rr e c t l y   pr e di c t   t h e   p h i s hi n p r o c e s s   a n t h e   F P R   w a s   s e l e c t e a s   t h e   de t e c t i o n   ra t e   w hi c i n c o rr e c t l y   pr e di c t e d   n o rm a l   a s   p hi s h i ng .   F i gu r e   3   de m o n s t r a t e s   R O c ur v e .           F i gu r e   3 .   R O c u r v e     Evaluation Warning : The document was created with Spire.PDF for Python.
            IS S N :   2 502 - 47 52   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   17 ,   N o .   3 M a r c 20 20  :   1 1 6 5   -   1 1 7 1   1170   T h e   h o r i z o nt a l   a x i s   i t h e   a b o ve   f i gur e   i n d i c a t e s   t h e   e rr o r   de t e c t i o n   r a t e   m e a n w hi l e   t h e   v e rt i c a l   a x i s   i n di c a t e s   t h e   de t e c t i o r a t e .   F o u r   l i n e s   r e p r e s e n t   t h e   i n d i v i du a l   R O c u r v e   of   t h e   m a c hi n e   l e a rni n g   c l a s s i f i e r s .   T h e   R O c ur v e   i s   di ff i c ul t   t c o m pa r e   be c a us e   i t   s e e m s   t o   b e   s i m i l a r   u nde r   t h e   s a m e   c o n di t i o n s .   H e n c e ,   t h e   a r e a   u nde t h e   c u r v e   (A U C)  w a s   us e t o   m e a s ur e   de t e c t i o a c c ur a c y .   T h e   A U r e s ul t s   i de n t i f i e w e r e   a b l e   t o   m e a s u r e   w h e t h e r   t h e   de t e c t i o n   a pp r o a c h   w a s   go o o r   b a d.   A n   a r e a   o f   s h o w s   pe r fe c t   pr e di c t i o n   w h i l e   a a r e a   o f   0. 5   s h o w s   a   b a d   p r e di c t i o n .     T a b l e   s h o w s   t h a t   t h e   r a ndo m   fo r e s t   a nd  M L P   c l a s s i f i e r s   p r o v i de   t h e   b e s t   A U v a l ue s ,   w i t h   o ve r   0. 97 .   T h i s   s i g n i f i e s   pe r f e c t   p r e di c t i o n .   O v e r a l l ,   t h e   c u r v e   a nd  t h e   A U v a l ue s   c o n f i rm e t ha t   t h e   m o s t   r e c e n t   phi s h i n g   e xpe r i m e n t s   ha p r o v i de c o m pe l l i ng  a c c u r a t e   r e s ul t s   i n   t h e   p h i s h i ng  w e bs i t e   a ppl i c a t i o n s   de t e c t i o n .       T a b l e   4 .   A U R e s ul t s   C l a s s i f i e r   A U C   I ndi c a t o r   R a ndo m   F o r e s t   0. 98 5   P e r f e c t   pr e di c t i o n   KNN   0. 96 1   P e r f e c t   pr e di c t i o n   M L P   0. 97 8   P e r f e c t   pr e di c t i o n   J 48   0. 95 7   P e r f e c t   pr e di c t i o n       5.   C O N C LU S I O N   T h i s   p a pe r   ha s   p r e s e n t e t h e   pe r f o r m a n c e   o f   t h e   p r o po s e a pp r o a c i n   de t e c t i n p hi s h i n g   a t t a c ks .   T h e   pr o po s e a ppr o a c h   t ha t   i m p l e m e n t s   t h e   m a c h i n e   l e a rni ng  c l a s s i f i e r   a n h a s   c o rr e c t l y   c l a s s i f i e ph i s h i n g   by   us i n r e l e v a n t   f e a t u r e s .   I n   t h e   e xpe r i m e n t s ,   t hi s   p a pe c on s i de r s   a pp l i e r e a l   p h i s hi n a n d   b e n i g n   s a m p l e s   a ppl i c a t i o n   da t a s e t .   T h e   e xpe r i m e nt   r e s ul t s   s h o w   t h a t   t h e   pr o po s e a ppr o a c h   r e c o r de h i g h   a c c ur a c y   i n   c l a s s i fy i n t h e   p hi s h i n g .       A C K N O WL ED G E M EN TS   T h i s   w o r w a s   s uppo r t e b y   U n i v e r s i t i   M a l a y s i a   P a h a n g ,   u n de t h e   G ra n t   F a c ul t y   of   Co m put e r   S y s t e m s   a nd  S o f t w a r e   E n g i n e e r i ng  (F S K 10 00),   R D U 1803163.       R EF ER EN C ES   [ 1]   A .   F i r da u s ,   N .   B .   A nua r ,   M .   F .   A .   R a z a k,   a nd  A .   K .   S a ng a i a h ,   B i o - i ns pi r e c o m put a t i o na l   pa r a di g m   f o r   f e a t ur e   i nv e s t i g a t i o a nd  m a l w a r e   d e t e c t i o n:   i nt e r a c t i v e   a na l y t i c s ,   M ul t i m e d.   T oo l s   A pp l . ,   20 17.   [ 2]   M uh a m m a T a s e e r   S u l e m a n   a n S h a hi M a hm o o A w a n,   O p t i m i z a t i o o f   U R L - B a s e P h i s hi ng   W e b s i t e s   D e t e c t i o t hr o ug G e n e t i c   A l g o r i t hm s ,   A u t om .   C o nt r ol   C om p ut .   S c i . ,   v o l .   5 3,   no .   4 ,   p p.   33 3 34 1,   20 19 .   [ 3]   A .   K ul ka r n i   a nd  L .   L . ,   P hi s hi ng   W e bs i t e s   D e t e c t i o us i ng   M a c hi n e   L e a r ni ng ,   I nt .   J .   A dv .   C om p ut .   Sc i .   A pp l . ,   v o l .   10,   no .   7,   2 019 .   [ 4]   M .   H a z i m ,   N .   B .   A nua r ,   M .   F .   A R a z a k ,   a n N .   A .   A bdul l a h ,   D e t e c t i ng   o pi n i o s p a m s   t hr o ug s u pe r v i s e d   bo o s t i ng   a pp r o a c h,   P L oS  O ne ,   v o l .   1 3,   no .   6 ,   p p.   1 23 ,   2 018 .   [ 5]   P hi s hM e ,   A na l y s i s   o f   S us c e pt i b i l i t y ,   R e s i l i e nc y   a nd  D e f e n s e   A g a i ns t   S i m ul a t e   a nd   R e a l   P h i s h i ng   A t t a c ks ,   2 017 .   [ 6]   W .   S .   C y be r s e c ur i t y ,   N e a r l y   1. M i l l i o N e w   P hi s hi ng   S i t e s   C r e a t e E a c M o nt h ,   W e br oot   Sm a r t e r   C y be r s e c ur i t y ,   20 17 .   .   [ 7]   A P W G ,   A P W G   P hi s h i ng   A t t a c T r e nds   R e po r t s ,   A P W G   U ni f y i n G l oba l   R e s p ons e   t o   C y be r c r i m e ,   2 018 .   .   [ 8]   R .   G o w t ha m   a nd  I .   K r i s hna m ur t hi ,   A   c o m pr e he ns i v e   a nd  e f f i c a c i o us   a r c hi t e c t u r e   f o r   de t e c t i ng   phi s h i ng   w e bpa g e s ,   C om pu t .   Se c ur . ,   v o l .   4 0,   pp .   23 37 ,   2 014 .   [ 9]   S .   G .   S e l v a g a na p a t hy ,   M .   N i v a a s hi ni ,   a nd   H .   P .   N a t a r a j a n ,   D e e p   be l i e f   n e t w o r k   ba s e d   de t e c t i o a n c a t e g o r i z a t i o o f   m a l i c i o us   U R L s ,   I n f .   Se c u r .   J . ,   v o l .   27,   no .   3 ,   pp.   1 45 1 61 ,   2 01 8.   [ 10]   L .   M c C l us k e y ,   F .   T ha b t a h ,   a n R .   M .   M o ha m m a d ,   I nt e l l i g e nt   r u l e - ba s e p hi s hi ng   w e bs i t e s   c l a s s i f i c a t i o n ,   I E T   I n f .   Se c ur . ,   v o l .   8 ,   no .   3 ,   pp .   153 160 ,   2014 .   [ 11]   A .   A .   A ki ny e l a nd  A .   O .   A de w um i ,   C l a s s i f i c a t i o o f   phi s h i n g   e m a i l   us i ng   r a ndo m   f o r e s t   m a c hi n e   l e a r n i ng   t e c hni que ,   J .   A pp l .   M a t h. ,   v o l .   20 14 ,   2014 .   [ 12]   M .   F .   A .   R a z a k,   N .   B .   A nua r ,   R .   S a l l e h ,   A .   F i r d a us ,   M .   F a i z ,   a nd   H .   S .   A l a m r i ,   L e s s   G i v e   M o r e :   E v a l ua t e   a nd   z o ni ng   A ndr o i a pp l i c a t i o ns ,   M e as .   J .   I n t .   M e as .   C on f e d. ,   v o l .   13 3 ,   pp.   3 96 4 11,   2 019 .   [ 13]   M .   A ki y a m a ,   T .   Y a g i ,   T .   Y a da ,   T .   M o r i ,   a n Y .   K a do ba y a s hi ,   A na l y z i ng   t he   e c o s y s t e m   of   m a l i c i o us   U R L   r e d i r e c t i o t h r o ug l o ng i t ud i na l   o bs e r v a t i o f r o m   ho ne y po t s ,   C om put .   Se c ur . ,   v o l .   6 9,   pp .   155 173 ,   201 7.   [ 14]   B .   L i ,   G .   Y ua n ,   L .   S he n ,   R .   Z ha ng ,   a nd  Y .   Y a o ,   I nc o r po r a t i ng   U R L   e m be ddi ng   i nt o   e ns e m bl e   c l us t e r i ng   t o   de t e c t   w e a no m a l i e s ,   F ut ur .   G e ne r .   C om put .   Sy s t . ,   v o l .   96 ,   pp.   1 76 1 84,   201 9.   [ 15]   S .   N i s ha   a n A .   N .   M a dh e s w a r i ,   Se c ur e aut he nt i c a t i o f o r   i n t e r ne t   v ot i ng  i c or por a t e   c om pan i e s   t p r e v e nt   phi s hi ng  at t ac k s ,   v o l .   2 2,   no .   1 ,   p p.   4 5 49 ,   201 6.   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       P hi s hi ng  de t e c t i on  s y s t e m   us i n m a c hi ne   l e ar ni ng   c l as s i f i e r s   ( Nur   Shol i hah   Z ai ni )   1171   [1 6]   H .   B .   K a z e m i a a nd  S .   A hm e d,   C o m pa r i s o ns   o f   m a c hi ne   l e a r ni n g   t e c hni que s   f o r   de t e c t i ng   m a l i c i o us   w e bp a g e s ,   E x pe r t   Sy s t .   A pp l . ,   v o l .   42 ,   no .   3,   pp .   116 6 1 177 ,   2015 .   [ 17]   K .   T ho m a s ,   C .   G r i e r ,   J .   M a ,   V .   P a xs o n,   a n D .   S o ng ,   D e s i g a n d   E v a l ua t i o o f   a   R e a l - T i m e   U R L   S pa m   F i l t e r i ng  S e r v i c e ,   2 011   I E E E   Sy m p .   Se c ur .   P r i v . ,   pp .   447 462 ,   2011 .   [ 18]   A .   F i r da u s ,   N .   B .   A nua r ,   M .   F .   A .   R a z a k,   I .   A .   T .   H a s h e m ,   S .   B a c ho k,   a nd  A .   K .   S a ng a i a h,   R o o t   E xpl o i t   D e t e c t i o a nd  F e a t ur e s   O p t i m i z a t i o n:   M o bi l e   D e v i c e   a nd  B l o c kc ha i B a s e d   M e d i c a l   D a t a   M a na g e m e n t ,   J .   M e d.   S y s t . ,   v o l .   42,   no .   6,   2 018 .   [ 19]   M .   F .   A .   R a z a k ,   N .   B .   A nua r ,   F .   O t hm a n ,   A .   F i r da u s ,   F .   A f i f i ,   a n R .   S a l l e h ,   B i o - i ns p i r e f o r   F e a t ur e s   O pt i m i z a t i o a n M a l w a r e   D e t e c t i o n ,   A r a b.   J .   Sc i .   E ng . ,   2018 .   [ 20]   J .   A .   C h a udh r y ,   S .   A .   C h a udh r y ,   a nd  R .   G .   R i t t e nho us e ,   P h i s h i ng   a t t a c ks   a nd  de f e ns e s ,   I n t .   J .   Se c u r .   i t s   A ppl . ,   v o l .   10,   no .   1,   p p.   24 7 25 6,   20 16.   [ 21]   R .   G o w t ha m   a nd  I .   K r i s hna m ur t hi ,   A   c o m pr e he ns i v e   a nd  e f f i c a c i o us   a r c hi t e c t u r e   f o r   de t e c t i ng   phi s h i ng   w e bpa g e s ,   C om pu t .   Se c ur . ,   v o l .   4 0,   pp .   23 37 ,   2 014 .   [ 22]   G .   X i a ng ,   J .   H o ng ,   C .   P .   R o s e ,   a nd  L .   C r a no r ,   C a nt i n a + ,   A C M   T r ans .   I n f .   Sy s t .   Se c u r . ,   v o l .   14,   no .   2,   pp .   1 28 ,   2011 .   [ 23]   R .   T ha kur ,   P r e pr oc e s s i ng  and  C l as s i f i c a t i o of   D at A na l y s i s   i I ns t i t ut i on al   S y s t e m   us i n W e k a,   v o l .   112,   no .   6 ,   pp.   9 11,   2 015 .   [ 24]   F .   A f i f i ,   N .   B .   A nua r ,   S .   S ha m s h i r b a nd ,   a n K . - K .   R .   C ho o ,   D y H A P :   D y na m i c   H y br i A N F I S - P S O   A ppr o a c f o r   P r e d i c t i ng   M o bi l e   M a l w a r e ,   P L oS   O ne ,   v o l .   11 ,   no .   9 ,   p .   e 016 262 7,   201 6.   [ 25]   C .   S c i e nc e ,   C om p ar a t i v e   e v al ua t i o of   t he   di f f e r e nt   d at a   m i ni ng   t e c hni que s ,”   v o l .   10 ,   no .   3 ,   pp .   2 33 238 ,   2016 .   [ 26]   T .   C ho a nd  J .   P i c ka r d ,   M a c h i ne   L e ar n i ng  bas e I P   N e t w or k   T r af f i c   C l as s i f i c a t i on  u s i ng  F e at ur e   S i gn i f i c anc e   A nal y s i s ,   v o l .   16 ,   no .   3 ,   pp .   9 12 ,   201 8.       Evaluation Warning : The document was created with Spire.PDF for Python.