I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   19 ,   N o .   1 J ul y   20 20 ,   pp .   54 3 ~ 55 2   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 9 .i 1 . pp 54 3 - 55 2             543       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   E x p l o r i n g   p e r m i ssi o n i n   a n d r o i d   a p p l i c a t i o n s us i n g     e n sem b l e - b a sed  e x t r a   t r e e   f e a t u r e   s e l e c t i o n       H o w i d A b u b ak e r ,   A i d A l i ,   S i ti   M a r i y am   S h am s u d d i n ,   an d   S h afaatu n n u r   H as s an     F a c ul t y   o f   E ng i ne e r i ng ,   S c ho o l   o f   C o m put i ng ,   U ni v e r s i t i   T e kno l o g i   M a l a y s i a   ( U T M ) ,   M a l a y s i a       A r ti c l e   I n fo     A B S TR A C T   Ar t i c l e   h i s t or y :   R e c e i v e N ov   3 ,   2019   R e v i s e J a n   19 ,   202 0   A c c e pt e F e b   1 ,   2020       T he   f a s t   d e v e l o pm e n t   o f   m o bi l e   a pp s   a n i t s   us a g e   ha s   l e t o   a i nc r e a s e     t he   r i s o f   e xpl o i t i ng   us e r   pr i v a c y .   O ne   m e t ho us e i t he   A nd r o i s e c ur i t y   m e c ha ni s m   i s   pe r m i s s i o c o nt r o l   t ha t   r e s t r i c t s   t h e   a c c e s s   o f   a pps   t o   c o r e   f a c i l i t i e s   o f   de v i c e s .   H o w e v e r ,   t ha t   pe r m i s s i o ns   c o ul be   e xp l o i t e by   a t t a c ke r s   w he g r a n t i ng   c e r t a i c o m bi na t i o ns   o f   pe r m i s s i o ns .   S o ,   t hi s   p a pe r   a i m s   t o   e xpl o r e   t he   p a t t e r o f   m a l w a r e   a p ps   ba s e d   o a n a l y z i ng   pe r m i s s i o ns   by   pr o p o s i ng   a   f r a m e w o r ut i l i z i ng   f e a t ur e   s e l e c t i o ba s e o e ns e m bl e   e x t r a   t r e e   c l a s s i f i e r   m e t ho a n m a c hi n e   l e a r n i ng   c l a s s i f i e r .   T h e   u s e d a t a s e t   ha 25458  s a m p l e s   ( 8 643  m a l w a r e   a pp s   &   168 15  b e n i g a pps )   w i t h   17 f e a t u r e s .     T hr e e   da t a s e t s   w i t 254 58  s a m pl e s   a n 5,   1 a nd  2 f e a t u r e s   r e s pe c t i v e l y   w e r e   g e ne r a t e a f t e r   us i ng   t he   p r o po s e f e a t ur e   s e l e c t i o m e t ho d.   A l l   t he   da t a s e t   w a s   f e t o   m a c hi ne   l e a r n i ng .   S u ppo r t   V e c t o r   M a c hi n e   ( S V M ) ,   K   N e i g hbo r s   C l a s s i f i e r ,   D e c i s i o T r e e ,   N a ï v e   B a y e s   a nd  M u l t i l a y e r   P e r c e p t r o ( M L P )   c l a s s i f i e r s   w e r e   us e d .   T he   c l a s s i f i e r s   m o de l s   w e r e   e v a l ua t e us i ng   t r u e   ne g a t i v e   r a t e   ( T N R ) ,   f a l s e   po s i t i v e   r a t e   ( F N R )   a nd  a c c ur a c y   m e t r i c s .     T he   e x pe r i m e n t a l   r e s ul t s   o bt a i n e s ho w e t h a t   S uppo r t   V e c t o r   M a c hi ne   a n K N e i g hbo r s   C l a s s i f i e r s   w i t h   20   f e a t ur e s   a c hi e v e t h e   h i g he s t   a c c ur a c y   w i t h   94  %   a n T N R   w i t h   a   r a t e   o f   89  %   u s i ng   t he   K N e i g hbo r s   C l a s s i f i e r .   T he   F N R   r a t e   i s   dr o ppe t o   0. 001  us i ng   f e a t ur e s   w i t S uppo r t   V e c t o r   M a c hi ne   ( S V M )   a nd  M u l t i l a y e r   P e r c e pt r o ns   ( M L P )   c l a s s i f i e r s .   T he   r e s ul t   i ndi c a t e d   t ha t   r e duc i ng   pe r m i s s i o f e a t u r e s   i m pr o v e t he   pe r f o r m a nc e   o f   c l a s s i f i c a t i o n   a nd  r e duc e t h e   c o m put a t i o na l   o v e r he a d .     Ke y w or d s :   F e a t u r e   s e l e c t i o n   M a c hi n e   l e a rni ng   M a l w a r e   a n d r o i d   c l a s s i f i c a t i o n   P e r m i s s i o n - b a s e a na l y s i s   C opy r i gh t   ©   20 20   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   H ow i da   A b ub a ke r ,   F a c ul t y   of   E n g i n e e ri n g,   S c h o o l   of   Co m put i n g ,     U n i v e r s i t i   T e kn o l o gi   M a l a y s i a   (U T M ),   J o h o r,   M a l a y s i a .   E m a i l :   h o w i da 10@ g m a i l . c o m       1.   I N TR O D U C TI O N     W i t h   t h e   g r o w t h   o f   s m a rt p h o n e s   a nd  t h e   s e r v i c e s ,   t h e y   prov i de   s uc h   a s   o n l i n e   s h o ppi ng,   h e a l t m o n i t o ri n s y s t e m ,   m o n e y   t r a n s a c t i o n   a nd  m a n y   m o r e .   T h e   f r e que n t   us e   o f   m ob i l e   de v i c e s   w i t h   t h a t   f a c i l i t i e s   e n c o ur a ge   pe o pl e   t o   s t o r e   a n s ha r e   t h e i r   pe r s o n a l   a nd  c r i t i c a l   i n f o r m a t i o n   t hr o ug h   us i n m o b i l e   de v i c e s ,     a n t h e   w i de   us e   of   d e v i c e s   w i t h   A n d r o i s y s t e m   m a ke s   A ndr o i d - b a s e m o b i l e   de v i c e s   a   t a r ge t   f o r   m a l i c i o us   a ppl i c a t i o n   de v e l o pe r s   [1].   T h e s e   m a l i c i o us   a ppl i c a t i o n s   m a y   l e a t h e   us e r ’s   p r i v a t e   i n f o r m a t i o n   w i t h o ut   t h e i kn o w l e dge   o r   c o n s e n t .   S i n c e   a n d r o i o pe ra t i n s y s t e m   s e c ur i t y   m o de l   i s   b a s e o n   a ppl i c a t i o n - o ri e n t e m a n d a t o r y   a c c e s s   c o n t r o l   a n s a n db o xi ng.   E a c h   a pp l i c a t i o n   a s s i g n s   a   u ni que   U s e r   ID   a n a   s e t   of  pe r m i s s i o n s   a t   t h e   a pp  i n s t a l l a t i o n   t i m e .   A n d r o i de v e l o pe r s   m us t   r e que s t   pe r m i s s i o n   t o   us e   t h e s e   s pe c i a l   f e a t ur e s   i n   a   s t a n d a r f o r m a t   t h a t   i s   pa r s e a t   i n s t a l l a t i o n   t i m e   [2].   T h e   pe rm i s s i o n   m o de l   us e i n   A n d r o i ha s   m a n y   a dv a n t a ge s   a n c a n   b e   e ffe c t i ve   i n   pr e v e n t i n m a l w a r e   w h i l e   a l s o   i n f o r m i n us e r s   w h a t   a pp l i c a t i o n s   a r e   c a pa b l e   o do i n o n c e   i n s t a l l e [3].   W h e n   us e r   do w n l o a a pps ,   t h a t   a pps   r e que s t   s o m e   p e r m i s s i o n s   t l i m i t   a c c e s s   t o   s y s t e m   r e s o ur c e s .   T h e   a pp l i c a t i o n s   c a n   a c c e s s   r e s o ur c e s   o n   t h e   c o n di t i o n   t ha t   t h e   pe rm i s s i o n s   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m p   S c i ,   V o l .   19 ,   N o .   1 J ul y   202 0   :     54 3   -   55 2   544   a r e   de f i n e i n   m a ni f e a s t   f i l e .   T h e r e by ,   a   s e c ur i t y   l a y e r   i s   c r e a t e fo r   t h e   us e r s .   H ow e ve r ,   t ha t   pe r m i s s i o n s   c o ul b e   e xpl o i t e by   a t t a c ke r s   T hi s   e xpl o i t a t i o n   c a n   b e   d o n e   v i a   c a m e r a ,   S M S ,   c a l l ,   a ud i o ,   a n i m a ge   o r   l o c a t i o n   e xp l o i t a t i o by   a t t a c ki ng  t h e   s y s t e m   c a l l ,   pe rm i s s i o n   o A P i n s i de   t h e   A nd r o i s m a r t p h o n e   [4 - 6].   M a ny   s t u d i e s   e m p l o y e d   m a c hi ne   l e a r ni ng   i d e t e c t i ng   a t t a c k s   s u c a s   d e t e c t i ng   p h i s h i ng   a t t a c k   i t he   s t u dy   of   J u p i e t   a l . ,   [ 7 ] .   I n   t hi s   pa pe r,   w e   w i l l   a l s o   ut i l i z e   m a c h i n e   l e a rn i ng  i n   e xpl o ri n t h e   r e que s t e pe r m i s s i o n s   i a n d r o i m a l w a r e   a ppl i c a t i o n s .   T h e r e f o r e ,   t h e   c o n t ri b ut i o n   o t h i s   pa pe r   i s   t o   pr o po s e   a   f r a m e w o r t o   e xpl o r e   t h e   pe r m i s s i o n s   of   a n d r o i a pp l i c a t i o n s   t ha t   a r e   b e i n r e que s t e a t   i n s t a l l a t i o n   a n r u n   t i m e   by   us i n f e a t ur e   s e l e c t i o n   m e t h o w i t h   t h e   c o m b i n a t i o o f   us i n g   m a c hi n e   l e a rni n c l a s s i f i e r s .   T h e   p r o po s e f e a t ur e   s e l e c t i o m e t h o b a s e o n   s e l e c t i n t h e   i m po r t a n t   f e a t u r e s   t h a t   c o n t ri b ut e   t o   c l a s s   t a r ge t   us i n e n s e m b l e   e xt r a   t r e e   c l a s s i f i e r .   T h e   p r o p o s e a ppr o a c h   t a r ge t s   t h e   b i n a r y   c l a s s   c l a s s i f i c a t i o n   p r o b l e m   t o   c l a s s i fy   a n d r o i a pps   a s   m a l w a r e   o n o n - m a l w a r e .   T h e   r e s t   o f   t h i s   pa pe r   i s   o rga ni z e a s   f o l l ow s .   R e l a t e w o r i s   i nt r o duc e i n   s e c t i o 2.   I n   s e c t i o 3,   w e   pr o v i de   a n   o v e r v i e w   of   t h e   m e t h o do l o g y .   T h e   e xpe ri m e n t a l   s e t up   i s   e xpl a i n e i n   de t a i l   i s e c t i o n   4.   R e s ul t s   a n d   di s c us s i o n   a r e   c l a ri f i e i n   s e c t i o n   5.   S e c t i o n   6   c o n c l ude s   t h e   pa pe r   a n p r e s e nt s   po s s i b l e   f ut ur e   w o r k.       2.   RE LA TED   W O RK   T h e   i n c r e a s e   us a ge   o f   m ob i l e   de v i c e s   [8]  a n d   t h e i r   a pp l i c a t i o n s   w i t h   a nd r o i s y s t e m   i n   t h e   m a r ke t   ha s   b e e n   l e t o   c o n duc t   a n   a c t i v e   r e s e a r c h   i n   a na l y z i n a n d r o i a p ps   t o   i n v e s t i ga t e   t h e   pa t t e rn   o f   t h e   m a l i c i o us   a pps   [9 ].   T h e   A n d r o i d -   M a ni f e s t . xm l   f i l e   i s   o n e   c o m po n e n t   o f   t h e   A ppl i c a t i o n   P a c k a ge   f i l e   (A P K t h a t   ha s   a e s s e n t i a l   i n f o rm a t i o a b o ut   t h e   a pp l i c a t i o a n d   i w h i c h   pe rm i s s i o n s   a r e   s t o r e [10 ].   It   de c l a r e s   w h i c h   pe r m i s s i o n s   t h e   a ppl i c a t i o n   m us t   ha v e   t o   a c c e s s   pr ot e c t e pa r t s   o f   t h e   A P a n i nt e ra c t   w i t h   o t h e a ppl i c a t i o n s .   I n   o r de t o   p r o t e c t   A n d r o i d   us e r s ,   a p pl i c a t i o n s   a c c e s s   t o   r e s o ur c e s   i s   r e s t r i c t e w i t h   pe rm i s s i o n s .   A n   a ppl i c a t i o n   m us t   o b t a i n   pe rm i s s i o n s   i n   o rde r   t o   us e   s e n s i t i v e   r e s o ur c e s   l i ke   t h e   c a m e ra ,   m i c r o ph o n e ,   o c a l l   l o [11] .   I n v e s t i ga t i ng  a nd  s t udy i n r e que s t e pe r m i s s i o n s   h a v e   b e e n   do n e   by   m a n y   r e s e a r c h e r s .   X .   L i a n J .   L i [12]  p r o po s e a   f r a m e w o r t h a t   us e s   m a c h i n e   l e a rn i ng  t e c hn i que s   t o   g e t   h i g h   de t e c t i o n   a c c u r a c y   w i t t h e   po t e n t i a l   o f   de t e c t i n g   A n d r o i d   m a l w a r e   a p pl i c a t i o n s   b a s e o n   pe rm i s s i o n s   [12] .   W a ng  e t   a l . ,   [13]  s t udi e t h e   r e que s t e p e rm i s s i o n s   o f   a n dr o i a pp  by   a n a l y z i n t h e   r i s o f   a i n di v i du a l   pe rm i s s i o n   a n t h e   r i s k   o f   a   g r o up  o f   c o l l a b ora t i v e   pe rm i s s i o n s .   T h e y   us e f e a t ur e   ra n k i n m e t h o ds   s uc h   a s   m ut u a l   i n f o rm a t i o n,   c o rr e l a t i o n   c o e ff i c i e n t ,   a n T - t e s t   t o   ra n A n d r o i i n d i v i dua l   p e r m i s s i o n s   w i t h   r e s pe c t   t o   t h e i r   ri s a n t h e y   us e t h e   s e que n t i a l   f o r w a rd  s e l e c t i o n   a s   w e l l   a s   p r i n c i pa l   c o m po n e n t   a na l y s i s   t o   i de n t i fy   r i s ky   pe r m i s s i o n   s ub s e t s .   T hr e e   m a c hi n e   l e a rni n g   c l a s s i f i e r s   us e t o   e v a l ua t e   t h e i r   e xpe ri m e n t   (s uppo rt   v e c t o r   m a c h i n e ,   de c i s i o n   t r e e s ,   a n ra n do m   f o r e s t ).   T h e i r   m e t h o a c hi e v e d   pe r f o r m a n c e   w i t h   a   de t e c t i o n   ra t e   o f   94. 62%   a n d   a   f a l s e   p o s i t i v e   r a t e   o f   0. 6% .   J i a o   e t   a l . ,   [14]  p r o po s e a   h y b r i de t e c t i o n   m e t h o b a s e o n   pe r m i s s i o n.   T h e   a ppl i c a t i o n s   a r e   de t e c t e a c c o r di n t o   t h e i r   pe rm i s s i o n s   t b e n i g n   a n m a l i c i o us   a ppl i c a t i o n s .   T h e n,   t h e   s us pi c i o us   a ppl i c a t i o n s   a r e   r u n   i n   o r de r   t o   c o l l e c t   t h e   f un c t i o c a l l s   r e l a t e t o   s e n s i t i v e   pe r m i s s i o n s .   F u r t h e rm o r e ,   s us pi c i o us   a ppl i c a t i o n s   a r e   r e p r e s e n t e i n   a   v e c t o r   s pa c e   m o de l   a nd  t h e i r   f e a t u r e   v e c t o r s   a r e   c a l c ul a t e by   T F - ID F   a l go r i t hm .   T h e i r   m e t h o a c h i e v e a   t r ue   po s i t i v e   ra t e   a t   91. a n a   f a l s e   pos i t i v e   r a t e   a t   2. % .   J e t   a l . ,   [10]  a n a l y z e t h e   pe r m i s s i o n s   of   m a l i c i o us   a ppl i c a t i o n s   t o   i n v e s t i ga t e   t h e   a b i l i t y   of   t h e m   i n   r e c o gn i z i n s us pi c i o us   a ppl i c a t i o n s .   T h e y   s t udi e t h e   s y s t e m   of   m o n i t o ri n r e que s t e pe r m i s s i o n   i n   m o b i l e   a ppl i c a t i o n s   t o   c h e c t h e   pe r m i s s i o n   r e que s t   hi s t o r y   of   e a c h   a ppl i c a t i o n   a nd  m a n a ge   a ppl i c a t i o n s .   A l t a h e r   [1 5]  p r o po s e a   h y b r i n e u r o - f uz z y   c l a s s i f i e r   (E H N F C)   f o r   A n d r o i m a l w a r e   c l a s s i f i c a t i o us i n g   pe rm i s s i o n - b a s e f e a t ur e s   t o   i m p r o v e   de t e c t i o n   a c c ura c y .   H ow e ve r ,   t h e   s e t   of   pe r m i s s i o n s   r e qu i r e by   a n y   A n dr o i a pp  du ri n i n s t a l l a t i o n   t i m e   i s   c o n s i de r e a s   t h e   f e a t u r e   s e t   w h i c a r e   us e i pe rm i s s i o n   -   b a s e de t e c t i o n   o f   A n dr o i m a l w a re s .   T h o s e   h i g h   d i m e n s i o n a l   f e a t ur e   s e t   s h o ul b e   r e duc e t o   m i ni m i z e   c o m put a t i o n a l   o v e rh e a b y   c h oo s i n a o pt i m a l   s ub   -   s e t   o f   fe a t ur e s .     T h e r e   a r e   m a n y   s t udi e s   d o n e   o n   e xpl o r i ng  t h a t   pe rm i s s i o ns ;   fo r   e xa m pl e ,   W a n g ,   e t   a l . ,   [13]  u s e di f fe r e nt   m e t h o ds   of   fe a t u r e   s e l e c t i o n   s uc a s   S e que n t i a l   F o rw a r S e l e c t i o n   (S F S ) ,   a nd  P ri n c i pa l   Co m po n e nt   A na l y s i s   (P CA ).   A f t e s e l e c t i n g   s ub s e t   o f   f e a t ur e s ,   t h e y   us e S V M ,   D e c i s i o n   T r e e   a n d   R a ndo m   F o r e s t ,     t o   de t e c t   s us pi c i o us   a pps   b a s e o n   t h e   i de n t i f i e s ub s e t s   o f   r i s ky   pe r m i s s i o n s .   V e r m a   e t   a l . ,   [16 us e   t h e   i n f o r m a t i o ga i n   a l go ri t hm   o f   fe a t ur e   s e l e c t i o n   t o   s e l e c t   t h e   b e s t   f e a t ur e s   f r o m   t h e   e xt ra c t e f e a t ur e s   of  a n d r o i a pp l i c a t i o pa c ka ge   f i l e s .   T h a t   m e t h o de pe n ds   o n   t h e   e n t r o py   of   t h e   a t t ri b u t e s   a n d   s e l e c t s   t h e   l a r ge s t   v a l ue   of   ga i n   a s   t h e   b e s t   fe a t u r e .   T h e   s t udy   do n e   by   A l t y e b   A l t a ha r   [1 7]  us e t w o   fe a t u r e s   s e l e c t i o n   a l go ri t hm s ,   I n f o r m a t i o n   G a i n   (IG a n P e a r s o n   Co rrCo e f   (P C)  t o   ra n t h e   i n d i v i dua l   pe r m i s s i o n s   a n A P I’s   c a l l s   b a s e o n   t h e i i m po rt a n c e .   K u m a e t   a l . ,   [1 8],   p r o po s e a   n o v e l   a ppr o a c h   t o   di s t i n gu i s h   b e t w e e n   m a l w a r e   a nd  b e n i g a pp l i c a t i o n s   b a s e o n   pe rm i s s i o n   r a nki n g ,   s i m i l a ri t y - b a s e pe r m i s s i o n   f e a t u r e   s e l e c t i o n ,   a n a s s o c i a t i o n   r ul e   f o r   pe rm i s s i o n.   H ow e v e r ,   m o s t   s t udi e s   i n v e s t i ga t e   r e que s t i n pe r m i s s i o n s   b a s e a t   i n s t a l l a t i o n   t i m e .   I n   t h i s   s t udy ,   w e   fo c us   o n   e xpl o r i n pe rm i s s i o n s   a s   a   f e a t ur e   f o r   a n d r o i a pps   a t   i n s t a l l a t i o n   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E x p l or i ng   p e r m i s s i ons   i n   andr o i a ppl i c a t i o ns   us i n g   ( H ow i da  A bub ak e r )   545   a n r u t i m e   t o   f i n o ut   t h e   p a t t e rn  o f   t h e m   i n   i de n t i f y i n t h e   r i s ky   a pps .   W e   a l s o   e m pl oy e a n   e xt ra   t r e e   c l a s s i f i e r   w hi c i s   k n o w n   f o r   f a s t   pe r f o r m a n c e   t o   s e l e c t   t h e   i m po r t a nt   f e a t u r e s   [19 ].       3.   M ET H O D O L O G Y   T h e   a i m   o f   o ur   pa pe r   i s   t o   de v e l o a   f r a m e w o r t o   c l a s s i fy   a n d r o i a pp   b a s e o n   a na l y z i n pe r m i s s i o n s   t o   s e l e c t   t h e   i m po rt a nt   s ub s e t   of   pe r m i s s i o n s   f e a t ur e s   t ha t   a r e   r e l a t e t o   c l a s s   t a r ge t   us i n e n s e m b l e   e xt ra   t r e e   c l a s s i f i e r.     3 . 1 .   F r am e w o r k   c o m p o n e n ts   T h e   f ra m e w o r c o n s i s t s   o f   t h e   f o l l ow i n p h a s e s :   a)   D a t a s e t :   T h e   da t a s e t   c o n s i s t s   o f   t h e   f o l l ow i n i n f o r m a t i o s uc h   a s   A pp’s   P a c ka ge   (t h e   a pp l i c a t i o n ’s   pa c ka ge   n a m e ),   P e rm i s s i o n s   (a   l i s t   o f   pe r m i s s i o n s   de c l a r e i n   t h e   m a l w a r e   a nd  n o n - m a l w a r e   a pps ) .   T h i s   pha s e   i s   de s c r i b e a s   a   P r e - pr o c e s s i n da t a s e t   i n   w h i c h   t he   da t a s e t   i s   c l e a n e a s   de pi c t e b e l ow   i n   F i gu r e   1 .   b)   F e a t u r e s   S e l e c t i o n :   I n   t h i s   p h a s e ,   a   f e a t u r e   s e l e c t i o n   m e t h o b a s e o n   a n   e xt ra   t r e e   c l a s s i f i e r   a ppl i e t o   e xt ra c t   t h e   i m po rt a nt   f e a t ur e s   a s   de c l a r e d   i F i gu r e   1.   c)   Cl a s s i f i c a t i o n   a nd  E v a l ua t i o n:   I n   t h i s   s t a ge ,   s e v e r a l   c l a s s i f i c a t i o n   m a c h i n e   l e a rni n g   a l go r i t hm s   o c l a s s i f i e r s   a r e   a p pl i e d .   T h e   d a t a s e t   ge n e r a t e d   f r o m   t h e   s e c o n p h a s e   (a f t e r   a p pl y i n f e a t u r e   s e l e c t i o n   m e t h o d)  a n c l e a n e da t a s e t   a r e   f e t o   m a c h i n e   l e a rn i ng  t o   b ui l m a c h i n e   l e a rni n m o de l s   a nd  c l a s s i fy   t h e   a n d r o i a pp  a s   m a l w a r e   o r   n o n - m a l w a r e   a s   e xpl a i n e i n   F i gu r e   1 .   W e   us e S c i ki t   L e a rn   l i b ra r i e [20]  t o   a pp l y   fe a t ur e   s e l e c t i o t e c hni que s   a n d   i m pl e m e nt   m a c h i n e   l e a rni n a l go r i t h m s .     3. 1 . 1.   D atas e   W e   us e t h e   da t a s e t   o f   M a h i n d ra   [2 1]  t o   b ui l t h e   d a t a s e t   o f   o ur   s t udy .   T h e y   c o l l e c t e a r o un d   13, 000  A nd r o i a pp l i c a t i o n   p a c ka ge s   (.   a pk)  a s   n o r m a l   a p p s   f r o m   di f fe r e n t   r e s o ur c e s   a n 6971  m a l i c i o us   a ppl i c a t i o n s   f r o m   kn o w n   s o ur c e s   s uc h   a s   A n d r o i B o t n e t   da t a   s e t   [22],   D r o i dK i n   da t a   s e t   [23] ,   A nd r o i M a l w a r e   G e n o m e   P r o j e c t   [24]  a n A n d r o M a l S h a r e   [25] .   T h e y   e xt ra c t e t h e   pe rm i s s i o n s   a t   i n s t a l l a t i o n   a n r u n   t i m e   a f t e r   r u nni n t h e   c o l l e c t e A n dr o i a p pl i c a t i o n   pa c ka ge s   (.   a pk)  us i n e m u l a t o r   b l ue s t a c [26].     In   t hi s   s t udy ,   w e   us e t h e   n e w   ve r s i o n   o t h e i r   da t a s e t   t ha t   c o n t a i n s   18, 850  n o rm a l   a n d r o i a pp l i c a t i o pa c ka ge s   a n 10, 000  m a l w a r e   a ppl i c a t i o n   pa c ka ge s .   T h e   da t a s e t   ha s   173  pe rm i s s i o n s   f e a t u r e s   (99  s t a t i c   pe r m i s s i o n s   a n 74  dy n a m i c   pe rm i s s i o n s ) ,   w h e r e   e a c h   f e a t ur e   r e p r e s e nt s   t h e   pe r m i s s i o n .   T h e   o c c urr e n c e   of  pe r m i s s i o n   i s   r e pr e s e nt e by   o n e   w h i l e   t h e   a b s e n c e   of  pe r m i s s i o n   i s   r e pr e s e nt e by   z e r o .   T h e   s t a t i c   pe r m i s s i o n s   c o l l e c t e a t   i n s t a l l a t i o n   t i m e   a r e   de n o t e by   ( S w h i l e   t h e   dy n a m i c   pe r m i s s i o n s   c o l l e c t e a t   ru n - t i m e   a r e   i ndi c a t e by   (D ).   T h o s e   pe r m i s s i o n s   w e r e   di s t ri b ut e a m o n 3 c a t e go r i e s   o t h e   a pps   [21] .     T h e   da t a s e t   i s   a   pub l i c l y   a v a i l a b l e   f r o m   t h e   w e b s i t e   t ha t   i s   de s c r i b e i t h e i r   pa pe r   [ 36].   A f t e r   c l e a ni n t h e   da t a s e t   a n de l e t i n t h e   dupl i c a t e s a m p l e s ,   w e   go t   25458  s a m pl e s   (8643  m a l w a r e   a pps   &   16815  b e n i g n   a pps w i t 173   f e a t u r e s ,   l a b e l e a s   m a l w a r e   a nd  n o n - m a l w a re .       3. 1 . 2.   F e atu r e s   T h e   f e a t ur e s   us e i n   t h i s   s t udy   a r e   t h e   a pp’s   pe r m i s s i o n s   t ha t   a r e   r e que s t e du r i ng  i n s t a l l a t i o n   a n a t   r u n   t i m e .   T h e   f o c us   of   t h i s   pa pe r   i s   t o   f i n t h e   o pt i m a l   s e t   of   pe r m i s s i o n s ,   a   s e t   t h a t   gi v e s   h i g h   a c c ura c y   a n d   i s   m o r e   r e l a t e t o   c l a s s   t a rge t ,   o ut   o f   a l l   t h e   pe r m i s s i o n s   pr o v i de by   a n   A n d r o i o pe r a t i n s y s t e m .   T a c c o m pl i s h   t h i s ,   w e   us e i n b ui l t   c l a s s   f e a t ur e _i m po r t a n c e s   of   e xt r a   t r e e - b a s e c l a s s i f i e r s .   F i gu r e   s h o w s   a   di a g ra m   o f   o ur   p r o po s e f r a m e w o r k.       4.   EX P ER I M EN TA S E TU P   M ETH O D O LO G Y   O ur  e xpe ri m e n t   i n c l ude s   t h e   f o l l o w i n s t e ps :     4. 1 .   I m p l e m e n tati o n   W e   us e d   P y t ho n;   t he   p ro g ra m m i n g   l a ng u a g e   t o   c o nd u c t   o u e x p e ri m e n t   b y   u t i l i z i ng   S c i k i t -   L e a r [ 2 0 ] .   S c i ki t -   L e a rn  i s   o n e   o f   t h e   c o m m u n i t i e s   t h a t   ha s   i m p l e m e n t e a   m a c h i n e   l e a rn i ng  a l go r i t h m .     4. 1 . 1.   P r e p r o c e s s i n g   In   t h i s   s t a ge ,   w e   d e l e t e t h e   dupl i c a t e s a m pl e s   a n o r g a ni z e t h e m   a s   m a l i c i o us   a n b e n i g n   by   l a b e l l i n t h e m   a s   m a l w a r e   a n n o n - m a l w a r e .   T h e   pe rm i s s i o ns   of   a ppl i c a t i o n s   a r e   e xt r a c t e t hr o ug h   i n s t a l l i ng  a n r u n   t i m e .   T h e   f e a t ur e s   a r e   s t o r e a s   a   b i na r y   m a t ri o f   (0,   1)  b i n a r y   v a l ue s .   A f t e r   t ha t ,   w e   a ppl i e a   f e a t ur e   s e l e c t i o n   m e t h o t o   b ui l a   d a t a s e t   w i t di f f e r e n t   r e d uc e f e a t ur e s .   A s   de s c r i b e i F i gu r e   1.   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m p   S c i ,   V o l .   19 ,   N o .   1 J ul y   202 0   :     54 3   -   55 2   546   4. 1 . 2.   F e atu r e   s e l e c ti o n     T h e   s e c o n p ha s e   of   o ur   f r a m e w o r i s   us i ng  t h e   f e a t u r e   s e l e c t i o n   t e c hni que   a s   s h o w n   i n   F i g u r e   1.     W e   us e fe a t ur e   s e l e c t i o n   m e t h o b a s e o n   e n s e m b l e   e xt r a   T r e e - b a s e fe a t u r e   s e l e c t i o n   t o   s e l e c t   t h e   i m po rt a nt   s ub s e t   of   f e a t ur e s .   F e a t u r e   S e l e c t i o n   i s   o n e   o f   t h e   c o r e   c o n c e pt s   i n   m a c h i n e   l e a rn i ng  w h i c h   h u ge l y   i m p a c t s   t h e   pe r f o r m a n c e   of   t h e   m o de l .   W e   us e t h e   f e a t ur e   i m po rt a n c e   p r o pe r t y   o f   t h e   m o de l .   F e a t u r e   i m po rt a n c e   g i v e s   a   s c o r e   fo r   e a c h   f e a t u r e   o f   da t a   b e t w e e n   z e r o   a nd  o n e .   T h e   hi g h e r   t h e   s c o r e   i s ,   t h e   m o r e   i m po rt a nt   o r   r e l e v a nt   i s   t h e   f e a t ur e   t o w a r ds   t h e   o ut put   v a r i a b l e .   T h i s   s c o r e   h e l ps   i n   c h o o s i n t h e   m o s t   i m po rt a nt   f e a t u r e s   a n d r o t h e   l e a s t   i m po rt a nt   o n e s   fo r   m o de l   b ui l di n g.   F e a t u r e   i m po rt a n c e   i s   a n   i n b ui l t   c l a s s   t h a t   c o m e s   w i t h   T r e e   B a s e Cl a s s i f i e r s ,   w e   us e E xt ra   T r e e   Cl a s s i f i e r   [27 28]   w h i c h   i m pl e m e nt s   a   m e t a   e s t i m a t o r   t h a t   f i t s   a   n u m b e r   of   r a n do m i z e de c i s i o n   t re e s   (a . k. a .   e xt ra - t r e e s o n   v a r i o us   s ub - s a m pl e s   of  t h e   da t a s e t   a n us e s   a v e r a gi n t o   i m p r o v e   t h e   pr e di c t i v e   a c c ura c y   a n c o n t r o l   ov e r - f i t t i n t o   c o m put e   f e a t ur e   i m po rt a n c e ,   w h i c h   i t u rn  c a n   b e   us e t o   di s c a rd  i rr e l e v a nt   f e a t u r e s .   A s   de pi c t e by   F i gur e   1 ,   t h e   f e a t u r e   s ub s e t   s e l e c t i o n   s c h e m e   s t a r t s   w i t i ni t i a l i z i n g   t h e   e xt ra   t r e e   c l a s s i f i e r.   T h e   c l a s s i f i e s t a rt s   by   b ui l di n m e t a   e s t i m a t o r s .   E a c e s t i m a t o r   r e p r e s e n t s   t h e   n u m b e r   o f   t r e e s   i t h e   f o r e s t   a s   e xpl a i n e i F i gu r e   1 .   T h e   a t t r i b ut e   m a x_f e a t u r e s   s e a r c h   f o r   t h e   n u m b e r   o f   f e a t ur e s   t o   c o n s i de r   w h e n   l o o ki ng  f o r   t h e   b e s t   s pl i t   o f   t r e e   n o de   w h e r e   t h e   s e a r c h   f o r   a   s p l i t   do e s   n o t   s t o unt i l   a t   l e a s t   o n e   v a l i d   p a r t i t i o n   o f   t h e   n o de   s a m pl e s   i s   f o un d,   e v e n   i f   i t   r e qui r e s   t o   e f fe c t i ve l y   i n s pe c t   m o r e   t ha n   m a x_f e a t u r e s   f e a t ur e s .   A t   e a c h   t e s t   n o de ,   e a c h   t r e e   i s   p r o v i de w i t a   ra n do m   s a m pl e   o f   n   fe a t ur e s   f r o m   t h e   f e a t ur e - s e t   f r o m   w h i c h   e a c h   de c i s i o n   t r e e   m us t   s e l e c t   t h e   b e s t   fe a t ur e   t o   s pl i t   t h e   da t a   b a s e o n   us i n t h e   G i n i   I n de x.   T h e   f un c t i o n   (“ g i n i i s   us e h e r e   by   de f a ul t   t o   c o m put e   t h e   G i n i   Im po r t a n c e   o t h e   fe a t u r e   by   us i n t h e   pa ra m e t e r   f e a t ur e _i m po rt a n c e s w h i c h   i s   c a l l e a l s o   a s   t h e   G i n i   Im po rt a n c e   o f   t h e   f e a t ur e s .   T h e   o ut put   i s   e n s e m b l e us i ng  a v e r a g i n t o   c h o o s e   t h e   i m po rt a nt   f e a t u r e s .     By   a v e r a gi n g ,   t h e   e s t i m a t e s   o f   pr e di c t i v e   a b i l i t y   ov e r   s e ve r a l   r a ndo m i z e t r e e s   c a n   h e l i n   r e duc i n g   t h e   v a r i a n c e   of   s uc h   a n   e s t i m a t e   a n us e   i t   fo r   f e a t ur e   s e l e c t i on.   E v e r y   fe a t ur e   i s   o r de r e i n   de s c e n di n o r de a c c o r di n t o   t h e   G i n i   Im po r t a n c e   of   t h a t   f e a t u r e .   A n t o   s e l e c t   t h e   t o n   f e a t ur e s ,   l a r ge s t   ( n f un c t i o n   i s   us e d.   F o r   i n s t a n c e ,   t o   s e l e c t   t h e   t o 5,   10,   a n 20  f e a t ur e s ,   ( n v a l ue   i s   a s s i g n e t o   5,   10,   a n 20  r e s pe c t i v e l y   a s   s h o w n   i F i gu r e   1 .   A f t e e x t r a c t i ng   t he   i m p o rt a nt   p e r m i s s i o ns   f e a t u re s ,   w e   p l o t   t he   t o p   5 ,   1 0   a nd   2 0   f e a t u re s   a s   d e m o ns t ra t e d   i n   t he   f o l l o w i ng   f i g u re s   T h e   t o i m po rt a nt   f e a t u r e s   t ha t   w e   ob t a i n e a f t e r   a ppl y i n g   f e a t ur e   i m po r t a n c e   f e a t ur e   s e l e c t i o n   m e t h o a r e   de c l a r e i n   F i gu r e   2.   A s   w e   c a n   ob s e r ve   f r o m   F i gur e   2,   t h e   pe r m i s s i o n   (D e f a ul t :   r e a p h o n e   s t a t e   a n i de nt i t y   (S ))  r e p r e s e n t s   t h e   m o s t   i m po r t a n t   f e a t ur e   w i t a   s c o r e   o f   0. 12.   T hi s   pe r m i s s i o n   A l l o w s   o n l y   a c c e s s   t o   ph o n e   s t a t e ,   i n c l udi ng  t h e   p h o n e   n u m b e r   o f   t h e   d e v i c e ,   c urr e nt   c e l l ul a r   n e t w o r i n f o r m a t i o n,   t h e   s t a t us   o f   a n y   o n go i ng  c a l l s ,   a nd  a   l i s t   o f   a n y   P h o n e   A c c o u nt s   r e g i s t e r e o n   t h e   de v i c e .   T h i s   pe r m i s s i o n   i s   c o n s i de r e da n ge r o us   a s   de c l a r e by   t h e   s t udi e s   i n   [13,   15 ,   1 6]  b e c a us e   t h a t   pe rm i s s i o n   a l l o w s   t h e   a ppl i c a t i o n   t o   c a l l   ph o n e   n u m b e r s   w i t h o ut   u s e r   i nt e r v e n t i o n .   A s   a   r e s ul t ,   m a l i c i o us   a ppl i c a t i o n s   m a y   c a us e   un e xpe c t e d   c a l l s   o a   us e r   p h o n e   b i l l .   T h e   pe r m i s s i o n   (w r i t e   c o nt a c t   da t a   (S ))  u n de r   Co nt a c t   pa t t e rn   c o m e s   i n   t h e   s e c o n ra n a f t e r   (D e f a ul t :   r e a p h o n e   s t a t e   a n i de n t i t y   (S ))  pe r m i s s i o n .   T h i s   pe r m i s s i o n   a l l o w s   a n   a p pl i c a t i o n   t o   w r i t e   t h e   us e r ' s   c o nt a c t s   d a t a   [30 ,   3 1].   T hi s   pe r m i s s i o n   i s   da n ge r o us   b e c a us e   i t   i n v o l v e s   t h e   us e r ' s   p ri v a t e   i n f o r m a t i o n,   a s   de c l a r e i [1 8,   31 ,   3 2].   T h e   pe rm i s s i o n s   (Y o u r   a c c o un t s :   c o n t a c t s   da t a   i n   G o o gl e   a c c o un t s   (D ))  a s ke a t   ru n   t i m e   a n d   a l l o w e S i t e s   a n d   a p ps   t o   r e que s t   di f f e r e n t   ki nds   o f   a c c e s s   t o   G o o gl e   A c c o un t ,   i n c l ud i n g   r e que s t s   t o :   a)   S e e   b a s i c   pr of i l e   i n f o r m a t i o n :   M a n y   s i t e s   a n a pps   o n l y   r e que s t   a c c e s s   t o   b a s i c   i n f o ,   i n c l udi ng  n a m e ,   e m a i l   a d d r e s s ,   a nd  p r o f i l e   pi c t u r e .   W h e n   a   us e r   g ra nt s   a c c e s s   t o   t h i s   i n f o   by   c h oo s i n " S i g n   i n   w i t G oo gl e "   o n   s i t e s   a n a pps   t ha t   h a v e   t h i s   f e a t u r e .   S ha r i ng  t hi s   i n f o r m a t i o n   m a ke s   i t   e a s i e r   t o   c r e a t e   a a c c o un t   a n h e l ps   t h e   us e a v o i c r e a t i n n e w   pa s s w o r ds .   b)   S e e   s o m e   i n f o r m a t i o n   i n   G o o gl e   A c c o un t :   I n   a d di t i o n   t o   b a s i c   pr o f i l e   i n f o r m a t i o n ,   s o m e   s i t e s   a n a pps   m i g ht   a l s o   a s f o r   pe rm i s s i o t o   s e e   a n m a ke   a   c o p y   of   i n f o r m a t i o i t h e   us e r   a c c o un t .   T hi s   m a y   i n c l ude   i n f o rm a t i o l i ke   Co n t a c t s ,   P h o t o s ,   Y o uT ub e   pl a y l i s t s ,   a n d   m o r e .   c)   E di t ,   upl o a &   c r e a t e   c o n t e nt   i n   G o o gl e   A c c o un t :   In   a d di t i o n   t o   s e e i n a   b a s i c   pr o f i l e   a n s o m e   i n f o r m a t i o n   i n   t h e   a c c o un t ,   s o m e   s i t e s   o r   a pps   m a y   a s fo r   pe r m i s s i o n   t o   do   e v e n   m o r e   i n   G o o gl e   A c c o un t .   T h i s   m a y   i n c l ude   e di t i n g,   up l o a di n g ,   o r   c r e a t i n c o n t e nt .   F o r   e xa m pl e ,   a   f i l m   e di t i ng  a pp  m a y   e di t   v i de o   a n d   upl o a d   i t   t o   t h e   Y o uT ub e   c h a nn e l ,   o a e v e n t   pl a nni n a pp  m a y   c r e a t e   e v e n t s   o n   G o o gl e   Ca l e n d a r ,   w i t h   us e pe rm i s s i o n   [ 33].       Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E x p l or i ng   p e r m i s s i ons   i n   andr o i a ppl i c a t i o ns   us i n g   ( H ow i da  A bub ak e r )   547       F i gu r e   1 .   T h e   p r o po s e f r a m e w o r k           F i gu r e   2 .   T o i m po r t a n t   f e a t u r e s   w i t h   i t s   f e a t u r e   i m po r t a n c e   s c o r e   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m p   S c i ,   V o l .   19 ,   N o .   1 J ul y   202 0   :     54 3   -   55 2   548   T h e   s t udy   do n e   by   M a h i n d r u   [21] ,   c a t e go ri z e t hi s   pe r m i s s i o n   a s   d a n ge r o us   pe r m i s s i o n   s i n c e   a s ke by   t h e   m o s t   s us pi c i o us   a pps .   W a ng  e t   a l . ,   [13]  us e m ut ua l   i n f o r m a t i o n ,   c o rr e l a t i o n   c o e ff i c i e n t ,   a nd  T - t e s t   f e a t ur e s   s e l e c t i o n   m e t h o ds   t o   ra n A nd r o i i ndi v i dua l   pe rm i s s i o n s   w i t h   r e s pe c t   t o   t h e i r   ri s k.   T h e i m e t h o s h o w e t h a t   ( r e c e i v e   _S M S pe r m i s s i o n   ha s   ra n ke t h e   v e r y   t o ri s pe rm i s s i o by   t h e   t hr e e   ra n k i n m e t h o ds   us e d.   T h i s   t y pe   of   S M S - r e l a t e a c t i v i t i e s   m a i nl y   c o n t ri b ut e s   t o   t h e   do m i n a nt   t hr e a t s   [1 3].   T h e   pe r m i s s i o (a c c e s s   a l l   G o o gl e   s e r v i c e s gr o upe a s   o n e   o f   t h e   r i s ky   pe r m i s s i o a s   i de nt i f i e by   M a h i nd r [ 21].   T h e   t o 10  f e a t u r e s   a r e   s e l e c t e by   a s s i gn i n g   t h e   v a l ue   o f   n   w i t h   (1 0)  i l a r ge s t   ( n )   m e t h o d ,   F i g u r e   hi g h l i g ht s   t h e   t o 10  i m po r t a nt   f e a t ur e s   s e l e c t e d.   A s   w e   n o t i c e   f r o m   F i gur e   3,   s t a t i c   pe r m i s s i o n s   h a v e   m o r e   pr o pa ga t i o n   t h a dy n a m i c   pe r m i s s i o n s   w i t a n   a v e r a ge   v a l ue   o f   0. 6.           F i gu r e   3 .   T o 10   i m po r t a nt   f e a t u r e s   w i t h   i t s   f e a t u r e   i m po rt a nc e   s c o r e       W h e n   w e   e xt ra c t e t h e   t o 10  i m po r t a n t   f e a t u r e s ,   w e   fo un o ut   t h a t   t h e   t o 5   f e a t ur e s   t h a t   e xt ra c t e a b ov e   i n   F i gu r e   o c c ur   a g a i n   i n   t h e   l i s t   o f   t o 10  f e a t ur e s   a s   s h o w n   i n   F i g u r e   3.   H ow e ve r ,   s t a t i c   f e a t ur e s   s t i l l   ha v e   t h e   m o s t   di s t ri b ut i o w i t h   a n   a v e r a ge   o f   0. 6.   A s   w e   ob s e r v e   f r o m   t h e   F i gu r e   a b o ve ,   t h e   n e w   o c c urr e n c e   o da nge r o us   pe rm i s s i o n s   s uc h   a s   (f o r m a t   e xt e rna l   s t o r a ge   (D ),   r e a S M S   o r   M M S   (D ),   c o n t r o l   l o c a t i o n   upda t e   n o t i f i c a t i o n   (S ),   A udi o   F i l e   A c c e s s   (S ),   a c c e s s   t pa s s w o r ds   f o r   G o o gl e   a c c o un t s   (D ).   T h e s e   pe r m i s s i o n s   l i s t e a s   r i s ky   pe r m i s s i o a s   s t a t e by   t h e   s t udy   i [21] .     W h e n   w e   e xt r a c t e t h e   t o 20  i m po r t a n t ,   w e   f i n t h a t   m o s t   pe r m i s s i o n s   pe r c e nt a ge   a r e   dy n a m i c   pe r m i s s i o n s   t ha t   o c c ur   duri n r u n   t i m e   w i t h   a n   a v e r a ge   o 0. 55  a s   di s pl a y e d   i n   F i gu r e   4.   T h e s e   d y n a m i c   pe r m i s s i o n s   ( r e a S M S   o r   M M S   (D ),   r e c e i v e   S M S   (D ),   c o n t a c t s   d a t a   i G o o gl e   a c c o un t s   (D ) ,   f o r m a t   e xt e rn a l   s t o ra ge   (D ),   r e a c a l e n d a r   e v e n t   (D ),   w r i t e   c o n t a c t   da t a   (D ),   a dd  o r   m o di fy   c a l e n da r   e v e n t   a n s e n d   e m a i l   t o   gue s t   (D ),   w r i t e   b r ow s e r ’s   h i s t o r y   a n b oo km a r ks   (D ),   r e a c o n t a c t   da t a   (D ),   f i n (G P S l o c a t i o n   (D a n d:   r e a d   p h o n e   s t a t e   a nd  i de nt i t y   (D ))  a r e   l i s t e a s   da n ge r o us   pe rm i s s i o n s   a s   p r o v e by   t h e   s t udy   i [21] .           F i gu r e   4 .   T o 20   i m po r t a nt   f e a t u r e s   w i t h   i t s   f e a t u r e   i m po rt a nc e   s c o r e   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E x p l or i ng   p e r m i s s i ons   i n   andr o i a ppl i c a t i o ns   us i n g   ( H ow i da  A bub ak e r )   549   4. 1 . 3 .   C l as s i f i c ati o n   an d   e v al u ati o n   In  t hi s   p ha s e ,   w e   b ui l t   c l a s s i f i e r   m o de l s   us i n f i v e   m a c h i n e   l e a rni ng  c l a s s i f i e r s   S uppo rt   V e c t o r ,     K   N e i g h b o r s   Cl a s s i f i e r ,   D e c i s i o n   T r e e ,   N a i v e   B a y e s   a n d   M ul t i l a y e r   P e r c e pt r o n s   (M L P ).   W e   e v a l ua t e   t h e   c l a s s i f i e r s   by   s pl i t t i n t h e   da t a s e t   t o   17820  s a m pl e s   i n   t he   t ra i ni n s e t   a n 7638  s a m p l e s   i n   t h e   t e s t i n s e t .   W e   us e fo ur   d a t a s e t s   w i t h   25458   s a m pl e s   a n d   173 ,   5 ,   10 ,   a nd  20   pe rm i s s i o n s   f e a t u r e s   r e s pe c t i v e l y .     4. 1 . 4 .   Ev al u ati o n   m e tr i c s   W e   us e t h e   f o l l ow i n c o n f us i o m a t ri c e s   t o   e v a l ua t e   o ur  c l a s s i f i e r s :   S pe c i fi c i t y :   S pe c i f i c i t y   a l s o   c a l l e t h e   t rue   n e ga t i v e   ra t e   t ha t   m e a s u r e s   t h e   p r o po rt i o o f   a c t ua l   n e g a t i v e s   t ha t   a r e   c o r r e c t l y   i de n t i f i e a s   s uc h   (e . g . ,   t h e   pe r c e nt a ge   o f   m a l i c i o us   a pps   t ha t   a r e   c o rr e c t l y   i de n t i f i e a s   m a l i c i o us   a s   de s c r i b e b e l ow :     T N R   =   ( T N   /   T N + F P )   (1)     T h e   t rue   po s i t i v e   (T P i n   o ur   s t udy   i s   t h e   n um b e r   o f   b e ni g n   a pp l i c a t i o n s   c o r r e c t l y   r e c o gn i z e d .     A n t h e   f a l s e   pos i t i v e   (F P r e pr e s e n t s   t h e   n u m b e r   o f   m a l w a r e   a ppl i c a t i o n s   w r o n gl y   i de n t i f i e a s   b e n i g n .     T h e   t rue   n e ga t i v e   (T N i ndi c a t e s   t h e   num b e r   o f   m a l w a r e   a ppl i c a t i o n s   c o r r e c t l y   r e c o gn i z e d.   A n t h e   f a l s e   n e ga t i v e   (F N r e p r e s e n t s   t h e   num b e o f   be n i g a ppl i c a t i o n s   t ha t   a r e   w r o n gl y   i de nt i f i e a s   m a l i c i o us .     F al s e   N e ga t i v e   Rat e   (F N R):   F N R   m e a s u r e s   t h e   p r o po r t i o n   of   a l l   b e ni g a pps   t ha t   w i l l   b e   i de n t i f i e w r o ngl y   a s   m a l i c i o us   a pps   a s   s h o w n   b e l ow :     F N R =   (F N   /   F N + T P )   (2)     O v e r al l   Ac c u r ac y   (A CC):   A CC  m e a s u r e s   t h e   pe r c e n t a ge   o f   c o r r e c t l y   i de nt i f i e a ppl i c a t i o n s :     A CC=   (T P + T N   /   T P + T N + F P + F N )   (3)       5.   R ES U LTS   A N D   D I S C U S S I O N   T h e   r e s ul t   a nd  d i s c us s i o n   a r e   e xpl a i n e d   i s e c t i o n   5. 1   a nd  s e c t i o n . 5 . 2 .     5. 1    R e s u l ts   T h e   o ut c o m e   o o ur   e xpe r i m e n t   i s   r e p r e s e n t e i n   t hi s   s e c t i on,   w e   c o n duc t e e xpe r i m e nt s   us i n 4   da t a s e t s   a n d   c l a s s i f i e r   a l go r i t h m s .   T h e   f i r s t   d a t a s e t   c o n s i s t s   o f   25458  s a m p l e s   w i t h   17 f e a t u r e s .   A f t e us i n g   a   f e a t ur e   s e l e c t i o n   m e t h o d,   w e   go t   t hr e e   da t a s e t s   w i t h   25 4 58  s a m p l e s   a n 5 ,   10 ,   20  f e a t u r e s   r e s pe c t i v e l y .     T h e   e xpe r i m e n t   m e a s u r e t h e   c l a s s i f i e r ’s   T N R ,   F N R ,   a nd  p r e di c t i o n   a c c ura c y .   W e   us e 70%  o f   t h e   da t a   s e t   a s   a   t r a i n i ng  d a t a s e t   a n 30%  a s   a   t e s t i n g   da t a s e t .   S o ,   t h e r e   a r e   17820   s a m pl e s   i n   t h e   t ra i ni n s e t   a n 7638   s a m pl e s   i n   t h e   t e s t i ng  s e t .   T a b l e .   de pi c t s   t h e   e v a l ua t i o m e t r i c s   o f   e a c h   c l a s s i f i e r   a l go r i t hm   w i t h   f o ur   da t a s e t .     T h e   r e s ul t s   s h o w   t h a t   us i ng  l e s s   fe a t ur e s   (20  f e a t ur e s i m p r o v e s   t h e   a c c ura c y .   F o r   i n s t a n c e ,   us i n S uppo rt   V e c t o r   a n K N e i g h b o r s   Cl a s s i f i e r   w i t h   2 f e a t ur e s   a c hi e v e t h e   h i g h e s t   a c c ura c y   w i t h   94  % .     H ow e ve r ,   N a ï v e   B a y e s   a c h i e ve t h e   b e s t   r e s ul t   o f   t h e   a c c ura c y   o f   90  w i t h   1 f e a t ur e s   w h i l e   us i n 173   f e a t ur e s ,   t h e   r e s ul t   o b t a i n e i s   8 w hi c h   i s   t h e   l o w e s t   ra t e .   T h e   b e s t   a c c ura c y   ob t a i n e w a s   95  us i ng  M ul t i l a y e r   P e r c e pt r o n s   (M L P w i t h   20  a n 17 f e a t ur e s .   In   t e rm s   o f   F N R   (t h e   n u m b e r   o f   b e n i g n   a pps   m i s c l a s s i f i e a s   m a l w a r e ),   S uppo r t   V e c t o r   a n M ul t i l a y e r   P e r c e pt r o n s   (M L P a c h i e v e t h e   be s t   r e s ul t   of  0. 001  w i t h   5   f e a t ur e s .   A l s o ,   us i n N a ï v e   B a y e s ,   t h e   r e s ul t   d ro ppe f r o m   0. w i t h   1 73  f e a t u r e s   t o   0. 03  w i t h   5   f e a t ur e s .   K N e i gh b o r s   Cl a s s i f i e r   p r o duc e t h e   b e s t   p e r f o r m a n c e   i n   t e rm s   of   T N R   ( n um b e r   o m a l w a r e   c l a s s i f i e a s   m a l w a r e w i t h   a n   89  ra t e   us i n 20  f e a t ure s .   H ow e v e r ,   D e c i s i o n   T r e e   pr o duc e t h e   b e s t   a c c ur a c y   of   94  w h e w e   us e a l l   f e a t u r e s   (173   f e a t u r e s a s   s h o w n   i T a b l e   1.     5. 2 .      D i s c u s s i o n   A s   w e   c a n   s e e   f r o m   o ur   p r e v i o us   r e s ul t   t ha t   s uppo rt   v e c t o r   m a c hi n e   (S V M a nd  K N e i g h b o r s   Cl a s s i f i e r s   a c h i e v e goo a c c ur a c y   w h e n   w e   m i ni m i z e t h e   num b e r   o f   f e a t ur e s   f r o m   173   t o   20 .   S i n c e   S V M   a n K N e i g h b o r s   c l a s s i f i e r s   a r e   c o m put a t i o na l l y   e xpe n s i v e   due   t o   t h e   i m pl e m e nt a t i o n   o f   qua d ra t i c   pr o g r a m m i n g   a n d   r e qui r e   m o r e   t i m e   t o   e xe c ut e   c l a s s i f i c a t i o [34 35] ,   s o   r e duc i n f e a t u r e s   h e l ps   i r e duc i n t h e   c o m put a t i o n   p r o c e s s   a n i m p r o v i n a c c u r a c y   a s   w e l l   [37].   H ow e v e r ,   w h e n   w e   us e pr ob a b i l i s t i c   c l a s s i f i e r s   s uc h   a s   N a ï v e   B a y e s ,   t h e   pe r f o r m a n c e   o f   a c c ur a c y   i s   a l s o   i m p r o v e w i t a   90. 4   ra t e   us i ng  10   f e a t ur e s .   M o r e ov e r ,   s i n c e   m o s t   20  fe a t ur e s   t h a t   w e r e   s e l e c t e a s   i m po rt a nt   f e a t ur e s   a r e   d y n a m i c   pe r m i s s i o n s   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m p   S c i ,   V o l .   19 ,   N o .   1 J ul y   202 0   :     54 3   -   55 2   550   f e a t ur e s   t ha t   a s ke a t   r u n   t i m e ,   w e   c a n   c o n c l ude   t ha t   c h o o s i n t h a t   pe rm i s s i o n s   h e l ps   i n   i m p r o v i n t h a c c ur a c y .   A l s o ,   a   di ffe r e n t   n u m b e r   o pe r m i s s i o n s   r e que s t e by   di f fe r e n t   k i n ds   o a pps   gi v e s   e v i de n c e   t h a t   pe r m i s s i o n s   c a n   b e   us e a s   e ffe c t i ve   fe a t ur e s   t o   di s c r i m i na t e   m a l w a r e   a p ps   f r o m   b e n i g n   a pps   s i n c e   a l l   t ha t   20  pe r m i s s i o n s   a r e   c o n s i de r e a s   ri s ky   a n r e p r e s e n t   t h e   t a rge t   c l a s s   a s   w e l l   [21].   I n   a dd i t i o n ,   f r o m   o ur   r e s ul t   ob t a i n e i t   i s   o b s e r v e t h a t   us i ng  l e s s   a t t ri b ut e s   i n   t h e   fe a t u r e   s pa c e   r e s ul t e i n   po o r   pe r f o r m a n c e .     T h e   p r i m a r y   r e a s o n   i s   t ha t   t h e s e   f e a t ur e s   do   n o t   r e pr e s e nt   t h e   t a r ge t   c l a s s .   T h e r e f o r e ,   i n   r e s pe c t   of   t h e   a c c ur a c y ,   a ddi n f e a t ur e s   (20  f e a t ur e s i n   t h e   f e a t u r e   s pa c e   c a pt u r e s   t h e   s a l i e n t   i n f o r m a t i o n   v a ri a b i l i t y   i n   t h e   f e a t ur e   v e c t o r s   of  i n s t a n c e s   be l o n gi n t o   t h e   c l a s s   a n d   t h us   i m p r o v i n t h e   c l a s s i f i c a t i o n.   M ul t i l a y e r   P e r c e pt r o n s   (M L P y i e l ds   t h e   b e s t   pe r fo r m a n c e   t h a t   i s   t h e   a c c ur a c y   i s   i n c r e a s e f r o m   0. 85  t o   0. 95  w i t h   2 f e a t ur e s ,   a n a l l   f e a t ur e s .   T hi s   gi v e s   e v i de n c e   t h a t   us i n a l l   f e a t ur e s   i s   n o t   a   gu a ra n t e e   t h a t   t h e   b e s t   r e s ul t   w o ul b e   fo un f o r   a   c l a s s i f i e r.   F u rt h e rm o r e ,   p r o c e s s i n m o r e   f e a t u r e s   i s   c o m put a t i o n a l l y   a n t i m e l y   e xpe n s i v e .   In   a ddi t i o n,   w e   fo un t ha t   F N R   de c r e a s e w h e w e   us e t h e   l e s s   fe a t u r e s   (5  f e a t ur e s t o   0. 001.   Co m pa r i ng  o ur  r e s ul t   w i t h   t h e   r e s ul t   o f   s t ud y   [17],   w e   c o n c l ude t ha t   o ur   m e t h o (f e a t u r e   s e l e c t i o n   b a s e o e xt ra   t r e e   c l a s s i f i e r a c hi e v e be t t e r   a c c ura c y   w i t h   94  a n d   95  %,   w h i l e   s t udy   [17]  a c h i e v e d   a c c ur a c y   w i t 89  us i n g   I n f o r m a t i o n   G a i n   (IG )   a nd  P e a r s o n   Co rr Co e f   (P C)   f e a t ur e s   r a nki n g   a l go ri t hm s .   F r o m   o u r   f i n di ngs ,   w e   c a n   c o n c l ude   t h a t   o ur   p r o po s e m e t h o b a s e o n   E xt ra - T r e e   c l a s s i f i e r   h e l ps   i n   i n c r e a s i n a c c ura c y   a n d   r e duc i n g   c o m put a t i o n a l   b u r de n s   [38] .       T a b l e   1 .   T h e   r e s ul t   o f   c l a s s i f i c a t i o us i n g   d i f fe r e nt   d a t a s e t   o f e a t ur e s   Cl a s s i fi e a l g o ri t h m s   N u m b e r   o F e a t u r e s   T N R   F N R   A c c u ra c y     S u p p o r t   V e c t o r   m a c h i n e   5   fe a t u re s   0 . 5 8   0 . 0 0 1   0 . 8 5   1 0   fe a t u re s   0 . 7 8   0 . 0 9   0 . 9 1   2 0 f e a t u r e s   0 . 8 5   0 . 0 1   0 . 9 4   1 7 3   f e a t u r e s   0 . 9 0   0 . 0 3   0 . 9 1     K N e i g h b o r s Cl a s s i fi e r   5   fe a t u re s   0 . 7 0   0 . 0 8   0 . 8 5   1 0   fe a t u re s   0 . 8 3   0 . 0 2   0 . 9 1   2 0   fe a t u re s   0 . 8 9   0 . 0 2   0 . 9 4   1 7 3   f e a t u r e s   0 . 8 1   0 . 0 2   0 . 9 2     D e c i s i o n   T re e   5   fe a t u re s   0 . 7 8   0 . 1 7   0 . 8 1   1 0   fe a t u re s   0 . 8 7   0 . 1   0 . 8 9   2 0   fe a t u re s   0 . 9 0   0 . 0 7   0 . 9 2   1 7 3   f e a t u r e s   0 . 9 3   0 . 0 5   0 . 9 4   N a ï v e   Ba y e s   5   fe a t u re s   0 . 6 8   0 . 0 3   0 . 8 7   1 0   fe a t u re s   0 . 7 9   0 . 0 4   0 . 9 0   2 0   fe a t u re s   0 . 8 2   0 . 0 7   0 . 8 9   1 7 3   f e a t u r e s   0 . 8 3   0 . 1   0. 88   M u l t i l a y e P e r c e p t r o n s   (M L P )   5   fe a t u re s   0 . 5 8   0 . 0 0 1   0 . 8 5   1 0   fe a t u re s   0 . 7 8   0 . 0 1   0 . 9 2   2 0   fe a t u re s   0 . 7 8   0 . 0 1   0 . 9 5   1 7 3   f e a t u r e s   0 . 8 9   0 . 0 2   0 . 9 5       6.   C O N C LU S I O N   P e r m i s s i o n   i s   o n e   o f   t h e   m o s t   i m po rt a nt   f e a t u r e s   f o r   a na l y z i ng  A n d r o i d   a pps .   O u p r o po s e d   pe r m i s s i o n - b a s e f r a m e w o r us e s   m a c hi n e   l e a rni n g   a l go r i t hm s   t o   c l a s s i fy   t h e   a nd r o i a pp  a s   m a l w a r e   o r   b e n i g n   a pps   b a s e o n   us i ng  E xt ra - T r e e   c l a s s i f i e r   f e a t u r e   s e l e c t i o n   m e t h o d.   F e a t u r e   s e l e c t i o m e t h o b a s e o n   e n s e m b l e   e xt ra   t r e e   c l a s s i f i e t ha t   ha s   i n b ui l t   c l a s s   f e a t u r e   i m po r t a n c e   t o   a s s i g n   a   s c o r e   f o r   e a c h   f e a t u r e   o f   a   da t a s e t   a n s e l e c t   t h e   i m po rt a nt   f e a t u r e   t ha t   c l o s e s   t o   t a r ge t   c l a s s   h a s   b e e n   us e d.   F o ur   da t a s e t s   w e r e   us e w i t h   5,   1 0,   20  a n d   173   f e a t u r e s   r e s pe c t i v e l y   a n d   f i v e   c l a s s i f i e r s   a l go ri t hm s   w e r e   us e (S uppo r t   V e c t o r   M a c h i n e   (S V M ),   K   N e i gh b o r s   Cl a s s i f i e r,   D e c i s i o n   T r e e ,   N a ï v e   B a y e s   a n M ul t i l a y e r   P e r c e pt r o n s   (M L P )).     T h e   c l a s s i f i e r s   m o de l s   a r e   e v a l u a t e us i n t r ue   n e ga t i v e   r a t e   (T N R ),   f a l s e - n e ga t i v e   ra t e   (F N R a n a c c ura c y   m e t r i c s .   T h e   e xpe r i m e nt a l   r e s ul t s   s h o w   t h a t   S uppo r t   V e c t o r   a n K N e i gh b o r s   Cl a s s i f i e r   w i t h   20  f e a t ur e s   a c hi e v e t h e   h i g h e s t   a c c u r a c y   w i t 94  a nd  t h e   h i g h e s t   T N R   r a t e   w i t 89  %.   A n w e   c o n c l ude t h a t   m o s t   da n ge r o us   pe r m i s s i o n s   a r e   r e que s t e duri n t h e   ru n   t i m e   a n ha v e   m o r e   c o n t ri b u t i o n   i n   e nha n c i ng  m o de l   pe r f o r m a n c e   a s   o b t a i n e by   us i n S u ppo r t   V e c t o r   a n d   K N e i g h b o r s   C l a s s i f i e w i t h   20  f e a t u r e s .     M o r e ov e r ,   w e   c o n c l ude t ha t   o ur   p r o po s e f e a t ur e   s e l e c t i o n   m e t h o b a s e o n   E x t r a - T r e e   c l a s s i f i e r   i m p r o v e s   t h e   c l a s s i f i c a t i o n   a c c ura c y   a n r e duc e s   c o m put a t i o n a l   l o a ds .   T o   f ur t h e r   i m p r o v e   c l a s s i f i c a t i o n,   i   t h e   f ut ur e   w e   w i l l   us e   di f fe r e nt   f e a t u r e   s e l e c t i o n   m e t h o ds   a n i n v e s t i g a t e   o t h e r   f i t n e s s   c r i t e ri a   t o   i m p r o v e     t h e   e ff i c i e n c y   of   pe r m i s s i o n - b a s e A n d r o i m a l w a r e   a na l y s i s .         Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E x p l or i ng   p e r m i s s i ons   i n   andr o i a ppl i c a t i o ns   us i n g   ( H ow i da  A bub ak e r )   551   A C K N O WL ED G E M EN T   T h e   a ut h o r s   w o ul l i ke   t o   t h a n t h e   U n i v e r s i t i   T e k n o l o gi   M a l a y s i a   (U T M fo r   t h e i r   s uppo r t   i R e s e a r c h   a n D e v e l o pm e n t   a n t h e   S o f t   Co m put i n R e s e a rc h   G r o up  (S CR G fo r   t h e   i n s p i r a t i o i n   m a ki n g   t h i s   s t u dy   a   s uc c e s s .   T hi s   w o r i s   s uppo rt e by   M i n i s t r y   of  H i gh e r   E d uc a t i o n   (M O H E u n de r   F u n d a m e nt a l   R e s e a r c G r a nt   S c h e m e   (R .   J 1300 00. 7 828 . 4F 989) .       R EF ER EN C ES     [ 1]   F .   I dr e e s ,   a n M .   R a j a r a j a n ,   " I nv e s t i g a t i ng   t he   a nd r o i i n t e n t s   a n d   pe r m i s s i o ns   f o r   m a l w a r e   d e t e c t i o n, "   I n t .   C on f .   W i r e l .   M ob .   C om pu t .   N e t w .   C om m un,   p p.   35 4 - 358,   2 014 .   [ 2]   S .   K um a r ,   A .   V i i n i ka i ne n,   a nd  T .   H a m a l a i ne n,   " A   ne t w o r k - ba s e f r a m e w o r f o r   m o bi l e   t h r e a t   d e t e c t i o n, "   1 s t   I n t .   C onf .   D at a   I nt e l l .   Se c u r . pp .   227 - 233 ,   201 8.   [ 3]   S .   B h a nda r i ,   e t   a l . ,   " A ndr o i i nt e r - a pp   c o m m uni c a t i o t h r e a t s   a n d   de t e c t i o t e c hni qu e s , "   C om put .   Se c u r ,   v o l .   70 ,     pp.   39 2 - 421,   2 017 .   [ 4]   A nw a r ,   Z .   a nd  K ha n,   W . A . ,   " G ue s s   w ho   i s   l i s t e ni ng   i t o   t he   bo a r m e e t i ng :   o t he   us e   o f   m o bi l e   de v i c e   a ppl i c a t i o ns   a s   r o v i ng   s py   bug s ,   "   Se c ur i t y   and   C om m u ni c at i on   N e t w or k s ,   v o l .   8 ,   no .   16,   p p.   28 13 - 2825 ,   2 01 5.     [ 5]   M .   A l e ne z i a n I .   A l m om a ni ,   " A bus i ng   A ndr o i pe r m i s s i o ns :   A   s e c ur i t y   pe r s p e c t i v e , "   I E E E   J or dan  C o nf .   A p pl .   E l e c t r .   E ng .   C om pu t .   T e c hn ol ,   pp .   1 - 6 ,   201 8.   [ 6]   M .   M .   S a udi ,   e t   a l . ,   " A   ne w   m o bi l e   m a l w a r e   c l a s s i f i c a t i o f o r   c a m e r a   e xpl o i t a t i o b a s e o s y s t e m   c a l l   a nd   pe r m i s s i o n , "   W or l C ongr .   E ng .   C om pu t .   S c i . ,   v o l .   1 ,   20 17 .   [ 7]   J .   A .   J up i n,   e t   a l . ,   " R e v i e w   o f   t he   m a c hi ne   l e a r ni ng   m e t ho ds   i t he   c l a s s i f i c a t i o o f   phi s hi ng   a t t a c k" ,   B u l l e t i o f   E l e c t r i c al   E ng i ne e r i ng   a nd  I n f or m at i c s v o l .   8 ,   no .   4,   pp .   154 5 - 155 5,   2 01 9.   [ 8]   D .   W a hy o no ,   e t   a l . ,   " P r e l i m i na r y   s t udy   o f   w i r e l e s s   ba l l o o ne t w o r us i ng   a da pt i v e   po s i t i o t r a c ki ng   t e c hno l o gy   f o r   po s t   d i s a s t e r   e v e nt ,   "   T E L K O M N I K A   ,   v o l .   17 ,   no .   4 ,   pp .   1767 - 17 73 ,   2019   [ 9]   D ,   L y nkov a . ' 25+   A w e s o m e   M o bi l e   M a r ke t i ng   S t a t i s t i c s   f o r   2019' ,   2 019 .   [ O nl i ne ] .   A v a i l a bl e :   ht t ps : / / t e c hj u r y . ne t / s t a t s - a bo ut / m o bi l e - m a r ke t i ng / .     [ 10]   S .   J u ,   H .   S e o ,   a n J .   K w a k ,   " R e s e a r c o a ndr o i m a l w a r e   pe r m i s s i o pa t t e r u s i ng   pe r m i s s i o m o ni t o r i ng   s y s t e m , "   M ul t i m e d.   T oo l s   A pp l . ,   v o l .   7 5,   no .   22 .   P p.   14 807 - 148 07 ,   2 016.   [ 11]   d e v e l o pe r . a n dr o i d . c o m .   '   P e r m i s s i o ns   o v e r v i e w   ' .   [ O nl i ne ] .   A v a i l a b l e :   ht t ps : / / de v e l o pe r . a n dr o i d . c o m / g ui de / t o pi c s / p e r m i s s i o ns / o v e r v i e w .   [ 12]   X .   L i u a n J .   L i u ,   " A   t w o - l a y e r e p e r m i s s i o n - ba s e a nd r o i m a l w a r e   de t e c t i o s c he m e , "   P r oc .   -   2nd  I E E E   I n t .   C onf .   M o b.   C l oud   C om pu t .   Se r v .   E n g pp .   142 - 14 8,   20 14.   [ 13]   W .   W a ng ,   e t   a l . ,   " E x pl o r i ng   pe r m i s s i o n - i nd uc e r i s i a n dr o i a p pl i c a t i o ns   f o r   m a l i c i o us   a pp l i c a t i o d e t e c t i o n,   "   I E E E   T r an s .   I n f .   F or e ns i c s   Se c ur . ,   v o l .   9,   no .   11 ,   pp .   1 869 - 188 2,   20 14.   [ 14]   H .   J i a o ,   e t   a l . ,   " H y br i de t e c t i o us i ng   pe r m i s s i o a na l y s i s   f o r   a ndr o i m a l w a r e ,   I nt e r n at i ona l   C on f e r e nc e   on  Se c ur i t y   an P r i v ac y   i n   C om m un i c a t i on   N e t w or k s ,   v o l .   152 ,   pp .   54 1 - 545,   20 15.     [ 15]   A .   A l t a he r ,   " A i m pr o v e A ndr o i m a l w a r e   de t e c t i o s c he m e   ba s e o a e v o l v i ng   h y br i ne u r o - fu z z y   c l a s s i f i e r   ( E H N F C )   a n p e r m i s s i o n - ba s e f e a t ur e s , "   N e ur a l   C om put .   A pp l . ,   v o l .   2 8,   no .   12 ,   pp.   4 147 - 415 7,   20 17 .   [ 16]   S .   V e r m a ,     a nd  S .   K .   M ut t o o ,   " A a ndr o i m a l w a r e   de t e c t i o f r a m e w o r ba s e o pe r m i s s i o ns   a nd  i n t e nt s , "   D e f .   Sc i .   J . ,   v o l .   6 6,   no .   6,   p p.   61 8 - 623,   2 016 .   [ 17]   A .   A l t a he r ,   a nd  O .   M o ha m m e d ,   " I nt e l l i g e nt   hy br i a p pr o a c f o r   a ndr o i m a l w a r e   de t e c t i o ba s e o pe r m i s s i o ns   a nd  A P I   c a l l s , "   I nt .   J .   A dv .   C om put .   Sc i .   A p pl . ,   v o l .   8,   no .   6 ,   pp.   6 0 - 67,   20 17.   [ 18]     R .   K um a r ,   e t   a l . ,   "   R e s e a r c o da t a   m i n i ng   of   pe r m i s s i o n - i nduc e r i s f o r   a ndr o i I o T   de v i c e s ,   "   A ppl .   Sc i . ,   v o l .   9,   no .   2 ,   p p .   2 77,   2 019 .   [ 19]   P .   G e ur t s ,   D .   E r ns t ,   a nd  L .   W e he nke l ,   " E x t r e m e l y   r a n do m i z e t r e e s , "   M ac h.   L e ar n . ,   v o l .   63 ,   no .   1 ,   pp .   3 - 42,   20 06.   [ 20]   s c i ki t - l e a r n . o r g . ' s c i ki t - l e a r n   M a c hi n e   L e a r ni ng   i n   P y t h o ' .   [ O nl i ne ] .   A v a i l a b l e : ht t p s : / / s c i ki t - l e a r n. o r g / s t a b l e /   [ 21]   A .   M a hi n dr u a n P .   S i ng h,   " D y na m i c   pe r m i s s i o ns   ba s e a n dr o i m a l w a r e   de t e c t i o us i ng   m a c hi ne   l e a r n i ng   te c hni que s ,   pp.   2 02 - 210 ,   2017 .   [ 22]   K a di r ,   A . F .   A . ,   S t a k ha no v a ,   N .   a nd   G ho r ba n i ,   A .   A . ,   " A ndr o i b o t ne t s :   W ha t   u r l s   a r e   t e l l i ng   us , I nt e r na t i ona l   C onf e r e nc e   on   N e t w or k   and   S y s t e m   Se c ur i t y ,   pp .   78 - 91 ,   2015 .   [ 23]   H .   G o nz a l e z ,   N .   S t a kh a no v a ,   a nd  A .   A .   G ho r ba ni ,   " D r o i dK i n:   L i ght w e i g ht   de t e c t i o o f   a ndr o i a pps   s i m i l a r i t y ,   "     pp.   43 6 - 453,   2 014 .   [ 24]   Y .   Z ho a n X .   J i a ng .   A ndr o i M a l w a r e   G e no m e   P r o j e c t   ,   2012 .   [ O nl i ne ] .   A v a i l a bl e :   ht t p: / / w w w . m a l g e no m e pr o j e c t . o r g / .   [ 25]   ' S a ndD r o i -   A a ut o m a t i c   A ndr o i a pp l i c a t i o a na l y s i s   s y s t e m   ' .   S e e   U s e r ' s   M a n ua l .   [ O n l i n e ] .   A v a i l a b l e :   ht t p: / / s a n ddr o i d. x j t u. e du . c n: 8080/ .   [ 26]     ' B l ue s t a c ks   ' .   [ O nl i ne ] .   A v a i l a b l e :   ht t p: / / w w w . b l u e s t a c ks . c o m / .   [ 27]   S kl e a r n .   E ns e m b l e .   ' E xt r a T r e e s C l a s s i f i e r   .   [ O nl i ne ] .   A v a i l a b l e :   ht t ps : / / s c i k i t l e a r n. o r g / s t a b l e / m o dul e s / g e ne r a t e d/ s k l e a r n . e n s e m b l e . E xt r a T r e e s C l a s s i f i e r . ht m l #s kl e a r n. e ns e m bl e . E xt r a T r e e s C l a s s i f i e r .   [ 28]   ' T r e e - ba s e f e a t u r e   s e l e c t i o ' .   [ O nl i ne ] .   A v a i l a bl e :     ht t ps : / / s c i k i t - l e a r n . o r g / s t a bl e / m o du l e s / f e a t u r e _ s e l e c t i o n . ht m l # t r e e - ba s e d - f e a t ur e - s e l e c t i o n .   [ 29]   ' P y t ho n P a nda s   D a t a F r a m e .   nl a r g e s t   ( ) ' .   [ O nl i n e ] .   A v a i l a bl e :   ht t ps : / / w w w . g e e ks f o r g e e ks . o r g / py t ho n - pa nda s - da t a f r a m e - nl a r g e s t / .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m p   S c i ,   V o l .   19 ,   N o .   1 J ul y   202 0   :     54 3   -   55 2   552   [ 30]   W .   L i ,   J .   G e ,   a n G .   D a i ,   " D e t e c t i ng   m a l w a r e   f o r   a ndr o i pl a t f o r m :   A S V M - ba s e a p pr o a c h ,   "   I E E E   2nd  I n t .   C onf .   C y be r   Se c ur .   C l ou C om put .   pp .   464 - 469 ,   201 5.   [ 31]   de v e l o pe r . a n dr o i d . c o m .   ' W R I T E _C O N T A C T S .   [ O nl i ne ] .   A v a i l a b l e :   ht t ps : / / de v e l o pe r . a n dr o i d . c o m / r e f e r e nc e / a ndr o i d / M a n i f e s t . pe r m i s s i o n. h t m l #W R I T E _C O N T A C T S .   [ 32]   L .   S un,   e t   a l . ,   " S i g ni f i c a n t   pe r m i s s i o i de nt i f i c a t i o f o r   m a c hi ne - l e a r n i ng - ba s e a nd r o i m a l w a r e   de t e c t i o n,   "     IE E E   T r an s .   I nd .   I n f or m at i c s ,   v o l .   1 4,   no .   7 ,   p p.   32 16 - 3225 ,   201 8.   [ 33]   ' T hi r d - pa r t y   s i t e s   &   a p ps   w i t a c c e s s   t o   y o ur   a c c o unt ' .   A v a i l a bl e :   ht t ps : / / s u ppo r t . g o og l e . c o m / a c c o unt s / a ns w e r / 3466 521? hl = e n   [ 34]   C. - C .   C ha ng   a nd   C . - J .   L i n ,   " L i bs v m ,   "   A C M   T r ans .   I n t e l l .   Sy s t .   T e c h nol . ,   v o l .   2,   no .   3 ,   pp.   1 - 27 ,   201 1.   [ 35]   M .   V .   V a r s h a ,     P .   V i no d,   a nd   K .   A .   D ha ny a ,   " I de nt i f i c a t i o o f   m a l i c i o us   a n dr o i d   a p u s i ng   m a ni f e s t   a n o pc o de   f e a t u r e s ,   "   J .   C om pu t .   V i r o l .   H a c k i ng   T e c h . ,   v o l .   1 3,   no .   2 ,   p p.   12 5 - 138,   2 017 .   [ 36]   A .   M a h i nd r u,   A ndr o i M a l w a r e   a nd  N o r m a l   pe r m i s s i o ns   da t a s e t ,”   2 018 .   [ O nl i ne ] .   A v a i l a b l e :   ht t ps : / / da t a . m e n de l e y . c o m / da t a s e t s / 95 8w v r 38gy / 5.   [ 37]   A .   Z a kr a ni ,   M .   H a i n,   a nd   A .   I dr i ,   " I m pr ov i ng   s o f t w a r e   de v e l o pm e nt   e f f o r t   e s t i m a t i o us i ng   s up po r t   v e c t o r   r e g r e s s i o n   a nd   f e a t u r e   s e l e c t i o n,   "   I nt e r n at i ona l   J o ur na l   of   A r t i f i c i a l   I n t e l l i ge nc e ,   v o l .   8 ,   no .   4 ,   pp .   399 - 410 ,   201 9.   [ 38]   W ha t   i s   t h e   e x t r a   t r e e s   a l g o r i t hm   i m a c hi ne   l e a r ni ng ?   [ O nl i ne ] .   A v a i l a b l e :   ht t p s : / / w w w . quo r a . c o m / W ha t - is - t he - e xt r a - t r e e s - a l g o r i t hm - in - m a c hi ne - l e a r n i ng .   Evaluation Warning : The document was created with Spire.PDF for Python.