I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   14 ,   N o .   3 J u n e   20 1 9 ,   pp .   1244 ~ 1250   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 4 .i 3 . pp 124 4 - 1250             1244       Jou r n al   h o m e pa ge ht t p: / / i ae s c or e . c om / j our na l s / i nde x . php/ i j e e c s   C o m p a r i so n   o f   f e a t u r e   s e l e c t i o n   t e c h n i q u e s i n     c l a ssi f y i n g   st r o k e   d o c u m e n t s       N u r   S yaz I z z at i   M o h d   R afe i 1 ,   R o h ayan ti   H as s an 2 RD  R o h m at  S ae d u d i n 3 ,   A n i s   F ar i h an   M at  R af fe i 4 Zal m i yah   Z ak ar i a 5 ,   S h ah r e e n   K as i m 6   1 , 2 , 5 S c h oo l   o f   C o m put i ng ,   F a c ul t y   of   E ng i ne e r i n g ,   U n i v e r s i t i   T e k no l o g i   M a l a y s i a ,   M a l a y s i a   3 S c hoo l   o f   I ndus t r i a l   E ng i ne e r i ng ,   T e l ko m   U ni v e r s i t y ,   I ndo ne s i a   4 F a c ul t y   of   C o m put e r   S y s t e m s   a nd   S o f t w a r e   E ng i ne e r i ng ,   U n i v e r s i t i   M a l a y s i a   P a h a ng ,   M a l a y s i a   6 F a c ul t y   of   C o m put e r   S c i e nc e   a n I nf o r m a t i o T e c hno l o gy ,   U ni v e r s i t i   T un   H u s s e i n   O nn   M a l a y s i a ,   M a l a y s i a       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e D e c   1 6 ,   2018   R e v i s e F e b   1 4 ,   201 9   A c c e pt e F e b   2 8 ,   201 9       T he   a m o unt   o f   di g i t a l   b i o m e di c a l   l i t e r a t u r e   g r o w s   t ha t   m a ke   m o s t   o f   t he   r e s e a r c he r s   f a c i ng   t he   d i f f i c ul t i e s   t o   m a na g e   a nd  r e t r i e v e   t h e   r e qu i r e i nf o r m a t i o f r o m   t he   I nt e r n e t   b e c a us e   t h i s   t a s i s   v e r y   c h a l l e ng i ng .     T he   a pp l i c a t i o o f   t e x t   c l a s s i f i c a t i o o b i o m e di c a l   l i t e r a t ur e   i s   o ne   o f   t he   s o l ut i o ns   i o r d e r   t o   s o l v e   pr o bl e m   t ha t   h a v e   be e f a c e by   r e s e a r c he r s   bu t   m a na g i ng   t he   h i g di m e n s i o na l i t y   o f   da t a   be i ng   a   c o m m o i s s u e   o t e xt   c l a s s i f i c a t i o n.   T h e r e f o r e ,   t he   a i m   o f   t hi s   r e s e a r c i s   t o   c om pa r e   t h e   t e c hni que s   t h a t   c o ul be   u s e t o   s e l e c t   t h e   r e l e v a n t   f e a t ur e s   f o r   c l a s s i f y i ng  bi o m e di c a l   t e x t   a bs t r a c t s .   T hi s   r e s e a r c f o c us   o P e a r s o n‟ s   C o r r e l a t i o a nd  I n f o r m a t i o G a i a s   f e a t u r e   s e l e c t i o t e c hni q ue s   f o r   r e duc i ng   t he   hi g di m e n s i o na l i t y   of   da t a .   T o w a r d s   t h i s   e f f o r t ,   w e   c o nduc t   a nd  e v a l ua t e   s e v e r a l   e xpe r i m e nt s   us i ng   100  a bs t r a c t   o f   s t r o ke   do c um e nt s   t ha t   r e t r i e v e f r o m   P ubM e d a t a ba s e   a s   da t a s e t s .   T h i s   d a t a s e t   u nde r w e n t   t he   t e x t   p r e - pr o c e s s i ng   t ha t   i s   c r uc i a l   be f o r e   pr o c e e t o   f e a t u r e   s e l e c t i o ph a s e .   F e a t ur e s   s e l e c t i o pha s e   i s   i nv o l v i ng   I nf o r m a t i o G a i a nd  P e a r s o C o r r e l a t i o t e c hni qu e .   S uppo r t   V e c t o r   M a c hi n e   c l a s s i f i e r   i s   us e i o r d e r   t o   e v a l ua t e   a n c o m pa r e   t he   e f f e c t i v e ne s s   o f   t w o   f e a t ur e   s e l e c t i o t e c hni q ue s .   F o r   t h i s   da t a s e t ,   I n f o r m a t i o G a i ha s   o ut pe r f o r m e P e a r s o n‟ s   C o r r e l a t i o by   3. 3% .     T hi s   r e s e a r c t e nd s   t o   e x t r a c t   t he   m e a n i ng f ul   f e a t u r e s   f r o m   a   s ubs e t   o f   s t r o ke   do c um e nt s   t h a t   c a be   u s e f o r   v a r i o us   a p pl i c a t i o e s pe c i a l l y   i di a g no s e   t he   s t r o ke   d i s e a s e .   Ke y w or ds :   F e a t u r e   s e l e c t i o n     In f o r m a t i o ga i n   P e a r s o c o rr e l a t i o n   S uppo r t   v e c t o r   m a c h i n e   T e xt   c l a s s i f i c a t i o n   C opy r i gh t   ©   201 9   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   Ro h a y a n t i   H a s s a n,     S c h o o l   of   Co m put i n g ,   F a c ul t y   of   E n gi n e e r i n g ,     U n i v e r s i t i   T e kn o l o gi   M a l a y s i a ,     81310  J o h o r   B h a ru,   J o h o r,   M a l a y s i a .   E m a i l :   r o h a y a nt i @ ut m . m y       1.   I N TR O D U C TI O N     I t h e   c e nt u r y ,   t h e   v a s t   a m o unt   o f   a v a i l a b l e   t e xt   do c um e n t s   t ha t   r e l a t e t o   b i o m e di c a l   p r o duc e s   n e w   c h a l l e n ge s   f o r   t h e   r e s e a r c h e r s   i n   c o l l e c t i ng  s pe c i f i c   i n f o r m a t i o n   c o n c e rn i ng  a n y   pa r t i c ul a di s e a s e s   s uc h   a s   s t r o ke   o r   a b o ut   a n y   s pe c i f i c   i nt e r e s t   i n   a n y   f i e l d.   T h e   t e xt   do c um e n t   c a b e   f r o m   m a n y   s o ur c e s   of   l i ke   W o r l W i de   W e b ,   gov e r nm e nt a l   e l e c t r o n i c   r e po s i t o ri e s ,   b i o l o gi c a l   da t a b a s e s ,   a n d   n e w s   a rt i c l e s   w h i c h   a l l   o f   t h i s   a r e   i n   t h e   fo r m   o un s t r uc t u r e i n f o r m a t i o n   [1].   T hi s   i s s ue s   a nd  s i t ua t i o n   a r e   g r o w i n f a s t   t ha t   w e   n e e d   s o m e   e xpe r t s   t o   m a na ge   t h i s   h u ge   a m o u n t   o f   d o c um e n t   t ha t   a re   a v a i l a b l e   i n   m a n y   r e pos i t o r y   t h a t   ha v e   be e n   m e nt i o n e d   i [2] .   R e c e n t l y ,   t h e r e   a r e   s e ve r a l   a p p r o a c h e s   t ha t   ha v e   b e e n   pr o po s e d   by   m a n y   r e s e a r c h e r s   t o   i de n t i fy   t e rm s   i n   b i o m e di c a l   l i t e ra t u r e s   due   t o   di f f i c ul t i e s   fo r   us e r s   t o   f i n t h e   e ff e c t i v e l y   a n e ff i c i e n t l y   w a y s   f o r   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Com par i s on   of   f e at ur e   s e l e c t i on   t e c h ni qu e s   i c l as s i f y i ng   s t r ok e   do c um e n t s   ( Nur   S y az a   Iz z at i   Moh R af e i )   1245   o r ga ni z i n d a t a   a n d   r e t r i e v i ng  r e l e v a nt   i n f o r m a t i o n   f r o m   t h e   t e xt   s uc h   a s   by   pe r fo r m i n t e xt   c l a s s i f i c a t i o n   o kn o w n   a s   t e xt   m i ni n g   t e c hni que .   T e xt   c l a s s i f i c a t i o n   i s   a   p r o c e s s   of   c a t e g o r i z i n do c um e n t s   a ut o m a t i c a l l y   i nt o   t h e i r   p r e de f i n e c l a s s e s   b a s e o n   t h e i c o n t e n t s   [ 3].   M e t e   e t   a l .   [ 4]  a l s o   de f i n e t e xt   c l a s s i f i c a t i o n   a s   a   p r o c e s s   of   di s c o ve r i n t e xt ua l   i n f o r m a t i o n   t ha t   m us t   ha v e   a   f i xe c l a s s   fo r   e a c h   t e xt .   H ow e v e r ,   b i i s s ue   of  c l a s s i fy i n i s   a   hi g di m e n s i o n a l i t y   o f   da t a   t ha t   c o n s i s t   o f   r e du n da nt   o i rr e l e v a n t   da t a   [5].   I n   o r de r   t o   r e duc e   t h i s   h i g h   di m e n s i o na l i t y ,   fe a t ur e   s e l e c t i o n   i s   t h e   b e s t   s o l ut i on   t o   us e   [6].   A s   m e n t i o n e by   [7],   by   e m pl oy i n t h e   f e a t ur e   s e l e c t i o n   i n   c l a s s i f i c a t i o n,   t h e r e   a r e   b e n e f i t s   c a n   b e   ga i n e s uc h   a s   r e duc i n i n   t i m e   a nd  s t o r a ge .   O t h e r   t h a n   t ha t ,   t h e   f e a t u r e   s e l e c t i o n   m e t h o c a n   i m p r o v e   t h e   pe r f o r m a n c e   by   r e m o v i n t h e   r e du n da nt   o i rr e l e v a n t   d a t a   b a s e o t h e i w e i ght   i t s e l f .   A m o n m a n y   fe a t ur e   s e l e c t i o n   t e c hn i que s   o r   a l s o   c a l l e a s   fi l t e r   a pp r o a c h e s ,   W e t   a l .   [8]  de s c r i b e s   t h a t   t h e   p r o po s e pr o b a b i l i t i e s   a p p r o a c h   t ha t   c a l l e S V M - b a s e pr o b a b i l i t y   f e a t ur e   s e l e c t i o n   c a n   a v o i t h e   pr o b l e m   b i a s   t o w a r ds   da t a   t ha t   a b l e   t o   o ut pe r f o r m e d   I n f o r m a t i o G a i n   a n d   C h i - S q ua r e .   I o t h e r   ha nd,   S h a ra f e t   a l .   [9]  ha v e   c o m pa r e f i l t e r   a p p r o a c h e s   w h i c h   a r e   Chi - S q ua r e   a n I n f o r m a t i o n   G a i n   w i t h   S uppo r t   V e c t o r   M a c hi n e s   (S V M ),   N a ï v e   B a y e s i a n   a nd  J 48  c l a s s i f i e r   i c l a s s i fy i n t h e   s pa m   e m a i l s .   A   s i m i l a r   s t udy   a l s o   h a s   b e e n   c o n duc t e by   [10]  a nd  [9] ,   w h e r e   t h e y   us e f i l t e r   a nd   w r a ppe r   a pp r o a c h e s   n a m e l y   In f o r m a t i o n   G a i n,   G a i n   R a t i o ,   C h i - S q ua r e ,   Co rr e l a t i o n   F e a t u r e   S e l e c t i o n ,   L i n e a r   di s c ri m i n a nt   a na l y s i s   a n R a n do m   F o r e s t   t h a t   ha v e   be e n   a ppl i e a l s o   i c l a s s i fy i n t h e   s pa m   e m a i l s .   T h e   r e s ul t   s h o w s   f i l t e r   a pp r o a c h e s   e n a b l e   t h e   c l a s s i f i e r   a c hi e v e s   t h e   i m p r o v e m e n t   o n   c l a s s i f i c a t i o n   a c c u r a c y   by   r e duc i n t h e   n um b e r   o f   unn e c e s s a r y   a t t ri b ut e   w h i l e   w r a ppe r   a pp r o a c h e s   ha s   po t e nt i a l   hi g hl y   de s i r a b l e   r e duc e   t he   n u m b e r   o f   fe a t u r e s   b ut   i t   w i l l   n o t   a f f e c t i n g   t o   a c c ur a c y   o f   c l a s s i f i e r .   M e a n w hi l e ,   [11]  ha s   i nt r o duc e a n   a p pr o a c h   o f   c o m b i n a t i o n   f e a t u r e   s e l e c t i o n   b a s e o n   t h e   a v e r a ge   w e i gh t   o f   f e a t ur e s   t o   c l a s s i fy   A r a b i c   c o r pus .   I a n o t h e r   w o r k,   [12]  c l a i m e t ha t   D i s t i n gu i s h i ng  F e a t u r e   S e l e c t o r   i s   b e t t e r   t ha n   G i ni   I n de i n   s e l e c t i n t h e   f e a t u r e s   o f   O H S U M E D   da t a s e t .   I n   c l a s s i fy i n t h e   S M S   S pa m   c o l l e c t i o n,   [13]   h a s   c l a i m e t ha t   P e a r s o n   Co rr e l a t i o n   pe r f o r m e w i t h   t h e   hi g h e s t   a c c ura c y   c o m pa r e t o   S y m m e t ri c   U n c e r t a i nt y ,   Ch i - S q ua r e   a n M ut ua l   I n f o r m a t i o n   f e a t u r e   s e l e c t i o n   t e c hn i q ue s .     T h i s   i s   due   t o   P e a r s o n   Co rr e l a t i o n   i s   m o r e   s i m pl e   a n r e duc e   c o m put i o n a l   t i m e   i n   b ui l di n t h e   t e xt   c l a s s i f i c a t i o m o de l .   In   t hi s   pa pe r ,   t hi s   s t udy   a i m s :   (i t o   i de n t i fy   t h e   r e l a t e f e a t u r e s   o n   r i s f a c t o r s   of   s t r o k e ,   (i i t pe r f o r m   f e a t u r e   s e l e c t i o r e m o v i n i rr e l e v a nt   f e a t u r e s   o do c um e n t   o f   r i s k   f a c t o r s   o f   s t r o ke ,   a n ( i i i t e v a l ua t e   P e a r s o n   Co rr e l a t i o n   a n I n f o rm a t i o G a i t e c hni q ue s   i c l a s s i fy i n s t r o ke   do c um e n t s .   T h e   s t r o n g   r e l a t e s t r o ke   do c um e n t s   w e r e   i de n t i f i e a t   t h e   e n o f   t h e   c l a s s i f i c a t i o n   p r o c e s s .   T h i s   p a pe r   i s   o r ga ni z e a s   fo l l ow s :   In   S e c t i o n   1 ,   w e   pr e s e n t   t h e   i n t r o duc t i o n   o t h i s   pa pe r .   T h e n,   i n   S e c t i o n   2 ,   t h e   m a t e ri a l   a n m e t h o a r e   di s c us s e i n   de t a i l .   W h i l e   S e c t i o n   3   pr e s e nt s   t h e   r e s ul t   a nd  di s c us s i o n   o f   t h e   e xpe r i m e nt a l   r e s ul t s .     F i na l l y ,   S e c t i o n   4   p r o v i de s   t h e   c o n c l us i o n   o f   t h i s   r e s e a r c h .       2.   M A TER I A A N D   M ETH O D   F i gu r e   i l l us t ra t e s   t h e   p r o po s e r e s e a r c h   f r a m e w o r o f   t hi s   s t udy   t h a t   c o n s i s t s   o f   s i ph a s e s .     In   p ha s e   1,   t h e   pr o c e s s   be gun   by   i de n t i fy i n t h e   i s s ue s   a n ri s f a c t o r s   t h a t   r e l a t e s t r o ke   di s e a s e .   M o s t l y   t h e   ri s f a c t o r s   w e r e   f o un a n e xt ra c t e f r o m   A m e ri c a n   S t r o k e   A s s o c i a t i o n ,   N a t i o na l   H e a r t ,   L u n g ,   a nd  B l o od   In s t i t ut e   (N IH a n S t r o ke   F o un da t i o n   s o ur c e s .   F o r   s t r o ke   d o c um e n t   da t a s e t s ,   a m o n t h e   a v a i l a b l e   da t a b a s e s ,   t h e   P ub M e da t a b a s e   w a s   r e fe rr e b e c a us e   i t   i s   f r e e   da t a b a s e s   t h a t   s t o r e s   pub l i c l y   a c c e s s i b l e   f ul l - t e xt   of  a r t i c l e s .   F o r   e v e r y   doc um e n t ,   t i t l e   a n d   a b s t r a c t   pa rt s   h a v e   b e e n   s c a nn e w h e t h e t h e   do c um e nt   b e l o n gs   t o   ri s ky   o r   n o n - r i s ky   s t r o ke   doc um e n t .   F u r t h e rm o r e ,   t h e s e   t w o   pa r t s   w e r e   s e l e c t e b e c a us e   t h e y   po t r a y   t h e   w h o l e   c o n t e n t   i do c um e nt s .   T a b l e   s h o w s   ke y w o r ds   t h a t   ha v e   be e n   us e t o   s e a r c h   t h e   s t r o ke   do c um e n t s .   B a s e o n   T a b l e   1,   100   do c um e n t s   h a v e   b e e n   s e l e c t e a s   a   da t a s e t   i t hi s   s t u dy   w h i c l a t e r   ha v e   be e n   di v i de i n t o   t w o   c a t e go r i e s   r i s f a c t o r   a n n o n - r i s f a c t o r.   A s   s h o w n   i n   T a b l e   2,   t h e   f i r s t   c a t e go r y   i s     r i s f a c t o r   t ha t   c o nt a i n s   6 j o ur na l s   w h i l e   t h e   s e c o n c a t e go r y   i s   n o n - ri s f a c t o r   c o n t a i n s   40  j o urn a l s .   E v e n   t h o ug h   t h e   ke y w o r f a c t o r s   of   s t r o ke   o r   r i s ks   o f a c t o r s   of   s t r o ke   a r e   us e fo r   s e a r c h i ng  t h e   do c um e n t s ,   t h e   do c um e n t   t ha t   n o t   r e l a t e t o   ke y w o r a l s o   e xi s t s   i t h e   que r y   s o   t h a t   t h e   do c um e n t s   t h a t   n o t   r e l a t e t o   r i s k   f a c t o r s   w i l l   put   i n o n - r i s k   f a c t o r s   c a t e go r y .       T a b l e   1 .   K e y w o r ds   us e i S e a r c hi n g   S t r o ke   D o c um e n t s   D a t a b a s e   K e y w o r d   Re s u l t   (D o c u m e n t s )   P u b M e d   S t r o k e   2 8 4 5 7 5     F a c t o r s   o S t r o k e   9 9 1 4 1     Ri s k   f a c t o r s   o s t r o k e   6 0 9 4 8       Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   14 ,   N o .   3 J u n e   20 1 9   :     1244     1250   1246   P r e - p r o c e s s i n m e t h o pl a y s   a n   i m po rt a nt   r o l e   i n   t h e   a ppl i c a t i o n   o f   t e x t   c l a s s i f i c a t i o n   w h i c h   t hi s   pha s e   i n v o l ve t h e   c l e a n i ng  a nd  p r e pa ri n o f   t e xt   t o   pr o c e e t o   n e xt   s t e p .   T h e   a i m   o f   t h i s   p r e - p r o c e s s i n i s   t o   s e l e c t   t h e   r e l e v a n t   w o r ds   t h a t   c a rr y   t h e   m e a n i ng  a n r e m o ve   t h e   w o r ds   t ha t   n o t   c o n t r i b ut e   t o   di ff e r e n t i a t i n g   b e t w e e n   t h e   do c um e n t s   [ 14].   I n   t h i s   s t u dy ,   t h e   p r e - p r o c e s s i ng  s t e f o c us e o n   s t o w o r ds   r e m o v a l   a n d   s t e m m i ng.   T h e s e   t w w e r e   kn ow n   a s   t h e   i m po rt a nt   s t e ps   i n   do i n p r e - p r o c e s s i n fo r   t e xt   c l a s s i f i c a t i o n   [14].   T h e   s t o w o r ds   r e m o v a l   a i m s   t o   r e duc e   t h e   di m e n s i o n a l i t y   of   t e r m   s pa c e   w h i l e   t h e   s t e m m i ng  d i s c ov e r s   t h e   r o o t   w o r o r   b a s e   w o r fo r   a n y   pa r t i c ul a r   t e rm .   T h e   do c um e nt   t e rm   m a t r i (D T M i s   o ut put   f r o m   t h i s   p h a s e   t h a t   c o n t a i n s   t h e   do c um e n t s   w i t hi n   t h e   c o r pus   f o r   i t s   r o w s   w hi l e   t h e   c o l um n s   r e p r e s e n t   t h e   c o un t   f o r   e a c h   of  t h e   f e a t u r e s   t ha t   a ppe a w i t h i t h e   c o r pus   i t h e   c s v   f o r m a t .   R   l a n gu a ge   w a s   us e i p r e - p r o c e s s i n g   s t e p.           F i gu r e   1 .   R e s e a r c f ra m e w o r       T a b l e   2 .   S t r o ke   D o c um e n t s   Cl a s s   D o c u m e n t   Ca t e g o ry   N u m b e r   o D o c u m e n t s   Y e s   Ri s k   F a c t o r   60   No   N o n - Ri s k   F a c t o r   40       A f t e r   t h e   t e xt   p r e - p r o c e s s i n i s   do n e ,   t h e   P e a r s o n ‟s   Co rr e l a t i o n   a n I n f o r m a t i o n   G a i n   f e a t u r e   s e l e c t i o n   a r e   a ppl i e t o   f i l t e r   t h e   da t a s e t s   us i ng  W a i ka t o   E n v i r o nm e n t   f o r   K n o w l e dge   A n a l y s i s   ( W E K A ).   F e a t u r e   s e l e c t i o n   c a s o l v e   t h e   h i g h   d i m e n s i o na l   o f   da t a   t ha t   a l w a y s   o c c ur   i n   t e xt   c l a s s i f i c a t i o n   b y   r e duc i n t h e   i rr e l e v a n t ,   n o i s e   a n r e du n da nt   f e a t u r e s   w h i c h   a r e   b ur de n   o n   c h a l l e n gi ng  t a s ks   [15].   B a s e o n   t h e   di f fe r e nt   s t r a t e gi e s   o f   s e a r c hi n g ,   f e a t ur e   s e l e c t i o n   c a n   b e   c l a s s i f i e i n t o   t hr e e   a pp r o a c h e s   w h i c h   a r e   f i l t e a pp r o a c h,   w ra ppe r   a pp r o a c h   a n e m b e dde a ppr o a c h   [16 ].   T h i s   s t udy   o n l y   fo c us   o n   P e a r s o n ‟s   Co rr e l a t i o a n I n f o r m a t i o G a i w h i c h   a r e   u nde f i l t e r   t e c hni que .   B a s i c a l l y ,   bo t h   f e a t u r e   s e l e c t i o n   t e c hni que   us e t h e   s a m e   i nput   t ha t   r e f e r   t o   do c u m e n t   t e r m   m a t ri (D T M w h i c h   i t   i s   t h e   r e s ul t   o f   pr e - p r o c e s s i n s t a ge   a n d   t h e   W E K A   s of t w a r e   c a pa b l e   t o   l o a d   CS V   f o r m a t   o D T M   a n d   c o n v e r t   t o   A R F F   fo r m a t   t o   p r o c e e t o   f e a t ur e   s e l e c t i o n   p ha s e .   B e s i de s ,   bo t h   o f   t h i s   t e c hni que   a l s o   a ppl i e f e a t ur e   ra n k i n t ha t   p r o v i di n a   ra t i n o f   t h e   fe a t ur e s   t ha t   o r de r l y   by   t h e i r   s c o r e   t o   t h e   e v a l ua t o r   a n d   ge n e ra l l y   i t   pe r fo r m s   t h e   ra n w h i c h   f e a t ur e s   s h o ul b e   obt a i n   hi g h   o r   l o w   r a nk  a c c o r di n t o   t h e   s e l e c t e d   f e a t ur e s   i t h e   gi v e da t a s e t s   [ 17] .   T h e   c o n c e pt   of   P e a r s o n   Co rr e l a t i o n   a n I n f o rm a t i o n   G a i n   t e c hni que   i n   s e l e c t i n t h e   s ub s e t   of  r e l e v a nt   f e a t u r e s   f r o m   t h e   e x t r a c t e f e a t u r e s   o f   t h e   s t r o ke   do c um e n t s   a r e   e xp l a i n e a s   a b ov e :     a)   P e a r s o n ‟s   Co rr e l a t i o n   T h e   w a y   P e a r s o n   c o r r e l a t i o n   c o e ff i c i e n t   ρ  de a l i ngs   t h e   s t r e ngt h   o f   t h e   r e l a t i o n s hi b e t w e e n   t w o   f e a t ur e s   t o   f i n t h e   s i m i l a r i t y   b e t w e e n   of   t h e m ,   i s   b a s e o n   v a l ue   w hi c h   t h e   gi v i n a   v a l ue   b e t w e e n   + a n 1 ,   w h e r e   1   i n d i c a t e s   po s i t i v e ,   i n di c a t e s   n o   c o r r e l a t i o a nd  - 1   i s   n e ga t i v e   c o r r e l a t i o [18 ].   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Com par i s on   of   f e at ur e   s e l e c t i on   t e c h ni qu e s   i c l as s i f y i ng   s t r ok e   do c um e n t s   ( Nur   S y az a   Iz z at i   Moh R af e i )   1247   b)   In f o r m a t i o G a i n   In f o r m a t i o n   G a i n   m e a s u r e s   t h e   a m o u n t   o f   i n f o r m a t i o n   i n   b i t s   ob t a i n e f o r   pr e di c t i o n   o f   a   c l a s s   b y   de t e r m i n i ng  t h e   p r e s e n c e   of   a   fe a t u r e   i n   a   d a t a s e t .   I t   de t e rm i n e s   t h e   c ha n ge   i n   e n t r o py   w h e n   t h e   f e a t ur e   i s   p r e s e n t   v s .   w h e n   t h e   f e a t ur e   i s   a b s e n t .   E nt r o p y   i s   a   m e a s ur e   o f   un c e r t a i n t y   o r   unp r e di c t a b i l i t y   i n   a   s y s t e m .   It   i s   t h e   b a s i s   f o r   I n f o rm a t i o G a i a t t r i b ut e s   ra n k i n g   m e t h o ds   [18 ].     T h e   e ffe c t i ve n e s s   of   t h o s e   t w o   f e a t ur e   s e l e c t i o n   t e c hn i que s   i s   e v a l ua t e   i n   c l a s s i f i c a t i o n   p ha s e   a s   m e nt i o n e d   e a r l i e r.   T h e   e xpe ri m e n t s   c o n d u c t   us i ng  t hr e e   s e t s   o f   f e a t ur e s   w h i c h   i n v o l ve s ub s e t   of   da t a s e t   b e fo r e   a n a f t e r   f e a t u r e   s e l e c t i o n   us i n IG   a n P e a r s o n‟s   Co r r e l a t i o n .   T h e   c l a s s i f i c a t i o n   p r o c e s s   a l s pe r f o r m s   by   W E K A   t oo l s   w h i c h   S V M   c l a s s i f i e r   i s   us e d .   I n   t h i s   r e s e a r c h ,   70%  o f   da t a s e t   i s   b e i n c h o s e n   ra n do m l y   a s   t h e   t ra i ni n w hi c h   c o n t ri b ut e   70  do c um e n t s   a nd  30%  f o r   t e s t i n da t a s e t   t ha t   e qua l   t o   30  do c um e n t s .     In  o r de r   t o   m e a s u r e   o t h e   pe r f o r m a n c e   o f   a n y   pa rt i c ul a r   a l g o r i t hm   o r   t e c hn i q ue   us e d,   t h e   t hi n g   t ha t   n e e ds   t o   be   d o n e   i s   t h e   pe r f o r m a n c e   m e a s u r e m e n t   o n   t h e   c h o s e n   m e t h o d,   w hi c h   i s   S V M ,   f o r   t hi s   r e s e a r c h .   T h e   c l a s s i f i e r   pe r f o r m a n c e   i s   b e i n m e a s u r e b a s e o n   t hre e   pr o pe r t i e s   w h i c h   a r e   a c c ura c y ,   pr e c i s i o n   a nd  r e c a l l .   T h e   m o de l   i s   b e i ng  r u o s ub s e t s   of   s t r o ke   do c um e n t s   w i t h o ut   a nd  w i t f e a t u r e   s e l e c t i o n .     T h e   a c c u r a c y   i s   c a l c ul a t e by   us i ng  t h e   f o l l ow i n f o r m ul a   s t a t e b y   [19],                          (         ) (                   )   ( 1)     T h e   p r e c i s i o i s   c a l c ul a t e b y   us i n t h e   f o l l ow i n g   f o r m ul a   s t a t e b y   [19],                                (         )   ( 2)     W h e r e   tp   i s   t r ue   po s i t i v e ,   fp   i s   f a l s e   po s i t i v e .     T h e   r e c a l l   i s   c a l c ul a t e b y   us i n g   t h e   f o l l o w i n f o r m u l a   s t a t e by   [20],                        (         )   ( 3)     W h e r e   tp   i s   t r ue   po s i t i v e ,   fn   i s   f a l s e   n e ga t i v e .       3.   R ES U LTS   A ND  DISCUSSIO N   In   t hi s   s e c t i o n ,   a n a l y s i s   o n   t e xt   pr e p r o c e s s i n a nd  a l s o   a na l y s i s   o n   fe a t u r e   s e l e c t i o n   w i l l   be   di s c us s e d   i n   de t a i l s .     3. 1 .     A n al ys i s   o n   Te x P r e p r o c e s s i n g   F i gu r e   s h o w s   t h e   m o s t   f r e que n t   f e a t u r e s   w i t hi n   t h e   do c um e nt s   f r o m   s t r o ke do c s   c o r pus   us i n P e a r s o n   Co rr e l a t i o n   a n I n f o r m a t i o n   G a i n   e v a l ua t i o n.   T h e   c l a s s i f i c a t i o n   p r o c e s s   a i m   t o   i de nt i f y   t h e   s t r o n g   r e l a t e s t r o ke   doc um e n t s .   A s   a   r e s ul t ,   a f t e r   p r e - p r o c e s s i n g   i s   do n e   t ow a r ds   t h e   c o r pus   of   t e xt   d o c um e n t s ,     t h e   m o s t   f r e que nt   f e a t u r e s   t h a t   ha v e   be e n   e xt ra c t   f r o m   do c um e n t s   w i t h i n   c o r p us   us i n g   G r a p B a r   a s   v i s ua l i z a t i o n   m e t h o d.   T h e   f e a t ur e s   de m o n s t r a t e   t h a t   S t r o ke   pr e s e nt   t h e   hi g h e s t   n u m b e r   o f   f r e que n c y .   S t r o ke   s h o w   t h e   h i g h e s t   n u m b e r   of   f r e que n c y   b e c a us e   o r i gi n a l   da t a s e t s   m o s t l y   a bo ut   t h e   t e xt   o r   do c um e n t   r e ga rdi n t o   S t r o ke   di s e a s e   w h i c i s   s e a r c h e by   us i n c e r t a i n   ke y w o r ds   a nd  t h o s e   ke y w o r ds   a l w a y s   i n c l ude   w o r „s t r o ke ‟  i n   t h e   que r y .   In   a ddi t i o n ,   t h e   do c um e nt s   i c o r pus   m o s t l y   r e v i e w   a bo ut   S t r o ke ,   f o r   t ha t   r e a s o S t r o ke   p r e s e n t   t h e   h i g h e s t   f r e que n c y   c o m pa r e t o   o t h e t e r m s .   A pa r t   f r o m   t ha t ,   f r o m   t h e   e xt ra c t e do c um e n t s   t h e r e   a r e   f i v e   m o s t   f r e que n t   r i s f a c t o r s   o f   s t r o ke   t ha t   ha v e   b e e n   m i n e a s   t a b ul a t e i n   T a b l e   3.   B a s e o n   T a b l e   3,   t h e r e   a r e   a   f e w   r i s f a c t o r s   a ppe a r   w hi c h   s h o w   t h a t   ri s f a c t o r s   l i ke   h y pe r t e n s i o n,   a ge ,   s m o ki n g,   di a b e t e s   w e r e   a l w a y s   be i n g   i s s ue s   o n   t h e   do c um e nt s .   H y pe r t e n s i o n   a l s o   kn o w n   a s   hi g h   b l o o d   pr e s s ur e   i s   t h e   c o m m o n   r i s f a c t o r s   of   s t r o ke   w h i c h   i t   put   a   s t ra i n   o a l l   t h e   b l o o v e s s e l s   t hr o ugh o ut   o u r   b o d y   i n c l udi n g   t h e   b ra i n   t ha t   t h e   l e a o n e   t h e n   o ur   h e a r t   ha s   t o   w o r k   m uc h   ha r de r   t o   ke e p   t h e   b l oo c i r c ul a t i o n   go i n b ut   t h i s   s t ra i n   c a n   da m a ge   o ur   b l o o d   v e s s e l s   w h i c h   c a us i n g   t h e m   t o   b e c o m e   h a r de r   a n d   n a rr o w e r ,   a   c o n d i t i o n   c a l l e a t h e r o s c l e r o s i s   t h e n   i t   m a ke s   a   b l o c ka ge   m o r e   l i ke l y   t o   oc c ur ,   w h i c h   c o ul c a us e   a   s t r o ke   o r   t ra n s i e n t   i s c ha e m i c   a t t a c (S t o ke   A s s oc i a t i o n,   20 12).   E v e n   t h o ug h,   t h e   ra r e   c a s e ,   t hi s   e xt r a   s t ra i n   m a y   c a us e   a   b l oo ve s s e l   t o   w e a ke n   a nd  b ur s t   i n s i de   t h e   b r a i n   t h a t   w i l l   c a us i n g   b l e e di n i nt o   s urr o u n di ng  t i s s ue   t h a t   c a l l e h a e m o rrha gi c   s t r o ke   (S t o ke   A s s o c i a t i o n,   201 2).   A c c o r di ng  t o   S t a t e   o f   t h e   n a t i o n.   (2018 ),   s t r o ke   c a n   a t t a c t o   a n y o n e   of   a n y   a ge   i n c l udi ng  b a b i e s   a n c hi l d r e n   a nd  us ua l l y   t h e   c a us e s   of   s t r o ke   i n   c hi l d r e n   a r e   v e r y   di ff e r e n t   f r o m   t h o s e   i n   a dul t .   B e s i de s ,   S t a t e   o f   n a t i o n.   (2 018)  a l s s t a t e t ha t   t h e   r a t e   of   f i r s t   t i m e   s t r o ke s   i n   pe o pl e   a ge 45  a nd  ov e r   i s   e xpe c t e t o   i n c r e a s e   by   59%  i n   t h e   n e xt   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   14 ,   N o .   3 J u n e   20 1 9   :     1244     1250   1248   20  y e a r s .   A c t ua l l y ,   ri s f a c t o r   o f   a ge   i s   c l o s e l y   r e l a t e t o   t h e   w a y   of   t h e i r   l i f e s t y l e   i t s e l f   w h i c h   i n v o l ve   c o n s um pt i o n   o f   a l c o h o l ,   i l l e ga l   d r ug  a n a l s o   s m o ki ng  h a b i t   (S t a t e   o f   n a t i o n,   2018) .   B e s i de s ,   t h e r e   a r e   a b o ut   5%  s t r o ke   o c c ur s   i n   a du l t s   a r o u n 18  t o   44  y e a r s   o l due   t t h e   s ub s t a n c e   a b us e   l i ke   c o n s um pt i o n   o f   a l c o h o l ,   i l l e ga l   d r ug   a nd  a l s o   s m o ki n g   h a b i t   t ha t   s t a t e b y   (R í o s ,   F   e t   a l .   20 13)           F i gu r e   2 F r e que n t   f e a t u r e s   o f   t h e   d a t a s e t       T a b l e   3 .   R i s F a c t o r s   o f   S t r o ke   F e a t u r e s   F re q u e n c y   A g e   250   H y p e r t e n s i o n   197   D i a b e t e s   180   S m o k i n g   167   G e n d e r   100       3. 2 .       A n a l ys i s   o n   F e atu r e   S e l e c ti o n   T a b l e   s h o w s   t h e   n u m b e r   o f   f e a t ur e s   t h a t   h a v e   s e l e c t e a f t e r   a p pl y i n t h e   d i f fe r e nt   f e a t ur e   s e l e c t i o n .   T h e r e   a r e   2021  f e a t u r e s   f r o m   t h e   o r i gi na l   do c um e n t   a f t e r   t h e   e xt ra c t i o n   i n f o r m a t i o n   f r o m   un s t r uc t u r e t o   s t r uc t u r e i n f o r m a t i o t ha t   r e p r e s e n t   by   fe a t ur e s .   A f t e r   a ppl y i n g   P e a r s o n ‟s   Co rr e l a t i o f e a t u r e   s e l e c t i o n   o n l y   923  fe a t u r e   a r e   s e l e c t e w h i l e   w h e n   a ppl y i n I n f o r m a t i o n   G a i n   f e a t u r e   s e l e c t i o n   o nl y   9   f e a t ur e s   w e r e   s e l e c t e d.   W h e n   a ppl y i n di f f e r e n t   f e a t u r e   s e l e c t i o n ,   t h e   r e s ul t   a l s o   di f fe r s   due   t o   t h e   w e i gh t e t h a t   a ppl y   t h e   f e a t u r e   s e l e c t i o n   i t s e l f .   T h e   pe r f o r m a n c e   o f   c l a s s i f i c a t i o w a s   t h e t e s t e us i ng  S V M   w i t us i n di f f e r e n t   f e a t u r e   s e l c t i o n   t e c hn i q ue s   n a m e l y   P e a r s o n‟s   Co r r e l a t i o n   a nd  I n f o r m a t i o n   G a i n.   F i gu r e   de m o n s t r a t e s   t h e   a c c u r a c y   of   S V M   c l a s s i f i e r   o n   di f f e r e n t   f e a t u r e   s e l e c t i o n   t e c hn i que s .   T h e   hi g h e s t   a c c ur a c y   w a s   pe r fo r m e w h e n   us i n w i t h   P e a r s o n ‟s   Co rr e l a t i o n   f e a t ur e   s e l e c t i o n   t e c h ni que   w h i c h   i s   94. 12 %.   In f o r m a t i o n   G a i n   w a s   t h e n   pe r f o r m e w i t h   91. 18%  a c c ur a c y ,   w h i l e   t h e   a c c ura c y   w i t h o ut   us i n a n y   f e a t ur e   s e l e c t i o n   t e c hn i que   w a s   o n l y   79. 41%.   T hi s   s h o w e t ha t   s e l e c t i o n   o f   t h e   r e l e v a n t   f e a t u r e s   a b l e   t o   b oo s t   t h e   a c c ur a c y   of   t e xt   c l a s s i f i c a t i o n .     O n   t h e   o t h e r   ha n d ,   t h e   pe r f o r m a n c e   of   c l a s s i f i c a t i o n   a l s o   b e e n   t e s t e i n   t e rm   o pr e c i s i o n   a n r e c a l l .   P r e c i s i o n   c a b e   k n o w n   a s   po s i t i v e   p r e di c t i v e   v a l ue   w h i c m e a s u r e   t h e   po rt i o n   t ha t   s h o w s   t h e   l e v e l   of  r e l e v a nt   o f   t h e   r e t r i e v e i n s t a n c e   t h a t   w i l l   b e   a f fe c t e t h e   va l ue   o f   a c c ur a c y .   M e a n w h i l e ,   R e c a l l   a l s o   kn o w n   a s   s e n s i t i v i t y   w h i c h   m e a s u r e   t h e   f r a c t i o n   o r e l e v a n t   i n s t a n c e s   t h a t   a r e   r e t r i e v e i n s t a n c e   t h a t   w i l l   b e   a ffe c t e d   t h e   v a l ue   o f   a c c ur a c y .   Y e t ,   P e a r s o n ‟s   Co rr e l a t i o ha s   o ut pe r f o r m e I n f o r m a t i o G a i n   w i t t h e   hi g h e s t   pr e c i s i o n   a n d   r e c a l l ,   a t   94 . 10 %.   T h e   r e c a l l   a n p r e c i s i o n   v a l ue   c o ul po r t r a y   t ha t   t h e   t e xt u a l   do c um e n t s   c o ul b e   pr e c i s e   a n c o rr e c t l y   c l a s s i f i e by   us i n P e a r s o n   Co rr e l a t i o n   a n d   I n f o r m a t i o n   G a i n   (IG )   f e a t ur e   s e l e c t i o s i n c e   b o t h   o f   t h e   m e a s u r e   e v e n   a c h i e v e m a xi m um   pe r c e n t a ge   o f   r e c a l l   a n d   p r e c i s i o v a l ue .         T a b l e   4 .   R e s ul t   o f   N um b e r   o f   F e a t u r e s   S e l e c t e w i t h   D i f f e r e nt   F e a t u r e   S e l e c t i o n   F e a t ur e   S e l e c t i o n( F S )   N um be r   o f   f e a t u r e s   s e l e c t e d   W i t ho ut   F S   2021   P e a r s o n‟ s   C o r r e l a t i o n   923   I n f o r m a t i o G a i n   9       Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Com par i s on   of   f e at ur e   s e l e c t i on   t e c h ni qu e s   i c l as s i f y i ng   s t r ok e   do c um e n t s   ( Nur   S y az a   Iz z at i   Moh R af e i )   1249       F i gu r e   3 P e r f o r m a n c e   m e a s u r e m e nt   o f   S V M   c l a s s i f i e w i t h   di f fe r e nt   f e a t u r e   s e l e c t i o n       4.   C O N C LU S I O N   A   huge   a m o unt   o f   b i o m e di c a l   do c um e n t s   i n   r e po s i t o r y   gi v e s   di ff i c ul t i e s   fo r   us e r s   t o   f i n d   t h e   e ffe c t i ve l y   a n e ff i c i e n t l y   t e r m s   i n   b i o m e di c a l   l i t e ra t u r e s .   H e n c e ,   a   s t ra t e gy   t i de n t i f y   fe a t ur e s   o n   r i s k   f a c t o r s   of   s t r o ke   w a s   pr o po s e a n t h e   us e of   fe a t ur e   s e l e c t i o n   t e c hni que s   s uc h   a s   P e a r s o Co rr e l a t i o n   a nd  In f o r m a t i o n   G a i n   w e r e   s uc c e s s f ul l y   f i l t e r s   t h e   i rr e l e v a n t   f e a t u r e s   o n   do c um e nt s .   F o r   f ut u r e   w o r ks ,   e xpe rt   v a l i da t i o c o ul b e   c o n s i de r e a s   a   pa rt   o f   w e i gh t e qu a t i f i c a t i o n   i n   s e l e c t i n g   t h e   m o r e   r e l e v a nt   f e a t u r e s .       A C K N O WL ED G E M EN TS   T h i s   r e s e a r c w a s   s uppo r t e by   F R G S   G r a nt   a nd  U T M   G ra n t   u n de r   V o t   N o .   4F 973  a n 1 6H 73   r e s pe c t i v e l y .       R EF ER EN C ES     [ 1]   S i ng h,   A .   ( 2013 ) .   T e x t   M i ni ng :   A   B ur g e o ni ng   t e c hno l o gy   f o r   kno w l e dg e   e x t r a c t i o n,   1 ( M a r c h) ,   22 2 6.   [ 2]   S t a v r i a no u,   A . ,   A ndr i t s o s ,   P . ,   a nd  N i c o l oy a nni s ,   N .   ( 200 7) .   O v e r v i e w   a nd  s e m a nt i c   i s s ue s   o f   t e x t   m i ni ng .   A C M   S I G M O D   R e c o r d,   36 ( 3) ,   23 .   ht t p s : / / do i . o r g / 10 . 11 45/ 1324 185 . 13 24 190   [ 3]   S ur k a r ,   M .   Y .   R . ,   a nd   M o ho d,   P .   S .   W .   ( 2 014 ) .   A   R e v i e w   o F e a t u r e   S e l e c t i o a n D o c um e nt   C l a s s i f i c a t i o u s i ng   S uppo r t   V e c t o r   M a c hi ne ,   3( 2) ,   933 937 .   [ 4]   M e t e ,   M . ,   Y u r uk ,   N .   X u ,   X .   a n B e r l e a n t ,   D .   ( 20 10) .   K no w l e dg e   D i s c ov e r y   i T e xt u a l   D a t a ba s e s :   A   C o n c e pt - A s s oc i a t i o M i n i ng   A ppr o a c h.   D a t a   E ng i ne e r i ng ,   I nt e r n a t i o na l   S e r i e s   i O pe r a t i o ns   R e s e a r c a nd  M a n a g e m e nt   S c i e nc e .   D O I   :   10. 1 007 / 978 - 1 - 441 9 - 0176 - 7_1 .   225 - 24 3.   [ 5]   B a l i ,   M . ,   a nd  G o r e ,   D .   ( 201 5) .   A   S ur v e y   o T e xt   C l a s s i f i c a t i o w i t D i f f e r e n t   T y pe s   o f   C l a s s i f i c a t i o M e t ho ds ,   4888 4894 .   ht t p s : / / do i . o r g / 10 . 15 680 / i j i r c c e . 201 5. 0305 174   [ 6]   Y u,   L . ,   &   L i u,   H .   ( 20 03) .   F e a t u r e   S e l e c t i o f o r   H i g h - D i m e ns i o na l   D a t a :   A   F a s t   C o r r e l a t i o n - B a s e F i l t e r   S o l ut i o n.   I nt e r na t i o na l   C o nf e r e nc e   o M a c hi ne   L e a r n i ng   ( I C M L ) ,   1 8 .   ht t ps : / / d o i . o r g / c i t e u l i k e - a r t i c l e - i d: 3398512   [ 7]     [ 8]   W u,   K . ,   L u,   B . - L . ,   U c hi y a m a ,   M . ,   a n I s a ha r a ,   H .   ( 20 07) .   A   pr o ba bi l i s t i c   a pp r o a c t o   f e a t ur e   s e l e c t i o f o r   m ul t i - c l a s s   t e x t   c a t e g o r i z a t i o n.   A dv a nc e s   i N e ur a l   N e t w o r ks I S N N   200 7 ,   1310 131 7   [ 9]   S ha r a f f ,   A . ,   N a g w a ni ,   N .   K . ,   a nd  S w a m i ,   K .   ( 2 015 ) .   I m pa c t   o f   F e a t ur e   S e l e c t i o T e c hni que   o E m a i l   C l a s s i f i c a t i o n.   I nt e r na t i o na l   J o ur n a l   o f   K no w l e dg e   E ng i ne e r i ng - I A C S I T ,   1( 1) ,   59 63 .   ht t ps : / / d o i . o r g / 10. 7763 / I J K E . 2015 . V 1 . 10   [ 10]   P a r i m a l a ,   R . ,   a n N a l l a s w a m y ,   R .   ( 2 011 ) .   A   S t udy   o f   S pa m   E - m a i l   c l a s s i f i c a t i o u s i ng   F e a t u r e   S e l e c t i o pa c ka g e .   G l o ba l   J o ur n a l   o f   C o m put e r   S c i e nc e   a nd  T e c hno l o gy ,   11( 7) ,   45 54 .   [ 11]   A de l ,   A . ,   O m a r ,   N . ,   a nd  A l - S ha bi ,   A .   ( 2014 ) .   A   c o m pa r a t i v e   s t udy   of   c o m bi ne f e a t u r e   s e l e c t i o m e t ho ds   f o r   A r a bi c   t e x t   c l a s s i f i c a t i o n.   J o ur n a l   o f   C o m put e r   S c i e nc e ,   10 ( 11 ) ,   223 2 22 39 .   ht t ps : / / do i . o r g / 10. 3844 / j c s s p . 201 4. 2 232 . 22 39.   [ 12]   P a r l a k ,   B . ,   a nd  U y s a l ,   A .   K .   ( 201 6) .   T he   i m pa c t   o f   f e a t ur e   s e l e c t i o o m e d i c a l   do c um e nt   c l a s s i f i c a t i o n.   I be r i a n   C o nf e r e nc e   o I nf o r m a t i o S y s t e m s   a nd  T e c hno l o g i e s , C I S T I , 2016 J u l y ( 1503) .   ht t ps : / / do i . o r g / 10. 1109 / C I S T I . 2016. 7521 524   [ 13]   D e e pa L a ks hm i ,   S . ,   a nd  V e l m ur ug a n ,   T .   ( 2 016 ) .   E m p i r i c a l   s t u dy   o f   f e a t u r e   s e l e c t i o m e t ho ds   f o r   hi g d i m e n s i o na l   da t a .   I ndi a n   J o ur n a l   o f   S c i e nc e   a nd   T e c hno l o gy ,   9( 39 ) ,   1 6.   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   14 ,   N o .   3 J u n e   20 1 9   :     1244     1250   1250   [ 14]   R a m a s ub r a m a ni a n ,   C . ,   a nd  R a m y a ,   R .   ( 2013 ) .   E f f e c t i v e   P r e - P r o c e s s i ng   A c t i v i t i e s   i n   T e x t   M i ni ng   us i ng   I m pr o v e d   P o r t e r s   S t e m m i ng   A l g o r i t hm .   I nt e r na t i o na l   J o ur na l   o f   A d v a nc e R e s e a r c i n   C o m put e r   a n C o m m uni c a t i o E ng i ne e r i ng ,   2 ( 12 ) ,   4 536 4538 .   R e t r i e v e f r o m   w w w . i j a r c c e . c o m   [ 15]   C ha nd r a s he k a r ,   G . ,   a nd  S a h i n ,   F .   ( 20 14) .   A   s ur v e y   o f e a t ur e   s e l e c t i o m e t ho ds .   C o m put e r s   a n E l e c t r i c a l   E ng i ne e r i ng ,   4 0( 1 ) ,   16 28 .   ht t p s : / / do i . o r g / 10 . 10 16/ j . c o m pe l e c e ng . 2 013. 11 . 024   [ 16]   M i a o ,   J . ,   a nd  N i u ,   L .   ( 20 16) .   A   S u r v e y   o F e a t ur e   S e l e c t i o n.   P r o c e di -   P r o c e di a   C o m put e r   S c i e nc e ,   91 ( I t qm ) ,   919 9 26.   h t t ps : / / do i . o r g / 10. 1016 / j . p r o c s . 201 6. 0 7. 111   [ 17]   D i na k a r a n,   S . ,   a nd  T ha ng a i a h ,   P .   R .   J .   ( 20 13) .   R o l e   o f   A t t r i bu t e   S e l e c t i o i C l a s s i f i c a t i o A l go r i t hm s .   I nt e r na t i o na l   J o u r na l   o f   S c i e n t i f i c   &   E ng i ne e r i ng   R e s e a r c h,   4( 6 ) ,   6 7 71.   h t t ps : / / do i . o r g / J une   2 013   [ 18]   P hy u,   T .   Z . ,   a nd  O o ,   N .   N .   ( 2 016 ) .   P e r f o r m a nc e   C o m pa r i s o o f   F e a t ur e   S e l e c t i o M e t ho ds .   M A T E C   W e of   C o nf e r e nc e s ,   42 ,   600 2.   [ 19]   S o ko l ov a ,   M .   a n L a pa l m e ,   G .   ( 2009 ) .   A   S y s t e m a t i c   A na l y s i s   of   P e r f o r m a nc e   M e a s u r e s   f o r   C l a s s i f i c a t i o T a s ks .   I n f o r m a t i o P r o c e s s i ng   a n M a n a g e m e nt   4 5.   do i : 10. 101 6/ j . i pm . 20 0 9. 03 . 0 02.   4 27 4 37.   [ 20]   P i t r e ,   S . ,   H o o s h y a r ,   M . ,   S c ho e nr o c k,   A . ,   S a m a nf a r ,   B . ,   J e s s u l a t ,   M . ,   G r e e n ,   J .   R . ,   D e h ne ,   F .   a nd  G o l s h a ni ,   A . .   ( 201 2) .   S ho r t   C o - O c c ur r i ng   P o l y pe pt i de   R e g i o ns   C a n   P r e di c t   G l o ba l   P r o t e i I nt e r a c t i o M a p s .   B i o i nf o r m a t i c s .   D O I :   10. 103 8/ s r e p00 239 .   - 10 .   Evaluation Warning : The document was created with Spire.PDF for Python.