I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   20 ,   N o .   2 N o v e m b e r   20 20 ,   pp.   960 ~ 96 7   IS S N :   25 02 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 20 .i 2 . pp 960 - 96 7             960       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   O p i n i o n   c l a ssi f i c a t i o n   on   so c i a l   n e t w o r k   b y   a   n o v e l   f e a t u r e   sel e c t i o n   t e c h n i q u e         A tc h ar a   C h o om p o l P an i d S o n gr am P h attah an ap h o n C h om p h u w i s e t   P O L A R   L a b,   D e p a r t m e n t   o f   C o m put e r   S c i e nc e ,   F a c ul t y   o f   I nf o r m a t i c s ,   M a h a s a r a kha m   U n i v e r s i t y ,   T ha i l a nd       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e F e b   10,   2 020   R e v i s e A pr   8 ,   2020   A c c e pt e A p r   2 1 ,   2020       M o s t   o f   t he   o pi n i o c o m m e nt s   o s o c i a l   ne t w o r ks   a r e   s ho r t   a nd  a m bi g uo us .   I g e ne r a l ,   o pi ni o c l a s s i f i c a t i o n   o t h e   c o m m e nt s   i s   d i f f i c ul t   b e c a us e   o f   l a c ki ng   do m i na nt   f e a t u r e s .   A   f e a t ur e   e x t r a c t i o t e c hni que   i s   t he r e f o r e   ne c e s s a r y   f o r   i m pr o v i ng   a c c ur a c y   of   t he   c l a s s i f i c a t i o a nd  c o m put a t i o na l   t i m e T h i s   p a pe r   pr o po s e s   a e f f e c t i v e   f e a t u r e   s e l e c t i o m e t ho f o r   o pi ni o c l a s s i f i c a t i o o a   s o c i a l   ne t w o r k .   T he   pr o po s e d   m e t ho d   s e l e c t s   f e a t ur e s   ba s e o t h e   c o nc e pt   o f   f i l t e r   m o de l ,   t o g e t he r   w i t a s s o c i a t i o r u l e s .   S uppo r t   a nd  c o nf i de nc e   a r e   u s e t o   c a l c ul a t e   t he   w e i g ht s   o f   f e a t u r e s .     T he   f e a t u r e s   w i t hi g w e i g ht   a r e   s e l e c t e f o r   c l a s s i f i c a t i o n.   U n l i k e   s u ppo r t s   i a s s o c i a t i o r ul e s ,   s up po r t s   i o ur   m e t ho d   a r e   no r m a l i z e t o   0 - t o   r e m ov e   o ut l i e r   s up po r t s .   M o r e o v e r ,   t un i ng   pa r a m e t e r   i s   us e t o   e m pha s i z e     t he   de g r e e   o f   s uppo r t   or   c o nf i de nc e .   T he   e xp e r i m e n t a l   r e s u l t s   s ho w   t ha t     t he   p r o po s e m e t ho p r o v i de s   hi g c l a s s i f i c a t i o e f f i c i e nc y .   T he   pr o po s e m e t ho d   o ut pe r f o r m s   I n f o r m a t i o G a i n ,   C h i - S qua r e ,   a nd  G i n i   I nde i bo t h   c om put a t i o na l   t i m e   a nd   a c c ur a c y   Ke y w or d s :   A s s oc i a t i o r u l e   F e a t u r e   s e l e c t i o n   O pi n i o c l a s s i f i c a t i o n   O pi n i o m i ni n g   S o c i a l   n e t w o r k   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   A t c ha r a   C h o o m po l ,   D e pa rt m e n t   o f   Co m put e S c i e n c e ,   M a h a s a ra k ha m   U ni v e r s i t y T ha i l a n d .   E m a i l :   a t c ha r a . c h o @ m s u. a c . t h       1.   I N TR O D U C TI O N     S o c i a l   n e t w o r ki n g   w e b s i t e s   h a v e   n o w a da y s   be c o m e   i m po rt a nt   c o m m u n i c a t i o n   t o o l s .   T h e y   a l l ow   us e r s   t o   s h a r e   o pi ni o n s   a n d i s c us s   v a r i o us   i s s ue s   t h r o ug h   m e s s a ge   fo r m a t s   (s uc h   a s   po s t s   a n c o m m e n t s ) .   O pi n i o n   m e s s a ge s   o n   s o c i a l   n e t w o r ks   a r e   i m po r t a n t   i nfo r m a t i o n   a n a na l y z e f o r   us e f ul   i n   m a n y   a ppl i c a t i o n s .   F o r   e xa m p l e ,   o pi n i o n   m e s s a ge s   a r e   us e t o   t r a c c o n s u m e r s ’  a t t i t ude s   t o w a r p r o duc t s   o r   s e r v i c e s .   M o r e o ve r ,   t h e y   a r e   us e t o   i de n t i fy   t h e   s a t i s f a c t i o n s   o f   de m o gr a p h i c s   f e a t u r e s   w i t h   p a r t i c u l a pr o duc t s   [1,   2] .   I po l i t i c s ,   o pi n i o n   m e s s a ge s   a r e   us e f or  e l e c t o r a l   p r e di c t i o n s   o t o   m a ke   a   s u r v e y   of  pe o pl e ’s   o pi n i o n s   a b o ut   po l i t i c a l   pa rt i e s   [3].   I n   e duc a t i o n ,   t he y   a r e   e xpl o i t e t o   a n a l y z e   s t ude n t   s e n t i m e n t s   t o   i m p r o v e   t h e   e f f i c i e n c y   of   s t ud y i n g   [4].     In   o pi n i o n   c l a s s i f i c a t i o n,   f e a t ur e s   a r e   e xt r a c t e f r o m   m e s s a ge s   (t e xt s a n t h e n   l e a rn i ng  a l go r i t h m s   w i l l   de t e rm i n e   t h e   o ri e nt a t i o o f   o pi ni o n s   f r o m   t h e   f e a t u r e s .   S i n c e   m o s t   o f   t h e   m e s s a ge s   o n   s o c i a l   n e t w o r k i n g   w e bs i t e s   a r e   s h o r t   a n v a gue ,   f e a t u r e s   a r e   r e s ul t e d   i n   a   l a r ge   f e a t ur e   s pa c e   t h a t   c o n t a i n s   i rr e l e v a n t   a nd  r e du n d a n t   f e a t u r e s   fo r   c l a s s i f i c a t i o n.   T h e   i rr e l e v a nt   a n r e du n d a n t   f e a t u r e s   l e a t o   m i s c l a s s i f i c a t i o n   i o pi n i o n   c l a s s i f i c a t i o n   t a s k .   T h e r e f o r e ,   fe a t ur e   s e l e c t i o n   b e c o m e s   a n   i m po r t a n t   p ha s e   i n   t h e   t a s k.   It   s e l e c t s   r e l e v a nt   f e a t u r e s   t o   i n c r e a s e s   t h e   pe r f o r m a n c e   o t h e   c l a s s i f i c a t i o n   [5] .   V a ri o us   f e a t ur e   s e l e c t i o n   m e t h o ds   ha v e   b e e n   p r o po s e fo r   o pi ni o n   c l a s s i f i c a t i o n   [6 - 9].   T h e   f i l t e r   m o de l   i s   o n e   po pul a f e a t u r e   s e l e c t i o n   m o de l .   T h e   i de a   o f   f i l t e r   m o de l   i s   t o   c a l c ul a t e   t h e   w e i gh t   o f   f e a t ur e s   a n t h e n   f e a t u r e s   a r e   de c i de t o   ke e o r   r e m o v e   f r o m   de t e rm i na t i o t h e   w e i gh t   o f   fe a t ur e s .   T h e   f i l t e r   m o de l   i s   s i m p l e   a nd  e f f e c t i v e   [1 0].   In   t hi s   pa pe r ,   a   f e a t u r e   s e l e c t i o n   m e t h o i s   pr o po s e d   t i m p r o v e   t h e   pe r f o r m a n c e   of   o pi n i o c l a s s i f i c a t i o n   o n   s o c i a l   n e t w o r k.   It   p r o c e s s e s   b a s e o n   f i l t e r   m o de l .   U nl i ke   t h e   p r e v i o us   f e a t ur e   s e l e c t i o n   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       O pi ni on   c l as s i f i c at i on  on  s o c i a l   n e t w or k   by   a   nov e l   f e at ur e   s e l e c t i o t e c hni q ue   ( A t c har C hoom po l )   961   m e t h o ds ,   c o n f i de n c e   a n d   s uppo rt   v a l ue s   i a s s o c i a t i o n   r u l e   m i ni n a r e   a p pl i e t o   c a l c ul a t e   w e i gh t   o f   f e a t ur e s .   In   t h e   p r o po s e m e t h o d,   t h e   c o n f i de n c e   v a l ue   i n d i c a t e s   a   pe r c e nt a ge   of   c l a s s   c i   a m o n f e a t u r e   f j T h e   s uppo rt   v a l ue   i n di c a t e s   f r e que n c y   of   f e a t ur e   f j   i c l a s s   c i .   T h e   s up po rt   i s   n o r m a l i z e t o   0 - t o   r e m o v e   o ut l i e r   s uppo r t M o r e ov e r ,   t h e   b a l a n c e   of   s uppo r t   a n c o n f i de n c e   v a l ue s   a r e   a dj us t e by   t h e   pa ra m e t e r   p I n   a dd i t i o n,     t h e   v e r t i c a l   d a t a   f o r m a t   i s   us e t o   e a s i l y   c a l c ul a t e   t h e   s up po r t   a n d   c o n f i de n c e   v a l ue s .   T h e t h e   t i m e   f o r   c o m put i n w e i g h t s   o f   f e a t ur e s   c a b e   i m p r o v e d.     In  c o n c l us i o n,   t h e   c o nt r i b ut i o n s   o f   t hi s   p a pe r   a r e   t h e   f o l l ow i ng.   a)   S uppo r t   a nd  c o n f i de n c e   v a l ue s   a r e   a pp l i e t o   c a l c ul a t e   w e i ght s   of   f e a t ur e s   t h a t   a r e   us e t o   s e l e c t   m o s t   r e l e v a nt   f e a t ur e s .   T h e   s e l e c t e f e a t ur e s   i m p r o v e   a c c ur a c y   w h e n   c o m pa ri n t o   In f o r m a t i o n   G a i n ,     Chi - S qu a r e ,   a n d   G i ni   I n de x .   b)   T h e   s uppo r t   i s   n o r m a l i z e t o   0 - t o   r e m o v e r   o ut l i e r   s uppo r t .   T h e n   r e l e v a n t   f e a t u r e s   w i l l   b e   fo un a n d   le a t o   i m p r o v e   c l a s s i f i c a t i o n .     c)   A   t u ni n g   pa ra m e t e p   i s   p r o po s e d   t o   a dj us t e b a l a n c e   b e t w e e s uppo rt   a n d   c o n f i de n c e   d)   T h e   w e i gh t   o f   fe a t u r e   i s   e a s i l y   c a l c ul a t e by   us i n v e rt i c a l   da t a   f o r m a t   t ha t   c a i m p r o v e   t h e   c o m put a t i o n   t i m e   T h e   r e s t   o f   t h e   pa pe r   is   o r g a n i z e a s   f o l l ow s .   Re l a t e w o r ks   a r e   m e n t i o n e d   i n   S e c t i o n   2.   S e c t i o n   3   de s c r i b e s   t h e   p r o po s e m e t h o d .   T h e   e xpe ri m e nt a l   e v a l ua t i o n s   a r e   di s c us s e d   i n   S e c t i o 4 .   F i na l l y ,   S e c t i o n   pr o v i de s   c o n c l us i o n s   a n f ut u r e   w o r k.       2.   RE LA TED   WO R K S   Cu rr e nt l y ,   s oc i a l   n e t w o r w e b s i t e s   h a v e   be c o m e   da t a   s o ur c e s   fo r   r e s e a r c h e r s   b e c a us e   t h e   a m o unt   o da t a   o s o c i a l   n e t w o r ki n g   s i t e s   h a s   g r o w e n o r m o us l y ,   e s pe c i a l l y   o pi n i o m e s s a ge s .   O pi ni o c l a s s i f i c a t i o i s   a   t e xt   m i ni n t a s t h a t   t r y   t o   f i n d   o r i e n t a t i o n   o f   o pi n i o n s   f r o m   o p i n i o n   m e s s a ge s .   It   i s   w i de l y   a ppl i e i m a n y   r e s e a r c do m a i n s ,   s uc a s   r e s t a u ra n t   r e v i e w s ,   p r o duc t   r e v i e w s ,   m o v i e   r e v i e w s   e t c .   D ue   t o   un s t ruc t u r e d a t a ,   o pi n i o n   m e s s a ge s   a r e   t ra n s f o r m e t o   f e a t ur e   s pa c e .   M o s t   of   t h e   o pi n i o n   m e s s a ge s   o n   s oc i a l   n e t w o r ks   a r e   s h o rt ,   a m b i guo us   a n h a v e   n o n - do m i na n t   f e a t u r e s .   T h e r e f o r e ,   t h e   f e a t ur e   s pa c e   i s   v e r y   l a r ge .     F e a t u r e   s e l e c t i o n   b e c o m e s   a n   i m po r t a n t   p r o c e s s   t o   de c r e a s e   t h e   n u m b e r   of   f e a t ur e s   fo r   i m p r o v i n g     t h e   a c c u r a c y   a n d   r e duc i n g   t h e   c o m put a t i o n a l   b ur de n .     F e a t u re   s e l e c t i o m e t ho d s   ha v e   b e e s t u d i e d   i m a ny   re s e a rc he s F o e x a m p l e ,   A l ha j   e t   a l .   [6]   p re s e nt e d   a   t w o - t i e f e a t u re   s e l e c t i o m e t ho d   t o   s e l e c t   a p p ro p ri a t e   a nd   s i g ni f i c a nt   f e a t u re s .   T he   s u b s e t   o f   f e a t u re s   i s   ra nk e d   b a s e d   o hi g i nf o rm a t i o g a i e nt ro py   i t he   f i rs t   t i e r.   T he f e a t u re s   a re   e x t e nd e d   w i t hi g a b i l i t y   i t he   s e c o nd   t i e r.   T he   a n a l y s i s   re s u l t s   s ho w e d   t ha t   t he   s e l e c t e d   f e a t u re s   g a v e   hi g h   c l u s t e ri ng   a c c u ra c y .   P a rl a   a nd   O z e l   [7]   p ro p o s e d   a   ne w   f e a t u re   s e l e c t i o m e t ho d ,   c a l l e d   Q u e r y   E x p a ns i o R a nk i ng .   T he   m e t ho d   i s   b a s e d   o q u e r y   e x p a ns i o t e r m   w e i g ht i ng   m e t ho d s .   T he   re s u l t s   s ho w e d   t ha t   Q u e r y   E x p a ns i o R a nk i ng   c o u l d   i m p ro v e   s e nt i m e nt   a n a l y s i s   p e rf o rm a nc e   i n   t e r m s   o f   c l a s s i f i c a t i o n   a c c u ra c y   a nd   c o m p u t a t i o na l   t i m e .     P r a t i w i   a nd  A di w i j a y a   [8]  pr o po s e f e a t ur e   s e l e c t i o n   a n c l a s s i f i c a t i o n   b a s e o n   I n f o r m a t i o n   G a i fo r   s e n t i m e n t   a n a l y s i s .   T h e   m e t h o pe r f o r m e o n   a   m o v i e   r e v i e w   da t a s e t   a nd  s h o w e t h a t   i t   c o ul r e duc e   m o r e   t ha n   90 o f   unn e c e s s a r y   fe a t u r e s   w i t h   96 a c c u r a c y .   Y a n e t   a l .   [ 9]  p r o po s e a   n e w   fe a t ur e   s e l e c t i o a l go ri t hm   b a s e o n   c o m p r e h e n s i v e   m e a s u r e m e n t s ,   b o t h   i n t e r - c a t e go r y   a n i nt ra - c a t e go r y ,   fo r   t e xt   c a t e go r i z a t i o n.   T hr e e   b e n c hm a rk  do c um e nt   c o l l e c t i o n s ,   20 - N e w s gr o ups ,   R e ut e rs - 21578  a nd  W e b K Z ,     w e r e   c l a s s i f i e by   N a ï ve   B a y e s   a n S uppo r t   V e c t o r   M a c h i n e s .   T h e   e xpe ri m e n t a l   r e s ul t s   s h o w e t h a t     t h e   f e a t ur e   s e l e c t i o n   m e t h o i s   s i g n i f i c a n t l y   s upe r i o r   t o   o t h e m e t h o ds .   A de l e ke   e t   a l .   [5]  p r o po s e a   t w o - s t e p   f e a t ur e   s e l e c t i o n   m e t h o d.   I n   t h e   f i r s t   s t e p ,   C h i - s qu a r e   w a s   a do pt e t o   r e duc e   t h e   di m e n s i o n a l i t y   of   a   f e a t ur e   s e t .   I n   t h e   s e c o n s t e p,   a   w ra ppe r   c o rr e l a t i o n - b a s e t e c hni q ue   w a s   e m pl oy e t o   f ur t h e s e l e c t   m o s t   r e l e v a nt   f e a t ur e s   f r o m   t h e   r e duc e fe a t u r e   s e t .   T h e   r e s ul t s   s h o w n   t ha t   t h e   f e a t u r e   s e l e c t i o n   m e t h o a c h i e v e a c c ur a c y   of   93. 60%  i n   4. 17   s e c o n ds .   S o m a nt r i   a n d   A p r i l i a n i   [11]  p r o po s e a   h y b r i d   f e a t ur e   s e l e c t i o n   m o de l   t o   s o l ve   t h e   n o n - o pt i m a l   p r o c e s s   of   s e l e c t i ng  f e a t u r e s .   H y b r i f e a t u r e   s e l e c t i o n   m o de l s   c o m b i n e   In f o r m a t i o n   G a i n   a n d   a   ge n e t i c   a l go r i t h m .   T h e   r e s ul t s   s h o w e t ha t   t h e   p r o po s e m e t h o ga v e   a a c c u r a c y   o f   93. 00%.       R a fe i   e t   al .   [12]  c o m pa r e t h e   pe r f o r m a n c e   of  t w f e a t ur e   s e l e c t i o n   t e c hn i que s   fo r   s e l e c t   t h e   r e l e v a n t   f e a t ur e s   fo r   c l a s s i fy i n b i o m e di c a l   t e xt   a b s t ra c t s .   T h e   t w f e a t u r e   s e l e c t i o n   t e c hn i que s ,   P e a r s o n ’s   Co rr e l a t i o a n I n f o rm a t i o G a i n ,   a r e   i n v e s t i ga t e f o r   r e duc i n g   t h e   hi g di m e n s i o n a l i t y   of   da t a .   S t r o ke   do c um e n t s   w e r e   c l a s s i f i e by   S uppo r t   V e c t o r   M a c hi n e .   T h e   e xpe r i m e n t a l   r e s ul t s   s h o w e t ha t   I n f o r m a t i o G a i n   o ut pe r f o r m e P e a r s o n ’s   Co rr e l a t i o n   by   3. 3%.   P u rn a m a s a r i   [1 3]   c l a s s i f i e t w e e t s   t h a t   c o n t a i n   b ul l y i n by   us i n S uppo r t   V e c t o r   M a c h i n e .   R e l e v a n t   f e a t u r e s   a r e   s e l e c t e by   us i n In f o r m a t i o n   G a i n.   I n   t h e   f i r s t   s t e p,   t w e e t s   a r e   pr e p r o c e s s e by   us i n t o ke n i z i n g ,   f i l t e ri n g ,   s t e m m i n g   a n t e rm   w e i ght i n g .   I t h e   s e c o n s t e p,     In f o r m a t i o n   G a i n   f e a t u r e   s e l e c t s   r e l e v a n t   f e a t u r e s   by   c a l c ul a t i n t h e   e n t r o py   v a l ue   of   e a c h   f e a t ur e s .     A f t e r   t h a t ,   t h e   c l a s s i f i c a t i o p r o c e s s   i s   pe r fo r m e by   S uppo r t   V e c t o r   M a c h i n e   c l a s s i f i e r .   T h e   r e s ul t s   s h o w e d   t h a t   t h e   b e s t   t hr e s h o l d   o f   i n f o r m a t i o ga i n   i s   9 0%  w i t a c c ura c y   76. 66% .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   20 ,   N o .   2 N o v e m be r   20 20  :     96 0   -   96 7   962   F r o m   p r e v i o us   w o r k,   f e a t ur e   s e l e c t i o n   i s   a n   i m po rt a nt   p r o c e s s   i n   t e xt   c l a s s i f i c a t i o n .     O pi n i o n   c l a s s i f i c a t i o n   i s   a   ki n o f   t e xt   c l a s s i f i c a t i o n   t ha t   ne e ds   t o   r e duc e   d i m e n s i o n   o f   f e a t ur e   s pa c e   a n d   s e l e c t   r e l e v a n t   f e a t u r e s .   M o s t   f e a t ur e   s e l e c t i o n   m e t h o ds   c a l c ul a t e   t h e   w e i gh t s   o f   f e a t ur e s   b a s e o n   r e l a t i o n s h i ps   w i t h i n   f e a t u r e s   a n c l a s s e s .   U n l i ke   t h e   p r e v i ous   m e t h o ds ,   t h e   f r e que n c y   of   t h e   r e l a t i o n s h i o f e a t ur e s   a nd  c l a s s e s   i s   a dde t c a l c ul a t e   t h e   w e i gh t   o f   f e a t u r e s   i n   o ur   m e t h o d.   F urt h e r m o r e ,   m o s t   f e a t ur e   s e l e c t i o n   o n   o pi ni o c l a s s i f i c a t i o n   r e t ri e v e   r e l e v a n t   f e a t u r e s   f r o m   a   h o r i z o nt a l   v e c t o r ,   w h e r e   a   do c um e nt   i s   m a ppe t o   a   r o w .   T h e   r o w   c o n s i s t s   o f   a   h uge   n um b e r   o f   a l l   po s s i b l e   fe a t u r e s .   If   a   do c um e n t   ha s   a   s m a l l   s ub s e t   o f   t h e   f e a t ur e s ,   a   l a rge   n ul l   v a l ue   w i l l   b e   ge n e ra t e d   w h i c h   ha s   a   n e ga t i v e   i m p a c t   o c o m put a t i o na l   pe r f o r m a n c e .   I o ur  p r o po s e m e t h o d,   a   v e r t i c a l   da t a   f o r m a t   i s   e m pl o y e t o   r e duc e   c o m put a t i o n   c o s t .       3.   TH E   P R O P O S ED   M ET H O D   In  t hi s   pa pe r,   a   f e a t ur e   s e l e c t i o n   m e t h o i s   p r o po s e t o   s e l e c t   m o s t   r e l e v a nt   f e a t u r e s   a n i m p r o ve   pe r f o r m a n c e   o f   o pi n i o n   c l a s s i f i c a t i o n   o n   s o c i a l   n e t w o r k.   D ue   t o   o pi ni o n   c l a s s i f i c a t i o n   p r o c e s s i n o n   t e xt   da t a s e t ,   t e x t   da t a s e t   ha s   t o   b e   pr e pr o c e s s e t o   s t r uc t u r e d a t a s e t .   T h e   p r o po s e m e t h o r e p r e s e n t s   t h e   d a t a s e t   a s   a   v e r t i c a l   d a t a   f o r m a t   t o   e a s i l y   c a l c ul a t e   s uppo r t   a n c o n f i de n c e   v a l ue s .   T h e   p r e p r o c e s s i n i s   e xpl a i n e i s ub s e c t i o n   3. 1.   F r o m   t h e   v e r t i c a l   da t a s e t ,   i t   w i l l   b e   pr o c e s s e t o   f i n m o s t   r e l e v a n t   f e a t u r e s .   T h e   pr o c e s s   i n   t h e   pr o po s e m e t h o c o n s i s t   o ph a s e s ;   s uppo r t   a nd  c o n f i de n c e   c a l c ul a t i o n,   s uppo r t   n o r m a l i z a t i o n ,   pa r a m e t e t u ni n a n w e i ghi n c a l c ul a t i o n,   a n f e a t u r e   r a n k i n g.   A l l   p ha s e s   w i l l   b e   e xpl a i n e m o r e   de t a i l s   i t h e   s ub s e c t i o n s   3. 2   -   3. 5 .     3. 1 .     P r e p r o c e s s i n g   T h e   pr e p r o c e s s i n i s   t h e   f o l l ow i n s t e ps :   (1)  t e xt   f r a g m e n t s ,   s uc h   a s   #,   e m o t i c o n s ,   U R L s   a n @ ,     a r e   r e m o v e f r o m   t h e   t e x t   d a t a s e t   b e c a us e   t h e y   do   n o t   s i gni f i c a n t l y   de s i gna t e   t h e   po l a r i t y   i de n t i f i c a t i o n ,     (2)   s t o w o r ds   a r e   r e m o v e f r o m   t h e   d a t a s e t   us i n a   di c t i o na r y - b a s e t e c h n i que ,   (3)  t h e   s t e m m i n p r o c e s s   i s   pe r f o r m e b e f o r e   t o k e n i z a t i o n   a n d   i n   t h e   t o ke ni z a t i o n   p r o c e s s   w o r ds   pr e c e de by   n o / n o t   a r e   t o ke ni z e us i n t h e   bi - g r a m   t e c hn i que ,   o t h e r w i s e ,   uni - g ra m .   A   t o ke is   c o n s i de r e a s   a   f e a t ur e .   N e xt ,   t h e   da t a s e t   i s   t r a n s f o r m e t o   t h e   v e r t i c a l   da t a s e t   a s   a n   e xa m pl e   i T a b l e   1,   w h e r e   D   { d 1 , d 2 ,   . . ,   d 5 }   i s   t h e   s e t   o f   doc um e n t s   T   { t 1 t 2 ,   . . ,   t 6 }   i s   t h e   s e t   o f   f e a t ur e s ,   a n d   C   { c 1 c 2 , }   i s   t h e   c o m pl e t e   s e t   o f   di s t i n c t i v e   c l a s s   l a b e l s .         T a b l e   1 .   V e r t i c a l   d a t a   f o r m a t     F e a t u r e   S e t   o f   D o c u m e n t s   t 1   { d 1 , d 3 , d 5 }   t 2   { d 1 d 2 , d 3 }   t 3   { d 1 , d 3 , d 4 }   t 4   { d 1 d 2 , d 3 , d 5 }   t 5   { d 1 , d 5 }   t 6   { d 2 , d 3 , d 4 , d 5 }   c 1   { d 1 d 2 , d 3 }   c 2   { d 4 , d 5 }       3. 2 .     S u p p o r an d   c o n fi d e n c e   c a l c u l ati o n   S uppo r t s   a nd  c o n f i de n c e s   v a l ue s   of   a l l   f e a t ur e s   a r e   e a s i l y   c a l c ul a t e f o r   e a c h   c l a s s   i n   t h e   v e r t i c a l   da t a s e t .   T o   c a l c ul a t e   a   c o n f i de n c e   v a l ue   o f   f e a t ur e   t i   i n   c l a s s   c k ,   w e   n e e t o   f i n t h e   s uppo rt   o f   f e a t ur e   t i   a n d   t h e   s uppo r t   o f   f e a t ur e   t i   i n   c l a s s   c k T h e   s up po r t   o f   f e a t ur e   t i   i s   t h e   n u m b e r   of  d o c um e n t s   c o n t a i ni n t i   t h a t   i s   e a s i l y   ob t a i n e by   c o un t i n t h e   n u m b e r   o f   d o c um e n t s   c o n t a i n i ng  t h e   f e a t u r e   t i   i n   t h e   v e r t i c a l   da t a s e t .     F o r   e xa m pl e   t h e   s uppo rt   o f   t 3   =   | { d 1 d 3 d 4 } |   =   3 ,   de n o t e   a s   S ( t 3 )   T h e   s upp o r t   o f   f e a t ur e   t i   i n   c l a s s   c k   i s   t h e   n u m b e r   of  d oc um e nt s   c o n t a i n i ng  t i   i n   c k ,   de n o t e a s     | S ( t i ,   c k ) | .   I n   o u r   w o r t h e   s uppo r t   o f   fe a t ur e   t i   i n   c l a s s   c k   is   e a s i l y   c a l c ul a t e f r o m   | S ( t i ,c k )| =   | S ( t i ) S ( c k ) | .     F o r   e xa m p l e ,   t h e   s up po r t   o f   f e a t ur e   t 3   i c l a s s   c 1   c a n   b e   c a l c ul a t e f r o m     | S ( t 3 , c 1 ) |)   |S ( t 3 ) ∩S ( c 1 |   =   | { d 1 ,   d 3 , d 4 } |{   d 1 ,   d 2 ,   d 3 } |   =   | {   d 1 ,   d 3 } |   =   2   A s   a   r e s ul t ,   t h e   c o n f i de n c e   i s   e a s i l y   c a l c ul a t e f r o m   t h e   c a l c ul a t e d   s uppo rt .   T h e   c o n f i de n c e   i s     t h e   r a t i o   of   t h e   n u m b e r   of   d o c um e n t s   t h a t   c o n t a i n   f e a t u r e   t i   i n   c l a s s   c k   a n t h e   n u m b e r   of   d o c um e n t s   c o n t a i f e a t ur e   t i .   T h e r e f o r e ,   t h e   c o n f i de n c e   i s   c a l c ul a t e f r o m   C ( t i ,c =   | S ( t i ,c k ) |   | S ( t i ) | .   T h e   c o n f i de n c e   o f e a t ur e   t 3   i n   c l a s s   c 1   c a n   b e   fo un f r o m   C ( t 3 ,c 1   =   | S ( t 3 ,c 1 ) |   | S ( t 3 ) |   =   2/ =   0 . 66 7 .   T h i s   s t a t e s   t ha t   i f   f e a t ur e   t 3   i s   i a   do c um e n t ,   t h e   p r o b a b i l i t y   of   t h e   do c um e nt   b e l o n gi ng  t o   c l a s s   c 1   i s   66 . 70% .       Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       O pi ni on   c l as s i f i c at i on  on  s o c i a l   n e t w or k   by   a   nov e l   f e at ur e   s e l e c t i o t e c hni q ue   ( A t c har C hoom po l )   963   3. 3 .     S u p p o r t   n o r m al i z ati o n   S i n c e   t h e   s uppo r t   m a y   b e   v e r y   s m a l l   o r   v e r y   l a rge ,   i t   n e e ds   t o   b e   n o r m a l i z e t o   r e m o v e   o ut l i e s uppo r t .   I t h e   p r o po s e m e t h o d,   t h e   s up po r t   i s   n o r m a l i z e t o   0 - 1,   t h e   s a m e   a s   t h e   u ni t   v a l ue   o f   c o n f i de n ce In  t h e   n o r m a l i z a t i o o f   t h e   s uppo r t   p r o c e s s ,   a l l   f e a t u r e s   i n   c l a s s   c k   a r e   ra n ke b y   t h e i r   s up po r t s   i de s c e n di n g   o r de r.   F o r   e xa m pl e ,   i n   T a b l e   2,   c l a s s   c 1   c o n s i s t s   o f   fe a t ur e s   t 1 t 2 t 3 t 4 t 5 ,   a n t 6 .   T h e   s uppo r t s   o f   a l l   f e a t ur e s   i n   c l a s s   c 1   a r e   s h o w n   i t h e   s e c o n r o w   ( S ( t i ,   c 1 ) ) .   T h e   s up po r t s   o f   t 2   a n t 4   a r e   t h e   hi g h e s t ,   s o   t 2   a nd  t 4   a r e   ra n ke i n   t h e   f i r s t   o r de r .   T h e   s e c o n hi g h e s t   s uppo r t s   a r e   t h e   s uppo r t s   o f   t 1 t 3 ,   a nd  t 6 ,   s o   t 1 t 3 ,   a n t 6   a r e   ra n ke i n   t h e   s e c o n o r de r.   T h e   s uppo r t   o f   t 5   i s   t h e   l ow e s t   s uppo r t ,   s o   t 5   i s   r a n ke i n   t h e   t h i r o r de r.     T h e   r a nki n g   v a l ue s   a r e   s h o w n   i n   t h e   t hi r d   r o w   ( R ( t i ,   c 1 ) ).   A f t e r   r a nki n g   v a l ue s   f o un d,   t h e   n o r m a l i z a t i o of  s uppo r t   c a n   b e   c a l c ul a t e d   f r o m   NS ( t i ,c k )   =   R ( t i ,   c k )   /   N ,   w h e r e   N   i s   t h e   n u m b e r   of   a l l   f e a t ur e s .   F o r   e xa m pl e ,   NS ( t 3 ,c 1 )   =   R ( t 3 ,   c 1 )   /   =   2/ =   0 . 33 .       T a b l e   2 .   T h e   ra n ki ng  v a l ue s   o f   f e a t ur e s   F e a t u r e   ( t i )   t 1   t 2   t 3   t 4   t 5   t 6   Cl a s s   ( c k )   S ( t i , c 1 )   2   3   2   3   1   2   c 1   R ( t i , c 1 )   2   1   2   1   3   2   c 1       3. 4 .     P ar am e t e r   tu n i n an d   w e i gh ti n g   c a l c u l ati o n     F i r s t ,   t h e   w e i ght   o f   e a c h   f e a t u r e   i c k   i s   c a l c ul a t e b a s e o i t s   n o r m a l i z e s u ppo r t   a nd  c o n f i de n c e .   A   t u n i n pa ra m e t e r   ( p i s   i nt r o duc e t o   b a l a n c e   t h e   s i g ni f i c a n c e   of   t h e   n o r m a l i z e s uppo rt   a nd  c o n f i de n c e .     p   i s   a   c o n s t a nt   v a l ue   (0  <   p   1 ) If   s upp o r t   i s   m o r e   s i g n i f i c a n t   t ha n   c o n f i de n c e p   i s   m o r e   t ha n   0 . 5,   a nd  l e s s   t h a 0 . o t h e r w i s e .       T h e   w e i ght   o f   f e a t ur e   t i   i c l a s s   c k   c a n   b e   e v a l ua t e us i n g   w ( t i ,c k )   =   p × NS ( t i ,c k )   ( 1 - p ) × C ( t i ,c k ) w h e r e   w ( t i ,c k )   i s   t h e   w e i ght   f e a t u r e   t i   i c l a s s   c k , F o r   e xa m p l e ,   i f   =   0 . 9 ,   t h e   w e i g h t   o f   fe a t ur e   t 3   i c 1   a n d   c 2   a r e   c a l c ul a t e a s   f o l l o w s .     w ( t 3 ,c 1 )   0 . 9 × NS ( t 3 ,c 1 )   +   ( 1 - 0. 9 ) × C( t 3 ,c 1 )   ( 0. 9 × 0 . 33)   +   (1 - 0. 9) × 0 . 667   =   0 . 427   w ( t 3 ,c 2 )   0 . 9 × NS ( t 3 ,c 2 )   ( 1 - 0. 9 ) × C ( t 3 ,c 2 )   ( 0. 9 × 0 . 33)   +   (1 - 0. 9) × 0. 50   0. 347   F i na l l y ,   t h e   f i na l   w e i g h t   o f   fe a t ur e   i s   de c i de by   t h e   m a x i m um   v a l ue   o f   t h e   w e i gh t   o f   fe a t u r e   t i   i c l a s s   c k W ( t i =   m a x ( w ( t i , c k )) .   F o r   e x a m pl e ,   t h e   f i n a l   w e i ght   o f   fe a t ur e     t 3   W ( t 3 )   =   m a x{ w ( t 3 ,   c 1 ) ,   w ( t 3 ,   c 2 )}   =   m a x{ 0 . 427 ,   0. 3 47 }   =   0. 427 .     3. 5 .     F e atu r e   r an k i n g   A l l   f e a t u r e s   i n   d a t a s e t   a r e   r a n ke by   t h e i r   f i na l   w e i ght s   i n   de s c e n di n o r de r.   T h e   f e a t u r e   w i t h     t h e   hi g h e s t   w e i ght   i s   t h e   f i r s t   r a n k   a nd  m e a n s   t h a t   i t   i s   t h e   m o s t   r e l e v a n t   f e a t u r e s .   T h e   s e t   o f   m os t   r e l e v a nt   f e a t ur e s   c a b e   s e l e c t e f r o m   t h e   r a n ke d   f e a t u r e s .       4.   EX P ER I M EN TA EV A LU A TI O N S     4 . 1 .     Ex p e r i m e n ta l   s e tu p   T h e   e xpe r i m e nt a l   da t a s e t s   w e r e   c o l l e c t e f r o m   t w i t t e r ,   a n c o m pri s e d   10, 000  i n s t a n c e s   f r o m   S t a n df o r t w i t t e r   s e n t i m e n t   da t a   (S T S )   [14] ,   4 , 000   i n s t a n c e s   f r o m   S e m E v a l - 20 17  T a s k4A   d a t a s e t   (S e m E v a l )   [15] ,   2, 600  i n s t a n c e s   f r o m   S e nt i m e nt   s t r e n g t t w i t t e r   d a t a s e t   (S S - T w e e t )   [16]   a n d   1, 00 i n s t a n c e s   f r o m   H CR  T w i t t e da t a s e t   [17] .   A l l   d a t a s e t s   a r e   p r e p r o c e s s e a s   i s ub s e c t i o n   3. 1.   T o   pe r f o r m   f e a t u r e   s e c t i o n   us i ng  In f o r m a t i o n   G a i n   (IG ) ,   C h i - S q ua r e (C hi 2) ,   a n G i ni   I n de x   (G i n i ) ,   t h e   da t a s e t s   a r e   t ra n s f o r m e i n   v e c t o r   s pa c e   m o de l .   A   do c um e n t   is   t ra n s f o r m e in t o   a   v e c t o r .   F o r   e a c v e c t o r ,   t h e   v a l ue   o f   f e a t ur e s   i s   1 ,     i f   t h e   f e a t ur e   o c c ur s   i n   t h e   do c u m e nt ,   o t h e r w i s e ,   0.   A l l   d a t a s e t s   ha v e   t w o   c l a s s e s ,   po s i t i v e   a n n e ga t i v e .   F i na l l y ,   t h e   c ha ra c t e ri s t i c s   o f   da t a s e t s   a r e   s h o w n   i n   T a b l e   3       T a b l e   3 .   T h e   c h a ra c t e ri s t i c s   o f   t h e   da t a s e t s   D a t a   s e t   N u m b e r   o c o m m e n t s   L a b e l   N u m b e r   o fe a t u re s   P o s i t i v e   Cl a s s   N e g a t i v e   Cl a s s   1 .   S T S   1 0 , 0 0 0   5 , 0 0 0   5 , 0 0 0   1 2 , 7 7 2   2 .   S e m E v a l   4 , 0 0 0   2 , 0 0 0   2 , 0 0 0   9 , 0 6 5   3 .   S S - T w i t t e r   2 , 6 0 0   1 , 3 0 0   1 , 3 0 0   6 , 8 4 5   4 .   H CR   1 , 0 0 0   500   500   1 , 8 6 7       Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   20 ,   N o .   2 N o v e m be r   20 20  :     96 0   -   96 7   964   F o r   e v a l ua t i ng  t h e   p r o po s e m e t h o a ga i n s t   IG ,   C hi 2 ,   a n G i n i ,   t h e   pe r f o r m a n c e   of   c l a s s i f i c a t i o n   a n c o m put a t i o n   t i m e   a r e   i n v e s t i ga t e i n   o ur   e xpe r i m e nt s .   F o r   i n v e s t i ga t i n pe r f o r m a n c e   of   c l a s s i f i c a t i o n,   t h e   n u m b e r   o f   s e l e c t e f e a t ur e s   i s   v a r i e d   f r o m   10 t o   90% .   T h e t h e y   a r e   i n v e s t i ga t e d   t o   c l a s s i fy   o pi n i o n   o r i e nt a t i o n   b y   us i n g   N a ï v e   B a y e s   t h a t   i s   a   s i m pl e   c l a s s i f i e r   a nd   e ff e c t i ve   i o pi ni o c l a s s i f i c a t i o n   [ 18 - 2 5 ].     10 - f o l c r o s s - v a l i da t i o n   i s   us e t o   di v i de   da t a s e t   t h e   e xpe r i m e n t s T h e   a v e r a ge   a c c ura c y   a n a v e ra ge     F - m e a s u r e   f o r   e a c c l a s s   a r e   us e t o   e v a l ua t e   t h e   p ro pos e m e t h o a ga i n s t   IG C h i 2 ,   a n d   G i ni .     T h e   c o m put a t i o n   t i m e   i s   e v a l u a t e f r o m   w e i ght i n g   c a l c u l a t i o a nd  f e a t u r e s   ra n ki ng     4 . 2   Ex p e r i m e n ta l   r e s u l ts   an d   d i s c u s s i o n   F i r s t ,   t h e   v a l ue s   o f   p   a r e   i n v e s t i ga t e t o   f i n d   t h e   b e s t   v a l ue s   fo r   gi v i n g   h i g h e s t   a c c ura c y .   In   T a b l e   4,   p   =   0. 8   gi v e s   t h e   hi g h e s t   a c c ura c y   o n   S e m E v a l   a n d   H CR   a n d   p   =   0. 9   gi v e s   t h e   hi g h e s t   s u ppo r t   o S T S   a n SS - T w e e t .   M o r e ov e r ,   t h e   r e s ul t   i s   s h o w n   t ha t   t h e   a c c u r a c y   i s   i n c r e a s e w h e n   t h e   p   v a l ue   i s   i n c r e a s e d.     It   m e a n s   t h a t   t h e   n o r m a l i z e s up po r t   i s   m o r e   i m po rt a nt   t h a c o n f i de n c e   i o pi n i o n   c l a s s i f i c a t i o n .       T a b l e   4 .   A c c ura c y   of   t h e   c l a s s i f i c a t i o n   f o r   e a c p   p   v a l u e   D a t a s e t   S T S   S e m E v a l   SS - T w e e t   H CR   p   =   0 . 1   5 8 . 9 3   7 7 . 7 1   5 5 . 0 4   7 3 . 4 1   p   =   0 . 2   6 0 . 1 9   8 0 . 5 2   5 5 . 4 9   7 3 . 9 1   p   =   0 . 3   6 2 . 5 8   8 3 . 8 3   5 6 . 4 7   7 5 . 6 4   p   =   0 . 4   6 6 . 1 5   8 5 . 8 7   5 8 . 0 4   7 7 . 3 0   p   =   0 . 5   6 9 . 3 0   8 6 . 8 2   5 9 . 3 3   7 8 . 9 8   p   =   0 . 6   7 1 . 1 4   8 7 . 2 2   6 0 . 6 0   8 0 . 0 4   p   =   0 . 7   7 2 . 1 0   8 7 . 4 3   6 1 . 0 2   8 0 . 2 0   p   =   0 . 8   7 2 . 2 3   8 7 . 4 4   6 1 . 4 1   8 0 . 4 4   p   =   0 . 9   7 2 . 2 8   8 7 . 4 1   6 1 . 4 2   8 0 . 2 2       T h e   pe r f o r m a n c e s   of   c l a s s i f i c a t i o n   o n   f o ur   da t a s e t s   a r e   r e p o r t e i n   T a b l e   5   t o   T a b l e   8.   I T a b l e   5 t h e   p r o po s e m e t h o gi v e s   t h e   hi g h e s t   a v e r a ge   a c c ur a c y   a n d   F - m e a s u r e   f o r   n e ga t i v e   c l a s s   o n   t h e   S T S   da t a s e t H ow e ve r ,   t h e   a v e r a ge   F - m e a s u r e   f o r   po s i t i v e   c l a s s   of  t he   pr o po s e m e t h o i s   s l i g h t l y   l ow e r   t ha n   t h o s e   G i n i ,   C h i a n IG .   I n   T a b l e   6 ,   t h e   p r o po s e m e t h o gi v e s   t h e   hi g h e s t   a v e r a ge   a c c ur a c y   a n F - m e a s u r e   f o r   bo t h   c l a s s   o n   t h e   S e m E v a l   d a t a s e t .   I T a b l e   7 ,   t h e   p r o po s e d   m e t h o gi v e s   t h e   h i g h e s t   a v e r a ge   a c c ura c y   a n F - m e a s u r e   f o r   t h e   n e ga t i v e   c l a s s   o n   SS - T w i t t e r   d a t a s e t .   H ow e ve r ,   i t   gi v e s   l o w e r   a v e ra ge   F - m e a s u r e   f o r     t h e   po s i t i v e   c l a s s   t ha n   o t h e r   m e t h o ds .   I n   T a b l e   8 ,   t h e   p r o pos e m e t h o gi v e s   h i g h e s t   a v e r a ge   a c c ura c y   a n d     F - m e a s u r e   fo r   t h e   n e ga t i v e   c l a s s   o n   t h e   H C R   da t a s e t .   H ow e v e r ,   t h e   a v e r a ge   F - m e a s u r e   fo r   t h e   po s i t i v e   c l a s s   i s   s l i g ht l y   l ow e r   t ha n   o t h e r   m e t h o ds .   F r o m   T a b l e   5   t o   T a b l e   8,   t h e y   a r e   s h o w n   t ha t   t h e   p r o po s e m e t h o pr o v i de s   h i g h e a c c ura c y   t h a n   G i n i ,   C hi a n IG .   F u rt h e r m o r e ,   t h e   p r o po s e m e t h o r e s ul t s   i n   t h e   h i g h e s t     F - m e a s u r e   fo r   t h e   n e g a t i v e   c l a s s .   T a b l e   r e po r t s   t h e   c o m put a t i o na l   t i m e   o t h e   pr o po s e m e t h o a ga i n s t   G i n i ,   C hi 2   a nd  IG .   I t   i s   s h o w n   t ha t   t h e   p r o po s e m e t h o d   o ut p e r f o r m s   G i ni ,   C hi 2   a nd  IG .     T h e r e f o r e ,   w e   c a n   c o n c l ude   t ha t   t h e   p r o po s e d   m e t h o s e l e c t s   m o s t   r e l e v a n t   f e a t u r e s   fo r   c l a s s i f i c a t i o n   w i t h   l o w e r   c o m put a t i o na l   t i m e   w h e n   c o m pa r e t o   G i n i ,   C h i a nd  IG .   M o r e o ve r ,   s uppo rt   v a l ue   o r   f r e que n c y   of   fe a t u r e   i s   s i g ni f i c a nt   f o r   s e l e c t i n g   r e l e v a nt   f e a t u r e .       T a b l e   5 P e r f o r m a n c e   o f   t h e   c l a s s i f i c a t i o n   o n   t h e   S T S   da t a s e t   N u m b e r   o f   S e l e c t e d   F e a t u r e s   A c c u ra c y   F - M e a s u re   (P o s i t i v e   Cl a s s )   F - M e a s u re   (N e g a t i v e   Cl a s s )   G i n i   Ch i 2   IG   P ro p o s e d   G i n i   Ch i 2   IG   P ro p o s e d   G i n i   Ch i 2   IG   P ro p o s e d   10%   7 1 . 1 6   7 1 . 0 5   7 1 . 0 6   7 1 . 9 1   7 2 . 4 7   7 2 . 3 7   7 2 . 5 5   7 2 . 6 3   7 0 . 0 7   6 9 . 9 5   6 9 . 8 6   7 1 . 2 7   20%   7 1 . 7 7   7 1 . 7 7   7 1 . 3 4   7 2 . 3 9   7 2 . 7 8   7 2 . 7 8   7 2 . 5 5   7 3 . 1 8   7 0 . 8 5   7 0 . 8 4   7 0 . 2 9   7 1 . 6 2   30%   7 1 . 4 3   7 1 . 4 5   7 1 . 1 8   7 2 . 1 3   7 2 . 7 1   7 2 . 7 2   7 2 . 6 2   7 2 . 7 1   7 0 . 4 4   7 0 . 4 8   7 0 . 1 1   7 1 . 5 9   40%   7 1 . 2 6   7 1 . 2 8   7 1 . 0 8   7 1 . 8 9   7 2 . 8 5   7 2 . 8 5   7 2 . 8 0   7 1 . 9 4   7 0 . 1 8   7 0 . 2 2   6 9 . 9 7   7 1 . 9 1   50%   7 1 . 2 1   7 1 . 2 5   7 1 . 0 5   7 1 . 9 5   7 2 . 9 7   7 2 . 9 9   7 2 . 8 8   7 1 . 2 8   7 0 . 0 2   7 0 . 0 7   6 9 . 7 9   7 2 . 6 5   60%   7 1 . 6 9   7 1 . 7 2   7 1 . 2 5   7 1 . 9 4   7 3 . 2 9   7 3 . 3 0   7 2 . 9 6   7 0 . 9 3   7 0 . 3 6   7 0 . 4 2   6 9 . 7 9   7 2 . 9 4   70%   7 1 . 6 6   7 1 . 6 6   7 1 . 5 4   7 2 . 2 7   7 3 . 1 1   7 3 . 1 1   7 3 . 1 2   7 2 . 1 1   7 0 . 2 9   7 0 . 2 9   7 0 . 0 3   7 2 . 5 0   80%   7 2 . 1 5   7 2 . 1 0   7 2 . 1 0   7 2 . 4 3   7 3 . 3 0   7 3 . 2 7   7 3 . 2 7   7 2 . 9 9   7 0 . 9 5   7 0 . 8 9   7 0 . 8 9   7 1 . 9 2   90%   7 2 . 2 5   7 2 . 2 5   7 2 . 2 7   7 2 . 3 0   7 3 . 2 0   7 3 . 2 0   7 3 . 2 1   7 3 . 2 5   7 1 . 2 7   7 1 . 2 7   7 1 . 3 0   7 1 . 3 2   A v g .   7 1 . 6 2   7 1 . 6 1   7 1 . 4 3   7 2 . 1 3   7 2 . 9 7   7 2 . 9 5   7 2 . 8 8   7 2 . 3 4   7 0 . 4 9   7 0 . 4 9   7 0 . 2 3   7 1 . 9 7       Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       O pi ni on   c l as s i f i c at i on  on  s o c i a l   n e t w or k   by   a   nov e l   f e at ur e   s e l e c t i o t e c hni q ue   ( A t c har C hoom po l )   965   T a b l e   6 .   P e r f o r m a n c e   o f   t h e   S e m E v a l   da t a s e t   N u m b e r   o f   S e l e c t e d   F e a t u r e s   A c c u ra c y   F - M e a s u re   (P o s i t i v e )   F - M e a s u re   (N e g a t i v e )   G i n i   Ch i 2   IG   P ro p o s e d   G i n i   Ch i 2   IG   P ro p o s e d   G i n i   Ch i 2   IG   P ro p o s e d   10%   8 6 . 6 8   8 6 . 6 8   8 6 . 6 8   8 7 . 1 8   8 6 . 5 5   8 6 . 5 5   8 6 . 5 1   8 7 . 1 2   8 6 . 7 7   8 6 . 7 7   8 6 . 8 5   8 7 . 1 8   20%   8 7 . 3 8   8 7 . 3 8   8 7 . 4 0   8 7 . 1 0   8 7 . 2 2   8 7 . 2 2   8 7 . 2 4   8 7 . 0 5   8 7 . 4 7   8 7 . 4 7   8 7 . 5 1   8 7 . 1 2   30%   8 6 . 9 5   8 6 . 9 5   8 7 . 3 8   8 7 . 3 8   8 6 . 8 2   8 6 . 8 2   8 7 . 2 7   8 7 . 3 6   8 7 . 0 6   8 7 . 0 6   8 7 . 4 7   8 7 . 3 5   40%   8 7 . 2 3   8 7 . 2 3   8 6 . 9 8   8 7 . 3 3   8 7 . 0 4   8 7 . 0 4   8 6 . 8 1   8 7 . 2 1   8 7 . 4 3   8 7 . 4 3   8 7 . 1 8   8 7 . 4 1   50%   8 7 . 0 0   8 7 . 0 0   8 6 . 9 5   8 7 . 5 0   8 6 . 7 8   8 6 . 7 8   8 6 . 7 3   8 7 . 1 9   8 7 . 2 7   8 7 . 2 7   8 7 . 2 3   8 7 . 7 6   60%   8 7 . 3 8   8 7 . 3 8   8 7 . 1 8   8 7 . 3 3   8 7 . 1 8   8 7 . 1 8   8 6 . 9 5   8 6 . 9 2   8 7 . 5 8   8 7 . 5 8   8 7 . 4 0   8 7 . 6 6   70%   8 7 . 4 8   8 7 . 5 0   8 7 . 2 3   8 7 . 6 3   8 7 . 2 4   8 7 . 2 6   8 7 . 0 0   8 7 . 3 4   8 7 . 6 7   8 7 . 7 0   8 7 . 4 2   8 7 . 8 6   80%   8 7 . 5 5   8 7 . 5 5   8 7 . 5 5   8 7 . 5 0   8 7 . 3 6   8 7 . 3 6   8 7 . 3 6   8 7 . 3 3   8 7 . 6 9   8 7 . 6 9   8 7 . 6 9   8 7 . 6 4   90%   8 7 . 6 8   8 7 . 6 8   8 7 . 6 8   8 7 . 6 8   8 7 . 5 6   8 7 . 5 6   8 7 . 5 6   8 7 . 5 6   8 7 . 7 6   8 7 . 7 6   8 7 . 7 6   8 7 . 7 6   A v g .   8 7 . 2 6   8 7 . 2 6   8 7 . 2 2   8 7 . 4 0   8 7 . 0 8   8 7 . 0 9   8 7 . 0 5   8 7 . 2 3   8 7 . 4 1   8 7 . 4 2   8 7 . 3 9   8 7 . 5 3       T a b l e   7 .   P e r f o r m a n c e   o f   t h e   S S - t w i t t e d a t a s e t   N u m b e r   o f   S e l e c t e d   F e a t u r e s   A c c   F - M e a s u re   (P o s i t i v e )   F - M e a s u re   (N e g a t i v e )   G i n i   Ch i 2   IG   P ro p o s e d   G i n i   Ch i 2   IG   P ro p o s e d   G i n i   Ch i 2   IG   P ro p o s e d   10%   5 9 . 3 1   5 9 . 2 3   5 8 . 3 5   6 0 . 9 2   6 3 . 6 9   6 3 . 6 2   6 3 . 5 7   6 2 . 2 9   5 5 . 0 1   5 4 . 9 4   5 3 . 3 8   5 9 . 6 4   20%   6 0 . 5 4   6 0 . 2 3   6 0 . 1 9   6 2 . 0 0   6 3 . 6 4   6 3 . 4 7   6 4 . 0 6   6 3 . 5 5   5 7 . 6 3   5 7 . 1 4   5 6 . 5 4   6 0 . 5 7   30%   6 0 . 1 9   6 0 . 2 3   6 0 . 3 8   6 1 . 7 7   6 3 . 7 5   6 3 . 8 2   6 4 . 7 1   6 2 . 5 0   5 7 . 0 6   5 7 . 0 4   5 6 . 6 1   6 1 . 1 9   40%   6 0 . 6 9   6 0 . 4 2   6 0 . 0 0   6 1 . 6 2   6 4 . 6 0   6 4 . 3 9   6 4 . 6 7   6 0 . 0 1   5 7 . 4 0   5 7 . 0 0   5 5 . 8 4   6 3 . 3 3   50%   6 1 . 1 2   6 1 . 0 8   6 0 . 6 5   6 1 . 2 7   6 5 . 1 4   6 5 . 0 7   6 5 . 3 3   5 8 . 0 2   5 7 . 3 5   5 7 . 3 3   5 6 . 0 2   6 4 . 2 3   60%   6 0 . 3 5   6 0 . 3 8   6 0 . 0 4   6 1 . 3 5   6 4 . 2 8   6 4 . 2 8   6 4 . 3 6   5 9 . 1 7   5 6 . 2 3   5 6 . 2 9   5 5 . 4 9   6 3 . 4 6   70%   6 0 . 7 3   6 0 . 5 8   5 9 . 8 8   6 0 . 8 5   6 4 . 2 5   6 4 . 0 3   6 3 . 8 8   6 0 . 9 4   5 6 . 9 0   5 6 . 8 3   5 5 . 5 2   6 0 . 9 1   80%   6 0 . 5 4   6 0 . 5 8   6 0 . 5 8   6 0 . 9 6   6 3 . 8 3   6 3 . 8 5   6 3 . 8 5   6 3 . 0 7   5 6 . 9 7   5 7 . 0 4   5 7 . 0 4   5 8 . 8 9   90%   6 0 . 1 2   6 0 . 1 2   6 0 . 1 2   6 0 . 1 2   6 3 . 2 3   6 3 . 2 3   6 3 . 2 3   6 3 . 2 3   5 6 . 7 3   5 6 . 7 3   5 6 . 7 3   5 6 . 7 3   A v g .   6 0 . 4 0   6 0 . 3 2   6 0 . 0 2   6 1 . 2 1   6 4 . 0 5   6 3 . 9 7   6 4 . 1 8   6 1 . 4 2   5 6 . 8 1   5 6 . 7 0   5 5 . 9 1   6 0 . 9 9       T a b l e   8 .   P e r f o r m a n c e   o f   t h e   H CR   da t a s e t   N u m b e r   o f   S e l e c t e d   F e a t u r e s   A c c   F - M e a s u re   (P o s i t i v e )   F - M e a s u re   (N e g a t i v e )   G i n i   Ch i 2   IG   P ro p o s e d   G i n i   Ch i 2   IG   P ro p o s e d   G i n i   Ch i 2   IG   P ro p o s e d   10%   7 5 . 8 0   7 6 . 0 0   7 6 . 5 0   7 7 . 5 0   7 6 . 3 5   7 6 . 4 8   7 6 . 9 6   7 7 . 8 8   7 6 . 8 0   7 7 . 1 7   7 7 . 7 0   7 7 . 5 4   20%   7 8 . 4 0   7 8 . 5 0   7 7 . 9 0   7 8 . 1 0   7 8 . 5 5   7 8 . 5 6   7 8 . 1 7   7 8 . 8 2   7 8 . 9 9   7 9 . 2 0   7 8 . 5 5   7 8 . 0 1   30%   8 0 . 1 0   8 0 . 3 0   7 9 . 5 0   7 9 . 0 0   8 0 . 6 1   8 0 . 7 4   7 9 . 8 2   7 9 . 2 5   8 0 . 1 7   8 0 . 3 8   7 9 . 8 0   7 9 . 2 2   40%   8 0 . 4 0   8 0 . 5 0   8 1 . 2 0   8 0 . 1 0   8 1 . 0 6   8 1 . 1 6   8 1 . 7 8   8 0 . 5 6   8 0 . 1 0   8 0 . 1 6   8 1 . 0 1   7 9 . 8 2   50%   8 1 . 2 0   8 1 . 2 0   8 1 . 1 0   8 0 . 8 0   8 2 . 0 2   8 1 . 9 4   8 1 . 9 7   8 1 . 2 4   8 0 . 7 6   8 0 . 7 1   8 0 . 6 5   8 0 . 3 8   60%   8 1 . 7 0   8 1 . 6 0   8 1 . 8 0   8 2 . 8 0   8 2 . 5 7   8 2 . 4 6   8 2 . 5 7   8 2 . 9 4   8 1 . 2 2   8 1 . 1 4   8 1 . 3 5   8 2 . 7 3   70%   8 2 . 9 0   8 2 . 7 0   8 2 . 2 0   8 2 . 2 0   8 3 . 5 4   8 3 . 2 8   8 3 . 0 2   8 2 . 6 2   8 2 . 4 4   8 2 . 2 7   8 1 . 5 8   8 1 . 8 3   80%   8 1 . 6 0   8 1 . 7 0   8 1 . 5 0   8 2 . 9 0   8 2 . 4 4   8 2 . 5 1   8 2 . 3 6   8 3 . 3 2   8 0 . 6 8   8 0 . 8 0   8 0 . 5 8   8 2 . 5 5   90%   8 1 . 9 0   8 1 . 9 0   8 1 . 9 0   8 2 . 2 0   8 2 . 7 5   8 2 . 7 5   8 2 . 7 5   8 2 . 9 5   8 0 . 9 1   8 0 . 9 1   8 0 . 9 1   8 1 . 3 7   A v g .   8 0 . 4 4   8 0 . 4 9   8 0 . 4 0   8 0 . 6 2   8 1 . 1 0   8 1 . 1 0   8 1 . 0 4   8 1 . 0 6   8 0 . 2 3   8 0 . 3 1   8 0 . 2 4   8 0 . 3 8       T a b l e   9 .   Co m pu t a t i o n a l   t i m e   f o r   f e a t ur e   r a nki n g   ( s e c o n d)     G i n i   Ch i 2   IG   P ro p o s e d   S T S   3 . 1 4 9   2 . 9 2 3   3 . 5 1 2   2 . 8 4 4   S e m E v a l   0 . 9 1 1   0 . 8 2 8   0 . 9 1 5   0 . 6 8 7   SS - T w i t t e r   0 . 4 6 8   0 . 4 6 7   0 . 4 7 8   0 . 3 5 9   H CR   0 . 0 7 1   0 . 0 9 7   0 . 0 7 0   0 . 0 5 3       5.   C O N C LU S I O N     F e a t u r e   s e l e c t i o n   i s   a i m po r t a nt   p r o c e s s   t o   r e duc e   t h e   f e a t u r e s   a n d   i m p r o v e   t h e   pe r f o r m a n c e   o o pi n i o n   c l a s s i f i c a t i o n .   A   f e a t ur e   s e l e c t i o n   m e t h o i s   pr o po s e b a s e o n   t h e   c o n c e pt   of   f i l t e r   m o de l t o ge t h e w i t h   a s s o c i a t i o n   r u l e   t e c hn i que s .   S uppo rt   a n c o n f i de n c e   v a l ue s   a r e   a ppl i e t o   c a l c ul a t e d   w e i ght   o f e a t ur e .   S uppo r t   v a l ue s   a r e   n o r m a l i z e t o   r e m o v e   o ut l i e r s M o r e o ve r ,   a   t u ni n g   pa ra m e t e r   p   is   p r e s e n t e t o   b a l a n c e     t h e   s i g n i f i c a n c e   o f   t h e   n o rm a l i z e s u ppo r t   a nd  c o n f i de n c e .   T h e   e xpe ri m e nt a l   r e s ul t s   s h o w   t ha t   t h e   s uppo r t   o r   f r e que n c y   of   fe a t ur e   ha s   s i g ni f i c a n t   f o r   f e a t u r e   s e l e c t i o n .   T h e   p r o po s e a l go r i t hm   g i v e s   hi g h e r   a c c ur a c y   t h a n   G i ni ,   C h i a nd  IG   b e c a us e   i t   c a n   f i nd  m o s t   r e l e v a n t   f e a t u r e s   t ha t   l e a t o   h i g h   pe r f o r m a n c e   o f   c l a s s i f i c a t i o n .   M o r e ov e r ,   t h e   c o m put a t i o n   t i m e   of  t h e   pr o p o s e m e t h o i s   t h e   b e s t   w h e n   c o m pa r i ng  G i n i ,   Chi 2   a n d   IG   b e c a us e   t h e   w e i ght s   o f   f e a t ur e s   a r e   qui c kl y   a n e a s i l y   c a l c ul a t e o v e r t i c a l   da t a   f o r m a t .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   20 ,   N o .   2 N o v e m be r   20 20  :     96 0   -   96 7   966   A C K N O WL ED G E M EN TS     T h e   a ut h o r s   a r e   v e r y   gr a t e f ul   t o   t h e   D e pa rt m e n t s   o f   In fo r m a t i o n   T e c hn o l o g y ,   M a ha s a ra k ha m   U n i v e r s i t y   a nd  K a l a s i n   U n i v e r s i t y   fo r   s uppo r t i n g   t hi s   r e s e a r c h.       R EF ER EN C ES     [ 1]   S .   S a ng a m   a nd  S .   S h i nde ,   S e n t i m e nt   c l a s s i f i c a t i o o f   s oc i a l   m e di a   r e v i e w s   us i ng   a e ns e m bl e   c l a s s i f i e r ,   I ndo ne s i an   J our nal   o f   E l e c t r i c a l   E ngi ne e r i ng   and   C om p ut e r   Sc i e nc e ,   v o l .   16 ,   no .   1,   p p .   355 - 3 63 2 019 .   [ 2]   C .   T r o us s a s ,   e t   a l . S e nt i m e n t   a na l y s i s   o f   F a c e bo o s t a t us e s   u s i ng   N a i v e   B a y e s   c l a s s i f i e r   f o r   l a ng ua g e   l e a r n i ng ,   i n   2013   F our t h   I nt e r n at i on al   C on f e r e nc e   on   I nf o r m a t i o n,   I nt e l l i ge nc e ,   Sy s t e m s   and   A p pl i c a t i ons   ( I I SA ) ,   pp .   1 - 6 201 3 .   [ 3]   M .   A nj a r i a   a nd  R .   M .   R .   G u dde t i ,   I nf l ue nc e   f a c t o r   ba s e o pi ni o m i ni ng   o f   T w i t t e r   d a t a   us i ng   s upe r v i s e d   l e a r n i ng ,   i n   20 14  Si x t h   I nt e r n at i ona l   C on f e r e nc e   on  C om m u n i c a t i on  Sy s t e m s   a nd  N e t w or k s   ( C O M SN E T S)   pp.   1 - 8 2 014 .   [ 4]   A .   O r t i g o s a ,   e t   a l . S e n t i m e n t   a na l y s i s   i F a c e bo o a nd   i t s   a p pl i c a t i o t o   e - l e a r ni ng ,   C om put e r s   i H um an   B e hav i o r ,   v o l .   3 1,   pp .   527 - 54 1,   20 14 .   [ 5]   A .   A de l e ke ,   e t   a l . A   t w o - s t e f e a t ur e   s e l e c t i o m e t ho f o r   qur a ni c   t e xt   c l a s s i f i c a t i o n,   I ndo ne s i an  J ou r na l   of   E l e c t r i c al   E ng i ne e r i ng   a nd  C om pu t e r   S c i e nc e ,   v o l .   1 6,   no .   2 ,   p p.   7 3 0 - 736,   20 19.   [ 6]   T .   A .   A l ha j ,   e t   a l . F e a t ur e   S e l e c t i o U s i ng   I nf o r m a t i o G a i f o r   I m pr o v e S t r uc t ur a l - B a s e A l e r t   C o r r e l a t i o n,   P l oS  one ,   v o l .   11, no .   1 1,   p .   e 01 6601 7,   20 16.   [ 7]   T .   P a r l a r ,   e t   a l . Q E R :   a   ne w   f e a t ur e   s e l e c t i o n   m e t ho f o r   s e nt i m e nt   a n a l y s i s ,   H um an - C e nt r i c   C om pu t i n and   I nf or m a t i on  Sc i e nc e s ,   v o l .   8 ,   201 8.   [ 8]   A .   I .   P r a t i w i   a nd   A di w i j a y a ,   O t h e   F e a t ur e   S e l e c t i o a n C l a s s i f i c a t i o B a s e o I nf o r m a t i o G a i f o r   D o c um e nt   S e nt i m e n t   A na l y s i s ,   A p pl i e C om p ut a t i ona l   I n t e l l i ge nc e   and   So f t   C om put i ng ,   v o l .   20 18 ,   p p.   1 - 5 ,   2 018 .   [ 9]   J .   Y a ng ,   e t   a l . A   ne w   f e a t ur e   s e l e c t i o b a s e o c o m pr e he n s i v e   m e a s u r e m e nt   bo t i i n t e r - c a t e g o r y   a nd  i n t r a - c a t e g o r y   f o r   t e xt   c a t e g o r i z a t i o n,   I nf or m a t i on   P r oc e s s i ng   and   M an a ge m e nt v o l .   48,   no .   4 ,   pp.   7 41 - 754 ,   2012 .   [ 10]   X .   D e ng ,   e t   a l . F e a t ur e   s e l e c t i o f o r   t e x t   c l a s s i f i c a t i o n:   A   r e v i e w ,   M u l t i m e di a   T o ol s   a nd  A ppl i c at i on s ,   v o l .   78 ,   pp.   37 97 - 3816 ,   2 01 9.   [ 11]   O .   S o m a nt r i   a nd  D .   A pr i l i a n i ,   O p i n i o M i n i ng   o C ul i na r y   F o o d   C us t o m e r   S a t i s f a c t i o U s i ng   N a ï v e   B a y e s   B a s e d - o H y br i F e a t ur e   S e l e c t i o n,   I nd one s i a J our nal   o f   E l e c t r i c al   E ng i ne e r i ng  an C om put e r   Sc i e nc e ,   v o l .   15,   no .   1 ,   pp.   4 68 - 475 ,   2019 .   [ 12]   N.   S .   I .   M .   R a f e i ,   e t   a l . C o m pa r i s o o f   f e a t ur e   s e l e c t i o t e c hni qu e s   i c l a s s i f y i ng  s t r o ke   do c um e nt s ,   I ndone s i an   J our nal   o f   E l e c t r i c a l   E ngi ne e r i ng   and   C om p ut e r   Sc i e nc e ,   v o l .   14 ,   n o .   3,   p p.   12 44 - 1250 ,   201 9.   [ 13]   N .   M .   G .   D .   P ur n a m a s a r i ,   e t   a l . ,   C y be r bul l y i ng   i de nt i f i c a t i o n   i t w i t t e r   us i ng   s uppo r t   v e c t o r   m a c hi ne   a nd   i nf o r m a t i o g a i b a s e f e a t u r e   s e l e c t i o n,   I nd one s i a J our nal   o f   E l e c t r i c al   E ng i ne e r i ng  and   C om pu t e r   S c i e nc e ,   v o l .   18,   no .   3 ,   pp.   1 494 - 150 0,   20 20 .   [ 14]   A .   G o ,   e t   a l . T w i t t e r   s e nt i m e n t   c l a s s i f i c a t i o us i ng   di s t a n t   s up e r v i s i o n,   S t a nf o r d   U ni v e r s i t y ,   pp .   1 - 6,   200 9.   [ 15]   S .   R o s e n t ha l ,   e t   a l . S e m E v a l - 20 17  T a s 4:   S e nt i m e nt   A na l y s i s   i n   T w i t t e r ,   P r oc e e di ng s   o f   t he   11t h   I n t e r na t i ona l   W or k s hop   on   Se m ant i c   E v al u at i on   ( Se m E v al - 20 17) ,   pp .   502 - 518 2 017 .   [ 16]   M .   T he l w a l l ,   e t   a l . S e n t i m e n t   s t r e ng t d e t e c t i o f o r   t he   s o c i a l   w e b ,   J ou r na l   o f   t he   Am e r i c an   Soc i e t y   f o r   I nf or m a t i on   Sc i e nc e   and   T e c hn ol o gy v o l .   63 ,   pp .   1 63 - 173 ,   2012 .   [ 17]   M .   S p e r i o s u ,   e t   a l . T w i t t e r   po l a r i t y   c l a s s i f i c a t i o w i t l a b e l   p r o pa g a t i o o v e r   l e x i c a l   l i n ks   a n t h e   f o l l o w e r   g r a ph ,   T he   P r o c e e d i ng s   o f   t he   F i r s t   W or k s ho p   on   U n s u pe r v i s e d   L e a r n i n g   i n   N L P ,   E d i n b u r g h ,   S c o t l a nd ,   p p .   5 3 - 63 ,   2 01 1 .   [ 18]   Y .   L .   P hua ,   S o c i a l   M e di a   S e n t i m e n t   A na l y s i s   a nd  T o pi c   D e t e c t i o n   f o r   S i ng a po r e   E ng l i s h ,   M a s t e r ' s   T he s i s ,   N a v a l   P o s t g r a dua t e   S c ho o l ,   2 013 .   [ 19]   F .   H e m m a t i a n   a nd  M .   K .   S o hr a b i ,   A   s ur v e y   o c l a s s i f i c a t i o t e c hni q ue s   f o r   o pi ni o n   m i n i ng   a nd  s e nt i m e n t   a na l y s i s ,   A r t i f i c i al   I nt e l l i ge nc e   R e v i e w ,   v o l .   5 2,   pp .   149 5 - 1545 ,   20 1 9 .   [ 20]   M .   B i l a l ,   e t   a l . S e n t i m e n t   c l a s s i f i c a t i o o f   R o m a n - U r du  o pi ni o ns   us i ng   N a ï v e   B a y e s i a n,   D e c i s i o T r e e   a nd   K N N   c l a s s i f i c a t i o t e c hni q ue s ,   J o ur na l   of   K i ng  S aud   U ni v e r s i t y   -   C om put e r   and   I n f o r m at i on   S c i e nc e s ,   v o l .   2 8,     no .   3 ,   pp.   3 30 - 344 ,   2016 .   [ 21]   K .   M .   A .   H a s a n ,   e t   a l . O p i ni o m i ni ng   us i ng   N a ï v e   B a y e s ,   2015  I E E E   I n t e r nat i on al   W I E   C o nf e r e nc e   on   E l e c t r i c al   an C om put e r   E ng i ne e r i ng ,   pp .   511 - 51 4,   20 15.   [ 22]   H .   P a r v e e a nd  S .   P a nd e y ,   S e nt i m e nt   a na l y s i s   o T w i t t e r   D a t a - s e t   us i ng   N a i v e   B a y e s   a l g o r i t hm ,   I n t e r nat i on al   C onf e r e nc e   on   A p pl i e an T he or i c a l   C om put i ng   a nd   C om m un i c a t i on  T e c h nol ogy ,   pp .   4 16 - 419 ,   201 6.   [ 23]   A .   G o e l ,   e t   a l . R e a l   t i m e   s e n t i m e nt   a n a l y s i s   o f   t w e e t s   us i ng   N a i v e   B a y e s ,   201 2nd  I n t e r na t i ona l   C onf e r e nc e   on  N e x t   G e ne r at i on   C om pu t i ng   T e c hno l og i e s ,   p p.   25 7 - 261,   2 016 .   [ 24]   R .   A .   R a m a dha ni ,   e t   a l . C o m pa r i s o o f   N a i v e   B a y e s   s m o o t hi ng   m e t ho ds   f o r   T w i t t e r   s e n t i m e nt   a n a l y s i s ,   i 201 6   I nt e r n at i on al   C on f e r e nc e   on   A dv anc e d   C om pu t e r   S c i e nc e   and   I n f o r m at i on  Sy s t e m s   ( I C A C SI S) ,   pp.   2 87 - 292 2016 .   [ 25]   A .   P r a bha t   a nd  V .   K hu l l a r ,   " S e n t i m e nt   c l a s s i f i c a t i o o bi g   da t a   us i ng   N a ï v e   ba y e s   a nd  l o g i s t i c   r e g r e s s i o n , "   i 20 17   I nt e r n at i on al   C on f e r e nc e   on   C om pu t e r   C om m un i c a t i on  and   I nf o r m at i c s   ( I C C C I ) ,   p p.   1 - 5 ,   2 017 .             Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       O pi ni on   c l as s i f i c at i on  on  s o c i a l   n e t w or k   by   a   nov e l   f e at ur e   s e l e c t i o t e c hni q ue   ( A t c har C hoom po l )   967   B I O G R A P H I ES   O F   A U T H O R S       A t c h a r C h o o m p o l   ha s   be e a   P h . D .   s t ude nt   a t   t h e   F a c ul t y   o f   I n f o r m a t i c s ,   M a h a s a r a k ha m   U ni v e r s i t y   ( M S U )   T ha i l a nd  s i nc e   201 4.   S h e   o bt a i ne he r   m a s t e r s   d e g r e e   i I nf o r m a t i o n   T e c hno l o gy   a t   K i ng   M o n g kut ' s   I ns t i t ut e   o f   T e c hno l ogy   N o r t B a ng ko k   ( K M U T N B )   T ha i l a n d .   H e r   r e s e a r c i nc l ud e s   m a c hi n e   l e a r ni ng ,   da t a   m i ni ng ,   t e x t   c l a s s i f i c a t i o a nd   f e a t ur e   s e l e c t i o n.         P an i d a   S o n gr am   i s   c ur r e n t l y   a A s s i s t a n t   P r o f e s s o r   a t   t he   F a c ul t y   o f   I nf o r m a t i c s ,   M a h a s a r a kha m   U ni v e r s i t y   ( M S U ) ,   T h a i l a n d.           P h a t t ah an ap h o n C h o m p h u w i s e t   i s   c ur r e nt l y   a A s s i s t a nt   P r o f e s s o r   a t   t he   F a c ul t y   of   I n f o r m a t i c s ,   M a ha s a r a kh a m   U n i v e r s i t y   ( M S U ) ,   T ha i l a nd .     Evaluation Warning : The document was created with Spire.PDF for Python.