I n d on e s ian   Jou r n al   o f   E lec t r ica l   E n gin e e r in a n d   Com p u t e r   S c ience   Vo l .   25 ,   N o .   2 F e b r ua r y   2022 ,   pp.   1199 ~ 1207   I S S N:  2502 - 4752,   DO I 10 . 11591/i j e e c s . v 25 .i 2 . pp 1199 - 1207             1199       Jou r n al  h o m e page ht tp: // ij e e c s . iaes c or e . c om   S oc ia c y b e r - c r im i n al , t ow ar d s au t o m at ic  r e al  t im e   r e c ogn it io n   of  m a li c io u p ost s on  T w itt e r       Yas s e r   I b r ah i m   Abd e lm on e m   A l i ,   M oh am m e d   Abd e l   Ra z e k ,   Nas s e r   E l - S h e r b e n y   M a th e ma ti c  a nd   C omput e r  S c i e nc e  D e pa r tm e nt , F a c ul t y   of   S c i e n c e , A z ha r   U ni ve r s it y , C a ir o E g y pt       Ar t ic l e   I n f o     AB S T RA CT   A r ti c le  h is tor y :   R e c e i ve Ju n   29 2021   R e vi s e De c   1 2021   A c c e pt e De c   9 2021       E as y   a cce s s   t o   t h i n t e rn e t   t h r o u g h o u t   t h e   w o r l d   h as   fu l l y   r e fo r med   t h e   u s ag o s o ci al   co mm u n i c at i o n   s u c h   as   Face b o o k ,   T w i t t e r,   L i n k e d   In   w h i ch   are  b e co m i n g   p art   o o u l i f e .   A cco rd i n g l y ,   cy b e r c r i me  h as   b e c o me   v i t al   p ro b l em ,   e s p eci al l y   i n   d e v el o p i n g   co u n t ri e s .   T h d i s s emi n at i o n   o f   i n fo r m at i o n   w i t h   n o   ri s k   o f   b ei n g   d i s c o v e r e d   an d   f e t c h ed   l e a d s   t o   a n   i n c r e as i n   cy b e r - c r i m i n al .   M e an w h i l e,   t h e   h u g e   a mo u n t   o f   d at c o n t i n u o u s l y   p ro d u ce d   fr o m   T w i t t e m a d e   t h e   d i s c o v e r y   p ro ce s s   o f   cy b e r - c ri mi n a l s   i s   t o u g h   as s i g n men t .   T h i s   r e s e ar ch   w i l l   c o n t ri b u t e   i n   d e t erm i n e d   o n   t h e   b u i l d   t h e   c o m p arab l e   v ec t o rs   fo (p o s i t i v e   an d   n eg at i v e   cl as s e s an d   t h e n   t h cl as s i f y   i n c o mi n g   t w ee t s   t o   p r e d i c at e   h i s   cl as s   (p o s i t i v o r   n eg at i v e ).   T h p ro p o s e d   r o u t i n e s   s t ari n g   w i t h   t h c o n s t ru c t   s u p e r   c o m p arab l e   v ec t o rs   (SCV )   (p o s i t i v an d   n e g at i v e   v ec t o rs ),   an d   t h co n s t ru c t   v ec t o fo r   t h e   i n co m i n g   t w ee t ,   an d   t h en   c al cu l at e   s i m i l ari t i e s   w i t h   b o t h   SCV   an d   co m p are   c a l c u l at ed   s i mi l ari t i e s   t o   p r e d i c at e   cl as s   o i n co m i n g   t w ee t .   In   t h i s   re s e arch ,   w u s e d   s o me   c o mmo n   t ech n i q u e s   fo c a l c u l at i n g   t h e   w e i g h t   o t e rm s   i n   t w ee t s   t o   c o n s t ru c t   SCV .   T o   en s u r e   t h e   s u cce s s fu l   o p e rat i o n   o t h e   p ro p o s ed   s y s t em ,   w e   p e rfo r me d   p i l o t   an al y s i s   o n   r e al   e x am p l e   o an   e x am i n at i o n .   R e s e ar ch   Im p ro v e s   p reci s i o n ,   r ec al l ,   an d   F1   v al u e s   b y   8 7 % ,   5 9 % ,   6 9 . 9 9 % ,   re s p ec t i v el y .   K e y w o r d s :   C y be r - c r i m i na l   Do m i na n t   m e a ni ng   M a l i c i o us   po s t s   o n   T wi t t e r   T e r m   f r e que nc y   T F   i nv e r s e   do c u m e n t   f r e que n c y   Th i s   i s   a n   o p en   a c ces s   a r t i c l u n d e r   t h CC  B Y - SA   l i cen s e.     C or r e s pon din A u th or :   Ya s s e r   I b r a him   Ab d e l m o ne m   Ali   M a t h e m a t i c   a n C o m put e r   S c i e n c e   De pa r t m e n t ,   F a c u l t y   o f   S c i e n c e ,   Az h a r   uni ve r s i t y   Na s r   C i t y , 11884,   C a i r o ,   E gy pt   E m a i l y a s s e r . i b r a him @a z h a r . e du. e g       1.   I NT RODU C T I ON   T h e   a i m   o f   c y be r s e c ur i t y   i s   t o   s e c ur e   pr o c e s s e s ,   ha r dwa r e ,   s o f t wa r e ,   a n i nf o r m a t i o n   c o m po n e n t s   o f   c o m put e r   s y s t e m s   dur i n g   o nli ne   s e s s i o n   f r o m   s t e a l i ng,   h a r m ,   i n t e r r upt i o n ,   a n il l e ga l   u s e .   I pr e s e n t   e r a ,   s o c i a l   ne t wor i s   t h e   pa r t   a n pa r c e l   i e v e r y da l i f e .   E a s y   a c c e s s   t o   i n t e r n e t   t h r o ugh   t h e   wo r l ha s   f u ll y   r e f o r m e t h e   us a ge   o f   s o c i a l   c o m m u ni c a t i o n   s uc h   a s   F a c e b o o k ,   T wi t t e r ,   L i n ke d - I n   w hi c h   a r e   b e c o m in a   pa r o f   o ur   l i f e .   A c c o r d i n g ly ,   c y be r c r im e   h a s   b e c o m e   a   vi t a l   pr o bl e m ,   e s pe c i a ll y   i a   de v e l o p i ng  c o un t r y .   On e   o f   t h e s e   c y be r c r im e s   i s   c y be r s e c ur i t y   i nf o r m a t i o n   w hi c h   c o n t a i ns   a   v a r i e t y   o f   u n o f f i c i a l   s o ur c e s ,   s uc a s   s o c i a m e d i a   p l a t f o r m s ,   c h a t   r oo m s ,   bl o gs ,   a n de ve l o p e r   f o r u m s .   T hi s   t y p e   k i n o f   c r i m e   pr o vi de s   i nf o r m a t i o n   a b o ut   s e c ur i t y   v u l ne r a bil i t i e s ,   t h r e a t s ,   a n a tt a c ks .   I n   o r de r   to  s e c ur e   t hi s   i n f o r m a t i o n ,   we   n e e r e a l - t i m e   i n t e ll i ge n c e .   O n   c y be r s e c ur i t y   t h r e a t s   a n v u l ne r a bil i t i e s .   T h e   pr o po s e a ppr o a c h   w i ll   c a r e f u ll y   e x a mi ne   a   n u m be r   o f   s t ud i e s   t h a t   ha v e   s ugg e s t e m o de l s   f o r   f ut ur e   c y b e r s e c ur i t y   t h r e a t s   a n a r e   ba s e o n   t i me  s e r i e s   a n m o vi n a v e r a ge s .   T h e r e   a r e   o ve r   150  mi l li o us e r s   wr i t e   o v e r   50 m il li o n   t we e t s   pe r   da y   f o r   t h e   y e a r   2019   [ 1] .   c o n s i de r e t e x t   c a t e g o r i z a t i o n   i s   ne c e s s a r y   t o   ge r e l e v a n t   i nf o   f r o m   s uc h   a   h uge   c o l l e c t i o n   t we e a n c o n v e r t   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i ,   Vo l .   25 ,   N o .   2 F e b r ua r y   20 22 1199 - 1207   1200   t h e   e n t i r e   l a r ge - s c a l e   i nf o r m a t i o n   i n t o   a   s m a ll   s i z e   s u b c a t e go r y .   I t   c a b e   c o n t r o l l e d   f o r   a n a ly s i s .   A s   a   r e s u l t ,   a tt e m pt s   h a v e   b e e n   m a de   t c l a s s i f y   t h e   t e x t   o f   t h e   t we e t   i n to   s e v e r a l   a r e a s   to   di s c o v e r   i nf o r m a t i o n   o n   a   pa r t i c u l a r   t o pi c .   T y p i c a l   e x a m p l e s   a r e   a   g e o l o c a t i o n   us e r   pr e d i c t i o n   t o   c a t e gor i z e   t we e t s   by   g e o - po l i t i c a l   l o c a t i o n   [ 2] .   Al s o ,   T w i tt e r   h a s   330  mi ll i o n   m o n t hly   us e r s   wo r l d w i de   [ 3] .   C o n s i de r e a s   T ur ke y   f if t h   c o un t r y   w i t m i ll i o n   a ppr o xi m a t e   c o n s i de r   a c t i ve   f r o m   J a n ua r y   2019  [ 4] .   P o l i t i c a l   p r e d i c t i n a f f i li a t i o n   by   r a t i ng  t we e t s   r e l a t e to   p o l i t i c s   [ 5] ,   a n pr e d i c t i n c r im e   c a t e go r i z e s   T w i t t e r   po s t s   b a s e o n   e m o t i o n   [ 6] .   Ho we v e r ,   t h e   r a t i n o f   d i f f i c u l t y   i t wi t t e r   p o s t s   i n   n a t ur e   b e c a us e   o f   t h e   l e n gt h   o f   t h e   t w i t t e r   p o s t s   i s   li mi t e d,   i . e . ,   un de r   280  c h a r a c t e r s ,   a n v a r i e t y pe s   o f   us e r s   e n ga ge   i n   i nf o r m a l   t we e t   wr i t i n [ 7] .   D i o ı s i o   e al .   [ 8] .   p r e s e n t s   n e m e t h o do l o g y   t o   i m pr o v e   t h e   s e a r c h   r e s u l t s .   H i s   pr o bl e m s   a r e   c y b e r a t t a c ki n i s   c o m m o n   a n bi i s s ue   be c a us e   t h e r e   a r e   m a ny   f l o w s   o f   d a t a   pr o duc e   s o c i a l   m e d i a   s uc h   a s   t wi t t e r ,   s o   m o s t   o r ga ni z a t i o n   r e s o r t   s e c ur i t y   i n f o r m a t i o n .   T h e s e   s y s t e m s   r e l y   o n   s y nc h r o ni z i ng  t he   l a t e s t ,   c o r r e c t i o n s ,   a s   we ll   a s   t h r e a t s   pr e s e n t e by   t h r e a t   f e e ds .   He   t r i e t pr o duc e   a   n e a r c hi t e c t ur e   s e pa r a t e i t h r e e   s t a ge s .   C o l l e c t   da t a   f r o m   T w i t t e r   by   u s i ng   T w i t t e r   a pp l i c a t i o n   pr o gr a m mi ng  i n t e r f a c e   ( A P I ) ,   a ppl f i l t e r s   a n n o r m a li z e s   t we e t s   o n   s pe c i f i c   f o r m a t .   App l y   b i na r y   c l a s s if i e r   l a b e l s   t o   c l a s s if y   f e t c h e t we e t s   i n t r e l e v a n t   o r   i r r e l e v a n t ,   r e l e va n t   I t   i s   po s s i b l e   t h a t   T we e t s   c o n t a i n   v a l ua bl e   i n f o r m a t i o n   a b o ut   a n   a s s e a n a r e   n o t   r e l a t e ot h e r w i s e .   F i na ll y ,   t h e   n a m e e n t i t y   r e c o gni t i o n   ( NE R )   n e t wo r p r o c e s s e s   t h e   r e l e v a n t   t we e t s   dur i n t h e   i nf o r m a t i o n   e x t r a c t i o n   s t a ge .   F o r   e x a m p l e ,   t h e   i nf o r m a t i o n   ga t h e r e c o u l b e   ut i li z e to   s e n o ut   a   s e c ur i t y   a l e r t .   Hi s   a ppr o a c h   r e s u l t s ,   t h e   pr o po s e p i pe li ne   a c hi e v e s   a   t r ue   r a t e   p o s i t i v e   o f   94%   o a ve r a ge   9 1%   r a t e   n e ga t i ve   f o r   r a t i n g   t a s a n F 1 -   s c o r e   92%   a v e r a ge   f o r   t a s e n t i t y   n a m e d   r e c o gni t i o n ,   vi a   3   i n f r a s t r uc t ur e s   to pi c a l   r e s e a r c h .   S a b o tt ke   e t   al.   [ 9]   s h o ws   a   v u l ne r a bil i t y   de t e c t i o n   s e r vi c e   b a s e o n   T w i tt e r   s ugge s t e us i n t h e   s uppo r t e v e c t o r   m a c hi ne   ( S VM )   c l a s s if i c a t i o n .   I t   c o ul d   b e   a bl e   t o   b e   e x p l o i t e d   i a   r e a l - li f e   s i t ua t i o n   a   f a s c i na t i n g   f e a t ur e   T h e   go a l   o f   t hi s   r e s e a r c h   i s   t o   l o o i n t o   a ggr e s s i ve   i n t e r f e r e n c e   a s   a   w a y   t o   t r i c t h e   c l a s s if i e r .   T h e s e   r e c r u i t e r s   m a y   pr o vi de   t h e   i nf o r m a t i o n   i n   a   m o r e   o r ga ni z e a n f o r m a l   w a y   a t   t h e i r   T w i tt e r   h e a dqu a r t e r s .   I t   t a ke s   a dv a n t a ge   o f   s o m e   o f   t h e   c h a r a c t e r i s t i c s   o f   t h e s e   e s s a y s ,   s uc h   a s   t h e i r   gr a mm a t i c a r e l a t i o n s hi p s   a n r e l a t i o ns hi p s .   I c o nj u n c t i o n   w i t h   t hi s   pr o po s a l ,   Z h o e al.   [ 10]   us e s   t h e   a r c hi t e c t ur e   o f   t h e   NE R   to   e x t r a c t   i n d i c a t o r s   o f   c o m pr o m i s e   ( I o C )   a c c o r di n t o   c y b e r s e c ur i t y   r e po r t s   i n   c o n t r a s t   to   t h e   de s i g n .   L i k e   t h e   o n e   b e a r i n g   h e r   n a m e .   B a d j a t i y a   e t   al.   [ 11]   e duc a t e   ot h e r   c us t o m e r s   o p i ni o n s   o f   c o p y r i g h t   o n   S e m E va l   2015  [ 12]   T wi t t e r .   T h e   o u t d oo r   e qui p m e n t   i n t r o duc e to  t h e   c h a ll e n ge   r a n ke f i r s t   i n   b o t h   mi s s i o n s .   B a d j a t i y a   e al.   [ 11]   pr e s e n t s   a n   e x a m p l e   w hi c h   i s   n o a s s e r t i v e   a s ,   b ut   i s   n o t   l i mi t e t o,   t h e   pa t h   o f   l e a r ni ng  f o r   t h e   a dvi c e   o f   t h e   f o s s il   i d i o t   wh o   l o ve s   y o to  h a t e .   T h e   a ut h o r s   r e por t   t h a l e a r ni ng  t e c hni que s   p l a y   a n   i m po r t a n t   r o l e   i n   e a t i n g.   R e ga r d i n t h e   a pp l i c a t i o n s   o f   l e a r ni ng  a pp li c a t i o n s ,   a pp l i c a t i o ns ,   a pp l i c a t i o ns ,   a pp l i c a t i o n s ,   a n a pp li c a t i o n s .   W a g ne r   e al.   [ 13]   l o n s h o r t - t e r m   m e m o r y   ( L S T M )   a r c hi t e c t ur e   im p l e m e n t e s e que nc i n g   t o   s us pe n d   m e d i c a l   e n t i t i e s   f o r   pu bli c   h e a l t m o ni t o r i n g.   T h e   a r c hi t e c t ur e   o f f e r e d   i s   s upe r i o r   to   t h e   pr e vi o us   c a s e .   A s   f a r   a s   t h e   f ut ur e   i s   c o n c e r n e d,   i n   r e l a t i o n   t o   t h e   i nf r a s t r uc t ur e   pr opo s e by   L a m p l e   e al.   [ 14] T h i s   i s   h o we   a do p t e d   o ur   N E R   a ppr o a c h   [ 15] .   As l a n   e al.   [ 16]   wor ks   o n   T wi t t e r   a s   e x a m p l e ,   t h e y   us e   m a c hi ne   l e a r ni n g   t e c hni que s ,   w hi c i nve s t i g a t e   i f   a c c o un t s   s o c i a l   m e d i a   we r e   im po r t a n c e   i t e r m s   o f   c y be r s e c ur i t y .   T h e y   us e d   t h e   P y t h o pr o g r a m mi ng  l a n gua g e   C r a w l e r   T w i t t e r   A P I   to   f i x   t h e i r   da t a s e t   f o r   us e   i t h e i r   r e s e a r c h .   Al ve s   e al [ 17]   t h e y   i n t r o duc e m a ny   o f   t e s t e d   t h e   qua n t i t a t i v e   e v a l ua t i o n   w i t h   e v e r y o ne   i n   mi nd  T w i t t e r   p o s t s   f r o m   80   a c c o un t s   o v e r   m o n t h s   ( a   tot a l   o f   195, 000  t we e ts ) ,   i t   s h o ws   t h a t   t h e i r   m e t h o do l o g y   c a m e   a t   t h e   r i gh t   t i m e   a n s uc c e s s f u ll y   f i nd   t h e   m o s t   s e c ur i t y - r e l a t e T we e t s   r e l a t e t o   t h e   I T   i nf r a s t r uc t u r e   e x a m p l e   ( v a l ue   o f   po s i t i v e   m e a s ur e   gr e a t e r   t h a n   90% ) ,   i n c o r r e c t l y   c h o o s e .   A   l i t t l e   n u m be r   o f   r e l a t e t we e t s   ( v a l u e   o f   f a l s e   po s i t i v e   m e a s ur e   l e s s   t h a n   10% ) .   Dua r t e   e al .   [ 18]   i n t r o duc i n a   n e m e t h o do l o g y   de v e l o pe d   f o r   t e x a n a l y s i s   i n   E n g l i s h   or   oth e r   wi de l y   s p oke n   l a n gu a ge s ,   s u c h   a s   P or tu gu e s e   us i n g   bi g   da ta   [ 1 9 ] .   J a v e d   e a l .   [ 2 0 ]   i n t r o duc e s   wha t   b e c a u s e   o f   t hi s   t y pe   o f   s h o r t c u t,   we   c a n   bl o c s u c h   h a r m f u l   we bs i t e s   by   c li c k i ng  o n   t h e m   a s   l o c ke r   we bs i t e s .   Kh a n dpur   e al .   [ 21]   s h o ws   a   ne s t ud y   o n   de t e c t i n c y be r - a tt a c ks   by   a na ly s i ng   T w i tt e r   da t a .   S o hi m e   e al .   [ 22]   s h o ws   if   t h e   i nve s t i ga t i o pe r i o i s   l o n g   e n o ugh ,   c y be r   a tt a c ke r s   ha v e   a n   a d v a n t a ge ,   whi c h   i s   a   d i f f i c u l t y   f o r   a   s e c ur i t y   a n a ly s t .   K e e u w i t h   t h e   l a t e s r i s k s .   W e   a im   i t hi s   r e s e a r c h   t o   pr o duc e   a   m i xe d   m e t ho d o l o g y   t o   o v e r c o m e   t h e   a b o v e   pr o bl e m ,   we   c a s u m m a r i z e   a s   t h e   f o l l o w i ng:      C o l l e c t   bi n a r y   c l a s s if i c a t i o n   da t a s e t .     C o l l e c t   f u ll   de s c r i pt i o n   f r o m   T w i t t e r   a ppl i c a t i o n   p r o g r a m mi ng  i n t e r f a c e   ( A P I )   f o r   e a c T we e t ,   s e pa r a t i o da t a s e i n t o   p o s i t i v e   a n n e g a t i v e   po c ke t s .     C o n s t r uc t   s upe r   c o m pa r a bl e   v e c t o r   ( S C V )   f o r   e a c h   po c ke t   to   ge n e r a t e   v e c to r   p o s i t i v e ,   a n ve c to r   n e ga t i v e .       C o n s t r uc t   v e c to r   f r o m   e n t i r e   T we e t .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       Soc ial   c y be r - c r iminal ,   to w ar d s   automati c   r e al  ti me   r e c ognit ion  of    ( Y as s e r   I br ahim  A bde lmone A li )   1201     C a l c u l a t e   s i m il a r i t i e s   b e t we e n   po s i t i v e   a n n e ga t i ve   v e c t o r s .       C o m pa r e   b e t we e n   r e s u l t s .   T h e   r e s t   o f   t hi s   s t ud y   i s   o r ga ni z e a s   f o ll o ws s e c t i o n   s h o ws   t h e   m e t h o do l o g y   a n d   t h e   pr o p o s e a l go r i t hm   w i t h   h o to   to  e nh a n c e   bi na r y   c l a s s if i c a t i o n   us i ng  W o r d2Ve c   m o de l .   S e c t i o n   3,   pr e s e n t s   t h e   e x pe r im e n t   a n s h o t h e   i m pr o v e h a ppe ne a f t e r   a pp l yi ng  o ur   pr o p o s e a l go r i t hm .   C o n c l us i o n   a nd  f ut ur e   pr o j e c t s   a r e   pr e s e n t e i n   s e c t i o n   4.       2.   M E T HO DOL OG Y   Our   m e t h e do l o g y   f o c us e s   o h o to   i m pr o v e   t he   a c c ur e c c y   r e s u l t s   o f   t h e   c l a s s i f i c a t i o m e t h o d.   T h e r f e r f o r e ,   i t   us e s   t wi t t e r   s o c i a l   n e t wo r a n bi na r y   c l a s s i f i e da t a s e t   to   whi c h   w i ll   b e   de s c r i be i n   t h e   l a t e r   s e c t i o n s .   W e   w il l   t a ke   a   t o u r   i n   o ur   pr o p o s e a l go r i t hm   w hi c h   r e s e a r c h   t r y   im p l e m e n t   to   a n s we r   s ugge s t   que s t i o ns .   Al s o ,   we   wi ll   d i s c us s   t h e   s ugge s t i o n   t e c hni que s   whi c h   r e s e a r c h   w il l   b e   im p l e m e n t .     2. 1.     Cl as s if i c at ion   al gor it h m   T hi s   s e c t i o n   t r i e s   t o   c o v e r c o m e   t h e   f o ll o w i ng   c ha l l e nge s   w hi c h   a r e   t h e   m a i pa r t   o f   t hi s   m e t h o do l o g y :     Ho to  e n h a nc e   bi na r y   c l a s s i f i c a t i o n   u s i ng  W o r d2Ve c   M o de l ?     Ho to  c o n s t r uc t   s upe r   c o m pa r a bl e   ve c t or   S C V?   I n   F i g u r e   1 ,   s h ow s   th e   p r op os e d   a l g or i th m   s ta g e s .   F i r s th i s   a l g or i th m   c o l l e c ts   m e ta - d a ta   ( f ul l   tw e e te x t   a n d   tags )   a b ou tw e e ts   by   us i n g   T wi tt e r   A P I   s e r vi c e   ( t h i s   s e r vi c e   p r o vi de d   by   T w i t te r   i t s e l f )   f or   w or ki n g   d a t a s e [ 2 3 ] .           F i gur e   1.   Al go r i t hm   s t a ge s       T hi s   da t a s e t   c o n s i s t s   o f   t h r e e   c l a s s if i e da t a s e t s   D 1 ,   D 2 ,   D 3 .   E a c h   r a da t a s e c o n t a i ns   t we e t - i d,   c l a s s if i e s t a t us   o nl y ,   s o   we   m u s t   c o l l e c t   ot h e r   d a t a   f r o m   T w i t t e r   A P I .   T h e   n e x t   s t e i s   to   s e pa r a te  da t a s e i n t o   t w o   po c ke t s   o n e   f o r   po s i t i ve   t we e t s   a n d   o t h e r   f o r   n e ga t i v e   po c ke t s   to   pr e pa r e   to   t h e   ne x t   s t e f o r   e a c po c ke t   ( p o s i t i v e   a n ne ga t i v e )   we   w il l   c o n s t r uc t   s upe r   v e c to r   c o m pa r a bl e ,   we   w il l   us e   s o m e   d i f f e r e n t   m e t h o do l o g i e s   t o   c o n s t r uc t   s upe r   c o m p a r a bl e   v e c to r   we   w i ll   de s c r i b e   i t s   l a t e r ,   n o we   w il l   b e   r e a d y   t c o m pa r e   e a c h   da t a s e t   w i t h   t w o   s upe r   v e c to r   c om pa r a bl e   ( po s i t i ve   a n n e g a t i ve )   by   us i ng  o u t p ut   o f   t h e   f o l l o w i n po c ke t s :            ,                                     As   s h o w i n i ve c t or i z e   l a y e r   t o   pr e pa r e   t h e   n e x t   s t e by   c a l c u l a t i n s im il a r i t y   b e t we e n   pr e vi o us   v e c to r s   we   h a v e   n e w   c l a s s   f o r   e a c t we e t   i n   D i ,   we   w il l   c o m p a r e   a   n e w   c l a s s   a n a c t ua l   c l a s s   t o   c a l c u l a t e   e f f i c ien c y   f o r   e a c h   m e t h o do l o g y .   W e   w il l   s h o o u r   a r c hi t e c t u r e   i n   de t a i l   i t h e   f o l l o w i ng  s e c t i o n s .   B ut   n o we   c a s u m m a r i z e   o ur   a r c hi t e c t ur e   a s   t h e   f o l l o w i ng  a l go r i t hm :   C la s s if ic a ti o   L a y e r   [ 4]   V e c t o r i z e   L a y e r   [ 3]   C la s s if ie d D a ta s e t   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i ,   Vo l .   25 ,   N o .   2 F e b r ua r y   20 22 1199 - 1207   1202     C o l l e c t   bi n a r y   c l a s s if i e da t a s e t .     C o l l e c t   f u l l   de s c r i pt i o n   f r o m   T w i t t e r   A P I   f o r   e a c h   T we e t.     S e pa r a t i o n   da t a s e t   i n to   p o s i t i v e   a n ne ga t i v e   po c k e t s .     C o n s t r uc t   s upe r   c o m pa r a bl e   v e c t o r   ( S C V )   f o r   e a c po c ke to   ge n e r a t e   V ( f o r   p o s i t i v e   po c ke t )   a n V ( f o r   n e ga t i v e   po c ke t ).     C o n s t r uc t   v e c to r   V f o r   tw e e t i .     C a l c u l a t e   S p i   a n S n i   (S p i   s im il a r i t y   be t we e n   V a n V &   S n i   s i mi l a r i t y   b e t we e n   V a n V n ).     C o m pa r e   b e t we e n   S p i   a n S n i   t pr e di c a t e   c l a s s   o f   t i .     2. 2.    Cl as s if i c at ion   m e t h od   W e   w il l   u s e   i n   o ur   pr o p o s a l   t h e   f o l l o w i ng  t e c h ni qu e   i n   v e c t o r i z e   a n c l a s s i f i c a t i o n   l a y e r s :     T e r m   f r e que nc y   t e c hni qu e   ( T F ) .     T e r m   f r e que nc y   i nve r s e   do c um e n t   f r e que nc y   t e c hni que   ( T F - I DF ) .     Do m i na n t   m e a ni ng  t e c h ni qu e .   W e   w il l   a dd  e x t r a   s t e i n   e a c h   a b o v e   t e c hni que ,   by   r e m o v e   dup li c a t e   di m e ns i o n   f r o m   b o t h   s upe r   v e c t or   c o m pa r a bl e   po s i t i v e   a n n e g a t i ve ,   t hi s   a dd i t i o n   w il l   g i ve   a   c h a n ge   i n   r e s u l t s   s i g ni f i c a n t l y .   F o r   c o n s t r uc t   s upe r   v e c t o r s   c o m pa r a bl e   f o r   po s i ti ve   a n d   n e ga t i v e   po c ke t s   by   m e r g i ng  a l l   t we e t s   i ns i de   e a c h   po c ke ( p o s i t i v e   a n n e ga t i v e )   a n c a l c u l a t e   we i g h t   o f   e a c h   t e r m   by   s o m e   t e c hni que ,   w i ll   de s c r i be   l a t e r .   T hi s   pr o c e s s   w i ll   pr o duc e   t w o   v e c to r s   p o s i t i ve   V a n ne ga t i v e   V pr e d i c a t i o n .   W e   w il l   u s e   s a me   t e c h ni que   t c o n s t r uc s upe r   c o m pa r a bl e   t c o n s t r uc t   V f o r   t we e t   t i ,   to   pr e pa r e   n e x t   s t e p.   C a l c u l a t e   S p i   a n S n i   s i mi l a r i t y   b e t we e n   t a n b o t h   V a n V by   us e r   E uc l i de a n   d i s t a n c e   e qua t i o n   a s   t h e   f o l l o w i ng:      =   ( , ) ,  =   ( , ) ,       wh e r e   i = 1, 2, 3, …, k   a n i s   da t a s e t   s i z e .         ( ,     ) =   .   |   | |   |         De pe n o n   S p i   a n S n i   we   w il l   ge t   t h e   c l a s s   o f   t to   c a l c u l a t e   e f f i c a c y .   No l e t   us   t a ke   s o m e   b r i e f   a b o ut   t h e   t e c h ni que s   whi c h   us i ng  i n   t hi s   pa pe r :     T e r m   f r e qu e n c y   ( T F )   t e c hni que   b y   c a l c u l a t e   r a t i o   o f   n u m be r   o f   t i m e s   t e r m   o c c ur r e n c e   a n t ot a l   n u mb e r   o f   t e r m s   i n   do c u m e n t .      ( ) =                                                 T e r m   f r e que nc y   i nve r s e   do c u m e n t   f r e que n c y   ( T F - I DF )   t e c hni que   li ke   T F   w i t h   c a nc e ll a t i o n   a ll   t e r m s   whi c h   o c c ur r e i n   a l l   do c u m e n t s .       ( ) =  ( ) . log   (                       )         Do m i na n t   m e a ni ng  m e t h o d,   whi c h   i s   we ll - k n o wn  T h e   s e t   o f   ke y wo r ds   t h a t   f i t   t h e   i n t e n d e m e a nin o f   t h e   t a r ge t   wor d”   [ 24] .   T h e   que s t i o n   i s   vi e we d   a s   a   go a l   m e a ni ng,   a s   we ll   a s   c e r t a i n   wo r ds   t h a t   f a ll   w i t hin  t h a t   m e a ni ng s   s c o pe .   I t   f r e e z e s   t h e   i n t e n de m e a ni ng,   k n o w n   a s   t h e   k e y wo r d,   t h e n   a dd s   o r   r e m o v e s   s l a v e   wo r ds   t h a t   e x p l a i t he   m e a ni ng   [ 25] ,   [ 26] .   T o   c on s t r uc t i n do m i na n t   m e a ni ng  hi e r a r c hi c a l ,   a s s u me  we   h a v e   a   da t a s e t   m a d e   up  o f   n ,   t h a t   C   =   { Ci } n i = 1   i s ,   f o r   e a c h   C f r o m   C   r e pr e s e n t e by   a   c o l l e c t i o n   o f   do c um e n t s   w hi c h   t r y i ng  t o   de s c r i b e   c o nc e pt   C i ,   s u ppo s e   t h a t   t h e   c o l l e c t i o n   c o ns i s t s   o f   m   do c u m e n t s ,   t h a i s   { C =   D i j ,   j   =   1,   2,   3,   . . . ,   m i } ,   e a c h   do c u m e n t   i n   t hi s   c o l l e c t i o n   c o ns i s t s   o f   a   s e t   o f   wo r ds   or   D i =   w i lj ,   l   =   1,   2,   3,   . . . ,   k t e r m s .   T h e   w i lj  s   r e pr e s e n t   wor r e pe t i t i o n   w i lj  o c c ur s   i n   do c u m e n t   D whi c h   s l a v e s   wo r ds   o f   c o n c e pt   C i .   T hi s   f r e que n c y   i s   c a l c u l a t e a s   t h e   n u m be r   o f   t i m e s   t h a t   t h e   w o c c ur s   i n   t h e   D i j T h e   f o l l o w i n s t e ps   r e pr e s e n t   t h e   pr o c e s s   to   c h oo s e   topN  wo r ds   whi c h   c a n   i n d i c a t e   t h e   do m i na n t   m e a nin o f   c o n c e pt   C i ,   s uppo s e   t h a wor w i s y m b o li z e s   c o n c e pt   C i .   a)   C o m put e   e a c h   w i lj  f o r   a l l   i ,   j .   b)   S uppo s e   t h a C i , j   i s   t h e   f r e que n c y   o f   c o n c e pt   C i ,   whi c h   a ppe a r s   i n   do c u m e n t   D i wh e r e   j   =   1,   2,   3 , . . . ,   m i .   c)   C a l c u l a t e   m a xim u m   o f   C ji  f o r   a l l   i ,   F i =   M a x { C ji } m i   j = 1 .   d)   C a l c u l a t e   m a xim u m   v a l ue   o f   w i lj  f o r   a l l   l ,   j ,   F i w j   =   M a x { w i lj } mi j = 1 .   e)   C h o o s e   P i c ,   whi c h   s a t i s f i e s   ¡   F i w j   ¡   F i c .   f)   F i na ll y ,   c o n s i de r   t h e   do m i na n t   m e a ni ng  pr o b a bil i t y :   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       Soc ial   c y be r - c r iminal ,   to w ar d s   automati c   r e al  ti me   r e c ognit ion  of    ( Y as s e r   I br ahim  A bde lmone A li )   1203    =  ( | ) = 1   = 1 , = 1 , 2 , ,     = 1 , 2 , ,       No f o r   e a c h   c o nc e pt   C i ,   we   r a n t h e   t e r m s   o f   c o l l e c t i o n   { P i1 ,   P i2 ,   . . . ,   P im i de c r e a s i ng   o r de r .   A s   a   r e s u l t ,   t h e   Do m i na n t   M e a ni ng  o f   t h e   c o n c e pt   C i   c a b e   r e pr e s e n t e by   t h e   s e t   o f   wo r ds   t h a t   c o r r e s po n ds   to  t h e   s e t   { P i1 ,   P i2 ,   . . . ,   P iN } ;   t h a i s :     W =  { w i 1 ,w i 2 ,...,w iN }       T h e   s e t   W i s   r e pr e s e n t i n m o r e   i n t e n de m e a ni ng  f o r   c o n c e pt   C i .       3.   RE S UL T S   AN DI S CU S S I ON   T o   tr y   a n s we r   o n   qu e s t i o n s   Ho t o   e n h a n c e   bi na r y   c l a s s if i c a t i o n   u s i n g   W o r d2Ve c   M o de l ?   An h o w   to   c o n s t r uc t   c o m pa r a bl e   v e c t o r ?   W e   c o n duc t   e x p e r i m e n t   o n   c o l l e c t i o n   t we e t s   o f   bi na r y   c l a s s if i e d.   W e   w il l   t a l i de t a i l   a b o ut  da t a s e t   us e to   c a l c u l a t e   e f f i c ien c y .   Al s o ,   we   w i l l   t a k e   a   to ur   a n d i s c u s s   i de t a i l   h o c o ul a n s we r   a b o ut   s ugge s t e que s t i o n s ,   a n d   w il l   t r y   a ns we r   que s t i o " w h a t 's   o ur   r e c o m m e n da t i o tec hni q e   whi c h   g i ve s   m o r e   a c c ur c ny   r e s u l t s ? "   l a t e r   l a s t   s e c t i o n .       3. 1.     Dat as e t   T h e   da t a s e t s   c o n s i s t   o f   t h r e e   bi na r y   c l a s s i f i e d a t a s e t s   ( D 1 ,   D 2 ,   D 3 )   [ 23] ,   t h e s e   da t a s e t s   c o n s i s t   o f   4614,   2127  a n 1081  t we e t s ,   r e s pe c t i ve ly .   D i   r e pr e s e n t e by   c o m a   s e pa r a t e   v a l ue   f il e   f o r m a t   ( c s v   f il e )   w i t b a s i c   da t a   ( t we e t - i d,   c l a s s if i c a t i o n   c l a s s ) .   T a bl e   s h o ws   d e s c r i be   t h e   a b o v e   t r a i ni ng  d a t a s e t s .   W e   w il l   u s e   D wh e r e   i   =   1,   2,   to   c o n s t r uc t   s upe r   v e c to r s   c om pa r a bl e   a n we   w il l   c o m pa r e   i t s   w i t h   a ll   ot h e r   da t a s e t s   e x c l ud i ng  i t s e lf   ( D i )   a n we   w i ll   de s c r i b e   t h e   r e s u l t s   i n   t h e   n e x t   s e c t i o n .       T a bl e   1.   Num be r   o f   t we e t s   f o r   b ot h   p o c ke t s   D a ta s e t   D 1   D 2   D 3   P o s it i ve   2391   634   453   N e ga ti v e   2223   1493   628   T ot a l   4614   2127   1081       3. 2.     E x p r i m at al   r e s u l t s   W e   w i ll   pa r t i t i o n   t hi s   s e c t i o n   i n t o   t i m e   r e a l i t y   a nd  pr o p o s e s y s t e m   e f f i c i e nc y ,   vi a   d i s c u s s i o n   t h e   r e s u l t s   o f   t i m e   a n e f f i c i e nc y .   As   we   s e e   t h e   r e s u lt s   s h o t h e   pur po s e   o f   us i ng  r e duc t i o n   t e c hni que   a s   e x t r a   s t e p,   s i g ni f i c a n t l y   m o r e   im pr o v e s .   I n   t hi s   r e s e a r c h ,   t h e   t r a di t i o n a l   m e t h o to   c a l c u l a t e   a   we i g h t   o f   a ny   t e r m   in  s pe c i f i c   c o n t e x t   i s   t e r m   f r e que n c y   ( TF )   t e c hni que .   As   we   s e e   t h e   r e s u l t s   s h o t h e   pu r po s e   o f   us i ng  r e duc t i o t e c h ni que   a s   e x t r a   s t e p ,   s i g nif i c a n t l y   m o r e   i m pr o v e s .     T F   V. S .   T F   +   r e duc t i o n   T a bl e   2   s h o ws   t he   r e s u l t s   o f   pr e c i s i o a n d   r e c a ll   r e s u l t s   f o r   a ll   t e c hni que s .   T h e   r e s u l t   o f   f i r s t   t e c h ni que   T F   pur e   ( w i t h o ut  a ddi n a ny   e x t r a   s t e ps )   gi ve s   80%   a n 91%   f o r   p r e c i s i o n   a n d   r e c a l l   r e s pe c t i v e ly ,   a l s o   T F   e x t r a   ( T F   wi t h   r e d uc t i o n   dup l i c a t e   di m e ns i o n s   f r o m   b ot h   s upe r   ve c to r s   c o m pa r a bl e )   g i ve s   87%   a n 60%   f o r   pr e c i s i o n   a nd  r e c a l l   r e s pe c t i v e ly   a s   s h o w n   i T a bl e   a n T a bl e   3.   T h e   im pr o v e m e n t   i n   pr e c i s i o n   a n d   r e c a ll   f o r   b o t h   T F   &   T F   +   r e duc t i o n   t e c hni que s   i s   t a ke a r o un 7%   a n 31%   r e s pe c t i v e ly   a s   s h o wn   i n   T a bl e   a nd  T a bl e   5.   I n   c o n t r a s t,   t h e   a r e   i m pr o v e m e n t   i t i me   pe r f o r m a n c e   f o r   b o t h   t e c h ni que s   a s   s h o wn   i F i gu r e   2.   F i gur e   s h o ws   t i m e   pe r f o r m a nc e   f o r   T F   V. V.   T F   r e duc t i o n   whi c h   t e l l   u s   T F   +   r e duc t i o n   m o r e   t i me  pe r f o r m a n c e   t h a n   T F .     Do m i na n t   m e a ni ng   ( DM )   V. S .   DM   +   r e duc t i o n   T a bl e   2   s h o ws   t h e   r e s u l t s   o f   pr e c i s i o n   a n r e c a ll   r e s u l t s   f o r   a ll   t e c hni qu e s .   T h e   r e s u l t   o f   f i r s t   t e c hni que   DM   pur e   g i ve s   80%   a n 91%   f o r   pr e c i s i o a n r e c a l r e s pe c t i ve ly ,   a l s o   DM   +   R e duc t i o n   g i ve s   87%   a n d   60%   f o r   pr e c i s i o n   a n r e c a ll   r e s pe c t i ve l y   a s   s h o wn   in  T a bl e   2   a n T a bl e   3.   T h e   im pr o v e m e n t   i n   pr e c i s i o a n d   r e c a ll   f o r   b o t h   DM   DM   +   R e du c t i o t e c h ni que s   i s   t a ke n   a r o un 7%   a n d   31%   r e s pe c t i v e ly   a s   s h o w n   i T a bl e   a n d   T a bl e   5.   I n   c o n t r a s t,   t h e   a r e   im pr o v e m e n t   i n   t i m e   pe r f o r m a nc e   f o r   b ot h   t e c hni que s   a s   s h o wn   i n   F i gur e   3.   F i gur e   s h o ws   t i m e   pe r f o r m a n c e   f o r   DM   v . s .   DM   +   r e duc t i o n   whi c h   t e ll   u s   DM   +   r e duc t i o n   m o r e   t i m e   pe r f o r m a n c e   t h a n   DM .     TF - I DF   V. S .   T F - I DF   +   r e duc t i o n   T a bl e   2   s h o ws   t h e   r e s u l t s   o f   pr e c i s i o n   a n d   r e c a ll   r e s u l t s   f o r   a l t e c h ni que s .   T h e   r e s u l t   o f   f i r s t   t e c h ni que   T F - I DF   pur e   ( w i t h o u t   a dd i n a ny   e x t r a   s t e ps )   g i v e s   83%   a n d   87%   f o r   pr e c i s i o n   a n r e c a ll   r e s pe c t i v e ly ,   a l s o   T F - I DF   r e duc t i o n   g i ve s   91%   a n 59%   f o r   pr e c i s i o n   a n d   r e c a l l   r e s pe c t i v e ly   a s   s h o wn   i n   T a bl e   a n T a bl e   3.   T h e   i m pr o v e m e n t   i n   pr e c i s i o n   a n r e c a l l   f o r   b o th   T F - I DF   &   T F - I DF   +   r e duc t i o n   t e c hni qu e s   i s   t a ke n   a r oun 4%   a n 32%   r e s pe c t i v e ly   a s   s h o wn   i n   T a bl e   4   a n d   T a bl e   5.   I n   c o n t r a s t ,   t h e   a r e   i m pr o v e m e n t   i n   t i m e   pe r f o r m a n c e   f o r   b o t h   t e c h ni que s   a s   s h o wn   in    Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i ,   Vo l .   25 ,   N o .   2 F e b r ua r y   20 22 1199 - 1207   1204   F i gur e   4.   F i gur e   s h o ws   t i m e   pe r f o r m a n c e   f o r   T F - I DF   v . s .   T F - I DF   +   R e duc t i o n   w hi c h   t e l l   u s   T F - I DF   +   r e duc t i o n   m o r e   t i m e   pe r f o r m a n c e   t h a n   T F - I DF .       T a bl e   2.   P r e c i s i o n ,   r e c a l l ,   a n F s u mm a r y   f o r   a l l   t e c hni que s   T e c hni qu e   P r e c is i o n   R e c a ll   F1   TF   80.00%   91.00%   82.23%   T F  R e du c ti o n   87.00%   60.00%   70.34%   DM   80.00%   91.00%   82.23%   D M  R e duc ti o n   87.00%   60.00%   70.34%   TF - I D F   83.00%   91.00%   86.36%   TF - I D F  R e du c ti o n   87.00%   59. 00%   69.99%       T a bl e   3.   P r e c i s i o n ,   r e c a l l ,   a n F s u mm a r y   f o r   a l l   t e c hni que s   T e c hni qu e   D a ta s e t   D 1   D 2   D 3   P r e c is i o n   R e c a ll   F1   P r e c is i o n   R e c a ll   F1   P r e c is i o n   R e c a ll   F1   TF   D1   -   -   -   64.00%   76.00%   69.49%   76.00%   88.00%   81.56%   D2   75.00%   91.00%   82.23%   -   -   -   74. 00%   91.00%   81.62%   D3   80.00%   81.00%   80.50%   68.00%   72.00%   69.94%   -   -   -   T F  R e du c ti o n   D1   -   -   -   76.00%   50.00%   60.32%   80.00%   49.00%   60.78%   D2   87.00%   39.00%   53.86%   -   -   -   82.00%   36.00%   50.03%   D3   85.00%   60.00%   70.34%   76.00%   53.00%   62.45%   -   -   -   DM   D1   -   -   -   6 4.00%   76.00%   69.49%   76.00%   88.00%   81.56%   D2   75.00%   91.00%   82.23%   -   -   -   74.00%   91.00%   81.62%   D3   80.00%   81.00%   80.50%   68.00%   72.00%   69.94%   -   -   -   D M  R e duc ti o n   D1   -   -     76.00%   50.00%   60.32%   80.00%   49.00%   60.78%   D2   87.00%   39.00%   53.86%   -   -   -   82.00%   36.00%   50.03%   D3   85.00%   60.00%   70.34%   76.00%   53.00%   62.45%   -   -   -   TF - I D F   D1   -   -     72.00%   81.00%   76.24%   83.00%   90.00%   86.36%   D2   78.00%   91.00%   84.00%   -   -   -   77.00%   91.00%   83.42%   D3   81.00%   83.00%   81.99%   70.00%   73.00%   71.47%   -   -   -   TF - I D F  R e du c ti o n   D1   -   -   -   76.0 0%   50.00%   60.32%   80.00%   49.00%   60.78%   D2   87.00%   39.00%   53.86%   -   -   -   82.00%   35.00%   49.06%   D3   86.00%   59.00%   69.99%   78.00%   52.00%   62.40%   -   -   -       T a bl e   4.   T h e   i m pr o v e m e n t s   v a l ue s   i n   pr e c i s i o n   T e c hni qu e   P r e c is i o n   I mpr ove s   TF   80.00%   7.00%   T F  R e du c ti o n   87. 00%     DM   80.00%   7.00%   D M  R e duc ti o n   87.00%     TF - I D F   83.00%   4.00%   TF - I D F  R e du c ti o n   87.00%       T a bl e   5.   T h e   i m pr o v e m e n t s   v a l ue s   i n   r e c a ll   T e c hni qu e   R e c a ll   I mpr ove s   TF   91.00%   31.00%   T F  R e du c ti o n   60.00%     DM   91.00%   31.00%   D M  R e duc ti o n   60.00%     TF - I D F   91.00%   32.00%   TF - I D F  R e du c ti o n   59.00%               F i gur e   2.   T F   1   a n d   t i m e   c o m pa r i s o n   c h a r t   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       Soc ial   c y be r - c r iminal ,   to w ar d s   automati c   r e al  ti me   r e c ognit ion  of    ( Y as s e r   I br ahim  A bde lmone A li )   1205       F i gur e   3.   DM   a n d   t i m e   c o m pa r i s o n   c h a r t           F i gur e   4.   T F - I DF   a n d   t i m e   c o m pa r i s o n   c h a r t       As   s h o w n   i F i gur e   5   a n T a bl e   3,   t h e   im pr o v e m e n t   i t i m e   i s   i nc r e a s e d   qu i c k ly   i t he   T F   a n T F   +   r e duc t i o n   t e c hni que ,   DM   a n T F - I DF   pur e   m o r e   t i m e   e f f i c i e n t   t h a n   T F   pur e ,   b ut   T F   r e duc t i o n   c l o s e   f r o m   ot h e r   t e c h ni que s .   I t   i s   i n t e r e s t i n t o   n ot e   t h a t   t h e   hi g h e s t   i m pr o v e m e n t   i n   T D - I DF   i b o t h   pur e   a n r e duc t i o f r o m   t i m e   pe r f o r m a n c e .   F i na ll y ,   a b o ve   d i s c us s i o n   a n m e a s ur e m e n t   v a l ue s   w hi c l e a d   us   t o   o ur   pr o p o s e m e t h o do l o g y   e nh a n c e   pr e c i s i o n   87%   a n r e c a ll   59% ,   i n   f ut ur e   we   w i l l   wo r to   e n h a n c e   a b o v e   v a l e s   b y   a pp l yi ng  o r   m i x   a n o t h e r   t e c hni que .           F i gur e   5.   Al l   t e c hni que s   t i m e   c o m pa r i s o n   c h a r t   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i ,   Vo l .   25 ,   N o .   2 F e b r ua r y   20 22 1199 - 1207   1206   4.   CONC L USI ON   T h e   c ha n ge   i n   de gr a da t i o n   f o r   e a c h   y e a r   o v e r   t h e   pa s t   f o ur   de c a de s   i s   gr a dua ll y   i nc r e a s e d.   I n   t hi s   r e s e a r c h   we   us e s o m e   c o m m o n   t e c hni que s   f o r   c a l c u l a t e   a   we i g h t   o f   t e r m s   i t we e t   to   c o n s t r uc t   c om pa r a bl e   v e c t o r s   a n c o m put e   s i mi l a r i t y   b e t we e n   t h e s e   ve c to r s   a n i n put   t we e to   pr e di c a t e   hi s   c l a s s   ( pos i t i v e   o r   n e ga t i v e ) .   T he   e x pe r im e n t a l   r e s u l t s   t e l l   us   t h e   b e s t   i m pr o v e m e n t   t i m e   i do m i na n t   m e a ni ng   ( DM )   a n t e r m   f r e qu e n c y   i nve r s e   do c um e n t   f r e que n c y   ( T D - I DF )   m o r e   t h a n   t e r m   f r e qu e n c y   (T F )   f r o m   e xc r e m e n t a l   r e s u l t s .       RE F E R E NC E S   [ 1]   S A s la m,  T w it t e r   b y   N umb e r s S ta ts D e m o g r a phi c s   F un  F a c ts O mni c or e 2021.  A c c e s s e d:   J ul 14,  2020.  [ O nl in e ] A v a il a bl e :   ht tp s :/ /ww w .o mni c o r e a ge n c y . c o m/ twi tt e r - s ta ti s ti c s /2 020   [ 2]   B H a n,  P C oo k,  a nd  T B a ld w in T e x t - ba s e twi tt e r   us e r   ge o l oc a ti o pr e d ic t i o n,”   J our nal   o f   A r ti f ic ia I nt e ll ig e nc e   R e s e ar c h vo l.  49, pp. 451 500, 2014, d o i:  10.1613/ ja ir .4200.   [ 3]   H T P ha n,   V C T r a n,  N .   T N gu y e n,   a nd  D H w a ng,  I mp r ov in g   th e   P e r f or ma nc e   of   S e n ti m e nt   A na l y s is   of   T w e e ts   C o nt a i ni ng  F uz z y   S e n ti m e nt   U s in th e   F e a tu r e   E ns e mbl e   M o d e l,   in   I E E E   A c c e s s v o l.   8,  pp.  14630 - 14641,  2020,  do i :   10.1109/AC C E S S .2019.2963702 .   [ 4]   A O ka y P A G o l e a nd  A O ka y T ur ki s a nd  s lo ve ni a h e a lt mi ni s tr ie s   us e   of   twi tt e r A   c o mpa r a ti ve   a na l y s is ,”   C or por at e   C om m uni c at io ns :  A n I nt e r nat io nal  J our nal v ol . 26, n o . 1, pp.  176 - 191 2020, do i 10.1108/C C I J - 01 - 2020 - 0019.   [ 5]   M D C o n ov e r B G o n c a l v e s J R a tk ie w i c z A F la mm in i,   a nd  F M e n c z e r ,   P r e di c ti ng  th e   P o li ti c a A li gnm e nt   of   T w it te r   U s e r s ,”   2011   I E E E   T hi r I nt e r nat io nal   C onf e r e nc e   on  P r iv a c y Se c ur it y R is k   and  T r us and  2011  I E E E   T hi r I n te r nat io nal   C onf e r e nc e  on Soc ia C om put in g , 2011, pp. 192 - 199, do i:  10.1 109/ P A S S A T /S oc ia lC o m.2011.34 .   [ 6]   X W a ng,  M S G e r b e r a nd  D E B r o w n,  A ut o ma ti c   c r im e   p r e di c ti o us in e ve nt s   e x tr a c t e f r o twi tt e r   p o s ts ,”   in   I nt .   C onf .   Soc ia C om put in g, B e hav io r al - C ul tu r al  M ode li ng, and P r e di c ti on 2012,  pp. 231 238, do i:  10.1007/978 - 3 - 642 - 29047 - 3_28.   [ 7]   D R a ma ge S D uma i s a nd   D L ie bl in g,  C ha r a c t e r i z in mi c r obl o gs   w it h   to pi c   m o de ls ,”   P r oc e e di ngs   o f   th e   F our th   I nt e r nat io nal   A A A I  C onf e r e nc e  on W e bl ogs  and Soc ia M e di a , 2010.   [ 8]   N D io s i o F A l ve s P M F e r r e ir a a nd  A B e s s a ni C y b e r t hr e a D e t e c ti o f r om  T w it t e r   us in D e e N e ur a N e tw o r ks ,”   2 019  I nt e r nat io nal  J oi nt  C onf e r e nc e  on N e u r al  N e tw or k s  ( I J C N N ) , 2 019, pp. 1 - 8, do i 10.1109/I J C N N .2019.8852475 .   [ 9]   C . S a bo tt k e , O . S u c iu ,  a nd  T . D umi t r a s ,   V ul ne r a bi li t y  di s c l o s u r e  i n  t h e  a ge   of  s o c ia l  me di a :  E x pl o it in g  t w it t e r   f or  p r e di c ti ng  r e a l - w o r ld   e x pl o it s ,”   P r oc e e di ngs  of  t he  24t h   U SE N I X  C on f e r e nc e  o n Se c ur it y  Sy m po s iu m 2015,  pp. 1041 1056.   [ 10]   S Z h o u,  Z L ong,  L T a n,  a nd  H .   G u o A ut o ma ti c   id e nt i f i c a ti o of   in di c a t o r s   of   c o mp r o mi s e   us in n e ur a l - ba s e s e qu e nc e   la be ll in g,”   ar X iv  pr e pr in ar X iv : 1810.10156 , 2018.   [ 11]   P B a dj a ti y a S .   G upt a M G upt a a nd  V V a r ma D e e l e a r ni ng  f o r   ha t e   s p e e c d e t e c ti o in   tw e e ts ,”   in   P r oc e e di ngs   of   th e   26t I nt e r nat io nal  C onf e r e nc e  on W or ld   W id e   W e b C om pani on 2017,  pp. 759 760, do i:  10.1145/3041021.3 054223.   [ 12]   M . P o nt ik i,  D G a la ni s , H . P a pa g e o r gi o u,  S . M a n a ndha r , a nd I A ndr o ut s o p o ul o s , “ S e me v a l - 2015 ta s k 12: As pe c ba s e d s e nt im e nt   a na l y s is ,”  i P r o .   9t h I nt .   W or k s hop on Se m ant ic  E v al uat io n   ( Se m E v al  2015) 2015,  pp. 486 495,  do i:   10.18653 / v 1/ S 15 - 2082 .   [ 13]   C W a gne r A D ul a unoy G W a ge ne r a nd  A I kl o d y M is p:   T he   de s ig a nd  im pl e m e nt a ti o of   a   c o l la bor a ti v e   t hr e a t   in te ll ig e n c e   s ha r in pl a t f o r m,”   in   P r oc e e di ngs   of   th e   2016  A C M   on  W or k s hop  on  I nf or m at io Sha r i ng  and  C ol la bor at iv e   Se c ur it y 2016,  pp. 49 56, do i:  10.1145/2994539.2 994542.   [ 14]   G L a mpl e M B a ll e s te r o s S S ub r a ma ni a n,  K K a w a ka mi a nd  C D y e r N e ur a a r c hi t e c tu r e s   f or   na me e nt it y   r e c o gni ti on,”   P r oc e e di ngs   of   th e   2016  C onf e r e n c e   o f   th e   N o r th   A m e r ic an   C hapt e r   o f   th e   A s s o c ia ti on  f o r   C om put at io nal   L in gui s ti c s :   H u m an  L anguage  T e c hnol ogi e s , 2016 , pp. 260 - 270, do i:   10.18653/ v 1/ N 16 - 1030 .   [ 15]   A J Y e p e s   a nd  A .   M a c K in la y ,   N e r   f or   m e di c a e nt it ie s   in   tw it te r   us in s e qu e n c e   t s e qu e n c e   n e ur a n e tw o r ks ,”   in   P r oc e e di ngs   of  t he  A us tr al a s ia n L anguage  T e c hnol ogy  A s s o c ia ti on W or k s hop 2016 2016,  pp. 138 142.   [ 16]   C B A s la n,  R B S a gl a m,  a nd  S L i,   A ut o ma ti c   d e te c ti o of   c y b e r   s e c ur it y   r e la te a c c o un ts   o o nl in e ˘   s oc ia ne tw or ks T w i tt e r   a s  a n e x a mpl e ,”  i P r oc .   9t h I nt .   C onf .   s oc ia m e di a and Soc i e ty 2018,  pp. 236 240, do i:  10.1145/3217804.3 217919.   [ 17]   F A lv e s A B e tt in i,   P M F e r r e ir a a nd  A B e s s a ni P r o c e s s in twe e ts   f o r   c y b e r s e c ur i t y   th r e a a w a r e ne s s ,”   I nf or m at io Sy s te m s vo l.  95, 2021, d o i:  10.1016/ j. is .2020.101586.   [ 18]   F F D ua r t e O M P e r e ir a a nd  R L .   A gui a r D is c ove r y   of   ne w s w o r th y   e ve nt s   in   twi tt e r ,”   in   P r oc e e di ngs   of   th e   3r I nt e r nat io nal   C onf e r e nc e   on  I nt e r n e of   T hi ngs B ig   D at and  Se c ur it y   ( I oT B D 2018) 2018,  pp.  244 252,  do i :   10.5220/000671270 2440252 .   [ 19]   A S e th S N a y a k,  J M o th e a nd  S J a dha y N e w s   di s s e mi na ti o o twi t te r   a nd  c o n ve nt i o na n e w s   c ha nne ls ,”   in   19t I nt e r nat io nal   C onf e r e nc e   on  E nt e r pr is e   I nf or m at io Sy s te m s   ( I C E I 2017) vol 1,  2017,  pp.  pp 43 - 52,  do i :   10.5220/000626410 0430052 .   [ 20]   A J a v e d,  P B ur na p,  a nd  O R a na P r e di c ti o n   of   dr i ve - b y   d o w nl o a a tt a c ks   o twi tt e r ,”   I nf or m at io P r oc e s s in &   M anage m e nt vo l.  56, n o . 3, pp. 1133 1145, 2019,  d o i:  10.1016/ j. ip m.2018.0 2.003.   [ 21]   R P K ha ndpur T J i,   S J a n,  G W a ng,  C . - T L u,  a nd  N R a ma kr is hna n,  C r o w ds o ur c in c y b e r s e c ur it y C y be r   a tt a c d e te c ti on   us in s o c ia m e di a ,”   in   P r oc e e di ngs   o f   th e   2017  A C M   on  C onf e r e nc e   on  I nf o r m at io and  K now le dge   M anag e m e nt 2 017,    pp. 1049 1057, do i:  10.1145/3132847.3 132866.   [ 22]   F H S o hi m e R R a ml i,   F A R a hi m,  a nd  A A .   B a ka r E x pl o r a ti o S tu d y   of   S ki ll s e ts   N e e d e in   C y b e r   S e c ur it y   F i e ld ,”   2 020  8t I nt e r nat io nal   C onf e r e nc e   on  I nf or m at io T e c hnol ogy   and  M ul ti m e di a   ( I C I M U ) 2020,   pp.  68 - 72,   do i:   10.1109/I C I M U 49871.2020.9243448 .   [ 23]   N D io s i o W o r ki ng   D a ta s e t ,   G it hub 2020.  A c c e s s e d:   F e b.  9,  2020.  [ O nl in e ] A v a il a bl e ht tp s :/ /g i th ub.c o m/ nd i o n y s us /t w i tt e r - c y b e r th r e a t - d e t e c ti o n/ tr e e /m a s te r /d a ta   [ 24]   M A R a z e k,   C F r a s s o n,   a nd  M K a lt e nba c h,  D o mi na nt   m e a ni ngs   a ppr o a c h   t o w a r ds   in di v id ua li z e d   w e b   s e a r c f or   le a r ni ng   e n v ir o nm e nt s ,”   in   A dv anc e s   in   w e b - bas e e duc at io n:   pe r s onal iz e le ar ni ng  e nv ir on m e nt s pp.  46 69,  2006,  do i:   10.4018/97 8 - 1 - 59140 - 690 - 7.c h003.   [ 25]   M A R a z e k,  T o w a r ds   m o r e   e f f i c i e nt   im a g e   w e s e a r c h,”   I nt e ll ig e nt   I nf or m at io M anage m e nt v o l.   5,  n o 6,  p p.  196 - 203 20 13,  do i:  10.4236/i im .2013.56022.   [ 26]   Y I br a hi m,  M A R a z e k,  a nd  K A E lDa hs ha n T o w a r ds   mor e   E f f ic i e nt   f or   W e I ma g e   S e a r c h   E ngi n e   us in D o mi na nt   M e a ni ng  T e c hn iq u e ,   I n te r nat io nal   J our nal   of   C om put e r   T r e nds   and  T e c hnol ogy   ( I J C T T ) vol 54,  n o 2 pp.  91 - 96,  2 017   do i:  10.14445/22312803 / I J C T T - V 54P 114.   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       Soc ial   c y be r - c r iminal ,   to w ar d s   automati c   r e al  ti me   r e c ognit ion  of    ( Y as s e r   I br ahim  A bde lmone A li )   1207   B I OG RA P HI E S   OF   AU T HO RS       Y a s s er  I bra h i m   A bdel m o n e m   A l i           i s   L ec t u r e A s s i s t an t   at   Ma t h .   Co m p u t er   Sci en c e   D e p art me n t ,   Fa c u l t y   o f   S c i en ce ,   A z h ar  u n i v e rs i t y ,   N as Ci t y ,   Cai r o ,   E g y p t .   H b o rn   i n   Cai ro ,   E g y p t ,   h o l d s   Ba ch e l o r's   i n   P u r e   Mat h em at i c s   a n d   C o m p u t e S ci e n ce   w i t h   V e r y   G o o d   fro d eg r ee .   H e   H o l d s   m as t e r’s   d eg r ee   i n   C o m p u t e S ci e n ce   fr o m   Mat h .   C o m p u t e r   Sci en ce   D e p art men t ,   Facu l t y   o S ci e n ce ,   A zh ar  u n i v ers i t y   w i t h   Im ag e   R e t ri e v a l .   Pu p l i s h e d   p ap e w i t h   T i t l e   T o w ard s   m o r E ff i ci e n t   f o W e b   Im ag S e ar c h   E n g i n e   u s i n g   D o mi n a n t   Me an i n g   T ec h n i q u e ”.   H e   c a n   b c o n t ac t e d   at   em a i l :   y as s e r. i b rah i m@ azh ar. ed u . eg .         D r.   M o h a m m ed  A bdel   R a z e k           i s   a   Pro fe s s o o Co m p u t e S c i en ce   at   A zh ar   U n i v e rs i t y .   H e   h o l d s   Ph . D .   i n   Co m p u t e S c i en ce - A rt i fi c i a l   I n t e l l i g e n ce - fr o m   U n i v e rs i t y   o f   Mo n t re a l ,   Ca n ad a   i n   2 0 0 4 .   H i s   re s e ar ch   f o c u s e s   o n   t h d e s i g n   o n ew   ap p l i c at i o n   u s i n g   art i fi ci al   i n t e l l i g e n ce   t ech n i q u e s   o n   e - l e arn i n g ,   M e d i c i n e,   C y b e rs ec u r i t y ,   I n t e rn e t   o T h i n g ,   an d   o t h e rs .   H e   h as   mo r e   t h an   8 0   p ap e rs   p u b l i s h e d   i n   i n t e rn at i o n a l   j o u rn a l s   an d   C o n f e r en ce s .   H e   s e rv e s   as   an   ed i t o mem b e f o m a n y   J o u rn a l s   an d   as   re v i ew er  o m an y   i n t e r n at i o n a l   c o n f e r e n ce s .   A s   p o s t d o c t o ral   f e l l o w   at   N SE RC ,   Can ad a,   H e   h ad   w o r k e d   i n   c r e at i n g   i n t el l i g en t   s i g n i n g   s y s t em   t o   m a n i p u l at e   h u g e   d at ab as e   c o n t ai n i n g   c u s t o me rs   p u rch as e s   at   Re t ai l   Co m p an y .   H e   h as   b ee n   a d d ed   t o   W h o   i s   W h o   i n   t h e   w o r l d   i n   2 0 0 9 .   H e   i s   w o r k i n g   as   a   c o n s u l t an t   fo q u al i t y   as s u ran ce   fo t rad i t i o n al   a n d   o n l i n e   e d u c at i o n   at   m an y   i n s t i t u t i o n s :   Mi n s t e o H i g h e r   E d u c at i o n   E g y p t ,   K i n g   A b d u l   A zi z   U n i v e rs i t y - Sau d i   A rab i a ,   a n d   N at i o n al   A u t h o ri t y   f o Q u al i t y   A s s u ran ce   a n d   A cc r e d i t at i o n   o E d u c at i o n   (N A Q A A E ) H e   c a n   b c o n t ac t e d   at   em a i l :   ab d el ram@ azh ar . e d u . e g .         D r.   N a s s er  A .   El - S h erbe n y           b o rn   i n   Man s o u r a,   E g y p t ,   h o l d s   Ba c h el o r's   i n   Mat h em at i c s   w i t h   E x cel l e n t   d e g r ee .   H h a d   h i s   mas t e r’s   d eg r ee   i n   Mat h em at i c s   fr o m   Mat h em at i c s   D e p art men t ,   Fa c u l t y   o S ci e n ce ,   Man s o u r U n i v e rs i t y .   H h a d   h i s   D E C2   fr o m   Fac u l t e'  P o l y t ech n i q u d Mo n s ,   M o n s ,   B el g i q u e .   H h ad   h i s   P h . D .   d e g r ee  i n   Mat h em at i c s   fro m   Mat h em at i c s   D e p art men t ,   Facu l t y   o S c i en ce ,   Mo n s   U n i v e rs i t y ,   Mo n s ,   Bel g i u m .   Cu rren t l y   w o r k s   as   Pro f.   i n   Mat h em at i c s ,   Mat h em at i cs   D e p art me n t ,   Fa c u l t y   o Sci e n ce,   A l - A zh ar  U n i v e rs i t y ,   Cai r o ,   E g y p t ,   p u b l i s h e d   s ev e ral   s c i e n t i fi r e s e ar ch e rs   i n   O p t i m i zat i o n   N e t w o rk s .   H e   c a n   b c o n t ac t e d   at   em ai l :   n as s e r el s h e rb en y @ y ah o o . c o m .     Evaluation Warning : The document was created with Spire.PDF for Python.