I n t e r n at ion al   Jou r n a l   of   I n f o r m at ics   an d   Com m u n icat ion   T e c h n ol ogy  ( I J - I CT )   Vo l .   1 4 ,   N o .   3 De c e m b e r   20 2 5 ,   pp.   1015 ~ 1023   I S S N:  2252 - 8776 DO I 10 . 11591/i ji c t . v 1 4 i 3 . pp 1 0 15 - 1023             1015       Jou r n al  h o m e page ht tp: // ij ict . iaes c or e . c om   M u ltil in g u al  h at e  sp e e c h  d e t e c t io n  u si n d e e p  l e ar n in g       Vin c e n t ,   Am al ia   Z ah r a   D e pa r tm e nt   of   C o mput e r  S c i e n c e B I N U S  G r a dua te  P r o gr a m - M a s te r  of  C o mput e r   S c i e n c e , B in a  N us a nt a r a  U ni v e r s it y   J a ka r ta , I ndo ne s ia       Ar t ic l e   I n f o     AB S T RA CT   A r ti c le  h is tor y :   R e c e i ve d   No v   10,   2024   R e vi s e M a r   18,   2025   A c c e pt e J un   9,   2025       T h ri s e   o s o ci al   med i a   h as   en ab l e d   p u b l i e x p re s s i o n   b u t   a l s o   fu e l ed   t h s p re ad   o h at s p eec h ,   c o n t ri b u t i n g   t o   s o ci al   t e n s i o n s   a n d   p o t en t i al   v i o l en ce .   N at u ral   l an g u a g e   p ro ce s s i n g   ( N L P) ,   p art i cu l ar l y   t e x t   c l as s i fi c at i o n ,   h as   b e co me  e s s e n t i a l   f o d e t ec t i n g   h a t e   s p eech .   T h i s   s t u d y   d ev e l o p s   h at s p e ec h   d e t ec t i o n   mo d el   o n   T w i t t e u s i n g   Fas t T e x t   w i t h   b i d i r ec t i o n a l   l o n g   s h o rt - t e rm   memo r y   (B i - L ST M)  an d   e x p l o r e s   mu l t i l i n g u al   b i d i r ec t i o n a l   e n co d e r   r e p re s en t at i o n s   fr o m   t ran s fo r me rs   (M - BE RT fo h a n d l i n g   d i v e rs l an g u ag e s .   D at au g me n t at i o n   t ech n i q u e s - i n cl u d i n g   e as y   d at au g me n t at i o n   (E D A me t h o d s ,   b a c k   t ran s l at i o n ,   a n d   g e n e rat i v e   a d v e rs ari al   n e t w o r k s   (G A N s ) - are   em p l o y ed   t o   e n h an ce   cl as s i fi c at i o n ,   e s p eci al l y   f o i m b al a n ce d   d at as e t s .   Re s u l t s   s h o w   t h at   d at au g men t at i o n   s i g n i fi c an t l y   b o o s t s   p e rfo r m an ce.   T h e   h i g h e s t   F1 - s c o re s   ar e   ach i ev e d   b y   r an d o m   i n s e rt i o n   fo r   I n d o n e s i an   (F1 - s co r e :   0 . 8 8 9 ,   A cc u ra cy :   0 . 8 7 9 ),   s y n o n y r e p l a cemen t   fo r   E n g l i s h   (F1 - s c o r e:   0 . 8 7 2 ,   A ccu ra cy :   0 . 8 3 1 ),   an d   r an d o d el e t i o n   f o r   G e rm a n   (F1 - s c o r e:   0 . 8 5 3 ,   A c cu ra cy :   0 . 8 3 0 )   w i t h   t h e   F as t T e x t   +   Bi - L ST mo d e l .   T h e   M - B E RT   m o d e l   p e rfo r m s   b e s t   w i t h   r an d o d el e t i o n   f o r   I n d o n e s i an   (F1 - s c o r e:   0 . 8 9 8 ,   A ccu ra cy :   0 . 8 8 0 ),   ran d o m   s w ap   f o E n g l i s h   (F1   s c o re:   0 . 8 7 0 ,   A c cu ra cy :   0 . 8 6 6 ),   an d   ran d o m   d e l e t i o n   f o G e r m an     (F1 - s c o re:   0 . 6 6 2 ,   A ccu ra cy :   0 . 8 5 8 ).   T h e s e   fi n d i n g s   u n d e rs c o r t h at   d at au g me n t at i o n   e ff ec t i v en e s s   v ari e s   b y   l an g u a g e   an d   mo d e l .   T h i s   r e s e ar ch   s u p p o rt s   e ffo rt s   t o   m i t i g at e   h at e   s p eech ’s   i m p ac t   o n   s o ci al   med i b y   ad v an ci n g   mu l t i l i n g u al   d e t ec t i o n   c ap ab i l i t i e s.   K e y w o r d s :   Bi - L S T M   Da t a   a ugm e n t a t i o n   Ha t e   s pe e c h     M - B E R T   NL P   Th i s   i s   a n   o p en   a c ces s   a r t i c l u n d e r   t h CC  B Y - SA   l i cen s e.     C or r e s pon din A u th or :   V i n c e n t   De pa r t m e n t   o f   C o m put e r   S c i e n c e ,   B I NU S   Gr a dua te  P r o gr a m   M a s t e r   o f   C o m put e r   S c i e n c e ,   B i na   Nus a n t a r a   Uni v e r s i t y   J a ka r t a ,   I n do n e s i a   E m a i l vi nc e n t 053@bi nus . a c . i d       1.   I NT RODU C T I ON   S o c i a l   m e d i a   i s   a   pa r o f   t h e   i n t e r n e t   t h a t   f a c i li t a t e s   us e r s   i n   e x pr e s s i ng  t h e m s e l ve s ,   c o l l a b o r a t i n g,   i n t e r a c t i n g,   s h a r i n g,   a n c o m m u ni c a t i n w i t h   ot h e r s .   I n   2020,   h a l f   o f   t h e   wo r l d s   po pu l a t i o n   wa s   a l r e a d y   us i n s o c i a l   m e d i a .   Out  o f   5. 2   bi ll i o n   pe o pl e   who  o wn e d   m o bil e   ph o n e s ,   4. 5   bi ll i o n   we r e   c o n n e c t e to  t h e   i n t e r n e t ,   a n 3. 8   bi l li o n   we r e   a c t i v e   s o c i a l   m e d i a   us e r s .   T hi s   f i gur e   o f   3. b i ll i o n   r e pr e s e n t e 49 %   o f   t h e   g l o b a l   po pu l a t i o n   i n   2020.   T h e   e m e r ge n c e   o f   s o c i a l   m e d i a   p l a t f o r m s   l i ke   T w i t t e r ,   F a c e b o o k ,   a n I n s t a gr a m   h a s   pr o vi de a   s pa c e   f o r   t h e   publ i c   to   e x pr e s s   t h e i r   o pi ni o ns   t h r o ugh   p o s t e c o m m e n t s .   Am o n t h e s e   p l a t f o r m s ,   T wi tt e r   s t a n ds   o u by   o f f e r i n f e a t ur e s   li ke   r e t we e t s ,   l i ke s ,   a n r e pl i e s ,   a l l o w i ng  m il li o n s   o f   us e r s   to   i n d i r e c t l y   i n t e r a c t   i n   c o nv e r s a t i o ns .   Ho we v e r ,   th e s e   f e a t ur e s   h a v e   i n t r o duc e a   s i g nif i c a n t   n e c h a ll e n ge :   t h e   s pr e a o f   h a t e   s pe e c h   [ 1] .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 4 ,   N o.   3 De c e m be r   20 2 5 :   1015 - 1023   1016   Ha t e   s pe e c h   i s   a   ph e n o m e n o n   wh e r e   us e r s ,   e i t h e r   i n t e n t i o n a ll y   o r   uni n t e n t i o n a ll y ,   d i s s e mi na t e   m e s s a ge s   o r   c o n t e n t   a i m e a t   pr o v o ki n g,   i n c i t i ng,   o r   di s c r i mi na t i n a g a i ns t   s pe c i f i c   i nd i v i dua l s   o r   gr o ups   [ 2] Ha t e   s pe e c h   o f t e n   t a r ge t s   i n d i v i dua l s   b a s e o n   c h a r a c t e r i s t i c s   s uc h   a s   e t h ni c i t y ,   r e l i g i o n ,   r a c e ,   ge n de r ,   s e x ua l   o r i e n t a t i o n ,   o r   ot h e r   b a c kgr o un ds .   C o n s e que n t l y ,   h a t e   s pe e c h   c a n   l e a t o   s o c i a l   t e ns i o n s ,   c r e a t e   s t e r e ot y pe s ,   h a r m   i n t e r c u l t ur a l   r e l a t i o n s ,   a n i nc i t e   ot h e r   f o r m s   o f   p hy s i c a l   vi o l e n c e .   T a ddr e s s   t h i s   i s s ue ,   r e s e a r c h   i n a t ur a l   l a n gua ge   pr o c e s s i ng  ( NL P ) ,   pa r t i c u l a r ly   i n   t e x t   c l a s s i f i c a t i o n ,   h a s   e m e r ge a s   a n   e f f e c t i v e   a pp r o a c h   to  a n a ly z i ng  t h e   c o m p l e x   l i ngu i s t i c   pa tt e r n s   us e o n   s o c i a l   m e d i a .   T e x c l a s s i f i c a t i o n   i s   a   b r a n c h   o f   NL P   a i m e d   a gr o upi n t e x t s   i n t c e r t a i n   c a t e g o r i e s   or   c l a s s e s .   H o we v e r ,   c h a l l e n ge s   i n   t e x c l a s s if i c a t i o n   a r i s e   wh e n   t h e   m o de l   m us t   h a n d l e   t h e   l i ngu i s t i c   a n c o n t e x t ua l   d i v e r s i t y   o n   s o c i a l   m e d i a ,   i n c l ud i ng  uni que   wr i t i n s t y l e s   a n p h r a s e s   [ 3] .   A dd i t i o n a ll y ,   n o i s y   a n i m ba l a n c e da t a   o n   s o c i a l   m e d i a   pr e s e n t   f ur t h e r   c h a ll e n ge s   f o r   t e x c l a s s if i c a t i o n   [ 4] [ 5 ] .   T hi s   n o i s e   c a n   s t e m   f r o m   v a r i o us   f a c t or s ,   i n c l ud i ng  a bb r e vi a t i o ns ,   s l a n g,   e m o t i c o n s ,   o r   ot h e r   wr i t i n e r r o r s .   M e a n whil e ,   i m ba l a nc e da t a   c a n   c a us e   i s s u e s ,   s uc h   a s   o v e r f i t t i n t t h e   m a j o r i t y   c l a s s   a n po or   p r e d i c t i v e   a c c ur a c y .   T a ddr e s s   t h e s e   c h a ll e n ge s ,   t h e   de v e l o p m e n t   o f   m o de l s   c a pa bl e   o f   h a n d li ng  l i ngu i s t i c   v a r i a t i o n   a nd  c l a s s if i c a t i o n   c ha l l e nge s   i s   t h e   f o c us   o f   t hi s   r e s e a r c h .   M e t h o ds   s uc h   a s   da t a   a ug m e n t a t i o n ,   a da pt i v e   NL P ,   a n d   de e l e a r ni ng  a ppr o a c h e s   h a ve   b e c o m e   i n c r e a s i n g l y   po pu l a r   s o l ut i o n s   f o r   t a c kl i ng  t h e s e   c h a ll e n g e s .   W i t t e c h n o l o g i c a l   a d v a n c e m e n t s   a n m o r e   s o phi s t i c a t e m e t h o ds ,   t e x c l a s s if i c a t i o n   i s   e x pe c t e to  c on t i n ua ll y   im pr o v e   i n   i t s   pe r f o r m a nc e   a n a c c ur a c y   i n   i n t e r pr e t i n t h e   d i v e r s e   i nf o r m a t i o n   f o un o n   s o c i a l   m e d i a .     I n   t hi s   s t ud y ,   t h e   a ut h o r s   wi l l   de v e l o a   m o de l   u s i n f a s t T e x t   c o m bi ne w i t h   bi d i r e c t i o n a l   l o n s h o r t - t e r m   m e m o r y   ( B i - L S T M )   t o   a n a ly z e   pu bl i c   o p i ni o n   o n   T w i t t e r   r e ga r di n v a r i o us   i s s ue s .   T h e   s e l e c t i o n   o f   t h e     Bi - L S T M   m o de l   i s   b a s e o n   i t s   a bil i t y   t o   h a n d l e   c o m put a t i o n a l   c h a ll e n ge s   a n e nh a n c e   a   h o l i s t i c   un de r s t a n d i ng  o f   t e x t   c l a s s i f i c a t i o n   [ 6] .   T hi s   r e s e a r c h   w il l   a l s o   e x p l o r e   t h e   pot e n t i a l   f o r   tr a n s f e r   l e a r ni n g   de v e l o p m e n t   us i n m u l t i li ngua l   bi d i r e c t i o n a l   e n c o de r   r e pr e s e n t a t i o ns   f r o m   t r a n s f o r m e r s   (M - B E R T )   to  im pr o v e   m o de l   pe r f o r m a n c e   i n   de t e c t i n a n a ddr e s s i ng  m u l t i li ngua l   ha t e   s pe e c h .   A dd i t i o n a ll y ,   da t a   a ug m e n t a t i o n   m e t h o ds   s u c h   a s   e a s y   da t a   a ug m e nt a t i o n   ( E DA ) ,   b a c t r a n s l a t i o n ,   a n ge n e r a t i v e   a d v e r s a r i a n e t wo r ks   ( GA Ns )   w i ll   b e   ut i li z e t e n ha n c e   m o de l   p e r f o r m a n c e .   T hi s   s t ud y   i s   e x pe c t e to  c o n t r i b ut e   to  e f f o r t s   i n   mi n im i z i ng  t h e   n e ga t i v e   i m pa c t   o f   h a t e   s pe e c h   i n   s o c i a l   m e d i a .   T h e   r e s e a r c h   p a pe r   w i ll   b e   s t r uc t ur e d   a s   f o l l o w s .   I n   s e c t i o n   w il l   pr e s e n t   r e l a t e pr e vi o us   wo r k   o n   m u l t i li ngua l   m e t h o ds   f r o m   v a r i o us   s o ur c e s .   I n   s e c t i o n   w il l   d i s c us s   t h e   pr o p o s e m e t h o us e i n   t hi s   r e s e a r c h .   T h e   r e s u l t s   o f   t h e   m o de l   de ve l o p m e nt  wi ll   be   d i s p l a y e t h r o ugh   t a bl e s   i n   s e c t i o n   4,   wi t h   a   c o n c l ud i ng  s u mm a r y   pr o vi de i n   s e c t i o n   5.       2.   L I T E RA T UR E   RE VI E W   R e s e a r c h   ut i li z i ng  m u l t il i ngua l   l e a r ni ng  m o de l s ,   s uc h   a s   m u l t i li ngua l   B E R T   ( M - B E R T ) ,   h a s   be e c o n duc t e f o r   s o m e   t i m e .   I n   t h e   s t ud y   [ 7] h a t e   s p e e c h   c l a s s i f i c a t i o n   a c hi e v e n o t a bl e   r e s u l t s   u s i ng  M - B E R T   i n   v a r i o us   s e t t i n gs .   F o r   t h e   m u l t i li ngua l   ba s e li ne   M - B E R T ,   t h e   m o de l   s h o we m o de r a t e   a c c ur a c y ,   w i t h   t h e   hi g h e s t   pe r f o r m a nc e   o b s e r v e i n   H i nd i   ( 73. 7% ) ,   f o l l o we by   E n g li s h   ( 73. 6% ) ,   a n l o we r   a c c ur a c y   in  Ge r m a n   ( 69. 9% ) .   T h e s e   r e s u l t s   i nd i c a t e   t h a t   t h e   b a s e l i ne   M - B E R T   m o de l   c a n   h a n d l e   m u l t i li ng ua l   h a t e   s pe e c h   c l a s s if i c a t i o n   r e a s o n a bly   we ll   b ut   s t r uggl e s   w i t h   c e r t a i n   l a n gua g e s   li ke   Ge r m a n .   W h e n   a u g m e n t e d   w i t h   GA N,   s i g nif i c a n t   i m pr o v e m e n t s   we r e   o b s e r ve d   a c r o s s   a l l   l a n gu a ge s .   T h e   a c c ur a c y   f o r   Hi n d i   in c r e a s e to   78 . 3% ,   whi l e   E n g li s h   r e a c he 75. 3% ,   a n Ge r m a n   s h o we t h e   m o s t   s ub s t a n t i a l   im pr o v e m e n t ,   r i s i ng  t 77. 1% .   T h e s e   f i nd i ngs   hi g hli g h t   t h e   e f f e c t i v e n e s s   o f   c o m bi n i ng  M - B E R T   w i t h   G A t o   e n h a n c e   h a t e   s pe e c c l a s s if i c a t i o n ,   pa r t i c u l a r ly   i n   a ddr e s s i ng  l a n gua ge   di v e r s i t y   a n b o o s t i n c l a s s if i c a t i o n   a c c ur a c y   a c r o s s   m u l t i li ngu a l   da t a s e t s .   A dd i t i o n a ll y ,   r e s e a r c h e r s   [ 8]   c o m pa r e d i f f e r e n t   w o r d   e m b e dd i ng s ,   s uc h   a s   M USE   a n E L M O,     to   a s s e s s   t h e i r   i n f l ue n c e   o n   m o de l   pe r f o r m a n c e .   Ho we v e r ,   t h e   M - B E R T   m o de l   do e s   n o a l wa ys     o u t pe r f o r m   o t h e r   m o de l s   i t e r m s   o f   F 1 - s c o r e .   F o r   i n s t a n c e ,   i n   s e n t i m e n t   a n a ly s i s   r e s e a r c by   [ 9]   f a s t T e x t   +   B i - L S T M   r a n ke s e c o n d,   c l o s e ly   c o m pe t i n w i t h   M - B E R T ,   w i t h   F 1 - s c o r e s   o f   80. 37%   o n   t h e   UC S A   da t a s e t   a n 76. 50 %   o n   t h e   UC S A - 21  d a t a s e t.   I n   t hi s   s t udy ,   t h e   us e   o f   da t a   a ugm e n t a ti o n   w i t   GA N s   pr o v e to  e n h a n c e   a c c ur a c y   by   6% ,   s h o w i ng  a   s upe r i o r   pe r f o r m a nc e   c o m pa r e to  b a c k - tr a n s l a t i o n   a n d   E DA   [ 10] .       3.   M E T HO D   I n   t hi s   s e c t i o n ,   we   de s c r i be   t h e   r e s e a r c h   m e t h o do l o g y ,   f o c us i ng  o n   t e x c l a s s i f i c a t i o n   t e c hni que s   o u t l i ne i n   F i gur e   1.   T h e   pr o c e s s   b e ga n   w i t h   da t a   c o l l e c t i o n ,   f o l l o we by   pr e pr o c e s s i n t o   c l e a n ,   no r m a li z e ,   a n s t r uc t ur e   t h e   da t a ,   e n s ur i n c o n s i s t e nc y   a nd  qua l i t y   a c r o s s   s a m p l e s .   T h e   da t a s e t   wa s   t h e d i vi de   i n t o   tr a i ni ng,   v a li da t i o n ,   a n t e s t i n s e t s   to   e n a bl e   a   c o m pr e h e ns i ve   e v a l ua t i o n   o f   m o de l   p e r f o r m a n c e .     Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776         M ult il ingual   hate  s pe e c de tec ti on  us ing  de e lear ning   ( V ince nt)   1017   Va r i o us   da t a   a ugm e n t a t i o n   t e c hni que s   we r e   s u b s e que n t l y   a pp li e t e x pa n a n d i ve r s if y   t h e   da t a s e t ,   e nh a nc i n m o de l   ge n e r a li z a bil i t y .   Ne x t ,   t h e   m o de l   wa s   t r a i n e us i ng  o pt i mi z e hy pe r pa r a m e t e r s   s e l e c t e t h r o ugh   s y s t e m a t i c   t un i n f o r   i m pr o v e pe r f o r m a n c e .   F i na ll y ,   e a c h   m o de l ' s   e f f e c t i v e n e s s   a n a c c u r a c y   we r e   r i go r o us l y   e v a l u a t e a n a n a ly z e w i t hi n   t h e   c o n t e x t   o f   t e x t   c l a s s if i c a t i o n   f o r   t h e   c h o s e n   do m a i n.           F i gur e   1.   P r o p o s e m e t h o d       3. 1.     Dat a   c ol l e c t ion   T h e   da t a   f o r   t hi s   r e s e a r c h   wa s   c o l l e c t e f r o m   Ha t e s pe e c h d a t a . c o m ,   a   r e l i a bl e   p l a t f o r m   pr o v i d i n g   da t a s e t s   f o r   h a t e   s pe e c h   a n a ly s i s .   T h e   da t a s e t   us e i n   t hi s   s t ud y   i nc l ude s   t e x t   i n   t h r e e   l a n gua ge s I n d o n e s i a n ,   E n g l i s h ,   a n Ge r m a n .   E a c h   p i e c e   o f   t e x t   i n   t h e   da tas e t   i s   l a b e l e to   i n d i c a t e   wh e t h e r   i t   c o n s t i t u t e s   h a t e   s pe e c o r   n o n - h a t e   s pe e c h .   No n - h a t e   s pe e c h   i ns t a n c e s   a r e   l a b e l e w i t h   a   bi na r y   0,   whil e   h a t e   s pe e c h   i ns t a n c e s   a r e   l a b e l e w i t h   a   bi na r y   1.   As   a n   e x a m p l e ,   t hi s   c a n   b e   s e e n   i n   T a bl e   1.       T a bl e   1.   E x a m p l e   da t a   c o l l e c t i o n   T w e e t   L a ngua g e   L a b e l   H e he h e  i tu la h dungun y a  ka mu  o ta k t e r ba li k s us a unt uk dij e la s ka n i tu  a na k i ngus a n ba r u t umbuh be lu pa nt a s  me nge r ti  s a na  ne t e  dul u s a ma  i bumu Da s a r  ka da ke bo n   I ndo n e s ia   1   te r im a  ka s ih  pa k ki ni  pa pua  pun y a  w a ja h ba r u ga k me ni ngga lk a n buda y a  me r e ka  t a pi  p e mba nguna n t id a me nga ba ik a n ke a r i f a n l oc a l   I ndo n e s ia   0   a vo id  p o li ti c a p o s ts  but  F U C K  Y o u M r . M o di f u c y our  p o li ti c s  a nd a ll   y o ur  i nhu ma ne  t a c ti c s  t o   le pe o pl e  di e . h tt ps :/ /t .c o/ hG a g T j3 I I u # I ndi a C ov id C r is is   E ngl is h   1   @ ma r ti n_c o mps t o n @ B r it B ox _U S  Ã ¢â ¬ Å M a r y   , J o s e ph a nd  t he  w e e  D o nk e y , ha v e   y ou n ot  he a r of   pho t o s h o p s o n ?  Y o u' ve  j us a th e  i n te r ne a  c ha ll e ng e , a  c ha ll e nge  t h e y ' ll  t a k e !   E ngl is h   0   R T  @ H ih i9 7948034: M e r o  i s e in   H u r e ns o hn   G e r ma n   1   B a r kl e y  >  X a v ht tp s :/ /t . c o /S A n c B 0k T 6F   G e r ma n   0       3. 2.     P r e p r oc e s s in d at a   T e x t   p r e pr o c e s s i n i nv o l v e s   a   s e r i e s   o f   s t e ps   to  m a ni pu l a t e   a n c l e a n   t e x f o r   m o r e   e f f e c t i v e   pr o c e s s i n w i t h   NL P .   P r e pr o c e s s i ng  i nc l ud e s   s e ve r a l   s t a ge s   t c l e a n   a n t r a n s f o r m   r a t e x t   i n t o   a   f o r m a t   s u i t a bl e   f o r   a n a ly s i s   i n   m o de li ng,   e n s ur i n hi g h - qua l i t y   r e s u l t s   T h e   f o l l o w i ng  a r e   t h e   pr e p r o c e s s in s t e ps   [ 11] :   a)   C l e a ni ng:  t h e   pr o c e s s   o f   r e m o vi ng  s p e c i a l   c h a r a c t e r s ,   n u m be r s ,   s pa c e s ,   UR L s ,   e m o t i c o ns ,   a n d   unn e c e s s a r y   s ym b o l s   f r o m   t h e   t e x t .   T h e   m a i n   go a l   i s   t c l e a n   t h e   t e x o f   i r r e l e v a n t   e l e m e n t s   or   n o i s e .   b)   C a s e   F o l d i ng:  c o nv e r t i n a ll   l e t t e r s   i n   t h e   t e x t   to  e i t h e r   l o we r c a s e   o r   uppe r c a s e .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 4 ,   N o.   3 De c e m be r   20 2 5 :   1015 - 1023   1018   c)   F il t e r i n g:  i r r e l e va n t   wor ds ,   pa r t i c u l a r ly   s t o w or ds ,   a r e   r e m o v e f r o m   t h e   t e x t .   S to w o r ds   a r e   c o m mo nly   us e t e r m s   t h a pr o v i d e   l i t t l e   va l ue   to  t h e   a n a l y s is ,   s uc h   a s   t h e ,   i s ,   or   a n d   a n f il t e r i n t h e m   o ut   h e l p s   f o c us   o n   m o r e   r e l e v a n t   w o r ds .   d)   S t e m mi ng:  t h e   pr o c e s s   o f   r e m o vi ng  wo r d   s u f f i xe s   to   r e t ur n   t h e   wor d   to  i t s   r oot  f o r m .   S pe c i f i c a ll y,   t h e   m e t h o o p t i mi z e s   a n a ly s i s   by   ha n d l i ng  d i f f e r e n t   wo r d   f o r m s .   e)   T o ke ni z i ng:  b r e a k i ng  t h e   t e x t   i n t o   s m a ll e r   u ni t s   s u c h   a s   wo r ds   or   ph r a s e s .     3. 3.     S p l it   d at as e t   I n   da t a   pr o c e s s i n f o r   de e l e a r ni ng,   i t   i s   i m po r t a n t   to   s pl i t   t h e   da t a   i n to   s ub s e t s   s o   t h a t h e   m o de l   c a n   be   e f f e c t i v e ly   t r a i ni ng,   v a li da t i o n ,   a n t e s t i n g.   F r o m   T a bl e   2,   we   s e e   t h a t   a   c o m m o n   a ppr o a c h   i s   t o   di vi de   t h e   da t a   i n t 80%   tr a i ni ng  da t a ,   10%   v a l i da t i o n   da t a ,   a n 10%   t e s t i n da t a .   T hi s   s p li t   e n s ur e s   t h a t   t h e   m o de l   h a s   e n o ugh   da t a   to   l e a r n   f r o m   ( t r a i ni ng  da t a ) ,   m o ni t o r   a n a d j u s t   i t s   pe r f o r m a n c e   ( v a li da t i o n   d a t a ) ,   a n m e a s ur e   i t s   f i na l   pe r f o r m a n c e   o n   pr e vi o u s l y   u n s e e n   da t a   ( t e s t i n da t a ) .   W i t h   t hi s   a l l o c a t i o n ,   t h e   m o de l   is   e x pe c t e to   g e n e r a l i z e   we ll   a n de li ve r   a c c ur a t e   pe r f o r m a n c e .       T a bl e   2.   S pl i t t i n d a t a   L a ngua g e   L a b e l   T r a in in g ( 80% )   V a li da ti o n   ( 10% )   T e s ti ng   ( 10 % )   I ndo n e s ia   N o n - h a t e   s pe e c h ( 0)   5,023   628   628   h a te   s pe e c ( 1)   6,048   756   756   E ngl is h   N o n - h a t e   s pe e c h ( 0)   1,073   134   134   h a te   s pe e c ( 1)   2,001   250   250   G e r ma n   N o n - h a t e   s pe e c h ( 0)   1,659   207   208   h a te   s pe e c ( 1)   633   79   79       3. 4.     Dat a   a u gm e n t at ion   Da t a   a ugm e n t a t i o n   t e c hni que s   a r e   e s s e n t i a l   f o r   a ddr e s s i ng  t h e   i m ba l a n c e   i n   t h e   da t a s e t ,   a s   s h o wn   i T a bl e   a n F i gur e   2.   I n   t h e   I n do n e s i a n   da t a s e t ,   t h e   n u m b e r   o f   n o n - h a t e   s pe e c h   s a m p l e s   ( 5, 023)   i s   s i g nif i c a n t l y   l o we r   t h a n   t h a t   o f   h a t e   s pe e c h   s a m p les   ( 6, 048) ,   wi t h   a   d i f f e r e n c e   o f   1, 025  i ns t a n c e s .   A   s im il a r   im ba l a n c e   i s   s e e n   i n   t h e   E n g li s h   da t a s e t ,   wh e r e   n on - h a t e   s pe e c h   ( 1, 073)   i s   c o n s i de r a bly   l e s s   t h a n   h a t e   s pe e c ( 2, 001) ,   r e s u l t i n i n   a   d i f f e r e n c e   o f   928  i ns t a n c e s .   T h e   Ge r m a n   da t a s e t   s h o ws   t h e   m o s t   e x t r e m e   i mb a l a n c e ,   w i t h   n o n - h a t e   s pe e c h   ( 1, 659)   o u t n u m b e r i ng  h a t e   s pe e c h   ( 633)   by   1, 026  i n s t a n c e s .   T hi s   i m ba l a n c e   c a n   l im i t   t h e   m o de l s   a bil i t y   t ge n e r a l i z e   a n i n t r o duc e   bi a s   to wa r d   t h e   m a j o r i t y   c l a s s ,   whi c h   i n   t ur n   c a n   r e duc e   t h e   a c c ur a c y   o f   pr e d i c t i o n s   f o r   t h e   m i n o r i t y   c l a s s .     F i gur e   i ll us t r a t e s   t h e   di s t r i b ut i o n   o f   t r a i ni ng  da t a   a c r o s s   t h r e e   l a n gua ge s I n do n e s i a n ,   E n g l i s h ,   a n d   Ge r m a n ,   c o m pa r i ng  t h e   da t a   b e f o r e   a n a f t e r   a ugm e n t a t i o n .   F i gur e   2( a )   r e p r e s e n t s   t h e   c o un o f   da ta  s a m p l e s   i t h e   n o n - a ug m e n t e da t a s e t .   F i gur e   2( b )   s ho ws   t h e   d i s t r i b ut i o n   a f t e r   a pp l yi ng  da t a   a ugm e n t a t i o t e c h ni que s ,   whi c h   r e s u l t e i n   a   m o r e   b a l a nc e r e pr e s e n t a t i o n   o f   h a t e   s pe e c h   ( l a b e l e a s   1 )   a n n o n - h a t e   s pe e c h   ( l a b e l e a s   0 )   a c r o s s   t h e   t h r e e   l a n gua g e s .   T a c hi e ve   t hi s   b a l a nc e ,   t h e   s t udy   e m p l o y s   t h r e e   da t a   a ug m e n t a t i o n   t e c hni que s E DA ,   b a c t r a n s l a t i o n ,   a n GA Ns .   T h e s e   m e t h o ds   e nh a n c e   t h e   di v e r s i t y   a n d   v o l u m e   o f   tr a i ni ng  da t a ,   a ddr e s s i n t h e   i m ba l a nc e   a n i m pr o vi ng  t h e   m o de l 's   a bil i t y   t ge n e r a l i z e   a c r o s s   m u l t i li ngu a l   da t a s e t s .           ( a )   ( b )     F i gur e   2.   T r a i ni ng  da t a   ( a )   b e f o r e   a ug m e n t a t i o n   a nd  ( b )   a f t e r   a ugm e n t a t i o n     Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776         M ult il ingual   hate  s pe e c de tec ti on  us ing  de e lear ning   ( V ince nt)   1019   3. 4. 1 .   E as d at a   au gm e n t at ion   E DA   i s   a   t e c hni que   us e i n   NL P   t i n c r e a s e   t h e   a m o u n t   o f   t r a i ni ng  da t a   by   ge n e r a t i n v a r i a t i o n s   o f   e xi s t i n da t a .   T h e   pr i m a r y   go a l   o f   E D A   i s   to  i m pr o v e   m o de l   pe r f o r m a nc e   by   i n t r o duc i n s li g h t   v a r i a t i o n s   in  t h e   tr a i ni ng  da t a ,   e n a bli ng  t h e   m o de l   t l e a r n   f r o m   a   w i d e r   r a n ge   o f   e xa m p l e s .   T h e   m a i n   t y pe s   o f   E DA   i nc l ude   [ 12] [ 13 ] :   a)   S y n o nym   r e p l a c e m e n t i n   t hi s   a ppr o a c h ,   w o r ds   i n   t h e   t e x a r e   r e pl a c e w i t h   t h e i r   s y n o ny m s .   T hi s   c a n   b e   do n e   us i n a   t h e s a ur us   o r   wor e m b e dd i ng  m o de l s   to   f i nd  wo r ds   w i t h   s im i l a r   m e a ni ng s   i n   s p e c i f i c   c o n t e x t s .   b)   R a n do m   i ns e r t i o n t hi s   m e t h o i nv o l v e s   r a ndo m ly   i ns e r t i n a dd i t i o na l   wo r ds   i n t o   t h e   t e x t.     T h e s e   e x t r a   wo r ds   c a n   b e   c h o s e n   f r o m   ot h e r   da t a   T hi s   he l ps   i n t r o duc e   m o r e   v a r i e t y   a n r i c hn e s s   in   t h e   da t a .   c)   R a n do m   s wa p:  i n   t hi s   a ppr o a c h ,   t h e   or de r   o f   wor ds   i n   a   s e n t e n c e   i s   r a n do m ly   s wa ppe to  c r e a t e   n e v a r i a t i o n s   o f   t h e   t e x t .   d)   R a n do m   d e l e t i o n t hi s   m e t h o i nv o l ve s   r a n do ml y   de l e t i n wo r ds   f r o m   t h e   t e x t .   T hi s   i n t r oduc e s     v a r i a t i o n   by   r e m o vi ng  c e r t a i n   wo r ds ,   f o r c i n t h e   m o de l   to  r e l y   m o r e   o n   t h e   c o n t e x o f   t h e   r e m a ini ng   wo r ds .     3. 4. 2 .   B ac k   t r an s l at ion   B a c t r a n s l a t i o n   i s   us e a s   a   da t a   a ugm e n t a t i o t e c h ni qu e   i n   NL P   to  i nc r e a s e   va r i a t i o n   a n t h e   a m o un t   o f   t r a i ni ng  da t a .   T hi s   t e c hni qu e   i nv o l v e s   tr a n s l a t i n t h e   o r i g i na l   t e x t   i n to   a n ot h e r   l a n gu a ge   a n t h e t r a n s l a t i n i t   b a c to   t h e   o r i g i na l   l a ngua ge   [ 14] .   B y   do i n s o ,   i t   i n t r o duc e s   s ub t l e   c h a n ge s   i n   s e n t e n c e   s t r uc t ur e ,   v o c a b u l a r y ,   a n ph r a s i ng,   whi c h   h e l t h e   m o de l   ge ne r a l i z e   b e t t e r   to  un s e e n   da t a .   T hi s   a ppr o a c h   i s   pa r t i c u l a r l y   e f f e c t i v e   f o r   l o w - r e s o ur c e   l a n gu a ge s   o r   da t a s e t s   wi t h   l im i t e d i v e r s i t y .   I n   t hi s   s t udy ,   I n d o n e s i a n ,   E n g l i s h ,   a n Ge r m a n   da t a   wi ll   b e   t r a n s l a t e d   i n t F r e n c h   a n t h e n   b a c to  t h e i r   r e s pe c t i v e   o r i g i na l   l a n gua ge s .   T h e   us e   o f   F r e n c h   a s   a n   i n t e r m e d i a t e   l a n gua ge   wa s   c h o s e n   to   l e v e r a ge   i t s   s t r uc t u r a l   d i f f e r e n c e s   f r o m   t h e   s o ur c e   l a n gu a ge s ,   t h e r e by   i n t r o duc i n m e a ni ng f u l   v a r i a t i o ns .   T hi s   pr o c e s s   n ot   o nl y   e n r i c h e s   t h e   tr a i ni n g   da t a s e b ut  a l s o   e n ha n c e s   t h e   r o b us t n e s s   o f   m o de l s   by   e x po s i ng  t h e m   to  m u l t i p l e   l i ngu i s t i c   pa tt e r n s   a n d   v a r i a t i o n s   de r i ve f r o m   t r a n s l a t i o n .     3. 4. 3 .   Gener at ive  ad ve r s a r ia l   n e t wo r k s   GA N s   a r e   a n   i nn o v a t i v e   m e t h o i n   t e x t   da t a   a u g m e n t a t i o n ,   c o n s i s t i n o f   t wo  m a i n   c o m po n e n t s :     t h e   ge n e r a t o r   a n t h e   d i s c r i mi na t o r   [ 15] .   T h e   ge n e r a t o r   i s   r e s po n s i b l e   f o r   c r e a t i n s y n t h e t i c   t e x t   t h a r e s e m bl e s   t h e   o r i g i na l   t e x t ,   a i mi ng  to   m im i c   t h e   l i ngu i s t i c   pa t t e r n s   a n s e m a n t i c   s t r uc t ur e   f o un i n   t h e   t r a i ni ng  da t a .   On   t h e   ot h e r   h a n d,   t h e   d i s c r i mi na t o r   a c t s   a s   a   s upe r vi s o r ,   e v a l u a t i n a n d i s t i n gu i s hi ng  b e t we e t h e   o r i g i na l   t e x t   a n t h e   s y n t h e t i c   t e x t   ge n e r a t e by   t h e   ge n e r a t o r .   Dur i n t h e   t r a i ni n pr o c e s s ,   t h e   g e n e r a t o r   c o n t i n uo us l y   im pr o v e s   i t s   a bil i t y   t o   p r o duc e   m o r e   r e a l i s t i c   a n c o n t e x t ua l ly   a ppr o pr i a t e   t e x t ,   whil e   t h e   d i s c r i mi na t o r   b e c o m e s   i nc r e a s i ng ly   s k il l e a t   i de n t i f yi ng  s u b t l e   d i f f e r e n c e s   b e t we e n   r e a l   a n s y n t he t i c   t e x t .   T hi s   a dv e r s a r i a l   t r a i ni ng  d y n a mi c   pus h e s   b o t h   c om po n e n t s   to  i m pr o v e   i t e r a t i v e ly ,   u l t i m a t e l y   r e s u l t i ng  i n   a   ge n e r a t o r   t h a t   c a n   pr o duc e   hi g hly   c o nvi nc i ng  s y n t he t i c   t e x t .   B y   l e v e r a g i ng  t hi s   m e t h o d,   GA Ns   c a e f f e c t i v e ly   e nha n c e   da t a s e t s ,   i m pr o v e   m o de l   r o b us t n e s s ,   a n a ddr e s s   da t a   s c a r c i t y   c h a ll e n g e s   i n   t a s ks   s uc h   a s   s e n t i m e n t   a n a ly s i s ,   m a c hi ne   t r a n s l a t i o n ,   a n t e x t   c l a s s if i c a t i o n   [ 16] .     3. 5.     M u l t il in gu al   m od e l   3. 5. 1.   F as t T e x t + B i - L S T M   F a s t T e x t   i s   a   wo r d   r e pr e s e n t a t i o n   m o de l   de v e l o pe by   F a c e b o o A I   r e s e a r c h   ( F A I R )   t h a i s   us e a s   wo r d   e m b e dd i ng  f o r   t h e   t h r e e   l a n gua g e s   i n   t hi s   s t ud y I n do n e s i a n ,   E n g l i s h ,   a n Ge r m a n   [ 17] [ 18]   T m a xim i z e   t h e   us e   o f   F a s t T e x t   w or r e pr e s e n t a t i o n s ,   t hi s   m o de l   i s   c o m bi ne w i t h   B i - L S T M ,   a   t y pe   o f   r e c ur r e n t   n e ur a l   n e t w o r k   ( R NN )   de s i g ne to  h a nd l e   l o n g - r a n ge   de pe n d e n c i e s   i n   s e qu e n t i a l   da t a .   Bi - L S T M   pr o c e s s e s   t h e   i n put   n o o nl y   i n   t h e   f o r wa r di r e c t i o n   b ut   a l s o   i n   t h e   b a c kwa r d i r e c t i o n ,   a l l o w i ng  t he   m o de l   to  c a p t ur e   c o n t e x f r o m   b o t h   s i de s   o f   a   to ke n   i n   t h e   s e que n c e   [ 19] [ 20] .   T h e   c o m bi na t i o n   o f   F a s t T e x t   f o r   wo r d   r e pr e s e n t a t i o n   a n B i - L S T M   f o r   s e que n c e   m o de l i ng  e n a bl e s   t h e   m o de l   to   b e tt e r   un de r s t a n t h e   s e m a n t i c   m e a ni ng  o f   t e x t   a n i t s   c o n t e x t ,   m a k i ng  i t   s u i t a bl e   f o r   t e x t   c l a s s i f i c a t i o n   t a s ks   s uc h   a s   h a t e   s pe e c de t e c t i o n .   I n   t hi s   s t ud y ,   e x t e n s i ve   hy pe r pa r a m e t e r   t un i n wa s   c o n duc t e to  i de n t i f y   t h e   o p t i m a l   s e t ti ngs   f o r   t h e   c o m bi ne F a s t T e x a n B i - L S T M   m o de l .   K e y   pa r a m e t e r s   a dj u s t e i n c l ude t h e   l e a r ni ng  r a t e ,   dr o p o u t   r a t e ,   a n t h e   n u m b e r   o f   uni t s   i n   t h e   B i - L S T M   l a y e r .   E a c h   c o n f i gur a t i o n   wa s   e v a l ua t e b a s e o n   v a l i da t i o a c c ur a c y   t de t e r m i ne   i t s   e f f e c t i ve n e s s   i n   c a pt ur i n c o n t e x t ua l   a n s e m a n t i c   i nf o r m a t i o n   f o r   a c c ur a t e   t e x c l a s s if i c a t i o n .   T hi s   pr o c e s s   i s   s u mm a r i z e i n   T a bl e   2.       Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 4 ,   N o.   3 De c e m be r   20 2 5 :   1015 - 1023   1020   Af t e r   c o n duc t i n v a r i o us   hy p e r pa r a m e t e r   e x pe r i m e n t s   a n a n a ly z i ng  t h e   tr a i ni ng  a n v a li da t i o a c c ur a c y   c ur v e s ,   t h e   o p t i m a l   c o nf i gur a t i o n   i n   T a bl e   wa s   s e l e c t e w i t h   a   l e a r ni ng  r a t e   o f   0. 001,   dr o p o u o f   0. 4,   a n uni t s .   T hi s   c o nf i gur a t i o n   wa s   c h o s e n   b e c a us e   t h e   a c c ur a c y   c ur v e s   de m o ns t r a t e   m i n im a l   o ve r f i t t i n g,   w i t h   a   s t a bl e   r e l a t i o n s hi b e t we e n   t r a i ni ng  a n v a li da t i o n   a c c ur a c y .       T a bl e   3.   B e s t   hy pe r pa r a m e t e r   t uni n g   L e a r ni ng  r a te   H y p e r pa r a m e t e r   d r o p o ut   r a te   U ni ts   V a li da ti o a c u r a c y   0.01   0.5   32   0.8364   0.01   0.5   8   0.8359   0.01   0.4   32   0.8354   0.01   0.4   16   0.8349   0.001   0.4   8   0.8349   0.01   0.4   16   0.8349       3. 5. 2.   M - B E RT   M - B E R T   i s   a   t r a n s f o r m e r - ba s e m o de l   de s ign e t o   p r o c e s s   t e x t   i n   m u l t i p l e   l a n gua ge s   s i m u l t a n e o us ly   [ 21] [ 22 ] .   I i s   t h e   m u l t il i ngu a l   v e r s i o n   o f   B E R T ,   t r a i n e o n   t e x t   da t a   f r o m   v a r i o us   l a n gua ge s   w i t h o ut  s e pa r a t i n m o de l s   by   l a n gua ge .   W i t h   pr e - t r a i ni ng  a n f i ne - t uni n g,   M - B E R T   c a p t ur e s   s e m a n t i c   m e a ni ng  a n s y n t a c t i c   s t r uc t ur e   f r o m   t e x t ,   l e ve r a g i n b o t h   pr e vi o us   a n f o l l o w i ng  wo r ds   t h r o ugh   i t s   t r a n s f o r m e r   a r c hi t e c t ur e .   T h e   M - B E R T   m o de l   us e i n   t hi s   r e s e a r c h   i s   f r o m   t h e   goo gl e - be r t /b e r t - b a s e - m u l t i li ngu a l - c a s e v e r s i o n ,   e n a bli ng  i t   to   p r o c e s s   da t a   i n   I n do n e s i a n ,   E n g li s h ,   a n Ge r m a n .   T hi s   m o de l   [ 23] [ 24]   i s   pa r t i c u l a r ly   b e ne f i c i a l   f o r   t a s ks   i nv o l vi ng   m u l t il i ngua l   da t a s e t s ,   a s   i t   e n s ur e s   c o n s i s t e n t   a n r o b us t   pe r f o r m a n c e   a c r o s s   l a n gu a ge s   w i t h o ut  r e qui r i n lan gua g e - s pe c if i c   a da pt a t i o ns .   B y   us i ng  s h a r e pa r a m e t e r s   a c r o s s   l a n gua ge s ,   M - B E R T   e f f e c t i ve ly   l e a r n s   m u l t il i ngua l   r e pr e s e n t a t i o n s .       4.     RE S UL T   AN DI S CU S I ON   T h e   r e s u l t s   a n d i s c us s i o n   o f   o ur   r e s e a r c h ,   f o c us i n o n   t h e   e v a l ua t i o n   o f   m o de l   pe r f o r m a n c e   us i ng   a c c ur a c y   a n F 1 - s c o r e   m e t r i c s .   I n   t h e   m o de l   e v a l ua t i o n ,   we   t h o r o ughl y   a s s e s s   t h e   pe r f o r m a n c e   o f   t h e   pr o p o s e m o de l   us i ng  t w o   ke y   e v a l ua t i o n   m e t r i c s ,   a s   r e f e r e n c e i n   pr i o r   s t udi e s   [ 25 ] [ 26] :   a)   A c c ur a c y   i s   a   m e t r i c   t h a t   c a l c u l a t e s   t h e   pr o p o r t i o n   o f   c o r r e c t l y   c l a s s if i e i ns t a n c e s   o u t   o f   t h e   tot a l   i ns t a nc e s   i n   t h e   da t a s e t .   I t   i s   de t e r m i ne by   d ivi d i ng  t h e   s u m   o f   t r ue   p o s i t i v e   a n t r ue   n e ga t i ve   pr e d i c t i o n s   by   t h e   t ot a l   n u m be r   o f   i ns t a n c e s ,   a s   s h o wn   i n   t h e   f o r m u l a :       =   +  +  +                                                                                                                                                                                              ( 1)     b)   F1 - s c o r e   i s   t h e   h a r m o ni c   m e a n   o f   pr e c i s i o n   a n r e c a l l ,   a n i t   pr o vi de s   a   b a l a n c e m e a s ur e   o f   a   m o de l 's   a c c ur a c y   by   c o m bi n i ng  b o t h   m e t r i c s .   T h e   F 1 - s c o r e   i s   pa r t i c u l a r ly   u s e f u l   w h e n   de a li ng  w i t h   i m ba l a nc e da t a s e t s ,   a s   i t   c o n s i de r s   b o t h   t h e   pr e c i s i o n   ( t h e   pr opo r t i o n   o f   t r ue   p o s i t i v e   pr e d i c t i o n s   a m o n a l l   po s i t i ve   pr e d i c t i o n s )   a n r e c a l l   ( t h e   pr o p o r t i o n   o f   t r ue   p os i t i v e s   a m o n a l l   a c t ua l   po s i t i v e s ) .   T h e   f o r m u l a   f o r     F1 - s c o r e   i s :     1  = 2   ×        ×        +                                                                                                                                                            ( 2)     A   hi g he r   a c c ur a c y   v a l ue   i n d i c a t e s   t h a t   t h e   m o de l   i s   e f f e c t i v e   i n   c o r r e c t l y   i de n t i f yi ng  b o t h     po s i t i v e   a n n e ga t i v e   c l a s s e s ,   pr o vi d i ng  a   s t r a i g h t f o r wa r d   m e a s ur e   o f   i t s   o v e r a l l   pe r f o r m a n c e .   B e s i de s   t h a t ,   a   hi g h e r   F 1 - s c o r e   i n d i c a t e s   b e t t e r   pe r f o r m a n c e ,   e s pe c i a ll y   i n   s c e n a r i o s   wh e r e   c e r t a i n   c l a s s e s   m a y   d o m i na t e .   T hi s   m a ke s   F 1 - s c o r e   a   v a l ua bl e   m e t r i c   wh e a c c ur a c y   a l o n e   m a y   n o p r o vi d e   a   c o m p l e t e   m o de l s   e f f e c t i v e n e s s .   B a s e o n   t h e   r e s u l t s   i n   T a bl e   4,   we   i de n t i f y   t h e   b e s t - pe r f o r m i ng  da t a   a ug m e n t a t i o n   t e c h ni que s   f o r   e a c h   l a n gua g e   a c r o s s   b o t h   m o de l s .   F o r   t h e   F a s t T e x t   +   B i - L S T M   m o de l ,   R andom  I ns e r ti on   pe r f o r m s   b e s t   f o r   I n do n e s i a n   w i t h   a n   a c c ur a c y   o f   0. 879  a n a n   F 1 - s c o r e   o f   0. 889,   E DA   ( Sy nony R e place me nt)   i s   m o s e f f e c t i v e   f o r   E n g l i s h   w i t h   a n   a c c ur a c y   o f   0. 831  a n a n   F 1 - s c o r e   o f   0. 872,   a n R andom   De letion   y i e l ds   t h e   hi g h e s pe r f o r m a n c e   f o r   Ge r m a n   w i t h   a n   a c c ur a c y   o f   0. 830   a n a n   F 1 - s c o r e   o f   0. 853 .   I n   t h e   c a s e   o f   M - B E R T ,   R andom  De letion   s h o ws   t h e   b e s t   r e s ul t s   f o r   I n do n e s i a n   ( a c c ur a c y 0. 880,   F 1 - s c or e 0 . 898) ,   R andom  S w ap   i s   o pt i m a l   f o r   E n g li s h   ( a c c ur a c y 0. 866,   F 1 - s c o r e 0 . 870) ,   a n R andom  De letion   a ga i n   a c hiev e s   t h e   hi g h e s t   a c c ur a c y   a n F 1 - s c o r e   f o r   Ge r m a n   ( a c c ur a c y 0. 858,   F 1 - s c o r e 0 . 662) .   T h e s e   f i nd i ng s   s ugge s t h a t   t h e   e f f e c t i v e n e s s   o f   da t a   a ugm e n t a t i o n   t e c h ni que s   va r i e s   by   l a n gua ge   a n m o de l .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776         M ult il ingual   hate  s pe e c de tec ti on  us ing  de e lear ning   ( V ince nt)   1021   T a bl e   pr o vi de s   a   c o m pa r i s o n   o f   a v e r a ge   m o de l   pe r f o r m a n c e   w i t h   a n w i t h o ut   da t a   a ugm e n t a t i o f o r   b o t h   F a s t T e x t   +   B i - L S T M   a n M - B E R T   a c r o s s   t h r e e   l a n gu a ge s .   F o r   F a s t T e x t   +   B i - L S T M ,   t h e   i n c l u s i o o f   s i x   da t a   a ug m e n t a t i o n   t e c hni que s   im pr o v e s   pe r f o r m a n c e   f o r   E n g l i s h   a n Ge r m a n ,   y i e l d i ng  hi g h e r   a c c ur a c y   ( 0. 800   f o r   E n g l i s h   a n 0. 840  f o r   Ge r m a n )   a n F 1 - s c o r e s   ( 0 . 845  f o r   E n gl i s h   a n 0. 718  f o r   Ge r m a n )   c o m pa r e d   to  t h e   b a s e li ne .   Ho we v e r ,   f o r   I n do n e s i a n ,   t h e   a c c ur a c y   ( 0. 864)   a n F 1 - s c o r e   ( 0 . 879)   a r e   o nl y   s li g h t l y   hi g h e r   t h a n   t h e   b a s e li ne .   I n   t h e   c a s e   o f   M - B E R T ,   a ppl yi ng  da t a   a ugm e n tat i o n   a l s o   e n ha n c e s   pe r f o r m a n c e ,   e s pe c i a ll y   f o r   E n g l i s h ,   w h e r e   t h e   F 1 - s c o r e   i m pr o v e s   f r o m   0. 829  to   0 . 851.   T h e   a c c ur a c y   a n d   F1 - s c o r e s   f o r   Ge r m a n   a l s o   i nc r e a s e   w i t h   da t a   a ug m e n t a t i o n ,   t h o ugh   t h e   i m pr o v e m e n t   i s   m o r e   m o de s t   ( f r o m   0. 787  to   0 . 798  i n   a c c ur a c y   a n f r o m   0. 590  to   0 . 633  i n   F 1 - s c o r e ) .   F or   I n do n e s i a n ,   h o we v e r ,   t h e   b a s e li ne   m o de l   ( a c c ur a c y   o f   0. 886  a n F1 - s c o r e   o f   0. 897)   s l i g h t l y   o ut pe r f o r m s   t h e   a ve r a ge   w i t h   da t a   a ug m e n t a t i o n   ( a c c ur a c y   o f   0. 870  a n d     F1 - s c o r e   o f   0. 886) .   Ov e r a l l ,   da t a   a ugm e n t a t i o n   ge n e r a ll y   im pr o v e s   pe r f o r m a nc e ,   wi t h   t h e   m o s n ot a bl e   ga i ns   o b s e r v e f o r   E n g l i s h   a n Ge r m a n ,   e s pe c i a ll y   i n   t e r m s   o f   F 1 - s c o r e ,   whi l e   t h e   i m p a c t   o n   I n do n e s i a n   i s   l e s s   s i g nif i c a n t .       T a bl e   4.   M o de l   c o m p a r i s o n   F a s t T e x t   +   B i - L S T M   a n M - B E R T   M o de l   D a ta   a ugme nt a ti o n   I ndo n e s ia   E ngl is h   G e r ma n   A c c u r a c y   F1 - s c o r e   A c c u r a c y   F1 - s c o r e   A c c u r a c y   F1 - s c o r e   F a s tT e x t+   Bi - L S T M   N o n e  ( B a s e li n e )   0.859   0.873   0.779   0.838   0.804   0.575   E D A  ( S y n o n y r e pl a c e m e nt )   0.875   0.888   0.831   0.872   0.808   0.670   E D A  ( R a ndo i ns e r ti o n)   0.879   0.889   0.813   0.850   0.853   0.720   E D A  ( R a ndo s w a p)   0.865   0.873   0.794   0.831   0.881   0.763   E D A  ( R a ndo d e le ti o n)   0.869   0.877   0.792   0.830   0.853   0.853   B a c t r a ns la ti o n   0.872   0.885   0.815   0.863   0.832   0.684   G A N s   0.826   0.862   0.758   0.824   0.818   0.623   M - B E R T   N o n e  ( B a s e li n e )   0.886   0.897   0.776   0.829   0.787   0.590   E D A  ( S y n o n y r e pl a c e m e nt )   0.876   0.889   0.815   0.864   0.822   0.653   E D A  ( R a ndo i ns e r ti o n)   0.864   0.879   0.818   0.861   0.818   0.638   E D A  ( R a ndo s w a p)   0.865   0.883   0.815   0.866   0.780   0.663   E D A  ( R a ndo d e le ti o n)   0.880   0.898   0.802   0.858   0.818   0.662   B a c t r a ns la ti o n   0.872   0.887   0.801   0.855   0.780   0.577   GA Ns   0.867   0.883   0.722   0.807   0.770   0.609       T a bl e   5.     A v e r a ge   m o de l   c o m pa r i s o n   M o de l   D a ta   a ugme nt a ti o n   I ndo n e s ia   E ngl is h   G e r ma n   A c c u r a c y   F1 - s c o r e   A c c u r a c y   F1 - s c o r e   A c c u r a c y   F1 - s c o r e   F a s tT e x t+   Bi - L S T M   N o n e  ( B a s e li n e )   0.859   0.873   0.779   0.838   0.804   0.575   A ve r a g e  w it h 6 da ta   a ugme nt a ti o n   0.864   0.879   0.800   0.845   0.840   0.718   M - B E R T   N o n e  ( B a s e li n e )   0.886   0.897   0.776   0.829   0.787   0.590   A ve r a g e  w it h 6 da ta   a ugme nt a ti o n   0.870   0.886   0.795   0.851   0.798   0.633       5.   CONC L USI ON   O ur   r e s e a r c h   de m o n s t r a t e s   t h e   i m pa c t   o f   v a r i o us   d a t a   a ugm e n t a t i o n   t e c hni que s   o n   m u l t i li ngua l   h a t e   s pe e c h   de t e c t i o n   a c r o s s   I n do ne s i a n ,   E n g li s h ,   a n Ge r m a n   da t a s e t s .   B y   l e v e r a g i ng  a ug m e n t a t i o n   m e t h o ds   l i k e   r a n do m   i n s e r t i o n ,   s y n o nym   r e p l a c e m e n t ,   a n r a n do m   de l e t i o n ,   we   o b s e r v e n o t a bl e   i m pr o v e m e n t s   i n   m o de l   pe r f o r m a n c e ,   pa r t i c u l a r ly   w i t h   F 1 - s c o r e s ,   whi c h   a r e   c r uc i a l   i i m ba l a nc e da t a s e t s   t y p i c a l   o f   h a t e     s pe e c h   de t e c t i o n .   T h e   F a s t T e x t   +   B i - L S T M   a n M - B E R T   m o de l s   s h o we d i f f e r i ng  s t r e n gt h s   de pe n d i ng  o n   t h e   l a n g ua ge ,   hi g hli g h t i n t h a t   l a n gua g e - s pe c if i c   n ua n c e s   c a n   s i g nif i c a n t l y   i nf l u e n c e   t h e   e f f e c t i ve n e s s   o f     b o t h   m o de l s   a n a ug m e n t a t i o n   s t r a t e gi e s .   E n g l i s h   a n Ge r m a n   da t a s e t s   b e n e f i t e t h e   m o s f r o m   a ug m e n t a t i o n ,   w i t h   s ubs t a n t i a l   b o o s t s   i n   b o t h   a c c ur a c y   a n F 1 - s c o r e s ,   wh e r e a s   t h e   I n do n e s i a da t a s e e xhi b i t e o nl y   m a r g i na l   im pr o v e m e n t s ,   s ugge s t i n g   i t   m a y   c a pt ur e   l a n gua g e   n ua n c e s   e f f e c t i ve l y   e v e n   w i t h o ut  a ug m e n t a t i o n .       F UN DI NG  I N F ORM AT I ON   A ut h o r s   s t a t e   n f u n d i ng  i nv o l v e d.         Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 4 ,   N o.   3 De c e m be r   20 2 5 :   1015 - 1023   1022   AU T HO CONT RI B UT I ONS   S T AT E M E NT     Nam e   of   Aut h or   C   M   So   Va   Fo   I   R   D   O   E   Vi   Su   P   Fu   V i n c e n t                               Am a li a   Z a h r a                                 C     C o n c e pt ua li z a ti o n   M     M e th o d o l o g y   So     So f twa r e   Va     Va li da ti o n   Fo     Fo r ma a na l y s is   I     I nve s ti ga ti o n   R     R e s o u r c e s   D   :   D a ta   C ur a ti o n   O   :   W r it in -   O r ig in a D r a f t   E   :   W r it in -   R e v i e w  &   E di ti ng   Vi     Vi s ua li z a ti o n   Su     Su pe r v is io n   P     P r o j e c a dmi ni s tr a ti o n   Fu     Fu ndi ng a c qui s it i o n         CONF L I CT   OF   I NT E RE S T   S T AT E M E NT   A ut h o r s   s t a t e   n c o nf li c t   o f   i n t e r e s t .       DA T AV AI L AB I L I T Y   T h e   da t a   t h a s uppo r t h e   f i nd i ngs   o f   t hi s   s t ud y   a r e   o pe nl y   a v a il a bl e   o n   h a t e s pe e c h d a t a . c o m       RE F E R E NC E S   [ 1]   S A C a s ta ño - P ul ga r ín N S r e z - B e ta n c ur L M T V e ga a nd  H M H L óp e z I nt e r n e t,   s oc ia me di a   a nd  o nl in e   ha te   s pe e c h.  S y s t e ma ti c  r e v ie w ,   A ggr e s s  V io le nt  B e hav , v ol . 58, p. 101608,  M a y  2021, d o i 10.1016/j .a v b.2021.101608.   [ 2]   M A P a z J M o nt e r o - D ía z a nd  A M o r e n o - D e lg a d o H a te   S p e e c h:   a   s y s t e ma ti z e r e v i e w ,   Sage   O pe n vo l.   10,   n o.  4,    O c t.  2020, d o i:  10.1177/215824402 0973022.   [ 3]   P J o ti ka bukka na V S o r nl e r tl a m v a ni c h,  O M a na bu, a nd  C .   H a r ue c ha i y a s a k,  S oc ia me d ia   te x c la s s if i c a ti o b y   e nha nc in w e ll - f or m e te xt   tr a in e m o d e l ,   J our nal   of   I C T   R e s e ar c and  A ppl ic at io ns vo l.   10,  n o 2,  pp.  177 196,  A ug.  2 016,     do i:  10.5614/i tb j. i c t. r e s .a ppl .2016.10.2.6.   [ 4]   B L iu   a nd  Y W a ng,  D e e le a r ni ng  m o d e ls   f o r   t e x c la s s i f i c a ti o n ,   in   2022  I E E E   C onf e r e nc e   on  T e l e c om m uni c at io ns ,   O p ti c s   and C om put e r  Sc ie n c e  ( T O C S) , I E E E , D e c . 2022, pp. 821 826.  do i:  10.1109/ T O C S 56154.2022.10015969.   [ 5]   P M L a v a n y a   a nd   E S a s ik a la D e e p   l e a r ni ng  t e c hni qu e s   o t e x t   c la s s i f i c a ti o us in na tu r a l   la ngua ge   p r oc e s s in ( N L P )   in   s oc ia he a lt hc a r e   n e tw o r k:   a   c o mp r e h e ns i ve   s ur ve y ,   in   2021  3r I nt e r nat io nal   C on f e r e nc e   on  Si gnal   P r oc e s s in and   C om m uni c at io n   ( I C P SC ) , I E E E ,   M a y  2021, pp. 603 609. d o i:  10.1109/I C S P C 51351.2021.9451752.   [ 6]   B J a ng,  M .   K im G H a r e r im a na S K a ng,  a nd  J .   W K im Bi - L S T M   m o d e t o   in c r e a s e   a c c ur a c y   in   t e x c la s s i f i c a ti o n:     c o mb in in W or d2 ve c   C N N   a nd  a tt e nt io m e c ha ni s m ,   A ppl ie Sc ie nc e s v o l.   1 0,  no 17,  p.  5841,  A ug.  2020,  do i:   10.3390/a pp10175841.   [ 7]   K M na s s r i,   R F a r a hba khs h,  a nd  N C r e s pi M ul ti li ngua ha te   s pe e c d e te c ti o n A   s e mi - s upe r v is e g e n e r a ti ve   a d v e r s a r ia a ppr o a c h,   E nt r opy , vo l.  26, n o . 4, p. 344, Ap r . 2024, d o i:  10.3 390/ e 26040 344.   [ 8]   M . B o jk ov s ký a nd M . P ik ul ia k,  S T U F I I T  a S e mE v a l - 2019  T a s k 5:   mul ti li ngua ha te  s pe e c h d e t e c ti o n   o n t w it t e r   w it h M U S E   a nd  E L M E mb e ddi ngs ,   in   P r oc e e di ngs   of   th e   13t I nt e r nat io nal   W or k s hop  on  Se m ant ic   E v al uat io n ,   S t r o uds bur g,  P A ,   U S A :   A s s o c ia ti o f or  C o mput a ti o na L in gui s ti c s , 2019, pp. 464 468.  do i:  10.18653/ v 1/ S 19 - 2082.   [ 9]   L K ha n,  A A mj a d,  N A s hr a f a nd  H . - T C ha ng,  M ul ti - c la s s  s e nt im e n a na l y s is   of   ur du  t e x us in mul ti li ngua B E R T ,   Sc R e p vo l.  12, n o . 1, p. 5436, M a r . 2022, d o i:  10.10 38/ s 41598 - 022 - 09 381 - 9.   [ 10]   P G ha de ka r M J a mbl e A J a y bha y B J a gt a p,  A J o s hi a n H M o r e T e x da ta   a ugme nt a ti o us in ge n e r a ti ve   a dve r s a r ia ne tw o r ks , ba c k t r a ns la ti o n   a nd E D A ,   2023, pp. 391 401. d o i:   10.1007/978 - 3 - 031 - 37940 - 6_32.   [ 11]   N G a r g   a nd  K S ha r ma T e x p r e - pr oc e s s in of   mul ti li ngua f o r   s e nt im e nt   a na l y s is   ba s e o s oc ia n e tw o r k   da ta ,     I nt e r nat io nal   J our nal   o f   E le c tr i c al   and  C om put e r   E ngi ne e r in ( I J E C E ) vo l.   12,  n o 1,  p.  776,  F e b.  2022,  do i:   10.11591/i je c e . v 12i 1.pp776 - 784.   [ 12]   L .  F .  A . O . P e ll i c e r ,   T .  M . F e r r e ir a ,  a nd A H . R . C o s ta D a ta  a ugme nt a ti o n t e c hni qu e s  i n na tu r a la ngua ge  pr oc e s s in g,   A ppl   Sof t   C om put , vo l.  132, p. 109803, J a n. 2023, do i:  10.1016/ j. a s oc .20 22.109803.   [ 13]   A M I s s if a nd  M C G a ni z s im pl e   da ta   a ugm e nt a ti o me th o t o   im p r ov e   th e   p e r f or ma n c e   of   na me e nt i t y   r e c o gn it io mo d e ls   in   m e di c a d o m a in ,   in   2021  6t I nt e r nat io nal   C onf e r e nc e   on  C om put e r   Sc i e nc e   and  E ngi ne e r in ( U B M K ) I E E E ,     S e p. 2021, pp. 763 768. d o i:  10.1109/U B M K 52708.2021.9558 986.   [ 14]   D . R . B e ddi a r ,  M . S . J a ha n, a nd M . O us s a la h,  D a ta  e x pa ns i o us in g ba c k t r a ns la ti o n a nd pa r a phr a s in f or  ha te  s p e e c h d e t e c ti o n,   O nl in e  Soc  N e tw  M e di a , vo l.  24, p. 100153, J ul . 2021, d o i:  10.1 016/ j. o s n e m.2021.100153.   [ 15]   G . I gl e s ia s , E T a la ve r a , a nd A . D ía z - Á l v a r e z A  s ur ve y   o G A N s  f o r   c o mput e r   vi s io n:  R e c e n r e s e a r c h, a na l y s is  a nd t a xo n om y ,   C om put  Sc R e v , v ol . 48, p. 100553, M a y  2023, d o i:  10.1016/j . c o s r e v .2023.100553.   [ 16]   L G o n o a nd  Y Z ho u,  A   R e v i e w G e n e r a ti ve   A d v e r s a r ia N e tw o r ks ,   in   2019  14 th   I E E E   C onf e r e nc e   on  I ndus tr ia l   E le c tr o ni c s   and A ppl ic at io ns  ( I C I E A ) , I E E E , J un. 2019, pp. 505 510. do i:   10.1109/I C I E A .2019.8833686.   [ 17]   M U me r   e al . I mpa c of   c o n vo lu ti o na n e ur a ne tw or a nd  F a s tT e x e mbe dd in o t e x c la s s if i c a ti o n,   M ul ti m e T ool s   A ppl vo l.  82, n o . 4, pp. 5569 5585, F e b. 2023, d o i:  10.1007/s 11042 - 022 - 13459 - x.   [ 18]   A A ma li a O S S it o mpul E B N a ba ba n,  a nd  T M a nt o r o A e f f i c i e nt   t e x c la s s if i c a ti o us in f a s tt e x f or   ba ha s a   I ndo n e s ia   doc um e nt s   c la s s if i c a ti o n ,   in   2020  I nt e r nat io nal   C on fe r e n c e   on  D at S c ie nc e ,   A r ti f i c ia I nt e ll ig e nc e ,   and  B us in e s s   A nal y ti c s   ( D A T A B I A ) , I E E E , J ul . 2020, pp. 69 75. d o i:  10.1109/DA T A B I A 50434.2020.9190447.   [ 19]   A . G l e nn, P L a C a s s e , a nd B . C ox E m o ti o c la s s i f i c a ti o n   of  i ndo n e s ia n t w e e ts  us in g bi di r e c ti o na L S T M ,   N e ur al  C om put  A ppl vo l.  35, n o . 13, pp. 9567 9578, M a y  2023, d oi 10.1007/s 00521 - 022 - 08186 - 1.   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776         M ult il ingual   hate  s pe e c de tec ti on  us ing  de e lear ning   ( V ince nt)   1023   [ 20]   U B M a ha de v a s w a m y   a nd  P S w a th i,   S e nt im e nt   a na l y s is   us in bi di r e c ti o na L S T M   N e tw o r k,   P r oc e di C om put   Sc i v o l.   218,  pp. 45 56, 2023,   do i:  10.1016/j .p r oc s .2022.12.400.   [ 21]   T P i r e s E S c hl in g e r a nd  D G a r r e t te H o w   mul ti li ngua is   mul ti li ngua B E R T ?   in   P r oc e e di ngs   o th e   57t h   A nnual  M e e ti ng  o th e   A s s oc ia ti on  f or   C om put at io nal   L in gui s ti c s S tr o uds bur g P A U S A A s s o c ia ti o f o r   C o mp ut a ti o na L in gui s ti c s 2019,     pp. 4996 5001. do i:  10.18653/ v 1/ P 19 - 1493.   [ 22]   P W u,  X L i,   C L in g,  S D in g,  a nd  S .   S he n,  S e nt im e nt   c la s s if i c a ti o us in a tt e nt i o me c ha ni s a nd  bi di r e c ti o na l o ng  s ho r t - te r m m e m or y  ne tw or k,   A ppl  Sof C om put , vo l.  112, p. 107792,  N ov . 2021, d o i:  10.1016/j .a s o c .2021.107792.   [ 23]   A N A z ha r   a nd  M L .   K h o d r a F in e - tu ni ng  p r e tr a in e d   m ul ti li ngua B E R T   m o d e f or   in d o n e s ia a s pe c t - ba s e s e nt im e nt   a na l y s is ,   in   2020  7t h   I nt e r nat io nal   C onf e r e nc e   on  A dv an c e   I nf or m at i c s :   C onc e pt s T he or y   and  A ppl ic at io ns   ( I C A I C T A )   I E E E , S e p. 2020, pp. 1 6. d o i:  10.1109/I C A I C T A 49861.2020.9 428882.   [ 24]   G M a ni a s A M a v r o gi or g o u,  A K i o ur ti s C S y m vo ul id is a nd  D K y r ia z is M ul ti li ngua te x c a te g or i z a ti o a nd  s e nt i me nt   a na l y s is a   c o mpa r a ti ve   a na l y s is   of   th e   ut il i z a ti o of   mul ti li ng ua a ppr o a c he s   f or   c la s s if y in twi tt e r   da ta ,   N e ur al   C om put   A ppl vo l.  35, n o . 29, pp. 21415 21431, O c t.  2023, d o i:  10.1007/s 005 21 - 023 - 08629 - 3.   [ 25]   Y L iu   a nd  S Y a ng,  A ppl ic a ti o of   d e c is io tr e e ba s e c la s s if i c a ti o a lg o r it hm  o c o nt e nt   ma r k e ti ng ,   J our nal   o f   M at he m a ti c s vo l.  2022, n o . 1, J a n. 2022, doi:  10.1155/2022/ 6469054.   [ 26]   Ž Ð V uj ov i c C la s s if ic a ti o m o d e e v a lu a ti o m e tr i c s ,   I nt e r nat io nal   J our nal   o f   A dv anc e d   C om put e r   Sc ie n c e   and  A ppl ic at i o ns vo l.  12, n o . 6, 2021, d o i:  10.14569/ I J A C S A .2021.0120670.       B I OG RA P HI E S   OF   AU T HO RS       V i n ce n         i s   s t u d en t   p u rs u i n g   a   b ach e l o r’s   d e g r ee   i n   c o m p u t e s ci e n ce   at   B i n a   N u s an t ara  U n i v e rs i t y .   H h as   d em o n s t rat e d   p as s i o n   f o n at u ral   l a n g u ag p ro ce s s i n g   T h i s   p u b l i c at i o n   m ark s   h i s   i n a u g u ral   c o n t ri b u t i o n   t o   t h a c ad em i c o mmu n i t y   an d     re fl ec t s   e ag e r n e s s   t o   en g a g e   w i t h   s c h o l ar l y   d i s c o u r s e .   H c an   b e   co n t a c t ed   at   em ai l :   v i n cen t 0 5 3 @ b i n u s . ac . i d .       A m a l i a   Za h ra ,   S. Ko m . ,   P h .   D .           l ec t u r e at   t h e   Mas t e o Co m p u t e S c i en c d e p art men t ,   Bi n N u s an t ara  U n i v e rs i t y   s i n ce   2 0 1 7 .   Sh e   e arn ed   h e Ph . D .   fr o m   t h e   Sch o o l   o f   Co m p u t e r   S c i en ce   a n d   I n f o r m at i c s   at   U n i v e rs i t y   Co l l eg D u b l i n   ( U CD ),   I r el an d ,   i n   2 0 1 4 .   Sh c o m p l e t e d   h e b a c h el o r’s   d e g r e at   t h Fa c u l t y   o f   Co mp u t e S ci e n ce ,   U n i v e rs i t y   o f   I n d o n e s i a   (U I ) ,   i n   2 0 0 8 .   Sh e   g ai n e d   s i g n i fi c a n t   re s e ar c h   e x p e r i e n ce   as   re s e ar c h   as s i s t an t   w o rk i n g   o n   t h e   d ev e l o p men t   o an   In d o n e s i a n   Sp eech   R ec o g n i t i o n   S y s t em   aft e g ra d u at i n g   fr o m   U I .   Be fo r e   j o i n i n g   B i n N u s an t ara  U n i v e rs i t y ,   s h e   w as   l ec t u r e an d   r e s e ar ch e at   t h e   Fa c u l t y   o f   Co m p u t e S c i en ce ,   U n i v e rs i t y   o In d o n e s i a.   H e r e s e ar ch   i n t e r e s t s   e n co m p as s   s p e ec h   p ro ce s s i n g ,   s p ee ch   r ec o g n i t i o n ,   s p e ak e r eco g n i t i o n ,   s p o k en   l a n g u ag e   i d en t i fi c at i o n ,   a n d   o t h e r   are as   r e l at e d   t o   s p eec h   t ec h n o l o g y .   Sh e   c a n   b e   c o n t ac t e d   at   em ai l :   a m al i a. zah ra @ b i n u s . ed u .     Evaluation Warning : The document was created with Spire.PDF for Python.