I n t e r n at ion al   Jou r n a l   of   I n f o r m at ics   an d   Com m u n icat ion   T e c h n ol ogy  ( I J - I CT )   Vo l .   1 5 ,   N o .   2 J un e   20 2 6 ,   pp.   447 ~ 455   I S S N:  2252 - 8776 DO I 10 . 11591/i ji c t . v 1 5 i 2 . pp 44 7 - 455             447       Jou r n al  h o m e page ht tp: // ij ict . iaes c or e . c om   M itigat in ge n d e r  b ia in   S T E M   st u d y  f ie ld  c la ssi f ic at io n  u si n GRU an d  L S T M  w ith   au g m e n t e d  d at ase t  t e c h n iq u e       De vi  F it r ian ah ,   S ar ah   S af it r i,   Nadzl And r it I n t an   G h ayat r ie   D e pa r tm e nt   of   C o mput e r  S c i e n c e B I N U S  G r a dua te  P r o gr a m M a s te r  of  C o mput e r   S c i e n c e , B in a  N us a nt a r a  U ni v e r s it y   J a ka r ta , I ndo ne s ia       Ar t ic l e   I n f o     AB S T RA CT   A r ti c le  h is tor y :   R e c e i ve J a n   16,   2025   R e vi s e No v   7,   2025   A c c e pt e De c   14,   2025       T h i s   s t u d y   e x ami n e s   g en d e b i as   i n   art i f i c i a l   i n t el l i g en ce   ( A I ),   fo cu s i n g   o n   t h e   cl as s i fi c at i o n   o f   h i g h   s ch o o l   s t u d e n t s   i n t o   s c i en ce ,   t ec h n o l o g y ,   e n g i n ee ri n g ,   an d   m at h em at i c s   ( ST E M )   an d   n o n - S T E fi el d s .   U s i n g   I n d o n e s i an   s t u d e n t   C o m p u t e r   S c i en ce   D e p art me n t ,   BIN U S   G rad u at Pro g ra m     Mas t e r   o C o m p u t e r   S c i en ce ,   B i n a   N u s an t ara  U n i v e rs i t y ,   J ak art a,   1 1 4 8 0   d at a,   c o n d i t i o n a l   v ar i at i o n al   a u t o e n co d e (C V A E a n d   mu l t i l ab el   s y n t h e t i m i n o r i t y   o v e r - s a m p l i n g   t ech n i q u e   (M L SMO T E )   w e r e   em p l o y ed   fo d at au g me n t at i o n   t o   mi t i g at e   b i as   b e fo r e   t rai n i n g   g at e d   r ec u rr en t   u n i (G RU an d   l o n g   s h o rt - t e r m   memo r y   (L ST M)   m o d e l s   fo r   p red i c t i o n .   T h c o m b i n at i o n   o M L SMO T E   an d   G RU   d em o n s t rat e d   s u p e ri o p e rf o r m an ce,   ac h i e v i n g   a cc u ra c i e s   o f   9 3 %   fo r   f em a l e   s t u d en t s   an d   9 4 %   fo r   m al e s .   T h e s re s u l t s   i n d i c at e   t h at   ML SMO T E   an d   G RU   e ff ec t i v e l y   p re d i c t   fi e l d s   o s t u d y   w h i l ad d r e s s i n g   g en d e r   b i as .   T h fi n d i n g s   c o n t ri b u t t o   a d v a n c i n g   fai r n e s s   i n   A I   s y s t em s   fo e d u c at i o n   an d   b ey o n d ,   en s u ri n g   e q u i t ab l e   o p p o rt u n i t i e s   ac ro s s   d i v e rs e   ap p l i c at i o n s .   K e y w o r d s :   Da t a   a ugm e n t a t i o n   Ga t e r e c ur r e n t   uni t s   Ge n de r   b i a s   L o n s h o r t - t e r m   m e m o r y   Th i s   i s   a n   o p en   a c ces s   a r t i c l u n d e r   t h CC  B Y - SA   l i cen s e.     C or r e s pon din A u th or :   S a r a h   S a f i t r i     De pa r t m e n t   o f   C o m put e r   S c i e n c e ,   B I NU S   Gr a dua te  P r o gr a m   -   M a s t e r   o f   C o m put e r   S c i e n c e     B i n a   Nu s a n t a r a   Uni v e r s i t y   J a k a r t a ,   11480 ,   I n do n e s i a   E m a i l s a r a h . s a f i t r i @bi nu s . a c . i d       1.   I NT RODU C T I ON    T h e   i n t e g r a t i o n   o f   a r t i f i c i a l   i n t e l l i ge n c e   ( A I )   i n to  d e c i s i o n - m a k i n h a s   tr a n s f or m e d   s e c tor s   s uc h   a s   h e a l t h c a r e   [ 1] ,   f i n a n c e   [ 2] ,   e du c a t i o n ,   a n d   e m p l o y men t - d o m a i n s   c r i t i c a l   to  y o u t h   a c a d e m i c   a n d   c a r e e r   pa t h wa y s .   D e s pi te   i t s   p oten t i a l ,   A I   r a i s e s   c o n c e r n s   a b o u f a i r n e s s   a n d   b i a s ,   pa r t i c ul a r l y   ge n de r   bi a s   [ 3 ] ,   [ 4] ,   whi c h   c a r e i nf o r c e   e xi s t i n g   di s pa r i t i e s .   I n   e du c a t i o n ,   g e n de r   b i a s   i n   A I   h a s   s i gni f i c a n i m p l i c a t i o n s   f or   pr e d i c t i ng  a c a d e m i c   c h o i c e s   b e twe e n   s c i e n c e ,   te c h n o l o gy ,   e n gi n e e r i n g ,   a n d   m a t h e m a t i c s   ( S T E M )   a n d   n o n - S T E M   f i e l ds .   W o m e n   r e m a i n   un de r r e p r e s e n t e d ,   c o n s t i tu t i n o n l y   3 5 %   o f   S T E M   g r a d ua tes   gl o b a l l y   [ 5 ] .   B i a s e d   d a tas e ts   m a y   l e a A I   m ode l s   to  f a v or   m a l e   s tud e n t s   f or   S T E M   p r e d i c t i o n s ,   pe r pe tua t i n i n e q ua l i t y .   A s   A I   i nc r e a s i n g ly   i nf l ue n c e s   e d uc a t i o n a l   g u i da n c e ,   a dd r e s s i n s uc h   bi a s e s   i s   vi t a l   to  e n s u r e   e q ui t a b l e   opp or tun i t i e s .   S t udi e s   s h o w   t h a A I   c a n   b ot h   m i t i ga t e   a n a m p l i f y   bi a s   de pe n di n o n   de s i gn   a n i m p l e m e n t a t i o n   [ 6] .   Hum a n - c e n t e r e d   A I   ( HA I )   e m ph a s i z e s   f a i r n e s s   t h r o u gh   i n c l us i ve   de s i g n ,   da t a   e v a l ua t i o n ,   a n a l g o r i t hm i c   a da p t a t i o n .   R e ka b s a z   a n S c h e dl   [ 7]   i n t r oduc e s   a   f r a m e wo r k   to  m e a s ur e   ge n de r   b i a s   i n   i nf o r m a t i o n   r e tr i e v a l   ( I R )   m o de l s ,   r e v e a l i n t h a p r e - tr a i n e e m b e dd i n gs   c a n   a m p l i f y   bi a s   t h r ough   tr a n s f e r   l e a r ni n g.   T h e s e   f i nd i n gs   un de r s c o r e   t h e   i m po r tan c e   o f   f a i r n e s s   i n   A I   a ppl i c a t i o n s   a c r os s   e d uc a t i o n   a n ot h e r   f i e l ds   [ 8] .   W hil e   pr i o r   s t udi e s   ha v e   e x p l o r e a c a de m i c   pa t h wa y   pr e d i c t i o n   us i n m e t h o ds   s uc h   a s   r a n do m   f o r e s t   [ 9]   a n a r t i f i c i a l   n e ur a l   n e t wo r ks   ( A NN )   w i t h   A da m   o pt i mi z a t i o n   [ 10] ,   m o s n e g l e c t   ge n de r   b a l a n c e   o r   bi a s   e v a l ua t i o n .   Ot h e r   wo r ks ,   s uc h   a s   [ 11] ,   a p p l y   c l u s t e r i n t o   a s s e s s   ge n d e r   e qua l i t y   e f f o r t s   i n   e duc a t i o n   b ut   f o c us   o n   b e nc hm a r k i n r a t h e r   t h a n   m i t i ga t i n bi a s   i n   pr e d i c t i v e   m o de l s .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 5 ,   N o.   2 J un e   20 2 6 :   447 - 455   448   T hi s   s t ud y   i nve s t i g a t e s   ge n de r   bi a s   i n   c l a s s if yi ng   s t ude n t s   i n t S T E M   a n n o n - S T E M   f i e l d s   us i ng   n e ur a l   ne t wor ( NN )   a r c hi t e c t ur e s - ga t e r e c ur r e n t   uni t s   ( GR U)   a n l o n s h o r t - t e r m   m e m o r ( L S T M )   n e t wo r ks   [ 12] .   C h a l l e nge s   i nc l ude   s m a ll ,   c o nf i d e n t i a l   d a t a s e t s   a n l a b e l   im ba l a nc e   a c r o s s   ge n de r   a n s t ud y   f i e l ds ,   whi c h   hi nde r   m o de l   ge n e r a l i z a t i o n .   T a ddr e s s   t h e s e   c h a ll e n ge s ,   c o n d i t i o n a l   va r i a t i o na l   a ut o e n c o de r   ( C VA E )   a n m u l t i l a be l   s y n t h e t i c   mi n o r i t y   o v e r - s a m p l i ng  t e c hni que   ( M L S M OT E )   a r e   e m p l o y e f o r   da t a   a ugm e n t a t i o n .   C V A E   ge n e r a t e s   r e a l i s t i c   s y n t h e t i c   da t a ,   whi l e   M L S M OT E   b a l a n c e s   m i n o r i t y   c l a s s e s   i n   m u l t i - l a b e l   d a t a s e t s .   B ot h   a r e   i n t e gr a t e i n t o   GR a n L S T M   m o de l s   t o   e v a l ua t e   t h e i r   e f f e c t i v e ne s s   i n   mi t i ga t i n ge n de r   a n f i e l d - r e l a t e bi a s .   B y   e x a mi ni ng  bi a s   i n   S T E M /n o n - S T E M   c l a s s if i c a t i o n ,   t hi s   s t udy   c o n t r i b ut e s   to  t h e   di s c o ur s e   o n   f a i r ne s s   a n i nc l us i v i t y   i n   A I .   T h e   r e s u l t s   h o l im p li c a t i o n s   f o r   e n s ur i ng  e qu i t a bl e   e duc a t i o n a l   o ut c o m e s   a s   A I   b e c o m e s   i nc r e a s i ng ly   e m be dde i n   de c i s i o n - m a k i n s y s t e m s .       2.   RE S E AR CH  M E T HO D   2. 1.     Dat a   c ol l e c t ion   an d   c h ar ac t e r is t ic s   I n   I n do n e s i a ,   hi g h   s c h o o l   ( S M A )   s pa n s   t h r e e   y e a r s   ( gr a de s   10 - 12)   w i t h   13   s u bj e c t s   t a ugh t   o v e r   s i s e m e s t e r s ,   i n c l ud i ng  m a t he m a t i c s ,   s c i e n c e ,   l a n g ua ge ,   a n s o c i a l   s t ud i e s .   W hil e   S T E M   s ubj e c t s   a r e   c or e   c o m po n e n t s ,   i n t e gr a t e S T E M   c u r r i c u l a   a r e   n o y e c o m m o n .   S t ude n t s   c h oo s e   s pe c i a li z e s u bj e c t s   b a s e o t h e i r   c a r e e r   go a l s   a n a c a de mi c   i n t e r e s t s .   F o r   t hi s   s t udy ,   da t a   c o l l e c t i o n   b e ga n   w i t h   a n   i n t r o duc t i o n   l e tt e r   s ubmi t t e to   s e v e r a l   s c h o o l s   to  o b t a i n   pe r m i s s i o f o r   a c c e s s .   Due   to  c o nf i de n t i a li t y ,   o nl y   l im i t e a c a de m i c   da t a   we r e   pr o c e s s e to  e n s ur e   s t ude n t   pr i va c y .   A dd i t i o n a ll y ,   a   que s t i o nn a i r e   ga t h e r e s t ude n t s   a c a de mi c   r e c o r ds   a n c h o s e n   uni ve r s i t y   m a j o r s .   T h e   c o l l e c t e da t a   pr o vi de   i n s i g h t s   i n t s t ude n t   pe r f o r m a n c e ,   s ubj e c t   d i v e r s i t y ,   a n pa t t e r n s   i n   m a j o r   s e l e c t i o n   a c r o s s   I n do n e s i a n   hi g h   s c h o o l s .     2. 2.     M aj or   c at e gor i z at ion   T h e   c l a s s i f i c a t i o n   o f   hi g h e r   e duc a t i o n   m a j o r s   i n t o   S T E M   a n n o n - S T E M   f i e l d s   wa s   c o n duc t e us i n g   a   ke y wo r d - b a s e a ppr o a c h .   L i s t s   o f   S T E M   a n n o n - S T E M   ke y wo r ds   we r e   c o m p il e f r o m   a c a de m ic   t e r m i n o l o g y   a n e xi s t i n e duc a t i o n a l   c l a s s if i c a t i o n s .   S T E M   ke y wo r ds   i n c l ude E n g i ne e r i ng,   B i o l o g y ,   P hy s i c s ,   M a t h e m a t i c s ,   C o m put e r   S c i e n c e ,   a n r e l a t e t e r m s ,   whil e   n o n - S T E M   ke y wo r ds   i nc l ude d   A r t s ,   B u s i ne s s ,   E c o n o m i c s ,   L i t e r a t ur e ,   a n P s y c h o l o g y .   E a c h   m a j o r   i n   t h e   da t a s e t   wa s   pr o g r a m m a t i c a l ly   a na l y z e f o r   t h e s e   ke y wo r ds .   M a j o r s   c o n t a i ni n S T E M   t e r m s   w e r e   c l a s s if i e a s   S T E M ,   a n t h o s e   w i t h   n o n - S T E M   t e r m s   a s   n o n - S T E M .   Am bi guo us   c a s e s   we r e   r e vi e w e m a n u a l ly   b a s e o n   c ur r i c u l u m   f o c us   a n c a r e e r   pa t h wa y s .   T hi s   s y s t e m a t i c   a ppr o a c h   e n s ur e a c c ur a t e   c a t e g o r i z a t i o n   a nd   pr o vi de a   c l e a r   f o un da t i o n   f o r   f ur t h e r   a n a ly s i s   o f   s t ude n t s   a c a de mi c   c h o i c e s .     2. 3.     P r e - p r oc e s s in g   Da t a   c l e a ni ng  wa s   c o n duc t e to  c o r r e c i n c o ns is t e n c i e s   a n e r r o r s ,   i n c l ud i ng  h a n d li ng  m i s s i ng   v a l ue s ,   f i x i ng  t y po gr a phi c a l   e r r o r s ,   a n e n s ur i ng  unif o r m   da t a   f o r m a t s   [ 13] .   M i s s i ng  v a l ue s   we r e   im put e a ppr o p r i a t e l y ,   e r r o r s   we r e   c o r r e c t e m a n ua ll y   o r   p r o g r a m m a t i c a l ly ,   a n dup li c a t e   r e c o r ds   we r e   r e m o v e d.   T o   s t a n da r d i z e   gr a de s   a c r o s s   s c h o o l s ,   Z - s c o r e s   we r e   c o m put e by   s u b t r a c t i n e a c h   s c h o o l s   m e a n   gr a de   f r o m   i nd i v i dua l   gr a de s   a n d i v i d i ng  by   t h e   s c h o o l s   s t a n da r de vi a t i o n .   T hi s   n o r m a li z a t i o n   e n s ur e c o m p a r a bil i t y   a c r o s s   i n s t i t ut i o n s   w i t h   d i f f e r e n t   gr a di n s y s t e m s   [ 14] .   T h e   da t a s e wa s   t h e n   d i vi de i n t o   tr a i ni ng  a nd  t e s t i n g   s e t s   us i n s t r a t i f i e s a m p l i ng  to  m a i n t a i n   t h e   s a m e   pr o p or t i o n   o f   t a r ge v a r i a bl e s   i n   b o t h .   T hi s   a ppr o a c h   pr e s e r v e c l a s s   b a l a n c e ,   e nha n c i ng  t h e   r e l i a bil i t y   a n v a l i d i t y   o f   t h e   pr e d i c t i v e   m o de l s   [ 15] ,   [ 16 ] .     2. 4.     Dat a   a u gm e n t at ion   Da t a   a ugm e n t a t i o n   wa s   a pp li e t a ddr e s s   c l a s s   im ba l a n c e   a n e nha n c e   da t a s e t   di v e r s i t y ,   pa r t i c u l a r l y   f o r   un de r r e pr e s e n t e gr o ups   [ 17 ] .   T wo  m e t h o ds   we r e   us e d:  C VA E   a n M L S M OT E .   C VA E   ge n e r a t e s y n t h e t i c   s a m p l e s   r e s e m b li ng  t h e   or i g i n a l   da t a   di s t r i b ut i o n   whil e   c o n d i t i o ni ng  o n   a tt r i b ut e s   s uc h   a s   ge n de r   a n f i e l d   o f   s t udy .   B y   e n c o d i n a n de c od i n da t a   t h r o ugh   a   l a t e n t   s pa c e ,   C VA E   pr o duc e d   r e a l i s t i c   s a m p l e s   t h a t   m a i n t a i ne s t a t i s t i c a l   c o n s i s t e n c y   [ 18] .   T hi s   a ppr o a c h   e f f e c t i v e ly   i nc r e a s e r e pr e s e n t a t i o n - e s pe c i a ll y   o f   f e m a l e   s t ude n t s   i n   S T E M - t h e r e by   i m pr o vi ng  b a l a n c e   a n d i ve r s i t y .   M L S M OT E   f ur t h e r   mi t i ga t e c l a s s   i m ba l a nc e   by   ge n e r a t i n s y n t h e t i c   s a m p l e s   t h r o ugh   i n t e r po l a t i o n   b e t we e n   m i n o r i t y   c l a s s   i ns t a nc e s   w hil e   c o ns i de r i ng  m u l t il a b e l   r e l a t i o n s hi p s   [ 19] .   T hi s   m e t h o e ns ur e t h a t   n e s a m p l e s   c a pt ur e t h e   c o m p l e xi t y   o f   m u l t i p l e   c l a s s   l a b e l s ,   c o n t r i b ut i n t a   m o r e   b a l a n c e a n r e pr e s e n t a t i ve   da t a s e t.     2. 5.     Cl as s if i c at ion   T h e   c l a s s i f i c a t i o n   pha s e   o f   t h e   r e s e a r c h   e m p l o y e a d v a nc e n e ur a l   n e t wo r a r c hi t e c t ur e s ,   s pe c i f i c a l ly   GR a n L S T M   n e t wo r ks ,   to  pr e di c t   s t ude n s uc c e s s   i n   S T E M   f i e l ds   b a s e o n   t h e i r   a c a de m ic   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776       M it igat ing  ge nde r   bias   in   ST E M   s tudy  f ield   c las s if i c ati on  us ing  GR and   L ST M …  ( De v F it r ianah )   449   da t a .   GR wa s   s e l e c t e f o r   i t s   e f f i c i e nc y   i n   pr o c e s s i ng  s e que n t i a l   da t a   a n m i t i ga t i n t h e   v a ni s hi ng  gr a d i e n t   pr o bl e m   c o m m o n   i n   tr a di t i o n a l   r e c ur r e n t   n e ur a l   ne t w o r ks   ( R NN s )   [ 20 ] .   I e m p l o y s   r e s e a n upda t e   ga t e s   to  c o n t r o l   i nf o r m a t i o n   f l o w,   e n a bli ng  i t   to   r e t a i n   o r   d i s c a r i nf o r m a t i o n   a s   n e e de d.   T hi s   s i m p li f i e s t r uc t ur e   m a ke s   GR c o m put a t i o n a ll y   li g h t e r   t h a n   L S T M   whi l e   e f f e c t i ve ly   c a pt ur i n l o n g - t e r m   de pe n de n c i e s   [ 21] [ 22] .   T h e   m o de l   wa s   t r a i n e o n   f e a t ur e s   s uc h   a s   s e m e s t e r - w i s e   a c a de mi c   pe r f o r m a n c e ,   de m o gr a p hi c   da t a ,   a n m a j o r   c l a s s if i c a t i o n .   I t s   l a y e r e a r c hi t e c t ur e   c a pt u r e t e m po r a l   pa tt e r n s   i n   s t ude n t   r e c o r ds   [ 23] ,   a n d   pe r f o r m a n c e   wa s   e v a l ua t e us i n a c c ur a c y ,   pr e c i s io n ,   r e c a l l ,   a n F 1 - s c o r e .   L S T M ,   a l s o   de s i g n e t h a n d l e   s e que n t i a l   da t a ,   wa s   e m p l o y e f o r   i t s   s t r o n a bil i t y   t o   l e a r n   a n d   pr e s e r v e   l o n g - t e r m   de p e n de n c i e s   [ 24] .   I t   i n c l ude s   in put ,   f o r ge t,   a n o u t pu t   ga t e s   t h a t   a l l o s e l e c t i v e   r e t e n t i o o f   r e l e v a n t   i nf o r m a t i o n   o v e r   e x t e n de pe r i o ds   [ 25 ] .   T r a i n e o n   t h e   s a m e   da t a s e a s   GR U,   t h e   L S T M   m o de l   us e m u l t i p l e   s e que n t i a l   a n de n s e   l a y e r s   to  c a pt u r e   c o m p l e x   t e m po r a l   r e l a t i o n s hi p s   i n   a c a de m ic   pe r f o r m a n c e .   B ot h   a r c hi t e c t u r e s   de m o ns t r a t e r ob us t   pr e di c t i v e   c a pa bil i t y ,   o f f e r i n v a l ua bl e   i n s igh t s   i n t o   f a c t o r s   i nf l u e n c i ng  s t ude n t s   s uc c e s s   i n   S T E M   f i e lds .     2 . 6.     E val u at ion   I n   t hi s   e x p e r i m e n t a l   s t ud y ,   t h e   pe r f o r m a n c e   o f   t h e   a l go r i t hm s   w a s   e v a l ua t e us i n m e t r i c s   s uc h   a s   a c c ur a c y ,   pr e c i s i o n ,   r e c a l l ,   a n F 1 - s c o r e ,   a l o n w i t h   c o nf us i o n   m a t r i c e s   a n l o s s   e v a l ua t i o n s   t i d e n t i f y   c l a s s if i c a t i o n   i s s ue s .   A c c ur a c y   m e a s ur e s   t h e   o v e r a ll   c o r r e c t n e s s   o f   pr e d i c t i o ns ,   whil e   pr e c i s i o n   r e pr e s e n t s   t h e   pr o p or t i o n   o f   c o r r e c t l y   pr e d i c t e po s i t i v e   o b s e r va t i o n s .   R e c a l l   ( s e n s i t i v i t y )   a s s e s s e s   t h e   m o de l s   a bil i t y   to   c o r r e c t l y   i de n t i f y   po s i t i ve   c a s e s ,   a n t h e   F 1 - s c o r e   pr o vi de s   a   ha r m o ni c   b a l a n c e   b e t we e n   pr e c i s i o n   a nd  r e c a l l .   I n   a dd i t i o n ,   f a i r n e s s   m e t r i c s   we r e   e m p l o y e to  a s s e s s   ge n d e r - r e l a t e pe r f o r m a n c e .   T h e   a c c ur a c y   d i f f e r e n c e   m e t r i c   m e a s ur e s   t h e   ga i n   pr e d i c t i o n   a c c ur a c y   b e t we e n   m a l e   a n f e m a l e   s t ude n t s ,   wh e r e   a   l a r ge   d i f f e r e n c e   m a y   i nd i c a t e   ge n de r   bi a s .   T h e   pr e d i c t i o n   d i s t r i b ut i o n   by   ge n de r   m e t r i c   e x a mi ne s   t h e   pr o po r t i o n   o f   pr e d i c t e S T E M   a n n o n - S T E M   o u t c o m e s   f o r   e a c h   g e n de r ,   i de n t i f yi ng  po t e n t i a l   im ba l a n c e s   i n   c l a s s   a s s i g nm e n t s .   A   s ke we d i s t r i b ut i o n   m a y   r e v e a l   bi a s e s   i n   t he   t r a i ni ng  da t a   o r   m o de l   be h a vi o r ,   e m p h a s i z i ng  t h e   n e e f o r   b a l a n c e a n f a i r   pr e d i c t i o n s   a c r o s s   ge n de r s .     2 . 7.     E x p e r im e n t   s e t t in g   T h e   e x pe r im e n t s   we r e   c o n duc t e us i n t h e   f o l lo wi n f o ur   c o m bi na t i o n s   o f   da t a   a ugm e n t a t i o n   m e t h o ds   a n c l a s s i f i c a t i o n   m o de l s ,   w i t h   e a c h   s e t up  e v a l ua t e us i n 10 - f o l c r o s s - v a l i d a t i o n :   i)   C V A E   wi t h   GR U:  t h e   s y n t h e t i c   da t a   ge n e r a t e d   b y   C V A E   wa s   c o m bi ne w i t h   t h e   o r i g i na l   da t a s e t   a n us e to  tr a i n   t h e   GR m o de l .   T hi s   c o m bi na t i o n   a im e to  e v a l u a t e   t h e   i m pa c t   o f   C V A E - a ug m e n t e da t a   o n   t h e   pe r f o r m a nc e   o f   t h e   GR a r c hi t e c t ur e .   ii )   C V A E   wi t h   L S T M t h e   C VA E - a ug m e n t e da t a s e wa s   us e to  t r a i n   t h e   L S T M   m o de l ,   a l l o w i ng  f o r   a n   a s s e s s m e n t   o f   h o C VA E - ge ne r a t e da t a   i nf l ue nc e t h e   L S T M   m o de l 's   pe r f o r m a n c e .   ii i )   M L S M OT E   w i t h   G R U:  t h e   M L S M OT E - a ug m e n t e da t a s e t   wa s   e m p l o y e to   t r a i n   t h e   GR m o de l ,   e x a mi n i ng  t h e   e f f e c t s   o f   M L S M OT E   o n   t h e   GR m o de l 's   pr e d i c t i v e   c a pa bil i t i e s .   i v)   M L S M OT E   w i t h   L S T M t h e   M L S M OT E - a ug m e n t e da t a s e wa s   us e to  tr a i n   t h e   L S T M   m o de l ,   pr o vi d i n a   c o m pa r i s o n   o f   M L S M OT E ' s   e f f e c t i v e n e s s   w h e n   pa i r e w i t h   t h e   L S T M   a r c hi t e c t ur e .       3.   RE S UL T S   AN DI S CU S S I ON    I n   t hi s   s e c t i o n ,   we   pr e s e n t   t h e   r e s u l t s   o f   o ur   e x pe r i m e n t s   e v a l ua t i n t h e   i m p a c t   o f   da t a   a ugm e n t a t i o t e c h ni que s   o n   t h e   pe r f o r m a n c e   o f   GR a n L S T M   m o de l s .   Us i n C V A E   a n M L S M OT E ,   we   a u g m e n t e t h e   o r i g i na l   da t a s e t   a n tr a i n e b o t h   m o de l s   on   t h e s e   e nh a n c e da t a s e t s .   T h e   go a l   wa s   to  a s s e s s   t h e   e f f e c t i v e n e s s   o f   t h e s e   t e c h ni qu e s   i n   im pr o vi n t h e   m o de l s '   pr e d i c t i ve   c a pa bil i t i e s ,   e s pe c i a ll y   f o r   i m b a l a n c e d   da t a s e t s .   P e r f o r m a n c e   wa s   m e a s ur e u s i n a c c ur a c y ,   pr e c i s i o n ,   r e c a l l ,   a n F 1 - s c o r e .   T h e   f o l l o w i ng  s e c t i o n s   de t a i l   t h e   r e s u l t s   f o r   e a c h   c o m bi na t i o n   o f   a ug m e n t a t i o n   t e c hni que   a n m o de l .     3. 1.     M od e l   p e r f o r m an c e   T h e   pe r f o r m a n c e   m e t r i c s   hi g hli g h t   t h e   i nf l ue nc e   o f   d i f f e r e n t   a r c hi t e c t ur e s   a n a ug m e n t a t i o t e c h ni que s   o n   c l a s s if i c a t i o n   o u t c o m e s .   T a bl e   de t a i l s   t h e   r e s u l t s   f o r   a l l   e x pe r i m e n t s .   I n   E x pe r im e n t   1   ( C VA E + GR U) ,   t h e   m o de l   a c hi e v e 0. 80  a c c ur a c y   a n F s c o r e ,   wi t h   a   hi g h   r e c a ll   o f   0. 96  b ut  l o we r   pr e c i s i o n   ( 0. 69) ,   i n d i c a t i n s t r o n s e ns i t i vi t y   b ut   m o r e   f a l s e   po s i t i v e s .   E x pe r i m e n t   ( C VA E + L S T M )   y i e l de d   s l i g h t l y   l o we r   pe r f o r m a n c e - 0. 78  a c c ur a c y ,   0. 72  F 1 ,   0 . 62  p r e c i s i o n ,   a n 0. 86  r e c a l l - s h o w i n r e duc e l e a r ni ng   e f f e c t i v e n e s s .   M L S M OT E   s ubs t a n t i a l ly   im pr o v e r e s u l t s .   E x pe r i m e n t   ( M L S M OT E + GR U)   a c hi e v e t h e   b e s t   pe r f o r m a n c e ,   w i t h   0. 94  a c c ur a c y ,   0. 92  p r e c i s i o n ,   0. 96  r e c a l l ,   a n 0. 93   F 1,   r e f l e c t i n b a l a n c e a n d   r e l i a bl e   pr e d i c t i o n s .   E x pe r i m e n t   4   ( M L S M OT E + L S T M )   f o l l o we c l o s e ly ,   s c o r i n 0. 90  a c c ur a c y ,   0. 84   pr e c i s i o n ,   0. 94  r e c a l l ,   a n 0. 88  F 1.   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 5 ,   N o.   2 J un e   20 2 6 :   447 - 455   450   Ov e r a ll ,   M L S M OT E   e f f e c t i v e ly   m i t i ga t e c l a s s   i m ba l a n c e   a n e nh a n c e b ot h   pr e c i s i o n   a n r e c a l l .   GR U - b a s e m o de l s   c o n s i s t e n t l y   o u t pe r f o r m e L S T M   c o un t e r pa r t s ,   s ugge s t i n s upe r i o r   h a n d li ng  o f   t e m po r a l   de pe n d e n c i e s .   T h e s e   f i nd i ngs   u n de r s c o r e   t h e   i m po r t a n c e   o f   s e l e c t i n s u i t a bl e   a ug m e n t a t i o n   m e t h o ds   a nd   a r c hi t e c t ur e s   to  o p t i mi z e   c l a s s i f i c a t i o n   pe r f o r m a n c e .       T a bl e   1 .   E x pe r i m e n t   r e s ul t   m e t r i c   M e tr i c   A ve r a ge   v a lu e   C V A E   M L S M O T E   G R U   L S T M   G R U   L S T M   A c c u r a c y   0.80   0.78   0.94   0.90   P r e c is i o n   0.69   0.62   0.92   0.84   R e c a ll   0.96   0.86   0.96   0.94   F 1 S c or e   0.80   0.72   0.93   0.88       3. 2.     T r ain in an d   val id at io n   p e r f o r m an c e   T h e   GR U - C V A E   m o de l   s h o ws   i n   F i gur e   h a ve   a   s i g nif i c a n t   de c r e a s e   i t r a i ni ng  a n v a li da t i o n   l o s s   a c r o s s   a l l   10  f o l d s ,   wi t h   s t a bil i z a t i o n   a r o un d   e p o c h   10.   F o l ds   1,   3,   5 ,   8 ,   a n 10  de m o ns t r a t e   c o n s i s t e n t   pe r f o r m a n c e   w i t h   m i nim a l   f l uc t ua t i o n s ,   i n d i c a t i n g   g oo d   ge n e r a l i z a t i o n .   S o m e   f o l d s ,   s uc h   a s   2,   4 ,   6,   7,   a n 9 ,   s h o m i n o r   v a l i d a t i o n   l o s s   f l uc t ua t i o ns ,   s ugge s t i n pot e n t i a l   o ve r f i t t i n g.   Ov e r a ll ,   t h e   m o de l   pe r f o r m s   we l w i t h   m i n o r   o v e r f i t t i n i n   s o m e   f o l ds .           F i gur e   1 .   C VA E   w i t h   GR t r a i ni ng  a n v a li da t i o l o s s       M o s f o l ds   s h o i n   F i gur e   h a v e   a   s m o ot h   de c r e a s e   i n   b o t h   t r a i ni ng  a n v a li da t i o n   l o s s ,   w i t mi n im a l   g e n e r a l i z a t i o n   ga ps ,   i n d i c a t i n e f f e c t i ve   l e a r ni ng  a n r o b us t   pe r f o r m a n c e .   Ho we v e r ,   a   f e f o l d s ,   s uc h   a s   F o l a n F o l 8,   e x hi b i t   m i n o r   f l uc t ua t i o n s   i n   v a li da t i o n   l o s s ,   l i ke ly   c a us e by   s e n s i t i v i t y   t s pe c i f i c   v a li da t i o n   s u b s e t s .   Ov e r a l l ,   t h e   m o de l   ge n e r a li z e s   we l l   a c r o s s   t h e   f o l ds ,   de m o ns t r a t i n s t a bl e   a n d   r e l i a bl e   pe r f o r m a n c e .   T h e   GR U - M L S M OT E   m o de l   i n   F i gur e   a l s o   e x hi b i t s   a   s t e a dy   de c r e a s e   i n   tr a i ni ng  a n v a li da t i o l o s s   a c r o s s   a l l   f o l ds ,   s tabi l i z i n g   a r oun d   e p o c h   1 0 .   Ov e r a l l   f o l s h ow   s tabl e   p e r f or m a n c e ,   whi l e   f o l ds   2 ,   6 ,   a n d   7 e xh i b i t   va l i d a t i o n   l o s s   f l uc t ua t i o n s ,   hi n t i ng  a t   p ot e n t i a l   o ve r f i t t i n g.   Ov e r a l l ,   t h e   m o de l   s h o ws   c o n s i s t e n t   pe r f o r m a n c e   w i t h   s o m e   m i n o r   o v e r f i t t i n i n   a   f e f o l ds .   M L S M OT E - L S T M   i n   F i gur e   4,   v a l i da t i o n   l o s s   f luct ua t i o ns   l i ke ly   s t e m   f r o m   e x t e n de t r a i ni ng  o r   da t a   v a r i a bil i t y .   De s p i t e   t h e s e   s p i ke s ,   t h e   m o de l   ge n e r a li z e s   we l l   a c r o s s   f o l d s .   Ov e r a ll ,   a ll   m o de l s   s h o s t a bl e   l e a r ni ng  by   e po c h   10,   w i t h   GR a n L S T M   pe r f o r m i n r o b us t l y   u n de r   b o t h   C VA E   a n M L S M OT E ,   t h o ugh   mi n o r   v a li da t i o n   l o s s   v a r i a t i o ns   s ugge s t   s l i g h t   o v e r f i t t i n i n   s o m e   f o l ds .     Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776       M it igat ing  ge nde r   bias   in   ST E M   s tudy  f ield   c las s if i c ati on  us ing  GR and   L ST M …  ( De v F it r ianah )   451       F i gur e   2 .   C VA E   w i t h   L S T M   tr a i ni n a n v a li da t i o n   l o s s           F i gur e   3 .   M L S M OT E   wi t h   GR t r a i ni ng  a n v a li d a t i o n   l o s s           F i gur e   4 .   M L S M OT E   wi t h   L S T M   t r a i ni ng  a n v a li da t i o n   l o s s       3. 3.     F air n e s s   p e r f o r m an c e   T e v a l ua t e   f a i r n e s s   i n   m o de l   pe r f o r m a n c e   a c r o s s   ge n de r s ,   we   c o m pa r e t h e   a v e r a ge   a c c ur a c y   f o r   m a l e   a n d   f e m a l e   g r oups   a c r os s   f our   e x p e r i m e n ta l   s e tu ps .   T h e   r e s u l t s   a r e   s u m m a r i z e i n   T a b l e   2 .   F r om   T a bl e   2   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 5 ,   N o.   2 J un e   20 2 6 :   447 - 455   452   i t   i s   e vi de n t   t h a t   m o de l s   t r a i ne us i n t h e   M L S M OT E   t e c h ni que   c o n s i s t e n t l y   a c hi e v e   hi g h e r   f a i r n e s s   m e t r i c s ,   w i t h   r e l a t i v e ly   b a l a nc e a c c ur a c i e s   a c r o s s   b ot h   ge n de r s .   I n   c o n t r a s t ,   m o de l s   ut i li z i ng  C V A E   e xhi b i t   l a r ge r   d i s p a r i t i e s   i n   pe r f o r m a n c e ,   s ugge s t i n r oo m   f o r   i m pr o v e m e n t   i n   a c hi e vi ng  f a i r n e s s .   T h e   M L S M O T E   wi t GR m o de l   a c hi e ve s   t h e   hi g h e s t   o v e r a l l   a c c ur a c f o r   b o t h   m a l e   a n f e m a l e   gr o ups ,   r e f l e c t i n i t s   r ob us t ne s s   a n f a i r n e s s .   B u i l d i ng  o n   t h e   f a i r n e s s   e v a l ua t i o n ,   t h e   n e x t   s t e a n a l y z e s   t h e   pr e di c t i ve   d i s t r i b ut i o ns   to  i de n t i f pot e n t i a l   bi a s e s   o r   m i s a l i g n m e n t s   w i t h   t h e   o r i g i na l   d a t a .   W hil e   f a i r n e s s   m e t r i c s   s h o o v e r a l l   g e n de r   pa r i t y ,   d i s t r i b ut i o n   a n a ly s i s   r e v e a l s   w h e t h e r   m o de l s   a c c ur a t e l y   c a pt ur e   g r o up - s pe c i f i c   pa t t e r n s   o r   e x hi b i t   s y s t e m a t i c   o v e r -   o r   un de r - pr e di c t i o ns ,   e n s ur i ng  b o t h   f a i r n e s s   a n da t a   f i de l i t y .   I n   t hi s   e x pe r im e n t ,   t h e   C VA E   wi t h   GR a r c hi t e c t ur e   ( F i gur e   5,   l e f t )   s h o ws   di s c r e pa n c i e s   b e t we e pr e d i c t e a n o r i g i na l   d i s t r i b ut i o n s .   P r e d i c t i o n s   f o r   n o n - S T E M   m a l e s   a r e   un de r e s t i m a t e d,   whi l e   n o n - S T E M   f e m a l e s   a r e   o v e r e s t i m a t e d.   I n   t h e   S T E M   c a t e gor y ,   m a l e   pr e d i c t i o ns   a l i g n   c l o s e ly   w i t h   o r i g i na l s ,   wh e r e a s   f e m a l e   pr e d i c t i o ns   s l i g h t l y   e x c e e t h e m ,   i nd i c a t i n a   bi a s   t o wa r d   o v e r - pr e di c t i n f e m a l e s   a n d   un de r - pr e d i c t i n m a l e s .   T h e   C V A E   w i t h   L S T M   a r c hi t e c t ur e   ( F i gur e   5,   r i g h t )   c o n s i s t e n t l y   o v e r e s t i m a t e s   a c r o s s   g e n de r s   a n c a t e g o r i e s ,   s ugge s t i n a   bi a s   to wa r hi g h e r   pr e di c t e c o un t s .   T hi s   m a y   s t e m   f r om   c l a s s   im ba l a n c e   o r   i m pe r f e c t   r e c o n s t r uc t i o n   o f   t h e   da t a   di s t r i b ut i o n .   F i ne - t uni n o r   r e gul a r i z a t i o n   c ou l he l p   r e duc e   t hi s   s y s t e m a t i c   o v e r pr e d i c t i o n .       T a bl e   2.   A ve r a ge   a c c ur a c y   w i t hi ge n de r   E x p e r im e n t   A ve r a ge   ma le  a c c u r a c y   A ve r a ge   f e ma le  a c c ur a c y   C V A E  w it h G R U   0.83   0.72   C V A E  w it h L S T M   0.79   0.73   M L S M O T E  w it G R U   0.94   0.93   M L S M O T E  w it L S T M   0.89   0.88           F i gur e   5 .   E x pe r i m e n t   -   C VA E   w i t h   GR a n L S T M   pr e di c t i o n   d i s t r i b ut i o n       W i t h   M L S M OT E   a pp l i e f o r   da t a   b a l a n c i ng  a n a   GR U - b a s e m o de l   ( F i gur e   6,   l e f t ) ,   t h e   pr e d i c t e a n o r i g i na l   d i s t r i b ut i o ns   s h o s t r o n a l i g nm e n t .   I n   t h e   n o n - S T E M   c a t e g or y ,   pr e d i c t i o n s   f o r   b ot h   ge n de r s   c l o s e ly   m a t c h   t h e   o r i g i na l s ,   i n d i c a t i n r e duc e bias .   S i mi l a r ly ,   S T E M   pr e di c t i o n s   a li g n   we l l   a c r o s s   ge n de r s ,   de m o ns t r a t i n t h a t   M L S M OT E   e f f e c t i v e ly   m i t i ga t e s   c l a s s   im ba l a n c e   a n e nh a n c e s   GR U   m o de l   ge n e r a li z a t i o n .   I n   c o n t r a s t,   t h e   M L S M OT E + L S T M   m o de l   ( F i gur e   6,   r i g h t )   pe r f o r m s   c o n s i s t e n t l y   f o r   f e m a l e s   a c r o s s   b o t h   c a t e g o r i e s ,   w i t h   mi n i m a l   g a ps   b e t we e n   pr e d i c t e a n o r i g i na l   d i s t r i b ut i o ns .   Ho we v e r ,   f o r   m a l e s ,   pr e d i c t i o n s   a r e   s l i g h t l y   u n de r e s t i m a t e i n   n on - S T E M   a n o v e r e s t i m a t e i n   S T E M ,   r e v e a l i ng   r e s i dua l   im ba l a n c e .   W hil e   o v e r a l l   pe r f o r m a n c e   r e m a i ns   s t r o n g,   f ur t h e r   t uni n m a y   be   n e e de t i m pr ov e   m a l e   pr e d i c t i o n   a c c ur a c y   a c r o s s   b o t h   c l a s s e s .   T e x t e n t h e   a n a ly s i s ,   we   a l s o   e x a m i ne   t h e   m o de l 's   pe r f o r m a n c e   w i t h o u t   a ugm e n t a t i o n .   T hi s   c o m pa r i s o n   a im s   t e v a l ua t e   wh e t h e r   t h e   a ug m e n t a t i o n   pr o c e s s   c o n t r i b ut e s   to  t h e   o b s e r v e d i s c r e pa nc i e s .   F i gur e   c o m pa r e s   GR a n L S T M   m o de l s   i n   pr e d i c t i n S T E M   v e r s us   n o n - S T E M   o u t c o m e s   by   ge n de r   w i t h o ut   da t a   a ugm e n t a t i o n ,   r e v e a l i ng  c l e a r   m o de l   bi a s e s .   B o t h   m o de l s   s h o d i s c r e pa n c i e s   f o r   f e m a le   s t ude n t s - t h e   GR un de r p r e d i c t s   n o n - S T E M   a n ov e r pr e d i c t s   S T E M ,   whi l e   t h e   L S T M   s h o ws   s i mi l a r   t r e n ds   b ut   a l i g ns   s l i g h t l y   be tt e r   f o r   m a l e s .   T hi s   i n d i c a t e s   s t r o n ge r   pe r f o r m a nc e   f o r   m a l e   pr e d i c t i o ns   a nd  we a ke r   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776       M it igat ing  ge nde r   bias   in   ST E M   s tudy  f ield   c las s if i c ati on  us ing  GR and   L ST M …  ( De v F it r ianah )   453   a c c ur a c y   f o r   f e m a l e s ,   r e f l e c t i n da t a   i m ba l a n c e .   W i t h o ut  a ugm e n t a t i o n ,   b ot h   m o de l s   t e n to  o v e r f i t   t h e   do m i na n t   m a l e   da t a ,   f a il i ng  to  c a pt u r e   f e m a l e - s pe c i f i c   pa tt e r n s .   T h e s e   f i nd i ng s   e m p h a s i z e   t h e   i m po r t a n c e   o f   da t a   a ugm e n t a t i o n   to   i m pr o v e   m o de l   f a i r n e s s   a n r o b us t n e s s .           F i gur e   6 .   E x pe r i m e n t   2:  M L S M OT E   wi t h   GR a nd  L S T M   pr e di c t i o n   d i s t r i b ut i o n           F i gur e   7 .   M L S M OT E   wi t h   L S T M   pr e d i c t i o n   d i s t r i b ut i o n       4.   CONC L USI ON    T h e   e x pe r im e n t s   de m o ns t r a t e d   t h e   i m pa c t   o f   da t a   a ug m e n t a t i o n   t e c h ni que s   a n c l a s s if i c a t i o m o de l s   o n   pe r f o r m a n c e ,   f a i r n e s s ,   a n pr e d i c t i o n   di s t r i b ut i o n s .   M L S M OT E   c o m bi ne w i t h   GR c o n s i s t e n t ly   o u t pe r f o r m e ot h e r   s e t ups ,   a c hi e vi ng  t h e   hi g h e s t   a c c ur a c y   ( 0. 94 )   a n F s c o r e   ( 0. 93 )   whi l e   de m o n s t r a t i n g   b a l a n c e pe r f o r m a n c e   a c r o s s   ge n d e r s ,   w i t h   m a l e   a n f e m a l e   a c c ur a c i e s   a t   0. 94  a n 0. 93,   r e s pe c ti ve ly .   I c o n t r a s t ,   C VA E - b a s e m o de l s   e xhi b i t e l a r ge r   d i s pa r i t i e s   b e t we e n   ge n de r s ,   w i t h   n o t i c e a bl e   bi a s e s   in  pr e d i c t i o n   d i s t r i b ut i o ns .   F o r   i ns t a n c e ,   t h e   C V AE   wi t h   G R o v e r - pr e d i c t e f e m a l e s   i t h e   n o n - S T E M   c a t e g o r y   a n u n de r - pr e d i c t e m a l e s ,   hi g hli g h t i n c h a ll e n g e s   i a c hi e vi ng  f a i r n e s s .   S i mi l a r ly ,   t h e   C VA E   w i t L S T M   d i s p l a y e o v e r e s t i m a t i o n   a c r o s s   ge n de r s   a n c l a s s e s ,   s ug ge s t i n li mi t a t i o ns   i n   c a pt ur i n t h e   or i g i na da t a   di s t r i b ut i o n .   On   t h e   ot h e r   h a n d,   M L S M O T E   e f f e c t i v e ly   a ddr e s s e c l a s s   i m ba l a nc e s ,   w i t h   GR U   a c hi e vi ng  c l o s e r   a l i g nm e n t   b e t we e n   pr e di c t e a n o r i g i na l   d i s t r i b ut i o ns   f o r   b ot h   ge n de r s .   Ho we v e r ,   M L S M OT E   w i t h   L S T M   s h o we d i s c r e pa n c i e s   i n   m a l e   pr e d i c t i o ns ,   w i t h   u n de r e s t i m a t i o n   i t h e   n o n - S T E M   c a t e g o r y   a n s li g h t   o v e r e s t i m a t i o n   i S T E M .   Ov e r a l l ,   t h e   r e s u l t s   u n de r s c o r e   M L S M OT E 's   a bil i t y   t o   im pr o v e   pe r f o r m a n c e   a n f a i r n e s s ,   pa r t i c u l a r l y   w h e n   pa i r e w i t h   GR U,   t h o ugh   a d d i t i o n a l   t uni ng  m a y   b e   ne e de f o r   ot h e r   c o nf i gur a t i o n s   to   a ddr e s s   r e s i dua l   bi a s e s .       AC K NOWL E DGM E NT S   T h e   a ut h o r s   w o ul li ke   t a c kn o w l e dge   t h e   us e   o f   Op e nA I s   C h a t GPT   a s   a   s uppor t i v e   t oo l   dur i n g   t h e   de b ugg i ng  a n de v e l o p m e n t   pr o c e s s .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 5 ,   N o.   2 J un e   20 2 6 :   447 - 455   454   F UN DI NG  I N F ORM AT I ON   T hi s   wo r i s   s uppo r t e by   R e s e a r c h   a n T e c hn o l o g y   T r a ns f e r   O f f i c e ,   B i na   Nus a n t a r a   Uni v e r s i t y   a s   a   pa r t   o f   B i n a   Nus a n t a r a   Uni v e r s i t y s   I n t e r n a t i o n a l   R e s e a r c h   Gr a n t   e n t i t l e An   I n - de pt h   Ana l y s i s   o f   F e m a le   R e pr e s e n t a t i o n   a n E m p l o y a bil i t y   i S T E M   b a s e o n   M a c hi ne   L e a r ni n F r a m e wo r wi t h   c o n t r a c n u m be r :   069C /VR R T T /I I I /2024   a n c o n t r a c t   da t e :   M a r c h   18,   2024.       AU T HO CONT RI B UT I ONS   S T AT E M E NT   T hi s   j o ur n a l   us e s   t h e   C o n t r i b ut or   R o l e s   T a x o n o m y   ( C R e d i T )   to  r e c o gni z e   i n d i v i dua l   a ut h o r   c o n t r i b ut i o ns ,   r e duc e   a ut h or s hi d i s put e s ,   a n f a c il i t a t e   c o l l a b o r a t i o n .       Nam e   of   Aut h or   C   M   So   Va   Fo   I   R   D   O   E   Vi   Su   P   Fu   De vi   F i t r i a n a h                               S a r a h   S a f i t r i                               Na dz l a   An dr i t a   I n t a n   Gh a y a t r i e                                 C     C o n c e pt ua li z a ti o n   M     M e th o d o l o g y   So     So f twa r e   Va     Va li da ti o n   Fo     Fo r ma a na l y s is   I     I nve s ti ga ti o n   R     R e s o u r c e s   D   :   D a ta  C ur a ti o n   O   :   W r it in -   O r ig in a D r a f t   E   :   W r it in -   R e v i e w  &   E di ti ng   Vi     Vi s ua li z a ti o n   Su     Su pe r v is io n   P     P r o j e c a dmi ni s tr a ti o n   Fu     Fu ndi ng a c qui s it i o n         CONF L I CT   OF   I NT E RE S T   S T AT E M E NT   A ut h o r s   s t a t e   n c o nf li c t   o f   i n t e r e s t .       DA T AV AI L AB I L I T Y   T h e   da t a   t h a t   s upp o r t h e   f i nd i ngs   o f   t hi s   s t udy   a r e   a v a i l a b l e   o n   r e que s f r o m   t h e   c or r e s po n d i n g   a ut h o r ,   [ S S ] .   T h e   da t a   a r e   n ot   pub l i c ly   a v a il a bl e   du e   to  pr i v a c y   o r   e t hi c a l   r e s t r i c t i o ns .       RE F E R E NC E S   [ 1]   E J us s upo w K S p o hr e r A H e in z l,   a nd  J G a w li tz a A ugme nt in m e di c a di a gno s is   de c is io ns ?   A in ve s ti ga ti o i nt o   ph y s ic ia ns   de c is i o n - ma ki ng  pr oc e s s   w it a r ti f i c ia in t e ll ig e n c e ,”   I nf or m at io Sy s te m s   R e s e a r c h v o l.   32,  n o 3,  pp.  713 - 735,    S e p. 2021, d o i:  10.1287/i s r e .2020.0980.   [ 2]   M S to ne   e al . A r ti f i c ia in te ll ig e nc e   ( A I )   in   s tr a te gi c   ma r ke ti ng  d e c is io n - ma ki ng:   a   r e s e a r c a ge nda ,”   T he   B ot to m   L i ne   vo l.  33, n o . 2, pp. 183 - 200, Ap r . 2020, d o i:  10.1108/ B L - 03 - 202 0 - 0022.   [ 3]   E F e r r a r a F a ir n e s s   a nd  bi a s   in   a r ti f i c ia in t e ll ig e n c e a   br ie f   s ur ve y   of   s o u r c e s im pa c ts a nd  mi ti ga ti o s tr a te gi e s ,”   Sc i vo l 6,  no . 1, p. 3, D e c . 2023, d oi 10. 3390/s c i6 010003.   [ 4]   S O C o nn o r   a nd  H L iu G e nd e r   bi a s   pe r pe tu a ti o a nd   mi ti ga ti o in   A I   t e c hn o l o g ie s c ha ll e ng e s   a nd  o pp o r tu ni ti e s ,”     A I   &  SO C I E T Y vo l.  39, n o . 4, pp. 2045 - 2057, Aug. 2024, d o i:   10.1007/s 00146 - 023 - 01675 - 4.   [ 5]   U ni te N a ti o ns   E duc a ti o na S c i e nt i f i c   a nd  C ul tu r a O r ga ni z a ti on  ( U N E S C O ) G l o ba e duc a ti o m o ni t o r in r e p o r 2024  -   G e n de r   r e p o r t:   te c hn o l o g y   o h e r   te r ms .”   2024,  [ O nl in e ] A v a il a bl e ht tp s :/ /ww w .i a u - he s d.ne t/ a c ti o n/ gl o ba l - e du c a ti o n - m o ni t or in g - r e p o r t - 2024 - ge nd e r - r e p o r t - t e c hn o l o g y - h e r - t e r ms .   [ 6]   S J H Y a ng,  H O ga ta T M a ts ui a nd  N . - S C he n,  H uma n - c e nt e r e a r ti f i c ia in t e ll ig e n c e   in   e du c a ti o n:   s e e in th e   in v is ib le   th r o ugh  th e   v is ib l e ,”   C om put e r s  and E duc at io n:  A r ti f ic ia I nt e ll ig e nc e , v o l.  2, p. 100008, 2021, d oi 10.1016/j . c a e a i. 2021.1000 08.   [ 7]   N R e ka bs a z   a nd  M S c he dl D o   n e ur a r a nki ng  m o d e ls   in te n s if y   g e nde r   bi a s ? ,”   in   P r oc e e di ngs   o f   th e   43 r I nt e r nat io nal   A C M   SI G I R   C onf e r e nc e   on  R e s e a r c and  D e v e lo pm e nt   in   I nf or m at io R e tr ie v al J ul 2020,  pp.  2065 - 2068,     do i:  10.1145/ 3397271.3401280.   [ 8]   Y D o ng,   N L iu B J a la ia n,  a nd  J L i,   E D I T S :   m o d e li ng  a nd   mi ti ga ti ng  da ta   bi a s   f or   gr a ph   ne u r a n e tw o r ks ,”   in   P r oc e e di ng s   o th e  A C M   W e b C onf e r e nc e  2022 , A pr . 2022, pp. 1259 - 1269, do i:  10.1145/3485447.3 512173.   [ 9]   F C r uz - J e s us   e a l. U s in a r ti f i c ia in t e ll ig e n c e   m e th o ds   t o   a s s e s s   a c a de mi c   a c hi e ve m e nt   in   publ i c   hi gh   s c h oo ls   of   a   E u r o p e a U ni o c o unt r y ,”   H e li y on vo l.  6, n o . 6, p. e 04081, J un. 2020, d oi 10.1016/j .he li y on.2020. e 04081.   [ 10]   Ş A y d o ğdu,  P r e di c ti ng  s tu de n f in a pe r f o r ma nc e   us in a r ti f ic ia ne ur a n e tw o r ks   in   o nl in e   le a r ni ng  e n v i r o nm e nt s ,”     E duc at io n and I nf or m at io n T e c hnol ogi e s , v o l.  25, n o . 3, pp. 19 13 - 1927, M a y  2020, d o i:  10.1007/s 10639 - 019 - 10053 - x.   [ 11]   V T o ka r D T y s h c h e nk o T F r a n c huk,  V M a ko ie d ov a a nd  A L o ta r i e v U s in c lu s te r   a na l y s is   f o r   r e ve a li ng  ge nd e r   e qua li t y   pa tt e r ns   in   E U   I C T   e duc a ti o a nd  e mpl oy m e nt ,”   J our nal   of   T he or e ti c al   and   A ppl ie I nf o r m at io T e c hnol ogy ,   v o l.   101,  no .   16,    pp. 6691 6702, 2023.   [ 12]   B C M a te us M M e nd e s J T .   F a r in ha R A s s is a nd  A M C a r do s o ,   C o mpa r in g   L S T M   a nd  G R U   m o de ls   t pr e di c th e   c o ndi ti o of  a  pul p pa p e r  pr e s s ,”   E ne r gi e s , v o l.  14, n o . 21, p. 6 958, Oc t.  2021, d o i:  10.3390/ e n14216958.   [ 13]   F R id z ua a nd  W M .   N W a Z a in o n,  A   r e v i e w   o da ta   c l e a ns in me th o ds   f o r   bi da ta ,”   P r oc e di C om put e r   Sc ie nc e v o l.   161,   pp. 731 - 738, 2019, do i 10.1016/j .pr oc s .2019.11.177.     Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776       M it igat ing  ge nde r   bias   in   ST E M   s tudy  f ield   c las s if i c ati on  us ing  GR and   L ST M …  ( De v F it r ianah )   455   [ 14]   C A ndr a de Z   s c o r e s s ta nda r s c o r e s a nd  c o mp o s it e   t e s s c or e s   e x pl a in e d,”   I ndi an  J our nal   of   P s y c hol ogi c al   M e di c in e vo l.   43,  no . 6, pp. 555 - 557, N ov . 2021, d o i:  10.1177 /0 25371762110465 25.   [ 15]   J S a da i y a ndi P .   A r umuga m,  A .   K S a nga ia h,  a nd  C Z ha n g,  S tr a ti f i e s a mpl in g - ba s e d e e p   l e a r ni ng  a ppr o a c t in c r e a s e   pr e di c ti o n a c c u r a c y   of  unba la nc e d da ta s e t,   E le c tr oni c s , vo l.  12 , no . 21, p. 4423, O c t.  2023, d o i:  10.3390/ e l e c tr o ni c s 12214423.   [ 16]   Y X a nd  R G oo da c r e O s pl it ti ng  tr a in in a nd  v a li da ti o s e t:   a   c o mpa r a ti ve   s tu d y   of   c r o s s - v a li da ti o n,  b oo ts tr a a nd  s y s te ma ti c   s a m pl in f or   e s ti ma ti ng  th e   g e n e r a li z a ti o p e r f or ma nc e   of   s up e r v is e d   l e a r ni ng,”   J our nal   of   A nal y s is   and  T e s ti ng   vo l.  2, pp. 249 - 262, 2018, d oi 10.1007/s 41664 - 018 - 0068 - 2.   [ 17]   R E s c o ba r   D ía z   G ue r r e r o L C a r v a lh o T B oc kl it z J P o pp,  a nd  J L O li ve ir a A   da ta   a ugme nt a ti o me th o d o l o g y   t o   r e du c e   th e   c la s s  i mba la nc e  i n hi s t o pa th o l o g y  i ma g e s ,”   J our nal  of  I m agi ng I nf or m at ic s  i n M e di c in e , vo l.  37,  n o . 4, pp. 1767 - 1782, M a r . 20 24,   do i:  10.1007/s 10278 - 024 - 01018 - 9.   [ 18]   K S o hn,  X Y a n,  a nd  H L e e L e a r ni ng  s tr u c tu r e o ut put   r e pr e s e nt a ti o us in de e c o nd it i o na ge n e r a ti ve   m o d e ls ,”     A dv anc e s  i n N e u r al  I nf o r m at io n P r oc e s s in g Sy s te m s , v o l.  2015 - J a nua r y , pp. 3483 - 3491, 2015.   [ 19]   F C ha r te A J R iv e r a M J de J e s u s a nd  F .   H e r r e r a M L S M O T E a ppr o a c hi ng  im ba la nc e mul ti la b e le a r n in th r o ugh  s y nt he ti c   in s ta nc e  g e n e r a ti o n,”   K now le dge - B as e d Sy s te m s , v o l.   89, pp. 385 - 397, Nov . 2015, d o i:  10.1016 /j .kn o s y s .2015.07.019 .   [ 20]   M W a qa s   a nd  U W H umphr ie s A   c r it i c a r e v i e w   of   R N N   a nd  L S T M   v a r ia nt s   in   h y dr o l o g ic a t im e   s e r i e s   pr e di c ti o ns ,”   M e th ods X , vo l.  13, p. 102946, D e c . 2024, d o i:  10.1016/j .m e x .2 024.102946.   [ 21]   E A hma dz a d e h,  H K im ,   O J e o ng,  N .   K im a nd  I .   M oo n,  A   de e bi di r e c ti o na L S T M - G R U   n e tw o r k   m o de l   f o r   a ut o ma te d   c ip h e r t e x c la s s if i c a ti o n,”   I E E E   A c c e s s , v o l.  10, pp. 3228 - 3237,  2022, do i:  10.1109/AC C E S S .2022.3140342.   [ 22]   K E A r un K uma r D V K a la ga C M o ha S a K uma r M K a w a ji a nd  T M B r e n z a C o mpa r a ti v e   a na l y s is   of   ga te r e c ur r e nt   uni ts   ( G R U ) l o ng  s h o r t - te r m e m o r y   ( L S T M )   c e ll s a ut o r e g r e s s i v e   in te g r a te m ovi ng  a ve r a g e   ( A R I M A ) s e a s o na a ut o r e gr e s s iv e   in t e gr a t e m ov in a ve r a g e   ( S A R I M A )   f o r   f o r e c a s ti ng  C O V I D - 19  tr e nds ,”   A le x andr ia   E ngi ne e r in J ou r nal   vo l.  61, n o . 10, pp. 7585 - 7603, O c t.  2022, d o i:  10.1016 /j .a e j. 20 22.01.011.   [ 23]   F A lq a ht a ni   e al . H y b r id   d e e p   le a r ni ng  a lg o r it hm   f o r   f or e c a s ti ng  S A R S - C o V - da il y   in f e c ti o ns   a nd  d e a th   c a s e s ,”   A x io m s   vo l.  11, n o . 11, p. 620, N ov . 2022, d o i:  10.3390/a x i o ms 111106 20 .   [ 24]   K P S a in i   a nd  A S ha r ma A   c o mpa r is o b e tw e e n   l o ng  s h o r t - te r m e m o r y   a nd  pr o ph e t   f o r   ti m e   s e r i e s   a na l y s is   a nd  f or e c a s ti ng  te c hni que ,”   E duc at io nal  A dm in is tr at io n T he or y  and  P r ac ti c e s A pr . 2024, do i:  10.53555 /k ue y . v 30i 4.2816.   [ 25]   I D M ie n y e T .   G S w a r t,   a nd  G O ba id o R e c ur r e nt   n e u r a ne tw o r ks a   c o mp r e h e ns i ve   r e v ie w   of   a r c hi te c tu r e s v a r ia nt s a nd  a ppl ic a ti o ns ,”   I nf or m at io n , v o l.  15, n o . 9, p. 517, Aug. 202 4, d oi 10.3390/i n f o 15090517.       B I OG RA P HI E S   OF   AU T HO RS       D ev i   F i tr i a n a h           i s   l ec t u r e an d   r e s e ar ch e at   t h e   Mas t e o Co m p u t e S c i en c D e p art men t ,   B i n a   N u s an t ara  U n i v e rs i t y .   S h e   e ar n e d   h e r   Ba ch e l o r’s   d eg r ee   fr o m   B IN U S   U n i v e rs i t y   (2 0 0 0 an d   h e Mas t e r’s   an d   P h . D .   i n   c o m p u t e s ci e n ce  fro U n i v e rs i t as   In d o n e s i a   (2 0 0 8 ,   2 0 1 5 ).   Sh e   j o i n ed   a   s an d w i c h   p ro g ra at   M i ch i g an   St at e   U n i v e rs i t y   (2 0 1 4 an d   i s   c u rr en t l y   f el l o w   r e s e ar ch e at   E u r e k R o b o t i c s   L ab ,   Card i ff  M e t ro p o l i t an   U n i v e rs i t y ,   U K .   H e r   r e s e ar ch   i n t e r e s t s   i n cl u d e   d at mi n i n g ,   m a ch i n e   l e a rn i n g ,   A I ,   an d   ap p l i e d   remo t s en s i n g .   S h e   c an   b e   co n t a c t ed   at   em ai l :   d e v i . fi t ri a n ah @ b i n u s . a c . i d         Sa ra h   Sa f i tri           i s   g rad u at e   s t u d en t   p u rs u i n g   M as t e o In fo r m at i o n   at   Bi n a   N u s an t ara  U n i v e rs i t y .   T h e   r e s e ar ch   i n t e r e s t s   i n cl u d e   t h e   d e v el o p me n t   o r eco mme n d e s y s t em s ,   w i t h   p art i c u l ar  em p h as i s   o n   ad d r e s s i n g   b i as e s   i n   r eco mme n d at i o n   a l g o ri t h m s .   A d d i t i o n al l y ,   t h e r e   i s   a   fo cu s   o n   i n v e s t i g at i n g   t ec h n i q u e s   fo m an a g i n g   i m b al an ced   d at a,   ai mi n g   t o   en h a n ce   t h fa i rn e s s ,   a cc u ra cy ,   an d   p e rfo r man ce  o m a ch i n e   l e arn i n g   mo d el s .   S h c an   b e   co n t a c t ed   at   em ai l :   s arah . s afi t ri @ b i n u s . a c . i d         N a dzl a   A n dr i ta   I n ta n   G h a y a tri         i s   g rad u at e   s t u d e n t   p u rs u i n g   Mas t e o f   I n f o r m at i o n   T ech n o l o g y   d e g r ee  w i t h   a   f o c u s   o n   d at a,   m a ch i n e   l e arn i n g ,   an d   art i f i c i a l   i n t el l i g en ce   at   Bi n N u s an t ara  U n i v e rs i t y   i n   In d o n e s i a .   H e r e s e ar ch   i n t e r e s t s   ce n t e aro u n d   ad d r e s s i n g   g e n d e g ap   i s s u e s   t h ro u g h   i n n o v at i v e   ap p l i c at i o n s   o d at s c i e n ce ,   m a ch i n e   l e a rn i n g ,   an d   a r t i fi c i al   i n t e l l i g e n c e .   Sh e   c an   b e   c o n t ac t e d   at   e m ai l :   n ad zl a. g h ay a t ri e @ b i n u s . ac . i d .     Evaluation Warning : The document was created with Spire.PDF for Python.