I nd o ne s ia n J o urna l o f   E lect rica l En g ineering   a nd   Co m p u t er   Science   Vo l.   3 9 ,   No .   2 A u g u s t   2025 ,   p p .   1 221 ~ 1 2 3 5   I SS N:  2 5 0 2 - 4752,   DOI : 1 0 . 1 1 5 9 1 /i j ee cs.v 3 9 .i 2 . pp 1 2 2 1 - 1 2 3 5           1221     J o ur na l ho m ep a g e h ttp : //ij ee cs.ia esco r e. co m   An  o pti m i zed arc hitectu re  for real - ti m e f ra ud de tecti o n in big  da ta sy ste m s eco sy ste m s,  and env i ro n m en ts       G a ber  E .   Ab uta leb 1 Abda ll a h A.   AlH a bs hy 1 ,   B er iha n R.   E le m a ry 2, 3 E be id A.   E beid 1   K a m a l A .   E lDa h s ha n 1   1 D e p a r t me n t   o f   M a t h e mat i c s ,   F a c u l t y   o f   S c i e n c e ,   A l - A z h a r   U n i v e r si t y ,   C a i r o ,   Eg y p t   2 D e p a r t me n t   o f   A p p l i e d ,   M a t h e mat i c a l ,   a n d   A c t u a r i a l   S t a t i s t i c s,  F a c u l t y   o f   C o mm e r c e ,   D a mi e t t a   U n i v e r si t y ,   D a mi e t t a ,   Eg y p t   3 U n i v e r si d a d e   N O V A   d e   L i sb o a ,   N O V A   a t   TK H C a i r o ,   Eg y p t       Art icle  I nfo     AB ST RAC T   A r ticle  his to r y:   R ec eiv ed   Dec   3 2024   R ev i s ed   A p r   8 2 0 2 5   A cc ep ted   J u l   2 2025       T h e   e x p o n e n ti a g ro w th   o f   d a t a   in   re c e n y e a rs  h a c re a t e d   sig n if ica n c h a ll e n g e in   f ra u d   d e tec ti o n .   F ra u d u le n t   a c ti v it ies   a re   in c re a sin g l y   w id e sp re a d   a c ro ss   se c to rs,  su c h   a b a n k in g ,   w e b   n e tw o rk s,  h e a lt h   i n su ra n c e ,   a n d   tele c o m m u n ica ti o n s.   T h is  tre n d   h ig h li g h ts  a   g ro w in g   n e e d   f o b ig   d a ta   tec h n o l o g ies   su c h   a Ha d o o p ,   S p a rk ,   S to rm ,   a n d   HBa s e   to   e n a b le  re a l - ti m e   d e tec ti o n   a n d   a n a ly sis  o f   d a ta  f ra u d .   T h is  stu d y   a i m to   e n h a n c e   u n d e rsta n d i n g   o f   th e   f ra u d   c las sifica ti o n a n d   t h e ir  sp re a d   in   v a rio u se c to rs .   F ra u d   d e tec ti o n   in v o lv e a n a ly z i n g   d a ta  a n d   d e v e lo p i n g   m a c h in e   lea rn in g   (M L )   m o d e ls o trad it i o n a r u le - b a se d   s y ste m s to   id e n ti f y   a b n o rm a l   a c ti v it ies   a th e y   o c c u r.   T h e   a n a l y sis  in   th i p a p e e x a m in e b o th   t h e   a d v a n tag e a n d   li m it a ti o n o f   th e se   so lu ti o n s,   p a rti c u larly   re g a rd in g   sc a lab il it y   a n d   p e rf o r m a n c e .   T h is  p a p e e v a lu a t e th e   m e th o d s   a n d   b ig   d a ta  to o ls  u se d   in   f ra u d   d e tec ti o n   a n d   p re v e n ti o n   t h ro u g h   a   c o m p re h e n siv e   li tera tu re   re v ie w ,   e m p h a siz in g   th e   im p lem e n tatio n   c h a ll e n g e s.  T h is  re v ie w   d isc u ss e e x isti n g   so lu ti o n s,   o p e ra ti o n a e n v iro n m e n ts,  a n d   t h e   M L   a lg o rit h m a n d   trad it io n a l   ru les   e m p lo y e d .   T h e   m a in   o b j e c ti v e   o f   th is  stu d y   is  to   a d d r e ss   th e se   c h a ll e n g e b y   p ro p o sin g   a n   i n n o v a ti v e   a rc h it e c tu re   th a t   e q u ip o rg a n iza ti o n s   w it h   th e   late st  k n o w led g e   a n d   m e th o d o lo g ies   in   b ig   d a ta  tec h n o lo g ies   f o r   re a l - ti m e   f r a u d   d e tec ti o n   a n d   p re v e n ti o n .   K ey w o r d s :   A p ac h Sp ar k   B ig   d ata  tech n o lo g ies i n   f r a u d   d etec tio n   B ig   d ata  tech n o lo g ies  m ac h in lear n in g   al g o r ith m s   r ea l - ti m p r o ce s s in g   Fra u d   d etec tio n   T h is i a n   o p e n   a c c e ss   a rticle   u n d e r th e   CC B Y - SA   li c e n se .     C o r r e s p o nd ing   A uth o r :   Gab er   E .   A b u taleb   Dep ar t m en t o f   Ma th e m at ics,  F ac u lt y   o f   Scie n ce ,   A l - A zh ar   U n iv er s it y   C air o ,   1 1 5 1 1 ,   E g y p t   E m ail:  g ab er _ ab u taleb @ az h ar . ed u . eg       1.   I NT RO D UCT I O N   T h w id esp r ea d   r elian ce   o n   t h I n ter n et  h as  m ad n u m er o u s   e n tit ies  m o r s u s ce p tib le  t o   f r au d u le n t   ac tiv itie s ,   lead in g   to   s ig n i f ica n f in a n cial   lo s s e s   [ 1 ] .   Dete ctin g   a n d   d if f er e n tiati n g   f r a u d s t er s   f r o m   le g it i m a te   u s er s   in   th e   v a s s ea   o f   d i g ital   d ata  h as   b ec o m s ig n i f ica n ch alle n g e.   T h ex p lo s io n   o f   d ig ital  tr a n s ac tio n s   h as  f u e led   r is in   f r au d u le n t   ac tiv it y ,   th r ea te n i n g   f i n an c ial   in s ti tu t io n s   a n d   b u s i n es s es  [ 2 ] .   T r ad itio n al  f r au d   d etec tio n   m et h o d s   s tr u g g le  to   k ee p   p ac w it h   th e v o lv in g   ta ctics o f   f r au d s ter s .   B ig   d ata,   en co m p ass in g   s tr u c tu r ed   an d   u n s tr u ctu r ed   d ata  f r o m   v ar io u s   s o u r ce s ,   h o ld s   t h k e y   to   ad d r ess in g   th i s   c h alle n g [ 3 ] .   As  f r a u d s ter s   co n ti n u o u s l y   ad ap th eir   tech n iq u es,  o r g a n izat io n s   m u s e m p lo y   m ac h in lear n i n g   ( ML )   a n d   ar tif icia in telli g en ce   ( A I )   to   d et ec s o p h is t icate d   d ev iatio n s   f r o m   n o r m al  p atter n s   a m o n g   m ill io n s   o f   leg i ti m ate   tr an s ac tio n s .   I m p le m en tin g   r o b u s m ea s u r es  to   d etec an d   p r ev en f r au d s ter s   ac ce s s   to   s er v ice s   h a s   b ec o m to p   p r i o r ity   f o r   en titi e s ,   s a f e g u ar d i n g   t h i n ter ests   o f   leg iti m ate  u s er s .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci Vo l.  3 9 ,   No .   2 ,   A u g u s 20 25 :   1 2 2 1 - 1 235   1222   I n   r ec en y ea r s ,   t h er h a s   b ee n   an   i n cr ea s i n g   a m o u n t   o f   li ter atu r t h at  h a s   d ev elo p ed   f r a m e w o r k s   f o r   f r au d   d etec tio n   in   b ig   d ata  en v ir o n m en ts .   B ald o m i n o s   et  a l.   [ 4 ]   cr ea ted   s ca lab le  Had o o p - b ased   ar ch itectu r e   f o r   M L   o n   b ig   d ata  s tr ea m s ,   w h ile  Di  Ma u r o   an d   Di  Sar n o   [ 5 ]   p r o p o s ed   r ea l - ti m p r o ce s s i n g   s y s te m   u s in g   A p ac h Sto r m   an d   Ya h o o   S AM OA ,   ac h ie v i n g   9 0 % a cc u r ac y   i n   S k y p tr a f f ic  d etec tio n .   Z h ao   et  a l.   [ 6 ]   b u ilt a   n et w o r k   a n o m al y   d etec tio n   f r a m e w o r k   u s i n g   Had o o p ,   Kaf k a ,   an d   Sto r m   f o r   ac ad e m ic  n et w o r k s .   Dai  et  a l.   [ 7 ]   d ev elo p ed   f o u r - la y er   cr ed it  ca r d   f r au d   d etec tio n   s y s te m   in co r p o r atin g   d is tr ib u ted   s to r ag an d   s tr ea m i n g   an al y s is .   S t o j an o v ic  et  a l.   [ 8 ]   in tr o d u ce d   s elf - ad ap ti v ap p r o ac h   f o r   in d u s tr ial  q u alit y   co n tr o an o m al y   d etec tio n .   C u an d   He   [ 9 ]   p r o p o s ed   clo u d - b ased   f r a m e w o r k   co m b in in g   Had o o p   w it h   W ek a s   a lg o r it h m s ,   w h ile  B alas u p r a m a n ia n   et  a l.   [ 1 0 ]   c r ea ted   s y s te m   u s in g   p r in cip al  co m p o n en a n al y s i s   ( P C A )   a n d   s elf - o r g an izi n g   m ap s   ( SOM) .   Me lo - A co s ta  et  a l.   [ 1 1 ]   ad d r ess ed   class   i m b alan ce   in   cr ed it  ca r d   f r au d   d etec tio n   u s i n g   b alan ce d   r an d o m   f o r est  ( B R F)   o n   A p ac h S p ar k .   Oth m an   et  a l.   [ 1 2 ]   in tr o d u ce d   th Sp ar k - C h i - s u p p o r v ec to r   m ac h in e s   ( SVM )   m o d el  f o r   in tr u s io n   d etec tio n ,   an d   C ar cillo   et  a l.   [ 1 3 ]   d ev elo p e d   s ca lab le  r ea l - ti m e   f r au d   f i n d er   ( SC AR FF ) ,   s ca lab le  s y s te m   co m b i n i n g   K af k a,   Sp ar k ,   a n d   C as s an d r w it h   ad v a n ce d   M L   tech n iq u es.   Nair   et  a l.   [ 1 4 ]   cr ea ted   h ea lt h   p r ed ictio n   s y s te m   u s i n g   Sp ar k   an d   T w it ter   d ata,   w h ile   C ao   et  a l.   [ 1 5 ]   d ev elo p ed   T itA n t,  m illi s ec o n d - s p ee d   f r au d   d etec tio n   s y s te m   f o r   A lip a y   co m b i n i n g   o f f li n tr ai n i n g   w i t h   o n lin p r ed ictio n .   Z h o u   et  a l.   [ 1 6 ]   i n t r o d u c e d   a   f in an ci a l   f r au d   d e t e ct i o n   a p p r o a ch   u s in g   No d e 2 V e c   w i th   S p a r k   G r a p h X   an d   H a d o o p .   H a b e eb   e t   a l .   [ 1 7 ]   cr ea ted   r ea l - ti m an o m al y   d etec tio n   f r a m e w o r k   w it h   th eir   SS W L O FC C   alg o r it h m   ac h ie v in g   9 6 . 5 1 ac cu r ac y .   Sah ee d   et  a l.   [ 1 8 ]   d ev elo p ed   cr e d it  ca r d   f r au d   m o d els   u s i n g   P C A   w it h   v ar io u s   M L   t ec h n iq u es,  a n d   T aw d et  a l.   [ 1 9 ]   p r o p o s ed   an   o n lin p a y m en f r au d   d etec tio n   s y s te m   u s in g   P y Sp ar k   f o r   lar g e - s ca le  tr a n s ac tio n   an al y s is .     A lt h o u g h   t h er ar m a n y   e x ce llen r ev ie w   p ap er s   o n   th i s   to p ic,   n o   s in g le  ar c h itect u r al  d esig n   ef f ec tiv e l y   ad d r ess es  a n d   m an a g e s   t h ese  c h alle n g es.  P r ev io u s   r esear c h   o n   b i g   d ata  f r a u d   d etec tio n   f r a m e w o r k s   h as   f ac ed   s ev er al   li m itatio n s .   Ma n y   s o lu tio n s   o p er ated   ex clu s i v el y   w it h   b at ch   M L   al g o r ith m s   o v er   Had o o p ,   lack in g   s u p p o r f o r   r ea l - t i m e   s tr ea m   p r o ce s s in g .   Mo s f r a m e w o r k s   w er e   ap p lied   to   s in g le   d atasets ,   li m itin g   t h eir   g en er a lizab ilit y   an d   r o b u s t n es s .   Sev er al  ap p r o ac h es  d id   n o in co r p o r ate  u n s u p er v i s ed   ML   al g o r it h m s ,   d ata  e n r ich m en f ea t u r es  ( s u c h   as   I P   g eo lo ca tio n ) ,   o r   v is u aliza tio n   to o ls .   So m f r a m e w o r k s   p r o v id ed   o n ly   n ea r   r ea l - ti m r ath er   th a n   tr u r ea l - ti m p r o ce s s in g ,   w i th   ac c u r ac y   lev e ls   r eq u ir i n g   i m p r o v e m en t.  I n te g r atio n   w it h   m u ltip le  d etec tio n   alg o r ith m s   w as  o f te n   in s u f f icie n t.  A d d itio n al l y ,   s o m e   s y s te m s   lac k ed   r u le - b u ild in g   en g i n e s ,   d ata  en r ich m e n o p er atio n s ,   an d   m a n u al  v er i f icati o n   co m p o n en t s   f o r   m an a g i n g   s u s p icio u s   aler ts .   T h cu r r en s tu d y   co n tr ib u tes   to   th e x p an s io n   o f   k n o w led g i n   t h is   f ie ld   b y   ad d r ess i n g   i m p o r tan t   is s u es.  Fir s t,  co m p r eh e n s i v o v er v ie w   o f   f r au d ,   it s   cl ass i f icatio n s ,   a n d   th ar ea s   m o s s u s ce p tib le  to   f r au d u len t   ac ti v ities .   Seco n d ,   s tu d y   t h tec h n iq u es  u s ed   i n   d etec tin g   f r a u d u le n ac t iv i ties ,   h ig h li g h ti n g   b o th   th ad v a n ta g es  a n d   li m itat io n s   o f   t h ese  s o lu t io n s .   T h ir d ,   A d d itio n all y ,   it  e x a m in e s   t h late s b ig   d ata   tech n o lo g ies  a n d   th eir   ap p licatio n s   i n   d etec tin g   f r a u d u le n o p er atio n s .   Fo u r th ,   p r esen t s   th o r o u g h   r ev ie w   o f   m u c h   o f   t h liter atu r ad d r ess in g   f r a u d   p r ev en tio n   i n   b ig   d ata,   w it h   co m p a r ativ an al y s i s   o f   r ea l - ti m e   s o lu tio n s .   T ab le s   1   an d   2   d em o n s tr ate  h o w   m y   s t u d y   r elate s   to   an d   d if f er s   f r o m   p r ev io u s   w o r k ,   h i g h li g h tin g   th m e th o d o lo g ies  u s ed   b y   o t h er   r esear ch er s   an d   p o s itio n i n g   m y   co n tr ib u tio n s   w it h i n   t h ex i s ti n g   b o d y   o f   k n o w led g e.   Fi f t h ,   p r o p o s an   in n o v ati v ar ch itect u r th at   eq u ip s   o r g a n izatio n s   w i th   th e   lat est  k n o w led g e   an d   m et h o d o lo g ies in   b i g   d ata  tech n o lo g ies  f o r   r ea l - ti m f r au d   d etec tio n   an d   p r ev e n tio n .   T h p r o p o s ed   ar ch itectu r ad d r ess es  th ese  li m itatio n s   th r o u g h   s ev er al  k e y   co n tr ib u t io n s .   I u tili ze s   m u ltip le  b ig   d ata  tech n o lo g ie s   in clu d i n g   A p ac h Sp ar k   an d   Sto r m   f o r   i m p r o v ed   s ca lab ilit y   an d   ef f icie n t   s tr ea m   p r o ce s s i n g .   T h ar ch i tectu r s u p p o r ts   b o th   s u p er v is ed   an d   u n s u p er v i s ed   M L   alg o r ith m s .   I a ls o   in co r p o r ated   d ata  en r ich m e n t   o p er atio n s   i n cl u d in g   I P   g eo lo ca tio n ,   e m ail,   an d   b an k   ca r d   an a l y s is .   A d d itio n al l y ,   t h ar ch i tectu r in cl u d es  r u le - b u i ld in g   en g i n alo n g s id ML   al g o r it h m s   an d   f ea tu r es  m a n u a l   v er if ica tio n   co m p o n e n f o r   s u s p icio u s   aler m an a g e m en t.  T h ese  e n h a n ce m en ts   co l lecti v el y   r ep r ese n m o r e   r o b u s t,  v er s atile,   a n d   ac cu r ate  ap p r o ac h   to   f r au d   d etec tio n   in   b ig   d ata  en v ir o n m e n t s .   T h r em ai n d er   o f   th p ap er   is   o r g an ized   as  f o llo w s :   s ec tio n   2   p r o v id es  th m eth o d   o f   t h i s   s t u d y .   I n   s ec tio n   3   p r o v id es  an   o v er v ie w   o f   f r au d ,   it s   c h ar ac ter is tic s ,   an d   th u s o f   b ig   d ata  tech n o lo g ies  f o r   f r au d   d etec tio n .   I n   s ec tio n   4   ex p lain s   m eth o d o lo g ie s   an d   tech n iq u es  f o r   d etec tin g   r ea l - ti m e   f r au d   in   b ig   d ata   s y s te m s ,   as   w ell  a s   t h eir   li m it atio n s .   Sec tio n   5   d escr ib es  th liter atu r r e v ie w   m et h o d o lo g y   an d   p r o v id es  a n   an al y s is   o f   it.  I n   s ec tio n   6   p r esen t s   co m p ar ativ an a l y s is   o f   th liter at u r r ev ie w ,   h ig h li g h ti n g   it s   i m p ac o n   f r au d - r elate d   ar ea s   an d   th p r o p o s ed   ar ch itectu r in   t h is   s tu d y .   T h co n clu s io n   h i g h lig h ts   t h p ap er co n tr ib u tio n s   an d   s u g g e s ts   f u t u r r esear ch   d ir ec tio n s .       2.   M E T H O D   T h is   s tu d y   f o llo w s   s y s te m atic  ap p r o ac h   to   an al y zin g   f r au d   d etec tio n   tech n iq u e s   in   b ig   d ata  en v ir o n m e n t s .   T h ap p r o ac h   co n s is ts   o f   m u ltip le  s ta g es,  i n cl u d in g   u n d er s ta n d in g   f r a u d   an d   its   class i f icatio n s ,   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:   2502 - 4752         A n   o p timiz ed   a r ch itectu r fo r   r ea l - time  fr a u d   d etec tio n   in   b ig   d a ta   …  ( Ga b er E .   A b u ta leb )   1223   an al y z in g   e x is tin g   f r a u d   d etec tio n   tec h n iq u es,   ev al u at in g   b ig   d ata  tech n o lo g ie s ,   liter atu r r e v ie w ,   co m p ar ati v a n al y s i s ,   an d   ar ch itect u r al  d esi g n   to   ad d r ess   th c h alle n g es  a s s o ciate d   with   r ea l - ti m f r au d   d etec tio n .   T h f o llo w i n g   s tep s   o u tlin t h r esear ch   m et h o d o lo g y     Un d er s ta n d in g   f r au d   an d   it s   class i f icatio n s t h is   p h a s ex p lo r es  f r au d   t y p es,  th eir   clas s if ica tio n s ,   an d   v u l n er ab le  d o m ai n s .   I t a ls o   e x a m i n es t h li m itat io n s   o f   tr ad i tio n al  d etec tio n   m et h o d s   an d   h o w   M L   an d   b ig   d ata  tech n o lo g ie s   ad d r ess   th e s e   ch allen g e s .     L iter at u r r ev ie w l iter atu r e   r ev ie w   w as  co n d u cted   o n   f r au d   d etec tio n   m e th o d s ,   ML   m o d el s ,   an d   b i g   d ata  to o ls   lik e   Had o o p ,   Sp ar k ,   Sto r m ,   a n d   HB ase.   T h r ev ie w   co v er s   s t u d ies  f r o m   2 0 1 4   to   2 0 2 4 ,   f o cu s in g   o n   p ee r - r ev ie w ed   r esear ch   ad d r ess in g   f r a u d   d etec tio n   i n   b ig   d ata  en v ir o n m e n ts .     C o m p ar ativ a n al y s i s   o f   b ig   d ata  f r au d   d etec tio n   tech n iq u e s :   th s tu d y   co n d u ct s   co m p ar ativ an al y s is   o f   f r au d   d etec tio n   tech n iq u es  b y   e x a m i n in g   v ar io u s   r esear c h   s t u d ies  ac r o s s   d if f er en d o m ai n s ,   in c lu d i n g   f i n an cia tr an s ac t io n s ,   n et wo r k   s ec u r it y ,   a n d   o n li n f r au d   d etec tio n .   I ev alu ate s   lear n in g   t y p es   ( s u p er v i s ed ,   u n s u p er v is ed ,   r u l e - b ased ) ,   alg o r ith m s   ( d ec is io n   tr ee s   ( DT ) r an d o m   f o r est  ( RF ) ,   SVM,   n e u r a l   n et w o r k s ,   DB SC A N) ,   an d   b ig   d ata  to o ls .   T h tr ad e - o f f s   i n   ac cu r a c y ,   s ca lab ilit y ,   an d   r ea l - t i m p r o ce s s in g   ar an al y ze d ,   alo n g   w it h   th r o le  o f   s tr ea m i n g   tech n o lo g ie s   lik Ka f k a n d   Fl u m e.     A r c h itect u r al  d esig n   a n d   o p tim izatio n b ased   o n   th f i n d in g s   f r o m   t h liter at u r r ev ie w   an d   co m p ar ativ e   an al y s is ,   an   o p ti m ized   ar ch i tectu r f o r   r ea l - ti m f r au d   d etec tio n   is   p r o p o s ed .   T h p r o p o s ed   s y s te m   in te g r ates  m u ltip le  b ig   d ata  tech n o lo g ies,  in cl u d i n g   A p ac h e   Sp ar k   an d   Sto r m ,   to   en h a n ce   s ca lab ilit y   an d   s tr ea m   p r o ce s s i n g   ef f icie n c y .   I also   s u p p o r ts   h y b r id   f r au d   d etec tio n   ap p r o ac h ,   co m b i n i n g   ML   alg o r ith m s   ( b o th   s u p er v i s ed   an d   u n s u p er v is ed )   w it h   r u le - b ased   d etec tio n   m ec h a n i s m s .   A d d itio n al  d ata   en r ich m e n o p er atio n s ,   s u c h   a s   I P   g eo lo ca tio n ,   e m ail,   a n d   b an k   ca r d   an a l y s is ,   ar i n co r p o r ated   to   im p r o v e   f r au d   d etec tio n   ac c u r ac y .     I m p le m e n ta tio n   co n s id er atio n s th p r o p o s ed   ar ch itect u r is   m o d u lar   an d   s ca lab le,   s u p p o r tin g   i n teg r atio n   w it h   e x i s ti n g   i n f r astr u ctu r e s .   I in cl u d es  r u le - b u ild i n g   en g in f o r   cu s to m   f r au d   d etec tio n   r u le s   a n d   ML   m o d el s   tr ain ed   o n   h is to r ical  d ata.   A   m an u al  v er if icatio n   co m p o n en en s u r es  h u m a n   o v er s ig h i n   cr itical   f r au d   ca s e s .       3.   F RAUD   DE T E CT I O O VE RVIE W   An   o v er v ie w   o f   f r a u d   d etec tio n   is   p r esen ted   in   th i s   s ec tio n ,   co v er in g   t h f r au d   d ef i n itio n ,   it s   class i f icatio n ,   th ar ea s   m o s t a f f ec ted ,   an d   th c h alle n g es i n   d etec tin g   f r a u d .   E ac h   asp ec t i s   d is cu s s ed   in   d etai as f o llo w s :     3 . 1 .     F r a ud   Fra u d   i n v o l v es  f al s i f y in g   i n f o r m atio n ,   m a k i n g   f a ls r ep r ese n tatio n s ,   o r   ab u s in g   p o s it io n s   o f   p o w er   w it h i n   an   o r g an iza tio n   w it h   th in te n o f   p er s o n al  en r ich m en at  th ex p en s o f   o th er s .   T h A s s o ciatio n   o f   C er tifie d   Fra u d   E x a m i n er s   ( AC FE)   d ef in e s   f r a u d   as  th u s o f   o n e s   o cc u p atio n   f o r   p er s o n al  en r ich m e n t   th r o u g h   t h d elib er ate  m is u s e   o r   m is ap p licatio n   o f   t h e m p lo y i n g   o r g an izatio n s   r eso u r ce s   o r   ass ets   [ 1 ] Fra u d   r esu lts   i n   s i g n i f ica n f i n an cia lo s s e s   a n d   h a s   d etr i m en tal  e f f ec ts   o n   t h ec o n o m y ,   o r g an izatio n s ,   a n d   in d iv id u als  [ 2 ] .     3 . 2 .     F r a ud   c la s s if ica t io n   Fra u d   ca n   b class i f ied   in   m u ltip le  w a y s b y   p er p etr ato r ,   v icti m ,   an d   s c h e m t y p e.   Am o n g   v ar io u s   t y p es,  f r a u d s   ag ai n s o r g a n iz atio n s   ar co m m o n ,   an d   f i n a n cial  s tate m e n f r a u d s   ar th m o s co s tl y .   T h is   p ap er   h ig h li g h ts   t w o   m aj o r   cla s s i f icatio n s :   i)   I n ter n al  v s .   ex ter n al  f r au d in t er n al  f r au d   is   co m m itted   b y   in d iv id u als  w it h i n   an   o r g an izat io n   w h o   m is u s e   th eir   p o s itio n s   f o r   p er s o n al  g ain ,   in cl u d in g   ac ts   li k e m b e zz le m e n t,  f al s i f y i n g   r ep o r ts ,   an d   k ic k b ac k s .   Ma n ag er s   r ep r esen t   th e   g r ea te s r is k ,   w h ile  e m p lo y ee s   p r ese n lo w er   r i s k .   E x ter n al   f r au d ,   in   co n tr ast,  i s   p er p etr ated   b y   i n d iv id u als  o r   en titi es  o u ts id t h o r g an i za tio n   ex p lo iti n g   i ts   v u l n er a b ilit ies  t h r o u g h   s ch e m es li k id en tit y   th e f t a n d   p h is h in g   [ 3 ] .   ii)   Victi m - b ased   f r au d : th is   clas s i f icatio n   id en ti f ies t h a f f ec ted   p ar ty :     I n s tit u tio n al  f r au d   tar g ets  t h o r g an izatio n   its e lf   a n d   i n cl u d es  e m p lo y ee   e m b ez zle m e n t,  v en d o r   f r au d ,   an d   cu s to m er - r elate d   f r au d .     Ma n ag e m e n f r a u d   h ar m s   s h ar eh o ld er s   o r   d eb th o ld er s   o f   t h o r g an izatio n ,   o f ten   t h r o u g h   f in a n cial   s tate m en m a n ip u lat io n   b y   s e n io r   m a n a g e m e n t.     I n v e s t m e n a n d   co n s u m er   f r a u d   af f ec ts   i n d iv id u al s ,   w ith   i n v e s t m en f r a u d   in v o lv i n g   s c h e m e s   li k e   P o n zi  s ch e m es,  w h ile  co n s u m er   f r au d   in cl u d es id en t it y   t h e f t ,   cr ed it c ar d   f r au d ,   an d   in ter n e t f r au d .     Miscella n eo u s   f r au d   r ef er s   to   ca s es in   w h ic h   s o m eo n e x p lo its   an o t h er   p er s o n s   co n f id en c to   d ec eiv th e m .   T h is   ca te g o r y   i n cl u d es f r au d u le n t a cti v ities   s u c h   as b a n k r u p tc y   f r au d   an d   ta x   ev a s io n   [2 ] [ 2 0 ] .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci Vo l.  3 9 ,   No .   2 ,   A u g u s 20 25 :   1 2 2 1 - 1 235   1224   3 . 3 .     F r a ud   a re a s   Fra u d   af f ec ts   g r o w in g   r is k s   a cr o s s   s ec to r s ,   esp ec iall y   in   f i n an ce   a n d   d ata - s e n s iti v in d u s tr ies.  As   d ig italizatio n   in cr ea s e s ,   f r au d s ter s   ar em p lo y in g   m o r s o p h is ticated   m e th o d s   to   ex p lo it  o n lin f in a n cial   ac tiv itie s .   Ke y   s ec to r s   v u l n er ab le  to   f r au d   in cl u d f i n a n cial  s er v ices  [ 2 1 ] ,   in s u r a n c [ 2 2 ] ,   te leco m m u n icatio n s   [ 2 3 ] ,   h ea lth ca r [ 2 4 ] [ 2 5 ] ,   an d   co m p u ter   i n tr u s io n   [ 2 6 ] [ 2 7 ] .   Fig u r 1   ill u s tr ates   th e   ar ea s   m o s co m m o n l y   at   r is k   f o r   f r au d .   Fin a n cial  s er v ices  f r a u d   en co m p a s s e s   w id r an g o f   ille g al  p r ac tices,  in clu d in g   cr ed it  ca r d   f r au d   in v o l v i n g   u n a u t h o r ized   tr an s a ctio n s   a n d   ca r d   i n f o r m atio n   t h ef [ 2 8 ] .   I d en tit y   th e f r e m ai n s   o n o f   t h m o s t   p r ev alen f o r m s ,   lead i n g   to   f i n an cia lo s s e s   an d   leg al  r a m i f icatio n s   [ 2 9 ] .   Po n zi  s ch e m es   d ec eiv in v esto r s   w it h   p r o m i s es   o f   h i g h   r etu r n s   [ 3 0 ] ,   w h ile  m o n e y   la u n d er in g   atte m p ts   to   co n ce al  t h o r ig in s   o f   illeg a ll y   o b tain ed   f u n d s   t h r o u g h   v ar io u s   m et h o d s   s u ch   a s   f o r eig n   tr an s f er s   a n d   cr y p to c u r r en c y   tr an s ac tio n s   [ 2 1 ] .   W eb   n et w o r k   f r au d   o p er ates  th r o u g h   th e   I n ter n et  u s i n g   m a li cio u s   s er v ices  a n d   s o f t w ar to   ex p lo it   v icti m s .   T h is   in cl u d es  p h is h i n g   a ttack s ,   lo tter y   s ca m s ,   r o m an ce   s ca m s ,   a n d   r an s o m w a r attac k s   t h at  tar g et   in d iv id u als  t h r o u g h   v ar io u s   d ig ital  ch a n n els  [ 3 1 ] .   I n ter n a f r au d ,   o cc u r r in g   w it h i n   o r g an izatio n s ,   p o s es  s ig n i f ica n t h r ea t h r o u g h   ac ti v itie s   li k e m b ez zle m en t,   ass et  m i s ap p r o p r iatio n ,   an d   d o cu m e n t   f a ls i f icatio n ,   lead in g   to   b o th   f i n an c ial  lo s s es  an d   r ep u tatio n al  d a m a g [ 3 2 ] .   C u s to m s   f r au d   in v o lv e s   ev ad in g   o r   r ed u cin g   d u t y   p a y m e n t s   t h r o u g h   d ec ep t iv p r ac tices  s u c h   as   u n d er r ep o r tin g   v al u es,  m is c lass if y i n g   g o o d s ,   an d   f o r g in g   d o cu m en ts .   T h is   u n d er m i n e s   f air   m ar k et  co m p eti tio n   a n d   r esu lts   i n   s i g n i f ica n t e co n o m ic  lo s s es  [ 3 3 ] .   C o m p u ter   in tr u s io n ,   i n v o lv es   u n au t h o r ized   ac ce s s   to   s y s te m s   an d   n et w o r k s ,   m an i f e s ti n g   t h r o u g h   m al w ar attac k s ,   d e n ial  o f   s e r v ice  o p er atio n s ,   an d   SQ L   i n j ec tio n s ,   o f ten   r e s u l tin g   i n   d at th e f a n d   s y s te m   d am a g [ 2 6 ] .   I n s u r an ce   f r au d   m a n i f est s   ac r o s s   m u ltip le  s ec to r s ,   in cl u d in g   au to m o b il e,   h o m e,   an d   cr o p   in s u r an ce ,   w h er i n d iv id u als  o r   en titi es  m a k f al s clai m s   o r   ex ag g er ate  d a m ag e s   to   o b tain   u n d u b e n e f it s   [ 34] .   T elec o m m u n icatio n s   f r au d   is   b ec o m i n g   m aj o r   th r ea to   telec o m   o p er ato r s   ac r o s s   th eir   s er v ice   o f f er i n g s .   S u b s cr ip tio n   f r au d   i n v o l v es c r i m i n als o b tain in g   s e r v ices  w it h   p r e m ed itated   p lan s   to   av o id   p ay m en t.  I n   s u p er i m p o s ed   f r au d ,   s ca m m er s   g a in   u n a u t h o r ized   co n tr o o f   leg iti m ate  ac co u n ts   b y   clo n in g   d ev ice s   an d   ca r d s   [ 2 3 ] .   Hea lth ca r f r au d   in v o l v es  v ar io u s   d ec ep tiv p r ac tices  in   t h m ed ical  s ec to r .   T h is   in cl u d es   s u b m itti n g   in f lated   i n v o ices,   g en er ati n g   f a k b ill s ,   an d   en g a g i n g   in   p r escr ip tio n   d r u g   f r au d   w h er e   m ed icatio n s   ar o b tain ed   f o r   n o n - m ed ical  p u r p o s es o r   d is p en s ed   to   in d iv id u a ls   w it h o u t le g i ti m ate  n ee d   [ 3 5 ] .           Fig u r 1.   Fra u d   a r ea s       3 . 4 .     F r a ud   det ec t io n c ha lleng es   Dete ctin g   f r au d   p r esen t s   s u b s t an tial c h alle n g e s   d u to   i n h er e n t c o m p le x itie s   th a t o f te n   r ed u ce   s y s te m   ac cu r ac y   an d   i n cr ea s f a ls alar m s .   P ar ticu lar l y   i n   b an k i n g   a n d   e - co m m er ce ,   th e s a lar m s   ca n   lead   to   f i n an cia lo s s es.  E f f ec tiv f r a u d   d etec tio n   s y s te m s   r eq u ir o v er co m in g   t h ese  ch a llen g e s   to   m in i m ize  er r o r s   an d   i m p r o v r o b u s t n es s .   T h is   p ap er   h ig h li g h ts   t h to u g h est c h alle n g e s   th a t th e s s y s te m s   f a ce :     C o n c e p t   d r i f t :   t h e   s h i f t   i n   d a t a   o v e r   t i m e   d u e   t o   c h a n g e s   i n   u s e r   a n d   f r a u d s t e r   b e h a v i o r ,   d ec r e a s e s   m o d e l   a c c u r a c y   a s   h i s t o r i c a l   d a t a   b e co m e s   o u t d a t e d .   T o   c o u n t e r a c t   t h i s ,   r e g u l a r   m o d e l   u p d a t e s   a n d   c o n t i n u o u s   m o n i t o r i n g   a r e   c r u c i a l ,   e n s u r i n g   t h a t   m o d e l s   r e m a i n   a l i g n e d   w i t h   t h e   c h a n g i n g   n a t u r e   o f   i n p u t s   o v e r   t i m e   [ 3 6 ] .     I m b a l a n c e d   d a t a :   f r a u d   d e te c t i o n   f a c e s   a n   i m b a l a n c e d   d a t a s e t   wh e r e   l e g i t i m a t e   a c t i v i t i e s   v a s t l y   o u t n u m b e r   f r a u d u l e n t   o n e s .   T h i s   i m b a l a n c e   c a n   b e   b i a s e d   m o d e l s ,   i n c r e a s i n g   f a l s e   a l a r m s .   Ad d r e s s i n g   i t   i n v o l v e s   t e c h n i q u e s   l i k e   u n d e r   s a m p l i n g ,   o v e r s a m p l i n g ,   o r   t h e   s y n t h e t i c   m i n o r i t y   o v e r s a m p l i n g   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:   2502 - 4752         A n   o p timiz ed   a r ch itectu r fo r   r ea l - time  fr a u d   d etec tio n   in   b ig   d a ta   …  ( Ga b er E .   A b u ta leb )   1225   t e c h n i q u e   ( S M O T E ) ,   a l o n g s i d e   s p e c ia l i z ed   a l g o r i t h m s   a n d   e v a l u a t i o n   m e t r i c s   s u c h   a s   p r e c i s i o n ,   r e c a l l ,   a n d   F 1 - s c o r [ 3 7 ] .     Data   v o lu m a n d   v ar iet y : d ata  v o lu m an d   v ar iet y   r e f er s   to   t h m a s s i v a m o u n t a n d   d i f f er e n t t y p e s   o f   d ata   th at  o r g an izat io n s   m u s p r o c ess   f o r   f r au d   d etec tio n .   T h h ig h   d ata  v o lu m an d   d iv er s it y   co m m o n   i n   s ec to r s   lik b an k in g   an d   e - co m m er ce ,   co m p licate  f r au d   d etec tio n   as  f r au d s ter s   u s m u lti p le  ch an n e ls   an d   d ata  ty p es.  P r o ce s s in g   s u c h   v ast,  m u ltid i m en s io n al  d ataset s   r eq u ir es  s u b s ta n tial  co m p u tat io n al  r eso u r ce s   an d   ad v an ce d   alg o r it h m s   t h at  ca n   h a n d le  lar g e,   d iv er s d ata  ef f icien tl y   [ 3 8 ] .     R ea l - ti m d etec tio n r ea l - ti m d etec tio n   is   th p r o ce s s   o f   id e n ti f y in g   an o m a lies ,   p atter n s ,   o r   ev en ts   as  th e y   h ap p en ,   allo w in g   f o r   i m m ed i ate  r esp o n s to   p o ten tial  t h r ea ts .   I n   b an k i n g ,   r ea l - ti m f r a u d   d etec t io n   i s   ess e n tial  f o r   s to p p in g   f r au d u l en ac ti v it ies  b e f o r th e y   ca u s d a m a g e.   T h is   ca p ab ilit y   p r o tects  f in a n cial   ass ets   an d   p r eser v e s   t h r ep u t atio n   o f   b o th   co m p an ies  a n d   cu s to m er s ,   m ak in g   it  cr u cia co m p o n en o f   m o d er n   f i n a n cial  s ec u r it y   s y s t e m s [ 3 9 ] .     Fals p o s itiv e s o cc u r   w h e n   le g i ti m ate  tr an s ac tio n s   ar w r o n g l y   id e n ti f ied   as  f r au d u le n t,  ca u s i n g   cu s to m er   d is s atis f ac tio n .   R ed u ci n g   f a l s p o s iti v es  i n v o lv e s   r e f in i n g   d etec tio n   m et h o d s ,   a n al y zin g   c u s to m er   b eh av io r ,   an d   co m b i n in g   r u le - b ased   an d   an o m al y   d etec tio n   tech n iq u es,  w h ile  h u m a n   r e v ie w   o f   f lag g ed   tr an s ac tio n s   aid s   i n   m in i m iz in g   m i s ta k es  [ 4 0 ] .       4.   B I G   DA T A - B ASE F R AU DE T E C T I O N   B ig   d ata  r ef er s   to   m as s i v d atasets   th a s u r p as s   tr ad itio n al  p r o ce s s in g   ca p ab ilit ies  an d   ar d ef in ed   b y   th Fi v Vs   [ 4 1 ] .   Vo lu m e   in d icate s   v a s a m o u n ts   o f   d ata,   v ar iet y   co v er s   d i v er s d ata  t y p es,  v elo cit y   h ig h li g h ts   r ea l - ti m p r o ce s s in g   n ee d s ,   v er ac it y   en s u r es  d ata  q u alit y   an d   r eliab ilit y ,   an d   v alu f o cu s es  o n   ex tr ac ti n g   m ea n i n g f u i n s ig h t s .   B ig   d ata  p la y s   cr u cia r o le  in   f r a u d   d etec tio n   b y   e n ab lin g   t h a n al y s i s   o f   v ast   a m o u n t s   o f   d ata  f r o m   v ar io u s   s o u r ce s   to   u n co v er   p at ter n s ,   a n o m al ies,  a n d   s u s p ici o u s   ac ti v itie s .   T h is   s ec tio n   w il l e x p lo r th ap p r o ac h es a n d   b ig   d ata  to o ls   u tili z ed   f o r   d etec tin g   f r au d   w it h in   l ar g d atasets .     R u le - b ased   s y s te m s t h ese  s y s te m s   u ti lize  p r ed ef i n ed   r u les   d er iv ed   f r o m   h i s to r ical  d ata   to   en ab le  i m m ed iate  tr an s ac tio n   s u r v ei llan ce   an d   q u ic k   d ec is io n - m ak in g   i n   d etec tin g   f r au d u l en ac ti v itie s .   T h is   ap p r o ac h   f o r m s   th f o u n d atio n   o f   m an y   f r au d   d etec tio n   s tr a teg ies.   AI - d r iv e n   f r au d   d etec tio n :   t h is   is   an   ad v an ce d   tec h n o lo g i ca ap p r o ac h   th at  b en e f it s   AI   an d   ML   alg o r ith m s   to   au to m atica ll y   id en ti f y ,   p r ed ict,   an d   p r ev en f r au d u le n ac ti v itie s   ac r o s s   v ar io u s   d o m ain s .     B y   an al y zi n g   v ast  a m o u n ts   o f   d ata  in   r ea l - ti m e,   t h ese  in tel li g en s y s te m s   d etec co m p lex   p atter n s ,   an o m alie s ,   an d   p o ten tial  s ec u r it y   t h r ea ts   th at  tr ad itio n al  r u le - b ased   m et h o d s   m i g h o v er lo o k .   T h m et h o d s   u s ed   i n     AI - d r iv e n   f r a u d   d etec tio n   ca n   in cl u d e,   b u t a r n o t li m i ted   to :     Ma ch i n l ea r n in g co m p r is e s   f o u r   m ain   ca te g o r ies:   1 )   s u p er v is ed   l ea r n i n g   u s es  lab eled   d ata  w it h   tech n iq u es   li k DT lo g is t ic  r eg r ess io n   ( L R ) RF ,   a n d   SV M;  2 )   u n s u p er v is ed   l ea r n i n g   w o r k s   w it h o u t   lab eled   d ata,   em p lo y in g   K - m ea n s ,   lo ca o u tlier   f ac to r   ( L OF) ,   a n d   DB Sca n   to   id en t i f y   p atter n s   [ 4 2 ] ;     3 )   s e m i - s u p er v is ed   l ea r n i n g   c o m b i n es b o th   ap p r o ac h es  u s i n g   g e n er ati v ad v er s ar ial  n et w o r k s   ( G A Ns )   a n d   S3 VM 4 )   r ein f o r ce m e n l ea r n in g   tr ain s   alg o r it h m s   to   m ak s eq u en tial  d ec is io n s ,   w h er ag en ts   m a x i m ize   r e w ar d s   th r o u g h   b en e f icial  ac t io n s   i n   co m p lex   e n v ir o n m en t s   [4 3 ] .     AI - p o w er ed   f r a u d   d etec tio n   s tr ateg ie s u tili ze   ad v an ce d   a n o m al y   d etec tio n   alg o r it h m s   an d   A I - d r iv e n   p atter n   r ec o g n itio n   to   an al y ze   co m p le x   d ata  ac r o s s   m u ltip le   d im e n s io n s   [ 3 9 ] .   T h ese  ap p r o ac h es  in te g r at e   n atu r al  la n g u a g p r o ce s s in g   f o r   d etec tin g   s u s p icio u s   ac ti v it ies,  en ab lin g   co m p r eh e n s iv r is k   as s es s m e n t   th r o u g h   in te lli g en t   tech n o lo g y   p atter n s   [4 4 ] .   A d ap tiv le ar n in g   s y s te m s   co n tin u o u s l y   u p d ate  f r a u d   d etec tio n   m o d els,  cr ea ti n g   d y n a m ic  an d   e v o lv i n g   d ef e n s m ec h a n i s m s   t h at  ca n   an ticip a te  an d   m iti g ate   e m er g i n g   f r a u d u le n t a cti v itie s   w it h   u n p r ec ed en ted   ac cu r ac y .   A d v an ce d   an a l y t ics:   i n   f r au d   d etec tio n   co m b in r ea l - ti m tr an s ac tio n   s co r in g ,   b eh a v io r al  b io m etr ic s ,   n et w o r k   g r ap h   an al y s is   [4 5 ] ,   an d   p r ed ictiv m o d elin g .   T h ese  tech n iq u es  en ab le  in s ta n r is k   ass e s s m e n b y   an al y z in g   u s er   in ter ac tio n s ,   m ap p in g   f r a u d   n et w o r k s ,   an d   an ticip atin g   s u s p icio u s   ac tiv itie s   th r o u g h   s o p h is ticated   al g o r ith m s .   A d v an ce d   tech n ical  m et h o d s f o r   s ec u r it y   a n d   v er i f icati o n   in te g r ate  co m p r eh en s i v s u ite  o f   cu t ti n g - ed g tech n o lo g ies.  T h ese  ap p r o ac h es  in cl u d b io m etr ic  au t h e n ticatio n ,   m u lti - f ac to r   au th en ticatio n   tech n iq u es,  b lo ck c h ai n - b ased   v er if ica tio n   s y s te m s ,   a n d   s o p h is ticated   e n cr y p tio n   a n d   to k en iza tio n   m et h o d s   th at  w o r k   i n   co n ce r t to   cr ea te  r o b u s t sec u r it y   f r a m e w o r k s   [ 2 2 ] [ 4 6 ] .   B ig   d ata  v is u aliza tio n in s tea d   o f   j u s r ea d in g   r a w   n u m b er s   an d   tex t,  d ata  v is u aliza tio n   tu r n s   th e m   in to   p ictu r es  lik c h ar ts   a n d   g r ap h s .   T h is   m a k es  it  ea s ier   t o   s ee   w h at  t h d ata  m ea n s   an d   s p o tr en d s   [4 7 ] Data   v is u aliza tio n   to o ls   lik T ab leau   o r   P o w er   B I   f u r th er   e m p o w er   an al y s ts   b y   tr an s f o r m i n g   co m p le x   d ata  s ets i n to   clea r ,   in ter ac ti v f o r m ats.   B ig   d ata  to o ls   f o r   f r au d   d etec tio n   as f o llo w d s :     P r o ce s s in g   f r a m e w o r k s th i m p le m e n tat io n   o f   th e s ap p r o ac h es  r elies  o n   s e v er al  m aj o r   b ig   d ata  to o ls ,   p r im ar il y   d iv id ed   in to   p r o ce s s i n g   f r a m e w o r k s   a n d   d ata  m o v e m e n t   s o lu tio n s .   P r o ce s s in g   f r a m e w o r k s   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci Vo l.  3 9 ,   No .   2 ,   A u g u s 20 25 :   1 2 2 1 - 1 235   1226   in cl u d A p ac h Sp ar k   [4 8 ] ,   w h ic h   p r o v id es  d is tr ib u ted   c o m p u ti n g   f o r   b atch   a n d   r ea l - ti m p r o ce s s i n g ;   A p ac h Had o o p   [ 49 ] ,   o f f er in g   d is tr ib u ted   s to r ag an d   p r o ce s s in g   ca p ab ilit ie s A p ac h Sto r m   [5 0 ] d eliv er in g   r ea l - t i m p r o ce s s i n g   w i th   lo w   laten c y a n d   Ap ac h Fli n k   [5 1 ] ,   f o r   h ig h - t h r o u g h p u s tr ea m   p r o ce s s in g .     Data   m o v e m e n an d   s tr ea m in g f o r   d ata  m o v e m en an d   s t r ea m in g ,   o r g an iza tio n s   u tili ze   to o ls   s u ch   a s   A p ac h Flu m f o r   ef f icie n lo g   d ata  co llectio n   an d   m o v e m en [5 2 ] A p ac h Kaf k f o r   d is tr ib u ted   ev e n t   s tr ea m i n g   [5 3 ] ,   an d   a m az o n   k i n esi s   f o r   A W S - b ased   r ea l - ti m d ata  p r o ce s s in g   [5 4 ] .   T h ese  to o ls   an d   ap p r o ac h es  co llab o r ate  to   c r e ate  co m p r eh e n s iv f r au d   d etec tio n   s y s te m s   ca p ab le  o f   p r o ce s s i n g   m as s iv e   a m o u n ts   o f   d ata  i n   r ea l - t i m e,   id en tify i n g   p atter n s ,   a n d   f la g g i n g   s u s p icio u s   a cti v itie s   ac r o s s   v ar io u s   in d u s tr ies.  T h is   i n te g r ated   ap p r o ac h   en s u r es   r o b u s p r o tectio n   ag ai n s f r au d u le n ac tiv itie s   w h il e   m ai n tai n in g   e f f icien t p r o ce s s in g   ca p ab ilit ie s .       5.   L I T E R AT U RE   R E VI E W   Nu m er o u s   s t u d ies  h av e x a m i n ed   f r au d   d etec tio n   s y s te m s ,   esp ec iall w it h   b ig   d ata s   r is e.   T h is   s ec tio n   e x p lo r es  k e y   liter at u r o n   f r au d   d etec tio n   in   b i g   d ata ,   co v er in g   m et h o d o lo g i es  lik r u le - b ased   s tr ateg ie s   a n d   b o th   s u p er v i s e d   an d   u n s u p er v i s ed   lear n i n g   alg o r ith m s .   B ald o m i n o s   et  a l.   [ 4 ]   p r o p o s ed   a   s ca lab le  ar ch itectu r f o r   ML   o n   b ig   d ata   s tr ea m s   u s in g   th Had o o p   ec o s y s te m .   I c o n s is ts   o f   b atch   p r o ce s s in g   m o d u le  f o r   n o n - u r g en tas k s   a n d   s t r ea m   p r o ce s s i n g   m o d u le  f o r   r ea l - ti m e   ap p licatio n s ,   b o th   r el y in g   o n   HDFS  an d   HB ase   f o r   s to r ag [ 43 ] .   T h s y s te m   i n cl u d es  d ash b o ar d   f o r   b atch   r esu lts   an d   R E ST f u A P I   f o r   ML   s er v ice s ,   ap p lied   in   w eb   ad v er tis i n g   an d   g a m in g   b eh a v io r   p r ed ictio n .   T h ev alu atio n   h ig h li g h ts   i ts   ab ilit y   to   h a n d l co n c u r r en r eq u e s ts   a n d   p r o v id ac cu r ate  r ea l - ti m p r ed ictio n s ,   m ak in g   it   s u itab le  f o r   r ea l - ti m an al y tic s   as a   s er v ice.   Di  Ma u r o   an d   Di  Sar n o   [ 5 ]   p r o p o s ed   an   ar ch itectu r f o r   r ea l - ti m b ig   d ata  p r o ce s s i n g   an d   an al y s is ,   in te g r ati n g   A p ac h Sto r m   as  th s tr ea m   p r o ce s s in g   en g in a n d   Yah o o   SA MO A   f o r   d is tr ib u ted   s tr ea m i n g   ML T h ey   u tili ze d   t h v er tical  h o ef f d i n g   tr ee   alg o r it h m   to   r ec o g n ize  h id d en   S k y p tr a f f ic  i n   n et w o r k   s tr ea m s .   E x p er i m e n tal  r es u lts   d e m o n s tr ated   9 0 % a cc u r ac y   i n   id en t i f y i n g   Sk y p tr af f ic.   Z h ao   et  a l.   [ 6 ]   in tr o d u ce d   f r a m e w o r k   f o r   r ea l - ti m n et wo r k   tr af f ic  a n o m al y   d etec tio n   u s i n g   ML   an d   b ig   d ata  to o ls   li k A p ac h e   Had o o p ,   Kaf k a,   an d   Sto r m .   T h is   s y s te m   a n al y ze s   r ea l - ti m n et w o r k   f lo w   d ata   f r o m   t h U n i v er s it y   o f   Mi s s o u r i Kan s as  c it y s   ca m p u s   n e t w o r k   b y   in teg r ati n g   b atch   p r o ce s s in g   w i th   r ea l - ti m a n al y s is .   Ka f k h a n d les  d ata  s to r ag w h ile  S to r m   f ac ilit ate s   s tr ea m in g   an a l y s is .   T h f r a m e w o r k   en co m p as s es  d ata  in g e s tio n ,   p r ep r o ce s s in g ,   an o m al y   d etec tio n ,   an d   ML   co m p o n en ts .   P r eli m i n ar y   r esu lts   in d icate   it s   ef f ec ti v e n es s   in   i d en tify i n g   n et w o r k   an o m alie s ,   h ig h li g h ti n g   its   p o ten t ial  f o r   ef f ic ien n et w o r k   m an a g e m e n t in   ac ad e m ic  s ett i n g s .   Dai  et  a l.   [ 7 ]   p r o p o s ed   b ig   d ata - b ased   o n li n cr ed it  ca r d   f r au d   d etec tio n   f r a m e w o r k   w i th   f o u r - la y er   d esig n d is tr ib u ted   s to r ag la y er   f o r   h an d li n g   lar g tr an s ac tio n   d ata,   b atch   tr ain i n g   la y er   f o r   m o d el  tr ain i n g   u s i n g   Had o o p   an d   S p ar k   [4 8 ] ,   a   k e y - v al u s h ar i n g   la y er   f o r   f ast  m o d el  d ata  ac ce s s   v ia  No SQ L   d atab ase   [5 5 ] - [ 5 7 ] ,   an d   s tr ea m i n g   d etec tio n   la y er   f o r   r ea l - t i m an al y s is   u s i n g   s to r m .   T h is   h y b r id   f r a m e w o r k   h ig h li g h ts   t h s ca lab il it y ,   f au lt   to ler an ce ,   an d   h i g h   p er f o r m a n ce   o f   b ig   d ata  tec h n o lo g ies i n   f r au d   d etec tio n .   Sto j an o v ic  et  a l.   [ 8 ]   in tr o d u ce d   d ata - d r iv en   ap p r o ac h   f o r   r ea l - ti m a n o m al y   d etec tio n   i n   in d u s tr ial   q u alit y   co n tr o l,  s u itab le  f o r   co m p le x   m an u f ac tu r i n g   p r o ce s s es  w it h   n o n - lin ea r   p ar a m eter   co r r elatio n s .   T h is   s elf - ad ap tiv m et h o d   u tili ze s   b o th   h is to r ical  an d   r ea l - ti m d ata  to   en h an ce   ac cu r a c y ,   p ar ticu lar l y   i n   m an u f ac t u r in g   cr itica co m p o n en t s   li k m icr o w a v o v e n   f a n s .   T h s y s te m   ef f ic ien t l y   d et ec ts   d ev iat io n s   u s i n g   r ea l - ti m p r o ce s s in g   tec h n o l o g ies  ( e. g . ,   Sto r m )   alo n g s id h is to r ical  d ata  p r o ce s s in g   ( e. g . ,   Had o o p ) .   I ts   ar ch itect u r co m p r is es  s i x   co m p o n en ts d ata  s to r ag e,   p r o ce s s i n g ,   a n al y tics ,   u s er   in ter ac ti o n ,   in te g r atio n ,   an d   s ec u r it y   la y er s .   C u i   an d   He   [ 9 ]   p r o p o s ed   clo u d - b ased   a n o m al y   d etec tio n   f r a m e w o r k   t h at  u s e s   Had o o p s   d is tr ib u ted   p r o ce s s in g   a n d   W ek a ML   a l g o r ith m s .   T r af f ic  d ata  is   s to r ed   in   HDF S a n d   p r o ce s s ed   w it h   Ma p R ed u ce ,   w h ile  th b est - p er f o r m i n g   al g o r ith m - s elec ted   f r o m   Naï v B a y es ,   DT ,   an d   SVM - is   id en ti f ied   th r o u g h   W ek a.   T h f r a m e w o r k   in cl u d es  d ata  p r o ce s s in g ,   m i n i n g ,   an d   d etec tio n   m o d u les,  ac h ie v i n g   o v er   9 0 p r e d ictio n   ac cu r ac y .   E v alu at io n   w i th   s elf - r ef it   an d   1 0 - f o ld   cr o s s - v alid atio n   s h o w s   t h DT   ex c els  in   clas s if icatio n   ac cu r ac y ,   o f f er in g   g r ea ter   ef f i cien c y   t h a n   tr ad itio n al  s in g le - p o in m et h o d s .   B alasu p r a m a n ia n   et  a l.   [ 1 0 ]   p r o p o s ed   f r am e w o r k   to   p r ev en o n l in f r au d   b y   co m b in in g   b ig   d ata   an al y tics   a n d   ML .   T h eir   ap p r o ac h   in v o lv e s   co llecti n g   a n d   p r ep r o ce s s in g   tr a n s ac t io n   d ata,   ex tr ac ti n g   f ea t u r es,   an d   r ed u ci n g   d i m e n s io n alit y   w ith   P C A .   SOM   m o d el   is   t h e n   tr ai n e d   to   e v alu ate   tr an s ac t io n s ,   w it h   s u s p icio u s   ac ti v it y   tr ig g er in g   aler ts   o r   ca r d   b lo ck s .   T h f r am e w o r k   r ec o m m en d s   u s i n g   HDFS  o r   Sp ar k   f o r   d ata  s to r ag an d   k ee p in g   tr ain ed   d ata  in   m e m o r y   f o r   s p ee d ,   ai m in g   to   d etec f r au d   p r o ac t iv el y   b y   a n al y zin g   u s er   b eh a v io r   f r o m   h is to r ical  d ata.   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:   2502 - 4752         A n   o p timiz ed   a r ch itectu r fo r   r ea l - time  fr a u d   d etec tio n   in   b ig   d a ta   …  ( Ga b er E .   A b u ta leb )   1227   Me lo - A co s ta  et  a l.   [ 1 1 ]   p r esen ted   cr ed it  ca r d   f r au d   d etec tio n   s y s te m   ad d r ess i n g   class   i m b a lan ce ,   m i x ed   lab eled /u n lab eled   d at a,   an d   h ig h   tr a n s ac tio n   v o l u m e.   T h eir   ap p r o ac h   u s es  B R an d   co m b i n es   s u p er v i s ed   w it h   s e m i - s u p er v is ed   lear n in g   th r o u g h   co - tr ain in g ,   i m p le m en ted   o n   A p ac h Sp ar k   f o r   s ca lab ilit y .   T h is   m et h o d   s ig n if ican t l y   i m p r o v es  p er f o r m a n ce ,   ac h ie v i n g   2 4 h ig h er   g eo m e tr ic  m ea n   th a n   tr ad itio n al   RF s ,   w i th   t h B R a n d   co - tr ai n ed   B R m eta - cla s s i f ier   s h o win g   t h b est r es u lt s .   Oth m an   et  a l.   [ 1 2 ]   p r o p o s ed   th Sp a rk - C h i - S VM   m o d el  f o r   in tr u s io n   d etec tio n ,   u tili z i n g   ap ac h e   s p ar k   f o r   ef f icie n b ig   d ata  p r o ce s s in g .   T h m o d el  in cl u d es  d ataset  p r ep r o ce s s in g ,   f e atu r s elec tio n   w it h   C h i Sq Selecto r ,   an d   clas s i f icat io n   u s i n g   SVMW it h SGD,   w h ich   is   test ed   o n   th KDD  d at aset.  R e s u lt s   s h o h ig h   p er f o r m a n ce   a n d   s p ee d .   C ar cillo   et  a l.   [ 1 3 ]   in tr o d u ce d   SC AR F F ,   s ca lab le  f r au d   d etec tio n   s y s te m   t h at  co m b in es  b ig   d ata  to o ls   lik Kaf k a,   Sp ar k ,   a n d   C ass a n d r w it h   ad v a n ce d   ML   to   ad d r ess   i s s u es   s u ch   a s   d ata  i m b alan ce   an d   f ee d b ac k   laten c y .   SC AR F p r o ce s s es  s tr ea m i n g   d ata  f o r   n ea r   r ea l - ti m aler ts ,   u t ilizi n g   Ka f k f o r   f au lt - to ler an d ata  co llectio n ,   Sp ar k   f o r   f ea t u r en g i n ee r in g   a n d   class i f icatio n ,   an d   C a s s a n d r f o r   s to r ag e.   I ts   ML   en g i n e m p lo y s   w eig h ted   e n s e m b le  o f   c lass if ier s ,   w h i le  its   o p en - s o u r ce   f r a m e w o r k ,   d ep lo y ab le  v ia  Do ck er ,   allo w s   f o r   r ep r o d u cib ilit y   a n d   test in g   w it h   ar tif ic ial  d atasets ,   m a k i n g   it  h i g h l y   e f f ec tiv f o r   lar g e - s ca le  f r au d   d etec tio n .   Nair   et  a l.   [ 1 4 ]   p r o p o s ed   a   r ea l - ti m r e m o te  h ea lth   s ta tu s   p r ed ictio n   s y s te m   le v er ag i n g   A p ac h e   Sp ar k   an d   T w i tter   d ata.   T h s y s te m   f o cu s e s   o n   ap p l y in g   ML   m o d els  to   s tr ea m in g   b ig   d ata  f o r   h ea lt h   p r ed ictio n .   User s   t w ee th e ir   h ea lt h   attr ib u tes,  w h ich   ar th en   p r o ce s s ed   b y   th ap p licatio n   in   r ea ti m e.   T h s y s te m   ex tr ac ts   at tr ib u tes   an d   ap p lies   ML   m o d el,   s u c h   a s   DT ,   to   p r ed ict  th u s er s   h ea lt h   s tat u s .   T h e   pr ed ictio n   is   i n s ta n tl y   m e s s a g ed   to   th u s er   f o r   ap p r o p r iate  ac tio n .   T h ap p licatio n   i s   i m p le m e n ted   i n   S ca la,   in te g r atin g   DT   m o d el  w it h   T w itter   s tr ea m i n g   d ata  h a n d lin g ,   an d   ca n   b d ep lo y ed   o n - p r e m i s o r   in   th clo u d ,   s u c h   as  Am az o n   E C 2 .   T h T itAn s y s te m   w as  d ev el o p ed   b y   C ao   et  a l   [ 1 5 ] .   A n f in an c ial  is   h i g h - s p ee d   f r au d   d etec tio n   f r a m e w o r k   th at  p r ed icts   o n li n tr an s ac tio n   f r au d   in   m ill is ec o n d s .   I co m b i n es  o f f li n tr ain i n g   a n d   o n li n r ea l - ti m p r ed ictio n :   o f f li n e,   tr an s ac tio n   d ata  is   p r o ce s s ed   in   M ax C o m p u te  f o r   f ea tu r e x tr ac t io n ,   an d   m o d els  ar tr ain ed   w it h   K u n P en g .   On l in e ,   th m o d el  s er v er   r ec eiv es  p er io d ic  m o d el  u p d ates  an d   r etr iev es  d ata  f r o m   A li - HB ase  to   m ak i n s ta n t   p r ed ict io n s   o n   A lip a y   tr an s ac tio n s .   D esp ite  d ela y ed   lab els,  T itA n m ee ts   s tr ict  late n c y   d em a n d s   b y   in te g r ati n g   d i s tr i b u ted   alg o r ith m s   a n d   u s er   n o d em b ed d in g s ,   s h o w ca s in g   ef f ec tiv e,   r ea l - ti m f r au d   d etec tio n   i n   f in a n cial  tr a n s ac tio n s .   Z h o u   et  a l.   [ 1 6 ]   in tr o d u ce d   a n   in telli g e n t,  d is tr ib u ted   ap p r o ac h   f o r   d etec tin g   f i n an cia f r au d   u s in g   No d e2 Vec ,   g r ap h   e m b ed d in g   a lg o r it h m   th at  lear n s   n et w o r k   to p o lo g ie s   an d   r ep r ese n ts   t h e m   as  lo w - d i m en s io n al  v ec to r s .   T h is   ap p r o ac h   en h an ce s   clas s i f icatio n   an d   p r ed ictio n   u s in g   d ee p   n eu r al  n et w o r k s   an d   u tili ze s   A p ac h Sp ar k   Gr ap h an d   Had o o p   clu s ter s   f o r   p ar allel  d ata  p r o ce s s in g .   T h w o r k f lo w   i n cl u d es  f o u m ai n   m o d u les:   d ata  p r ep r o ce s s in g ,   f ea tu r e x tr ac tio n ,   g r ap h   e m b ed d in g ,   a n d   p r ed ictio n .   No d e2 Vec   o n   Sp ar k   Gr ap h ef f icie n tl y   ca p t u r es  v er tex   f ea t u r es,  i m p r o v i n g   d ee p   n eu r al  n et w o r k   cla s s i f icatio n   an d   b o o s tin g   f r au d   d etec tio n   ac cu r ac y .   Hab ee b   et  a l.   [ 1 7 ]   d ev elo p ed   r ea l - ti m an o m a l y   d etec tio n   f r a m e w o r k   u s in g   co m p o s ite  s tr ea m i n g   clu s ter i n g   ap p r o ac h   w i th   b ig   d ata  to o ls   lik Sp ar k   ML lib ,   Kaf k a,   an d   HB ase.   T h ey   i n tr o d u ce d   SS W L OF C C ,   n o v el  al g o r it h m   in   Sp ar k   ML lib ,   ac h iev in g   9 6 . 5 1 ac cu r ac y ,   1 3 . 3 3 3 s   ex ec u tio n   ti m e,   an d   1 9 4 . 3 3   MB  m e m o r y   u s a g e,   o u tp er f o r m in g   K - m ea n s   a n d   HDB S C A N.   T ested   o n   D A R P A,   MA C C DC ,   a n d   DE FC ON2 1 d ataset s ,   th f r a m e w o r k   i m p r o v e s   r ea l - ti m an o m al y   d etec tio n   b y   o p ti m izi n g   co m p u tatio n al  co s t,  ac cu r ac y ,   an d   d ata  v i s u a lizatio n .   Sah ee d   et  a l.   [ 1 8 ]   in tr o d u ce d   ML   m o d els  f o r   p r ed ictin g   cr ed it  ca r d   f r au d ,   f o c u s i n g   o n   n e w   d etec tio n   m o d el  th a u ti lizes  P C A   f o r   f ea t u r s elec tio n   a n d   v ar io u s   s u p er v i s ed   ML   tec h n iq u es  ( K - n ea r est   n eig h b o r   ( KNN ) ,   r id g class if ier ,   g r ad ien b o o s tin g ,   q u ad r atic  d is cr i m in a n an al y s is ,   A d aB o o s t,  an d   RF )   f o r   class i f icatio n .   T h m o d el  is   te s ted   o n   Ger m a n   a n d   T aiw a n   c r ed it  ca r d   d atasets   to   d is tin g u i s h   f r au d u len f r o m   leg iti m ate  tr a n s ac tio n s .   T aw d et  a l.   [ 1 9 ]   p r o p o s ed   n o v el  ap p r o ac h   to   d etec tin g   o n li n p a y m e n f r au d   u s in g   b ig   d ata   tech n iq u es,  p ar tic u lar l y   le v er ag in g   P y Sp ar k .   Af ter   d ata  p r ep r o ce s s in g ,   ML   al g o r ith m s   l ik RF DT ,   Naiv e   B ay e s ,   an d   LR   f r o m   Sp ar k   ML   ar ap p lied ,   en ab lin g   s c alab le,   d is tr ib u ted   class if icati o n .   T h s y s te m   is   d esig n ed   to   h elp   lar g o r g an izatio n s   an al y ze   ex ten s i v tr an s ac tio n   d ata  to   id en tify   p o ten tial  f r au d   o r   an o m alie s   ef f ec ti v el y .       6.   RE SU L T S AN D I SCU SS I O N   T h is   an al y s i s   e x a m in e s   f r au d   d etec tio n   m e th o d s   f r o m   s elec t ed   s tu d ies  ( T ab le  1 ) ,   ex p lo r in g   tr en d s   i n   au th o r s ,   p u b licatio n   y ea r s ,   lea r n in g   t y p es,  al g o r ith m s ,   to o ls ,   an d   tar g eted   d o m ai n s .   I a ls o   r ev ie w s   d etec tio n   tech n iq u es  a n d   alg o r ith m s ,   r ec o m m e n d in g   p r o p o s ed   ar ch itect u r f o r   o r g an izatio n s   6 . 2   to o ls   an d   tech n o lo g ies.   B ig   d ata  p latf o r m s   li k Sp ar k ,   Had o o p ,   H B ase,   an d   Sto r m   ar w id el y   u s ed   f o r   ef f ic ien lar g e - Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci Vo l.  3 9 ,   No .   2 ,   A u g u s 20 25 :   1 2 2 1 - 1 235   1228   s ca le  d ata  p r o ce s s in g .   Kaf k an d   f lu m co m p le m e n th ese  b y   m an a g i n g   r ea l - ti m d ata  s tr ea m s ,   cr u cial  f o r   f r au d   d etec tio n   i n   d y n a m ic  en v ir o n m e n t s .   Sp ar k   s tan d s   o u f o r   its   v er s at ilit y   i n   b o th   b atch   a n d   s tr ea m   p r o ce s s in g .       T ab le  1 .   C o m p ar ativ a n al y s i s   o f   th ex a m i n ed   b ig   d at f r a u d   d etec tio n   s y s te m s   A u t h o r   y e a r   L e a r n i n g   t y p e s   A l g o r i t h m   T o o l s   D o mai n   B a l d o mi n o e t   a l [ 4 ]   2 0 1 4   S u p e r v i se d ,   u n s u p e r v i se d   D T ,   n e u r a l - n e t w o r k ,   K - me a n s,  R F ,   M a r k o v - c h a i n s   H a d o o p ,   H B a se   M a h o u t   A d v e r t i se me n t s t o   w e b   v i si t o r s,  so c i a l   g a me s   D i   M a u r o   a n d   D i   S a r n o   [ 5 ]   2 0 1 4   S u p e r v i se d   V e r t i c a l   h o e f f d i n g   t r e e   S t o r m,  S A M O A   H i d d e n   S k y p e   t r a f f i c   Z h a o   e t   a l .   [ 6 ]   2 0 1 5   S u p e r v i se d   N a ï v e - B a y e si a n ,   S V M ,   D T   S t o r m,  K a f k a   H a d o o p   N e t w o r k   t r a f f i c ,   a n o mal y   d e t e c t i o n   D a i   e t   a l .   [ 7 ]   2 0 1 6   S u p e r v i se d ,   u n s u p e r v i se d   D B S C A N ,   H M M ,   S O M ,   n e u r a l   n e t w o r k ,   L R ,   D T ,   N a i v e   B a y e s   S t o r m,  H B a se ,   S p a r k ,   H a d o o p   C r e d i t   c a r d   f r a u d   d e t e c t i o n   S t o j a n o v i c   e t   a l .   [ 8 ]   2 0 1 6   R u l e s   R u l e s   S t o r m,  H a d o o ,   S p a r k ,   H B a se   Q u a l i t y   c o n t r o l   a n o mal y   d e t e c t i o n   C u i   a n d   H e   [ 9 ]   2 0 1 6   S u p e r v i se d   N a ï v e - B a y e s,  D T ,   S V M   H a d o o p   A n o mal y   d e t e c t i o n   B a l a s u p r a ma n i a n ,   e t   a l .   [ 1 0 ]   2 0 1 7   U n su p e r v i se d   S O M   S p a r k ,   H a d o o p   O n l i n e   t r a n s a c t i o n   f r a u d   d e t e c t i o n   M e l o - A c o st a     e t   a l .   [ 1 1 ]   2 0 1 7   S u p e r v i se d   S e mi - su p e r v i se d   R F   a n d   c o - t r a i n e d   B R F   S p a r k ,   H i v e   C r e d i t   c a r d   f r a u d   d e t e c t i o n   O t h m a n   et   a l .   [ 1 2 ]   2 0 1 8   S u p e r v i se d   C h i - S V M   S p a r k   I n t r u si o n   d e t e c t i o n   C a r c i l l o   e t   a l .   [ 1 3 ]   2 0 1 8   S u p e r v i se d   RF   S p a r k ,   K a f k a ,   C a ssa n d r a   C r e d i t   c a r d   f r a u d   d e t e c t i o n   N a i r   e t   a l .   [ 1 4 ]   2 0 1 8   S u p e r v i se d   DT   S p a r k   H e a l t h   st a t u p r e d i c t i o n   Cao   e t   a l .   [ 1 5 ]   2 0 1 9   S u p e r v i se d ,   r u l e s,  U n su p e r v i se d   D W ,   S 2 V ,   N R L ,   L R ,   G B D T ,   r u l e - b a se d ,   i so l a t i o n - f o r e st   A l i - H B a se ,   K u n P e n g   M a p R e d u c e   F i n a n c i a l   t r a n sac t i o n   f r a u d   Z h o u   e t   a l .   [ 1 6 ]   2 0 2 1   S u p e r v i se d   N o d e 2 V e c ,   d e e p w a l k ,   S V M   S p a r k   H a d o o p   I n t e r n e t   f i n a n c i a l   f r a u d   d e t e c t i o n   H a b e e b   e t   a l .   [ 1 7 ]   2 0 2 2   U n su p e r v i se d   S S W L O F C C ,   I F ,   L O F ,   K - me a n s,  H D B S C A N ,   a g g l o m e r a t i v e   c l u st e r i n g   F l u me ,   K a f k a ,   S p a r k ,   H B a se   I n t r u si o n   d e t e c t i o n ,   h a c k i n g   d e t e c t i o n ,   n e t w o r k   f r a u d   d e t e c t i o n   S a h e e d   e t   a l .   [ 1 8 ]   2 0 2 2   S u p e r v i se d   K N N ,   P C A ,   R F   N / M   C r e d i t   c a r d   f r a u d   d e t e c t i o n   T a w d e   e t   a l .   [ 1 9 ]   2 0 2 4   S u p e r v i se d   R F ,   D T ,   N B ,   L R   S p a r k   O n l i n e   p a y me n t       6 . 1 .     L ea rning   t y pes   a nd   a lg o rit h m   us a g e   As  s h o w n   i n   T ab le  1 ,   m u lt ip le  lear n in g   ap p r o ac h es  ar e   ap p lied   in   f r au d   d etec tio n ,   in cl u d in g   s u p er v i s ed ,   u n s u p er v is ed ,   a n d   r u le - b ased   lear n in g .   S u p er v i s ed   lear n in g   d o m i n ates  t h f iel d ,   w it h   alg o r it h m s   s u c h   as  DT s ,   SVM,   RF s ,   C NN,   an d   lo n g   s h o r t - ter m   m e m o r y   ( L ST M )   w id el y   u s ed .   Yu s s i f f   et  a l.   [ 58 p r o p o s ed   an   in telli g e n ap p r o ac h   f o r   d etec tin g   o n li n cr ed it  ca r d   f r au d   u s i n g   t h e x tr e m g r ad ien b o o s tin g   ( XGB o o s t )   alg o r ith m .   T h ese   tech n iq u es  ar f av o r ed   d u e   to   th eir   p r ed ictiv ca p ab ilit ies,  w h ic h   aid   in   id en ti f y i n g   f r a u d u le n t p atter n s   in   lar g d ataset s .   Un s u p er v i s ed   lear n i n g   i s   also   p r o m i n en t,  w ith   cl u s ter in g   al g o r ith m s   li k K - m ea n s ,   HDB S C A N,   an d   SOM  e m p lo y ed   f o r   d etec tin g   o u tlier s   an d   u n k n o w n   f r au d   p atter n s .   Mo r eo v er ,   r u le - b ased   m et h o d s   ar u tili ze d   in   s p ec i f ic  ca s e s   w h er p r ed ef i n ed   f r au d   cr iter ia  ar ess e n t ial  f o r   an o m a l y   d etec tio n .   T h an al y s is   o f   f r a u d   d etec tio n   alg o r it h m s   s h o w s   th at  c lu s ter in g   m et h o d s ,   p ar ticu lar l y   K - m ea n s ,   ar h ig h l y   f a v o r ed   f o r   u n s u p er v is ed   lear n in g   s ce n ar i o s ,   w h ile  DT an d   SVM  ar e   d o m i n a n i n   s u p er v i s ed   lear n in g   co n tex ts .   T h is   p r ef er en ce   s u g g est s   th at  cl u s t er in g   is   i n s tr u m en tal  in   d is co v er in g   h id d en   p atter n s   in   u n l ab eled   d ata,   w h i le   class i f icatio n   alg o r ith m s   e n h a n ce   p r ed ictio n   ac cu r ac y   an d   h elp   id en tify   f r a u d u le n in s ta n ce s   w it h in   lab eled   d atasets .     6 . 2 .     Su it a ble  f ra ud   det ec t io n   m et ho d s   a cr o s s   v a rio us   do m a i ns   C r ed it  ca r d   f r a u d   d etec tio n s ev er al  s t u d ies,   in c lu d i n g   t h o s b y   Dai   et  a l.   [ 7 ] ,   C ar cillo   e a l.   [ 1 3 ] ,   u tili ze   s u p er v is ed   tech n iq u es ,   o f ten   u s i n g   alg o r it h m s   li k e   RF s DT s ,   Nai v B a y es ,   a n d   ar tif icia n e u r al   n et w o r k   ( A NN ) ,   co m b i n ed   w ith   to o ls   s u ch   a s   Sp ar k ,   HB as e,   an d   Kaf k f o r   r ea l - ti m p r o ce s s in g .   Fi n an c ial   tr an s ac tio n   f r au d Z h o u   et   a l.   [ 1 6 ]   ap p lied   tech n iq u es  s u c h   as   No d e2 Vec   an d   SVM   f o r   d etec tin g   in ter n et   f i n an cia f r a u d ,   u ti lizin g   Sp ar k   an d   Had o o p   f o r   d ata  h a n d lin g .   A cc o r d in g   to   Yu s s i f f   et  a l .   [ 58 ] RF   w as  f o u n d   to   b th m o s e f f ec ti v m ac h in e - lear n i n g   al g o r it h m   f o r   f r au d   d etec tio n   o n   f i n an c ial  e - p latf o r m s .   I r a n k ed   f ir s t i n   b o th   f r eq u en c y   o f   u s a g an d   p er f o r m a n ce   a n al y s is ,   a ch iev in g   an   a v er ag ac c u r ac y   o f   9 6 . 6 7 %.   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:   2502 - 4752         A n   o p timiz ed   a r ch itectu r fo r   r ea l - time  fr a u d   d etec tio n   in   b ig   d a ta   …  ( Ga b er E .   A b u ta leb )   1229   I n tr u s io n   a n d   n et w o r k   f r a u d   d etec tio n al g o r ith m s   l ik is o latio n   f o r est ,   L OF,  a n d   HDB SC A ar e   u tili ze d   f o r   d etec tin g   an o m ali es  in   n et w o r k   d ata.   Hab ee b   e a l.   [ 1 7 ]   em p lo y ed   Sp ar k ,   HB ase,   an d   Kaf k i n   in tr u s io n   d etec tio n   to   m o n ito r   f o r   h ac k i n g   ac ti v itie s   an d   f r au d   w i th i n   n et w o r k s .   Hea lth   an d   qu alit y   co n tr o l:  in   h ea lt h   p r ed ictio n   an d   q u alit y   co n tr o an o m al y   d etec tio n ,   s t u d ies  lik th o s o f   Nair   et  a l.   [ 1 4 ]   an d   Sto j an o v ic  et  a l.   [ 8 ]   u s DT s   an d   r u le - b ased   s y s te m s   to   d etec an o m ali es  in   h ea l th   s ta tu s es  an d   en s u r d ata  in teg r it y   i n   q u alit y   co n tr o l p r o ce s s es.     6 . 3 .     T he   pro po s ed  a rc hite ct ure   T h is   r esear ch   p r o v id es  a   v is i o n   f o r   o r g an izatio n s   to   b u ild   s tr o n g   ar ch itect u r to   co m b at  f r au d   in   r ea ti m e.   F ig u r 2   ill u s tr ate s   th p r o p o s ed   ar ch itectu r t h at   in te g r ates  r u le  e n f o r ce m en t,  A I   m o d els,  an d   b i g   d ata  tech n o lo g ies  ac r o s s   m u lt ip le  la y er s T h s to r ag la y er   is   u s ed   to   s to r d ata.   I is   r ec o m m e n d ed   to   u s e   HB ase,   Had o o p   HDFS,  o r   C ass a n d r [ 59 ] ,   p r o v id in g   s c alab le,   d is tr ib u ted   s to r ag s o l u tio n   t h at  s u p p o r ts   b o th   r ea l - ti m d ata  ac ce s s   a n d   b atch   p r o ce s s in g   r eq u ir e m e n t s   f o r   f r au d   d etec tio n .   T h tr ain in g   la y er   p r o ce s s es  h is to r ical  d ata  an d   i m p r o v es  th A I   m o d el.   Sp ar k ,   f lu m [5 2 ] ,   an d   Had o o p s   p r o ce s s in g   ca p ab ilit ies  ca n   b co m b in ed   w it h   Ma h o u t’ s   ML   alg o r it h m s   [6 0 ] ,   w h i le  Hiv p r o v id es  p o w e r f u d ata  w ar e h o u s in g   f u n ctio n   f o r   co m p r e h en s i v a n a l y s i s   o f   p ast  f r a u d   p atter n s   [6 1 ] .   T h in te g r atio n   la y er   s er v es  as  t h p r im ar y   d at in g es tio n   p o in t ,   u tili z in g   p o w er f u m es s ag i n g   s y s te m s   li k e   Kaf k a,   R ed is   [6 2 ] R ab b itMQ  [6 3 ] ,   an d   A ctiv eM [6 4 ]   to   h an d le  d ata  f r o m   ex t er n al  s o u r ce s .   T h r ea l - ti m f r a u d   d etec tio n   la y er   s er v e s   as  th co r an a l y t ics  co m p o n e n t,  le v er ag i n g   tec h n o lo g ies   lik Ka f k s tr ea m s ,   Sp ar k   s t r ea m in g ,   o r   Sto r m   to   p r o ce s s   liv d ata  s tr ea m s .   I in teg r ates  co m p lex   f r au d   d etec tio n   r u les  alo n g s id ML   m o d el s   to   id en ti f y   ad v a n c ed   f r au d   p atter n s .   A d d itio n al l y ,   d ata  en r ich m e n t   en h a n ce s   d etec tio n   ac cu r ac y   b y   i n co r p o r atin g   co n tex tu al  i n s i g h ts   f r o m   i n ter n a an d   ex t er n al  s o u r ce s .   Ke y   tech n iq u es  i n cl u d I P - b ased   g eo lo ca tio n ,   VP d etec tio n ,   d ev ice  f i n g er p r in tin g ,   tr a n s ac tio n   an al y s i s ,   b eh av io r al  b io m e tr ics,  B I n u m b er s ,   an d   e m ail  v er i f icatio n ,   p r o v id in g   co m p r eh e n s i v e   ap p r o ac h   to   f r au d   p r ev en tio n .   T h u s er   i n ter f ac e   la y er   d eliv er s   a n   in t u iti v e x p er ie n ce   t h r o u g h   d ata   v i s u a lizat io n   to o ls ,   ac co m p a n ied   b y   a   r u le s   m an a g e m e n in ter f ac a n d   an   aler m an a g e m e n s y s te m   th a p r o m p tl y   n o ti f ie s   u s er s   o f   p o ten tial   f r a u d   ac ti v itie s ,   e n ab lin g   q u ick   r esp o n s e   to   s u s p icio u s   p atter n s .   T h p r o p o s ed   a rc h it e c tu re   d eliv er s   b alan ce d   ap p r o ac h   to   f r au d   d etec tio n ,   co m b i n in g   r ea l - ti m p r o ce s s in g   w it h   h i s to r ical   an al y s is   to   cr ea te  a   r o b u s t d ef en s ag ai n s t f r a u d u l en t a cti v ities .           Fig u r 2 .   T h p r o p o s ed   r ea l - tim f r a u d   d etec tio n   ar ch itect u r e           Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci Vo l.  3 9 ,   No .   2 ,   A u g u s 20 25 :   1 2 2 1 - 1 235   1230   6. 4 .     Co m pa ra t iv a na ly s is   w it h r ela t ed  w o rk s   T h is   s tu d y   p r ese n ts   n o v el  o p ti m ized   f r a u d   d etec tio n   ar ch i tectu r th at  ad d r ess e s   s e v er al  li m ita tio n s   id en ti f ied   in   e x is ti n g   w o r k s .   U n li k p r ev io u s   s t u d ies  t h at  r el y   s o lel y   o n   Had o o p   f o r   b atch   p r o ce s s in g   a n d   lack   r ea l - ti m s tr ea m   p r o ce s s in g   ca p ab ilit ies  ( e . g . ,   B ald o m i n o s   et  al.   [ 4 ] ,   Di  Ma u r o   an d   Di  Sar n o   [ 5 ] ) ,   th e   ar ch itect u r in te g r ates  Sp ar k ,   Had o o p ,   an d   Sto r m ,   en ab li n g   e f f icie n r ea l - ti m d etec ti o n   alo n g s id b atch   p r o ce s s in g .   A d d itio n all y ,   a s   s u m m ar ized   i n   T ab le  2 ,   s o m f r a m e w o r k s   ( e. g . ,   Z h ao   et  a l.   [ 6 ] ,   C u an d   He  [ 9 ] lack   s u p er v is ed   M L   s u p p o r t,  d ata  en r ich m e n t,  an d   v is u aliz atio n   to o ls .   T h s tu d y   ap p r o a ch   o v er co m es  t h ese   g ap s   b y   i n co r p o r atin g   s u p er v i s ed   lear n in g ,   I P   g eo lo ca tio n   en r ich m e n t,  an d   v i s u aliza tio n   f ea tu r es,  en h a n cin g   in ter p r etab ilit y   a n d   d ec is io n - m ak in g .       T ab le  2 .   C o m p ar is o n   o f   li m ita tio n s   i n   r elate d   w o r k s   an d   ad v an tag e s   o f   t h p r o p o s ed   ar ch itectu r e   R e f e r e n c e   L i mi t a t i o n s i n   e x i st i n g   w o r k s   I mp r o v e me n t s i n   t h e   p r o p o se d   a r c h i t e c t u r e   B a l d o mi n o e t   a l .   [ 4 ]   I n   t h i s   r e se a r c h ,   t h e   a u t h o r i m p l e me n t   a n d   e v a l u a t e   b a t c h   M L   a l g o r i t h ms t h a t   r u n   o n l y   o n   H a d o o p   a n d   l a c k   r e a l - t i me   s t r e a p r o c e ssi n g   c a p a b i l i t y .   T h e   p r o p o se d   a r c h i t e c t u r e   u t i l i z e s Sp a r k   a n d   S t o r m t e c h n o l o g i e s fo r   e n h a n c e d   sc a l a b i l i t y   a n d   s t r e a m p r o c e ssi n g   e f f i c i e n c y .   D i   M a u r o   a n d   D i   S a r n o   [ 5 ]   I n   t h i s   r e se a r c h ,   t h e   a u t h o r i m p l e me n t   a n d   e v a l u a t e   b a t c h   u n su p e r v i se d   M L   a l g o r i t h ms  t h a t   o p e r a t e   so l e l y   o n   H a d o o p   a n d   d o   n o t   p o sse ss re a l - t i me   st r e a m p r o c e ssi n g   c a p a b i l i t i e s.   T h e   p r o p o se d   a r c h i t e c t u r e   u t i l i z e s Sp a r k   a n d   H a d o o p   t o   e n a b l e   e f f i c i e n t   b a t c h   t r a i n i n g   u si n g   u n s u p e r v i se d   M L   a l g o r i t h ms.   Z h a o   e t   a l .   [ 6 ]   I n   t h i s   r e se a r c h   w o r k ,   t h e   a u t h o r s re l y   so l e l y   o n   H a d o o p   f o r   b a t c h   t r a i n i n g .   U n s u p e r v i se d   M L ,   d a t a   e n r i c h me n t   ( s u c h   a s I P   g e o l o c a t i o n ) ,   a n d   v i su a l i z a t i o n   t o o l s a r e   u n a v a i l a b l e .   T h e   p r o p o se d   a r c h i t e c t u r e   u t i l i z e s Sp a r k   a n d   H a d o o p   f o r   b a t c h   t r a i n i n g   w i t h   u n s u p e r v i se d   M L   a l g o r i t h ms  a n d   i n t e g r a t e s I P   g e o l o c a t i o n   e n r i c h me n t   a l o n g   w i t h   v i su a l i z a t i o n   t o o l s.   C u i   e t   a l .   [ 9 ]   T h e i r   so l u t i o n   w o r k s o n   o n e   d a t a se t   v i a   H a d o o p   b a t c h   t r a i n i n g   o n l y .   N e e d s a c c u r a c y   i mp r o v e me n t   a n d   l a c k s re a l - t i me   p r o c e ssi n g .   T h e   p r o p o se d   a r c h i t e c t u r e   u t i l i z e s Sp a r k   a n d   H a d o o p   f o r   b a t c h   t r a i n i n g   w h i l e   e n su r i n g   a c c u r a c y   mee t s re q u i r e me n t s   a n d   p r o v i d i n g   f u l l   r e a l - t i me   p r o c e ssi n g   su p p o r t .   D a i   et   a l .   [ 7 ]   T h e   f r a mew o r k   n e e d s i n t e g r a t i o n   w i t h   mu l t i p l e   d e t e c t i o n   a l g o r i t h ms.   T h e   p r o p o se d   a r c h i t e c t u r e   i a l r e a d y   w e l l - i n t e g r a t e d   w i t h   mu l t i p l e   d e t e c t i o n   a l g o r i t h ms.   S t o j a n o v i c   e t   a l .   [ 8 ]   L e a r n i n g   t y p e s a n d   M L   a l g o r i t h ms w e r e   u n s p e c i f i e d .   T h e   p r o p o s e d   a r c h i t e c t u r e   su p p o r t s   t h e   d i f f e r e n t   l e a r n i n g   t y p e s a n d   r u l e s.   B a l a s u p r a ma n i a n     e t   a l .   [ 1 0 ]   N o   su p e r v i s e d   M L   w a s u se d .   T h e   so l u t i o n   o f f e r s n e a r   r e a l - t i me   d e t e c t i o n   o n l y   a n d   l a c k r e a l - t i me   p r o c e ssi n g   t o o l s.   T h e   p r o p o se d   a r c h i t e c t u r e   su p p o r t s   su p e r v i se d   M L   a l g o r i t h ms a n d   e n a b l e s re a l - t i me   d e t e c t i o n   a n d   p r o c e ssi n g .   M e l o - A c o st a   e t   a l .   [ 1 1 ]   F r a mew o r k   l a c k s re a l - t i me   p r o c e ssi n g ;   S p a r k   o n l y   h a n d l e s b a t c h   t r a i n i n g .   T h e   p r o p o se d   a r c h i t e c t u r e   e n a b l e s re a l - t i me   p r o c e ssi n g   w i t h   S p a r k   a n d   H a d o o p   f o r   b a t c h   t r a i n i n g .   C a r c i l l o   e t   a l .   [ 1 3 ]   T h e   f r a mew o r k   h a n d l e s t r a n sac t i o n n e a r   r e a l - t i me   o n l y   a n d   l a c k s ru l e - b a se d   su p p o r t .   T h e   p r o p o se d   a r c h i t e c t u r e   p r o c e sse t r a n s a c t i o n s i n   r e a l - t i me ;   r u l e - b a se d   s u p p o r t .   O t h m a n   e t   a l .   [ 1 2 ]   T h e   mo d e l   l a c k s sc a l a b i l i t y   a n d   u se s a   si n g l e - p r e d i c t i o n   mo d e l .   T h e   p r o p o se d   a r c h i t e c t u r e   u se s St o r m   f o r   sca l a b l e   r e a l - t i me   p r o c e ssi n g   a n d   mu l t i p l e   p r e d i c t i o n   mo d e l s.   N a i r   e t   a l .   [ 1 4 ]   T h e   s y st e m u se s so l e l y   D T   M L   w i t h   n o   p r e se t   r u l e s.   T h e   p r o p o se d   a r c h i t e c t u r e   c o mb i n e M L   a l g o r i t h ms w i t h   p r e se t   r u l e s.   Cao   e t   a l .   [ 1 5 ]   S y st e m mi ssi n g   r u l e   e n g i n e ,   d a t a   e n r i c h me n t   ( I P / e mai l / c a r d ) ,   a n d   m a n u a l   a l e r t   v e r i f i c a t i o n   c a p a b i l i t i e s.   T h e   p r o p o se d   a r c h i t e c t u r e   su p p o r t s   a   r u l e   b u i l d e r   e n g i n e ,   d a t a   e n r i c h me n t   ( I P / e mai l / c a r d ) ,   a n d   m a n u a l   a l e r t   v e r i f i c a t i o n   c a p a b i l i t i e s.   Z h o u   e t   a l .   [ 1 6 ]   T h e   me t h o d o l o g y   l a c k s re a l - t i me   p r o c e ssi n g ,   a l t e r n a t i v e   so l u t i o n   i n t e g r a t i o n ,   a n d   m a n u a l   v e r i f i c a t i o n   f o r   su s p i c i o u a l e r t s.   T h e   p r o p o se d   a r c h i t e c t u r e   e n a b l e s re a l - t i me   p r o c e ssi n g ,   i n t e g r a t e s w i t h   a n y   so l u t i o n ,   a n d   i n c l u d e s m a n u a l   v e r i f i c a t i o n .   H a b e e b   e t   a l .   [ 1 7 ]   F r a mew o r k   l a c k s s u p e r v i se d   M L ,   r e a l - t i me   p r o c e ssi n g ,   r u l e   b u i l d i n g ,   d a t a   e n r i c h me n t ,   a n d   m a n u a l   v e r i f i c a t i o n ,   o f f e r i n g   o n l y   n e a r   r e a l - t i me   d e t e c t i o n .   T h e   p r o p o se d   a r c h i t e c t u r e   su p p o r t s   su p e r v i se d   M L ,   r e a l - t i me   p r o c e ssi n g ,   r u l e   b u i l d i n g ,   d a t a   e n r i c h me n t ,   ma n u a l   v e r i f i c a t i o n ,   a n d   r e a l - t i me   d e t e c t i o n .   S a h e e d   e t   a l .   [ 1 8 ]   N o   b i g   d a t a   t e c h   w a s sp e c i f i e d .   L a c k s   r e a l - t i me   p r o c e ssi n g ,   i n t e g r a t i o n   o p t i o n s,  a n d   man u a l   v e r i f i c a t i o n   f o r   su sp i c i o u t r a n s a c t i o n s.   T h e   p r o p o se d   a r c h i t e c t u r e   u t i l i z e s b i g   d a t a   t e c h n o l o g i e s t o   p r o v i d e   r e a l - t i me   p r o c e ssi n g ,   se a ml e ss i n t e g r a t i o n   c a p a b i l i t i e s,  a n d   man u a l   v e r i f i c a t i o n   f o r   su s p i c i o u t r a n sac t i o n s.   T a w d e   e t   a l .   [ 1 9 ]   T h e   me t h o d   l a c k s re a l - t i me   p r o c e ssi n g ,   i n t e g r a t i o n   o p t i o n s ,   a n d   ma n u a l   v e r i f i c a t i o n   f o r   su sp i c i o u t r a n sac t i o n s.   T h e   p r o p o se d   a r c h i t e c t u r e   o f f e r s r e a l - t i me   p r o c e ssi n g ,   i n t e g r a t e s w i t h   a l t e r n a t i v e s,  a n d   i n c l u d e s m a n u a l   v e r i f i c a t i o n   f o r   s u sp i c i o u s   t r a n s a c t i o n s.       Evaluation Warning : The document was created with Spire.PDF for Python.