Indonesi an  Journa of El ect ri cal Engineer ing  an d  Comp ut er  Scie nce   Vo l.   13 ,  No.   3 Ma rc h   201 9 , p p.   919 ~ 926   IS S N: 25 02 - 4752, DO I: 10 .11 591/ijeecs .v1 3 .i 3 .pp 919 - 926          919       Journ al h om e page http: // ia es core.c om/j ourn als/i ndex. ph p/ij eecs   Anomal y - bas ed i ntrusion  detecto r system  u sing restric ted  growin g self o rgan izing m ap       Tomi Y ahy a Christ yaw an,  Ah m ad   A fif  S upianto , Wa yan  Fir daus  M ah mu dy   Facul t y   of  Com pute Sc ie nc e, Br awij a y a   Univ ersi t y ,   Ma la ng ,   Indo nesia       Art ic le  In f o     ABSTR A CT   Art ic le   hist or y:   Re cei ved   J ul  06, 2 018   Re vised  N ov   1 1,   2018   Accepte Dec   8,   2018       The   rap id  dev elopm ent   of  int ern et   and  net wor te chnol og y   fo ll owed  b y   m al ic ious  thr ea t and  at t ac ks  on  net works   and  co m pute rs.  Intrusi on  det e ct io n   s y stem  (IDS was  deve lope d   to  s olv th at   prob lem s.  The   dev el op m ent   of  IDS   using  m ac hine   l ea rning  is  nee d e for   cl assif y ing   the   a tt a cks.   On m et hod  of   the   c la ss ifi c at i o is  Self - Organ iz ing  Map  (SO M).  SO abl to  per form   cl assifi ca t ion  an visual i zation  i le a rning  pro ces to  gai n ew  knowle dge .   How eve r,   the   SO has   le ss   eff ic ie n in  le arn ing  proc ess  when  appl ie in  Big   Data .   Thi stud y   proposes  Restri ct ed  Grow ing  SO m et hod  with  cl usteri n g   ref ere n ce   ve ct or   (RGS O M - CRV and  Para ll e RGS OM - C RV  t improve  SO eff ic ie n c in  c la ss ifica t io with  a c cur acy  conside r at ion   t solve  Big   Data   proble m .   G rowing  proc ess  in  RGS O is  res tri cted  b y   m axim um  nodes   and  growing  th reshold,   the   r eu pdat w ei ght   pr oce ss   will   upd a te   unused   ref ere n ce   ve ct or  when  m ap  size   al rea d y   m axi m um ,   the se  two  proc esses  solve  the   cons um ing  ti m of  reg ular   GS O M.  From   the   result of  t his  rese arc h   aga inst  KD Cup  1999  dat ase t ,   proposed  m ethod  Para llel  R GS OM - CR V   abl to  give  91. 86%  ac cur acy ,   20. 58%  fal s alarm   rat e ,   95. 32 rec a ll   o r   det e ct ion   rate,  a nd  pre c ision  is  94. 35%  and   ti m consum in is  outpe rform   tha r egul ar   Gr owing  SO M.  T his  proposed  m et hod  is  v er y   p rom ising  to  handl e   big   data problems   compare with   oth er  m et hods.   Ke yw or ds:   Bi data   Cl us te rin re fe ren ce  v ect or   Grow i ng s om   In tr us i on D et e ct or   Syst e m   Self - orga nizin m ap   Copyrig ht  ©   201 9   Instit ut o f Ad vanc ed   Engi n ee r ing  and  S cienc e .     Al l   rights re serv ed.   Corres pond in Aut h or :   Tom i Yah ya  Chr ist ya wa n ,   Faculty  of Com pu te Scie nc e,   Brawijaya  U niv ersit y,   Vetera street ,   Ma la ng ,  Indo ne sia .   Em a il to m i@rek avisit am a.n et       1.   INTROD U CTION   The  sec ur it threat  to  i nter ne us age  a nd  c om pu te net w orks  is  inc reas ing Seve ral  ty pes  of  new   at ta cks  on   t he  netw ork  ap pea pe rio dical ly this  m ake  chalang to  deve lop   fle xib le   a nd   a da ptive  ne twork   secur it y.  De vel op i ng   te ch ni ques  to  detect   ano m aly - b ased  ne twork  intr us i on  to  protect   com pu te syst em   and   netw ork  from   m al ic iou act ivit at ta cks  cal In tr us i on  Dete ct ion   Syst em   (I DS),   as  the   de te ct ion   of  s usp ic iou s   netw ork  tra ff ic  and c om pu te r usa ge   ca n no t   be done  by c onven ti onal   fire w al ls.   So m dev el op m ent  of  I DS   ba sed  on  m achine  le ar ning  te c hn i qu e T he  m et hods   us e for  a no m al y - base intr us i on  detect ion  are   com m on ly   dif fer e ntiat ed  int cl assifi cat io a nd  cl us te rin g.   H ow e ve r,   t her e   is  al so   hy br i dizat ion   betwee cl us te rin a nd   cl assifi cat ion   f or   i ntr us i on  de te ct ion   syst em .   In   t he  cl assifi cat ion  m et ho d,  so m stud ie us si ngle   cl assifi er  s uch  as  KNN  [ 1] S upport  Ve ct or   Ma c hin ( SV M)  [ 2] arti fici al  neural  net wor [3 - 6]   to  s olv ID S   pro blem Othe resea rc he rs  us hybr i m et ho ds   of  he ur ist ic   al gorith m   with   cl ass ifie m e tho [7 - 9] Mult i - le vel  SV a nd  Ext rem Lea rn i ng   Ma c hin e   with  K - Me an  [10] Decisi on  Tree   and   S VM  [ 11 ] Tree  A ugm e nted  Naï ve  Ba ye (TAN)   an Re duced  E rror   P runin (R EP)  [ 12] IDS - relat e stud ie us i ng c lusterin in cl ude  K - Me a n,   K - Me do i ds , A - S PO [ 13 ] , C A NN  [ 14 ]   On m et ho of  cl assifi cat ion  and   re duct io d at that  can  visu al iz the  le arn i ng   proces is  SO M.  I so m stud ie SO able  to  so lve  the  pro blem   of   cl assif ic at ion   with  bette res ult  [ 15 ] Howe ver,   SO M   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   13 , N o.   3 Ma rc h 201 9   :   919     926   920   exp e rience c on st raints  in  e ff ic ie ncy  du rin the  process  of   le ar ning  with  la rg data  ( Bi Data),  t his  have     high  ti m con s um ing T he  prob le m   is  du e   to  the   c har act er ist ic of   SO that  cal culat the  distance  bet we e input  vecto and   re fe ren ce  vecto to  deci de  the  winnin ne uro on   the  hidden  la ye fo eac epo c h.     Bi data  pr ob l e m see m   to  be  face by  L at   al [1] th ey   j us sel ect   5,552  in sta nce from   KD Cup   99  sam ple  data  as  the  trai ning  da ta an 5,552  instances  a te sti ng   data  f or  their  e xperim ent,  not  f ro m   the  entire   KDD  C up 99 d at a.   Ba sed  on   rese arch   c onduct e by  Alaha koon  [ 16] G r ow i ng  Self  Orga nizing  Ma ( GSOM)  ca be   us e to  buil d r efere nce  vecto r  g ra dual ly  b ase d on trai ning  da ta . How e ve r,  t his ab le  t s olve  the  prob l em  i the   first  ep oc on ly in  nex e poch to po l og ic al   m ap  will   be  la rg er an t he  pr ob le m   of   tim con su m will   reappear   on  ne xt  ep oc h.  Th is  stud pro poses  Re st rict ed  Gro wing  Se lf  O rg a nizin Ma with  cl ust eri ng   ref e ren ce  vector   (R GSOM - C RV)  an Pa rall el   RGS OM - C RV  to  so lve  t he   issue  on   regular  G SO to   handle   big   data  pro blem s.  This  resea rch  will   m easur RG SO M - CR an Parall el   RGSO M - C RV  ef fici ency  of   ti m e   consum ing  a nd accu racy, f al se ala rm  r at e, p r eci sion ,  and  re cal l.       2.   RESEA R CH MET HO D   This  resea rch   proce dure   sho wn   in  Fi gure  1.   Feat ures  f r om   dataset   wi ll   be  sel ect ed  accor ding  to   sel ect ed  featu r es,  an eac fe at ur value  will   be  no rm alizi ng   befor proce ss  at   RGS OM - CR V.   D at trai a nd   data te sti ng w il l be treat s am way b e f or pro cess in R GSO M - CR V.           Figure  1 .  Rese arch p ro ce dure       2.1.     K D D Cu p 99 D ataset   Dataset   KDD  Cup   99  f ro m   UCI  sepa rate  with  10%  data   trai (4 94, 02 instances and   data  te st  (4,89 8,431  i ns ta nces),  it ’s  ha ve  41  feat ur es .   This  dataset   c at egory   in  at ta cks  cl ass  dos pro be,  r 2l,  u2 an norm al   cat ego r y.  This  re searc will   us e   al da ta   prov i ded  by   this  dataset   to  m easur the eff ic ie nt  a nd   e f fecti ve   of prop os e m et hod  to  h a ndl e b ig  d at pro bl e m s.     2.2.     Sele c ted Fe ature   Data  trai w il be  pr oces ses  with  sel ect ed  featur e s Accord i ng   to  KDD  Cu 99  ta sk   (h tt p:// kdd.i cs. uci.edu/data ba ses/kddc up99/t ask.htm l)  wh ic a dap te fro m   Stolfo   et   al   pa per  [ 17] th ere  a re  three  ty pes  fe at ur sel ect io n,  basic  feat ures  of   i nd i vidual  TCP  co nnect ion,  c on te nt  featu res  within  a   connecti on  s uggested  by  dom ai knowle dge an tra ff ic   fe at ur c om pu te usi ng  tw o - seco nd   ti m window .   In  this  resea rc basic  featu re of  i nd i vidual  TCP  c onnecti on  cat eg or y   ty pe  be  c hose n.   Feat ur es   us ed   in  this   ty pe  are  durati on, pr oto c ol ty pe,   ser vice,  flag,  s rc  byte s, ds t byt es, lan d, w ron f ra gm ent, urg e nt.      2.3.     No r mali z e Feat ure   Af te r   dataset   s el ect ed  by  basi featur ty pe,   and   the this  f eat ur will   be  norm al izing   wi th  (1)  befor e   processe wit RGSO M Where  is  norm alized  value x   is   real  value ar gm in  (F i)  is  sm al le st  value  fro m   i - th   featur e s,  a r gma (F i)   is  la r ge st  value   f ro m   i - th   featu res.  A fter  norm al iz data  will   proce ss  in   RGS OM - CR V   to b e  train  and  then  te st  with  da ta  test .     n = x     arg m in ( Fi ) arg m ax   ( Fi )   arg m in ( Fi )   (1)   Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  250 2 - 4752       An omaly - base intr us io n det ect or  syste m us ing   restri ct e…  (Tom i Y ahy C hr ist yaw an )   921   2.4.     G SO M   Grow i ng   S O is  m od ifie regular   S OM  w hich  pro pos ed  by  Ala hakoon  [16] GSOM  pr ocedure   accor ding  to  A la hakoon  are  I niti al iz at ion   phase,  Gro wing  ph a se,  an Sm oo t hing  phase.   Figure  sho ne w   node  ge ner at io from   the  bo unda ry  of  t he  netw ork.  Fig ure  2a   is  init ia node  us i ng  nodes   as  ref e r ence   vecto r.   Fig ur 2b   s how  that  hi gh   er ror  occ urs  wh e winne r   node  distance  with  ref e re n ce  vecto is  m or than   grow i ng  thres ho l d.   Fig ur 2c   sh ow  the  grow i ng   s hcem a   of   GSOM.  G rowin phase  will   occu if  gro wi ng   thres ho l sm al l er th a n dist anc e of  winner  no de.           Figure  2. Ne w node  ge ner at io n from  the b ou nd a ry  of  t he ne twork       2.5     RGSOM - C RV   This  researc pro po se  RG S OM - CR V this  m et ho is  extend   f r om  reg ul ar  SO [15]   and   re gula r   GSOM  [16] T he  dif fer e nt  wi th  regular  GSOM  is  the  gro wing  of  ref e re nce  vect or   is  r est rict ed  by  m axim u m   siz of   node ( MN),   a nd   tw gr i m ap  di m e ns io ns Ma w il be  gr owin if  distance  fro m   winn in node   with  input  node  is  m or that  gr owin th reshold   (G T ).   If   th le ng t of  nodes  i m ap  m or th at   MN,  m ap  will   stop  grow i ng  a nd  r eupdate  by  sel ect ed  ra ndom l on e   re fer e nc vecto w hich  nev e h it   ( not  be   wi nn e ye t)  by   input.  Af te s el ect   winn e node sam with  re gula S O M,  weig ht  of   neig hborh ood  will   be  up date O ne  ref e ren ce   vect or   c ould  be  m or t ha one  ti m sel ect ed  to   be  winner   no de  cal le cl us t erin re fer e nce   vecto (CRV) Cl us te rin re fer e nce  vecto will   be  gro up   of  in put  with  sim il ar it weigh acc ordin to   m ini m u m   GT.   CR m eth od  will   reduc the  siz of   t opog raphical   m ap,   t his  m et ho ca de crease   tim con su m i ng  w he sel ect  w in ner   node  pr ocess.    Figure  is  t he   flo wc har of  RGS OM  proc edure ,   an Fig ur e   3a   is  the   whole  process   of  RG SO M   proce dure.  I i niti al iz at ion   process  us e nee set ti ng  the   m axim u m   m ap  siz and  m axi m um   no de   f or  th m ap   this  propose  f or   rest rict ed  the  siz of   the   gr owin no de   in  the  m ap.   User   al so   set ti ng   the  value   of   sta rt   le arn in rate  and  sto le a r ning  rate,  sta r gro wing  t hresh old ,   sto gro wing  t hr es hold,   a nd  m axEpoch.  In it ia li zat ion  pro ces s also  g e ne rate i niti al  n in e ref e re nce  vec tor n od es  for t he  m ap,  as sho w n on Fig ure  4a.     ( ) =    (   )    (2)      =     { }     (3)     ( + 1 ) =   ( ) +      (   ( ) ( )   )     (4)      =   ( )     (   2 2   ( ) )     (5)     Figure  3b  is  tr ai nin process   flow c har t U pdat le arn in r at and   up date  grow i ng   th res ho l us i ng   m on oto nic  de crem ent  fu nction,  fig ur ou t   by  (2 ) w here  S(t)   is  the  updated  le ar ni ng   r at or   gr ow i ng   thres ho l d,        is  sta rting   value,     i en ding  val ue ,   t   is  curre nt  epo c h,      is  m ax  epo c h.   Lear ning  rat e   and   gro wing  thres hold  updat us ed  to  set   c urren le ar ning   rate  and   gro w ing   th res ho l at   cur re nt  ep oc h.   T he  winner  node   c al culat us re gu la S OM  pr ocedu re  f ollo w   by  ( 3).  Wh e re win   is  wi nn e no de,   x   is  th input  vecto an   is  k - th   re fe r ence  vecto r.   Re fe re nce  ve ct or   a re  li st  of   no des  ge ner at by  first   node  (n i ne  s quar e   node  w hic po sit ion   is  in  the  center  of  m ap  Figure  4a an gen e rate  by  gr ow i ng   functi on If   winner  distance  m or than  the  grow i ng   th res ho l in  the  cu rr e nt  epoch  a nd  ge ner at e node le ng t s m al le than  m axim u m   node,   ref e ren c vector   will   gr ow  with  r an dom   weigh t.  If   gen e rated  node le ng th  m or e   than  m axi m u m   no de ,   unus e ref e rence   vecto will   be  re updated .   U nu se re fere nce  vecto a r node that  ne ver  hit  or   no ye t   sel ect ed  to   b e  w in ner.  T he  sc hem of   t he  grow i ng o R GSOM  s how on Figure 4 c.  N ei ghbor hood of w in ning   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   13 , N o.   3 Ma rc h 201 9   :   919     926   922   neur on  will   be   update us ( 4),  w he re     is  ga us ia nei ghbo rho od   f un ct io decide   by  ( 5) .   Lear ning  rate   no ta ti on  is  ( )   and   σ( t )   is  neighbor hood  ra dius,  bo th  a re  m on oto nical ly   decr easi ng   sc al ar  functi on  of  t   fo ll ow   the   r ule   of   ( 2),    is   k - t neig hborh ood of win ner node Sele ct e winner  n ode   will  be  pus to   the   li st  of   us e nodes .   Figure  3c  is  te stin g   procedu re  f lowc har t.  At  te sti ng   pur pose,  the  winne will   be  cho se f rom   m ap   gen e rate  by  tra ining   ste an us e node will   be  sel ect ed  to   be  ref e re nce  ve ct or   f or   te sti ng  in pu t.  T he  w inn e r   node  will   be   use t cal culat Tr ue  Ne gativ (T N),  T ru e   P os it ive  (TP),  F al se  Ne gative  ( FN ) False   P osi ti ve   (F P val ues.   T ru ne gative  is   correct   predic ti on   w hich  rea cat ego ry  is  norm al   and   la be le as  norm al Tru e   po sit ive   is  c orrect  pre dicti on  w hich   real  at t ack  cat e gory  a nd  la bele as   at ta ck.   False   ne gative  is   inc orrect   pr e dicti on   w hich  the  real  cat egory  is  at ta ck   bu pr e dicte as  norm al False   po sit ive  is  inco rr ect   pre dicti on  wh ic the  r eal   cat egory is n or m al  b ut labele as  att ack.           Figure  3. Flo w char t R GSOM - CR Proce dur e.           Figure  4. S qu a re  grow i ng no de  sch em a   Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  250 2 - 4752       An omaly - base intr us io n det ect or  syste m us ing   restri ct e…  (Tom i Y ahy C hr ist yaw an )   923   2.6.  Me asure ment   This  e xperim e nt  has  four  m e asur em ent to   evaluate  t his  m et ho d,  acc uracy   (A CC ),   fal se  al arm   rate  (F AR ),   detect ion   rate  (DTR )   or   recall pr e ci sion Accura cy   is  total   cor rectl cl assifi e exam ple  to  total   nu m ber   of exa m ple. A ccur ac y ca lc ulate  w it h (6):     ACC = TP + TN TP + TN + FP + FN   x   100%   (6)     False   al arm   rate  is  pe rcen ta ge   of  no rm al   categ ory   that  ha ve   bee la bel  a at ta ck  to  t ota nu m ber   of  norm a l   exam ples, and c al culat e as (7):     FAR = FP TN + FP   x   100%   (7)     Detect ion   rate  or r ecal l i s sta ndin g for c orrec tl y l abel as att acks t total   num ber  o at ta c ks , use (8 as  form ula.     D TR   or   Recal l = TP TP + FN   x   100%   (8)     Pr eci sio is  be ing   the  per ce nt age  of  co rr ect l la bel  at ta cks  as  at ta cks  to  total   nu m ber   of   instance  la bel ed  as  at ta cks,  a nd calc ulate  w it h ( 9) :     Preci sion = TP TP + FP   x   100%   (9)       3.   RESU LT S  AND DI SCU S S ION   RGSO M - CR V   and   Pa rall el   RGS OM - CR i this  ex per im ent  will   init ia lize  with  sam s ta rt  le arn in rate  (LRsta rt ),  stop  le arn i ng   rate  (LRst op),   sta rt  gro wing  thre shold  (G Tsta rt),   sto grow i ng  thr esh ol (G Tst op),  m ax  ep och,  m ap  siz e.  T his  ex pe rim ent  us es  LR sta rt=0.9,  LRst op=0 .1,  GTstart =0.05,  GTstop =0.01,   m axEpoch = 4,   m apSize=100 x100. Ma xim u m  n od e f or RG SO M - CR is 500 an m axi m u m  n od for  Parall el   RGSO M - CR V   dif fer e nt  bet ween  prot oc ol,  U dp  ha ve  m axim u m   no des   3000,  an tc a nd  ic m is   5000 ,   diff e re nt  val ue   of  this  s et ti ng  is  beca us ud at   trai ning  in sta nce  m uch   f ewer  that  tc a nd  ic m as  show at   Table  1.   This  exp e rim ent  us ing  com pu te r   w it sp eci ficat io n:  P ro ces sor  Int el   Core  i 7 - 6500U  CP U   @ 2.5 G H z   2.60 G Hz, M e m or y 8 G B,  w i th syst em  6 4 - bi t Op e rati ng Sy stem .   Tab le   2   s how   the  regular  GSOM  co nsum m or than  da ys  and   e nd e in  seco nd   e po ch  beca us e   hav m e m or lim it   issue  du e   the  m ap  gr ow ing   bigger Fro m   this  exp eri m ent,  GSOM  no ca pab le   t handle   la rg data  in  our  e xp e rim ent  du the  li m i ta tio of   m e m or and   ti m con sum ing   and   t his  is  no w horted  t be  con ti nue d.         Ta ble  1.   Distri bu ti on  of P ro t oc ol Type   Proto co l T y p e   Co u n t   ic m p   2 8 3 .602   tcp   1 9 0 .065   udp   2 0 .35 4       Table  2.   GSO M E xperim ent     ACC   FAR   DTR/Recall   Precisio n   Tr ain in g  T i m e   ep o ch   1   -   -   -   -   0 2 :3 2 : 1 1   ep o ch  2   -   -   -   -   More than  2 d a y s a n d  then  sto p p ed       The  resu lt   fro m   five  exp e rim ents  of  Paral le RGSO M - C RV  s how  in   T able  4.  T he  a ve rag e   Parall el   RGSO M - CR V   accu racy  is  91. 86%  an fal se  al arm   rate  is  20. 58%,  reca ll   or   detec ti on  rate  is  95.32 %,  an pr eci sio is  94.35%.  T he  a ve rag ti m con s um wh il trai ning  usi ng  Pa r al le RGSO M - CR is  hour 33  m inu te  and  18  seco nd (four  e po c h).  H ow e ve r,  ti m e con su m ing   f or  test in i s 46  m inu te s a nd 39 se co nd.   Fr om   Table  3   and  Ta ble  Pa ral le RGSO M - CR is  ou t pe rfor m   than  R G SO M - CR wit 91.86%  i accuracy,   false   al arm   rate  is  20.58% 95.32 f or   recall a nd  94. 35%  i pr eci sio n.  H oweve r,  preci sion  f ro m   bo t ex per im ent  ha ve  good  r esult.  From   Ta ble  at   thir exp e rim ent,  accuracy  of  RG S OM - CR ha ve   good   resu lt   tha othe e xp e rim ent.  This  ca be  ha pp e ne becaus RGS OM - CR is  gen e rate  r andom ly   and   in  eac exp e rim ent,  so  differe nt  res ul m ay   be  ob ta ined.  RGS OM - CR m ay be  cou l hav dif fer e nt  res ult  to f or   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   13 , N o.   3 Ma rc h 201 9   :   919     926   924   diff e re nt  G TSt art  an GTst op  set ti ng .   T he  r es ult  f ro m   the  fifth  e xperim e nt  usi ng  Pa rall el   RGS OM - C RV  f or   each p r oto c ol  s how at   Ta ble  5.   T he  par al le l R GS OM - CR V   ha ve  total   acc ur acy   is 97.27 %,  false  al arm   rate  is  12.72% recall   or  detect io r at is  99.79% ,   an pr eci sio is  96.87% Ic m pr ot oco ha ve  la r gest  acc ur at io n,  false al arm  r at e, d et ect io n rate  and lar gest  preci ssion .   Five  ex per im e nts   for  both  m et hods   will   be   evaluated Ta ble  sho th resu lt   of   fiv exp e rim ent   us in R GSOM - CR V.   The   av erag e   RGS OM - CR acc ur ac is  51. 45 %   an false  al arm   rate  is  11. 80 % recal l   or   detect io ra te   is  41 .78%,  a nd   pr eci sio is  93 . 09%.  T he  aver a ge  of  tim con s u m trai ning  us in RG SO M - CR is  ho urs  and   31  m inu te and   sec on d.   Tim con sum wh il te stin is  ho ur   a nd   44  m inu te and   59   seco nd.       Table  3.  R GSOM - CR V  Exp erim ents R esult     ACC   FAR   DTR/Recall   Precisio n   Tr ain in g  T i m e   Testin g  T i m e   Exp eri m en t 1   3 8 .22 %   1 8 .08 %   2 4 .52 %   8 1 .21 %   0 5 :1 7 : 2 4   0 1 :3 9 : 0 5   Exp eri m en t   2   3 8 .62 %   1 8 .69 %   2 7 .94 %   8 5 .66 %   0 5 :2 5 : 4 2   01 :3 2 : 5 6   Exp eri m en t   3   9 7 .74 %   9 .71 %   9 9 .61 %   9 7 .60 %   0 5 :3 4 : 3 0   0 1 :4 8 : 1 2   Exp eri m en t   4   4 1 .12 %   7 .48 %   2 8 .25 %   9 3 .78 %   0 5 :4 3 : 0 3   0 1 :2 7 : 2 6   Exp eri m en t   5   4 1 .54 %   3 .87 %   2 7 .85 %   9 6 .64 %   0 5 :3 7 : 0 1   0 2 :1 7 : 1 6   Av erage   5 1 .45 %   1 1 .80 %   4 1 .78 %   9 3 .09 %   0 5 :3 1 : 3 2   0 1 :4 4 : 5 9       Table  4.   Parall el  RGSO M - C RV E xp e rim ents R esult     ACC   FAR   DTR/Recall   Precisio n   Tr ain in g  T i m e   Testin g  T i m e   Exp eri m en t   1   9 7 .54 %   1 1 .02 %   9 9 .72 %   9 7 .26 %   0 8 :3 2 : 1 1   0 0 :5 2 : 4 8   Exp eri m en t   2   9 4 .79 %   1 9 .93 %   9 9 .48 %   9 4 .01 %   0 6 :1 5 : 5 9   0 0 :4 2 : 0 2   Exp eri m en t   3   7 8 .51 %   1 7 .52 %   7 7 .26 %   9 3 .34 %   0 5 :5 1 : 2 2   0 0 :5 7 : 0 7   Exp eri m en t   4   9 1 .21 %   4 2 .68 %   9 9 .69 %   9 0 .32 %   0 6 :1 8 : 4 6   0 0 :4 7 : 3 8   Exp eri m en t   5   9 7 .27 %   1 2 .72 %   99. 79%   9 6 .87 %   0 5 :4 8 : 1 6   0 0 :3 3 : 4 2   Av erage   9 1 .86 %   2 0 .58 %   9 5 .32 %   9 4 .35 %   0 6 :3 3 : 1 8   0 0 :4 6 : 3 9       Table  5.   Parall el  RGSO - CR V   Re su lt  Eac P ro t oco l at   Ex pe rim ent 5   Proto co l   ACC   FAR   DTR/Recall   Precisio n   ic m p   9 9 .74 %   5 6 .80 %   1 0 0 .00 %   9 9 .74 %   tcp   9 3 .39 %   1 4 .97 %   9 9 .44 %   9 0 .17 %   udp   9 8 .48 %   0 .52 %   3 3 .41 %   4 9 .60 %   Total   9 7 .27 %   1 2 .72 %   9 9 .79 %   9 6 .87 %       Fo m or detai insigh we   can  stu dy  w it the  m ap  gen e rated  i each  ep oc h,   wh ic sho w n   at   Figure  5 - 7.   Fr om   the  vis ua li zat ion   show at   Figure  5 - t her a re  ne knowle dge  of  in form ation   a bout  th e   tr ai ning  proce s of   Pa rall el   RGS OM.  Fig ure   at   udp  proto col  show that   nodes  wh ic s epar at ra ndom ly   is   nodes  t hat  ge ne rated  by  re update  unuse re fer e nce  ve ct or   process The  r andom ly   separ at of   s om node  al so  app ea at   Fig ure  f or  TCP   and  ud proto col.  At   Icm protoc ol  f r om   first  un ti f our th  ep oc s how that   decr easi ng of  use d refe ren ce  vec tor n um ber , t hat m ean th ere  are m or e sim i l ar  weig ht in  t ra ining data.   Parall el   RGS OM - CR V   is  outpe rfor m   regular  R GSOM  in  ef fici ency  of  tim con s um e,  it sp e nd  aver a ge  ho ur  and   33   m inu te and   18  sec ond  w hile  trai ning,  an 46  m inu te and   39  seco nd   for  te sti ng Trainin tim consum wh e us in R GSOM - CR V   is  be tt er  than   Pa ra ll el   RGSO M - CR V,   this   bec ause  i par al le RGS O M - CR the re   are  proce dure   to  sel ect in input  acc ordin to   prot oco ty pe.   H oweve r tim consum ing   f or  te sti ng   usi ng  Parall el   RGSOM - CR is  bett er  tha RG SOM this  beca use   at   par al le RGS OM   gen e rate  le ss  use nodes   in  t he  m ap,   s ti m fo r   sca nn i ng  the   wi nn e node   m or ef fici ent.  T he  prob l e m   of  Re gu la r   G SOM   for  cl as sifi ed  big   data  ha bee fi xe by   RGSO M - CR an Parall el   RGSO M - C RV,  th e   restrict ed  of   node le ngth  ge ner at by  gro wing  th reshol m ake  the  li m i ta ti on   of  m ap  to  gr ow i ng   bigger  a nd   bigger Cl us te rin ref e ren ce   vect or  m ake  RGSO M - CR V   capa ble  to   ge ner al iz weig h base  on  grow i ng   thres ho l d.   Fr om  Tab le  6 , Paral le l R GS O M - CR has  l ower acc ur acy  t han   oth e m et h od s , but let  see the n um ber  of   te sti ng  data,   pro posed  m et hod  ha ve  4,898,431  i ns ta nce as  te sti ng  dat a,  an ha ve  le s featu re  to   pr ocess.  W it la rg e am ou nt  of   te ste data,  Pa rall el   RGSO M - CR is  capab le   of   pr od ucin 91. 86%  accuracy,   so   this   m et ho d ve ry pr om isi ng  to  s olv e the  b i g data  pro blem s in  cl assifi cat ion .       Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  250 2 - 4752       An omaly - base intr us io n det ect or  syste m us ing   restri ct e…  (Tom i Y ahy C hr ist yaw an )   925   Table  6.  C om par iso n of p rop ose m et ho d wit h othe m et ho ds by  nu m ber   of  trainin g data, t esi ng d at a,   featur e s,  a nd a ccur acy .   Metho d   Tr ain in g  Data   Testin g  Data   Featu res   ACC  %   KNN  [ 1 ]   5 ,55 2   5 ,55 2   15   9 7 .69 %   SVM+ EL b ase  K - m e an   [ 1 0 ]     4 9 4 ,021   3 1 1 ,029   41   9 5 .75 %   TAN+R EP  [ 1 2 ]   3 2 6 ,053   1 6 7 ,968   No t pro v id ed   9 8 .99 %   Parallel  RGSO M - CRV   4 9 4 ,021   4 ,89 8 ,431   9   9 1 .86 %           Figure  5. Ma p gen e rated  w it h Parall el  RGS OM - CR V  for f irst ep och at e xperim ent 5           Figure  6. Ma p gen e rated  w it h Parall el  RGS OM - CR V  for s econd e poch  at  experim ent 5           Figure  7. Ma p gen e rated  w it h Parall el  RGS OM - CR V  for   thir e po c at  e xp e rim ent 5       4.   CONCL US I O N   Fr om   this  exp erim ent  Parall el   and   RGSO M - CR ou t perform   than   reg ula GSOM  in  tim e   consum ing s this  pro pose  m et ho is  m ore  eff ic ie nt  tha GSOM  m et ho d,   a nd  f ro m   com par at ion   with  ot he r   m et ho d,  the  re su lt   of  Parall e RGSO is  acce ptable  with  91. 86%  for  accuracy,  false   al arm   rate  aro un 20.58% re cal l   or  detect ion  r at is  95. 32%,   an 94.35%   in  pr eci sio n.  T his  stu dy  al s con cl ud e   that  f ind   t he   best of m axi m um  n od e  w il l i ncr ease  the e ff i ci ency, and R GSOM ge ne rali ze capab il it y d epend  on  GTst art an Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   13 , N o.   3 Ma rc h 201 9   :   919     926   926   GTS t op.  T he  capab il it to  gen erali ze  ref e re nce  vecto r   m a ke  accura cy   and   detect ion   rat acce ptable.  F ind in the opti m u m  p aram et er s et ti n g of g rowin t hr es holds  can   be use as a  r e fer e nce  for  th fu t ur resea rch.       REFEREN CE S   [1]   L.  Li ,   H.  Zha ng ,   H.  Peng ,   and  Y.  Yang.  Nea r e st  Neighbor ba sed  density   peaks   appr oac h   to  i ntrusion  detec ti o n.   Chaos,   Soli tons  Frac ta ls .   2018 110:   33 40.   [2]   E.   Kabi r,   J.   Hu,  H.  W ang,  and   G.  Zhuo.  novel   sta ti sti ca l   t ec hniqu for  in t rusion  det e ct ion   s y stem s.  Futur e   Gene ration  Com pute S y stems .   2 018;  79:   303 31 8.     [3]   M.  Ahm ed,   A.  Naser  Mahm ood,   and  J.  Hu .   surve y   of  ne twork  anomal y   de te c ti on  t ec hniqu es.   Journal  of  Ne tw ork  and  Computer  A ppli cations .   201 6;  60:   19 31.   [4]   E.   de  la   Hoz,   E .   de  la   Hoz,   A.   Ortiz ,   J.  Orteg a,   and  A.  Martínez - Álvar ez.  Feat ure   sel ec t ion  b y   m ult i - obj ec t i ve  opti m isat ion:  Applicati on   to  n e twork  anomal y   det e ct ion   b y   hi e rar chica l   self - or gani sing  m aps.   Knowle dge - Base d   Syste ms .   2014;   7 1:  322 338.   [5]   Z.   Chib a,   N.  A bghour,   K.  Mous said,   A.  El   O m ri,   and  M.  Ri da.   novel   archit e ct ure   combined  with  opti m al  par amete rs  for  bac propa g atio neur al   n et wor ks  appl ie to  an om aly   n et work  int rusion  de te c tion.  Computers   &   Sec urit y .   2018;  7 5:  36 58.   [6]   F.  Al  Huda,   W .   Firdaus  Mahmud y ,   and  H.  To ll e .   Android  M al ware   De te c ti o Us ing  Bac kpropa gation  Neura l   Network.   Indon e sian J ournal  o f El e ct rica Eng in ee ring a nd   Computer  Sc ie nc e .   2 016;  4(1):   240 - 2 44.     [7]   C.   Xiang ,   Y.  Xi a o,   P.  Qu,   and  X.   Qu.  Network  Int rusion  Detect ion   Based  on  PS O - SV M.  T ELKOMNIKA  Indone sia Jou rnal  of   Elec t rical   Engi ne erin g .   2014;   12(2):   1 502 - 1508.   [8]   A.  Kara m and  M.  Guerre ro - Zapat a .   fuz z y   an om aly   de te c ti on  s y stem  base on  h y brid  PS O - K m ea ns  al gorit hm   in   cont en t - ce n tric  n et works .   Ne uroc omputing .   2015 ; 149:  1253 1269.   [9]   A.  H.  Ham amot o,   L.   F.   Carva lh o,   L.   D.  H.  Sampa io,   T .   Abrão,   and  M.  L.   Proenç a.   Network  Anom aly   Detect io n   S y stem using  Ge net i Algori thm  and  Fuzz y   Log ic.  Exp ert S y st ems   with  Appl icati o ns.  2018;  92 39 0 402.   [10]   W .   L.   Al - Yasee n,   Z.   A.  Othm a n,   and  M.  Z.   A .   Naz ri .   Multi - l eve h y b rid  sup port  vec tor  m achine   and  ex tre m e   le arn ing  m ac hin base on  m odifi ed  K - m ea ns  for  int rusion  detec t ion  s y stem.  Ex pert  Syst ems  wit Appl i cation s 2017;  67:   296 3 03.   [11]   G.  Kim ,   S.  Le e ,   and  S.  Kim .   novel   h y brid  in tr usion  det e ct ion  m et hod  int egr at i ng  anomal y   d ete ct ion  with  m isuse  det e ct ion .   Ex per Syst ems wi th   A ppli cations .   201 4;  41(4):   1690 1 700.   [12]   K.  Raj ase k ara and  K.  Nirm al a .   Novel  and  Advanc ed  Dat Mining  Model  base H y brid  In trusion  Detect io Fram ework.   TE L KOMNIKA  Indone sian J ournal   of  E le c tric al   En gine ering .   2015;   13(2):  223 - 231.   [13]   J.  Jabe and  B .   Muthukum ar.   Intrusion  Detect i on  S y stem  (IDS ):  Anom aly   Detect ion  Us ing  Outli er  De te c ti o n   Approac h.   Proc edi Comput er  S ci en ce .   2015;   48 338 346.   [14]   W. - C.   Li n,   S. - W .   Ke,   and  C. - F.  Tsai .   CAN N:  A int rusion  det ection  s y stem  base on  combining  cl uster  c ent ers  a nd   nea rest   ne ighbor s.  Knowle dg e - B ased  Syste ms .   20 15;  78:   13 21.   [15]   T.   Kohonen .   Essentials  of   the sel f - orga nizing  m a p.   Neural   Ne two rks .   2013;   37:  52 65.   [16 ]   D.  Alaha koon,   S.  K.  Halga m uge,   and  B.   Srin iv asa n.   D y namic  self - orga ni zi ng  m aps  with  cont roll ed  growth  fo knowledge   d isco ver y .   IEEE  Tr ansacti ons on  N eural  Ne tworks .   200 0;  11(3):   601 61 4.   [17]   S.  J.  Stolfo,   W .   Fan,   W .   Lee,   A.  Prodrom idi s,  and  P.  K.  Chan.   C ost - base Model ing  and  Ev al ua tion  for  Data   Mini ng   with  Appli ca t ion   to  Fraud   and   Int rusion  Detect ion Result s   from   th JA M Proje c t. 2 000.     Evaluation Warning : The document was created with Spire.PDF for Python.