Indonesi an  Journa of El ect ri cal Engineer ing  an d  Comp ut er  Scie nce   Vo l.   24 ,  No.   2 N ov em ber   20 21 pp.  1063 ~ 1073   IS S N: 25 02 - 4752, DO I: 10 .11 591/ijeecs .v 2 4 .i 2 . pp 106 3 - 107 3          1063       Journ al h om e page http: // ij eecs.i aesc or e.c om   Anomal y event d etection  and lo calization  of vide o clips usi ng  global  an d local  outlie rs       Sa w sen  Abdul ha di  M ah m oo d 1 Az al  M on s hed  Ab id 2 Sadeq H .   L afta 3   1 , 2 Depa rtment   of   Com pute Sci en ce ,   Mus ta nsir i y a Univer sit y ,   Ba ghdad,   I raq   3 Depa rtment of  Applie Sc ie c e,  Univer sit y   of   T e chnol og y ,   Bagh dad,   I raq       Art ic le  In f o     ABSTR A CT   Art ic le  history:   Re cei ved   A pr   30 2021   Re vised  Sep   7 2021   Accepte Se p   16 2021       The   aut om atic  d et e ct ion  of  ano m aly   ev ent in  vide seque nc has  bec om a   cri tica issue  and  essenti al   deman for  the   ext ensi ve  depl o y m en of  computer   vision  s y stems   such  as  vide sur vei llanc applic a ti ons.  An  anoma l y   eve n in  vide ca be  denot ed  as  out li e beh avi or  withi vide fr ames  which  form ula te b y   a   devi at ion  from   the   stabl sc ene .   In  thi pape r,   a anomal y   eve nt  de tecti on   and  loc a li z atio m et hod  in  vide seque nc i pre sente d   inc ludi ng  m ult i l eve stra te g y   a te m pora fra m es  diffe ren ce s   esti m at ion,  m odel li ng  of  n orm al   and  abno rm al   beha v ior  u sing  reg ression  m odel   and   fina lly   d ensity base cl uster ing   to  det ect  the   o utl ie rs  (ab norm a eve nt)  at  cl ips  le ve l.  Henc e,   ou tl i er  scor i obta in ed  at   the  segm ent   or   clip  le ve a long   vide fra m es  seq uenc es.   The   pr o posed  m et hod  sepli ts  vide fr ame int non - over la pp ed  c li ps  using  globa o utl ie r   detec t ion  proc ess.  After w ard ,   a e ach   cl ip ,   th lo ca l   outl ie rs  are   d eterm ine base d   on  density   of  ea ch   clip.   Ext ensiv exp erim ent were   cond uct ed   upon  two  publi vide o   datase ts  whic h   inc lud dense   a nd  sca tt er ed  outliers  al ong  vid eo   seque nce.  The   expe riments   were   per fo rm ed  on  two  comm on  publi c   da ta sets  (Avenue and   Univer sit y   o f   Cal ifornia,   San  Diego  (UCS D) .   The   exp er iment al   result exh ibited  that  the  proposed  m et ho detec ts  we ll  outl i er  fr ames  at  clip  l eve l   with  lower   computat ion al   c om ple xity   compari ng  to  th st ate - of - the - ar m et h ods.   Ke yw or d s :   Anom al y event   Den s e cluste ring   Local  ou tl ie rs   Ou tl ie rs   Tem po ral  dif fe ren ces   This   is an  open   acc ess arti cl e   un der  the  CC  B Y - SA   l ic ense .     Corres pond in Aut h or :   Sawse n Abd ul had i M a hm oo d   Dep a rtm ent o f C om pu te Scie nce   Mustansiriy ah   Un i ver sit y   Ba ghda d,   Ir a q   Em a il sawsenhad i @uom us ta ns iriy ah. e du.iq       1.   INTROD U CTION   Ou tl ie rs,   al s known  as  an om al ie s,  abn orm al i ti es  or   rare   even ts,  are  da ta   sa m ples  or   obj ect in  ra w   data  that  do   no a dap to  con ce pt  of  norm al   beh aviour  [ 1].  O wing  to  the  gr owing  re quirem e nt  a nd   app li cat io ns   in   wide  dom ai ns su c as  vi deo  su r veill ance,   s ecur it y,  he al th care  an m edical   risk  [2 ]   as  w el as   intru si on  de te ct ion   [3 ] ,   an oma ly   and  outl ie r   detect io ta s play si gn ific ant  r ole  in   vari ant  fiel ds  incl ud i ng  com pu te vision,  sta ti sti cal   analy sis  an m achine  le ar ni ng .   O utli er  de te ct ion   is  t ask  of   d et erm ining    su b - r egi on   in  giv en  data  sa m ples  wh ic are  co ns ide red  as  abnor m al   su bse and   ha ve  unusual   be hav i ou r   from   oth er  sa m ples.  It  is  on of  the   esse ntial   data  m ining   obj ect ives   a nd  ba sic   fiel in  m any  app li cat ion s,  su c as  vid e o s urveil la nce sys te m s w hich  are  u se t rec ogn iz e the pote ntial  thr eat [2 ] - [ 4 ].   Ou tl ie rs  or  a nom aly  even ts  can  dev ia te   or  distor t he  sta ti sti cal   m easur em ents  an data  distrib uti on   du e   to   it rar el app ea ra nce  i the   real  li fe   e ven ts al lo wing   c onfu s ed   re presentat io of  t he  im plici dat an relat ion s hip s   [ 5].  P racti cal ly the  var ia nt  distribu ti on   of  norm al   and   a no m al even ts  w it hin   vid e f ra m es  is  un a nnou nced   with  ra re  pres entat ion   of   outl ie rs In   s urve il la nce  vid eo s,   the  pr e dom in ant  eve nts  occ urri ng   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   2 4 , N o.   2 N ove m ber   20 21 106 3   -   107 3   1064   fr e qu e ntly   are  denote as  no r m al   beh avi our,  wh il a bnor m al   even ts  a re  r efer red   t the  even ts  occ urre with   low  pro ba bili ty   [6 ] The  aim  of   outl ie detect ion   an loc al iz at ion   is  to  determ ine  the  sp at ia and   te m po ral    su b - r egi on i nvol ved   t he  an om al ou eve nts  with  aut om a ti m ann er  [ 7] .   O utli er  detec ti on   m et ho ds   can  be   cl assifi ed  in   te rm of   the  dat ty pe  re quire to   trai the  m od el   su ch   as po i nt,  c on te xt ual  an c ollec ti ve  ano m al ie s.  Po int  ou tl ie is  re ferred  to  sin gu la data  inst ance  de viate from   the  whol data  sa m ples.  A   con te xtu al   outl ie represe nts  an  in div id ual  da ta   sa m ple  devi at ed  within  con te xt  w hich  requires  no ti on   of  con te xt  as  we ll   as  con diti on al   ano m al ie s.  Coll ect ive  anom al ie are  den ote by  se of   co rr el at e data   instances  a nd   needs  relat ion s hi am on da ta   instance represe nted  by  seq uen ti al   and   s patia da ta The  singular  patte r ns   within  c ol le ct ive  ano m a ly   are  co ns ide red   not  an om a lou by  them sel ves.   Ba se on  the   ano m al def init ion   pro vid e in  [8 ] “Vi de an om al ie s   c an  be  th ought   of   as  the  oc currence  of   unusual   app ea ra nce o m ot ion  p at te rns  or  the   occ urr ence o usual   a pp ea ra nce o m ot ion   at trib ut es  in u nus ual  l ocati ons   or   ti m es”  we  form ulate   the  pro blem   of   an om aly  even de te ct ion   as  re gr essi on  m od el   fitt ing   as  we ll   as   cl us te rin g base d - l ocal outl ie r dete ct ion t ask.    In   t his  sect io n,  discuss i on  of   rece nt  resea rch es   rele van ou tl ie a nd  a nom aly  even de te ct ion   in   vid e seq ue nc will   be  pr ese nted.   Re ce ntly vid eo  a no m al detect ion ba sed  on  dee le arn i ng   m et ho ds   are   introd uced   incl ud i ng   diff e re nt  scenarios  s uc as;   sal ie ncy  vid e detect io m e tho base on  sp at ia l - te m po ral   featur e a nd  3D  co nvol utio netw ork  [9 ] te m po ral  se gm ent  networ [ 10] a uto e nc od e netw ork - base m ot ion   patte r le arn in [ 11 ] ,   end  to   en an om al detect ion   of  vid e base on  pre - trai ned  dee netw orks   [ 12 ] ,   deep   a nom aly  detect ion   with  dev ia ti on  net w orks  [ 13] H oweve r,   dee le arn i ng   m et ho ds  are  re quired  huge   dataset   sa m ple   to  ob ta in  an  a ccur at pe rform ance  m easur e   fo detect in ano m al even ts  within  vid e fr am es.   Othe resea rchers  f or m ulate d   the  pro blem   of   vi deo   a nom a ly   detect ion   as   regressio m od el   to  prov i de  an   ano m al scor by  fr am or  cl ip  le vel  [14 ] ,   [ 15 ] Sim ultaneousl y,  ot her   researc he r hav i nteres te by  trajecto ry - base d   vid e a no m al y detec ti on  m et hods   [16 ] [ 17 ].   T r a j e c t o r y   b a s e d   m e t h o d s   i n c l u d e   l e a r n i n g   t h e   n o r m a l   t r a j e c t o r i e s   o f   p e d e s t r i a n   w i t h   a s s i s t a n c e   o f   t r a c k i n g   a l g o r i t hm s   t o   d e c i d e   w h e t h e r   t h e   v i d e o   n o r m a l   o r   a n o m a l y .   T h e   m a i n   o b s t a c l e   o f   t r a j e c t o r y - b a s e d   m e t h o d s  i s   t h e   i n f l u e n c e  o f  o c c l u s i o n  e s p e c i a l l y   i n  c r o w d e d  s c e n e s   a s   w e l l   a s  t h e  l i k e l i h o o d  o f  e x i s t i n g  d i f f e r e n t   t r a j e c t o r i e s   f o r   s i n g l e   s c e n e   [ 1 8 ] .   L o c a l   a nd   g l o b a l   a n o m a l y   d e t e c t i o m e t h o d   u s i n g   h i e r a r c h i c a l   f e a t u r e   r e p r e s e n t a t i o n   a n d   G a u s s i a n   p r o c e s s   r e g r e s s i o n   w a s   i nt r o d u c e d   i n   [ 1 9 ] ,   w h e r e   g l o b a l   a n o m a l i e s   r e f e r   t o   t h a n om a l i e s   a m on g   s e q u e n c e   f r a m e s   a n d   l o c a l   a n o m a l i e s   d e n o t e   t h e   a n om a l o u s   r e g i o n s   w i t h i n   a   f r a m e .   L o c a l   a n om a l i e s   a r e   c om m o nl y   d e t e c t e d   i n   v i d e o s   b a s e d   o n   l o c a l   s p a t i o -   t e m p o r a l   f e a t u r e s ,   w h e r e   m o t i o n   i s   o c c u r r i n g   a n d   g e n e r a t i n g   d u e   t o   m u l t i p l e   o b j e c t s   m o vi n g   w i t h i n   s i n g l e   s c e n e   [ 2 0 ] .   V i d e o   a n o m a l y   de t e c t i o n   m e t h o d s   a r e   i n t e r e s t e d   i n   d e t e r m i ni n g   w h e t h e r   t h e   c u r r e n t   f r a m e   o f   a   g i v e n   v i d e o   d e m o n s t r a t e s   a n   a n om a l y   o r   n o t   [ 2 0 ] [ 2 1 ] .   Anothe ty pe  of   a nom alies  nam ed  con te xtu al   an om al wh ic c orresponds  t the  s a m ples  hav in sign ific a nt  va r ia ti on   causi ng  ano m al ie relat ed  to  certa in  co ntext  [ 20] Co ntextual   ano m al ie c an  be   cat egorized  ba sed  on  sp at ia and   te m po ral   f eat ur es  of  vi de fr am es  [22 ] [ 23] O utli ers  detect ion   m e thod s   base on  cl us t erin al go rith m are  insp ire by  m any  ear ly   researc her s   to  ef fici ently   de te ct   ou tl ie rs  ba sed  on  the  entire  data set   [24].  The  pro posed  w ork  in  [ 25 ]   ha ndle the  ano m al detect ion   pro ble m   as  low  li kelihoo patte rn   detect ion   due  to  li m i t ed  avail a bili ty   of   a de qu at in s ta nces  of  a no m al even ts  with   assist ance  of  ne ur al   netw ork  f or  norm al   even ts  le arn i ng.  L et   al.   [ 26] sug ge ste dicti on ary - ba sed   a ppr oach   t le ar norm al   beh a viors  an detect   ano m al even ts  us ing   r eco ns tr uct ed   erro r.   H oweve r,   this  m et hod  is  no rob us adequate ly   to  disti nguish  bet ween  norm al   and  ab norm al  eve nts  bas ed   on  the  rec onstructio e rror.  Th e   pro po se work  in  [27]  prese nt ed  le arn i ng   m od el   of   norm al   scenes  us i ng   two - stream   recu r ren a uto e nc od e in  sem su pervised  le a rn i ng   m ann er  a nd  tra j ect ory - ba sed  s patio - te m po ral   feature s.  Anot her   w ork  [ 28]   base on   a ut oen c ode net wor an sp at ia featu res   for  le ar ning  norm al   even ts.  The  m ai lim itati on   of   t his  m et hod  represe nted  by  it dep e nd e nc on   s uccee ding  the  tra j ect or y - base featu res   extracti on  ph a se  w hich  is  a ffec t ed   in cro wd e sce nes .   The  m ai obj e ct ive  of   t his  re search   is  t de sign   a nd  im ple m ent  com pu te visio syst e m   to  address  the  pr ob le m   of   a no m al even detect io i vid e o.   The   Anom al even ts  (outie rs ar detect ed   in  vide seq uen ce  b ase d on cl ip le vel.   W ca n sum m arize   the e ssent ia l con tri bu ti on s of the  pr opose m et ho d by ;     Determ in ing   a uto m at ic ally  th global  an lo cal   ou tl ie rs  in  vid e ba sed  on   tem po ral  re dund a ncy  of  f ra m es  and d e ns e  cli ps cl us te rin g.     Fu rt her,  trai ni ng   re gr essi on  m od el   can  e stim at the  g lo bal  an om al scor for  the  e nt ire  vid e f ra m es,   hen ce  d et ect s t he  a no m al ou po te ntial  f ram es w it hi eac c li p   in term  o f  local o utli er  detect ion .     In  c on ti nu ou m ann er,   the  t raine regressi on  m od el   is  updated   with   no r m al   segm ents  wh ic detect ed   in  the te sti ng m od e in  or der  t t ake a dv a nta ge of  nor m al  b eha viour  v a riat ion .   T h e   r e s t   o f   t h i s   p a p e r   i s   o r g a n i z e d   a s   f o l l ow s :   s e c t i o n s   2   a n d   3   p r e s e n t   t h e   d e t a i l   d e s c r i p t i o n   o f   a n om a l y   e v e n t   d e t e c t i o n   a n d   l o c a l i z a t i o n   m e t h o d   o f   v i d e o   c l i p s   u s i n g   gl o b a l   a n d   l o c a l   o u t l i e r s .   T h e   r e s ul t s   a n d   d i s c u s s i o n   a r e   i l l u s t r a t e d   i n   s e c t i o n   4 .   S e c t i o n   5   c o n c l u d e s   t h i s   p a p e r .     Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       An omaly eve nt d et ect io n and l oca li za ti on  of  vi deo  cli ps   us i ng  … ( Sawsen   Ab du l hadi M ahm ood )   1065   2.   THE  PROPO SED  METHO D   In   t his  sect io n,   we  will   dem on strat th pro posed   m et hod   of  an om al even de te ct ion   a nd   local iz at ion   al ong  vid e f ra m es  based   on  glob al   an loc al   ou tl ie pre di ct ion   as  s how in  Fi g ure   1.  In   t his  pap e r,   m ult ilevel  fr am ewo r is  adopted  to  determ ine  the  ano m al behavio ur   ( outl ie rs)   in  giv en  vid e sam ple.  First  le vel  is  re pr e se nted  by  est im a ti on   the   te m po ral  dif fer e nces   betwee se que nced  f ram es  based   on   visu al   featu res suc as m otion a nd  histo gr am  sim il arit y featu res .     Seco nd  le vel  m i m ic the  det ect ion   of  gl ob a ou tl ie rs  us i ng  tem po ral  dif fe ren ce   sco re  a nd  po ly nom ia l   fitt ing   m od el To  this  e nd,  a ass um ption   of   t he  re gr e ssion   m od el   is  presente a nd   t raine to  s peci fy  the   po ly nom ia fi tt ing   wit the  tem po ral  di ff e r ence  ra data   of   the  e ntire  vid e seq ue nc e.  Con se que ntly the  sam ples  that  dev ia te   f ro m   the  re gr essi on  m od el   are  c and i date  to  be   global  outl ie rs.   Accor dingly the   su ggest e global  outl ie det ect ion   m od el   is  trai ne us in on ly   no rm al  vid e os   with  norm al   beh avi ours  t pr e dict  the  optim al   po ly no m i al   coef fici ents .   W assum t hat  an  insta nt  segm ent  has  norm al   /a bn orm al  beh a viou bas ed  on  the  pr e dicti on   sc or of   the  ad opte regressi on   m od el   instea of   us i ng   pr e def i ned  thres ho l d.   I th is  le vel,  t he  vid e f ram es  are  se gm ented  into  set   of  pr i m itive  cl ips  or  shots  isolat ed   by  th e   corres pondin ind e xes  of  temporal   fr am es  diff e ren ces The  global  ou tl ie rs  are  ex plo it ed  to  segm ent  the  vid e fr am es into  cl ips .     F i n a l l y ,   t h e   l o c a l   o u t l i e r s   d e t e c t i o n   l e v e l   i s   i m p l e m e n t e d   w h e r e   t h e   c o n t e x t u a l   o u t l i e r s   w i t h i n   e a c h   v i d e o   c l i p   w a s   t a k e n   i n   o u r   c o n s i d e r a t i o n .   P r a c t i c a l l y ,   t h e   f r a m e w o r k   o f   a n   e f f i c i e n t   a n o m a l y   e v e n t   d e t e c t o r   s h o u l d   b e   e l i g i b l e   t o   u p d a t e   i t s   d e t e r m i n a t i o n   o f   n o r m a l   e v e n t s   i n   a   c o n t i n u o u s   m a n n e r .   T h u s ,   t h e   r e c e n t   a p p r o a c h   i s   a b l e   t o   u p d a t e   t h e   r e g r e s s i o n   m o d e l   t h r o u g h   f e e d i n g   t h e   d e t e c t e d   n o r m a l   s e g m e n t s   t o   t h e   t r a i n i n g   s a m p l e s   f r o m   a n y   a c q u i r e d   v i d e o .   F i g u r e   1   i l l u s t r a t e s   t h e   w o r k f l o w   o f   t h e   p r o p o s e d   a n o m a l y   e v e n t   d e t e c t i o n   m e t h o d .           Figure  1.  Wo r kfl ow  of  t he pr opose d an om al eve nt d et ect io m et ho d       2.1     Te mp or al  f r ames   d if f erence e s timat i on   As  a p re - proce ssing   of  v i deo   analy sis, w e segm ent the v ideo  into ind i vidu al  f ram es  an conve rt each   fr am e to Y Cb Cr for m at  in  order  t e xtract  t he  lum inance l ay er.  I t his p a per, an ef fici en t underst an ding  of  t he   vid e cl ip  be ha viours  has  be en  pro vide by  form ulati ng   the  tem po ral  rele van ce  am ong  s equ e nce f ram es.  I order  to   detect   an e xtract  t he   f or e gro und  obj ect s   (m ov in obje ct s)  over   the  vid e se qu ence,   the  te m po ral  diff e re ncin be tween eac tw co ns ec utive  f ram es is est i mate d.  T he  te m po ral  fr am es d if fer e nces a re ob ta ined   base on  t wo  m ai integrate par am et ers;  m ot ion   est im ation   a nd  c olour   histo gr am   dif fer e nce.  The   m ot ion   par am et er  bet ween  f r am es  F i F i - 1   is  ob ta ined  t hro ugh  bin a rizat ion   t he   subtract e i m age  ( F i   -   F i - 1 with   Th res hold   val ue   that  is  s pecifi ed  acc ordin to  th inte ns it range  of  the   s ubtract ed   im age  ( F i   -   F i - 1 a nd  Otsu ' m et ho d [ 2 9 ]  as  il lustrate i ( 1) :     =   |   1 |     >         (1)     Me anwhil e,  th foregr ound  obj ect are  e xt racted  an la belle usi ng  ( 8 c onnecte d)   neig hbouri ng  pix el of  M O i   i m age  w hich  re pr ese nts  the   f oreg rou nd  ob j ec ts  in  the  c urre nt   fr am F i whe re  i= 2,3,….N ,  an N   is  the  total  n um ber   of  f ram es  in  the   acq uire vid e sam ple.  A fter ward,   th area p r operty   AR i   is  e xtracte f r om  MO i   data  po i nt to  highli ght  the  interest e reg i on s m ini m iz ing   the  co m pu ta ti on   tim as  well   as  to   m ake  Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   2 4 , N o.   2 N ove m ber   20 21 106 3   -   107 3   1066   decisi on  a bout   occ urrin m otion   betwe e th seq ue nce  fr a m es.  W a ssum ed  that  the   hi gh e values   of  AR i   m easur ed  in pi xels (w hite pix el s)  re ferred  to m ot ion  ca pturing bet ween t he  seque nce fram es.   The  sec ond  pa ram et er  us ed   in  our  f ram ewor f or  te m po ral  fr am es  dif fer e nces  e stim ation   i s   represe nted   by   the  sim i la rity   ben c hm ark   com m on ly   use i m achine  le ar ning  a nd  data   analy sis.  T he  Hau s dor ff  dist ance  ( HD )   dis ta nce   m easur e m ent  [ 30 ]   is  a   li gh twei gh t   ye eff ect ive   sim il arity  m eas ur e   f or   qu a ntifyi ng  th pro xim it of   two  grap hs The  Hausd orff  ( HD )   dista n c m easur qu a ntifie the  dif f eren c e   betwee two  s equ e nce fr am es  based   on  bl ock - based   c olour  hist ogram   d iffer e nces.  T he   tem po ral  diff e ren ce   betwee eac s equ e nce  fr am es  F i , F i - 1       us in Ha us do rff ( HD )   distance  m e asur e  is c om pu te acco r ding t o (2) :      =    ( , 1 )       (2)     wh e re  Diff i   para m et er  denotes   the  weig hte s um   of   blo c ks   di ff ere nces  bet ween   seq ue nce   fr am es  F i   and   F i - 1   and  k   is   t he  c orrespo nd i ng  bl oc in de in   the  two f ram es   F i F i - 1 .     li near   i nteg rati on   of  the  t wo   pa ram et ers   ( AR i   a nd   Diff i is  sp eci fie to  f or m ulate   t he  sc or of   tem po ral  diff e r ences  betwee n ea ch  tw o seq ue nced f ram es  as g ive i ( 3):      =  + ( 1 )      (3)     wh e re  α   is  scal ar  sta nd   at   0.6  an it   is  dete rm ined  throu gh  the  e xp e rim e nts.  O bvio us ly ,   area  featu re  AR   is  aug m ented  by  scal ar  α   due  t it eff ect ive ne ss  of  ref le ct in the  dissim il ari ty   between  tw se quence   f ra m es.   The  te m po ral  diff e re nces  est i m ation   strat e gy   and   it visu a li zat ion   res ult  of   sam ple  vid e are   il lustrate in   Figure  a nd Fi gure   res pecti vely .           Figure  2 .  Bl oc k diag ram  o te m po ral fr am e d iffe re nces esti m at ion  strateg y         (a)       (b)     Figure  3 .  V is ua li zat ion  r es ult o te m po ral f r a m e d iffe ren ce s estim at ion  b a sed o n;  ( a area  (blue li ne a nd  HD  distance m easu re (re li ne) ;   ( b Tem pD iff  sc or e   of  vid e o   sa m ple   (0 4) from  AVEN U data s et   Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       An omaly eve nt d et ect io n and l oca li za ti on  of  vi deo  cli ps   us i ng  … ( Sawsen   Ab du l hadi M ahm ood )   1067   3.   MO DELL IN G NOR M AL  BE HAV I OUR  AND A NOMAL S COR E   3.1 .      Gl obal o ut li er detec tio n model   Ba sed on  t he  a ssu m ption ; a d at a sa m ple is con si der e as  g l ob al   outl ie if it  d eviat es s uffici ently  f ro m   the  w hole   data   set the  first  le vel  of  detect in ou tl ie rs  is  re al iz ed  base on  e xtracti ng  th global  ou tl ie usi ng   the  re gr essi on   m od el Re gr ession  a naly sis  is  fun dam ental   an com m on   con ce pt  adopted   in  m achine   le arn in m od el s.  S pecifica ll y,  it   fall under  su pe r vised   le ar ning  i wh ic the  trai ni ng  m od el   is  trai ne us in input  pr op e rtie an ou t pu l abels.  It  assist in  in vestigat ing   a n est a blishin the  rele van ce   of  t he  m od el   var ia bles th rou gh guessi ng ho w on e  v a riable  influ e nces t he othe r.   In   the  case  of  occurri ng   a bru pt  il lu m inati on   change  or   s udden   obj ect   m ot ion   al ong  vi de seq uen ce ,   we  need  to   la be the  c orrespo nd i ng  vi de f r a m es  with  a ppropr ia te   outl ie sco re.  I this   con te xt,  a   no n - li near  regressio m od el   is  em plo ye to  ac hieve  po ly no m ia fitting   process  wi th  the  ra data   of   te m po ral  fra m e s   diff e re nces  Te m pD iff.   Co ns e qu e ntly the  no rm al   beh avio ur  an the   gl ob al   outl ie rs  of  the   entire  vid e fra m es   are  est i m a te and   detect ed  r especti vely A con se qu e nc e,  global  ou tl ie rs  are  detect ed  by   le ver a gi ng   f r om  the  resi dual   er rors  wh ic s uf fici ently   descri bed   data  de viati on   from   the  fitt ed  po ly no m ia cur ve.  H ence ,   pr e dicti ng   th set   of   pote ntia values  of  po ly no m ial  coef f ic ie nts  will   info rm   us   of   how  ap pro pr ia te ly   our   current  m od el   is  able  to  des cribe  the  ra da ta   beh avi our.   The  m ai idea   of   ad opti ng   regressio m od el   for   global  ou tl ie detect ion  in  t he   w ho le   vi deo  fr am es  is  ba s ed  on  the   ass um ption   that  t he  te m po ral  fra m es  diff e re nces  ca be  represe nted  by  no n - li ne ar  po ly nom ia m od el The  ou tl ie r are  th os e   tem po ral  dif f eren c e   instants  that  ar no well   re presente by  th regressio m od el In   t his  le vel,  the  s udde or  ab rupt  ch ang e s   al ong  vi de f ra m es  are  detect ed  w hich   co rr e sp on de to  the   diff e re nces  sa m ples  that  far   su f fici ently   fro m   the   interva [ p+2∆ p - 2∆ ] wh e re   p   re pr ese nts  t he  po ly nom ia l   coe ff ic ie nts   a nd    ref e rs  t the  resi dual   er ror.   I this case, t he fr a m es ly ing  out  of this  range a r e label le as  g l ob al   outl ie f ra m es as sho wn in F i gure   4.    Hen ce f or th ,   th pr op os e fr a m ewo r of  gl ob al   ou tl ie de te ct ion   ta sk   is  designed  as  a   reg res sio m od el   fitting wh ic co ns ide rs  certai segm ent  of   the  vid eo  has  a bnor m al   beh avio ur  based   on  re gressi on   pr e dicti on  sco r instea of  a doptin a   pre de fine th res ho l for  detect ing  ano m al y.  Wh e the re  a re  a nom al changes the  ano m al scor e   ascents  si gn i ficantl y.  It  w or t noti ng  t ha the  detect e global  outl ie rs  are   exp l oited  to  autom at ic ally  s egm ent  vid eo  fr am es  into  prim i ti ve  sh ots  or   cl ips,  ye to  find   an local iz the  local   ou tl ie rs  within  eac cl ip.  Nei ghbo ur   fr am es  of   the   detect ed  glob al   ou tl ie fr am es  are  extracte an form ulate into  disti ng uish i ng  re gions  a nd yet   add e to  t he   m e m or bu ffer  to  c ollec the  ou tl ie reg i ons  al ong  vid e sam ple.  Fig ure   s how the  detect ed  global  outl ie rs  con stric te by   the  pr im itive  sh ots  bounda ri es  of   vid e sam ples 0 4,  06 take n from   AV EN U   da ta set .           Figure  4. Gl obal  o utli er  detec ti on   base d on poly no m ia l fit tin g st rategy  of  vid e sam ple (04)  from   AV E NU           (a)   (b)     Figure  5.  Dete ct ion   of cli ps   boun dar ie of:  (a ) vide sam ple 04, ( b)   vid e o sam ple 0 f r om   AV ENU   da ta set   X - a xis  represe nts fram es ind e xes;  Y -   a xis  de no te s  the tem po ral  dif fer e nce s scores     Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   2 4 , N o.   2 N ove m ber   20 21 106 3   -   107 3   1068   3.2.      L oca outli ers detec tio n   L o c a l   o u t l i e r s   c a n   b e   d e f i n e d   a s   t h e   p a t t e r n s   t h a t   p r om i n e n t   f r o m   t h e i r   n e i g h b o u r h o o d   i n   a   s p e c i f i c   d a t a   r e g i o n   [ 2 4 ] .   In   t h i s   s e c t i o n ,   w e   w i l l   e x p l a i n   h o w   t o   d e t e c t   t he   l o c a l   o u t l i e r s   i n   t h e   a c q u i r e v i d e o   s a m p l e   b a s e d   o n   c l i p s   d e n s i t y .   T h e   v i d e o   f r a m e s   a r e   s e gm e n t e d   a ut om a t i c a l l y   i n t o   n o n - o v e r l a p p e d   K   c l i p s   o r   s h o t s   b a s e d   o n   t h e   g l o b a l   o u t l i e r   d e t e c t i o n   p r o c e s s   i l l u s t r a t e d   i n   t h e   p r e v i o u s   s e c t i o n .   W e   c o p e   w i t h   e a c h   s e gm e nt e d   c l i p   a s   c l u s t e r   w i t h   v a r i a b l e   s i z e   S   a n d   a s s um e d   t h e   a v e r a g e   s c o r e   o f   t e m p o r a l   f r a m e   d i f f e r e n c e   o f   e a c h   c l u s t e r   i s   t he   c e n t r e   Co m   o f   c l u s t e r   C m .   A f t e r w a r d ,   t h e   d e n s i t y   o f   e a c h   c l u s t e r   i s   d e t e r m i n e d   b a s e d   o n   t h e   m e a n   d i s t a nc e   Md   b e n c hm a r k   b e t w e e n   e a c h   s a m p l e   x j   b e l o n g s   t o   m th   c l u s t e r   a nd   i t s   c e n t r o i d   Co m   a c c o r d i n g   t ( 4 ) :      ( ) = 1   (4)     wh e re  m = 1,   . K an K   is  t he  nu m ber   of   the  detect ed   cl ips  or  cl us te rs Ba se on  t he  m ean  dista nce  Md   m entioned   i ( 4),  lower   value  of  Md   re fers  to  pr ese nt  dense  cl us te wh il higher  value  of  Md   i ndic at es  that  the  cl us te r   is  scat te red   or   sp a rse.   Since   the  Md   value   is  inv ersely   relat ed  with  the   cl us te densi ty the   densi ty   DS   of t he  cl ust er  C m   i s ide ntifie t o be the  in ver se   of  Md   ( C m )  as  il lustrate in   (5) :      ( ) = 1  ( )   (5)     Accor ding  to  c luster  de ns it def i niti on t he  cl us te with  hi gh e de ns it le ads  to  be  it da ta   el e m ent s   are  cl os e t it centr oid.  In  con t rast,  lo w - de ns it cl us te rs   te nd  to  ha ve  data  el em ents  on  ave ra ge  f ar   from   cl us te ce ntre.   Re gards  to   loc al   ou tl ie r’s  d et ect ion   ta s k,   w ha ve  sel ect e the   hi gh e de ns it cl us te rs   w hich  include d   den se   ou tl ie rs  an re pr ese nt ed   ca nd i date  an om a ly   even with  r espect  to  the  w ho le   vi de seq uen c e   as  sh ow in  Figure   6.  The  c orrespo nd i ng  f ra m es  of   this  ty pe  of   cl us te r ar la belle as  ano m al even fr am es.  The  sel ect ion   be nch m ark   is  ba sed  m ai nly  on   pr e def i ned   th reshold  t ta ke   decisi on   a bout  lowe an hi gh e r   densi ty   cl us te r ta king  i our   co ns ide rati on  it m ean  va lue .   Furthe r,   t he  c entr oid   Co   of  lowe de ns it cl us te r;  i .e  ( DS   0)   is  consi der e t be  sin gula outl ie within  cl ust er  or  cl ip  a nd  the  co rr es po nding   fr am is  la belle as an om al y fr am e as il lustrate in  Fig ure   6.             Figure  6 Dem on st rati on r es ul ts of   si ngular   and colle ct ive  ano m al ie s f ra m es captur e d f ro m  v ide sam ple (0 4)   from   AV E NU       4.   RES ULT S   AND  DI SCUSSION     In   t his  sect io n,  detai le descri ption   of  c omm on   even det ect ion   dataset ad op te in   ou ex pe rim ents  is  pr ese nte as   well   pe rfor m ance  e valuati on   m e tric of   a no m al detect ion   sco re  are   com pu te a nd  sim ulate gr a phic al ly Two   m ai publi dataset   are  e m plo ye in  ou ex per im ents  to  eval uate  the   perform ance  of   t he  pro po se a no m al detect ion   ta sk  in  vid e se qu e nce I the   trai ni ng  m od e,  vi deo  sam ples  with  norm al   beh a viou are  dep l oyed  in  ou exp e rim ents  i orde to  est im at the  reg re ssion   m od el   coef fici ents.  T he  t est ing  m od is  sta nd i ng  to  validat t he  occurri ng  of  outl ie r’ s   sco r es  in  the   acq ui red   vi deo   sam ple.  Fi gure  presents   so m fr am es  e xam ples  of   no rm al   and   anom al beh avio ur  ta ke from   UCSD   [ 31 ]   an ave nu  [ 26 ]   dataset s   resp ect ively Av e nue  datase [2 6]  co ns is ts   of   16   trai ning   vid e os   an 21  te sti ng   vid e o.   Eac vi deo  sa m ple  ta kes  a s hort i nt erv al , a rou nd (1 - 2) m inu te s wi th f ram e reso l ution 6 40×3 60  pix el s.     4.1.     UCSD  d atase ts  ( Ped 1 and Ped 2)   The  UC SD   dat aset   [31]  com po ses   of   vid e s a m ples  of   pedest rian  wal kw a ys.  The  cr owd   den sit in   the  wal kw ay was  var ia ble r ang i ng   from   sp arse  t ver c rowded I the   norm al   set t ing the   vi deo   c on ta in s   on ly   pe destria ns Abn or m al  even ts  a re  due  to  ei the r:  the  ci rcu la ti on   of   non - pe des tria entit ie in  th e   walk ways  an ano m al ou pe de stria m otion   patte rn s Peds1  dataset   co nta ins  34  trai ning   vid eo  sam ples  an 36   te sti ng  vide sam ples  with  res olu ti on   of   238× 158  pix el s.  Peds2  dataset   co ntains  16   t rainin vide sam ples  and   12  te sti ng   vid e sam p le with  reso l utio of  360× 240  pix el s.  All  te sti ng   s a m ples  are  ass ociat ed   with  m anu al ly - colle ct ed  fr a m e - le vel  ground   tr uth   rele va nt  to  abno rm al  even ts  an nota ti on Fig ure   sh ow s   fr am es exam pl es of  norm al  a nd anom al y events take n fro m  A ven u an d UCSD  d at aset s .   Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       An omaly eve nt d et ect io n and l oca li za ti on  of  vi deo  cli ps   us i ng  … ( Sawsen   Ab du l hadi M ahm ood )   1069     (a)       (b)     Figure  7. Exa m ples o no rm al  an d an om al fr am es in; (a ) UCSD   - Ped2  da ta set , ( b)  A ve nu e  d at aset ,     the anom al y regions a re  dem on strat ed  b re d rect an gle       4.2.     Im plem e nt ati on  d e t ails   The  vi deo   fr a m es  are  extra ct ed  an resiz ed  into  reso l ut ion   ( 320× 200)   pix el s,  the c onve rt  each  fr am into  YC bCr  c olor  m odel   to  ex plo it   t he   lum inance  c om po ne nt  Y   i the  im ple m entat ion   f ram ewo r k.   I n   order  to  est im a te   the  an om al sco re  f or  c urr ent  f ram F i w a dopt  Ha us do rff  distanc m easur as  well   as  m ot ion   fe at ur e betwee t he  two  se quence   fr am es  ( F i F i - 1 ).   T he n,   th an om aly  scor is   est i m at ed  bas ed  on  integrati ng  the se  two  feat ur e by  us in li ne ar  ( 3) T he  e sti m at ed  ano m aly  scor es  value are  norm al ized   int [0,  10 ]   inter va to  facil ity  the  com pu ta ti on   pr oce ss.   T he  norm al iz a ti on   te chn iq ue  ad opte in  this  w ork  ha s   been  pe rfor m ed  acc ordin to   the  f ollow i ng  e qu at io n:    x n ( x - x m )/ std ,   w here  x n   re pr ese nts  the  norm al iz ed  data  po i nt,  x m   an d   st d   are  t he  m ean  and   sta ndar de viati on   of   al data  points  res pecti vely The   validat io w orkf l ow   of   the  pro pose an om al ev ent  detect io in  vi deo   is  c om po sed  of  tw m ai ph ases trai nin a nd  te sti ng  m od el s as ill us trat ed  in  the  f ollow in sub sect ion s .     4.3.     Tr aining   m odel   We  purs ue  to   determ ine  anom al ie in  give vid e se que nce  with  lo we r   com pu ta ti on  tim as  well   as  sp eci fyi ng  the  re qu i red   false  al arm   rate.  Sign i ficantl y,  the  pro pose ano m al detect i on   a ppr oach   a s su m es  that  any  ano m a lou patte r w ou l hold  f or   a obscu re  pe riod  o tim e.  Mean w hile,  we  ha ve  no  pr e - kn owle dge   about  the   an om al even in  t he  vid e se qu e nce.  T hus,   the trainin m od i desire t a ddress   an desc r ibe  the  norm al   beh avi our  of  the  fr a m sequ e nces.   The  t rainin m od is  config ur e by  sel ect ing  the  vid e os   sam ples   V { vi i =1,   2,  ....,   M with   norm al   beh avi our  to   pe rfo rm   the  fitt in pr ocess  with  a   prede fine regr ession  m od el   with  4 th   po ly nom ia l   e qu at io ha vi ng  four   coe ff ic ie nts  ( b0,  b1,  b2 b3 an one  tem po ral  dif fe ren ce   scor (in dep e ndent   var ia ble ).   The  te m po ral  fr am es  diff er ences  Te mpDiff   f or   eac vi de sam ple  hav e   been  com pu te d.   Co ns e qu e ntly we   app li ed  the  po ly no m ial  fitting   m od el   up on  the  diff e re nces   values  to  extr act   the  su it able  c oeffici ents  an resi du al   er rors  of  the  re gressi on  m od e l.  In  this  con te xt,  t he  glo bal  outl ie rs  de no t e   tem po ral  diff e r ences i ns ta nts t hat are  not  well  r ep rese nted b y t he  est im a te re gr essi on m od el .     4.4.     Te s ting  m od el   An ne ra data  of   dif fer e nt  values  obta ined  from   the  t e m po ral  di ff e r entia ph ase  a r fitt e with  the  trai ne re gressi on  m od el   to  detect   the  outl ie in   the  ra data.  The   poly no m ia reg r ession  m od el   f it a   curve  li ne   to   th te m po ral  dif f eren ces   da ta   as   il lustrate i F igure  8.   Global   outl ie rs  are   de te ct ed  base on  the   assum ption   tha ou tl ie rs  a re   f ar  aw ay   from   the  fitt ed  m odel   and  ha ve  a   higher   resi du al   error  tha t he   oth e data  sam ples.  The  co rr es pondin fr am es  of   this  ty pe  of   an om alies  are  la belle as  ano m a ly   fr a m e.   Fu rth er,  th e   local   ou tl ie rs  of  the  vid e sa m ple   hav bee detect ed  at   cl ip  le vel  based  on   de ns it cl us te ring   strat e gy Th e   corres pondin fr am es  of   t his  ty pe  of  cl us te r are  la belle as  an om al fr am even t.  The   sel ect ion   ben c hm ark   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   2 4 , N o.   2 N ove m ber   20 21 106 3   -   107 3   1070   is  base m ai nl on   a   prede fin ed  th res ho l to   ta ke  decisi on  a bout  lo wer  and  hi gh e densi ty   cl us te rs  ta king  i our  c onside rati on it s m ean  as the cen t re  of ea ch  cl ust er.             Figure  8. Vis ua li zat ion  r es ults o the  pr opose a no m al y event d et ect io n m et ho d.  (a )   ra r ep rese nts tem po ral  fr am es d iffe rence s,  (b)   ra w re pr ese nts t he glob al   outl ie det ect ion (c)   ra w dem on strat es t he fit ti ng   proce ss  with  regressio n m od el ( d)   ra w descri bed th e local  outl ie r dete ct ion,  (e )   r aw rep rese nts the  e xtracted  anom aly  reg i on s  or   cl ust ers,  last  r a w st at es the  den sit y of eac h cl us t er  DS       4.5.     Per fo r m an ce  m etrics   In   our  e xperim ents,  the   qua ntit at ive  resu lt s - base d   pe rfo rm ance  e valuati on  ha be en  c on du ct e us in receiver  oper at ing   cha racter ist ic   (ROC)  cu rv a nd  co rr es pondin area   unde the  c urve   (AUC)  m et ric s.  I this  w ork,  the   ano m al even t   is  detect e ba sed  on  a   cl ip  ( even t le vel   a nd  f ram le vel.  Co ns e quently we   record   the   be gi an e nd  of  each  a no m al even with   ass ist ance  of  gro und  t ru t re su l ts  pro vid e for   each  te sti ng   vid e i orde to  co nst ru ct   su it abl groun trut h - cl ip  le vel  res ults  for  validat ion   an c om par iso n   pur po ses . To   obta in ROC cur ve  dem on strat i on   for  the test ed  vid e sam ples, tru e posit ive  rate (TPR)  a nd f al se   po sit ive  rate  ( FPR)  m et rics  are  cal culat ed  at   cl i le vel.   AU area  m eas ur es  a re  com pu te f or   eac vid e in   bo t dataset s,  t hen   we  a ver a ge   the  obta ined  resu lt to  s how   the  AU for  each  dataset   c om par ed  wit recent   m et ho ds   t hat  ba sed  on  neural  netw orks  s uch   as  [25]  an [ 2 7 ] Table  e xh i bits  the  co rr ect   detect ion   sc ore  and  false  al arm   ben chm ark   f or  A venu,   Ped1  a nd  Pe d2   dataset res pecti vely Fig ure   il lustr at es  the  ROC  curves   qu a ntit at ive r es ults f or Ave nu,  Ped2 a nd Pe d1  dataset s r es pe ct ively .       Table  1.   c om par ison   resu l ts of eve nt le ve l detec ti on in  t erm  o co rr ect   detect ion an d f al se ala rm  r at e   Metho d   Co rr ect detectio n f alse alar m   Av en u     Ped 1   Ped 2   An o m a ly  even ts   47     40   12   M.  H asan   et al .   [ 2 5 ]   4 5 /4     3 8 /6   1 2 /1   S.  Yan   et  al .   [ 2 7 ]   3 4 /6     3 8 /5   1 2 /0   Y.  S.  Ch o n g   an d   Tay   [ 2 8 ]   4 3 /8     3 6 /1 1   1 2 /3   The p rop o sed  work   4 5 /3     3 8 /4   1 2 /1   Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       An omaly eve nt d et ect io n and l oca li za ti on  of  vi deo  cli ps   us i ng  … ( Sawsen   Ab du l hadi M ahm ood )   1071   c omm on ly the  highe va lues  of  the  AU C   area   val ue  ref e rr e t highe perfor m ance  of  t he  detect or  or  cl a ssifie m et ho d.  As  s how i F igure  8,   t he  pr opos e m et ho pr e sents  a   hi gher  A UC  value   w he app li ed   on  ave nu e   dataset   t ha Pe d1  a nd  P ed2.  T he  c r ow ded  sce nes  i nc lud e i vid e sam ples  are  e ff ect s   m ai nly of  inc re asi ng   false al ar m  r at es as sh own  in Fi g ure   10. Fr om  o ther han d, we  g et  c om petit ive r esults a nd   higher  pe rfor m ance  f or  a venu   an Pe d2  data set w hen   com par e with  the   pro posed  ap proach  to  sta te   of  the   art m et ho ds  as   il lustrate in  T able 2.           Figure  9. Roc  curves  vis ualiz at ion   resu lt of the  pro po se d work at  cli le vel for   ave nue ,  Ped2 a nd Pe d1  dataset s             Figure  10. T w e xam ples o f fai lure  c ases  of the  pro po se a no m al y detec tor       Table  2.   c om par ison   resu l ts of f ram e level  d et ect ion i n t erm  o A UC  m et ric   Metho d   AUC ( %)   Av en u     Ped 1   Ped 2   G.  Pan g   et al .   [ 1 2 ]   -     8 3 .2   7 1 .7   M.  H asan   et al .   [ 2 5 ]   7 5 .2     90   8 1 .5   Lu  et al.   [ 2 6 ]   6 5 .5     -   6 3 .8   S.  Yan   et  al.   [ 2 7 ]   7 9 .6     7 1 .9   7 5 .0   The p rop o sed   wo rk   83     76   82       Fr om   the  e xp e rim ents,  we  f ound  t hat  the   cl us te with  de nsi ty   cl os to  ze ro  val ue  is  c on sidere as   a   singular   an oma ly   fr am (sudd e cha nge),   w hile  the   cl us te rs   with   hig he de ns it r epr ese nt  a a no m al y   colle ct ive  f ram e   in  te rm   of   a nom aly  even de te ct ion   in   the   a cqu i red  vi deo  s a m ple.  F ur the r the   area   pa ra m et er   us e f or   fore gro und  obj ect extracti on  is  m or accurate   and   ref le ct a ef fici ent  crit erio of  the  se qu e nce   fr am es  beh a vi our  c om par ed   to  the  sim ilarity   distance   m easur bet ween  each   tw se qu e nce fr am es.   Fu rt her m or e,  t he  pr opos e a no m al even detect ion   sc he m is  validat ed  ba sed  on  th avail able  da ta set   without  need i ng  to  perform   an  a ug m entat ion   of  the  dataset in  co ntra st  to  dee le a rn i ng - an om al eve nt   detect ion - b a se d   m et ho ds w hi ch req uire a l arg e  d at aset  t o l earn  t he  a no m al y beh a viours.     Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   2 4 , N o.   2 N ove m ber   20 21 106 3   -   107 3   1072   4   CONCL US I O N     We  ha ve  sug ge ste an pres ented  a an oma ly   even detect ion   an loca li zat ion   schem based   on   determ ining   th global  an local   outl ie rs  in  vi deo   se que nce.  T he  prob l e m   of   global  ou tl ie detect ion   was   assum ed  as  re gr essi on  m od e fitt ing   in   ord er  to   segm ent  the   vi deo  f ram es  into   no overlap ping  cl ips T he   pro po se m odel   is  able  to  up date  the  trai ne re gr es sio m od el   us ing   ne wly  detect ed  ano m al clips .   The  global  outl ie rs   are  ex plo it ed   to  segm ent  the  vid e f ram es  into  cl ips.  Furt her m or e,  t he  local   outl ie rs  at   eac cl ip  are  detect ed  us in de ns i ty   of   each  cl ip  ta kin in  our  consi der at io the  co ntextual  ou tl ie rs  withi each  vid e cl ip.  Ba sed  on  the  e xperim ents  that  i m ple m ented  on   public  an om aly  even de te ct ion   datas et we  exh i bited  that  the  pro posed  a no m al detecto si gn i ficantl has  com petit ive  per f or m ance  com par e to  the   sta te - of - the - art  m e tho ds i n t er m s o detect io acc ur acy  a nd  f al se ala rm  r at es at cl ip level.       ACKN OWLE DGE MENTS   This  re searc was  par ti al ly   su pp or te by  com pu te sci e nce  dep a rtm ent - colle ge  of  e du c at io i Mustansiriy ah   Un i ver sit y.       REFERE NCE S     [1]   G.  Pang,   C.   Shen,   L .   Cao,   and   A.  Van  Den  Henge l " De ep  le arn ing  for  ano m aly   de tecti on :   rev ie w ,"   ACM  Computing  Surv ey s vo l. 54,   no.   2,   pp .   1 - 38 ,   Mar .   2021 ,   doi:  10. 11 45/3439950 .   [2]   K.  Yan,   X.  You,  X.  Ji,  G.  Yin ,   and  F.  Yang,   "A   hy br id  outlier   det ection  m et h od  for  hea lt c a re  big  data, 20 16   IEE E   Inte rnat io nal  Confe r enc es  on  Bi g   Data  and   Cloud  Computi ng  ( BDCloud) ,   Soci al  Comput ing   and  Ne tworki ng   ( Soci alCom) ,   Sustainabl e   Computing  and   Comm unic ati ons   ( SustainCom )   ( BDCl oud - Soci alCom - SustainCom) ,   Oct.   2016,   pp .   157 - 1 62,   doi 10 . 1109 /BDCloud - SocialCom - Sus ta inCom . 2016. 34 .   [3]   Y.  W ang,   Z .   W u ,   Y.  Zhu ,   and  P.  Zha ng,   "Resea r c on  anomal y   d e te c ti on  al gori th m   base on  general i za t ion  l at en c y   of  te lecom m unic ation  net work, "   Fut ure  Gene ration  Computer  Syste ms ,   vol.   85,   pp.   9 - 18,   Aug.  2018   doi:   10.10 16 / j . f uture. 2018. 02. 022 .   [4]   W .   L i ,   V .   M a h a d e v a n ,   a n d   N .   V a s c o n c e l o s ,   " A n o m a l y   D e t e c t i o n   a n d   L o c a l i z a t i o n   i n   C r o w d e d   S c e n e s , "   i n   I E E E   T r a n s a c t i o n s   o n   P a t t e r n   A n a l y s i s   a n d   M a c h i n e   I n t e l l i g e n c e ,   v o l .   3 6 ,   n o .   1 ,   p p .   1 8 - 3 2 ,   J a n .   2 0 1 4 ,     d o i :   1 0 . 1 1 0 9 / T P A M I . 2 0 1 3 . 1 1 1 .   [5]   Y.  Cong,   J.  Yu an ,   and   J.  L iu,   "S par se  rec onstr uct ion  cost  for  abnor m al   ev ent  det e ct ion , CV PR   2011 2011,     pp.   3449 - 3456 ,   doi:   10 . 1109/CV PR . 2011. 599543 4.   [6]   T.   Xiao ,   C.   Zh a ng ,   and  H.  Zh a,  "Le arn ing  to  de te c anomalies  i surveil la n ce   v i deo, in  IE EE   S ignal   Proce ss in g   Lett ers ,   vo l. 22,  no.   9 ,   pp .   1477 - 1481,   Sept .   2015 ,   doi 10 . 1109/LS P.2015. 2410031 .   [7]   L.   Krat and  K.   Nishino,   "A nom aly   de tecti on  i ext remel y   cro wded  sce nes  using  sp atio - te m po ral   m oti on  patte rn  m odel s,"  2009  IEE Confe r enc on  Computer  Vi sion  and  Pat te rn  Re c ognit ion 2009 ,   pp.   1446 - 1453,     doi:   10 . 1109/CV PR . 2009. 520677 1 .   [8]   V.  Sali gr ama,  J.   Konrad ,   and   P.   Jodoin,   "V id eo   Anom aly   Ide n tification, "   in  IEEE  Signa Proc essing  M agazine   vol.   27 ,   no .   5 ,   pp .   18 - 33 ,   Sept .   20 10,   doi 10 . 1109 /MS P.2010. 937393 .   [9]   K.  Min  and  J.  Corso,  "TAS ED - Net:   Te m pora l l y - agg reg a ti ng  spatial  rnc oder - d ec oder   ne twork  for  vide salie n c y   det e ct ion , 201 IEEE/CVF  I nte rnational   Co nfe renc on   C omputer  Vi sion   ( ICCV) ,   2019,   pp.   2394 - 240 3,     doi:   10 . 1109/IC CV.2019. 00248 .   [10]   L.   W ang   et  al. ,   " Te m pora segm e nt  net works :   tow ard good  pra ct i ce for  d ee p   acti on  rec ogn it ion , 2016  European   Confe renc on   C omputer  Vi sion   ( ECCV ) ,   vol .   991 2 2016 pp .   20 - 36 doi :   10 . 1007 /978 - 3 - 319 - 4648 4 - 8_2 .   [11]   Y.  Zhu  and  S.   News am,  "M o ti on - awa r fe at u re  for  improve vide anomal y   de tecti on , arXiv :1907 . 10211   pp.   1 - 12 ,   2019 .     [12]   G.  Pang,   C.   Yan,   C.   Shen,   A.  Van ,   Den  Henge l ,   and  X.  Bai ,   "S e lf - t ra ine d e ep  o rdina r egr ession  for  e nd - to - e nd  v ide a nom aly   d et e ct ion , 2020  IEE E/ C VF   Co nfe renc on  Computer  Vi sion  and  Pat te rn  Rec ognit ion  ( CVP R ) ,   2020,   pp .   12170 - 12179,   do i 10 . 1109/CVPR 42600. 2020. 01219 .   [13]   G.  Pang,   C .   She and  A.  V an  D en  Henge l,   "D e e anomal y   d et e c ti on  with   deviation  net works , 2 020  Proceedi ngs  of  the  25th   ACM   SIGKD Inte rnational   Con fe re nce   on   Knowle d ge  Discov ery   &   Data  Mini ng 20 20 pp.   353 - 362 ,     doi:   10 . 1145/32 92500. 3330871 .   [14]   F.  La nd i, C. G.   Snoek ,   and   R.   C ucc hi ara,  "A nom aly   loc a li t y   in   vi deo  survei ll an ce, arXiv :1901 . 10 364 ,   2019 .     [15]   W .   Sulta ni,   C.   Chen ,   and  M.  Shah,   "Rea l - wo rld  anomal y   d etec t ion  in  survei ll an ce   vide os , 2018  IEE E/ C VF   Confe renc on   C omputer  Vi sion   and  Pattern  R ecogniti on,   2018 ,   pp.   6479 - 6488 ,   doi:   10 . 1109/CV PR . 2018. 00678 .   [ 1 6 ]   F .   J i a n g ,   J .   Y u a n ,   F .   J i a n g ,   J .   Y u a n ,   S .   A .   T s a f t a r i s ,   a n d   A .   K .   K a t s a g g e l o s ,   " A n o m a l o u s   v i d e o   e v e n t   d e t e c t i o n   u s i n g   s p a t i o t e m p o r a l   c o n t e x t , "   C o m p u t e r   V i s i o n   a n d   I m a g e   U n d e r s t a n d i n g ,   v o l .   1 1 5 ,   p p .   3 2 3 - 3 3 3 ,   2 0 1 1 ,     d o i :   1 0 . 1 0 1 6 / j . c v i u . 2 0 1 0 . 1 0 . 0 0 8 .   [17]   Ce  Li,   Z.  H an,  Qixi ang   Ye,  a nd  J.   Jiao ,   "V isual   abnor m al  beha vior   d et e ct i on  base d   on   tr aj e ct or y   sparse   rec onstruc ti on   a naly s is,"   Neuro c omputing ,   vo l. 1 19,   pp .   94 - 100 ,   2013 ,   doi 10 . 10 16/j . n euc om . 201 2. 03. 040 .   [ 1 8 ]   M .   G .   N a r a s i m h a n   a n d   S .   K a m a t h ,   " D yn a m i c   v i d e o   a n o m a l y   d e t e c t i o n   a n d   l o c a l i z a t i o n   u s i n g   s p a r s e   d e n o i s i n g   a u t o e n c o d e r s , M u l t i m e d i a   T o o l s   A p p l . ,   v o l .   7 7 ,   n o .   1 1 ,   p p .   1 3 1 7 3 - 1 3 1 9 5 ,   J u n .   2 0 1 8 ,   d o i :   1 0 . 1 0 0 7 / s 1 1 0 4 2 - 0 1 7 - 4 9 4 0 - 2.   Evaluation Warning : The document was created with Spire.PDF for Python.