I nd o ne s ia n J o urna l o f   E lect rica l En g ineering   a nd   Co m p u t er   Science   Vo l.   11 ,   No .   3 Sep tem b er   201 8 ,   p p .   1 1 6 2 ~ 1 1 6 7   I SS N:  2502 - 4752 DOI : 1 0 . 1 1 5 9 1 / i j ee cs . v 1 1 . i3 . p p 1 1 6 2 - 1 1 6 7          1162       J o ur na l ho m ep a g e h ttp : //ia e s co r e. co m/jo u r n a ls /in d ex . p h p / ijeec s     Identi ficatio n of   Ra infall Pat terns  o n H y dro lo g ica l Si m ula tion   Using  Robus Pri ncipa l Co m po nen Ana ly sis       S.M .   Sh a ha rudin 1 N.   Ah m a d 2 ,   N. H .   Z a in ud d in 3 ,   N. S.  M o ha m ed 4   1, 3 De p a rtm e n o f   M a th e m a ti c s,  F a c u lt y   o f   S c ien c e   a n d   M a th e m a ti c s ,   Un iv e rsiti   P e n d id ik a n   S u l tan   I d r is M a lay sia   2 De p a rtme n o f   M a th e m a ti c s,  F a c u lt y   o f   S c ien c e ,   Un iv e rsiti   T e k n o lo g M a lay si a ,   M a la y sia   4 T e c h n ica F o u n d a ti o n ,   M a lay si a n   In sti tu te  o f   In d u str ial  T e c h n o lo g y ,   Un iv e rsiti   Ku a la L u m p u r M a la y sia       Art icle  I nfo     AB ST RAC T     A r ticle  his to r y:   R ec eiv ed   A p r   8 ,   2 0 1 8   R ev i s ed   J u n   9 ,   2 0 1 8   A cc ep ted   J u n   2 3 ,   2 0 1 8       A   ro b u st  d im e n sio n   re d u c ti o n   m e th o d   i n   P ri n c ip a Co m p o n e n A n a l y si s   (P CA w a u se d   to   re c ti fy   th e   iss u e   o f   u n b a lan c e d   c lu ste rs  i n   ra in f a ll   p a tt e rn d u e   to   t h e   sk e w e d   n a tu re   o ra i n f a ll   d a ta.  A   ro b u st  m e a su re   in   P CA   u sin g   T u k e y ’s  b iw e i g h c o rre latio n   to   d o w n we ig h   o b se rv a ti o n w a in tro d u c e d   a n d   th e   o p ti m u m   b re a k d o w n   p o in t o   e x trac th e   n u m b e o f   c o m p o n e n ts  in   P CA  u sin g   th is  a p p ro a c h   is  p ro p o se d .   A   se o f   si m u late d   d a ta  m a tri x   th a t   m i m i c k e d   th e   re a d a ta  se wa u se d   to   d e term in e   a n   a p p ro p riate   b re a k d o w n   poi n f o ro b u st  P CA   a n d   c o m p a re   th e   p e rf o r m a n c e   o f   th e   b o th   a p p r o a c h e s.  T h e   si m u late d   d a ta  in d ica ted   a   b re a k d o w n   p o in o f   7 0 %   c u m u lativ e   p e rc e n tag e   o f   v a rian c e   g a v e   a   g o o d   b a lan c e   in   e x trac ti n g   th e   n u m b e o f   c o m p o n e n ts .   T h e   re su lt sh o w e d   a   m o re   sig n i f ica n a n d   su b sta n ti a im p ro v e m e n w it h   th e   r o b u st P C A   th a n   th e   P CA   b a se d   P e a rso n   c o rre latio n   in   term s o f   th e   a v e ra g e   n u m b e o f   c l u ste rs o b tai n e d   a n d   i ts  c lu ste q u a li ty .   K ey w o r d s :   B r ea k d o w n   p o in t   C lu s ter   an al y s is   P r in cip al  co m p o n e n t a n al y s is   Si m u latio n   T u k e y s   b i w ei g h t c o r r elatio n   Co p y rig h ©   2 0 1 8   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e   Al rig h ts  re se rv e d .   C o r r e s p o nd ing   A uth o r :   S.M .   Sh a h ar u d i n   Dep ar t m en t o f   Ma th e m at ics,  F ac u lt y   o f   Scie n ce   an d   Ma t h e m atics,    Un i v er s iti P en d id ik a n   S u lta n   I d r is ,     3 5 9 0 0   T an j u n g   Ma li m ,   P er ak ,   Ma la y s ia.   E m ail:  s h az l y n @ f s m t.u p s i.e d u . m y       1.   I NT RO D UCT I O N     T h id en tif icatio n   o f   s p atial   to r r en tial  r ain f a ll  p atter n   i s   an   es s en t ial  tas k   f o r   h y d r o lo g is o r   cli m ato lo g is to   class i f y   h y d r o lo g ic  ev en t s   in   o r d er   to   s im p lify   h y d r o lo g ic  co n v o lu tio n .   Fo r   s u ch   p u r p o s es,  m ea s u r e m e n t s   o f   r ain f all  a m o u n f o r   ti m s er ie s   r e co r d s   o b s er v ed   at  s ev er al  r ain   g au g s tatio n s   h ad   lo n g   r ec o r d   o f   d ata  ar e   ex a m i n ed .   T h u s ,   id en ti f y in g   r ain f all  p att er n s   ca n   b d if f icu lt  i n   s u ch   h i g h   d i m en s io n al  d ata  s et  as  it  m a y   co n tai n   h ig h   d eg r ee   o f   ir r elev an an d   r ed u n d an in f o r m a tio n   w h ich   m a y   s i g n i f ica n tl y   d eg r ad e   th p er f o r m a n ce   o f   f u r t h er   an a l y s i s .     C lu s ter i n g   tech n iq u es  p r ec ed ed   b y   p r in cip al  co m p o n en an al y s is   ( P C A )   ar o f ten   co m b in ed   to   id en ti f y   k e y   s p atial  p atter n s   i n   t h d ata  b y   r ed u ci n g   t h n u m b er   o f   v ar iab les  f o r   clu s te r in g   ca s es   [ 1 ] - [ 3 ] .     A   t y p ica ap p r o ac h   in   P C A   r eq u ir es  th u s o f   co n f i g u r atio n   p o in ts   o f   en ti ties   b et w ee n   t h r o w s   an d   co lu m n   o f   t h d ata  b ased   o n   P ea r s o n   co r r elatio n   m atr i x .   P ea r s o n   c o r r elatio n   is   co m m o n l y   u s ed   in   t h d er iv a tio n   o f     T - m o d co r r elatio n   to   m ea s u r s i m ilar it y   b et w ee n   th d ail y   r ai n f all  esp ec iall y   in   co u n tr ies  th at  e x p er ien ce   f o u r   s ea s o n s   [ 4 ] - [ 6 ] .   P ea r s o n   co r r elatio n   m atr i x   is   ca lcu la ted   b y   f i n d in g   t h co v ar ian c o f   v ar iab les  an d   d iv id in g   it  b y   t h s q u ar r o o o f   th p r o d u ct  o f   th e   v ar ia n ce s .   Ho w e v er ,   P C A   b as ed   P ea r s o n   co r r elatio n   m atr i x   m a y   n o b s u itab le  f o r   all  ty p e s   o f   r ain f all  d ata,   p ar ticu lar l y   i n   t h tr o p ical  r eg io n .   Mo r p r ec is ely ,     th d ata  ar i n h er en tl y   s k e w e d ,   u s u all y   to   t h r ig h t,  a s   s u c h   d ata  o n l y   ta k p o s it iv v al u es  a n d   te n d   to   b e   s k e w ed   to w ar d s   h i g h er   v al u es.  I n   s e v er el y   s k e w ed   d is tr i b u tio n s ,   P ea r s o n   co r r elatio n   g r ad u all y   lo s e s   its   ad v an ta g es  e s p ec iall y   f o r   h ig h   d i m e n s io n al  d ata  o r   lar g c o r r elatio n   m atr i x   [ 7 ] . T h u s ,   ap p ly in g   P C A   b ased   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       I d en tifi ca tio n   o R a in fa ll P a tter n s   o n   Hyd r o lo g ica S imu la tio n   Usi n g   …  ( S . M.  S h a h a r u d in )   1163   P ea r s o n   co r r elatio n   o n   r ain f a ll  d ata  esp ec ial l y   i n   P en i n s u l ar   Ma la y s ia  co u ld   a f f ec t   cl u s ter   p ar titi o n s   a n d   g en er ate  e x tr e m e l y   u n b ala n ce d   clu s ter s   i n   h i g h   d i m e n s io n al  s p ac e.   T o   o v er co m t h i s s u es  ab o v e ,   T u k e y 's  b i w ei g h co r r elatio n   m atr i x   i s   i n tr o d u ce d   f o r   th e   a n al y s i s   o f   s p atial  d is tr ib u tio n   to r r en tial  r ain f all   p atter n s ,   as  an   alter n a ti v o f   th P ea r s o n   co r r elatio n   m atr i x .   P C A   b ased   T u k e y s   b i w ei g h co r r elatio n   s h o w s   d if f er en t iati n g   p atter n s   o n   t h n u m b er   o f   cl u s ter s   p r o d u ce d   at  d if f er en t   cu m u lat iv e   p er ce n ta g o f   v ar i atio n   u s ed .   I n   cli m ato lo g y   s t u d ies  p ar ticu lar l y   i n   id e n ti f y in g   r ai n f a ll  p atter n s ,     it  is   m o r r ea s o n ab le  to   o b t ain   m o r th a n   t w o   cl u s ter   p ar titi o n s   to   ex p lain   t h v ar io u s   t y p e s   o f   r ain f all   p atter n s .     T u k e y ' s   b i w ei g h t   co r r elatio n   i s   b ased   o n   T u k e y 's   b i w eig h t   f u n ct io n   th at   r elies   o n   M - e s ti m ato r s   u s ed   i n   r o b u s co r r elatio n   esti m at es.  T h is   ap p r o ac h   is   m o r r esis ta n f o r   o u tl y i n g   v al u es  as  it  ex a m i n es  ea c h   o b s er v atio n   a n d   d o w n - w ei g h ts   t h o s t h at   lie  f ar   f r o m   th ce n ter   o f   t h d ata.   An o t h e r   i m p o r tan t   p ar in   T u k e y s   b i w ei g h co r r elatio n   is   b r ea k d o w n   p o in t .   A cc o r d in g   to   t h s t u d y ,   t h b r ea k d o w n   p o in is   u s ed   i n   m ea s u r in g   t h eir   r esis ta n ce   in   o u tl y i n g   d ata  v alu e s   [ 8 ] .   Ho w ev er ,   in   P C A   b ased   T u k e y s   b i w ei g h co r r elatio n ,   th b r ea k d o w n   p o in t is  u s ed   to   d eter m i n t h b est n u m b er   o f   co m p o n e n t s   to   ex tr ac t.   I n   o r d er   to   ass es s   t h p er f o r m an ce   o f   t h P C A   b ased   T u k e y s   b i w eig h t   co r r elatio n ,   w il l u s tr ate  th e   p r o p o s ed   an d   class ical  m et h o d   o n   s ev er al  s et s   o f   s i m u l ated   d ata  m atr ices  t h at  m i m ic  t h r ea d ata.     T h ese  s i m u lated   d ata  m atr ice s   f o llo w   t h d is tr ib u tio n   o f   t h o r i g in al   to r r en tial   r ain f all   d ata  in   P en in s u lar   Ma la y s ia.   T h p u r p o s o f   u s i n g   s i m u la tio n   i s   to   d eter m in an   ap p r o p r iate  b r ea k d o w n   9   p o in an d   to   ev al u at e   th p er f o r m a n ce   o f   th b o th   m eth o d s   in   th a n al y s i s   o f   id e n ti f y in g   s p atia clu s ter   to r r en tial  r ain f al p atter n s   i n   P en in s u lar   Ma la y s ia.         2.   RE S E ARCH   M E T H O D     I n   th i s   s t u d y ,   t h f o cu s   is   o n   t h o cc u r r en ce   o f   ex tr e m r ain f all  e v en d escr ib ed   as  to r r en tial  r ain f a ll.   I w a s   t h er ef o r n ec es s ar y   to   ch o o s s o m cr iter ia   th a wo u ld   lead   to   t h estab li s h m e n o f   a   th r e s h o ld ,   i n   o r d er   to   allo w   f o r   clea r   d is t in ctio n   b et w ee n   w h at  co n s t itu tes  d a y   o f   to r r en tia r ai n f a ll   in   t h P en i n s u lar   Ma la y s ia  r e g io n   a n d   w h at  d o e s   n o t.  T h r an g o f   th r es h o ld   f o r   to r r en tial  r ain f all  d ata  i n   P en in s u lar   Ma la y s ia  is   6 0   m m /d a y .   T h is   th r es h o ld   is   c h o s en   b ased   o n   th e   ca teg o r izatio n   o f   r ain f all   in ten s it y   b y   J ab atan   P en g air an   d an   Salira n   ( J P S).   B y   f ilter i n g   d a y s   w it h   r ain f al m o r th a n   6 0   m m   f o r   at  least  2 o f   o v er all  s tatio n s ,   2 5 0   d ay s   an d   1 5   r ain f a ll  s tatio n s   w er o b tain ed   w h ich   i n   t u r n   w er s u f f ice  en o u g h   to   r ep r esen th m ai n     to r r en tial c en ter s .   Fig u r 1   s h o w s   t h m atr i x   o f   d ail y   to r r en tia r ai n f al d ata  a f ter   f il ter in g   f r o m   r a w   d ata  b as ed   o n   t h e   th r es h o ld   th a s e to   t h d ata.   T h r ain f all  d a y   i n   th e   f ir s co lu m n   r e f er s   to   t h r ain f al o b s er v atio n   a n d   t h e   r ain f al s tatio n   i n   th f ir s r o w   r e f er s   to   th v ar iab le.   R ai n f a ll  is   o f ten   e x p r ess ed   i n   m illi m e ter s   p er   d ay   ( m m /d a y )   w h ic h   r ep r esen t s   t h to tal  d ep t h   o f   r ain w ater   ( m m ) ,   in   2 4   h o u r s .   Fro m   Fi g u r 2   an d   T ab le  1 ,     it  ap p ea r ed   th at  th lo ca tio n s   w h er th e s to r r en tial  r ai n f al o cc u r   an d   w er lar g el y   lo ca ted   at  t w o   r eg io n s   s p ec if icall y   t h No r th er n   a n d   E aster n   r eg io n .           Fig u r 1 .   An   ex a m p le  o f   s n a p s h o t o f   t h d ail y   to r r en tial r ai n f a ll d ata  co n s i s ti n g   o f   d ail y   a m o u n t o f   r ai n f a ll  d ata  r ec o r d ed   at  s ev er al  lo ca tio n s   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l.  11 ,   No .   3 Sep tem b er   2 0 1 8   :   1 1 6 2     1 1 6 7   1164       Fig u r 2 .   R ain f all  s tatio n s   th a t   r ep r esen t th m ain   to r r en tia l c en ter s   i n   P en in s u lar   Ma la y s ia       T ab le  1 .   L is t o f   th R ai n f a ll St atio n s   A cc o r d in g   th Mo n s o o n   Occ u r r ed   R e g i o n   S t a t i o n   C o d e   N o r t h e a st   P i n t u A . B a g a n , A i r I t a m   N1     S e l a ma   N2     K l i n i k B k t .   B e n d e r a   N3   Ea st   K l i n i k B i d a n   , Ja mb u B o n g k o k   E7     S e k .   K e b .   K e mase k   E5     S e k .   K e b .   K g .   Jab i   E1 1     K g .   M e r a n g   , S e t i u   E1 0     En d a u   E1     R u m a h   P a m   P a h a n g   T u a , P e k a n   E2     K u a n t a n   E3     JP S   K e mama n   E4     S e k . M e n .   S u l t a n   O mar,   D u n g u n   E6     K g .   M e n e r o n g   E8     S t o r   JP S   K u a l a   T r e n g g a n u   E9     K o t a   B h a r u   E1 2       3.   M E T H O DO L O G Y   3 . 1 .     P rincipa l C o m po nent  A na ly s is   ba s ed  P ea rso n Co rr e la t io n   P C A   i s   d esi g n ed   to   r ed u ce   t h e   n u m b er   o f   v ar iab les o f   in ter e s t in to   s m al ler   s et  o f   co m p o n en ts   w h ile   r etain i n g   m o s o f   t h s ig n i f ica n i n f o r m atio n   [ 9 ] [ 1 0 ] .   T h is   i s   ac h iev ed   b y   co n v e r ti n g   s et   o f   o b s er v at io n s   o f   p o s s ib l y   co r r elate d   v ar iab les   in to   s et  o f   li n ea r l y   u n co r r elate d   v ar iab les  ca lled   p r in cip al  co m p o n en ts .     T h f ir s p r in cip al  co m p o n en ac co u n ts   f o r   as  m u ch   o f   t h v ar iat io n   i n   t h o r ig i n al  d ata.     T h en   ea ch   s u cc ee d in g   co m p o n e n t   ac co u n ts   f o r   as   m u c h   o f   t h r e m ai n in g   v ar iatio n   s u b j ec to   b ein g   u n co r r elate d   w ith   t h p r ev io u s   co m p o n e n t.   C o v ar ian ce   o r   co r r elatio n   m a tr ix   d er iv ed   f r o m   th d ata  m atr ix   p la y s   an   i m p o r tan r o le  in   P C A   to   ca lcu late  it s   eig e n v alu e s   an d   eig en v ec to r s   to   o b ta in   t h ass o ciate d   co m p o n e n ts   t h at  ac co u n f o r   m o s o f   th e   v ar iatio n s   i n   t h d ata   [ 1 1 ] .   Fo r   th p u r p o s o f   t h i s   s tu d y ,   co r r elatio n   m atr ix   is   u s ed .   I is   g en er all y   r ec o m m e n d ed   tak i n g   a least  7 0 o f   cu m u lati v p er ce n tag o f   to tal  v ar iatio n   as  b e n ch m ar k   to   c u o f f   t h e   eig en v al u es   in   lar g e   d ata  s et  f o r   ex tr ac tin g   t h n u m b er   o f   co m p o n e n ts   [ 1 2 ] .   T h r ed u ce d   m a tr ix   i s   t h e   co m p o n e n t   m atr ix   o f   e ig e n v ec to r   lo ad in g s ‖  w h ic h   d e f i n es  th e   n e w   v ar iab le s   co n s i s ti n g   o f   li n ea r   tr an s f o r m atio n   o f   t h o r ig in a l v ar iab les th a m a x i m izes t h v ar ian ce   in   t h n e w   a x es.    T h s tep s   in v o l v ed   in   P C A   al g o r ith m   ar as  f o llo w s :   Step   1   : O b tain   th i n p u m atr i x .   Step   2   : Calcu late  its   co r r elatio n   m atr ix .   Step   3   : Calcu late  th ei g e n v ec to r s   a n d   eig en v alu e s   o f   t h co r r elatio n   m atr i x .   Step   4   : Sele ct  th m o s t i m p o r tan t p r in cip al  co m p o n e n ts   b ased   o n   c u m u lat iv p er ce n ta g o f   to tal   v ar iatio n .   Step   5   : D er iv th n e w   d ata  s et   Step   6   : Calcu late  C ali n s k i a n d   Har ab asz  in d ex   i n   n e w   d ata  s et  to   d eter m i n th b est  n u m b er   o f   cl u s ter   Step   7   : A p p l y   k - m ea n s   m et h o d   to   n ew   d ata  s et     Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       I d en tifi ca tio n   o R a in fa ll P a tter n s   o n   Hyd r o lo g ica S imu la tio n   Usi n g   …  ( S . M.  S h a h a r u d in )   1165   3 . 2 .   P rincipa l C o m po nent  A na ly s is   ba s ed  T u key s   B iw ei g ht  Co rr ela t io   P C A   b ased   T u k e y s   b i w ei g h co r r elatio n   is   p r o p o s ed   to   o v er co m t h p r o b le m   t h at  ad d r ess   i n   Sectio n   1 .   B e f o r p r o ce ed in g ,   th o r i g in al   d ata  m atr i x   i s   s ta n d ar d ized   b y   a   r o b u s lo ca tio n   an d   s ca le   est i m a to r   to   av o id   an y   m as k i n g   o r   s w a m p in g   e f f ec [ 1 3 ] .   T h r ed u ce d   d ata  s et  is   th e n   ap p lied   t o   K - Me a n s   cl u s ter   an al y s is   to   o b tain   clu s ter   p ar titi o n s .   m ea n s   m et h o d   r eq u ir es  s p ec if y in g   th n u m b er   o f   clu s ter s   b ef o r th alg o r ith m   is   ap p lied .   T o   o v er co m e   t h is   p r o b lem ,   C ali n s k i   an d   Har ab asz  I n d e x   [ 1 4 ]   is   u s ed   as  a   m ea s u r e   to   d eter m in t h o p ti m al  n u m b er   o f   clu s ter   p ar titi o n   f o r   th in p u d ata.   T h is   is   in d icate d   b y   th m a x i m u m   v al u e   o f   th i n d ex .   T h s tep s   in v o l v ed   in   t h p r o p o s ed   alg o r ith m   ar as  f o llo w s   [ 1 5 ] :   Step   1   : O b tain   th i n p u m atr i x .   Step   2   : Stan d ar d ize  th o b s er v atio n   w it h   m ed ian   a n d   m ea n   ab s o lu t d ev iatio n   ( M A D) ,   i.e .                       ̅            ( |                  (      ) | )       s u c h   th a t r ef er   to   ele m e n ts   i n   t h in p u m a tr ix .   Step   3   : Set  th b r ea k d o w n   p o in f o r   th T u k e y 's b i w ei g h t c o r r elatio n   at  0 . 4     Step   4   : Calcu late  th T u k e y 's b i w e ig h t c o r r elatio n   m atr i x .   Step   5   : Calcu late  th ei g e n v ec to r s   a n d   eig en v alu e s   o f   t h co r r elatio n   m atr i x .   Step   6   : Sele ct  th m o s i m p o r tan t p r in cip al  co m p o n e n ts   b ased   o n   c u m u lat iv p er ce n ta g o f   to tal   v ar iatio n .   Step   7   : D er iv th n e w   d ata  s et   Step   8   : Calcu late  C ali n s k i a n d   Har ab asz  in d ex   i n   n e w   d ata  s et  to   d eter m i n th b est  n u m b er   o f   cl u s ter   Step   9   : A p p l y   k - m ea n s   m et h o d   to   n ew   d ata  s et     3 . 3 .   Da t a   m o de l o f   ra infa ll f o t he  s i m ula t io n pro ce du re   Data   s ets  ar g en er ated   b ased   o n   p r o b ab ilit y   d is tr ib u tio n s   t h at  m i m ic  m u lti v ar iate  to r r en tial  r ain f all  d ata.   T h d is tr ib u tio n s   o f   tr o p ical  r ain f a ll  d ata  ar g e n er al l y   s k e w ed   to   t h r ig h a n d   t h u s   d is tr ib u tio n s   t h at   ex h ib it  t h is   c h ar ac ter is tic  ca n   b u s ed   to   m o d el  th to r r en tial  r ain f all.   T h r ee   d is tr ib u tio n s   ar ch o s en   w h ic h   ar g a m m a,   L o g - No r m al  a n d   Gen er alize d   P ar eto   d is tr ib u tio n   ( GP D)   ar test ed   o n   m u lti v ar iate  r ain f a ll  d ata.   T h ese  d is tr ib u tio n s   ar co m m o n l y   u s ed   as  p o ten tial  ca n d id ates  f o r   th d ata  g en er ati n g   m e ch an i s m   o f   r ain f all   d ata   [ 1 6 ] [ 1 7 ] .   E s tim at io n   o f   t h p ar a m eter s   f o r   ea ch   o f   t h ab o v s a m p led   p r o b ab ilit y   d is tr ib u tio n s   ar b ased   o n   th s u m m ar y   s tati s tics   f r o m   t h o r ig i n al  to r r en tial  r ai n f all  d ata  in   P en i n s u lar   Ma la y s i a.   T h ese  p ar am eter s   ar b ased   o n   th m ea n   a n d   s ta n d ar d   d ev iatio n   f r o m   th d ata  s et  o f   2 5 0   to r r en tial  r ai n f a ll  d a y s   a n d   1 5   r ain f all   s tatio n s   o f   t h o r ig i n al  to r r en tial  r ai n f a ll  d ata  f o r   th 3 3   y ea r   p er io d   in   P en in s u l ar   as  d escr ib ed   in     Sectio n   2 .   T h s h ap p ar am et er   f o r   th is   s tu d y   is   ξ=0 . 2   w h e r it  p e r f o r m s   w el f o r               an d   v er y   g o o d   f o r               [ 1 8 ] .     Ou o f   t h th r ee   p r o b ab ilit y   d is tr ib u tio n s   w h ich   w er s a m p le d ,   GP a p p ea r s   to   f it  th d ata  s et  b ased   o n   s ev er al  a s s ess m e n t s   b y   d is tr ib u tio n   g r ap h s   ( i.e   QQ  p lo an d   p r o b a b ilit y   d if f er en g r ap h )   an d   g o o d n ess   o f   f it  te s ts   u s i n g   C h i - s q u ar an d   An d er s o n   Dar li n g   test .   T h is   d is tr ib u tio n   i s   r e m ar k ab l y   g o o d   at  s ig n i f ica n ce   lev el                if                    ,   th u s   p r o v id in g   s o m ev id en ce   th at  t h n u ll  h y p o th esi s   is   tr u ( i.e   th GP p r o v id es th co r r ec t statis tical  m o d el  f o r   r ain f a ll d ata) .     Si m u latio n s   w er ca r r ied   o u o n   s a m p le  GP d is tr ib u ti o n s   ch ar ac ter ized   b y   t h r ee   p ar am eter s   lo ca tio n   μ =1 0 4 . 8 ,   s ca le  σ =5 4 . 7   an d   s h ap ξ=0 . 2 ,   o b tain ed   f r o m   t h o r ig i n al  to r r en tial  r ain f all  d ata  o f   3 3   y ea r   p er io d   in   P en in s u lar   Ma la y s i to   co n s tr u ct  an   n   x   p   m atr i x   w ith                 an d                to   r ep r esen 2 5 0   to r r en tial  r ain f al d ay s   an d   1 5   r ain f all  s tatio n s   r esp ec tiv el y   a s   d escr ib ed   in   Sectio n   2 .   I n   o r d er   to   v ar y   th e   s i m u lat io n   test ed ,   t w o   d if f er e n s etti n g s   ar u s ed .   Firstl y ,   t h s ca le  ( i.e .   s tan d ar d   d ev iatio n )   ar v ar ied   b elo w   an d   ab o v s tan d ar d   d ev iatio n   o f   th o r ig i n al  to r r en tial  r ai n f all  d ata  to   ass ess   t h ef f ec o f   p r eser v in g   m o s o f   th v ar i atio n s   i n   t h d ata.   A ll  g en er ated   d ata  clea r l y   co n ta in s   v al u e s   o f   ar o u n d   6 0   w h ic h   r ef lect  t h 6 0 m m /d a y   th r es h o ld   o f   to r r en tial  r ain f all.   Seco n d l y ,   s ev er al  r an g o f   b r ea k d o w n   p o in ts   b et w ee n   0 . 2   to   0 . 8   ar e   test ed   to   ev alu a te  th i n f lu e n ce   s e lectio n   o f   t h s i g n i f ica n ce   n u m b er   o f   co m p o n e n ts   to   ex tr ac t in   P C A .     E ac h   s et   o f   g en er ated   d ata  ar e   th e n   e m p lo y ed   to   t h t w o   ap p r o ac h es,  P C A   b ased   P ea r s o n   c o r r elatio n   an d   r o b u s P C A   b ased   T u k e y s   b i w e ig h co r r elatio n   a s   d esc r ib ed   in   Sectio n   3 . 1   an d   Secti o n   3 . 2 .   Fro m   t h es e   t w o   ap p r o ac h es,  t h eir   f in d in g s   w ill   b co m p ar ed   ac co r d in g   to   cl u s ter   p ar tit io n   an d   g en er at e     ex tr e m e l y   u n b alan ce d   c lu s te r s   r ain f all   p atter n s .   I n   ad d it io n   f o r   r o b u s P C b ased   T u k e y s   b i w e ig h t   co r r elatio n ,   th ch o ice  o f   ap p r o p r iate  b r ea k d o w n   p o in i s   d is cu s s ed   d u to   d eter m i n in   ex tr ac tin g   n u m b er   o f   co m p o n e n t i n   P C A .         Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l.  11 ,   No .   3 Sep tem b er   2 0 1 8   :   1 1 6 2     1 1 6 7   1166   4.   RE SU L T S AN D I SCU SS I O N   T h p er f o r m a n ce   o f   r o b u s P C A   b ased   o n   T u k e y s   b i w ei g h t   co r r elatio n   ar co m p ar ed   a g ain s t   P C A   ap p r o ac h es  u s i n g   th s i m u l ated   d ata  d escr ib ed   in   Secti o n   3 .   T a b le  2   s h o w s   t h a v er ag n u m b er   o f   co m p o n e n t s   o b tain ed   u s i n g   r o b u s P C A   b ased   T u k e y s   b i w ei g h co r r elatio n   f r o m   2 0   s i m u lated   d ata.     I v is u a lizes  t h at  th ch o ice  o f   b r ea k d o w n   p o in w o u ld   in f l u en ce   th ex tr ac t in g   n u m b er   o f   co m p o n e n ts   i n   th i s   ap p r o ac h .   Fro m   T ab le  2 ,   h i g h er   b r ea k d o w n   p o in ( r =0 . 8 )   w i ll  lead   to   f lag g i n g   f e w er   s i g n i f ica n ce   co m p o n e n t s   to   e x tr ac t.  A   b r ea k d o w n   p o in t s   o f   r =0 . 4   g iv es  a   g o o d   b alan ce   i n   e x tr ac tin g   n u m b er   o f   co m p o n e n t s   w h er it   r etain s   s u f f icien t   co m p o n e n t s   w h er o n l y   1 2   co m p o n en ts   h av b ee n   r etain ed .     I n   h y d r o lo g ical  d ata,   ex tr ac ti n g   to o   m an y   co m p o n en t s   is   n o f a v o r ab le  as  it  m a y   r e f le ct  v ar iatio n s   o f   lo f r eq u en c y   o r   s p atial  s ca le  th at  ar n o im p o r tan [ 1 9 ] .   Hen ce ,   th ch o ice  o f   b r ea k d o w n   p o in is   v er y   i m p o r tan in   P C A   b ased   T u k e y s   b i w ei g h t c o r r elatio n .   T h en tr ies  in   T ab le  3   s h o w   th av er a g n u m b er   o f   co m p o n en t s   an d   cl u s ter s   o b tai n ed   f r o m   P C b ased   P ea r s o n   co r r elatio n   an d   P C A   b ased   T u k e y s   b iw ei g h t   co r r elatio n   at  an   i n cr ea s in g   cu m u lati v e   p er ce n tag o f   v ar iatio n   f r o m   6 0 to   8 0 %.   E ac h   o f   t h ese   av e r ag n u m b er s   o f   co m p o n en ts   an d   cl u s ter s   ( r o u n d   u p   to   t w o   d ec i m al  p lace s )   ar o b tain ed   f r o m   t h 2 0   s i m u lat ed   d ata  as  ex p lain ed   in   Secti o n   3 .   No te  th at  th e   v ar iatio n   b et w ee n   t h s i m u lat ed   d ata  at  ea ch   lev el  o f   cu m u lativ p er ce n ta g o f   v ar iat io n s ,   co m p o n en ts   a n d   clu s ter s   is   s m all  ( 0 . 4 4   to   0 . 9 4 ) .         T ab le  2 .   T h A v er a g Nu m b er   o f   C o m p o n e n ts   B ased   o n   7 0 C u m u lati v P er ce n ta g o f   Var ian ce   in   Sev er al  Valu es   o f   B r ea k d o w n   P o in t   B r e a k d o w n   P o i n t ,     N u mb e r   o f   C o m p o n e n t s   0 . 2   9   0 . 4   12   0 . 6   6   0 . 8   3       T ab le  3 .   A v er ag N u m b er   o f   C o m p o n e n ts   a n d   C l u s ter s   Ob tain ed   b ased   o n   P ea r s o n   an d   T u k e y s   B i w ei g h C o r r elatio n   f r o m   2 0   Si m u late d   Data     C u m . %   N u mb e r   o f   c o mp o n e n t s   N u mb e r   o f   c l u st e r ,   K   T u k e y 's   b i w e i g h t   P e a r so n   T u k e y 's b i w e i g h t   P e a r so n     M e a n   S t d . D e v .   M e a n   S t d . D e v .   M e a n   S t d . D e v .   M e a n   S t d . D e v .   60   2 . 2 5   0 . 4 4   4 5 . 4 0   0 . 8 2   9 . 5 0   0 . 6 9   2 . 4 0   0 . 6 0   65   5 . 5 5   0 . 7 6   5 4 . 0 5   0 . 8 9   5 . 1 0   0 . 8 5   2 . 4 0   0 . 5 0   70   1 1 . 5 5   0 . 9 4   6 1 . 5 0   0 . 8 3   8 . 4 0   0 . 8 8   2 . 3 5   0 . 4 9   75   1 9 . 8 0   0 . 8 9   7 1 . 5 5   0 . 8 9   1 1 . 5 0   0 . 9 4   2 . 2 5   0 . 5 5   80   2 8 . 7 5   0 . 9 2   8 2 . 5 0   0 . 6 9   2 . 4 0   0 . 5 0   2 . 3 5   0 . 5 9       I is   o b s er v ed   f r o m   T ab le  3   th at  th er is   d if f er en ce   i n   t h av er ag n u m b er   o f   co m p o n e n ts   an d   th e   n u m b er   o f   clu s ter s   o b tain ed   f r o m   th e s t w o   co r r elatio n   m ea s u r es  in   P C A   at  ea ch   l ev el  o f   cu m u lati v e   pe r ce n tag o f   v ar iatio n s .   I ap p ea r s   th at  P C A   b ased   T u k e y 's  b i w eig h co r r elatio n   r eq u i r es  less   n u m b er   o f   co m p o n e n t s   to   e x tr ac i n   o r d er   to   ac h iev e   at  leas 7 0 o f   cu m u la tiv e   p er ce n tag e   o f   v a r iatio n   co m p ar ed   to   P C b ased   P ea r s o n   co r r elati o n .   Fo r   i n s ta n ce ,   2 8 . 7 5     2 9   co m p o n e n t s   ar r etai n ed   w i th   r o b u s P C b ased   T u k e y s   as  co m p ar ed   to   8 2 . 5 0     8 3   w i th   P C A   b ased   P ea r s o n s   at   8 0 cu m u lati v p er ce n tag e   o f   v ar iat io n .   I n clu s io n   o f   to o   m a n y   p r i n cip al  co m p o n e n t s   in f late s   th i m p o r tan ce   o f   o u tlier ,   th u s   t h r esu lt s   b ec o m p o o r l y   in   id en ti f y i n g   r ai n f all  p atter n s .     I n   ter m s   o f   cl u s ter   p ar titi o n s ,   T ab le  3   also   s h o w s   t h at  i n   co n tr ast  to   P C A   b ased   P ea r s o n s ,   P C b ased   T u k e y 's  b i w eig h co r r elatio n   is   m o r s e n s iti v to   th n u m b er   o f   clu s ter s   ac co r d in g   to   th n u m b er   o f   co m p o n e n t s   r etai n ed .   T h n u m b er   o f   cl u s ter s   as a   r esu lt o f   P C A   b ased   P ea r s o n   co r r elatio n ,   ap p ea r   to   s tab ilize   at  o n l y   t w o   cl u s ter s   r eg ar d less   o f   t h cu m u lati v p er ce n tag o f   v ar iat io n   u s ed .   I n   h y d r o lo g ical  s tu d ie s   p ar ticu lar l y   i n   id en ti f y in g   r ain f all  p atter n s ,   it  i s   m o r r ea s o n ab le  to   o b tain   m o r th an   t w o   clu s ter   p ar titi o n s   to   ex p lain   t h v ar io u s   t y p e s   o f   r ain f all  p atter n s .   T h u s ,   t w o   cl u s ter s   clea r l y   is   in ap p r o p r iate  as  it   m a s k s   th e   tr u e   s tr u ct u r o f   th d ata.   I n   o r d er   to   ex a m in e   t h cl u s t er   s o lu tio n s ,   t h c lu s ter in g   o u tp u t   at  7 0 c u m u lati v p er ce n tag e   o f   v ar iatio n   o n   P C b ased   T u k e y s   b i w ei g h co r r elatio n   ( 8 . 4 0     8   clu s ter s )   a n d   P C A   b ased   P ea r s o n   co r r elatio n   ( 2 . 3 5   2   clu s ter s )   ar ch o s e n   r esp ec tiv e l y .   T h er ef o r e,   f r o m   th r es u lt s   t h at  w d is c u s s   ab o v e,   it  ca n   b co n c lu d ed   th at  P C A   b ased   T u k e y s   b i w ei g h co r r elatio n   p r o v th at  it  is   an   e f f icien r o b u s m e th o d   w h e n   d ea lin g   w it h   h y d r o lo g ical  d at esp ec iall y   in   r ain f all   d ata  w h er it  s h o w s   s u b s tan tia i m p r o v e m en t   in   th e   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       I d en tifi ca tio n   o R a in fa ll P a tter n s   o n   Hyd r o lo g ica S imu la tio n   Usi n g   …  ( S . M.  S h a h a r u d in )   1167   clu s ter   p ar titi o n   w i th   P C A   b as ed   T u k e y s   b i w e ig h co r r elati o n   th a n   P C A   b ased   P ea r s o n s   to   av o id   in ac cu r ate   u n b ala n ce d   clu s ter s   i n   r ain f all  d ata       5.   CO NCLU SI O N   T h r o b u s t P C A   b ased   T u k e y s   b i w ei g h t   co r r elatio n   h as   b ee n   s h o w n   as   p r o m i s i n g   co n te n d er   to   t h e   ex is t in g   P C A   b ased   P ea r s o n   co r r elatio n .   Sp ec if icall y ,   r o b u s P C A   b ased   T u k e y s   b i w ei g h co r r elatio n   s h o w ed   s u b s ta n tial  i m p r o v e m en in   th cl u s ter   p ar titi o n   as   co m p ar ed   to   P C A   b ased   P ea r s o n   co r r e latio n   an d   it  h as  b ee n   p r o v en   b y   t h s i m u latio n   r es u lt s .   T h s i m u l ated   d ata  in d icate s   b r ea k d o w n   p o in o f   7 0 cu m u lat iv e   p er ce n tag e   o f   v ar i an ce   to   g iv e   g o o d   b alan ce   i n   e x tr ac tin g   th n u m b er   o f   co m p o n en ts   to   a v o id   v ar iatio n s   o f   lo w   f r eq u e n c y   o r   in s i g n if i ca n s p atial  s ca le  i n   t h clu s ter s .       RE F E R E NC E S     [1 ]   M o ro n   V ,   Ro b e rtso n   A W ,   Qia n   J H,  G h il   M .   W e a th e Ty p e Ac ro s th e   M a rit im e   Co n ti n e n t:   f ro m   th e   Diu rn a Cy c l e   to   In tera n n u a V a riati o n s.   Fro n ti e rs   in   En v ir o n me n t a l   S c ien c e .   2 0 1 5 3 ( 4 4 ) 1 - 1 9 .   [2 ]   A h m a d   N H,  Oth m a n   IR,   De n S M .   Hie ra rc h ica Clu ste A p p ro a c h   f o Re g io n a li z a ti o n   o f   P e n in s u l a M a la y si a   b a se d   o n   t h e   P re c ip i tatio n   Am o u n t.   J o u rn a o P h y sic s: Co n fer e n c e   S e rie s .   4 2 3 .   2 0 1 3 ;   1 - 1 0 .     [3 ]     S iv a   G S ,   Ra o   V S ,   Ba b u   DR.  Clu ste A n a l y sis  A p p ro a c h   to   S tu d y   th e   Ra in f a ll   P a t tern   in   Visa k h a p a tn a m   District.   W e e k ly S c ien c e   Res e a rc h   J o u rn a l .   2 0 1 4 ;1 ( 3 1 ).   [4 ]   S h a h a ru d in   S M ,   A h m a d   N,  Yu so f   F ,   Ya p   X Q.  T h e   Co m p a riso n   o f   T - m o d e   a n d   P e a rso n   Co rre la ti o n   M a tri c e in   Clas sif ic a ti o n   o f   Da il y   Ra in fa ll   P a tt e rn s in   P e n in s u lar M a lay sia .   M a tem a ti k a .   2 0 1 3 2 9 ( 1 c ),   1 8 7 - 1 9 4 .     [5 ]   Am iri   M A ,   M e s g a ri  M S .   M o d e li n g   th e   S p a ti a a n d   T e m p o ra V a riab il i ty   o f   P re c ip it a ti o n   i n   No rth w e st  Ira n .   A t m o sp h e re .   2 0 1 7 8 (2 5 4 ) ,   1 - 1 4 .     [6 ]   Ne e ti   N.  Ex ten d in g   T - M o d e   Ca n o n ica Co rre lati o n   A n a ly sis   to   T - M o d e   P re - F il tere d   Ca n o n ica Co rre latio n   A n a l y si s:  A   No v e A p p ro a c h   T o   Disc o v e S h a re d   P a tt e rn Be twe e n   Tw o   I m a g e   T i m e   S e ries .   In ter n a ti o n a J o u rn a o Rem o te  S e n sin g .   2 0 1 4 ,   3 5 (4 ) ,   1 9 2 6 - 1 9 3 5 .     [7 ]   Ra y m a e k e rs,   J,  Ro u ss e e u w   P J.  Fa st  R o b u st  Co rr e la t io n   f o Hig h   Dime n sio n a l   Da t a .   De p t .   o f   M a th e m a ti c s,  KU   L e u v e n ,   Be lg iu m .   a rX iv :1 7 1 2 . 0 5 1 5 1 .   2 0 1 8   [8 ]   Ow e n   M . T u k e y ' s Biwe ig h Co rre latio n   a n d   t h e   Bre a k d o w n .   M a ste T h e sis.  Ca li f o rn ia:  P o m o n a   Co ll e g e 2 0 1 0 .   [9 ]   S a h a k   R,   M a n so W ,   L e e   KY ,   Zab id A .   P e rf o rm a n c e   o f   P ri n c ip a Co m p o n e n A n a ly sis  a n d   Orth o g o n a L e a st  S q u a re   o n   o p t im ize d   F e a tu re   S e in   Clas sify in g   A sp h y x iate d   In f a n Cry   u sin g   S u p p o rt   V e c to r   M a c h in e .   In d o n e sia n   J o u rn a o El e c trica En g in e e rin g   a n d   Co m p u ter   S c ien c e .   2 0 1 8 9 ( 1 ),   1 3 9 - 1 4 5 .     [1 0 ]   Ru il ian   W ,   S h e n g ji a n   G .   Co m p re h e n siv e   Ev a lu a ti o n   to   Distrib u t io n   Ne tw o rk   P la n n i n g   S c h e m e u sin g   P ri n c ip a Co m p o n e n A n a l y sis  M e th o d .   TE L KO M NIK In d o n e sia n   Jo u rn a o El e c tri c a En g in e e rin g .   2 0 1 4 1 2 (8 ),   5 8 9 7 - 5 9 0 4 .   [1 1 ]   Ne w a re   S ,   M e h ta  K,  Zad g a o n k a A S .   F in g e Kn u c k le  Id e n ti f ic a ti o n   u si n g   P ri n c ip a Co m p o n e n A n a l y sis  a n d   Ne a re st M e a n   Clas si f ier .   In ter n a t io n a J o u rn a o Co m p u ter   A p p l ica ti o n s .   2 0 1 3 ;   7 0 (9 ):  1 8 - 2 3 .   [1 2 ]   S h a h a ru d in   S M ,   A h m a d   N.  M o d e li n g ,   De sig n   a n d   S im u latio n   S y ste m s.  In A li   M S M ,   S a h la n   S ,   W a h id   H,  Yu n u M A M ,   S u b h a   NA M   a n d   W a h a p   A R.   7 5 2 .   S in g a p o re :   S p r in g e r;  2 0 1 7 2 1 6 - 2 2 4 .     [1 3 ]   Ch o u lak ian   V .   Ro b u st  Q - M o d e   P ri n c ip a Co m p o n e n A n a l y sis  i n   L 1 .   Co mp u t a ti o n a S t a ti stics   &   Da ta   An a lys i s .   2 0 0 1 3 7 1 3 5 - 1 5 0 .   [1 4 ]   M a u li k   U.  2 0 0 2 .   P e rf o rm a n c e   Ev a lu a ti o n   o f   S o m e Clu ste rin g   A lg o r it h m a n d   V a li d it y   In d ice s.  IEE T ra n sa c ti o n s   o f   Pa tt e rn   A n a lys is  a n d   M a c h i n e   In t e ll ig e n c e .   2 0 0 2 2 4 ( 1 2 ):   1 6 5 0 - 1 6 5 4 .     [1 5 ]   S h a h a ru d in   S M ,   A h m a d   N,  Y u so f   F .   I m p ro v e d   Clu ste P a rti ti o n   i n   P rin c i p a l   Co m p o n e n t   A n a l y si G u id e d   Clu ste rin g .   I n ter n a t io n a J o u rn a o Co m p u ter   A p p l ica ti o n s .   2 0 1 3 7 5 ( 1 1 ):  2 2 - 2 5 .     [1 6 ]   Ch o   H - K,  B o wm a n   K.P ,   N o rth   G . R.   A   Co m p a riso n   o f   G a m m a   a n d   L o g n o rm a Distrib u ti o n   f o r   Ch a ra c teriz in g   S a telli te  Ra in   Ra tes   f ro m   th e   T r o p ica Ra in f a ll   M e a su rin g   M issio n .   J o u rn a o A p p li e d   M e teo ro l o g y .   2 0 0 4 4 3 :   1 5 8 6 - 1 5 9 7 .     [1 7 ]   Dh o re   K.A ,   N a th a n   KK ,   Kh a re   D,  Ch a u b e   U.C.   W e e k ly   Ra in fa ll   Pre d ictio n   u si n g   th e   S t a n d a rd   P a c k a g e   S M ADA P r o c e e d in g o f   th e   I n tern a ti o n a Co n f e re n c e   o n   W a ter  a n d   E n v iro n m e n (W E - 2 0 0 3 ).   1 5 - 1 8   De c e m b e 2 0 0 3 .   Bh o p a l .   2 0 0 3 3 2 - 3 9 .     [1 8 ]   De   Zea   Be r m u d e z   P ,   K o tz  S .   P a ra m e ter  Esti m a ti o n   o f   th e   G e n e ra li z e d   P a re to   Distrib u ti o n P a rt  I.   J o u rn a o S ta ti st ica P la n n i n g   a n d   I n fer e n c e .   2 0 1 0 ;   1 4 0 ( 6 ),   1 3 5 3 - 1 3 7 3 .   [1 9 ]   M imm a c k   G M ,   M a so n   S J,  Ga lp in   JS.   Ch o ice   o f   Dista n c e   M a tri c e in   Clu ste A n a l y sis  D e f in in g   Re g io n s.  J o u rn a l   o Cli m a te .   2 0 0 2 1 4 :   2 7 9 0 - 2 7 9 7 .       Evaluation Warning : The document was created with Spire.PDF for Python.