I nd o ne s ia n J o urna l o f   E lect rica E ng ineering   a nd   Co m p u t er   Science   Vo l.   1 2 ,   No .   1 Octo b er   201 8 ,   p p .   3 4 8 ~ 3 5 5   I SS N:  2502 - 4752 ,   DOI : 1 0 . 1 1 5 9 1 / i j ee cs . v 1 2 .i 1 . p p 348 - 3 5 5           348       J o ur na l ho m ep a g e h ttp : //ia e s co r e. co m/jo u r n a ls /in d ex . p h p / ijeec s   Star Co o rdina te   Di m ensio n Ar ra ng e m en using  Eu c lidea Dista nce and  P ea rso n Correla tion       No o E la iza   Abdu l   K ha lid ,   I zy a n Izza t i K a m s a ni   Un iv e rsiti   T e k n o lo g M a ra ,   4 0 4 5 0 ,   S h a h   A lam ,   S e lan g o Da ru Eh sa n ,   + 6 0 3 5 5 4 4 2 0 0 0 ,   M a lay sia       Art icle  I nfo     AB ST RAC T     A r ticle  his to r y:   R ec eiv ed   Ma y   1 8 ,   2 0 1 8   R ev i s ed   J u n   1 9 ,   2 0 1 8   A cc ep ted   Ju l 3 ,   2 0 1 8       S tar  Co o rd i n a te  (S C)   is  a   c irc u lar  v isu a li z a ti o n   tec h n iq u e   t h a m a p k - d im e n sio n a d a ta.   Its  i n tera c ti v e   fe a tu re a ll o w   u se to   m a n ip u late   p ro jec ti o n to   se a rc h   f o h id d e n   i n f o rm a ti o n .   W it h o u p rio k n o w led g e   o re latio n sh ip   b e tw e e n   d i m e n sio n u se rs  w il b e   b li n d ly   se a r c h in g   f o c lu ste rs.  T h is  p a p e r   p ro p o se d im e n sio n   re a rra n g e m e n u si n g   Eu c li d e a n   Dista n c e   a n d   P e a rso n   Co rre latio n s   to   re v e a th e   c lu ste r in   S C.   T h e   m e th o d o lo g y   c o n sists   o f   f o u p h a se s;  Ca lcu late   th e   d istan c e   b e twe e n   in d iv id u a a tt rib u tes   a g a in st  a   d e p e n d e n a tt rib u te  u sin g   Eu c li d e a n   d istan c e P e a rso n   c o rre lati o n   is  u se d   to   o b tai n   th e   c o rre latio n   d a ta  a tt rib u tes S o rt  th e   c o rre latio n   v a lu e in   a sc e n d in g   o rd e r;  f in a ll y ,   a tt rib u tes   tab le  a re   re o rd e re d   w it h   th e   p o sit iv e   v a lu e to   th e   rig h a n d   n e g a ti v e   v a lu e s   to   th e   lef a c c o rd in g   to   th e   c o rre latio n   v a lu e .   T h e   re su lt in g   tab les   a re   a p p li e d   to   p r o d u c e   th e   S C.   T h is  m e th o d   is  su c c e ss f u in   p ro d u c in g   c lu ste rs  th a m a k e it   e a sie f o th e   u se rs   to   f u rth e m a n ip u late   th e   S f o th e ir  d a ta an a ly sis.   K ey w o r d s :   Data   d i m en s io n   ar r an g e m e n t   E u clid ea n   d is ta n ce   P ea r s o n   co r r elatio n   Star   co o r d in ate   Vis u a lizatio n   Co p y rig h ©   2 0 1 8   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e   Al rig h ts  re se rv e d .   C o r r e s p o nd ing   A uth o r :   No o r   E laiza   A b d u l K h alid ,     Un i v er s iti T ek n o lo g i M ar a,   4 0 4 5 0 ,   Sh ah   A la m ,   Sela n g o r   Dar u l E h s an ,   +6 0 3 5 5 4 4 2 0 0 0 ,   Ma la y s ia.   E m ail:  elaiz a @ t m s k . u it m . ed u . m y       1.   I NT RO D UCT I O N     R ec en t   ad v a n ce m e n o f   h ig h   p er f o r m an ce   tech n o lo g ie s   h as  r esu lted   in   co llectio n s   o f   lar g h ig h   d i m en s io n al   d ata.   T h is   co n s is ts   o f   d ata  w i th   lar g e   n u m b er   o f   r ec o r d s   an d   a ttrib u te s .   E x t r ac tin g   m ea n i n g f u l   in f o r m atio n   f r o m   r a w   d ata  c o u ld   b d if f ic u lt  tas k .   On e   w a y   to   u n d er s ta n d   h i g h   d i m en s io n al  d ata  is   t o   d is p la y   it i n   lo w - d i m en s io n a l p lan [1 ].     T h m ai n   m o ti v atio n   f o r   d o m ain   ex p er ts   in   a n al y z in g   th eir   m u ltid i m e n s io n al  d ata  is   to   d etec an d   in ter p r et  clu s ter   s ep ar atio n   a n d   o u tlier s   [2 ] .   P r io r   to   th at,   w e   n ee d   to   s t u d y   a n d   a n al y ze   h ig h   d i m en s io n al   d ata   to   u n d er s tan d   a n d   i n ter p r et  t h r elatio n s h ip   b et w ee n   cl u s t er   an d   d ata  attr ib u tes.  Fe w   ( 2 0 0 7 )   s tated   th a t,   h an d li n g   g r o w in g   h ig h   d i m e n s io n al  d ata  ca u s es  d i f f icu l ti es  esp ec iall y   i n   clu s ter in g   el e m en ts   i n to   g r o u p s   in cl u d in g   v is u aliza t io n   p r o b le m s   d u to   d ata  cl u tter s   o r   d is tr ac tin g   r es u lt s .   P r o p er   cl u s ter i n g   is   u s e f u l   tech n iq u f o r   s tat is tica d ata   an al y s is   [4 ] .   I is   a   p r o ce s s   o f   g r o u p in g   d ata  b a s ed   o n   t h e   s i m ilar it y   o f   t h eir   p r o p er ties .   Hig h   d i m e n s io n a d ata  ca n   b d is p la y ed   in   clu s ter ed   r esu lt  th r o u g h   v i s u al izatio n   ap p r o ac h es  in   w h ic h   t h er ar m an y   tech n iq u es  t h at   ca n   b u s ed .   On o f   it   is   th e   Star   C o o r d in a te  ( SC )   tec h n iq u e.     SC   tech n iq u is   ab le  to   r ev ea p atter n s   an d   g r o u p s   f r o m   h i g h   d i m e n s io n al  d ata  w h ile  s til s h o w i n g   t h i m p ac t   o f   d ata  attr ib u tes  in   t h f o r m atio n   o f   its   p atter n s   an d   g r o u p s   [5 ] .   SC   tech n iq u ca n   also   r ev ea th clu s ter s   th r o u g h   m a n ip u latio n   o f   th e   ax es  b y   tr ial - a n d - er r o r .   T h u s ,   th cr it ical  q u esti o n   h er is   w h ic h   f ea t u r o r   d i m en s io n s   b est  s ep ar ates  t h class e s   an d   al lo w   clu s ter - b ased   d at class i f icatio n .   T h m ai n   p r o b le m   is   w it h o u t p r io r   k n o w led g f in d i n g     t h r ig h t o n e s   is   tr i v ial  [2 ]   A d v an ce s   o f   h ig h   p er f o r m a n ce   tech n o lo g ies  i n   t h f ield   o f   m ed ici n e,   en g i n ee r in g ,   s ci en ce   an d   b u s i n ess   h a s   r es u lted   i n   t h p r o d u ctio n   o f   h u g e   a m o u n ts   o f   d ata,   w h ic h   i s   k n o w n   as   h ig h   d i m en s io n al   d ata.   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752     S ta r   C o o r d in a te  Dimen s io n   A r r a n g eme n t u s in g   E u clid e a n   Dis ta n ce   a n d   ( N o o r   E la iz a   A b d u l Kh a lid )   349   T h is   co n s i s ts   o f   i n f o r m atio n   r elate d   to   m u ltip le  d ata  r ec o r d s ,   attr ib u te s   an d   t h r elatio n s h ip   b et w ee n   th e m .   Hig h   d i m e n s io n al  d ata  i s   d i f f i cu lt  to   i n ter p r et  an d   u n d er s ta n d .   On w a y   to   g et  m ea n i n g f u l   in f o r m atio n   f r o m   h ig h   d i m en s io n al  d ata  i s   th r o u g h   v is u aliza tio n   tech n iq u e.   Vis u a lizatio n   i s   tech n iq u w h ic h   tr an s f o r m s   r a d ata  in to   g r ap h ical  f o r m .   SC   tech n iq u is   o n o f   th f a m i li ar   tech n iq u e s   u s ed   to   v is u aliz h ig h   d i m e n s io n al   d ata.   T h g o o d   o f   u s in g   SC   tech n iq u is ,   d ata  d is tr ib u tio n   an d   d ata  d im e n s io n   ( attr ib u tes)  is   p lo tted   in   s in g le  w i n d o w .   T h u s ,   it  ea s e s   u s er s   to   d o   co m p ar is o n   o r   u n d er s tan d i n g   t h p atte r n   in   v i s u a lizatio n .   C o m p ar ed   to   o th er   tech n iq u e,   it  n ee d s   a   m o r s p ac to   p la ce   th e   r esu lts   o f   v i s u al izatio n .   Hig h   d i m e n s io n al   d ata  co n s is o f   i n f o r m atio n   in   m a n y   tab les  t h at  ar r elate d   to   m u ltip le  d at r ec o r d s   an d   attr ib u tes.   Fu r t h er m o r e,   th er i s   r elati o n s h ip   b et w ee n   r ec o r d s   an d   attr ib u tes.  Data   r ec o r d s   r ep r e s en th d ata  p o in t   w h ile  d ata   d i m e n s io n s   ( at tr ib u tes)  i n v o lv ed   w i th   th e   ax is   p o s itio n   i n   S C   e n v ir o n m en t.   T h ar r an g e m e n t   o f   d ata  d i m en s io n   in   SC   is   v ita s in ce   it  a f f ec ts   t h ap p ea r an c o f   cl u s ter   i n   f u tu r e.   I n itiall y ,   as  la y m en   u s er ,   th e y   w i ll  ap p ly   tr ial - an d - er r o r   m eth o d   to   p r o d u ce   v is u a lizatio n .   T h e y   w ill  ar r an g t h d ata  d im e n s io n   r an d o m l y   w h ic h   ar ex tr ac te d   f r o m   d ata  tab le.   Ho w e v er ,   r an d o m   ar r an g e m e n d o es  n o r ev ea g o o d   clu s ter i n g .     T h m ai n   m o t iv at io n   i n   ex p l o r in g   cl u s ter i n g   a n al y s i s   is   to   d eter m i n w h eth er   t h ar r an g e m e n o f   d ata  d i m en s io n s   i n f lu e n ce s   t h ap p ea r an ce   o f   cl u s ter in g ,   an d   w h y   it  is   i m p o r ta n to   k n o w   th e   co r r ec t   p o s iti o n s   o f   d ata  attr ib u tes   in   ea ch   a x is .   T h er ar t w o   r ea s o n s   w h y   t h is   is   i m p o r tan t.  T h f ir s is   t h at  u s er s   w it h   litt le  k n o w led g o f   SC   te ch n iq u es  m a y   lac k   g u id an ce   i n   ex p lo r in g   th d ata,   h av i n g   t o   r eso r t   to   tr ial - an d - er r o r ,   an d   w o u ld   s u b s eq u e n t l y   f ee d is co u r a g ed   Fen g   et   al.   ( 2 0 1 8 ) .   Seco n d ,   u s er s   n ee d   to   k n o w   th e   i m p o r tan ce   o f   at tr ib u te  p o i n ts   in   t h d ata,   a n d   w h y   t h e y   a r ar r an g ed   t h at   w a y .   K n o w i n g   t h is   b ef o r e h a n d   w o u ld   en ab le  th e m   to   f o r m   a   g o o d   s u m m ar y   an d   m a k f aster   d ec is io n .   SC   is   li m ited   w h e n   it  co m es  to   h ig h   n u m b er   o f   d ata  d i m en s i o n s   an d   w i ll  cl u tter   th d ata  f o r m atio n .   T h ir d ,   it  is   i m p o r t an to   eli m i n ate  th e   ir r elev an t   d ata  d i m en s io n s   f r o m   b ein g   d is p la y ed   [5 ]   t h at  w o u ld   n o t   af f ec t   t h f o r m atio n   o f   d ata  a n d   a v o id   clu s ter .   Fro m   t h is ,   s et  o f   q u esti o n s   ar is w h ic h   m o ti v ate s   o u r   w o r k Ho w   to   m o ti v ate  la y m a n   u s er s   w it h o u t   p r e - k n o w led g i n   S C   o n   t h f ir s s tep   i n   cl u s ter i n g   a n al y s i s ?   W h er is   th co r r ec t,  p r o p e r   p lace m en t   o f   d ata   d i m en s io n s ?   W h y   it  i s   i m p o r tan to   k n o w   t h r ig h p o s iti o n   o f   d ata  attr ib u te s ?   W h ich   d ata  d im e n s io n s   is   ir r elev an t to   b d is p la y   i n   an   S C   la y o u t?   I n   th n e x t p ar ag r ap h ,   r elate d   w o r k s   to   th is   s t u d y   i s   r ev ie w ed .   P r ev io u s   li ter atu r r elate d   to   d i m e n s io n   ar r an g e m en t   i n   S C   w il l b d is c u s s ed   i n   d etail.   A s   in tr o d u ce d   b y   Ka n d o g an ,   R o ad ,   &   J o s ( 2 0 0 0 ) ,   SC   i s   a   s i m p le  a n d   e f f i cien tech n iq u e   f o r   v i s u a lizi n g   m u ltid i m en s io n al   d ata.   SC   w o r k s   b y   p r ese n ti n g   d ata  p o in ts   u s i n g   v ec to r   s u m   o f   attr ib u tes  v al u es  alo n g   t h e   ax is .   I n   t h i s   p ap er ,   th e y   p r o v id ed   th u s er s   w i th   th ab il it y   to   v ie w   cl u s ter s ,   tr en d s   an d   o u tlier s   i n   t h d is tr ib u tio n   o f   d ata.     C lu s ter   a n al y s i s   i s   o f ten   o n e   o f   t h f ir s s tep s   i n   th e   an a l y s is   o f   d ata.   Ho w e v er ,   t h er ar s o m e   w ea k n e s s e s   i n   ex p o s in g   t h clu s ter s   p atter n ,   t h lar g es t o f   w h ich   i s   th ar r a n g e m e n t o f   d i m en s io n s .     T h er ar s ev er al  s t u d ies   w h i ch   f o cu s   o n   d i m e n s io n   ar r an g e m en t.  T h f ir s p ap er   is   f o u n d   in   y ea r   1 9 9 8   b y   A n k er s t,  B er ch to ld ,   &   Kei m .   T h e y   s tated   th at  t h o r d er   an d   ar r an g e m e n o f   d i m en s io n s   p la y s   a   s ig n i f ica n r o le  in   p r esen tin g   m a n y   h ig h - q u alit y   v is u ali za tio n   tech n iq u es  s u c h   as  p ar allel  co o r d in ate,   s ca tter p lo an d   m o r e.   I n   th eir   p ap er ,   d im e n s io n   ar r an g e m e n t   is s u h as  b ee n   s h o w n   to   b a n   N - P   p r o b lem   a n d   th e y   s u g g ested   u s in g   h e u r is tic   alg o r ith m   to   d eter m i n t h s i m ilar it y   o f   ea ch   d ata  d i m e n s i o n .   Data   d im e n s io n   w it h   s i m ilar   b eh a v io r s   ar p la ce d   n ex to   ea ch   o t h er .   Yan g ,   P en g ,   W ar d ,   &   R u n d en s tein er   ( 2 0 0 3 )   p r o p o s ed   an   in ter ac ti v h ier ar ch ical  o r d er in g   o f   t h d i m en s io n s   b as ed   o n   th eir   s i m ilar itie s ,   th u s   i m p r o v in g   th e   m an a g ea b ilit y   o f   h i g h - d i m e n s io n al  d ataset s   an d   r ed u ci n g   th co m p lex it y   o f   th o r d er in g .   W ar d   &   R u n d en s tei n er   ( 2 0 0 4 )   ap p lied   th co n ce p o f   cl u tter - b as ed   d i m en s io n   o r d er in g   i n   v ar io u s   v is u aliza tio n   tech n iq u es  to   r ed u ce   t h v is u al  clu tter .   T h en ,   S u n ,   T an g ,   T an g ,   &   Xiao   ( 2 0 0 8 )   ca m o u t   w it h   t h eir   id ea   o n   d esig n in g   d i m en s io n   co n f i g u r atio n   s tr ate g y   to   o p ti m ize  th o r d er   an d   an g le  o f   th d i m e n s io n   ax es.  T h e y   u s e   d ia m eter   as  t h d i m en s io n   a x is   i n s tead   o f   r ad i u s .   I n   2 0 1 0 ,   Di  C ar o ,   Fria s - Ma r ti n ez ,   &   Fria s - Ma r ti n ez   p r esen ted   o n   u n d er s ta n d in g   th r elatio n   b et w ee n   t h ar r an g e m en o f   d i m e n s io n s   an d   th q u a lit y   o f   v is u aliza t io n   u s i n g   t h R ad v iz   tech n iq u e.   Gar cia  et  al.   ( 2 0 1 6 )   p r o p o s ed   an   in ter ac tiv S tar   C o o r d in ate  ( iSt ar )   w h ic h   ca n   h a n d le  lar g n u m b er   o f   d ata  d im e n s io n s .   T h e y   also   s t u d ied   h o w   t h o r d er   o f   d ata  d i m en s io n   ca n   h av a n   i m p ac o n   r ev ea li n g   p atter n   an d   clu s ter in g ,   en ab li n g   u s er s   to   u n d er s ta n d   th e m   ea s ier .   W an g   et  al.   ( 2 0 1 7 )   s tu d ied   ab o u d eter m i n in g   w h ic h   d i m e n s io n s   ar r elev an o r   ir r elev an to   b d is p la y ed   in   t h S C   la y o u w h ic h   co n tr ib u tes to   cl u s ter i n g .   T h is   p ap er   p r esen ts   th s tu d y   o f   d im e n s io n   ar r an g e m e n in   SC   en v ir o n m e n to   r ev ea th clu s ter s   u s i n g   P ea r s o n   C o r r e la tio n   te ch n iq u w i th   b asic   k n o w led g o f   SC   tec h n iq u e.   T h p r o p o s ed   m et h o d   w h ich   n o o n l y   i m p r o v es  t h ef f icie n c y   o f   a x es  m an ip u latio n   w it h   h i g h er   clu s ter   q u ali t y ,   b u a ls o   en ab les  u s er s   to   lear n   th r elatio n s   b et w ee n   clu s ter s   an d   d ata  attr ib u tes.  Di m e n s io n s   ar ar r an g ed   b ased   o n   th s o r ted   co r r elatio n   v al u w it h i n   t h s a m le n g t h   o f   a x is   an d   a n g le.   T h co r r elatio n   v alu e s   wh ich   s h o w   s i m ilar   b eh av io r   ar p lace d   n ex to   ea ch   o th er   an d   w o u ld   b en e f it  f ir s t - t i m u s er s   u s in g   S C   tech n iq u b y   s er v i n g   a s   g u id a n ce   w h e n   o b s er v i n g   t h clu s ter s   ap p ea r an ce .   Firs tl y ,   t h d is ta n ce   o f   ea c h   d ata   attr ib u tes   ar ca lc u lated .   T h en   th co r r ela tio n s   b et w ee n   d ata  attr ib u te s   w er d eter m in ed .   T h co r r elatio n   v alu e s   f r o m   s m a ll  to   lar g e   v alu e   w er s o r ted .   T h co r r ela tio n   v a lu e s   w o u ld   p r o d u ce   n e g ati v an d   p o s iti v v alu e s .   W h en   p lo tti n g   t h d ata   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l 1 2 ,   No .   1 Octo b er   201 8     3 4 8     355   350   in   S C ,   t h n e g ativ e   co r r elatio n   v al u es  f o r   ea ch   d ata  attr ib u tes   w ill b p o s itio n ed   o n   t h le f t   s id w h ile  p o s iti v v alu w o u ld   b p lace d   o n   th r ig h t sid e.   T h r em ai n i n g   p ar o f   t h is   p ap er   is   o r g an ized   in   t h f o ll o w i n g   m a n n er Sectio n   2   d escr ib es  th e   m et h o d o lo g y   u s ed .   R e s u lt  an d   d is cu s s io n   w i ll  b ex p lai n ed   in   s ec tio n   3 .   L a s tl y ,   t h co n clu s io n   w i ll  b e   d is cu s s ed   in   s ec tio n   4 .       2.   RE S E ARCH   M E T H O D     I n   t h is   s ec tio n ,   all   t h p r o ce s s es  an d   ex p er i m en t s   t h at   h a v b ee n   d o n w i ll  b d i s cu s s ed   i n   d etail.   S C   la y o u co n s is ts   o f   cir c u lar l y   a r r an g ed   v ec to r s   v i   w it h   co m m o n   o r ig i n ,   ea ch   v ec to r   co r r e s p o n d in g   to   d ata  attr ib u te.   Data   in s ta n ce s   ar m ap p ed   to   th lay o u as  lin ea r   co m b in at io n   o f   th v ec to r s   v i.  T o   im p r o v th e   u s er   e x p er ien ce ,   S C   m et h o d s   en ab le  i n ter ac tiv e   f ea tu r es   th a allo w   u s er s   to   r o tate  th a n g le  o f   t h v ec to r s   v i   to   f in d   co n f i g u r atio n s   w h er p atter n s   a n d   g r o u p s   ar m o r cl ea r l y   r ev ea led .     2 . 1 .     Da t a   Co llect io n   T o   test   th m et h o d ,   an   au to m o b ile  d atase w ill  b u s ed   in   th e x p er i m e n t.  T h is   d ataset  is   a   b en ch m ar k   d ata  th a is   w id el y   u s ed   b y   v ar i o u s   r esear ch er s   an d   co n s is o f   3 9 5   au to m o b iles   f r o m   t h 1 9 7 0 s   u n t il  1 9 8 0 s .   T h attr ib u tes  m ea s u r ed   h er ar f u el  e f f ici en c y - m ile s   p er   g al lo n   ( MP G) ,   n a m o f   th e   ca r s   ( n a m e) ,   o r ig in   o f   t h e   ca r   ( o r ig in ) ,   y ea r   o f   th e   ca r   ( y ea r ) ,   ac ce ler atio n ,   w eig h t,  h o r s e p o w er ,   e n g in e   d is p lace m e n t ( d is p lace m e n t)   a n d   n u m b er   o f   c y lin d er s   ( c y li n d er s ) .     2 . 2   P r o ce s s   a nd   pro ce du re s   T h f ig u r b elo w   s h o w s   t h p r o ce s s   o n   ar r an g in g   t h d ata  d im en s io n   i n   r ig h t p o s itio n .   T h er ar s ix   s tep s   i n   th is   p r o ce s s .   Deta il s   ar d is cu s s ed   b e lo w :           Fig u r 1 .   T h p r o ce s s   o f   d i m e n s io n   ar r an g e m e n t i n   SC   e n v ir o n m e n t       Ste p 1 : Calcu la te  d is ta n ce .   Me th o d   u s ed   in   ca lc u lati n g   d is ta n ce   is   E u c lid ea n   d is ta n ce .     E q .               (           )               T o   d eter m i n t h eir   s i m ilar it y ,   E u clid ea n   d is ta n ce   m ea s u r is   u s ed .   R e s u lts   ar u s ed   to   d eter m in e   th s i m ilar it y   ar r an g e m en t o f   d i m en s io n s   as i n   Step   2 .   Ste p 2 : P ea r s o n   co r r elatio n ,     .     E q .           (    )       (   ) (   ) (             (   )   ) (             (   )   )       I n   o r d er   to   d eter m i n t h co r r elatio n   b et w ee n   ax is ,   t h P ea r s o n   f o r m u la  i s   u s ed .   T h is   s tep   is   cr u c ial  to   e n s u r e   th p o s itio n   o f   ea c h   ax is   is   co r r ec t so   th at  th ap p ea r an ce   o f   ea ch   clu s ter   ca n   b id en ti f ied .   Ste p 3 : So r t th co r r elatio n   v a lu es   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752     S ta r   C o o r d in a te  Dimen s io n   A r r a n g eme n t u s in g   E u clid e a n   Dis ta n ce   a n d   ( N o o r   E la iz a   A b d u l Kh a lid )   351   I n   th i s   s tep ,   ea ch   ax is   w ill  b e   s o r ted   f r o m   t h h ig h est  to   t h lo w est  v al u e.   T h s o r ted   ax is   ca n   b e   r ef er r ed   as  i n   t h T ab le  1 .   Ho w e v er ,   n o a ll  a x es  w ill  b s elec ted ,   if   th e   co r r elatio n   v alu e   is   o u o f     r an g [ - 0 . 5 ,   0 . 5 ] .   T h attr ib u te   o f   Or ig i n   a n d   A cc eler atio n   ar n o ch o s e n   to   b d is p la y ed   i n   t h v i s u a lizatio n   s in ce   it d o es n m ee t t h r an g e .       T ab le  1 .   A n   ex a m p le  o f   s o r ted   attr ib u tes  w it h   co r r elatio n   v al u u s in g   MP attr ib u te  as a n   an ch o r   A n c h o r :   M P G   C o r r e l a t i o n   V a l u e   C h o se n   A x e s   M P G   w i t h   Y e a r   0 . 5 8 0 3 8 4       M P G   w i t h   O r i g i n   0 . 4 7 9 5 4 9       M P G   w i t h   A c c e l e r a t i o n   0 . 4 2 0 5 7 4       M P G   w i t h   C y l i n d e r   - 0 . 7 7 7 1 4       M P G   w i t h   H o r se p o w e r   - 0 . 7 7 8 4 3       M P G   w i t h   D i s p l a c e me n t   - 0 . 8 0 5 2 5       M P G   w i t h   W e i g h t   - 0 . 8 3 2 2 8           Ste p 4 : P lo t th d ata  d im e n s io n   ( attr ib u tes)  w it h   s a m a n g le  b et w ee n   ea ch   a x is   1.   Neg ati v o n   t h lef t.   2.   P o s itiv o n   th r i g h t.   As  ca n   b s ee n ,   v ec to r   ad d itio n s   w it h i n   t h S C   s p ac m u s b v alid ,   in   o r d er   to   p r o j ec t   all  th d ata   p o in ts   co r r ec tl y   o n   an   S C .   I is   clo ck w is a n g le  b et w ee n   ax es.  T h p o s itiv co r r elatio n   v alu i s   p lace d   o n   th r i g h s id e,   w h i le  n eg at iv e   co r r elatio n   v a lu e   is   p lace d   o n   t h le f t   s id e.   T h o u tli n o f   ax i s   p o s itio n ed   i s   s h o w n   b elo w   i n   Fi g u r 2 .         Fig u r 2 .   T h o u tlin o f   ax is   p o s itio n   b as ed   o n   o b tain s   co r r elatio n   v al u e       B ased   o n   T ab le  1 ,   th f ir s a x is   to   b p o s itio n ed   o n   t h r i g h t   s id a f ter   a n   a n ch o r ,   MP w it h   t h e   p o s itiv co r r elatio n   v a lu i s   Yea r ,   f o llo w ed   b y   n eg a tiv c o r r elatio n   v alu w h ic h   is   C y l in d er ,   Ho r s ep o w er ,   Dis p lace m e n t a n d   W eig h t.    Ste p 5 :   I d en tify   cl u s ter s   Af ter   p lo ttin g   th a x is ,   an   ea r l y   cl u s ter   ap p ea r an ce   is   f o r m e d .   T h is   clu s ter   ca n   b an   in itia g u id eli n e   to   th la y m e n   to   d o   m o r d ata  ex p lo r atio n .       3.   RE SU L T A ND  AN AL Y SI S   B ef o r i m p le m en t in g   p r o p o s ed   m et h o d ,   w ca m o u w i th   r an d o m   p lo tti n g .   T h i s   is   to   s h o w   w h et h e r   p lo ttin g   r a n d o m l y   ca n   p r o d u ce   clu s ter   r es u lts   o r   n o t.  R e s u l ts   ar s h o w n   i n   Fi g u r 3 .   Fig u r 3   s h o w s   r an d o m l y   p lo t ted   d ata  d im e n s io n s .   As  ill u s t r ated   f r o m   th is   f i g u r e,   w ar e   u n ab le  to   b o th   ex tr ac a n y   u s e f u i n f o r m atio n   an d   d e f i n t h r elatio n s h i p   b et w ee n   d ata  d i m en s io n s .   T h r es u lt   o n l y   s h o w s   t h d is tr ib u tio n   o f   d ata  th at  r ep r esen ts   h i g h   d i m e n s io n al  d ata  v is u aliza tio n   in   ( a) .   I n   ( b )   it  s h o w s   t h at   m p g   is   p lo tted   as a n   an c h o r   to   ex a m i n t h co m p r o m is e   b et w ee n   o t h er   d ata  at tr ib u tes.   Ho w e v er ,   t h p o s itio n s   o f   d ata  attr ib u tes  ar p lace d   r eg ar d less   o f   i n ter r elate d n e s s   b et w ee n   attr ib u te  d ata.   C y l in d e r ,   h o r s ep o w er ,   an d   w ei g h ar p o s itio n ed   o n   th r ig h s id e,   w h ile  o r ig i n ,   y ea r   an d   ac ce ler atio n   ar lo ca ted   t o   th o p p o s ite.   B ased   o n   ( b ) ,   th d ata  is   p lo tte d   i n   tr ial - a n d - er r o r   m et h o d   to   g et  u s e f u i n f o r m atio n .   U n f o r tu n atel y ,   w it h o u t   k n o w i n g   t h co r r elatio n   b et wee n   d ata  a ttrib u te s   it   is   m ea n in g les s .   Fi g u r i n   ( c)   s h o w s   th ap p ea r an ce   o f   clu s ter s ,   b u w it h o u k n o w in g   th r ea s o n   w h y   it  i s   p o s itio n e d   in   t h at  w a y .   Her e,   h o r s ep o w er   d ata  ar p lo tted   as  an   a n ch o r   to   s ee   t h e f f ec t   o n   o th er   d ata  attr ib u te s .   L a s t l y   i n   ( d )   w ar ab le  to   r ev ea th cl u s ter ,   w i th   m i n i m al  p r ev io u s   k n o w led g o n   th i m p o r ta n ce   in   d ata  d im en s io n   ar r an g e m e n t,  b u th r o u g h   tr ial - a n d - er r o r   p r o ce s s .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l 1 2 ,   No .   1 Octo b er   201 8     3 4 8     355   352   Ste p 1 :   Ra nd o m   P lo t t ing             a)   N A M A       b)   M P G         c)   H O R S EPO W ER       d)   D I S P L A C EM EN T   Fig u r 3 .   R an d o m   p lo tti n g   w i t h   d if f er en t a n c h o r s   alo n g   w i th   all  d ata  d im e n s i o n s   u s i n g   th s a m a n g les i n   SC       A ll  o f   th ab o v w i ll  tak m o r tim to   g et  a n   ac cu r ate  r esu lt.   T h er ef o r to   av o id   th is   o b s tacle ,   w e   ap p lied   th p r o p o s ed   m et h o d .     Ste p2 :   Re m o v v a lue in r a ng [ - 0 . 5 ,   0 . 5 ]   T h is   ex p er i m e n w ill  b test e d   o n   all  th d ata  attr ib u tes  th at  ac as  an   an c h o r .   P r io r   to   th at,   d ata   attr ib u tes  w it h   co r r elatio n   v alu b et w ee n   - 0 . 5   an d   0 . 5   w ill   b ab o lis h ed .   T h is   is   b ec au s e ,   th d ata  attr ib u tes   w it h i n   t h at  r an g w il b co n s id er ed   as  less   co r r elate d   w i t h   th o t h er   d ata  attr ib u te s   as  it  d o es  n o h elp   i n   p er f o r m in g   clu s ter in g   p atter n .   Fig u r 4   s h o w s   an   e x a m p l th at  tak es  MP as  an   an ch o r   an d   r em o v e s   ac ce ler atio n   an d   o r ig i n   d ata  d im en s io n .             Fig u r 4 .   A cc eler atio n   a n d   Or i g in   d ata  d i m en s io n   w i ll b r em o v ed   as it i s   in   r a n g [ - 0 . 5 ,   0 . 5 ]       Ste p 3 :   P lo t   t he  s elec t ed  da t a   a t t ribute s   T h en ,   s elec ted   d ata  attr ib u tes t h at   h a v n e g ati v v alu w i ll b p o s itio n ed   o n   th le f t sid e,   wh ile  p o s iti v v al u w il l b p o s itio n ed   o n   th r ig h s id e.     E ac h   d ata  attr ib u tes ar p r esen ted   in   d if f er en t a x i s ,   d iv id ed   w i th i n   t h s a m a n g le  an d   ar r an g ed   i n   cl o ck w is e.   T h s a m e x p er i m e n ts   g o es   to   d if f er en t a n c h o r ; c y l in d er ,   d is p lace m e n t a n d   y ea r .   T h ese  r esu lt s   ar illu s tr ated   in   T ab le  2 .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752     S ta r   C o o r d in a te  Dimen s io n   A r r a n g eme n t u s in g   E u clid e a n   Dis ta n ce   a n d   ( N o o r   E la iz a   A b d u l Kh a lid )   353   T ab le  2 .   R esu lts   f o r   d if f er e n t a n ch o r s   SC   D e scr i p t i o n     A n c h o r :   M PG                 I n   t h i e x p e r i me n t ,   a l l   c o r r e l a t i o n   t h a t   i s   >   - 0 . 5   a n d   <   0 . 5   i e l i mi n a t e d .   W h i c h   me a n s   a c c e l e r a t i o n   a n d   o r i g i n   h a s   t h e   c o r r e l a t i o n   l e ss  t h a n   0 . 5 .   I n d i c a t i n g   l o w   c o r r e l a t i o n .     T h e   a x i t h a t   a r e   se l e c t e d   a r e   y e a r ,   c y l i n d e r ,   h o r se p o w e r ,   d i s p l a c e me n t   a n d   w e i g h t .   T h e   se l e c t e d   a x e a r e   p l a c e d   i n   so r t e d   o r d e r   a n d   l o c a t e d   e v e n l y   t h r o u g h o u t   t h e   3 6 0   a n g l e .     T h e   r e su l t i n g   i m a g e   i s a   v a g u e   f o r mat i o n   o f   3   c l u st e r s.     A n c h o r :   C y l i n d e r                 A t h e   a b o v e   c o r r e l a t i o n   v a l u e ,   i t   s h o w t h a t   Y e a r   w i l l   b e   e l i mi n a t e d   i n   t h e   d i sp l a y   b e c a u se   i t v a l u e   i g r e a t e r   t h a n   -   0 . 5 .       T h e   sel e c t e d   a x e a r e   d i sp l a c e me n t ,   w e i g h t ,   h o r se p o w e r ,   a c c e l e r a t i o n ,   o r i g i n   a n d   M P G .   T h e   l e n g t h   o f   t h e   a x e s   w i l l   b e   k e p t   t h e   same   a n d   t h e y   a r e   e v e n l y   l o c a t e d   t h r o u g h o u t   t h e   3 6 0   a n g l e .     A t t r i b u t e w h i c h   h a p o s i t i v e   v a l u e   w i l l   b e   p l a c e d   o n   t h e   r i g h t   si d e   w h i l e   n e g a t i v e   v a l u e w i l l   b e   p l a c e d   o n   t h e   l e f t   si d e .   H o w e v e r ,   w h i c h   a x i s   sh o u l d   c o me   f i r st   i s   d e t e r mi n e d   b y   i t c o r r e l a t i o n   v a l u e .     A t t r i b u t e   w i t h   h i g h e r   c o r r e l a t i o n   v a l u e   l i k e   d i s p l a c e me n t   w i l l   b e   l o c a t e d   a f t e r   i t s   a n c h o r ,   c y l i n d e r .   N e x t ,   l o w e r   c o r r e l a t i o n   v a l u e   su c h   a w e i g h t   w i l l   b e   p l a c e d   n e x t   t o   d i sp l a c e me n t   f o l l o w e d   b y   h o r se p o w e r   a t t r i b u t e .       W h i l e   f o r   n e g a t i v e   c o r r e l a t i o n   v a l u e ,   t h e   sm a l l e r   v a l u e   l i k e   M P G   w i l l   b e   p l a c e d   n e x t   t o   i t s a n c h o r ,   c y l i n d e r .       A l l   o f   t h e   d i me n s i o n   p o si t i o n   i s   a r r a n g e d   c l o c k w i se .   T h e   r e su l t i n g   i m a g e   sh o w s fo r mat i o n   o f   4   c l u s t e r s.   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l 1 2 ,   No .   1 Octo b er   201 8     3 4 8     355   354   SC   D e scr i p t i o n     A n c h o r :   D i sp l a c e m e n t             A t t r i b u t e   Y e a r   i e l i mi n a t e d   f r o t h e   d i sp l a y   si n c e   i t   sh o w c o r r e l a t i o n   v a l u e   g r e a t e r   t h a n   - 0 . 5 .   T h e   p o s i t i o n s   o f   a t t r i b u t e a r e   same   a t h e   p r e v i o u a n c h o r ;   c y l i n d e r   e x c e p t   f o r   t h e   d i sp l a c e me n t   w h i c h   s w a p i t   p l a c e w i t h   t h e   c y l i n d e r .       T h e   d i sp l a y   o f   t h i f i g u r e   sh o w t h e   si mi l a r i t y   d a t a   p a t t e r n   w i t h   a n c h o r   c y l i n d e r .   T h o u g h   d i sp l a c e me n t   a n d   c y l i n d e r   a r e   s w a p p e d   t h e   p a t t e r n   o f   d a t a   s h o w t h e   si mi l a r i t y   a i n   t h e   p r e v i o u f i g u r e .   I t   i n d i c a t e t h a t   t h e   c o r r e l a t i o n   b e t w e e n   d i s p l a c e me n t   a n d   c y l i n d e r   h a s   h i g h e r   c o r r e l a t i o n   c o mp a r e d   t o   o t h e r   a t t r i b u t e s.     T h e   r e su l t i n g   i m a g e   sh o w s fo r mat i o n   o f   4   c l u s t e r s.     A n c h o r :   Y e a r             T h e   a n c h o r   i n   t h i f i g u r e   i y e a r .   A l l   o f   t h e   a t t r i b u t e sh o w   t h a t   t h e i r   c o r r e l a t i o n   v a l u e   i g r e a t e r   t h a n   - 0 . 5   a n d   l e ss  t h a n   0 . 5   e x c e p t   o r i g i n   a n d   M P G .   T h i me a n t h a t   o r i g i n   a n d   M P G   a r e   n o t   e l i mi n a t e d   i n   t h e   d i s p l a y .       B a se d   o n   t h e   f i g u r e ,   t h e r e   i n o   st r o n g   c o r r e l a t i o n   a mo n g   h o r se p o w e r ,   d i sp l a c e me n t ,   c y l i n d e r ,   w e i g h t   a n d   a c c e l e r a t i o n .   T h u s,  n o   c l u st e r   i s   f o r me d   i n   t h i p r e se n t a t i o n .     T h u s,  y e a r   a t t r i b u t e   sh o u l d   b e   e l i m i n a t e d   d u r i n g   t h e   d i s p l a y   si n c e   t h e r e   i n o   o b v i o u c o r r e l a t i o n   b e t w e e n   o r i g i n   a n d   m p g .         4.   CO NCLU SI O N     Dete r m i n i n g   th co r r elatio n   b et w ee n   d ata  d i m en s io n   is   v ital   in   p er f o r m in g   cl u s ter in g   a n al y s i s .   Usi n g   th P ea r s o n   m et h o d   m a k e s   it  ea s y   to   k n o w   t h co r r ec p o s itio n in g   o f   d ata  d i m en s io n s   i n   an   SC .   C o n s eq u en tl y ,   g i v in g   la y m e n   w it h   t h is   i n f o r m atio n   h elp s   t h e m   in   t h eir   f ir s t s tep   to w ar d s   ex p lo r in g   an al y s is   o f   th ese   cl u s ter s ,   w h ich   t h u s   s a v es  th e m   f r o m   d o in g   ti m e - co n s u m i n g   tr ial - a n d - er r o r   p r o ce s s .     T h u s ,   th p r o p o s ed   tech n iq u e   co u ld   ass is u s er s   to   r ev ea th clu s ter   r elatio n s h ip   b et w e en   d ata  d im e n s io n   th r o u g h   d i m en s io n   co r r elatio n .       RE F E R E NC E   [ 1 ]     S a n c h e z   A ,   L e h m a n n   DJ .   Ad a p t a b le  Ra d ia Axe Pl o ts  fo Imp ro v e d   M u lt iva ria te  Da ta   Vi su a li za t io n Co m p u t   Gr a p h   Fo ru m .   2 0 1 7 ;3 6 (3 ) :3 8 9 9 9 .     Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752     S ta r   C o o r d in a te  Dimen s io n   A r r a n g eme n t u s in g   E u clid e a n   Dis ta n ce   a n d   ( N o o r   E la iz a   A b d u l Kh a lid )   355   [2 ]     W a n g   Y,  L J,   Nie   F ,   T h e ise l   H,  G o n g   M ,   L e h m a n n   DJ .   L in e a D isc rimin a ti v e   S ta Co o r d in a tes   fo Exp lo rin g   Cla ss   a n d   Cl u ste r S e p a ra ti o n   o f   Hig h   Dime n si o n a Da ta Co mp u Gr a p h   Fo ru m .   2 0 1 7 ;3 6 (3 ) :4 0 1 1 0 .     [3 ]     F e w   S .   Da ta   Vi s u a l iza ti o n   Pa st,   Pre se n a n d   F u tu re .   P e rc e p t   e d g e .   2 0 0 7 .   [4 ]     M o M .   A   Rev iew  o n   Va ri o u Clu ste rin g   T e c h n i q u e i n   Da t a   M in in g In t   J   Co mp u S c Co m mu n   Ne two rk s 2 0 1 6 ; 6 (Ju ly ):1 3 8 4 2 .     [5 ]   G a r c ia  G ,   G u sta v o   L ,   G o m e z - n ie to   E.   iS t a ( i* ):  An   in ter a c ti v e   sta c o o rd in a tes   a p p ro a c h   fo h i g h - d ime n sio n a l   d a t a   e x p lo ra ti o n .   Co m p u t   G ra p h   [ In tern e t ] .   El se v ier 2 0 1 6 ; 6 0 :1 0 7 1 8 .   A v a il a b le  f ro m :   h tt p : // d x . d o i. o rg /1 0 . 1 0 1 6 /j . c a g . 2 0 1 6 . 0 8 . 0 0 7   [6 ]     F e n g   K,  W a n g   Y,  Zh a o   Y,  F u   C,   Ch e n g   Z,   C h e n   B.   C lu ste a wa re   S ta C o o rd in a tes .   Vis  L a n g   Co m p u [ I n tern e t ] .   El se v ier   L td 2 0 1 7 ; 4 4 : 2 8 3 8 .   A v a il a b le f ro m h tt p s:// d o i. o rg /1 0 . 1 0 1 6 /j . jv lc.2 0 1 7 . 1 1 . 0 0 3   [7 ]     Ka n d o g a n   E,   Ro a d   H,  Jo se   S .   S ta Co o rd i n a tes  :  M u lt i - d ime n sio n a Vi s u a li z a ti o n   T e c h n i q u e   wit h   Un if o rm   T re a tme n o Dime n sio n s Pr o c   I EE In f   Vi S y mp .   2 0 0 0 ;( 6 5 0 ): 2 2 .     [8   A n k e r st  M ,   Be rc h to l d   S ,   Ke im  a .   S imil a rity  c lu ste rin g   o f   d ime n sio n f o a n   e n h a n c e d   v isu a li za ti o n \ n o f   mu lt id ime n sio n a d a ta Pro c   IEE S y mp   I n Vi s .   1 9 9 8 ;9 8 : 5 2 6 0 .     [9 ]     Ya n g   J,  P e n g   W ,   W a rd   M O,  R u n d e n ste in e EA .   In ter a c ti v e   h i e ra rc h ica d ime n si o n   o rd e rin g ,   sp a c in g   a n d   fi lt e rin g   fo e x p lo ra ti o n   o h ig h   d ime n sio n a l   d a ta se ts Pr o c e e d in g -   IE EE   S y mp o si u o n   In fo rm a t io n   Vi su a li z a ti o n ,   INFO  V IS .   2 0 0 3 .   1 0 5 - 1 1 2   p .     [1 0 ]     W a rd   M O,  Ru n d e n ste in e a .   Clu tt e Red u c ti o n   i n   M u lt i - Dime n sio n a Da t a   Vi su a li z a ti o n   Us in g   Dime n sio n   Reo rd e rin g IEE E   S y mp   I n Vi s .   I e e e 2 0 0 4 ;8 9 9 6 .     [1 1 ]     S u n   Y ,   T a n g   J,  T a n g   D,  X iao   W .   Ad v a n c e d   S t a Co o rd i n a tes Pro c e e d in g -   T h e   9 t h   I n ter n a t io n a Co n fer e n c e   o n   W e b - A g e   In f o rm a ti o n   M a n a g e me n t,   W AIM   2 0 0 8 .   2 0 0 8 .   p .   1 6 5 7 0 .     [1 2 ]     Di  Ca ro   L ,   F rias - M a rti n e z   V ,   F rias - M a rti n e z   E.   An a lyz in g   th e   ro le  o d ime n sio n   a rr a n g e me n fo d a t a   v isu a li za t io n   i n   Ra d v iz P a c if ic - A sia   Co n fer e n c e   o n   K n o w led g e   Di sc o v e ry   a n d   Da t a   M in in g .   2 0 1 0 .   p .   1 2 5 3 2 .       Evaluation Warning : The document was created with Spire.PDF for Python.