I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   20 ,   N o .   3 D e c e m b e r   20 20 ,   pp .   ab   156 9 ~ 157 5   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 20 .i 3 . pp 156 9 - 1575       1569       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   n e w   a p p r o a c h   f o r   i m p r o v i n g   c l u s t e r i n g   a l g o r i t h m p e r f o r m a n c e       A n fal   F .   N .   A l r am m ah i ,   K ad h i m   B.   S .   A l jan ab i   F a c ul t y   o f   C o m put e r   S c i e nc e   a nd   M a t he m a t i c s ,   U ni v e r s i t y   of   K uf a ,   I r a q       A r ti c l e   I n fo     A B S TR A C T   Ar t i c l e   h i s t or y :   R e c e i v e J a n   14 ,   2 0 20   R e v i s e F e b   3,   2020   A c c e pt e F e b   20,   202 0       C l us t e r i ng   r e pr e s e n t s   o ne   o f   t he   m o s t   po pul a r   a n us e D a t a   M i n i ng   t e c hni que s   due   t o   i t s   u s e f u l ne s s   a n t h e   w i d e   v a r i a t i o ns   o f   t he   a ppl i c a t i o ns   i n   r e a l   w o r l d .   D e f i ni ng   t he   n um be r   o f   t he   c l us t e r s   r e qu i r e i s   a a ppl i c a t i o o r i e n t e c o nt e xt ,   t hi s   m e a ns   t ha t   t h e   num be r   o f   c l us t e r s   i s   a i npu t   t o     t he   w ho l e   c l us t e r i ng   pr o c e s s .   T he   p r o po s e a pp r o a c r e p r e s e n t s   a   s o l ut i o f o r   e s t i m a t i ng   t he   o pt i m um   n um be r   o f   c l us t e r s .   I t   i s   b a s e o t he   u s e   o f   i t e r a t i v e   K - m e a ns   c l u s t e r i ng   unde r   t hr e e   d i f f e r e nt   c r i t e r i a ;   c e nt r o i d s   c o n v e r g e nc e ,   t o t a l   d i s t a nc e   be t w e e t h e   o bj e c t s   a n t he   c l u s t e r   c e nt r o i a nd   t he   num b e r   o f   m i g r a t e o bj e c t s   w hi c c a n   be   us e d   e f f e c t i v e l y   t o   e ns ur e   be t t e r   c l us t e r i ng   a c c ur a c y   a nd  pe r f o r m a nc e .   A   t o t a l   o f   20000  r e c o r ds   a v a i l a b l e   o t he   i n t e r ne t   w e r e   us e i t he   p r o po s e a p pr o a c t o   t e s t   t he   a ppr o a c h.     T he   r e s u l t s   o bt a i n e f r o m   t he   a pp r o a c s ho w e g oo i m pr o ve m e nt   o n   c l us t e r i ng   a c c ur a c y   a nd  a l g o r i t hm   pe r f o r m a nc e   o v e r   t he   o t he r   t e c hni qu e s   w he r e   c e n t r o i d s   c o n v e r g e nc e   r e pr e s e n t s   a   m a j o r   c l us t e r i ng   c r i t e r i a .   C a nd   M i c r o s o f t   E xc e l   w e r e   t he   s o f t w a r e   u s e d   i n   t h e   a pp r o a c h.     Ke y w or d s :   Ce n t r o i ds   Cl us t e r i n g   E uc l i d i a D i s t a n c e   C opy r i gh t   ©   20 20   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   A n f a l   F a l a N a j e e b   A l r a m m a hi ,   D e pa rt m e n t   o f   Co m put e S c i e n c e ,     U n i v e r s i t y   of   K uf a ,   I r a q .   E m a i l :   a n f a l 9 a b d@ g m a i l . c o m       1.   I N TR O D U C TI O N     Cl us t e r i n g   a m o n g   t h e   di f f e r e n t   D a t a   M i n i ng  t e c hni que s   i s   t h e   m o s t   w i de l y   us e D M   t e c h ni que .   Cl us t e r i n i n   D a t a   M i n i ng  ( D M i s   t h e   m e t h o o gr o upi n da t a   o bj e c t s   i n t o   c l us t e r s ,   w h e r e   da t a   o b j e c t s   a r e   s i m i l a r   t o   e a c h   o t h e r   w i t h i n   a   c l us t e r   a n di s s i m i l a r   t o   o t h e r   da t a   o bj e c t s   i n   o t h e r   c l us t e r s .   S i m i l a ri t i e s / D i s s i m i l a r i t i e s   b e t w e e n   da t a   o bj e c t s   a r e   e s t i m a t e b a s e o n   t h e   a t t ri b ut e   v a l ue s   by   us i n di s t a n c e   m e a s u r e s .   T h e   m a i n   go a l   o f   da t a   c l us t e ri n t o   f i n t h e   g r o ups   o f   a   s e t   of   po i n t s ,   p a t t e rn s   o r   o b j e c t s . o t h e r   purpo s e s   t o   da t a   c l us t e r i n g   c a n   b e   us e t o   ga i n   i n s i gt   i nt o   da t a ,   di s c o ve r   a n o m a l i e s ,   i de n t i fy   f e a t ur e s   of    t h e   da t a ,   f i nd  t h e   de gr e e   of   s i m i l a r i t y   a n o r ga ni z e   a nd  s um m a ri z e   t h e   da t a .   I n   s o m e   a ppl i c a t i o n s ,     Cl us t e r i n c a n   b e   c a l l e a s   da t a   s e gm e n t a t i o n   a s   a   r e s ul t   o pa r t i t i o n i ng  l a rge   da t a   s e t s   i n t o   g r o ups   b a s e t t h e i r   s i m i l a r i t y .   Cl us t e ri n c a n   b e   ut i l i z e f o r   o ut l i e r   de t e c t i o n   a n t h e   de t e c t i o n   o f   c r e di t   c a r f ra ud .   Cl us t e r i n g   i s   a   t a s i e xpl o ra t o r y   D M   a n d   a   t e c hni que   u s e i n   m a n y   f i e l ds   i n c l udi n g   b i o l o g y ,   s t a t i s t i c s pa t t e rn  r e c o gn i t i o n, i n f o r m a t i o r e t r i e v a l   ,   b i o i n f o r m a t i c s   a n d   m a c hi n e   l e a rn i ng  [1 - 3] .   Cl us t e r i n b r o a dl y   di v i de i n t o   t w t y pe s   h i e r a r c h i c a l   a nd  p a r t i t i o n i n b a s e o n   t h e   c l us t e r   s t r uc t u r e   w h i c h   t h e y   pr o duc e .   H i e r a r c h i c a l   c l us t e ri n w hi c h   us e   a   h i e ra r c h y   of   c l us t e r s   o r   n o de s   t o   c l us t e r   d a t a   o b j e c t s .   A dv a n t a ge   o f   t h i s   m e t h o i s   d i d n t   r e qui r e   a n y   pr e de f i n e i n f o r m a t i o n   a b o ut   t h e   n um b e r   o f   c l us t e r s .   B ut   i t   c o ul n o t   t o   ge t   b a c t o   a   p r e v i o us l y   f i n i s h e d   w o r k.   T h e   h i e ra r c hi c a l   m e t h o ds   c o l l e c t   t r a i n i ng  d a t a   i n t o   a   t r e e   s t ruc t u r e   of   c l us t e r s ,   w h i c h   t h i s   t r e e   c a l l e de n d r o gra m .   I t   r e p r e s e n t s   a   s e que n c e   o n e s t e c l us t e r   w h i c h   c o n s t r uc t e t o p - do w n   o r   b o t t o m - up.   T h e   r o o t   of   t h e   de n d r o g ra m   t r e e   r e p r e s e n t e by   o n e   c l us t e r,   i n c l u di n a l l   da t a   po i n t s ,   w h i l e   t h e   r e m a i ni n g   n   c l us t e r s   r e p r e s e n t s   t h e   l e a v e s   of   t h e   t r e e ,   e a c h   c l us t e i n c l ude   o n e   da t a   Evaluation Warning : The document was created with Spire.PDF for Python.
            IS S N :   2 502 - 47 52   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   20 ,   N o .   3 D e c e m be r   2 020   :   1569   -   1575   1570   po i n t .   I n   o r de r   t o   Cl us t e r   t h e   da t a   po i n t s   i n t o   di s j o i n t   gr o ups   by   c ut t i n t h e   t r e e   a t   a   de s i r e l e v e l .   H e i r a r c hi c a l   c l us t e r s   d a t a   i n   a gg l o m e ra t i v e   o r   di v i s i v e   m ode .   F i r s t   m o de ,   t h e   c l us t e ri n p r o c e s s   s t a rt   w i t h   r e p r e s e n t i n e a c h   d a t a   o b j e c t   a s   a   s i ngl e   c l us t e r .   A f t e r   t ha t ,   t h e   c l us t e r i ng  p r o c e e by   m e r gi n s i m i l a r   c l us t e r s   r e c ur s i v e l y .   T h e   s e c o n m o de ,   t h e   c l us t e ri n p r o c e s s   c o n s i de r   a l l   da t a   o bj e c t s   a r e   a   s i n gl e   c l us t e r   a n t h e n   di v i di n g   t hi s   c l us t e i nt o   di f f e r e n t   c l us t e r s   r e c ur s i v e l y   [ 4 5] .   T h e   s e c o n t y pe   i s   pa rt i t i o ni n c l us t e r i ng  t ha t   w o r o n   pa rt i t i o n i ng  o b j e c t s   i n t o   di f f e r e n t   c l us t e r s .     In   t h i s   m e t h o d,   e a c h   c l us t e r   c o n t a i n   t h e   d a t a   o bj e c t s   o a   s i m i l a r   c h a ra c t e ri s t i c s   w h i l e   di f f e r e n t   c l us t e r s   ha s     a   di s s i m i l a r   da t a   o bj e c t s .   A   pa rt i t i o c l us t e r i n g   a l go r i t hm   o b j e c t i v e   i s   t o   s pl i t   t h e   d a t a   po i n t s   i n t o   K   pa rt i t i o n s .   E a c h   p a r t i t i o w i l l   r e p r e s e nt   o n e   c l us t e r.   P a r t i t i o n   t e c hni que   de pe n ds   u po n   s pe c i f i c   o bj e c t i v e   f un c t i o n s .     T h e   w e a kn e s s   o f   a   pa rt i t i o a l go ri t hm   i s   w h e n e v e r   t h e   di s t a n c e   b e t w e e n   t h e   t w o   da t a   po i nt s   f r o m   t h e   c e n t e r   a r e   c l o s e   t o   a n o t h e r   c l us t e b e c a us e   t h e   r e s ul t   b e c o m e s   m i s l e a d i n d ue   c o n v e r ge n c e   of   t h e   da t a   po i n t s .     K - m e a n s   a l go r i t hm   m o s t   k n o w n   c l us t e r i n a l go r i t hm   us e i n   t h i s   pa pe r.   T h i s   s i m pl e   i t e ra t i v e   m e t h o t ha t   pa r t i t i o n   a   gi v e n   da t a   s e t   i nt o   a   n um b e r   o c l us t e r s . T hi s   a l go r i t hm   s uff e r s   f r o m   t h e   di f f c ul l t y   t o   f i n   t h e   o pt i m a l   n u m b e r   o f   k.   A l o n gs i de   t h e   qua l i t y   of   c l us t e ri n r e s ul t s   de pe n ds   o n   t h e   s e l e c t i o n   o f   i n i t i a l   c e n t r o i ds   [6 - 9]   In   s o m e   c l us t e r i n a ppl i c a t i o n s ,   t h e   n u m b e r   o c l us t e r s   i s   gi v e n   a s   i n put   (e . g.   g r o upi n a   s e t   o s t ude nt s   a c c o r di ng  t o   t h e i o v e r a l l   a v e r a ge ) . W h e r e a s   s o m e   o t h e r   a ppl i c a t i o n s ,   t h e   go a l   i s   t o   f i n o ut     t h e   o pt i m u m   n u m b e r   o f   c l us t e r s   fo r   s uc h   a pp l i c a t i o n s   (   w h a t   i s   t h e   m o s t   s ui t a b l e   n um b e r   o f   c l us t e r s   r e qui r e t o   gr o up  f a m i l i e s   a c c o r di n t o   t h e   s t a n d a r o f   l i v i n g).   T h e   g o a l   of   t h i s   r e s e a r c h   pa pe r   t o   pr o po s e   a n   a pp r o a c t o   f i n o ut   t h e   o pt i m u m   n u m b e r   o f   c l us t e r s   s ui t a b l e   fo r   g r o upi n s o m e   da t a   s e t s .   F o r   t hi s   i s s ue ,     m a n y   a t t e m pt s   ha v e   b e e n   p r o po s e m e t h o ds   t o   f i n o ut   t h e   o pt i m a l   n um b e r   o f   c l us t e r s .   Co h e n - a dd a d   e t   a l .   [10]   o pt i m i z e   a   s pe c i f i c   ob j e c t i ve   f o r   h i e ra r c hi c a l   c l us t e ri n a n a na l y s i s   t h e   pe r f o r m a n c e   of   bo t h   s i m i l a ri t y   a n d i s s i m i l a r i t y   b a s e d   on   h i e r a r c h i c a l   c l us t e r i ng.   N gu y e n e t   al .   [11]  us e s   a   b i - l e v e l   h i e ra r c hi c a l   c l us t e r i ng  m o de l   t h a t   i t   i s   f o r m ul a t i o n s   s uf fe r s   f r o m   a   d i s c r e t e   o pt i m i z a t i o n   p r o b l e m .   D e y ,   e t   al .   [1 2]  pr o po s e s   a   t hr e e   o pt i m i z a t i o n   p a ra m e t e r s   w h i c h   r e p r e s e n t s   a   s o l ut i o t o   t e m po ra l   c l us t e ri n p r o b l e m s .   T h i s   l e a t o   de ve l o n e w   a l go r i t hm s   t ha t   pe r f o r m s   c o m pr o m i s e   b e t w e e n   t h e s e   t hr e e   pa r a m e t e r s .   L e v i n   [13]   de s c r i b e s   a   v a ri o us   c o m b i n a t o r i a l   b a l a n c i n p r o b l e m s   i n   c l u s t e r i ng  a n a   n e w   b a l a n c e   i n di c e s   s ugge s t e fo r   c l us t e r i ng  s o l ut i o n s .     Ś m i e j a   e t   a l [14]   p r o po s e   a   m o de l   t o   c l us t e r i n g   t h e   s p a r s e   hi g h   d i m e n s i o n a l   b i n a r y   da t a   c a l l e S pa r s e M i x.   T h i s   m o de l   c o n s t r uc t s   a   hi g h l y   c o m pa t i b l e   pa rt i t i o n .   H ow e   [15]   i m p r o ve   a   n e w   k - m e a n s   m e t h o c a l l e A ugm e n t e k - m e a n s .   T h i s   m e t h o c l us t e ri n da t a   s e t s   a c c ur a t e l y   a n i n   f e w e r   i t e r a t i o n s   t ha   t h e   o r i gi na l   k - m e a n s .   A z a b   a n d   H e f n y   [16]   pr o po s e   a   l oc a l   m o de l   of   P S O   ( pa r t i c l e   s w a r m   o pt i m i z a t i o n f o r   pa r t i t i o n i ng  c l us t e ri n t o   ge t   r i o ff   t h e   di s a dv a nt a ge s   o f   t hi s   m o de l .   T ha t   l e t o   o pt i m i z e   t h e   l o c a t i o n   o   t h e   c e n t r o i o f   t h e   c l us t e r.   Z h o u   e t   al [ 17]  p r o po s e   a   m e t ho t o   de t e r m i n e   t h e   o pt i m a l   n u m b e r   o f   c l us t e r s   b a s e o n   a n   a gg l o m e ra t i v e   h i e r a r c h i c a l   c l us t e ri n a l go r i t hm   a n d   a   n e w   c l us t e r i n g   v a l i d i t y   i nde t o   e v a l ua t e   t h e   r e s ul t s   p r o duc e by   t h e   m e t h o d.   K h a n c h o uc h,   e t   a l [18 fo c us   o n   m u l t i - S O M   c l us t e r i ng  a l go r i t h m   a n d   t e s t   t h i s   a l go r i t hm   us i ng  r e a l   da t a   s e t s   w i t t w o   e v a l ut i o n   c ri t e r i a   t o   e xt r a c t   t h e   o pt i m a l   n u m b e r   o f   c l us t e r s .   T h i s   m e t h o t a ke s   l e s s   i t e r a t i o n s   s t e ps   b ut   c o n s i de r e i n s uf f i c i e n t   t o   de f i n e   t h e   b o un da ri e s   o f   e a c h   c l us t e r.   K i a n i ,   e t   al [1 9]   p r o po s e   a   m e t h o by   a pp l y i n a   m o de l   de pe n de d   o n   da t a   m i n i ng  t e c hn i que s   a nd  o pt i m i z e   t h e   c l us t e r i n t e c hn i que   by   a s s i gni n w e i gh t s   t o   fe a t u r e s   a n t h e y   a l s us e   G A   i n   o r de r   t o   i m p r o v e   o ut l i e r   d e t e c t i o n .   S e kul a   [20]   p r o po s e   t h e   pa c ka ge   o pt Cl us t e r   a s   m e t h o t o   de t e r m i n e   t h e   be s t   n um b e r   o c l us t e r s   w i t h   t h e   m o s t   s u i t a b l e   a l go ri t hm   f o r   a   g i v e n   s e t   o f   da t a .   T h i s   m e t h o e v a l ua t e   da t a   w i t t e n   c l us t e ri n g   a l go ri t hm s   a nd  t h e n   t h e   s e l e c t e a l go r i t h m s   a r e   e v a l ua t e us i n n i n e   v a l i da t i o n   m e a s u r e s   w h i c h   c l a s s i f i e a s   b i o l o gi c a l ,   i nt e rn a l ,   o s t a b i l i t y .   M uc a ,   e t   a l [21]   p r o po s e a   m e t h o f o r   de t e rm i n g   t h e   o pt i m a l   num b e of   c l us t e r s   us i n g   c l us t e r   v a l i da t i o m e a s u r e s . r e s ul t s   s h o w s   t ha t   t h e   m e t h o s e n s i t i v e   t o   t h e   i ni t i a l   s e l e c t i o n   o c e n t r o i ds   a n t a ke s   m o r e   c o m put a t i o na l   t i m e   i f   us e w i t l a r ge   d a t a .   S ub b a l a ks hm i e t   al .   [2 2]  p r o po s e d     a   m e t h o t o   s o l v e   t h e   o pt i m a l   n um b e o f   c l us t e r s   b a s e o f uz z y   s i l h o ue t t e   o n   dy n a m i c   da t a .     T h i s   m e t h o s uf f e r   f r o m   a   l a r ge   t i m e   c o m pl e xi t y .   L i a ng,   e t   al [2 3]  p r o po s e   a i nt i a l i z t i o m e t h o t h a t   f i nd  b o t h   t h e   c l us t e r   c e nt r o i ds   a n num b e r   o f   c l us t e rs   fo r   c a t e go r i c a l   d a t a .   C hi a ng  a nd  M i rki n   [ 24]   pr o po s e   a n   a dj us t e m e t h o o f   k - m e a n s   t o   f i n t h e   r i g ht   num b e r   o f   c l us e r s   b a s e o n   t h e   c o m pa ri s o n   w i t s e v e n   di f fe r e nt   a pp r o a c h s   u n de r   di f f e r e n t   c l us t e r   s p r e a d - s h a p e   pa ra m e t e r s . t h e y   ge t   b e s t   r e s ul t s   of   o n e   m e t h o d   t h a t   r e pr o duc e   t h e   r i g h t   n u m b e r   o f   c l us t e r s   b ut   n o t   go o r e s ul t s   w i t h i n   c l us t e r s   o r   c e nt r o i ds   r e c o ve r y .   U n l i ke   t r a d i t i o n a l   c l us t e r i ng  a ppl i c a t i o n s   i w h i c h   n u m b e r   o c l us t e r s   (k r e p r e s e n t   o n e   o f   t h e   i n pu t s   t o     t h e   a l go r i t h m s ,   s o m e   o t h e r   a p pl i c a t i o n s   t e n t o   de a l   w i t a s   a   pa ra m e t e r   t o   b e   e s t i m a t e d.   T h i s   pa pe r   pr o po s e s   a   n o ve l   i m p r o v i n m e t h o of   c l us t e r i n t o   t a c kl e   t h e   i s s ue   o f   d e t e r m i ni n g   t h e   o pt i m u m   n u m b e r   of  c l us t e r s   i s uc a p pl i c a t i o n s .         Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   n e w   appr oac h   f or   i m pr ov i ng   c l us t e r i ng   al gor i t hm s   pe r f or m anc e   ( A nf a l   F .   N .   A l r am m a hi )   1571   2.   TH E   P R O P O S ED   A P P R O A C H   T h e   da t a   s e t   us e t o   t e s t   t h e   a l go r i t hm   f r o m   U CI  r e po s i t o r y   t ha t   c o n s i s t s   o f   t w o   a t t ri b ut e s   a n 20000   r e o c o r ds   a s   s h o w n   T a b l e   a   s a m p l e   o f   25   r e o c r ds :       T a b l e   1 .   A   s a m pl e   o f   da t a   s e t     X1   Y1     X1   Y1   1   6 6 4 1 5 9   5 5 0 9 4 6   26   6 0 1 1 8 2   5 8 2 5 8 4   2   6 6 5 8 4 5   55 7 9 6 5   27   5 6 2 7 0 4   5 7 0 5 9 6   3   5 9 7 1 7 3   5 7 5 5 3 8   28   6 0 5 1 0 7   5 6 3 4 2 9   4   6 1 8 6 0 0   5 5 1 4 4 6   29   6 0 7 2 1 4   5 7 5 0 6 9   5   6 3 5 6 9 0   6 0 8 0 4 6   30   5 6 8 8 2 4   5 7 0 2 0 3   6   5 8 8 1 0 0   5 5 7 5 8 8   31   6 1 2 4 8 5   5 1 8 0 0 9   7   5 8 2 0 1 5   5 4 6 1 9 1   32   5 8 9 2 4 4   5 7 3 7 7 7   8   6 0 4 6 7 8   5 7 4 5 7 7   33   6 2 5 5 7 9   5 5 1 0 8 4   9   5 7 2 0 2 9   5 1 8 3 1 3   34   5 6 0 2 3 7   500 1 5 4   10   6 0 4 7 3 7   5 7 4 5 9 1   35   6 2 6 2 2 4   5 6 9 6 8 7   11   5 7 7 7 2 8   5 8 7 5 6 6   36   6 1 0 6 6 6   5 5 1 7 0 1   12   6 0 2 0 1 3   5 7 4 7 2 2   37   5 9 7 4 2 8   5 6 9 9 4 0   13   6 2 7 9 6 8   5 7 4 6 2 5   38   6 0 0 5 8 2   5 9 9 5 3 5   14   6 0 7 2 6 9   5 3 6 9 6 1   39   6 0 4 1 6 8   5 5 5 0 0 3   15   6 0 3 1 4 5   5 7 4 7 9 5   40   6 1 3 8 7 1   5 5 0 4 2 3   16   6 7 1 9 1 9   5 7 1 7 6 1   41   6 1 7 3 1 0   5 5 1 9 4 5   17   612 1 8 4   5 7 0 3 9 3   42   6 2 5 7 2 8   5 7 9 4 6 0   18   6 0 0 0 3 2   5 7 5 3 1 0   43   6 0 6 3 0 0   5 6 6 7 0 8   19   6 2 7 9 1 2   5 9 3 8 9 2   44   6 3 8 5 5 9   5 5 8 8 0 7   20   6 0 1 9 6 7   6 0 4 4 2 8   45   5 8 2 1 7 6   6 3 0 3 8 3   21   5 9 1 8 5 1   5 6 9 0 5 1   46   5 4 4 0 5 6   5 7 7 7 8 6   22   6 0 1 4 4 4   5 7 2 6 9 3   47   6 3 1 2 9 7   5 7 8 3 5 1   23   6 2 9 7 1 8   5 5 8 1 0 4   48   5 6 1 5 7 4   6 2 1 7 4 7   24   6 6 1 4 3 0   6 0 3 5 6 7   49   6 0 4 9 7 3   5 7 4 7 7 3   25   5 9 7 5 5 1   5 5 6 7 3 7   50   6 6 4 1 5 9   5 5 0 9 4 6       T h e   p r o po s e a l go r i t hm   us e t h e   o ut pu t   o f   t h e   i ni t i a l i z i ng  c e nt r o i ds   i k - m e a n s   c l us t e r i ng  a l go ri t hm .   T h e   a l go ri t hm   p r e s e n t s   a n   a pp r o a c h   f o r   e s t i m a t i ng  t h e   s t a r t i ng  i n t i a l   c e n t r o i ds   t hr o ugh   t hr e e   pr o c e s s e s   i n c l udi ng  de n s i t y   b a s e d,   n o r m a l i z a t i o n   a nd  s m o o t h i ng  i de a s   [25] T h e   p r o po s e d   a l go r i t h m   c l us t e r s   a   da t a   s e t   X   i n t o   k   c l us t e r s   i k - m e a n s   us i n g   E uc l i de a di s t a n c e   b e t w e e da t a   o b j e c t s   a n d   c e n t r o i ds .   T h e   a l go ri t hm   c a l l s   i n i t i a l i z i ng  c e n t r o i ds   a l go r i t h m   o n c e   t o   i n i t i a l i z e   t h e   c e n t r o i ds   f o r   a   gi v e da t a   s e t   w i t h   v a l ue   s t a rt i n g   w i t h   k= 2.   A f t e r   t ha t ,   i t e r a t i v e   K - m e a n s   a l go r i t hm   i s   us e   a n t h e   c o n v e r ge n c e   c r i t e r i a   i s   a ppl i e t o   f i n t h e   o pt i m a l   k.   A   c o n v e r ge n c e   c r i t e r i o n   c o n s i s t s   o f   t h e   f o l l ow i n g:     U s i n E uc l i de a d i s t a n c e   g i v e n   i n   (1)  b e t w e e n   t h e   o b j e c t s   of   a   g i v e n   c l us t e Ci   a nd  i t s   c e n t r o i d .     Ca l c ul a t i n g   t h e   d i f f e r e n c e   b e t w e e n   t w o   i t e ra t i v e   c e n t r o i ds   o f   a   g i v e n   c l us t e r.     Ca l c ul a t i n g   t h e   num b e o f   m i g r a t e o b j e c t s   (obj e c t s   m i g ra nt   f r o m   o n e   c l us t e t o   a n o t h e r ) .   A f t e r   c a l l i n t h e   f i r s t   a l go ri t hm   t h e n   s t a r t   f o r   l o o p   t a c c o m pl i s h   t h e   k - m e a n s   c l us t e ri n o f   t h e   da t a   s e t   w i t c u rr e nt   e s t i m a t e c e n t r o i ds   o f   v a l ue   a s   i n   E uc l i de a di s t a n c e   (1)   b e l ow :     ( , ) = ( 1 1 ) 2 + ( 2 2 ) 2 + + (   ) 2     (1)     w h e r e   i   i s   t h e   r o w   n u m b e r   t ha t   b o t h   d a t a   o b j e c t   a n c e nt r o i v a l ue   b e l o n t o   L   i s   t h e   c o l um n   n u m b e r   s t a rt   f r o m   (1,   2 …,   L ).     Ca l c ul a t e   t h e   di s t a n c e   b e t w e e n   t h e   da t a   o bj e c t s   a n c e nt r o i ds   f o r   s a m e   r o w   w i t h   L   c o l um n s .   Ca l c ul a t e   d i s t a n c e   o f   e a c h   da t a   o bj e c t   t o   a l l   c e nt r o i ds   t h e n   i n c l ude   t h a t   o b j e c t   t o   t h e   c l us t e o f   t h e   m i n i m u m   di s t a n c e   c a l c ul a t e b e t w e e n   da t a   a n d   i t   i s   c e n t r o i d .   I n   t h e   s a m e   i t e ra t i o n   w i t c urr e nt   v a l ue   a n d   c e n t r o i ds   v a l ue s ,   e s t i m a t e   t h e   m e a v a l ue s   o f   t h e   o b j e c t s   f o r   e a c c l us t e Ci = 1 . . . ,   r e s ul t e f r o m   c l us t e ri n o   t h e   p r e v i o us   s t e a n t h e   m e a n   v a l ue s   r e p r e s e n t s   a   n e w   c e n t r o i f o r   t h e   n e xt   i t e ra t i o n   w i t h   c u rr e n t     v a l ue   a s   i (2 ):     = 1 + 2 + +      (2)     w h e r e   t   i s   t o t a l   num b e r   o f   o bj e c t s   i n   c l us t e Ci     In   e v e r y   i t e r a t i o n,   c h e c i f   t h e   c e n t r o i ds   o t h e   n   i t e ra t i o n   a nd  n - i t e r a t i o n   a r e   t o t a l l y   s i m i l a r.   P e r f o r m   t h e   c e n t r o i c o n v e r ge n c e   b e t w e e n   t h e   t w c e n t r o i ds   of   c ur r e n t   a nd  p r e v i o us   i t e r a t i o n s   w i t h   c urr e nt   v a l ue ,   by   us i ng  pe r c e nt a ge   di f f e r e n c e   of   t h e   t w o   c e n t r o i ds   a s   fo l l ow   a s   i (3) :   Evaluation Warning : The document was created with Spire.PDF for Python.
            IS S N :   2 502 - 47 52   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   20 ,   N o .   3 D e c e m be r   2 020   :   1569   -   1575   1572      =   ( ( 1 ) ( ) ) ( 1 )     (3)     w h e r e   n - 1   i s   t h e   p r e v i o us   i t e r a t i o n   a n d   n   i s   t h e   c u rr e n t   i t e ra t i o n   If   t h e   c o n di t i o n   i n   t h e   p r e v i o us   st ep   i s   pe r fo r m e d,   t h e n   t e rm i na t e   t h e   l o o a n pe r f o r m   t h e   o t h e r   t w c r i t e ri a   t o   c urr e nt   v a l ue   a nd  i n c r e m e n t   v a l ue   b i s e c t i o n a l l y   a s :   k= k*2  a n s t a r t   o v e r   a g a i n   f o r   l o o f r o m   t o   N   i t e r a t i o n s   a n d   c l us t e r i n d a t a   s e t   X   w i t h   i ni t i a l   c e n t r o i ds   ge n e ra t e by   c a l l i n a l go r i t h m   o n e   f o r   n e w   k   v a l ue .   O t h e r w i s e ,   i f   t h e   c o n d i t i o n   i n   t h e   p r e v i o us   s t e i s n’t   pe r f o r m e d,   t h e n   m o v e   t o   t h e   n e xt   i t e r a t i o n   w i t c urr e n t   v a l ue   a n c l us t e r   da t a   s e t   X   w i t h   m e a n   v a l ue s   a s   n e w   c e n t r o i ds   a n c o m put e   a   n e w   m e a n s   u nt i l   pe r f o r m   t h e   c e n t r o i ds   c o n v e r ge n c e   c r i t e r i a .   I n   c a s e   t h e   c e n t r o i ds   c r i t e r i a   pe r f o r m e a n l o o t e r m i na t e t h e n   pe r f o r m   t h e   t w o   o t h e r   c r i t e ri a ,   t o t a l   di s t a n c e   f o r   e a c h   v a l ue   by   c a l c ul a t i n di s t a n c e   fo r   e a c h   c l us t e r   t h e n   s um   t h e   di s t a n c e   v a l ue s   a s   t o t a l   di s t a n c e   o f   v a l ue   a s   i (4) :     ( , ) = ( 1 1 ) 2 + ( 2 2 ) 2 + + (   ) 2     (4)     w h e r e   X   i s   da t a   o b j e c t   i n   c l us t e r   n u m b e r   c i   (c i = 1… k)  a nd  i s   c l us t e r   c e n t r o i f o r   t h e   s a m e   c i   n u m b e r   f o r   e a c h   c o l um n.   R e p e a t   t hi s   p r o c e s s   fo r   e a c h   c l us t e s e pa r a t e l y   a n c a l c u l a t e   t h e   s um   o f   t h e   d i s t a n c e s   o f   a l l   c l us t e r s   w i t h   c urr e nt   v a l ue   t o   r e pr e s e n t   t h e   t o t a l   d i s t a n c e s   of   s p e c i f i c   v a l ue .   T h e   t h i rd  c r i t e ri o n   i s   t h e   n um b e r   o m i g ra t e o b j e c t s   i e a c h   k   a nd  i t   i s   pe r c e n t a ge   t o   t o t a l   num b e o f   obj e c t s .   I n   t h e   l a s t   t w o   i t e r a t i o n s   ( n   a n d   n - 1)   w h e n   t h e   l o o s t o ppe (a f t e r   t h e   c e n t r o i ds   c o n v e r ge n c e   pe r f o r m e d),   a   c o unt e r   v a l ue   s t a rt   w i t h   t h e n   i n c r e m e n t e d   i f   e a c da t a   o bj e c t   o f   a   c l us t e r   C i   i n   i t e r a t i o n - m o v e t o   a n o t h e r   c l us t e r   num b e i i t e ra t i o n   n   (c l us t e r s   o f   c urr e n t   k   v a l ue a n d   t ha t   c o un t e r   v a l ue   r e p r e s e n t   n u m b e r   o f   m i g ra t e d   o bj e c t s   i n   v a l ue   a s   i (5) :       =     (5)     w h e r e   m   i s   t h e   c a l c u l a t e n u m b e r   o f   m i gra t e o b j e c t s   i n   v a l ue   a n D   i s   t h e   t o t a l   num b e r   o f   obj e c t s   i n   d a t s e t   X . T h e   f o l l ow i n i s   t h e   p r o po s e a l go r i t hm .     I n p u t :   G i v e n   a   da t a   s e t   X   w i t L   c o l um ns   a nd   k   c l us t e r s     O u t p u t :   i n i t i a l i z i ng   t h e   o p t i m a l   c l us t e r   f o r   a   g i v e da t a   s e t   S t e p   1 :   s t a r t   k= 2   S t e p   2 :   C a l l   a l g o r i t hm   o ne   ( X ,   k)   a s   C   S t e p   3 :   f o r   n   = 0   t o   N   ( w h e r e   N   i s   t h e   num be r   o f   i t e r a t i o ns )   pe r f o r m   t he   s t e p s   f r o m   4   t o   6:   S t e p   4 :   c l u s t e r   X   w i t C   b y   c a l c ul a t i ng   E uc l i de a n   d i s t a nc e   b a s e o n   e qu a t i o ( 1)   S t e p   5 :   E s t i m a t e   t h e   m e a n   v a l u e s   ba s e d   o e qua t i o n   ( 2)   S t e p   6 :   A ppl y   t he   c e nt r o i d   c o nv e r g e nc e   be t w e e n   t h e   c e n t r o i ds   o f   c ur r e nt   a n pr e v i o us   i t e r a t i o ns   w i t h   c ur r e n t   k   v a l ue ,   by   us i ng   pe r c e nt a g e   di f f e r e nc e   e qu a t i o ( 3)   S t e p   7 :   I f   t he   c o ndi t i o i n   s t e i s   f ul f i l l e d ,   t h e g o   t o   s t e 8   o t h e r w i s e ,   i nc r e m e n t   k= k*2   a n r e p e a t   f r o m   s t e 2.     S t e p   8 :   P e r f o r m   t o t a l   d i s t a nc e   c r i t e r i a   f o r   e a c k   v a l u e   by   c a l c ul a t i n g   di s t a nc e   e q ua t i o ( 4)   S t e p   9 :   P e r f o r m   t he   t hi r d   c r i t e r i a   i s   t he   num be r   o f   m i g r a t e o bj e c t s   i e a c us i ng   e q ua t i o ( 5)     S t e p   10 :   S t a r t i ng   f r o m   m a xi m um   k   v a l ue   r e c e i v e d   f r o m   s t e p   a nd   a ppl y i ng   t h e   n um be r   o f   m i g r a t e d   o bj e c t s ,   w h e r e   t he   c o n v e r g e nc e   c r i t e r i a   i s   a c hi e v e d   if   t h e   n um be r   o f   m i g r a t e d   o bj e c t s   <   10 %   o f   t he   t o t a l   o bj e c t s   i n   t h e   da t a s e t .   E l s e ,   k= k - a nd  r e pe a t   f r o m   s t e p   t o   9   u n t i l   v a l ue   r e a c ki   / ( k i   r e p r e s e n t   t h e   l a s t   i nc r e m e nt e d   v a l ue   be e n   r e a c he d ) .   If   m i n i m m   t o t a l   d i s t a nc e   f o r   e a c de c r e m e n t e d   k   v a l u e s   c r i t e r i a   i s   a c hi e v e t h e t h e   s o l ut i o i s   f o und  a n t h a t   k   ( a ny   of   de c r e m e n t e d   k )   r e pr e s e nt   t he   o pt i m a l   k   f o r   X .   e l s e   i nc r e m e n t   k   a nd   r e pe a t   f r o m   s t e p   2 .   S t e p   11 :   E nd       3.   R ES U LTS   A N D   A N A L Y S I S   In  t h e   p r o p o s e a pp r o a c h,   t hr e e   c r i t e r i a   w e r e   us e t o   f i n d   t h e   o pt i m a l   k   v a l ue   f o r   a   g i v e n   d a t a   s e t .   D e pe n di n o f   t h e   da t a s e t ,   i t s   a p pl i c a t i o n   a n t h e   c l us t e r i n do m a i n   t h e   c e n t r o i c o n v e r ge n c e   c r i t e ri a   i s   n o t   s uff i c i e n t   t o   ge t   t h e   o pt i m um   n u m b e r   o f   c l us t e r s ,   a n d   h e n c e   t w o   o t h e c ri t e r i a   w e r e   a ppl i e d.     3. 1 .   C e n tr o i d s   c o n v e r ge n c e   c r i t e r i a:   T h e   c e n t r o i c r i t e ri a   i s   a   c r i t i c a l   c o n di t i o n   i n   a l l   c l us t e r i ng   t e c hn i que s .   I n   t h e   p r o po s e a ppr o a c h,     t h e   t w o   o t h e r   c o n di t i o n s   w e r e   a dde t o   i t   a f t e r   i t   i s   pe rfo r m e d.   T h i s   c o n di t i o n   t e s t s   t h e   s i m i l a ri t y   of    t h e   c e n t r o i ds   v a l ue s   b e t w e e n   t w o   i t e r a t i o n s .   I n s i de   i t e ra t i o n s   w i t h   e a c h   v a l ue ,   t e s t   i f   t h e   c e n t r o i ds   o   t h e   c urr e n t   a n p r e v i o us   i t e r a t i o n   a r e   s i m i l a r.   E a c h   t i m e   c he c i f   t h e   pe r c e n t a ge   di f f e r e n c e   of   t h e   c e n t r o i Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   n e w   appr oac h   f or   i m pr ov i ng   c l us t e r i ng   al gor i t hm s   pe r f or m anc e   ( A nf a l   F .   N .   A l r am m a hi )   1573   v a l ue s   of   e a c h   c o l um n   l e s s   t ha n   2 %.   T h e   s e l e c t e pe r c e n t a g e   v a l ue   2%  r e p r e s e n t s   400   t ra i ni n g   f r o m   t h e   t o t a l   n u m b e r   o f   t h e   d a t a   s e t   (20000 t o   c r e a t e   a   m o de l   a n r e a c a   s o l ut i o n .     3. 2 .   To tal   d i s tan c e   T h i s   c o n d i t i o n   i s   a pp l i e f o r   e a c v a l ue   b y   c a l c ul a t i n t h e   di s t a n c e   o f   e a c h   c l us t e r   us i n E uc l i de a n   di s t a n c e   a n s u m m i n t h e   d i s t a n c e s   t o   r e p r e s e n t s   t h e   t o t a l   di s t a n c e   fo r   k.   t hi s   c o n di t i o n   s h o w s   t h e   di s t a n c e   of  e a c h   da t a   o bj e c t   t o   t h e   c e n t r o i i n   e a c h   c l us t e r   t h e n   s um m i n t h e   c a l c ul a t e di s t a n c e s   of  a l l   o bj e c t s   b e l o n t t h e   s a m e   c l us t e r .   A t   t h e   e n s u m   t h e   di s t a n c e s   of   a l l   c l us t e r s   o f   v a l ue .   R e s ul t s   s h o w s   i n   m o s t   c a s e s   t h a t     t h e   t o t a l   d i s t a n c e   o f   e a c h   ge t s   m i n i m i z e   w h i l e   k   v a l ue   i n c r e m e nt e e a c h   t i m e   a s   s h o w n   i Fi gu r e   2 .     3. 3 .   N u m b e r   o m i gr at e d   o b je c ts   Cl us t e r i n p r o c e s s   i s   e n de w h e n   n o   obj e c t s   (o r   pe r c e n t a ge   of   t h e   t o t a l   o b j e c t s m i gra t e b e t w e e n   c l us t e r s .   T h e   t hi r c o n d i t i o n   pe r f o r m e o n   t h e   c l us t e r s   o f   t h e   l a s t   t w o   i t e ra t i o n s   ( a n n - 1)   t o   c o un t     t h e   n um b e r   o f   ob j e c t s   m ov e b e t w e e n   c l us t e r s   i n   a   k   v a l ue .   T h e   p e r c e n t a ge   o f   t h e   m i g ra t e o b j e c t s   t   t h e   t o t a l   n u m b e r   o da t a   o bj e c t s .   T ha t   pe r c e n t a ge   m us t   a c c om pl i s h   v a l ue   l e s s   t ha n   10% .   10  r e p r e s e n t   2000   t r a i ni n g   f r o m   t h e   da t a   s e t   s i z e   2000 t h e n   i t   i s   n e e t o   18 000  t o   b ui l a   m o de l .   S o m e t i m e s   t h e   v a l ue   of    t h e   nu m b e r   o f   m i g ra t e o b j e c t s   i n c r e a s e e a c h   t i m e   t h e   v a l ue   i n c r e m e n t e w h e n   t h e   c e n t r o i ds   v a l ue s   b e   v e r y   c o n v e r ge n t   t o   e a c o t h e a s   s h o w n   i n   F i gu r e   1 .             F i gu r e   1 .   V a r i a t i o n s   o f   n u m b e r   o f   m i g ra t e o b j e c t s   w i t n um b e o f   c l us t e r s   K     F i gu r e   2 .   V a r i a t i o n s   of  t o t a l   di s t a n c e   w i t h   num b e o f   c l us t e r s   K       T h e   f o l l ow i n t a b l e s   r e p r e s e n t s   t h e   r e s ul t s   o f   us i n t h e   p r o po s e a pp r o a c h   us i n t h e   t hr e e   di f f e r e n t   c r i t e ri a .   W e   m o di fy   t h i s   pr o po s e a ppr o a c h   by   m a ki n t h e   s t o c o n di t i o n   i s   t h e   pe r c e nt a ge   t o   t h e   n u m b e r   of  m i g ra t e o b j e c t s   i n s t e a o f   c e n t r o i ds   c r i t e r i a   i c a s e   i t   p e r f o r m e a   v a l ue   l e s s   t ha n   0 . 01   t h e n   pe r f o r m     t h e   o t h e r   t w o   c r i t e r i a   a nd  i n c r e m e nt   k   v a l ue   t o   s t a r t   o v e r   a ga i n.   T h e   r e s ul t s   i t hi s   c a s e   s h o w s   t h a t   i t   n e e m o r e   i t e r a t i o n s   t o   a c c o m pl i s h   b o t h   pe r c e n t a ge s   of   m i gra t e a n c e nt r o i ds   t o   i n c r e m e nt   v a l ue .     If   t h e   m i g r a t e c r i t e ri a   i s   pe r f o r m e a n w h e n   m o v e t o   t h e   c e n t r o i ds   c r i t e ri a   di n o t   pe r f o r m e a   v a l ue   l e s s   t h a 0. 0 2,   s o   t h e   l o o c o n t i n ue   (o f   t h e   c u rr e n t   v a l ue t o   a c c o m pl i s h   a   s t o c o n di t i o n   a n d   c e n t r o i ds   c r i t e ri a   fo r   t h e   s a m e   i t e r a t i o n.   S o   a t   t h e   e n d ,   t h e   r e s ul t   o f   b o t h   c a s e s   (t h e   p r o po s e a ppr o a c a nd  m o di f i e o n e s h o w s   s a m e   o pt i m a l   v a l ue   f o r   t h e   us e da t a   s e t   b ut   n o t i c e   a i n c r e a s e   of   n u m b e r   o f   i t e r a t i o n s   t o   r e a c a   s o l ut i o n   i t h e   m o di f i e d   a ppr o a c h   a nd  a   de c r e a s e   i n   t h e   n u m b e r   m i g ra t e d   obj e c t s   a s   s h ow e i n   t h e   f o l l ow i n T a b l e   3.   T h e   r e s ul t s   s h o w s   t h a t   t h e   p r o po s e a ppr o a c h   ha s   hi g e ff i c i e n c y   a n b e t t e r   a l go r i t hm   pe r f o r m a n c e .   D e pe n di n o n   t h e   c l us t e ri n a p pl i c a t i o n   b e h a v i o r   a n c ha r a c t e r i s t i c s ,   a l l   o r   pa rt s   of   t h e s e   c r i t e ri a   c a n   b e   us e d   t o   ge t   b e t t e c l us t e r i n g   pe r f o r m a n c e .   T a b l e   2,   T a b l e   3,   F i gu r e   1 ,   F i g u r e   a nd  F i gu r e   3   s h o w   t ha t   t h e   o pt i m a l   num b e r   o f   c l us t e r s   f o r     t h e   da t a   s e t   b e e n   us e i n   t hi s   pa pe r   c a n   b e   a c h i e v e a t   k= 30  w i t h   t o t a l   di s t a n c e = 9127802 84. 928115 .     T h e   o ve r a l l   c o m pl e xi t y   o f   t h e   pr o po s e a ppr o a c i s   O (I  K   N +   K   N +   K   L W h e r e   K   i s   t h e   n u m b e r   o f   c l us t e r s ,   i s   t h e   n u m b e r   o f   i t e r a t i o n s ,   N   i s   t h e   n u m b e r   o f   obj e c t s   i n   a   da t a s e t   a n L   i s   t h e   n um b e r   o f   a t t ri b ut e s     i n   d a t a   s e t .     Evaluation Warning : The document was created with Spire.PDF for Python.
            IS S N :   2 502 - 47 52   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   20 ,   N o .   3 D e c e m be r   2 020   :   1569   -   1575   1574   T a b l e   2 .   R e s ul t s   o f   t h e   p r o po s e a l go r i t h m   It e ra t i o n   K   N u m b e r   o m i g ra t e d   o b j e c t s   P e r c e n t a g e   o m i g ra t e d   o b j e c t s   T o t a l   d i s t a n c e   5   2   191   0 . 0 0 9 5 5   4 2 8 6 6 0 6 6 8 3 . 0 3 8 5 5   9   4   192   0 . 0 0 9 6   2 9 0 2 8 3 9 6 9 1 . 6 3 7 9 7   13   8   201   0 . 0 1 0 0 5   2 0 4 5 2 5 6 6 5 7 . 5 1 5 0 8   10   16   150   0 . 0 0 7 5   1 3 3 1 4 9 1 3 4 5 . 2 4 6 6 6   16   32   141   0 . 0 0 7 0 5   9 1 4 1 1 2 8 6 4 . 5 0 5 5 1 9   14   30   160   0 . 0 0 8   9 1 2 7 8 0 2 8 4 . 9 2 8 1 1 5   10   28   208   0 . 0 1 0 4   9 8 6 6 7 4 1 3 7 . 5 2 2 7 3 7   18   26   189   0 . 0 0 9 4 5   1 0 2 6 8 0 4 5 2 1 . 3 8 9 2 5   8   24   187   0 . 0 0 9 3 5   1 1 1 9 8 4 2 2 4 2 . 4 3 8 1 1   16   22   186   0 . 0 0 9 3   1 1 1 1 0 7 1 1 8 2 . 4 5 0 7 6   20   20   91   0 . 0 0 4 5 5   1 1 4 3 5 0 0 9 4 5 . 0 8 7 7 7   16   1 8   186   0 . 0 0 9 3   1 2 4 4 5 5 1 7 0 2 . 7 8 8 3 3       T a b l e   3 .   R e s ul t s   o f   t h e   m o di f i e t o   t h e   p r o po s e a l go r i t h m   It e ra t i o n     K   N u m b e r   o m i g ra t e d   o b j e c t s   P e r c e n t a g e   o m i g ra t e d   o b j e c t s   T o t a l   d i s t a n c e   5   2   191   0 . 0 0 9 5 5   4 2 8 6 6 0 6 6 8 3 . 0 3 8 5 5   9   4   192   0 . 0 0 9 6   2 9 0 2 8 3 9 6 9 1 . 6 3 7 9 7   14   8   157   0 . 0 0 7 8 5   2 0 4 4 1 5 3 5 2 9 . 1 3 9 8 1   10   16   150   0 . 0 0 7 5   1 3 3 1 4 9 1 3 4 5 . 2 4 6 6 6   16   32   141   0 . 0 0 7 0 5   9 1 4 1 1 2 8 6 4 . 5 0 5 5 1 9   14   30   160   0 . 0 0 8   9 1 2 7 8 0 2 8 4 . 9 2 8 1 1 5   13   28   130   0 . 0 0 6 5   9 8 4 9 1 0 7 4 2 . 4 3 6 2 6 8   18   26   189   0 . 0 0 9 4 5   1 0 2 6 8 0 4 5 2 1 . 3 8 9 2 5   8   24   187   0 . 0 0 9 3 5   1 1 1 9 8 4 2 2 4 2 . 4 3 8 1 1   16   22   186   0 . 0 0 9 3   111 1 0 7 1 1 8 2 . 4 5 0 7 6   20   20   91   0 . 0 0 4 5 5   1 1 4 3 5 0 0 9 4 5 . 0 8 7 7 7   16   18   186   0 . 0 0 9 3   1 2 4 4 5 5 1 7 0 2 . 7 8 8 3 3           F i gu r e   3 .   D a t a   s e t   s c a t t e r e w i t h   t h e   f i n a l   c e n t r o i ds   k = 30   t ha t   r e p r e s e n t   t h e   o pt i m a l   s o l ut i o f o un b y     t h e   p r o po s e a pp r o a c h       4.   C O N C LU S I O N   A   pr o po s e a pp r o a c h   o f   a   s e t   o f   a l go r i t hm s   h a s   b e e n   s ugg e s t e i n   o r de r   t o   de t e rm i n e   t h e   o pt i m a l   v a l ue   of   t h e   n u m b e r   o f   c l us t e r s   t a ki ng  i nt o   c o n s i de r a t i o n   o pt i m i z a t i o n   o f   t h e   t i m e   c o m pl e xi t y   of   t h e   p r o po s e d   a l go ri t hm s   a nd  t h e   c o n v e r ge n c e   c r i t e r i a   o f   c l us t e r i n g.   T o t a l   di s t a n c e ,   c e n t r o i ds   c o n v e r ge n c e   a n num b e r   o m i g ra t e o bj e c t s   a r e   t h e   c o r e   c r i t e r i a   o f   t h e   pr o po s e d   a ppr o a c h.   It e r a t i v e   k - m e a n s   c l us t e r i ng  i s   a n   e ff e c t i ve   t e c hn i q ue   fo r   g r o upi n t h e   da t a s e t   a nd  a e ff i c i e n t   a l go ri t hm   f o r   i n i t i a l i z i ng  c e n t r o i ds   w a s   us e t o   i m p r o v e   t h e   o ve r a l l   pe r f o r m a n c e .   T h e   r e s ul t s   g i v e n   i T a b l e s   a n d   a nd  F i gu r e s   a n d   2,   s h o w   t ha t   t h e   p r o po s e d   a pp r o a c h   i n   w hi c h   t hr e e   di f fe r e nt   c o n v e r ge n c e   c r i t e ri a   w e r e   us e gi v e s   b e t t e r   a n r e l i a b l e   c o n v e r ge n c e   t ha us i n e a c c ri t e r i a   i n di v i du a l l y .     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   n e w   appr oac h   f or   i m pr ov i ng   c l us t e r i ng   al gor i t hm s   pe r f or m anc e   ( A nf a l   F .   N .   A l r am m a hi )   1575   R EF ER EN C ES   [ 1]   K .   J i a w e i   H a n ,   D a t a   M i ni ng :   C o nc e pt s   a nd  T e c hni que s , ”  E l s e v i e r ,   v o l .   12 ,   2 011 .   [ 2]   B .   G o nda l i y a ,   R e v i e w   p a pe r   o c l us t e r i ng   t e c hni que s ,   I n t e r na t o nal   J our na l   of   E ng i ne e r i ng  T e c hno l ogy ,   v o l .   2 ,   no .   7 ,   pp.   2 34 2 37,   2 014 .   [ 3]   A ni l   K .   J a i n ,   " D a t a   c l us t e r i ng :   50  y e a r s   be y o nd  K - m e a ns ,”   P at t e r R e c ogn i t i on   L e t t e r s ,   E l s e v i e r ,   v o l .   31 ,   no .   8 ,     pp.   65 1 - 666,   2 010 .   [ 4]   K .   K a m e s hw a r a &   K .   M a l a r v i z hi ,   S u r v e y   o C l us t e r i ng   T e c hni que s   i D a t a   M i ni ng ,   I nt e r na t i ona l   J our n al   of   C om put e r   Sc e i n c e   an I n f or m a t i on   T e c hno l og i e s ,   v o l .   5,   no .   2,   2 01 4.   [ 5]   M .   K .   R a f s a nj a ni ,   Z .   A .   V a r z a ne h ,   &   N .   E .   C hu ka n l ,   A   s ur v e y   of   hi e r a r c hi c a l   c l us t e r i ng   a l g o r i t hm s ,   J our nal   of   M a t he m at i c s   an C om pu t e r   S c i e nc e ,   v o l .   5 ,   no .   3,   pp .   229 240 ,   201 2.   [ 6]   G .   G a n dh i ,   R e v i e w   P a pe r :   A   C o m pa r a t i v e   S t udy   o P a r t i t i o ni ng   T e c h ni qu e s   o f   C l us t e r i ng   A l g o r i t hm s ,   I nt e r n at i on al   J o ur n al   o f   C om put e r   A pp l i c a t i ons ,   v o l .   87 ,   no .   9,   pp .   10 13 ,   201 4.   [ 7]   S .   S .   J   &   S .   P a ndy a " A O v e r v i e w   o f   P a r t i t i o ni ng   A l go r i t hm s   i n   C l us t e r i ng   T e c hni qu e s ,   I n t e r na t i o na l   J o ur n al   of   A dv an c e R e s e ar c h   i C om pu t e r   E n gi ne e r i n and   T e c hno l og y ,   v o l .   5 ,   no .   6 ,   pp .   1 943 1946 ,   201 6.   [ 8]   W u,   X i ndo ng ,   e t   a l . "T o 10   a l g o r i t hm s   i d a t a   m i ni ng , "   K now l e dge   and   i n f o r m at i on   s y s t e m s ,   v o l .   14 ,   no .   1 ,     pp.   1 - 37 , 200 8.   [ 9]   D ha na c ha n dr a ,   e t   a l . ,   " I m a g e   s e gm e nt a t i o us i ng   K - m e a ns   c l us t e r i n g   a l g o r i t hm   a nd  s ub t r a c t i v e   c l us t e r i ng   a l g o r i t hm , P r oc e di C om pu t e r   S c i e nc e ,   v o l .   54 ,   pp .   764 - 77 1,   20 15 .   [ 10]   V .   C o he n - a dd a d ,   e t   a l . ,   H i e r a r c hi c a l   C l us t e r i ng :   O bj e c t i v e   F unc t i o ns   a n A l g o r i t hm s ,   P r oc e e di n gs   o f   t he   20 18   A nnua l   A C M - SI A M   S y m pos i um   on   D i s c r e t e   A l g or i t hm s ,   2 018 .   [ 11]   M .   N .   N g u y e n,   e t   a l . ,   N e s t e r o v s   S m oo t hi ng   T e c hni qu e   a nd  M i ni m i z i ng   D i f f e r e nc e s   o f   C o n v e F unc t i o ns   f o r   H i e r a r c hi c a l   C l u s t e r i ng ,   O p t i m i z a t i on   L e t t e r s ,   v o l .   1 2,   no .   3,   p p .   4 55 - 457,   2 018 .   [ 12]   T .   K .   D e y ,   A .   R o s s i ,   &   A .   I di r o po ul o s ,   T e m po r a l   C l us t e r i ng ,   25 t A nn ual   E ur o pe an  Sy m po s i um   on  A l gor i t hm s   ( E SA   2017) . ,   L e i b ni z   I n t e r na t i o nal   P r oc e e di ng s   i I nf o r m a t i c s ,   A r t i c l e   n o .   35 ,   pp.   3 5: 1 35 : 14  a r X i v   b y   C o r ne l l   U ni v e r s i t y ,   a r X i v   P r e p r .   a r X i v 1704 . 059 64,   2 017 .   [ 13]   M .   S .   L e v i n,   T o w a r ds   ba l a nc e c l u s t e r i n g - pa r t   ( p r e l i m i na r i e s ) , ”  di s t r i bu t e c om pu t i ng ,   v o l .   12 ,   pp .   31 - 145  a r X i v   by   C o r ne l l   U n i v e r s i t y ,   a r X i v   P r e pr .   a r X i v 1706 . 03 065   ,   20 17 .   [ 14]   M.   Ś m i e j a ,   K .   H a j t o ,   &   J .   T a bo r ,   E f f i c i e nt   m i x t u r e   m o de l   f o r   c l u s t e r i ng   o f   s pa r s e   hi g di m e ns i o na l   bi na r y   da t a , ”  D at a   M i n i ng   an K now l e dge   D i s c ov e r y v o l .   33 ,   pp .   1583 - 16 24 ,   2 0 19 .   [ 15]   J .   A .   H o w e ,   I m pr ov e C l us t e r i ng   w i t A ug m e nt e k - m e a n s ,   s t a t   1050  ( 2017 ) :   22  a r X i v   b y   C o r ne l l   U ni v e r s i t y   , a r X i v   P r e p r .   a r X i v 170 5. 0 7592 ,   201 7.   [ 16]   S .   S .   A z a &   H .   A .   H e f ny ,   C e n t e r   o f   G r a v i t y   P S O   f o r   P a r t i t i o ni ng   C l us t e r i ng ,   a r X i v   by   C o r ne l l   U ni v e r s i t y ,   a r X i v   P r e p r .   a r X i v 170 6. 0099 7) ,   2017 .   [ 17]   S .   Z ho u,   Z .   X a nd  F .   L i u ,   " M e t ho f o r   D e t e r m i n i ng   t he   O pt i m a l   N um be r   o f   C l us t e r s   B a s e o A gg l o m e r a t i v e   H i e r a r c hi c a l   C l us t e r i ng , "   i I E E E   T r an s ac t i ons   on  N e ur a l   N e t w or k s   and  L e ar ni n Sy s t e m s ,   v o l .   2 8,   no .   12,     pp.   30 07 - 3017 ,   D e c .   2017 .   do i :   10. 1 109 / T N N L S . 201 6. 2 6080 01 .   [ 18]   I .   K ha nc ho uc h,   M .   C ha r r a d ,   a nd  M .   L i m a m ,   A I m pr ov e M u l t i - S O M   A l g o r i t hm   f o r   D e t e r m i ni ng   t h e   O p t i m a l   N um be r   o f   C l us t e r s ,   C om p ut e r   and   I nf or m a t i on  Sc i e nc e   201 5 Sp r i nge r p p.   18 9 20 1 20 15 .   [ 19]   R .   K i a ni ,   S .   M a hd a v i ,   a nd   A .   K e s h a v a r z i ,   A na l y s i s   a nd  pr e di c t i o of   c r i m e s   by   c l us t e r i ng   a nd  c l a s s i f i c a t i o n ,   I nt e r n at i on al   J o ur n al   o f   A dv an c e R e s e ar c i n   A r t i f i c i al   I nt e l l i ge nc e ,   v o l .   4 ,   no .   8 ,   201 5.   [ 20]   M .   N .   S e ku la ,   O pt C l us t e r :   a R   pa c ka g e   f o r   de t e r m i n i ng   t he   o pt i m a l   c l us t e r i ng   a l g o r i t hm   a n o pt i m a l   num be r   o f   c l us t e r s ,   E l e c t r on i c   T he s e s   a nd  D i s s e r t a t i ons ,   20 15 .   [ 21]   M uc a ,   e t   a l . ,   " A   pr o po s e a l g o r i t hm   f o r   de t e r m i ni ng   t he   o pt i m a l   n um be r   o f   c l us t e r s , E ur ope an  Sc i e nt i f i c   J ou r na l ,   E SJ ,   v o l .   11 no .   36 .   pp   112 - 12 0,   2 015 .   [ 22]   C.   S ubb a l a ks hm i ,   e t   a l . ,   " A   m e t ho t o   f i nd  o pt i m um   num be r   o f   c l us t e r s   ba s e o n   F uz z y   S i l ho ue t t e   o d y na m i c   da t a s e t , "   P r oc e di a   C om p ut .   Sc i .,   v o l .   46 ,   pp .   346 - 35 3,   20 15 .   [ 23]   B a i ,   L i a ng ,   J i y e   L i a ng ,   a nd  C hua ng y i D a ng " A i n i t i a l i z a t i o m e t ho t o   s i m u l t a n e o us l y   f i nd  i ni t i a l   c l us t e r   c e n t e r s   a nd  t he   num b e r   o f   c l us t e r s   f o r   c l us t e r i ng   c a t e g o r i c a l   da t a , K now l e dge - B as e S y s t e m s ,   v o l .   24 ,   no .   6   pp.   78 5 - 795 2 011 .   [ 24]   C hi a ng ,   M a r M i ng - T s o ,   a nd  B o r i s   M i r k i n " I nt e l l i g e n t   c ho i c e   of   t he   num be r   o f   c l us t e r s   i k - m e a n s   c l us t e r i ng :   a e xpe r i m e nt a l   s t udy   w i t di f f e r e nt   c l us t e r   s p r e a ds , J our nal   o f   c l as s i f i c at i on   v o l .   27 ,   p p.   3 - 40 2010 .   [ 25]   A .   H .   A l i w y   a nd  K .   B .   S .   A l j a na bi ,   A E f f i c i e n t   A l g o r i t hm   f o r   I ni t i a l i z i ng   C e n t r o i ds   i K - m e a ns   C l u s t e r i ng ,     ة ل ج م ت ا ب س ا ح ل ا   ت ا ي ض ا ي ر ل ل   ة ف و كل ا J .   K u f a   M at h.   C om p ut . ,   v o l .   2,   no .   2 ,   2 016 .   Evaluation Warning : The document was created with Spire.PDF for Python.