T E L K O M N I K T elec o m m un ica t io n Co m pu t ing   E lect ro nics   a nd   Co ntr o l   Vo l.  20 ,   No .   1 ,   Feb r u ar y   20 22 ,   p p .   98 ~ 1 0 8   I SS N:  1 6 9 3 - 6 9 3 0 ,   DOI : 1 0 . 1 2 9 2 8 /TE L KOM NI KA. v 20 i 1 . 1 8 9 3 8           98     J o ur na l ho m ep a g e h ttp : //telko mn ika . u a d . a c. i d   Ag ricultur e data   v isua liza tion a nd an a ly sis  using  data  mining   techniqu es: appli ca tion o unsu p er v ised ma chine lea rning       K un a l Ba da pa nd a 1 Deba ni  P ra s a d M is hra 1 ,   S urender  R eddy   Sa lk uti 2   1 De p a rtme n o El e c tri c a a n d   El e c tro n ics   En g i n e e rin g ,   IIIT   B h u b a n e sw a r,   Od ish a ,   I n d ia   2 De p a rtme n o Ra il ro a d   a n d   El e c tri c a En g in e e rin g ,   W o o s o n g   Un i v e rsity ,   Da e jeo n ,   Re p u b li c   o K o r e a       Art icle  I nfo     AB S T RAC T   A r ticle  his to r y:   R ec eiv ed   Dec   06 2 0 2 1   R ev is ed   Dec   1 2 ,   2 0 2 1   Acc ep ted   Dec   2 0 ,   2 0 2 1     Un su p e rv ise d   m a c h in e   lea rn in g   is   o n e   o th e   a c c e p ted   p latfo rm s fo r   a p p ly i n g   a   b ro a d   d a ta  a n a ly ti c c h a ll e n g e   th a in v o l v e th e   wa y   t o   i d e n ti fy   se c re tren d s,  u n e x p lai n e d   a ss o c iatio n s ,   a n d   o t h e si g n ifi c a n d a ta  fr o m   a   wid e   d isp e rse d   d a tas e t.   T h e   p re c ise   y i e ld   e stim a te  fo r   t h e   v a rio u c ro p in v o l v e d   in   t h e   p lan n i n g   is  a   c rit ica p r o b lem   fo a g ricu lt u ra p lan n in g .   To   a c h iev e   re a li stic  a n d   e ffe c ti v e   so lu ti o n s   t o   t h is   p r o b lem ,   d a ta  m i n in g   tec h n iq u e a re   a n   e ss e n ti a a p p ro a c h .   Ap p l y in g   d ist p lo c o m b in e d   with   k er n e d e n sity   e stim a te  ( KD E)  in   t h is  p a p e r   to   v is u a li z e   th e   p r o b a b i li ty   d e n sity   o f   d isse m in a ted   d a tas e ts  o f   v a st   c ro p   d e a ls  fo r   c ro p   p lan n in g .   T h is  p a p e fo c u se o n   a n a ly z i n g   a n d   se g m e n ti n g   a g ricu lt u ra d a ta  a n d   d e t e rm in in g   o p ti m a p a ra m e ters   to   m a x imiz e   c ro p   y ield   u si n g   d a ta  m i n in g   t e c h n iq u e s   su c h   a s K - m e a n s c lu ste rin g   a n d   p rin c ip a c o m p o n e n a n a l y sis (P C A).   K ey w o r d s :   B ig   d ata   Dis tp lo t   E lb o m eth o d   Ker n el  d en s ity   esti m ate   K - m ea n s   Prin cip al  co m p o n en t a n al y s is   T h is i a n   o p e n   a c c e ss   a rticle   u n d e r th e   CC B Y - SA   li c e n se .     C o r r e s p o nd ing   A uth o r :   Su r en d er   R ed d y   Salk u ti   Dep ar tm en t o f   R ailr o ad   an d   E lectr ical  E n g in ee r in g ,   W o o s o n g   Un iv er s ity     17 - 2 ,   J ay an g - D o n g ,   Do n g - Gu ,   Dae jeo n - 3 4 6 0 6 ,   R ep u b lic  o f   Ko r ea   E m ail:  s u r en d er @ wsu . ac . k r       1.   I NT RO D UCT I O N   I n d ia’ s   ag r icu ltu r al  h is to r y   g o es  b ac k   to   th I n d u s   Valley   C iv ilizatio n .   Ag r icu ltu r an d   o th er   r elate d   o p er atio n s   in   I n d ia  co n tr ib u te  ( 17 - 18 ) to   th Gr o s s   Do m esti Pro d u ct,   wh ich   h as  s ig n if ican ef f ec o n   th e   I n d ian   ec o n o m y .   Ag r icu ltu r p lay s   an   im p o r ta n p a r in   I n d i a’ s   s o cial  an d   ec o n o m ic  s y s tem   an d   is   th la r g est   ec o n o m ic  s eg m e n in   ter m s   o f   d em o g r a p h ics   [ 1 ] .   C r o p   o u tp u p r ed ictio n   ca n   h elp   th g o v er n m en b u ild   cr o p   in s u r an ce   p o licies  an d   s u p p ly   ch ain   o p er atio n   p o licies  u s in g   b ig   d ata  an aly s is   [ 2 ] .   I t   ca n   al s o   h elp   f ar m er s   b y   s u p p ly in g   t h em   with   p r ed icti o n   o f   th p ast cr o p   y ield   r ec o r d   th at  d ec r ea s es r is k   m an a g em en t   [ 3 ] .   T h s u m   o f   d ata  is   r is in g   ex p o n en tially ,   wh ile  th s p ee d   o f   e s tim atio n   is   s lo win g   d o wn .   I n s tan ce s   o f   l ar g d ata  in cl u d c r o p   p r o d u c tio n ,   th f ield   u s ed ,   an d   cr o p   y ield .   Sin ce   t h g o v er n m en s y s tem atica lly   an d   co n tin u o u s ly   g ath er s   d ata  o n   cr o p   p r o d u ctio n   an d   y ield ,   th s ca le  o f   th e   d ataset  is   k n o wn   to   b b ig   d ata,   wh ich   is   r ea l - wo r ld   d ata   th at   is   v er y   d if f icu lt   to   in ter p r et   [ 4 ] .   Statis tical  m eth o d s   an d   d ata  m in in g   ca n   b ex ten d ed   u n d er   d is tr ib u te d   an d   p ar allel  co m p u tin g   p latf o r m s   to   an aly ze   b ig   d ata  an d   o f ten   co n s u m es  h u g e   p r o ce s s in g   tim e   an d   v o l u m o f   s to r ag e   to   ac co m m o d ate   v ast  d ata  s ets   [ 5 ] .   Data   m in i n g   tech n i q u p lay s   a   cr u cial  r o le   in   d ata   an aly s is .   Data   m in in g   is   s u b f ield   o f   in ter d is cip lin ar y   co m p u ter   s cien ce   an d   an aly tics   with   an   o v er all  tar g et  o f   id e n tify in g   tr e n d s ,   p atter n s ,   an d   ass o ciatio n s   with in   b r o ad   d a ta  s ets  th at  in clu d e   s tr ateg ies  at  th in ter s ec t io n   o f   m ac h in lear n i n g ,   d atab as s y s tem s ,   an d   s tati s tic s   [ 6 ] D a t a   m i n i n g   u t il i z es  s p e c i al i z e d   s t a ti s t i c al   a l g o r i t h m s   w it h   t h e   u l t i m at e   p u r p o s o f   c o l l e c t i n g   d a t a   b y   s e g m en t i n g   t h e   d a t a   a n d   c o n v e r t i n g   t h e   i n f o r m a t i o n   i n to   a n   u n d e r s t a n d a b l e   f r a m e w o r k   t o   d e t e r m i n e   t h e   p o s s i b i l it y   o f   f u t u r e   e v e n t s   [ 7 ] .   T h er ar e   two   k in d s   o f   lear n in g   a p p r o ac h es  to   d ata  m i n in g u n s u p er v is ed   ( clu s ter in g )   an d   s u p e r v is ed   ( class if icatio n s )   [ 8 ] .   C lu s ter in g   is   th e   p r ac tice  o f   e v alu atin g   lis o f   d ata  p o in ts ”  an d   s o r t in g   th em   ac co r d in g   Evaluation Warning : The document was created with Spire.PDF for Python.
T E L KOM NI KA   T elec o m m u n   C o m p u t E l Co n tr o l         A g r icu ltu r d a ta   visu a liz a tio n   a n d   a n a lysi s   u s in g   … ( K u n a B a d a p a n d a )   99   to   d is tan ce   ca lc u latio n   in to   s ep ar ate  “c lu s ter s ”  [ 9 ] .   W h en   g r o u p in g   th ese  d ata  p o in ts ,   th g o al  s h o u ld   b f o r   d ata  p o in ts   in   th s am clu s ter   to   b e   s m all  d is tan ce   f r o m   ea ch   o th er ,   wh er ea s   d ata  p o in ts   in   s ep ar ate  clu s ter s   s h o u ld   b e   lo n g - d is tan ce   f r o m   ea ch   o th er   [ 1 0 ] .   Data   is   g r o u p ed   i n to   well - f o r m ed   class es  th r o u g h   clu s te r   an aly s is .   T h n o r m al  d ata  s tr u ctu r ca n   b e   ca p tu r e d   b y   well - f o r m ed   clu s ter s   [ 1 1 ] .     T h is   p ap er   aim s   to   less en   th m an u al  wo r k   o f   ap p ly in g   d a ta  m in in g   alg o r ith m s   b y   u s in g   d if f e r en t   p y th o n   m o d u les.  T h is   p ap er   u s es  p y th o n - b ased   lib r ar ies   ( n u m p y ,   p an d as,  s ea b o r n ,   K - m ea n s ,   p r in cip al  co m p o n en an aly s is   ( PC A ) ,   to o ls ,   f u n ctio n s ,   an d   m eth o d s   to   q u ick ly   an aly ze ,   m in e,   an d   v is u alize   th ag r icu ltu r d ataset.   T h d ataset  is   v i s u alize d   u s in g   d is tp lo t   co m b in ed   with   a   k er n el  d en s ity   esti m ate   ( KDE )   p lo t.  K - m ea n s   cl u s ter in g   tech n iq u is   u s ed   in   th e   cu r r en w o r k   to   f o r m   clu s ter s   f r o m   th e   ag r icu ltu r al  d ata s et .   C o m p ar ed   to   o th er   clu s ter in g   alg o r ith m s ,   th K - m ea n s   alg o r ith m   is   ex tr em ely   s im p le  to   im p lem en an d   is   also   v er y   e f f ec tiv in   co m p u ta tio n ,   wh ich   m a y   ex p lain   its   p o p u lar ity .   T h clu s ter s   o b tain e d   ar v is u alize d   b y   r ed u cin g   t h eir   d im en s io n s   u s in g   p r in ci p al  co m p o n en a n aly s is .   T h r em ain d er   o f   t h is   p ap er   is   o r g an ized   as  f o llo ws:   s ec tio n   2   ex p lain s   th m eth o d o l o g y   f o r   v is u alizin g   an d   clu s ter in g   th d ataset.   Sectio n   3   p r esen ts   th e   r esu lts   an d   f in ally ,   s ec tio n   4   c o n clu d es with   s o m d i r ec tio n s   f o r   f u tu r wo r k .       2.   RE S E ARCH   M E T H O D O L O G Y     T h is   p ap er   aim s   t o   p r o p o s m eth o d   to   a n aly ze   ag r icu lt u r al  d ata  u s in g   d ata   m in in g   t ec h n iq u es.  Ag r icu ltu r d ata  h as  b ee n   o b t ain ed   f r o m   cr ed ib le   s o u r ce s   i n   th e   p r o p o s ed   w o r k .   I n p u d a taset  co n s is o f   d ata   with   f o llo win g   p ar am eter s   n a m ely c r o p   n am e p r o d u ctio n   ( 2 0 0 6 - 2 0 1 1 ) ,   ar ea   ( 2 0 0 6 - 2 0 1 1 ) ,   y ield   ( 2 0 0 6 - 2 0 1 1 )   [ 1 2 ] .   I n   th p r o p o s ed   wo r k ,   th K - m ea n s   clu s ter in g   m eth o d   is   u s ed   to   clu s ter   d ata  b a s ed   o n   cr o p s   with   id en tical  o u tp u t,  ar ea ,   an d   y ield   am o u n ts   [ 1 3 ] .   Dis tp lo co m b in ed   with   Ker n el  d en s ity   e s tim atio n   ( KDE )   is   u s ed   f o r   v is u alizin g   th p r o b a b ilit y   d en s ity   at  d if f er en v alu es  in   co n tin u o u s   v ar iab le  o f   th d ataset  wh ich   ca n   im p r o v its   p r ed ictio n   ac cu r ac y .   T h p r in cip al  co m p o n en an aly s is   is   u s ed   f o r   d im en s io n ality   r ed u ctio n   o f   th d ataset  at  k ee p i n g   th e   o r ig in a in f o r m atio n   u n ch an g ed   [ 1 4 ] .   T h o p tim u m   p ar am eter s   f o r   m a x im u m   o u tp u t c a n   b o b tain ed   b ased   o n   th is   an aly s is .   C lu s ter in g   is   th p r o ce s s   o f   d iv id in g   d ataset  in to   g r o u p s   s u ch   th at  en titi e s   in   ea ch   c lu s ter   ar e   co m p ar ativ ely   m o r s im ilar   to   en titi es  o f   th a t   clu s ter   th a n   th o s o f   t h o t h er   clu s ter s .   I n   a   d ataset,   C lu s ter in g   ca n   r ev ea l   u n d etec ted   co n n ec t io n s .   I n   th p r o p o s ed   wo r k ,   w h av u s ed   th e   K - m ea n s   alg o r ith m   to   cl u s ter   o u r   ag r icu ltu r al  d ata.   T h e   K - m ea n s   alg o r ith m   b elo n g s   to   th e   p r o to ty p e - b ased   clu s ter i n g   g r o u p .   Pro t o ty p e - b ased   m eth o d s   s ee k   to   d ef in th d ata  s et  to   b ca teg o r ized   o r   c lu s ter ed   b y   ( u s u ally   s m all)   s et  o f   p r o to ty p es,  p ar ticu lar ly   p o in p r o t o ty p es,  wh ich   ar s im p ly   d ata  s p ac p o in ts   [ 1 5 ] .   E ac h   p r o t o ty p is   in ten d ed   to   ca p tu r e   th d is tr ib u t io n   o f   g r o u p   o f   d ata  p o in ts   b ased   o n   d ef in itio n   o f   s im ilar ity   to   th p r o to ty p o r   clo s en ess   to   it s   p o s itio n   th at  m ay   b af f ec ted   b y   th s ize  an d   s h ap p ar am eter s   o f   th ( p r o to ty p e - s p ec if ic)   [ 1 6 ] .   Ou r   g o al  is   to   g r o u p   th d ataset  b ased   o n   th eir   s im ilar i ty   in   ch ar ac ter is tic s ,   wh ich   ca n   b ac co m p lis h ed   u s in g   th alg o r ith m   K - m ea n s   th at  ca n   b e   s u m m ar i s ed   in   th f o llo win g   s ix   s tep s   [ 1 7 ]   in   Fig u r 1 .       C h o o s e   n u m b e r   o f   c l u s t e r s   K S e l e c t   r a n d o m   K   p o i n t s   t h a t   a r e   g o i n g   t o   b e   t h e   c e n t r o i d s   o f   e a c h   c l u s t e r   C a l c u l a t e   a   n e w   c e n t r o i d   f o r   e a c h   c l u s t e r A s s i g n   e a c h   d a t a p o i n t   t o   t h e   n e a r e s t   c e n t r o i d , d o i n g   s o   w i l l   e n a b l e   u s   c r e a t e   K   n u m b e r   o f   c l u s t e r s G o   t o   s t e p   4   a n d   r e p e a t R e a s s i g n   e a c h   d a t a p o i n t   t o   t h e   n e w   c l o s e t   c e t r o i d     Fig u r 1 .   Step s   f o r   ap p l y in g   K - m ea n s   clu s ter in g       Me asu r in g   s im ilar ity   b etwe en   o b jects:  s im ilar ity   is   d ef in ed   as  th o p p o s ite  d is tan ce ,   an d   th s q u ar ed   E u clid ea n   d is tan ce   b etwe en   t wo   p o in ts   p   an d   q   in   m - d im en s io n al  s p ac is   co m m o n l y   u s ed   d is tan ce   f o r   clu s ter in g   s am p les with   co n tin u o u s   f ea tu r es   [ 1 8 ] .     ( , ) 2 ( ) 2 = 1 = 2 2     ( 1 )     N o t e   t h at   t h i n d e x   i   i n   t h e   p r e c e d i n g   e q u a t i o n   r e f e r s   t o   t h e   i th   ( f e at u r e   c o l u m n )   d i m e n s i o n   o f   s a m p le  p o i n t s   p   a n d   q .   T h e   K - m ea n s   a l g o r i t h m   c a n   b e   d e f i n e d   as   a   s i m p l e   o p ti m i z at i o n   p r o b l e m   b a s e d   o n   t h is   E u c l i d e a n   d i s t a n ce   m e t r i c ,   a n   i t e r a ti v e   a p p r o a c h   t o   m i n i m i z i n g   t h e   s u m   o f   s q u a r e s   w i t h i n   t h e   c l u s t e r   ( W C S S)  [ 1 9 ] ,   wh ich   is   o f ten   also   ca lled   clu s ter   in er tia.   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   1 6 9 3 - 6 9 3 0   TEL KOM NI KA   T elec o m m u n   C o m p u t E C o n tr o l ,   Vo l.  20 ,   No .   1 Feb r u ar y   20 22 98 - 1 0 8   100       =   ( , ) = 1 = 1 ( ) ( ) 2 2     ( 2 )     wh er ( )   is   th ce n tr o id   f o r   cl u s ter   j,  ( , )   is   eq u al  to   1   if   th s am p le  ( )   is   in   clu s ter   j,  o th er wis e,   it s   v alu e   is   eq u al  to   0 .   O n o f   th e   d is ad v an tag es  o f   th is   clu s ter in g   alg o r ith m   is   th at   th n u m b e r   o f   c lu s ter s ,   k ,   p r io r i,   m u s b s p ec if ied .   Po o r   clu s ter in g   p er f o r m a n ce   m a y   r es u lt  in   a n   in a p p r o p r iate  o p ti o n   f o r   k .   Fo r   a n y   u n s u p er v is ed   alg o r ith m ,   th e   ca lcu latio n   o f   th o p tim al  n u m b er   o f   cl u s ter s   in to   wh ic h   th d ata  m ay   b e   clu s ter ed   is   f u n d am e n tal  s tep .   On e   o f   th m o s co m m o n   m eth o d s   f o r   e v alu atin g   th is   o p tim u m   k   v alu e   is   th e   elb o m eth o d   [ 2 0 ] Usi n g   th K - m ea n s   clu s ter in g   m eth o d   u s in g   th s k lear n   p y th o n   lib r ar y ,   we  ar n o w   d em o n s tr atin g   t h p r o v id ed   m eth o d .     2 . 1 .     Cre a t ing   a nd   v is ua lizin g   t he  da t a   Data   v is u aliza tio n   is   th r ep r e s en tatio n   o f   th e   d ata  v alu es  in   p icto r ial  f o r m at.   Vis u aliza tio n   o f   d ata   h elp s   in   attain in g   a   b etter   u n d er s tan d in g   an d   h elp s   d r a o u p er f ec co n clu s io n s   f r o m   th d ata.   Data   v is u aliza tio n   p lay s   cr u cial  r o le  in   an y   d ata  an a l y s is   [ 2 1 ] .   I t h elp s   to   r ec o g n ize  wh ic h   v ar ia b les  ar im p o r tan t   an d   wh ich   v ar iab les  ca n   in f lu en ce   o u r   p r e d ictio n   m o d el.   W h ile  p r ep ar i n g   a n y   m ac h in l e ar n in g   ( ML )   m o d el   we  h av t o   in itially   d is co v er   wh ich   ch ar ac te r is tics   ar s ig n if ican an d   h o th ey   ca n   af f ec t   th r esu lt.   T h is   ca n   b d o n b y   an aly zin g   th d ata  th r o u g h   d ata  v is u aliza tio n .     P y t h o n   s e a b o r n   m o d u l e :   T h e   d a t a   v i s u a li z a t i o n   m o d u l es   p r e s e n t   i n   P y t h o n   d e p e n d s   o n   t h e   P y t h o n   M a t p l o t li b   li b r a r y .   P y t h o n   s e a b o r n   i s   a l s o   o n e   o f   t h o s e   d at a   v is u a l i za t i o n   m o d u l es   w h i c h   p r o v i d e   f u n c t i o n s   w i t h   b e t t e r   e f f i ci e n c y   a n d   p l o t t i n g   f e a t u r e s .   W i t h   s e a b o r n ,   d a t a   c a n   b e   p r e s e n t e d   w i t h   d i f f e r e n t   v i s u a l iz a t i o n s   a n d   d i f f e r e n t   f e at u r e s   c a n   b e   a d d e d   t o   it   t o   e n h an c e   t h e   p i c t o r i al   r e p r e s e n t a t i o n   [ 2 2 ] .     D i s t p l o t :   A   d i s t p l o t   o r   p l o t   o f   d i s t r i b u ti o n   d e m o n s t r a t es   t h e   v a r i a n c e   i n   t h e   d is t r i b u ti o n   o f   d a t a .   T h e   S e a b o r n   d i s t p l o t   c a n   a ls o   b e   c l u b b e d   a l o n g   w i t h   t h e   k e r n e l   d e n s i t y   es t i m at e   ( K D E )   p l o t   to   e s t i m at e   t h e   p r o b a b i l i t y   o f   d i s t r i b u t i o n   o f   c o n t i n u o u s   v a r i a b l es   a c r o s s   v a r i o u s   d a t a   v a l u es .     K D E   p l o t:   I t is   a   p l o t   t h at   d e p ic t s   t h e   p r o b a b i l it y   d e n s i t y   f u n ct i o n   o f   t h e   c o n t i n u o u s   o r   n o n - p a r a m e t r i c   d at v a r i a b l e s ,   i . e . ,   w e   ca n   p l o t   f o r   th e   u n i v a r i a t e   o r   m u l t i p l e   v a r i ab l e s   a lt o g e t h e r   [ 2 3 ] .       H e a t m a p s :   O n e   o f   t h e   i m p o r t a n t   b u i l t - in   f u n c t i o n s   i n   t h e   d i r e c t i o n   o f   d a t a   e x p l o r a t i o n   a n d   v i s u a li z a ti o n   i n   s e a b o r n   i s   h e at m a p s .   S e a b o r n   h e a t m a p s   v is u a li z e   t h e   d at a   a n d   r e p r e s e n t   i t   i n   t h e   f o r m   o f   a   s u m m a r y   t h r o u g h   t h e   g r a p h / c o l o r e d   m a p s   [ 2 4 ] .   D is t p l o t   c o m b i n e s   t wo   p l o t s .   I c o m b i n e s   m a t p l o tl ib .   H i s t   f u n c t i o n   w i t h   s e a b o r n   d e p l o t ( ) .   W e   h a v e   u s e d   h e a t m a p   f o r   f i n d i n g   c o r r e l a t i o n s   i n   t h e   d at as e t .   F i g u r e   2   d e s c r i b es   t h c o d e   f o r   c r e a t i n g   a n d   v i s u a li z in g   t h e   d a t a s et ,   w h i c h   i n cl u d e s   4   b l o c k s   r e p r e s e n ti n g   t h e   c o d f o r   i m p o r t i n g   t h e   l i b r a r i es ,   l o a d i n g   t h e   d at a s et ,   p l o t t i n g   t h e   d is t p l o t ,   a n d   p l o tt i n g   t h e   h e a t m a p   r es p e c ti v e l y .           Fig u r 2 .   Step s   in v o lv ed   in   v is u alizin g   th d ataset       2 . 2 .     F ind ing   nu m ber  o f   clus t er s   K   by   elbo m et ho d   T h is   is   p er h ap s   th b est - k n o wn   m ea n s   o f   esti m atin g   th o p tim u m   n u m b e r   o f   clu s ter s   [ 2 5 ] .   I n   its   m eth o d ,   it  is   also   b it  n aiv e.   Me asu r th with in - clu s ter s - s u m   o f   s q u ar es  ( W C SS )   f o r   v a r io u s   k   v al u es,  an d   p ick   th k   f o r   wh ich   W C SS   b eg in s   to   d im in is h   f ir s t.  T h is   is   ev id en as  an   el b o in   th e   p l o o f   W C SS - v er s u s - k .   W ith in - clu s ter - s u m   o f   Sq u a r es so u n d s   s o r t o f   co m p licated .   L et' s   b r ea k   d o wn   th is   in   Fig u r 3 .     W n ee d   to   s ca le  th co n tin u o u s   f ea tu r es  to   g iv e   all  ch ar ac t er is tics   eq u al  s ig n if ican ce .   Scik it - lear n ' s   s tan d ar d   s ca ler   will b in clu d ed .   W will in itia lize  K - m ea n s   f o r   ea ch   k   v al u an d   u s th at tr ib u te  o f   in er tia  to   d ef in th e   n u m b er   o f   s q u ar ed   s am p le  d is tan ce s   to   th n ea r es clu s ter   co r e.   T h s q u ar ed   d is tan ce   n u m b er   te n d s   to   ze r o   as  k   in cr e ases .   I m ag in th at  k   is   s et  to   i ts   m ax im al  v alu n   ( wh er n   is   th n u m b er   o f   s am p les)  an d   ea ch   s am p le  f o r m s   its   clu s ter ,   m ea n in g   th to tal  o f   s q u a r d is tan ce s   is   eq u al  to   ze r o .   T h co d u s ed   to   m ap   th to tal  k   s q u ar d is tan ce s   is   d ef in ed   in   Fig u r 4 .   T h is   f ig u r d ep icts   th f o u r   b lo ck s   r e p r esen tin g   th c o d e   Evaluation Warning : The document was created with Spire.PDF for Python.
T E L KOM NI KA   T elec o m m u n   C o m p u t E l Co n tr o l         A g r icu ltu r d a ta   visu a liz a tio n   a n d   a n a lysi s   u s in g   … ( K u n a B a d a p a n d a )   101   f o r   im p o r tin g   th lib r ar ies,  s ca lin g   th d ataset,   in itializin g   th K - m ea n s   f o r   ea c h   k   v alu e,   an d   ap p ly in g   th e   elb o m eth o d ,   r esp ec tiv ely .   I f   th p lo lo o k s   lik an   ar m ,   s o   an   id ea k   is   th elb o o n   t h ar m .   Usi n g   th e   s k lear n   lib r ar y   an d   o u r   f ea tu r e   f o r   ca lcu latin g   W C SS   f o r   s ev er al  v alu es f o r   k ,   let  u s   im p le m en t th is   in   Py th o n .       W C S S T h e   W C S S   s c o r e   i s   t h e   s u m   o f   t h e s e   s q u a r e d   E r r o r s   f o r   a l l   t h e   p o i n t s . T h e   S q u a r e d   E r r o r   f o r   e a c h   p o i n t   i s   t h e   s q u a r e   o f   t h e   d i s t a n c e   o f   t h e   p o i n t   f r o m   i t s   r e p r e s e n t a t i o n   i . e .   i t s   p r e d i c t e d   c l u s t e r   c e n t e r .   A n y   d i s t a n c e   m e t r i c   l i k e   t h e   E u c l i d e a n   D i s t a n c e   o r   t h e   M a n h a t t a n   D i s t a n c e   c a n   b e   u s e d .     Fig u r 3 .   B r ief   d escr ip tio n   o f   W C SS           Fig u r 4 .   Step s   in v o lv ed   in   f in d in g   th n u m b er   o f   clu s ter s   ( K)   b y   elb o m eth o d       2 . 3 .     Appl y ing   K - m ea ns   a nd   princip a l c o m po nent  a na ly s is   ( P CA)   I n   th e   co d f o r   ap p l y in g   th K - m ea n s   alg o r ith m ,   th K - m ea n s   o b ject  h as  b ee n   c r ea ted   a n d   p ass ed   as  th n u m b er   o f   clu s ter s   “K”   o b tain ed   f r o m   th el b o m eth o d .   I n   th e   n e x lin e   f it  m et h o d   o n   K - m ea n s   h as  b ee n   ca lled   an d   th e   “c r o p _ d f _ s ca led ”  d ataset  h as  b ee n   p ass ed   th r o u g h   it   K - m ea n s .   L a b els_   is   u s ed   to   s ee   th lab els   f o r   th d ata p o in ts .   Via  d im en s io n ality   r ed u ctio n ,   t h clu s te r s   we  h av e   id en tifie d   af ter   ap p ly in g   th K - m ea n s   clu s ter in g   ap p r o ac h   ca n   b e   v is ib le.   PC is   an   ef f ec tiv e   to o f o r   v is u alizin g   h ig h - d i m en s io n al  d ata   in   co m b in atio n   with   K - m ea n s .   I is   an   u n s u p er v is e d   m ac h in e   lear n in g   alg o r ith m .   PC p r o jects  th em   in to   lo wer - d im en s io n al   v ac u u m ,   r estricts  th em ,   an d   v is u alize s   th em   to   o n ly   f ew   s ig n if ica n k ey   o n es  [ 2 6 ] .   Fig u r 5   d escr ib es  th co d f o r   im p lem en tin g   PC o n   th d ataset,   ea ch   b lo ck   in   th is   f ig u r r ep r ese n ts   th co d f o r   o b tain i n g   th p r in cip al  co m p o n e n ts ,   cr ea tin g   d ata f r am with   two   co m p o n e n ts ,   c   co n ca ten atin g   t h e   lab els to   th d ataf r am e ,   an d   v i s u alizin g   an d   in ter p r etin g   t h clu s ter s .             Fig u r 5 .   Step s   in v o lv ed   in   ap p ly in g   PC o n   th d ataset       Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   1 6 9 3 - 6 9 3 0   TEL KOM NI KA   T elec o m m u n   C o m p u t E C o n tr o l ,   Vo l.  20 ,   No .   1 Feb r u ar y   20 22 98 - 1 0 8   102   3.   RE SU L T S   A ND  D IS CU SS I O N   3 . 1 .     Vis ua lizing   t he  da t a s et   T h d ataset  m u s t b v is u alize d   b ef o r a p p ly in g   th e   K - m ea n s   alg o r ith m   t o   th e   d ataset.   R esu lts   o f   d ata   v is u aliza tio n   ar s h o wn   in   Fi g u r es   ( s ee   Ap p en d ix )   an d   7.   Fig u r 6   ( s ee   Ap p en d ix )   d e p icts   th e   KDE   p lo t   co m b in ed   with   d is tp lo is   p lo tted   f o r   t h d ataset  to   an aly ze   th d ata  th r o u g h   v is u aliza tio n .   Fig u r 7   d ep icts   th e   r esu lt  o f   t h h ea tm ap   p lo wh i ch   is   p lo tted   b y   r e p r esen tin g   t h d ataset  in   th f o r m   o f   a   2 - d im en s io n al  f o r m at   f o r   f in d in g   c o r r elatio n s   am o n g   th d ata.           Fig u r 7 .   Hea tm ap   f o r   th g iv en   d ataset       3. 2   Clus t er ing   T o   ca lcu late  th v alu e   ( n u m b er   o f   cl u s ter s ) ,   th elb o w   m eth o d   is   ap p lied   to   t h d a taset.  T h e   o u tco m o f   t h elb o w   p r o ce s s   is   r ep r esen ted   in   Fig u r e   8 ,   an d   it  d ep icts   th e   r esu lt  o f   t h e   elb o p lo t   wh ich   is   p lo tted   u s in g   th with i n - clu s ter   s u m   o f   s q u ar es  f o r   a   r an g e   o f   v alu es  o f   K T h o p tim u m   n u m b er   o f   clu s ter s   ( v alu e)   is   d eter m in ed   b y   c h o o s in g   th “e lb o w ”  v al u o f   K,   i.e . ,   th p o in at  wh ich   th W C S S   s tar ts   to   d ec r ea s lin ea r ly .   T h er ef o r e,   we  ass u m th at  th n u m b er   o f   clu s ter s   i s   4   f o r   th g iv en   d ataset T ab le  1   d ep icts   th r esu l o f   t h K - m ea n s   clu s ter in g   alg o r ith m .   Fig u r 9   d ep icts   th e   clu s ter s   we  h av o b tai n ed r e p r esen ted   b y   r ed u cin g   th eir   d im e n s io n s   u s in g   Prin cip al  co m p o n en t   a n aly s is .   C r o p s   ar co m m o n ly   p ick ed   f o r   th eir   ec o n o m ic   s ig n if ican ce .   T h e   ag r icu ltu r al  p la n n in g   p r o ce s s ,   h o wev er ,   in v o lv es  a n   esti m ate  o f   th y ield   o f   m an y   cr o p s .   I n   th is   co n tex t,   u s in g   d ata  av ailab ilit y   as  th m ain   m etr ic,   5 4   cr o p s   h a v b ee n   s elec ted   f o r   t h is   wo r k .   C r o p s   wer o n ly   c h o s en   wh e n   ap p r o p r iate  d ata  s am p les ca m u n d er   r ev iew  in   t h 6 - y ea r   r a n g ( 2 0 0 6 - 1 1 ) .   As  r esu lt  o f   th K - m ea n s   clu s ter in g   alg o r ith m ,   4   clu s ter s   ar f o r m ed .   C lu s ter   0   r e p r esen ts   th cr o p s   h av in g   m ed iu m   p r o d u ctio n ,   h ig h   a r ea ,   an d   m e d iu m - lo w   y ield .   C lu s ter   1   r ep r esen ts   th c r o p s   h av in g   lo w   p r o d u ctio n ,   lo ar ea ,   an d   m e d iu m   y i eld .   C lu s ter   2   r ep r esen ts   th c r o p s   h av in g   h ig h   p r o d u ct io n ,   m e d iu m   ar ea ,   an d   h ig h   y ield .   C lu s ter   3   r ep r esen ts   th cr o p s   h av in g   m ed iu m - lo p r o d u ctio n ,   m e d iu m - lo ar ea ,   an d   lo y ield .   Prin cip al  c o m p o n en a n aly s is   is   u s ed   to   r ep r esen th clu s ter s   b y   r e d u cin g   th ei r   d im en s io n s .   T h e   p r esen wo r k   co v er s   th d i s tp lo co m b in ed   with   th k e r n el  d en s ity   esti m ate  p lo an d   h ea tm ap   f o r   v is u aliza tio n .   T h e   elb o w   m eth o d   is   u s ed   f o r   f in d in g   th e   o p tim al  n u m b er   o f   clu s ter s   “K” .   K - m ea n s   clu s ter in g   alg o r ith m   is   ap p lie d   to   f o r m   c lu s ter s   f r o m   th d ataset.   T h p r in cip al  co m p o n en an aly s is   is   u s ed   to   r ep r esen t   th clu s ter s   f o r m ed   b y   r ed u c in g   th eir   d im e n s io n s .   T h cr o p   d ata  co llectio n   ca n   b a n aly s ed   u s in g   th ese  m eth o d s   an d   th o p tim u m   p a r am eter s   f o r   cr o p   p r o d u ctio n   ca n   b ca lcu lated .   Evaluation Warning : The document was created with Spire.PDF for Python.
T E L KOM NI KA   T elec o m m u n   C o m p u t E l Co n tr o l         A g r icu ltu r d a ta   visu a liz a tio n   a n d   a n a lysi s   u s in g   … ( K u n a B a d a p a n d a )   103       Fig u r 8 .   W C SS   v s   p lo t ( elb o m eth o d )       T ab le  1 .   C lu s ter s   o b tain ed   f r o m   th K - m ea n   al g o r ith m   to   r e p r esen t c r o p s   as p er   p r o d u ctio n ,   ar ea ,   a n d   y ield   C l u st e r   C r o p s   P r o d u c t i o n   r a n g e   A r e a   r a n g e   Y i e l d   r a n g e   C l u st e r   0   ( M e d i u P r o d u c t i o n ,   H i g h   A r e a   a n d   M e d i u m - L o w   Y i e l d )   R i c e ,   M a i z e ,   S o y a b e a n ,   D r y   g i n g e r ,   A r e c a n u t ,   G a r l i c ,   T o t a l   F r u i t s &  V e g e t a b l e s,  P o t a t o ,   O n i o n ,   B a n a n a   1 9 9 . 5 9 - 2 9 9 . 9 5   1 6 8 . 5 6 - 2 1 3 . 6 3   1 1 9 . 5 7 - 1 4 0 . 7 0   C l u st e r   1   ( Lo w   P r o d u c t i o n ,   L o w   A r e a ,   a n d   M e d i u mY i e l d )   B a j r a ,   R a g i ,   S ma l l   mi l l e t s ,   B a r l e y ,   S e samu m ,   R a p e s e e d   M u st a r d ,   Li n s e e d ,   S a f f l o w e r ,   N i g e r   se e d ,   M e s t a ,   J u t e   M e st a ,   S a n n h a m p ,   D r y   c h i l i e s,   C a r d a mo m ,   C o r i a n d e r ,   S w e e t   p o t a t o ,   T o b a c c o   9 7 . 2 7 - 1 2 0 . 5 4   7 1 . 2 4 - 7 6 . 6 8   1 3 4 . 7 0 - 1 5 4 . 1 5   C l u st e r   2   ( H i g h   P r o d u c t i o n ,   M e d i u m A r e a ,   a n d   H i g h   Y i e l d )   To t a l   S p i c e s   1 4 2 7 . 7 0 - 1 7 9 0 . 6 0   1 2 1 . 3 0 - 1 3 6 . 6 0   1 1 7 2 . 1 0 - 1 3 1 0 . 8 0   C l u st e r   3   ( M e d i u m - Lo w   P r o d u c t i o n ,   M e d i u m - L o w   A r e a ,   a n d   L o w   Y i e l d )   To t a l   F o o d g r a i n s,  W h e a t ,   J o w a r ,   C o a r se  C e r e a l s,   C e r e a l s,  G r a m ,   A r h a r ,   O t h e r   P u l se ,   T o t a l   N o n - F o o d   g r a i n s ,   T o t a l   O i l see d s,   G r o u n d n u t ,   C a st o r   se e d ,   S u n f l o w e r ,   N i n e   O i l see d s,   C o c o n u t ,   C o t t o n see d ,   T o t a l   F i b e r s,  C o t t o n   ( l i n t ) ,   Ju t e ,   T e a ,   C o f f e e ,   R u b b e r ,   B l a c k   p e p p e r ,   T u r mer i c ,   Ta p i o c a ,   S u g a r c a n e .   1 5 0 . 0 4 8 - 1 7 4 . 8 3   1 2 1 . 2 5 - 1 2 6 . 6 8   1 2 3 . 9 7 - 1 3 7 . 5 1           Fig u r 9 .   R esu lt o f   PC A       4.   CO NCLU SI O NS   A ND  F UT URE WO RK   I n   d ev elo p in g   co u n tr ies   s u ch   as  I n d ia,   ag r icu ltu r is   th m o s s ig n if ican ap p licatio n   f ield .   I n   ag r icu ltu r e,   th e   u s o f   in f o r m atio n   tech n o lo g ies  ca n   im p r o v th e   d ec is io n - m a k in g   s ce n a r io ,   a n d   f ar m er s   c an   p er f o r m   m o r e .   I n   s ev er al  m atter s   r elatin g   to   th ag r icu ltu r s ec to r ,   d ata  m in in g   p lay s   k e y   r o le  in   d ec is io n - m ak in g .   T h is   p a p er   d is cu s s e th r o le  o f   d ata   m in in g   f r o m   th p e r s p ec tiv o f   th e   ag r ic u ltu r f ield .   On   th e   in p u d ata,   d i f f er en t d ata  m in i n g   tech n iq u es  ar ap p lied   t h at  ca n   b u s ed   to   d eter m in th b est  o u tp u y ield in g   pr o ce s s .   T o   o b tain   th o p tim u m   p ar am eter s   to   ac h iev h ig h er   cr o p   y ield ,   th p r esen s tu d y   u s ed   d ata  m in in g   tech n iq u es  s u ch   as  K - m ea n s   c lu s ter in g ,   p r in cip al   co m p o n en t   an aly s is .   T h r o u g h   th is   p ap e r ,   an   attem p t   is   m ad e   to   less en   th e   m an u al   wo r k   o f   ap p ly in g   d ata   m in in g   alg o r ith m s   b y   u s in g   d if f e r en p y th o n   m o d u les.   E x p an d in g   th p r esen wo r k   t o   ev alu ate   s o il,  clim ate  co n d itio n s ,   d e m an d   d ata,   a n d   o th e r   v ar ia b les  f o r   th cr o p   t o   im p r o v t h cr o p   y ield   is   s co p f o r   f u tu r wo r k .       ACK NO WL E DG E M E NT S   T h is   r esear ch   wo r k   was f u n d e d   b y   W o o s o n g   Un iv e r s ity s   Aca d em ic  R esear ch   Fu n d in g   -   2022 .       Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   1 6 9 3 - 6 9 3 0   TEL KOM NI KA   T elec o m m u n   C o m p u t E C o n tr o l ,   Vo l.  20 ,   No .   1 Feb r u ar y   20 22 98 - 1 0 8   104   AP P E N D IX     P r o d u c t i o n   ( 2 0 0 6 - 11)       Fig u r e   6 .   Dis tp lo t c o m b in ed   w ith   KDE   p lo t f o r   th g iv e n   d at aset   Evaluation Warning : The document was created with Spire.PDF for Python.
T E L KOM NI KA   T elec o m m u n   C o m p u t E l Co n tr o l         A g r icu ltu r d a ta   visu a liz a tio n   a n d   a n a lysi s   u s in g   … ( K u n a B a d a p a n d a )   105   A r e a   ( 2 0 0 6 - 11)       Fig u r e   6 .   Dis tp lo t c o m b in ed   w ith   KDE   p lo t f o r   th g iv e n   d at aset ( co n tin u e)     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   1 6 9 3 - 6 9 3 0   TEL KOM NI KA   T elec o m m u n   C o m p u t E C o n tr o l ,   Vo l.  20 ,   No .   1 Feb r u ar y   20 22 98 - 1 0 8   106       Fig u r e   6 .   Dis tp lo t c o m b in ed   w ith   KDE   p lo t f o r   th g iv e n   d at aset ( co n tin u e)   Evaluation Warning : The document was created with Spire.PDF for Python.
T E L KOM NI KA   T elec o m m u n   C o m p u t E l Co n tr o l         A g r icu ltu r d a ta   visu a liz a tio n   a n d   a n a lysi s   u s in g   … ( K u n a B a d a p a n d a )   107   RE F E R E NC E   [ 1 ]   R .   R .   W a g h   a n d   A .   D o n g r e ,   " A g r i c u l t u r a l   s e c t o r st a t u s c h a l l e n g e s   a n d   i t ' r o l e   i n   I n d i a n   e c o n o my , "   J o u r n a l   o f   C o m m e r c e   a n d   Ma n a g e m e n t   T h o u g h t ,   v o l .   7 ,   n o .   2 ,   p p . 2 0 9 - 2 1 8 ,   2 0 1 6 ,   d o i :   1 0 . 5 9 5 8 / 0 9 7 6 - 4 7 8 X . 2 0 1 6 . 0 0 0 1 4 . 8 .   [ 2 ]   A .   K .   S . M d .   K h a n   Ta j u d d i n a n d   K A v i n a s h ,   " A d o p t i o n   o f   c r o p   i n su r a n c e   a n d   i m p a c t :   i n si g h t f r o I n d i a , "   A g r i c u l t u r a l   Ec o n o m i c s   Re se a rc h   R e v i e w ,   v o l .   3 1 ,   n o .   2 ,   p p . 1 6 3 - 1 7 4 ,   2 0 1 8 ,   d o i :   1 0 . 5 9 5 8 / 0 9 7 4 - 0 2 7 9 . 2 0 1 8 . 0 0 0 3 4 . 4 .   [ 3 ]   K .   C o b l e ,   T .   O   K n i g h t ,   G .   F .   P a t r i c k ,   a n d   A .   E.   B a q u e t ,   " C r o p   p r o d u c e r   r i sk   ma n a g e me n t   su r v e y a   p r e l i mi n a r y   s u mm a r y   o f   sel e c t e d   d a t a , "   M i ss i ssi p p i   S t a t e   U n i v e r si t y ,   In f o r mat i o n   R e p o r t   99 - 0 0 1 ,   M i ssi ssi p p i ,   1 9 9 9 .   [ 4 ]   X .   W u ,   X .   Z h u ,   G Q .   Wu ,   a n d   W D i n g ,   " D a t a   m i n i n g   w i t h   b i g   d a t a , "   I E E T ra n s a c t i o n o n   K n o w l e d g e   a n d   D a t a   En g i n e e ri n g ,   v o l .   2 6 ,   n o .   0 1 ,   p p .   9 7 - 1 0 7 ,   2 0 1 4 ,   d o i :   1 0 . 1 1 0 9 / T K D E . 2 0 1 3 . 1 0 9 .   [ 5 ]   C .   W a n g ,   M . - H .   C h e n ,   E .   S c h i f a n o ,   J .   Wu ,   a n d   J Y a n ,   " S t a t i s t i c a l   me t h o d s   a n d   c o m p u t i n g   f o r   b i g   d a t a , "   S t a t   I n t e r f a c e ,   v o l .   9 ,     n o .   4 ,   p p .   3 9 9 - 4 1 4 ,   2 0 1 6 ,   d o i :   1 0 . 4 3 1 0 / S I I . 2 0 1 6 . v 9 . n 4 . a 1 .     [ 6 ]   S A g a r w a l ,   "D a t a   m i n i n g   c o n c e p t a n d   t e c h n i q u e s , I n t e r n a t i o n a l   C o n f e r e n c e   o n   M a c h i n e   I n t e l l i g e n c e   Re s e a rc h   a n d   Ad v a n c e m e n t ,   2 0 1 3 p p .   2 0 3 - 2 0 7 ,   d o i :   1 0 . 1 1 0 9 / i c m i r a . 2 0 1 3 . 4 5 .   [ 7 ]   M .   S h a f i e i   a n d   E.   M i l o s ,   " A   st a t i st i c a l   mo d e l   f o r   t o p i c   se g me n t a t i o n   a n d   c l u s t e r i n g , "   C o n f e r e n c e   o f   t h e   C a n a d i a n   S o c i e t y   f o r   C o m p u t a t i o n a l   S t u d i e o f   I n t e l l i g e n c e ,   B e r l i n ,   2 0 0 8 ,   d o i :   1 0 . 1 0 0 7 / 9 7 8 - 3 - 540 - 6 8 8 2 5 - 9 _ 2 7 .   [ 8 ]   K .   B i n d r a   a n d   A .   M i s h r a ,   " A   d e t a i l e d   st u d y   o f   c l u st e r i n g   a l g o r i t h m s,"  6 t h   I n t e r n a t i o n a l   C o n f e re n c e   o n   Re l i a b i l i t y ,   I n f o c o m   T e c h n o l o g i e s   a n d   O p t i m i za t i o n   ( T ren d a n d   F u t u r e   D i re c t i o n s)   ( I C RI T O ) ,   N o i d a ,   I n d i a ,   2 0 1 7 p p .   3 7 0 - 3 7 6 ,     d o i :   1 0 . 1 1 0 9 / I C R I TO . 2 0 1 7 . 8 3 4 2 4 5 4 .   [ 9 ]   C .   M a i o n e a ,   D R. . N e l so n ,   a n d   R .   M .   B a r b o S sa ,   " R e s e a r c h   o n   s o c i a l   d a t a   b y   m e a n o f   c l u st e r   a n a l y si s , "   Ap p l i e d   C o m p u t i n g   a n d   I n f o rm a t i c s,  v o l .   1 5 ,   n o .   2 ,   p p .   1 5 3 - 1 6 2 ,   2 0 1 9 ,   d o i :   1 0 . 1 0 1 6 / j . a c i . 2 0 1 8 . 0 2 . 0 0 3 .   [ 1 0 ]   A .   K h a n d a r e   a n d   A A l v i ,   " Ef f i c i e n t   c l u s t e r i n g   a l g o r i t h m   w i t h   i m p r o v e d   c l u st e r s   q u a l i t y , "   I O S R   J o u r n a l   o f   C o m p u t e r E n g i n e e ri n g   ( I O S R - J C E) ,   v o l .   1 8 ,   n o .   6 ,   p p .   1 5 - 1 9 ,   2 0 1 6 ,   d o i :   1 0 . 9 7 9 0 / 0 6 6 1 - 1 8 0 6 0 5 1 5 1 9 .   [ 1 1 ]   M .   Z .   R o d r i g u e z   e t   a l .,   " C l u s t e r i n g   a l g o r i t h m s:   A   c o m p a r a t i v e   a p p r o a c h , "   PLo S   O N E,   v o l .   1 4 ,   n o .   1 ,   p p .   0 2 - 3 6 ,   2 0 1 9   d o i :   0 . 1 3 7 1 / j o u r n a l . p o n e . 0 2 1 0 2 3 6 .   [ 1 2 ]   J .   M a j u md a r   a n d   S .   N a r a see y a p p a ,   " A n a l y s i s o f   a g r i c u l t u r e   d a t a   u si n g   d a t a   mi n i n g   t e c h n i q u e s:   a p p l i c a t i o n   o f   b i g   d a t a , "   J o u rn a l   o f   Bi g   D a t a ,   v o l .   4 ,   n o .   1 ,   2 0 1 7 ,   d o i :   1 0 . 1 1 8 6 / s 4 0 5 3 7 - 0 1 7 - 0 0 7 7 - 4 .   [ 1 3 ]   T K .   A n d e r s o n ,   " K e r n e l   d e n s i t y   e s t i mat i o n   a n d   K - me a n c l u st e r i n g   t o   p r o f i l e   r o a d , "   Ac c i d e n t   A n a l y si s   &   Pr e v e n t i o n ,   v o l .   4 1 ,   n o .   3 ,   p p .   3 5 9 - 3 6 4 ,   2 0 0 9 ,   d o i :   1 0 . 1 0 1 6 / j . a a p . 2 0 0 8 . 1 2 . 0 1 4 .     [ 1 4 ]   S .   S e h g a l ,   H .   S i n g h ,   M .   A g a r w a l ,   a n d   V.   B . ,   S h a n t a n u ,   " D a t a   a n a l y s i u si n g   p r i n c i p a l   c o m p o n e n t   a n a l y si s,"  I n t e r n a t i o n a l   C o n f e re n c e   o n   M e d i c a l   I m a g i n g ,   m - H e a l t h   a n d   Em e r g i n g   C o m m u n i c a t i o n   S y s t e m ( M e d C o m ) ,   2 0 1 4 p p .   4 5 - 4 8 ,   d o i 1 0 . 1 1 0 9 / M e d C o m. 2 0 1 4 . 7 0 0 5 9 7 3 .   [ 1 5 ]   J .   K i m ,   R .   K r i s h n a p u r a m,   a n d   R .   D a v e ,   " A p p l i c a t i o n   o f   t h e   l e a s t   t r i mm e d   s q u a r e s   t e c h n i q u e   t o   p r o t o t y p e - b a se d   c l u s t e r i n g , "   Pa t t e r n   Re c o g n i t i o n   L e t t e rs ,   v o l .   1 7 ,   n o .   6 ,   p p .   6 3 3 - 6 4 1 ,   1 9 9 6 ,   d o i :   1 0 . 1 0 1 6 / 0 1 6 7 - 8 6 5 5 ( 9 6 ) 0 0 0 2 8 - 1 .   [ 1 6 ]   J .   H ä l ä i n e n ,   S .   J a u h i a i n e n ,   a n d   T K a r k k a i n e n ,   " C o m p a r i s o n   o f   I n t e r n a l   C l u st e r i n g   V a l i d a t i o n   I n d i c e f o r   P r o t o t y p e - B a se d   C l u st e r i n g , "   C l u s t e r i n g   Al g o ri t h m s,   v o l .   1 0 ,   n o .   3 ,   p p .   1 0 5 - 1 1 9 ,   2 0 1 7 ,   d o i :   1 0 . 3 3 9 0 / a 1 0 0 3 0 1 0 5 .   [ 1 7 ]   S .   N a ,   L .   X u mi n ,   a n d   G .   Y o n g ,   " R e s e a r c h   o n   k - me a n s   c l u s t e r i n g   a l g o r i t h m:   a n   i mp r o v e d   k - m e a n c l u st e r i n g   a l g o r i t h m , "   T h i rd   I n t e r n a t i o n a l   S y m p o si u m   o n   I n t e l l i g e n t   I n f o rm a t i o n   T e c h n o l o g y   a n d   S e c u r i t y   I n f o rm a t i c s ,   J i n g g a n g s h a n ,   C h i n a ,   2 0 1 0 p p .   6 3 - 6 7 ,   d o i :   1 0 . 1 1 0 9 / I I TS I . 2 0 1 0 . 7 4 .   [ 1 8 ]   J .   I r a n i   a n d   N .   P i s e ,   a n d   M .   P h a t a k ,   C l u s t e r i n g   t e c h n i q u e s   a n d   t h e   si m i l a r i t y   me a su r e u se d   i n   c l u st e r i n g :   A   s u r v e y , ”  I n t e r n a t i o n a l   J o u r n a l   o f   C o m p u t e r   Ap p l i c a t i o n s ,   v o l .   1 3 4 n o .   7 ,   p p .   9 - 14 ,   2 0 1 6 ,   d o i :   1 0 . 5 1 2 0 / i j c a 2 0 1 6 9 0 7 8 4 1 .   [ 1 9 ]   T .   T h i n s u n g n o e n a ,   N .   K a o u n g k u ,   P .   D u r o n g d u mr o n c h a i b ,   K .   K e r d p r a s o p ,   a n d   N K e r d p r a s o p ,   " T h e   c l u st e r i n g   v a l i d i t y   w i t h   si l h o u e t t e   a n d   s u m   o f   s q u a r e d   e r r o r s , "   3 r d   I n t e r n a t i o n a l   C o n f e r e n c e   o n   I n d u st r i a l   A p p l i c a t i o n   En g i n e e ri n g ,   2 0 1 5 ,   d o i :   1 0 . 1 2 7 9 2 / I C I A E2 0 1 5 . 0 1 2   [ 2 0 ]   D .   M a r u t h o ,   S .   H .   H a n d a k a ,   E .   W i j a y a ,   a n d   M u l j o n o ,   " T h e   d e t e r m i n a t i o n   o f   c l u st e r   n u mb e r   a t   k - mea n   u si n g   e l b o w   met h o d   a n d   p u r i t y   e v a l u a t i o n   o n   h e a d l i n e   n e w s , "   I n t e r n a t i o n a l   S e m i n a o n   A p p l i c a t i o n   f o T e c h n o l o g y   o f   I n f o rm a t i o n   a n d   C o m m u n i c a t i o n ,   S e mara n g ,   I n d o n e si a ,   2 0 1 8 ,   d o i :   1 0 . 1 1 0 9 / I S EM A N TI C . 2 0 1 8 . 8 5 4 9 7 5 1 .   [ 2 1 ]   S K .   A .   F a h a d   a n d   A .   E .   Y a h y a   " B i g   d a t a   v i s u a l i z a t i o n :   a l l o t t i n g   b y   R   a n d   P y t h o n   w i t h   G U I   To o l s,"  I n t e r n a t i o n a l   C o n f e re n c e   o n   S m a r t   C o m p u t i n g   a n d   El e c t r o n i c   E n t e rp ri s e ,   K u a l a   Lu mp u r ,   M a l a y s i a ,   2 0 1 8 ,   d o i :   1 0 . 1 1 0 9 / I C S C EE. 2 0 1 8 . 8 5 3 8 4 1 3 .   [ 2 2 ]   P .   L e me n k o v a ,   " P y t h o n   l i b r a r i e mat p l o t l i b ,   se a b o r n   a n d   p a n d a s   f o r   v i s u a l i z a t i o n   g e o s p a t i a l , "   A n a l e l e   s t i i n t i f i c e   a l e   U n i v e rs i t a t i i   Al e x a n d ru   I o a n   C u z a d i n   I a si   -   ser i a   G e o g ra f i e ,   v o l .   6 4 ,   n o .   1 ,   p p .   1 3 - 32 ,   2 0 2 0 ,   d o i :   1 0 . 1 5 5 5 1 / sc i g e o . v 6 4 i 1 . 3 8 6 .   [ 2 3 ]   T.   L e d l ,   " K e r n e l   d e n si t y   e st i m a t i o n :   t h e o r y   a n d   a p p l i c a t i o n   i n   d i scr i mi n a n t   a n a l y si s , A u st r i a n   J o u r n a l   o f   S t a t i s t i c s v o l .   3 3 ,   n o .   3 ,   p p .   2 6 7 - 2 7 9 ,   2 0 0 4 ,   d o i :   1 0 . 1 7 7 1 3 / a j s. v 3 3 i 3 . 4 4 1   .   [ 2 4 ]   S .   Zh a o ,   Y .   G u o ,   Q .   S h e n g ,   a n d   Y .   S h y r ,   " A d v a n c e d   h e a t m a p   a n d   c l u st e r i n g   a n a l y s i u si n g   h e a t ma p 3 , "   B i o Me d   Re se a rc h   I n t e r n a t i o n a ,   v o l .   2 0 1 4 ,   p p .   1 - 6 ,   2 0 1 4 , d o i :   1 0 . 1 1 5 5 / 2 0 1 4 / 9 8 6 0 4 8 .   [ 2 5 ]   M.   A .   S y a k u r ,   B .   K .   K h o t i m a h ,   E.   M.   S .   R o c h ma n ,   a n d   B.   D .   S a t o t o ,   " I n t e g r a t i o n   K - me a n c l u s t e r i n g   me t h o d   a n d   e l b o w   me t h o d   f o r   i d e n t i f i c a t i o n   o f   t h e   b e s t   c u st o mer   p r o f i l e   c l u st e r , "   I O C o n f e re n c e   S e r i e s:   M a t e ri a l S c i e n c e   a n d   E n g i n e e ri n g ,   v o l .   3 3 6 ,   T h e   2 n d   I n t e r n a t i o n a l   C o n f e r e n c e   o n   V o c a t i o n a l   E d u c a t i o n   a n d   El e c t r i c a l   E n g i n e e r i n g   ( I C VE E) S u r a b a y a ,   I n d o n e s i a N o v .   2 0 1 7 d o i :   1 0 . 1 0 8 8 / 1 7 5 7 - 8 9 9 X / 3 3 6 / 1 / 0 1 2 0 1 7 .   [ 2 6 ]   L .   L P a l e se,   A   r a n d o v e r si o n   o f   p r i n c i p a l   c o m p o n e n t   a n a l y si i n   d a t a   c l u s t e r i n g ,   C o m p u t a t i o n a l   Bi o l o g y   a n d   C h e m i s t ry ,     v ol 7 3 ,   p p .   57 - 6 4 ,   2 0 1 8 ,   d o i :   1 0 . 1 0 1 6 / j . c o m p b i o l c h e m. 2 0 1 8 . 0 1 . 0 0 9 .                         Evaluation Warning : The document was created with Spire.PDF for Python.