I nd o ne s ia n J o urna l o f   E lect rica l En g ineering   a nd   Co m p u t er   Science   Vo l.   1 2 No .   2 N o v e m b er   201 8 ,   p p .   5 7 0 ~ 5 7 6   I SS N:  2502 - 4752 ,   DOI : 1 0 . 1 1 5 9 1 / i j ee cs . v 1 2 .i 2 . p p 570 - 5 7 6           570       J o ur na l ho m ep a g e h ttp : //ia e s co r e. co m/jo u r n a ls /in d ex . p h p / ijeec s   Da ta M ining  App ro a ch t o  Herbs  Cl a ss ificatio n       Adill a h Da y a na   Ah m a d Da li ,   Nurul Asw a   O m a r,   Aida   M us t a ph a   F a k u lt S a in s K o m p u ter d a n   T e k n o lo g M a k lu m a t,   Un iv e rsiti   T u n   Hu ss e in   On n   M a lay sia       Art icle  I nfo     AB ST RAC T   A r ticle  his to r y:   R ec eiv ed   A p r   9 ,   2 0 1 8   R ev i s ed   Ma y   2 0 ,   2 0 1 8   A cc ep ted   Ju l   11 ,   2 0 1 8       He rb a re   o n e   o f   th e   h ig h - v a lu e   p ro d u c ts  in   M a lay sia .   T h e   ter m   h e rb s‟  h a m o re   th a n   o n e   d e f in it io n .   It  is  a lso   d e m a n d in g   b y   m u lt ip le  m a n if o l d s.  He rb a re   u se d   in   m a n y   se c to rs  n o w a d a y s.  T h e   a b il it y   to   id e n t ify   v a riety   h e rb in   th e   m a rk e t   is  q u it e   h a rd   w it h o u th e   in terv e n ti o n   o f   h u m a n   e x p e rts.   Un f o rtu n a tely ,   h u m a n   e x p e rts  a re   p ro n e   t o   e rro r.   He rb c las sif ica ti o n   is   a b le   to   a ss ist  h u m a n   e x p e rts  a n d   a th e   sa m e   ti m e   m in i m izin g   th e   in terv e n ti o n .   T h is  re se a rc h   p e rf o r m id e n ti f ic a ti o n   a n d   c las sif ica ti o n   o f   h e rb s   b a se d   o n   im a g e   c a p tu re   a d   v a riet y   o c la ss if ic a ti o n   a lg o rit h m su c h   a s   a n   A rti f icia l   Ne u ra Ne tw o rk   ( A NN ),   K - Ne a r e st  Ne ig h b o rs  (IBK),   De c isio n   T a b le  (DT )   a n d   M 5 P   T re e   a lg o rit h m s.  T h e   se lec ted   a lg o rit h m a re   i m p le m e n ted   a n d   e v a lu a ted   to   t h e ir  re lativ e   p e rf o rm a n c e   a n d   IBK  is   f o u n d   t o   p r o d u c e   th e   h ig h e st q u a li ty   o u tp u ts.     K ey w o r d s :   C las s i f icatio n   Data   m i n i n g   Her b s   Co p y rig h ©   2 0 1 8   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e   Al rig h ts  re se rv e d .   C o r r e s p o nd ing   A uth o r :   Nu r u As w O m ar   Fak u lti Sai n s   K o m p u ter   d an   T ek n o lo g i M ak l u m at,   Un i v er s iti T u n   H u s s ei n   On n   Ma la y s ia,     P ar it R aj a,   8 6 4 0 0   B atu   P ah at,   J o h o r ,   Ma lay s ia .   E m ail:  n u r u las w a@ u t h m . ed u . m y       1.   I NT RO D UCT I O N     Ma la y s ia  is   o n o f   th lead i n g   ex p o r ter   o f   h er b s .   T h h er b s   in d u s tr y   w as  ai m i n g   to   p r o d u ce   h i g h - v alu p r o d u cts,  to talin g   R M2 . 2   b illi o n   o f   th Gr o s s   Natio n al  I n co m ( GNI )   as  r ep o r te d   in   T h Ma la y s ia n   T im es  n e w s p ap er   ( 2 0 1 3 ) .   Dat s h o w s   t h at  h er b al  p r o d u ct  d e m a n d   h a s   m u ltip lied   m a n i f o ld s .   Her b al  h ea lth   f o o d s   h a v r ea c h ed   R M2 , 3 8 0   b illi o n   ar o u n d   2 0 0 1 .   P r io r   to   th a t,  f r o m   o n l y   R M2 , 0 9 3 . 8   m illi o n   i n   1 9 8 0 ,   d r asti in cr ea s e   i n   t h w o r ld   h er b al  p r o d u cts  ar v al u ed   at  R M9 5 0   b illi o n   in   1 9 9 6 .   C u r r e n t l y ,   t h tr ad v alu e   o f   t h h er b   s ec to r   w a s   e x p ec te d   to   s o ar   o v er   R M2   tr ill io n   b y   th e   y ea r   o f   2 0 2 0 .   T h v al u o f   t h r ee f o ld   in cr ea s e   co m p ar ed   to   th R M7 7 7   b illi o n   w o r th   o f   tr ad w a s   esti m at ed   in   th h er b s   s ec to r   in   2 0 0 9 .   On   th lo ca f r o n t,   th m i n is tr y   e s ti m ated   t h h er b   m ar k et   to   ex p a n d   b y   1 5   p er   ce n a   y ea r   f r o m   R M7   b illi o n   in   2 0 1 0   to   ar o u n d   R M2 9   b illi o n   b y   2 0 2 0 .       Gen er all y ,   it is   k n o w n   t h at  h er b s   h as c o n tr ib u ted   lo t i n   m e d icin al  p u r p o s ed   f r o m   lo n g   ti m a g o .   A l th f ac t s ,   tr u t h s   o r   p r in cip les  o f   h er b s   h a s   b ee n   p ass ed   d o w n   f o r   p er io d s   o f   m ille n ar ia n   o f   y ea r s   [ 1 ] .   Her b s   ar n u tr i tio u s   a s   w ell  a s   v a lu ab le  p lan ts .   T r u th f u ll y ,   t h b i g g e s t   p o s s ib le  f o r   n e w   h er b   cu r r en tl y   lie s   i n   th f o o d   s ec to r s .   I is   b ein g   u s ed   in   f o o d   p r e p ar atio n   an d   n o o n l y   t h at,   it  is   al s o   b ein g   w id el y   u s ed   in   m ed ici n an d   co s m etic  in d u s tr y .   Her b s   ar u s ed   b y   a l m o s e v er y o n n o wad ay s   eit h er   i n   t h f o r m   o f   s p ices,  h er b s   o r   d ail y   f o o d - b ased   p r o d u cts.  W ith   t h in cr ea s i n g   u s e   o f   h er b s ,   t h er is   a n   u r g e n n ee d   f o r   th e   ab ilit y   to   id en t if y   v ar iet y   h er b s   av ailab le  i n   th m ar k et.   Mo s h er b s   g r o w   in   t h j u n g le  an d   th w a y   t h e y   id en ti f y   i s   th r o u g h   th e   r ec o g n itio n   o f   h u m an   e x p er ts .     I is   v er y   i m p o r tan ce   to   au to m atica ll y   ac k n o w led g th v ar i o u s   t y p o f   h er b s   f o r   h er b s   cla s s i f icatio n   r ef er r ed   o n   th eir   p ar ticu lar   f ea tu r es  d u to   s h o r n u m b er   o f   r eso u r ce s   alo n g   w ith   k n o w led g ea b le  p er s o n .   On w a y   to   id en ti f y   h er b s   i s   th r o u g h   clas s i f icatio n   o f   t h h er b s .   C o m p u ter   Scie n ce   h a s   f i n all y   h ar n e s s ed   b o th   t h e   en o r m o u s   s to r eh o u s o f   d ata  an d   th v ast  co m p u ta tio n al  p o w er .   W id el y   d e f in ed   as  Kn o wled g Dis co v er y   i n   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       Da ta   Min in g   A p p r o a ch   t o   Herb s   C la s s i fica tio n   ( A d illa h   Da ya n a   A h ma d   Da li )   571   th d atab ases ,   d ata  m i n i n g   i s   co m p u ter ized   o r   u s e f u e x tr ac tio n   o f   p atter n s .   I r ep r ese n ts   th k n o w led g in ev itab l y   g at h er ed   in   d atab ases   th at  r eso l v es c o m p lica tio n .     Data   m i n in g   is   ab o u co n f ig u r atio n   o f   co m p licatio n   b y   e x a m i n an d   d eter m in t h d ata  th at  alr ea d y   ex is ted   i n   th d atab ases .   I f in d s   th i m p o r tan in f o r m at io n   h id d en   in   lar g v o l u m es  o f   d a ta  [ 2 ] .   Data   m i n in g   is   also   d escr ib ed   as  th s er ie s   o f   ac tio n   o f   u n co v er i n g   p a tter n s   i n   d ata.   T h p o s s ib le  u s o f   d ata  m i n in g   m et h o d   d ef in es  t h at  th ap p r o ac h   in   w h ich   r ep o s ito r y   o f   d ata  ca n   b u tili ze d   m a y   s tr et ch   f ar   b e y o n d   w h at   w a s   p er ce iv w h en   t h d ata  w as  in itial l y   g a th er ed .   L o ts   o f   a p p licatio n s   in   m ac h i n lear n i n g   to   d ata  m in in g   as  s h o w n   i n   th e   u n d er s ta n d in g .   T h i m p o r tan t   k n o w led g e   s tr u c tu r es   t h at  ar g ai n ed ,   th e   f u n d a m e n ta l   ex p lan atio n ,   ar at  leas as  cr u cial,   a n d   f r eq u e n tl y   v er y   m u ch   m o r s u b s tan tia co m p ar to   th ca p ab ilit y   to   ac co m p li s h   w ell  o n   n e w   ex a m p les.   L o ts   o f   lear n i n g   tech n iq u es  lo o k   f o r   s tr u ct u r al  d e f in itio n   o f   w h at  i s   lear n ed ,   d ef i n itio n   t h a co u ld   b e   q u ite  co m p l icate d   an d   ar e   co m m o n l y   ar tic u late   as  s ets   o f   r u les.   I n   th e   r ec en t   d ev elo p m en o f   a u to m ate d   class i f icatio n   tech n iq u e s ,   th e r h as  b ee n   g r ea d ea o f   p r o g r ess .   Fro m   t h co m b in atio n s   o f   ar ti f icia l   in tell i g e n ce   an d   s tat is tical  cl ass i f icatio n   ap p r o ac h es,  s ig n i f ican n u m b er   o f   n e w   tech n iq u e s   h a v ar is en .   Ma ch i n lear n i n g   a n d   d ata  m i n in g   h a v b o th   f asc in ated   r ea s o n ab le  in ter es i n   t h clas s i f ic atio n   al g o r ith m s   o f   b o th   in   t h r esear c h   ar ea s .   f e w   e x ter n al - m e m o r y   al g o r it h m s   [ 3 - 6 ]   an d   p ar allel   i m p le m en tatio n s   [ 7 ] ,   [ 8 ]   h av e   also   b ee n   s p ec if ied .   I h a v b ee n   r ec o m m e n d ed   w it h   t h p u r p o s ed   o f   b o o s t   u p   th e   i m p le m en ta tio n   ti m also   an al y ze   o n   h u g tr ain i n g   s ets.   A   lo g ical   p r o g r a m m in g   tech n iq u is   p r o p o s ed   b y   d u p lica t i n g   th e   m ec h a n is m   o f   t h h u m an   b r ain ,   w h ic h   is   th o b j ec tiv o f   A r t if icial  Ne u r al  Net w o r k   ( ANN ) .   T h is   tech n iq u s i m u lates  t h m ai n   b io lo g ical   o p er atio n s   o f   t h h u m a n   b r ain   u tili zi n g   p ar ticu lar   s o f t w a r e.   A NN  is   a n   al g o r ith m   t h at   is   ab le  to   p er f o r m   h u m a n   b r ain   o p er atio n s ,   co m p o s in g   d ec i s io n s ,   cr ea tin g   r es u lts ,   p r o d u ce   co n cl u s io n s   r e f e r r in g   to   t h e x is te n t   in f o r m atio n   i n   ca s t h er ar e   in s u f f icie n d ata,   co n ti n u all y   r ec eiv i n g ,   lear n in g   a n d   r e m e m b er in g   d ata  in   co m p u ti n g   e n v ir o n m en t [ 9 ] .   A t   p r esen t,   it  i s   p r ett y   co m p lic ated   to   ap p l y   m ac h in e   v i s io n   t o   ca teg o r ize  h er b ,   d u e   to   t h s u b s ta n tial   co m p u tatio n al  r eso u r ce s   alo n g   t h d if f icu lties   al g o r ith m s   n ee d ed .   T h A NN  ca n   d ef ea f e w   o f   th e   co m p lica tio n   b y   e x tr ac tin g   th e   f ea t u r es  i n s tan t l y   as  w e ll  as   e f f icien tl y .   A NN  h as   ar is e n   as   t h i m itatio n   o f   t h b io lo g ical  n er v o u s   s y s te m .   m o d o f   w o r k i n g   o f   co m p u ter   b y   ass i m i lated   to   th m o d o f   w o r k i n g   o f   a   b r ain ,   n eu r al  n et w o r k   m o d el  w a s   g r o w n .   An   ev a lu at io n   o f   a   s et  o f   s h ap f ea t u r es [ 1 0 ] .       2     RE SE ARCH   M E T H O DO L O G Y   R esear ch   m et h o d o lo g y   is   p r o ce s s   u s ed   to   g at h er   in f o r m a ti o n   an d   d ata.   I is   also   k n o w n   a s   w a y   o f   k n o w i n g   th o u tco m o f   s p ec if ic  p r o b lem   a n d   m a k in g   d ec is io n s .   R esear ch er s   co n s tr u ct  th eir   r esear ch   b y   f o r m u lati n g   an d   d ef i n i n g   r esear ch   p r o b le m .   A   d if f er en cr iter ia  to   d eter m in th c u r r en t   r esear ch   p r o b lem s   in   m eth o d o lo g y   b y   r esear c h er s .   I n   t h m et h o d o lo g y ,   it   ex p la in s   t h w a y   p r o b le m   is   i n s p ec ted   an d   th r ea s o n   f o r   u s i n g   s p ec if ic  m et h o d   an d   tech n iq u e.       I n   th p r ev io u s   r esear c h ,   th er ar m a n y   t y p e s   o f   clas s i f ic atio n   m e th o d o lo g ies  m e n tio n ed   s u ch   a s   A N o r   Gab o r - W av elets.  T h i s   s ec tio n   w ill  b r ief   ab o u th ch o s en   m et h o d o lo g y   u s ed   to   d eter m in t h at  t h i s   p r o j ec r u n s   p er f ec tl y .   A   p r o p er   m eth o d o lo g y   p lan   i s   n ec e s s ar y   to   co llect  t h r eq u ir ed   in f o r m atio n   an d   d ata.   Fig u r 1   s h o w s   clas s if icat io n   f r a m e w o r k   f o r   th i s   r ese ar ch .   I in clu d ed   f o u r   s tep s   w h ich   ar d ataset  ac q u is itio n ,   p r e - p r o ce s s in g ,   cl ass i f icatio n   an d   p er f o r m a n ce   an al y s i s .         Fig u r 1 .   C lass if ica tio n   f r a m e w o r k     D a t a se t   A c q u i si t i o n   Pre - p r o c e ssi n g   C l a ssi f i c a t i o n   P e r f o r man c e   A n a l y si s   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l 1 2 ,   No .   2 No v e m b er   201 8   :   5 7 0     5 7 6   572   Data s ets  ar p r ep ar ed   in   f ir s s tep   w h er r esear ch   d ata  s o u r c es  f r o m   m ac h i n lear n i n g   r ep o s ito r y   an d   s p ec if ic  i n   lea f   d ataset.   T h is   d ataset  ca n   b d o w n lo ad   f r o m   h ttp ://ar ch i v e. ics. u ci. ed u / m l/d at asets / L ea f   Nex s tep   is   p r e - p r o ce s s i n g ,   w h er t h is   s tep   i s   to   e n s u r th q u a lit y   o f   th e   d ata  r es u lt ,   th p r e - p r o ce s s in g   d ata  s h o u ld   b i m p le m en ted .   I n   t h i s   r esear ch ,   th in p u d ata  is   i n   t h ter m   o f   n u m er ical.   T h p r e - p r o ce s s in g   tec h n iq u u s ed   to   r ed u ce   th v ar iatio n   o f   h er b s   d u to   illu m in a tio n   f ac to r s .   T o   im p r o v t h e   p er f o r m a n ce   o f   h er b   class i f ica tio n ,   th i s   p r o ce s s   w ill h e lp   to   en h a n ce   an d   n o r m alize   t h h er b   d ataset.     B ased   o n   t h li ter atu r e,   f o u r   class i f icati o n   al g o r ith m   w h ic h   ar A r ti f ica Ne u r al  Net w o r k   [ 1 1 ] ,   K - Nea r est  Nei g h b o u r   [ 1 2 ] ,   Dec is io n   T ab le  an d   M5 P   T r ee   alg o r ith m s   h av e   b ee n   ch o s e n   f o r   th e   ex p er i m en t s .   T h ese  alg o r ith m s   ar ch o s e n   b ec au s th e y   ar th late s al g o r ith m s   u s ed   i n   th li ter atu r e.   T h is   alg o r ith m   is   u s ed   in   s tep   th r ee .   L ast  s tep   is   ev al u atio n   m e tr ic  o f   th h er b s   d ataset  w h ic h   co r r elatio n   co ef f icien ( C C ) ,   m ea n   ab s o lu t e   er r o r   ( MA E ) ,   r o o m ea n   s q u ar ed   er r o r   ( R MSE ) ,   r elativ ab s o lu te  er r o r   ( R A E )   a n d   r o o r elativ s q u ar ed   er r o r   ( R R SE)   o n   ea ch   ex p er i m en t   w ill  b est  s tated .   Fo r   th is   p u r p o s ed ,   Mu ltil a y er   P er ce p tr o n   Neu r al  Net w o r k   ( ML P ) ,   K - Nea r est  Nei g h b o u r s   ( I B K) ,   Dec is io n   T ab le  ( DT )   an d   M5 P   T r ee   alg o r ith m s   w il b co m p ar b ased   o n   th o s m etr ics.  T h r es u lt   s h o w n   as   f o llo w i n g   b ec au s th d atase is   n o a   ca te g o r ical  d ataset.   I i s   a   co n tin u o u s   d ataset.   T o   d ete r m in t h b est  m e th o d   f o r   th p er f o r m an ce   f o r   h er b s   class i f icatio n ,   t h e   p er f o r m a n ce   o f   th i s   alg o r it h m   w ill  b r ec o r d ed   an d   test e d .   T h tab le  b elo w   s h o w s   th r esu l o f   t h test ed   alg o r ith m .   T h n e x s ec tio n   w il f o c u s   o n   th p r o ce s s   ea c h   s tep   i n   clas s i f icatio n   f r a m e w o r k   b ased   o n   th i s   r esear ch .     2 . 1   Da t a s et   A   d ataset  i s   g r o u p   o f   d ata  w h ich   i s   co llected   f r o m   ce r tain   s o u r ce   s u ch   a s   th I n ter n et.   I is   m o s tl y   n o is y ,   i n co m p lete  a n d   in co n s is te n t.  Dat aset  m i g h co n s is o f   d ata  f o r   n o j u s o n b u m o r m e m b er s   eq u iv ale n t   to   t h n u m b er   o f   s eq u en ce s .   T h co n ce p d ata s et   m a y   a ls o   b u s ed   ar m o r e   r elativ el y ,   to   r ef er   to   th d ata  in   co llectio n   o f   clo s el y   r elate d   tab les,  eq u iv a len t   to   p a r ticu lar   ex p er i m e n ts   o r   ev en t.  B esid es,  it   co n tain s   o n l y   ag g r eg ate  d ata  o r   o f ten   co n tai n s   to o   m u ch   d ata  to   an al y ze   w h ic h   is   lac k i n g   o n   th attr ib u te ' s   v alu e.   T h d ataset  lis ts   v al u es  f o r   ea ch   v ar iab le,   w h ic h   ca n   b n u m b er   s u ch   as  i n te g er s   o r   r ea n u m b er .   T h is   r esear ch   u s es   th e   L ea f   d ataset,   av ai lab le  f o r   d o w n lo ad   f r o m   h ttp ://ar c h i v e. ics.u c i.e d u / m l/d ataset s / L ea f .   T h is   d ataset  i n clu d e s   4 0   d if f e r en p lan s p ec ies  i n cl u d in g   h er b s   an d   th d etai ls   o f   s cie n ti f ic  n a m es  o f   ea ch   p lan as  w ell  as  th n u m b er   o f   leaf   s p ec i m e n   ac ce s s i b le  b y   s p ec ies  ar s h o w n   i n   T ab le  1 .   Sp ec ies  n u m b er ed   f r o m   1   u n til  1 5   a n d   2 2   u n til   3 6   ex h ib it s   s i m p le   lea v es  a n d   s p ec ies  n u m b er ed   f r o m   1 6   to   2 1   an d   3 7   to   4 0   h av e   co m p le x   lea v es.  T h er ar to tal  o f   3 4 0   d ata.   I co n tain s   1 5   n eu r o n s ,   1   in p u la y er ,   h id d en   la y er   co n tai n s   o f   2 3   n eu r o n s   a n d   1   o u tp u t la y er .       T ab le  1 .   Deta iled   s cien tif ic  n a m o f   ea c h   p lan t a n d   th n u m b er   o f   leaf   s p ec i m e n   ac ce s s ib l b y   s p ec ie s   S c i e n t i f i c   N a m e   #   S c i e n t i f i c   N a m e   #   Q u e r c u s s u b e r   12   F r a x i n u s s p .   10   S a l i x   a t r o c i n e r a   10   P r i mu l a   v u l g a r i s   12   P o p u l u n i g r a   10   Er o d i u m s p .   11   A l n u s s p .   8   B o u g a i n v i l l e a   sp .   13   Q u e r c u s ro b u r   12   A r i saru m v u l g a r e   9   C r a t a e g u s mo n o g y n a   8   Eu o n y mu j a p o n i c u s   12   I l e x   a q u i f o l i u m   10   I l e x   p e r a d o   ssp .   a z o r i c a   11   N e r i u m o l e a n d e r   11   M a g n o l i a   so u l a n g e a n a   12   B e t u l a   p u b e sce n s   14   B u x u s se mp e r v i r e n s   12   T i l i a   t o me n t o sa   13   U r t i c a   d i o i c a   12   A c e r   p a l mat u m   16   P o d o c a r p u s s p .   11   C e l t i s sp   12   A c c a   se l l o w i a n a   11   C o r y l u s a v e l l a n a   13   H y d r a n g e a   sp .   11   C a st a n e a   sa t i v a   12   P se u d o sasa   j a p o n i c a   11   P o p u l u a l b a   10   M a g n o l i a   g r a n d i o r a   11   A c e r   n e g u n d o   10   G e r a n i u m   sp .   10   T a x u s b a c a t t a   5   A e scu l u s c a l i f o r n i c a   10   P a p a v e r   sp .   12   C h e l i d o n i u m m a j u s   10   P o l y p o l i u m v u l g a r e   13   S c h i n u t e r e b i n t h i f o l i u s   10   P i n u s s p .   12   F r a g a r i a   v e sca   11       Fig u r 2   s h o w s   th e   v i s u aliza ti o n   o f   t h d ata s et.   I t i s   n o t t h o u tp u t o f   cla s s i f icat io n   m o d el  y et   h elp s   to   v is u alize d   th d ataset  i ts el f .   I t sh o w s   m a tr ix   o f   t w o - d i m en s io n al  s ca tter   p lo ts   o f   e v er y   t w o   o f   attr ib u tes.   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       Da ta   Min in g   A p p r o a ch   t o   Herb s   C la s s i fica tio n   ( A d illa h   Da ya n a   A h ma d   Da li )   573       Fig u r 2 .   Vis u al izatio n   o f   d ata s et           Fig u r 2 .   Su m m ar y   o f   M L P   alg o r ith m       T h d ataset  n ee d   to   b in s er ted   in   th W E K A .   Af ter   th at  c h o o s class i f y ,   a n d   ch o o s an   a lg o r ith m   to   u s e.   As  f o r   a n   ex a m p le  i n   Fi g u r e   2 ,   ML P   alg o r it h m   h a s   b ee n   ch o s e n   a n d   th s u m m ar y   o f   t h r es u lt  h as  b ee n   s tated .       2 . 2   P re - pro ce s s ing   T o   en s u r th q u ali t y   o f   th e   d ata  r esu lt,  t h p r e - p r o ce s s i n g   d ata  s h o u ld   b i m p le m en t ed .   I n   th i s   r esear ch   First,  s elec s u b s et  o f   av ai lab le  d ata.   T h en ,   p r e - p r o ce s s   d ata  w h ic h   o r g a n ize  th e   s elec ted   d ata.   L ast   b u t n o t le ast,  tr a n s f o r m   t h d ata  th at  r ea d y   f o r   m ac h i n lear n i n g .     2 . 3   Cla s s if ica t io n Alg o rit h m   P r ed ictin g   n e w   d ata  h ap p en s   b y   tr ee   m o d elli n g   o f   d ata  w h ic h   is   t h u s o f   cla s s i f ica tio n   [ 2 ] .   I n   W E KA ,   t h al g o r ith m s   ch o s e n   i n clu d t h B a y esia n   cla s s i f ier s ,   tr ee s ,   r u le s ,   f u n ctio n s ,   la z y   clas s i f ier s ,   a n d   a   f i n al  m i s ce llan eo u s   ca teg o r y .   On l y   ce r tai n   al g o r ith m s   i n   W E KA  ar ca p ab le  to   p er f o r m   r eg r ess io n   o r   s u p p o r p r ed ictin g   co n ti n u o u s   v ar iab l e.   T h f o llo w in g   a lg o r it h m s   ar u s ed   b ec au s t h d ata s et  co n tain s   co n tin u o u s   class   v ar iab le.   I n   th i s   r esear ch   s tu d y ,   w d escr ib s u c h   an   ap p r o ac h .   a)   A r ti f icial  Neu r al  Net w o r k I co u ld   b co m p o s ed   as  m ath e m atica eq u a tio n s   in   r atio n a ll y   n atu r al  w a y .   Mu ltil a y er   P er ce p tr o n   is   n eu r al  n et w o r k   th at  tr ai n s   th a ap p ly   b ac k - p r o p ag atio n .     B esid es,  it  is   p r ec is p r ed icto r   f o r   th u n d er l y i n g   cl ass i f icatio n   d if f ic u lt y .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l 1 2 ,   No .   2 No v e m b er   201 8   :   5 7 0     5 7 6   574   b)   K - Nea r est  Neig h b o r T h tr ain in g   i n s tan ce s   is   s to r ed   b y   th e   laz y   lear n er s .   I o n l y   d o   r ea w o r k   w h e n   t h e   class i f icatio n   ti m co m e.   I B class i f ier s   t h at  b ein g   u s ed   is   th I B w h ich   ap p l y   t h id en tical  d is ta n ce   m etr ic.   T h n u m b er   o f   n ea r es n ei g h b o r s   ( d ef au lt   k =1 )   co u l d   also   b d escr ib ed   p ar ticu lar l y   o r   m ig h a s   w ell  d eter m in ed   a u to m at icall y   u tili zi n g   leav e - o n e - o u cr o s s   v alid atio n ,   s u b j ec to   an   u p p er   li m it  g i v en   b y   th p ar ticu lar   v a lu e.     c)   Dec is io n   T ab le:  E x p lain i n g   th o u tco m h a s   an   ea s y   w a y   wh ich   is   to   m a k it  t h eq u i v al en as  i n p u i n   m ac h in lear n i n g .   I t c r ea tes a  d ec is io n   tab le  m aj o r it y   clas s if i er s .     d)   M5 P I is   m o d el  tr ee   lear n e r   th at  ca p ab le  to   b u i ld   lo g i s tic   m o d el  tr ee s .   M5 P   u n ite  a   co m m o n   d ec is io n   tr ee   alo n g   t h p r o b ab il it y   o f   li n ea r   r eg r ess io n   f u n ctio n s   at  t h n o d es.    I n   ev er y   lea f   o f   r eg r ess io n   m o d el,   th M5 P   r eg r ess io n   m o d el  ar co m p ete n w it h   li n ea r   r eg r es s io n   m o d el.   2 . 4   E v a lua t io M e t ric   B ec au s o f   t h n u m er ical  n at u r o f   t h d ataset,   t h p r i m ar y   q u ali t y   m ea s u r p r o p o s ed   b y   t h er r o r   r ate  is   n o   lo n g er   s u itab le.   E r r o r s   ar n o ea s il y   p r esen o r   ab s en t;  t h e y   co m e   i n   v ar ie t y   s izes .   T o   f ig u r o u t h e   o u tco m o f   n u m er ical  p r ed ictio n ,     f e w   o f   alter n at iv e   m eth o d s   ca n   b ap p lied .   T h eq u atio n   o f   th e   ev alu a tio n   i s   s h o w n   i n   th f o ll o w i n g   w h er e:         n   th n u m b er   o f   er r o r   p   p r e d icted   v alu es   a   th ac tu al  v a lu e s     a)   C o r r elatio n   co ef f icie n ( C C )   m ea s u r h o w   s tr o n g   r ela tio n s h ip   is   b et w ee n   t w o   d at a.   C o r r elatio n   co ef f icie n t c alc u lated   u s i n g   t h f o llo w in g   eq u atio n                    w h er e:          =             ̅                 ̅                             ̅                an d                   ̅                 T h eq u atio n   r et u r n   v a lu e   b et w ee n   - 1   a n d   1 .   T h v al u 1   i s   co n s id er ed   as  s tr o n g   p o s iti v e   r elatio n s h ip   m ea n w h ile  v al u - 1   is   s tr o n g l y   n eg a tiv a n d   th e   v alu 0   h as  n o   r elatio n s h ip .   I f   th r esu lt   s h o w s   g r ea ter   n u m b er   th a n   v alu 1   an d   less   t h a n   - 1 ,   m i s ta k e   h a s   b ee n   m ad e.     b)   Me an   ab s o lu te  er r o r   ( MA E )   is   an   a v er ag t h m ag n it u d o f   t h i n d iv id u al  er r o r s   w ith o u ta k in g   ac co u n t   o f   th eir   s i g n .   T h eq u atio n   f o r   th M A E   is   a s   th f o llo w in g :     |           |       |           |       c)   R o o Me an   Sq u ar ed   E r r o r   ( R MSE )   m ea s u r es  t h d if f er en c es  b et w ee n   v a lu e s .   I is   s ta n d ar d   d ev iatio n   o f   t h r esid u als   ( p r ed ictio n   er r o r s ) .   T h r esid u al s   ar a   m ea s u r e   o f   h o w   f ar   t h r e g r ess io n   l in e   d ata/a ttrib u te  p o in ts   ar e.   R M S E   is   ca lcu lated   u s i n g   t h eq u at io n   as st ated   i n   th f o llo w i n g                                                 d)   R elati v A b s o l u te  E r r o r   ( R AE )   is   r elati v to   s i m p le  p r ed icto r ,   th av er a g o f   t h ac t u al  v al u e.   T h er r o r   is   j u s th e   to tal  ab s o l u te  er r o r   in s tead   o f   t h to tal  s q u ar ed   er r o r .     R A E   ta k es  th to tal  ab s o lu te  er r o r   an d   n o r m a lize  it  b y   d iv id i n g   b y   t h to tal  ab s o l u te  er r o r   o f   th s i m p le   p r ed icto r .   I is   ca lcu l ated   u s i n g   t h e   f o llo w in g   eq u at io n :     |           |       |           | |         |       |         |     e)   R o o R elati v Sq u ar ed   E r r o r   ( R R SE)   is     r elativ to   w h at  it   w o u ld   h av b ee n   i f   s i m p le  p r ed icto r   h a d   b ee n   u s ed .   T h p r ed icto r   is   th av er ag o f   t h ac tu a l v al u es.  T h eq u atio n   u s i s   as  f o llo w s :       Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       Da ta   Min in g   A p p r o a ch   t o   Herb s   C la s s i fica tio n   ( A d illa h   Da ya n a   A h ma d   Da li )   575                                                                                 3 .         RE SUL T S AN D I SCU SS I O NS   T h r esu lt  o b tain s   is   s tated   i n   C C ,   M A E ,   R MSE ,   R AE   an d   R R SE.   I d o es  n o ca lcu late  th ac cu r ac y   b ec au s d ataset  v al u es  is   i n   co n tin u o u s   n u m b er   in s tead   o f   ca teg o r ical  o r   n o m i n al  v al u e s .   T ab le  2   s h o w s   t h e   co m p ar is o n   r es u lt o f   t h s elec t ed   alg o r ith m s   w h ile  Fi g u r 3   illu s tr ates t h p er f o r m an ce .       T ab le  2 .   C o m p ar is o n   r es u lt o f   s elec ted   alg o r ith m s   A l g o r i t h m   CC   M A E   R M S E   RAE   R R S E   T i m e   ( S e c o n d s)   M L P   0 . 5 9   7 . 2 5   9 . 7 5   7 0 . 2 3   8 7 . 1 5   2 . 3 7     I B K   0 . 6 1   5 . 0 6   9 . 9 0   4 9 . 0 0   8 8 . 4 3   0 . 0 1   DT   0 . 4 3   8 . 1 3   1 0 . 1 8   7 8 . 8   9 1 . 0 2   0 . 4 2   M5P   0 . 5 3   7 . 9 7   9 . 5 0   7 7 . 3 2   8 4 . 9 7   0 . 8 2           Fig u r 3 C o m p ar ativ r es u lt s   ac r o s s   all  class i f icat io n   al g o r ith m s       As  s tated   i n   th tab le  ab o v e,   I B g av t h b est  r esu lt  a m o n g s t h o s al g o r ith m s   t h at  w er e   test ed .   Fo r   th C C ,   I B h as  th r esu lt  o f   0 . 6 1   co m p ar ed   to   ML P ,   D T   a n d   M5 P   w h ich   ar 0 . 5 9 ,   0 . 4 3   an d   0 . 5 3 .   A s   f o r   th ti m ta k en   f o r   ea ch   alg o r it h m s   to   p r o d u ce   r esu lts ,   t h K NN  o n l y   to o k   0 . 0 1   s ec o n d   to   p r o d u ce .   A s   f o r   th o th er   alg o r it h m s ,   DT   to o k   0 . 4 2   s ec o n d s   a n d   M5 P   to o k   0 . 8 2   s ec o n d s   m ea n w h i le  t h lo n g e s t i m e   ta k en   f o r   alg o r ith m s   to   p r o d u ce s   r esu lts   is   2 . 3 7   w h ic h   is   M L P .       4 .         CO NCLUS I O N   T h is   r esear ch   h as  ac co m p li s h ed   th m ai n   o b j ec tiv o f   ev alu ati n g   cr u cial  f ea tu r e s   f o r   h er b s   class i f icatio n .   I r ec o g n izes   t h m o s ap p licab le  al g o r ith m s   f o r   th ac h ie v e m en o f   h er b s   clas s i f icatio n .   A ll   th o s al g o r ith m s   w er r u n   an d   test ed   i n   W E K A   to o ls .   T h e   co m p ar is o n   o f   all  a lg o r it h m s   h as  b ee n   m ad an d   s tated   in   o r d er   to   f in d   w h ic h   alg o r ith m s   g iv e s   th m o s ex ce lle n r esu l f o r   th h er b s .   T h is   class i f icatio n   alg o r ith m   is   v er y   ea s y   to   i m p l e m en t in   t h clas s i f icatio n   to o l   s u c h   as W E K A .     B esid es,  it is   f lex i b le  f ea t u r e.         ACK NO WL E D G E M E NT   W w o u ld   li k to   s a y   t h a n k   y o u   to   Un i v er s iti  T u n   H u s s ei n   On n   Ma la y s ia  ( UT HM )   an d   Of f ice  f o r   R esear ch ,   I n n o v a tio n ,   C o m m er cializa tio n   an d   C o n s u lta n c y   Ma n ag e m e n ( OR I C C ) ,   UT HM   f o r   k in d l y   p r o v in g   u s   w i th   t h i n ter n al  f u n d in g   ( Vo t E 1 5 5 0 1 ) .       RE F E R E NC E S   [1 ]     Bro w n ,   D.  T h e   Ro y a Ho rti c u lt u ra S o c iety     En c y c lo p e d ia   o He rb a n d   T h e ir  Us e s .   Do rli n g   Kin d e rsle y ,   L o n d o n . 1 9 9 5 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l 1 2 ,   No .   2 No v e m b er   201 8   :   5 7 0     5 7 6   576   [2 ]     Bh a rg a v a ,   G .   S h a r m a ,   R.   Bh a rg a v a ,   M .   M a th u ria,  De c isio n   T re e   An a lys is  o n   J 4 8   Al g o rit h fo r   Da ta   M in in g ,   In tern a ti o n a Jo u rn a l   o f   A d v a n c e d   Re se a rc h   in   C o m p u ter  S c ien c e   a n d   S o f tw a r e   En g in e e rin g ,   v o 3 ,   n o   6 ,   p p .   1 1 1 4 - 1 1 1 9 .   2 0 1 3 .   [3 ]     A lsa b ti ,   S .   Ra n k a ,   V .   S in g h ,   CL OU DS Cla ss if ica ti o n   f o L a rg e   Ou t - of - C o re   Da ta se ts ,   P r o c .   In t' Co n f .   Kn o w led g e   Disc o v e r y   a n d   Da ta  M in i n g ,   p p .   2 - 8 ,   1 9 9 8 .   [4 ]     G e h rk e ,   V .   G a n ti ,   R.   Ra m a k ris h n a n ,   W . - Y.  L o h ,   BOAT - O p ti mistic  De c isio n   T re e   Co n str u c ti o n ,   P r o c .   A CM   S IG M OD   In t' Co n f .   M a n a g e m e n o f   Da ta,  p p .   1 6 9 - 1 8 0 ,   1 9 9 9 .   [5 ]     G e h rk e ,   R.   Ra m a k rish n a n ,   V .   Ga n ti ,   Ra in   F o re st  Fra me wo rk   fo F a st  De c i sio n   T re e   Co n stru c ti o n   o   L a rg e   Da ta se ts ,   Da ta M in i n g   a n d   Kn o w led g e   Disc o v e r y ,   p p .   1 2 7 - 1 6 2 ,   J u ly   2 0 0 0 .   [6 ]     M e h ta,  R.   A g ra w a l,   J.  Riss a n e n ,   S L IQ:  Fa st  S c a l a b le  Cl a ss if ier   fo Da ta   M in in g ,   P ro c .   1 9 9 6   In tern a ti o n a l   Co n f .   Ex ten d i n g   Da tab a se   T e c h n o lo g y ,   p p .   1 8 - 3 2 ,   1 9 9 6 .   [7 ]     Jo sh i,   G .   Ka r y p is,   V .   Ku m a r,   S c a lP a rC:  Ne S c a l a b le  a n d   Ef fi c ien P a ra ll e C la ss if ica ti o n   Al g o ri th f o r   M in in g   L a rg e   Da t a se ts ,   P ro c .   1 9 9 8   In t' P a ra ll e P r o c e ss in g   S y m p .   a n d   S y m p .   P a ra ll e a n d   Distri b u t e d   P r o c e ss in g ,   p p .   5 7 3 - 5 7 9 ,   1 9 9 8 .   [8 ]     S riv a sta v a ,   E. - H.(S a m Ha n ,   V .   Ku m a r,   V .   S in g h ,   Pa ra ll e Fo rm u la ti o n o De c isio n - T re e   Cla ss if ica ti o n   Al g o rit h ms ,   Da ta M in in g   a n d   Kn o w led g e   Disc o v e r y ,   v o l.   3 ,   n o .   3 ,   p p .   2 3 7 - 2 6 1 ,   S e p t.   1 9 9 9 .   [9 ]     L i m ,   W . Y.  L o h ,   Y.S .   S h i h ,   C o mp a ris o n   o Pre d ictio n   Acc u r a c y   Co mp lex it y   a n d   T ra i n i n g   T ime   o T h irty - T re e   Old   a n d   Ne C la ss if ica t io n   Al g o r it h ms ,   M a c h i n e   L e a rn in g ,   v o l.   4 0 ,   n o .   3 ,   p p .   2 0 3 - 2 2 8 ,   S e p t.   2 0 0 0 .   [1 0 ]     S il v a ,   A . R.   M a rc a l,   R.   M .   A .   d a   S il v a ,   Eva lu a ti o n   o f   fea t u re e fo lea d isc rimin a t io n ,   I n tern a ti o n a Co n f e re n c e   on   Im a g e   A n a l y sis a n d   Re c o g n it io n     [1 1 ]     A .   Ya sa r,   I.   S a rit a s,  M .   A .   S a h m a n ,   A .   O.  Du n d a r,   Cla ss if ic a ti o n   o L e a T y p e   Us in g   Arti fi c ia Ne u ra Ne two rk ,   In tern a ti o n a Jo u rn a o f   In telli g e n S y ste m s an d   A p p li c a ti o n in   En g in e e rin g ,   2 0 1 5 .   [1 2 ]     D.  S .   G u ru ,   Y.  H.  S h a ra th ,   S .   M a n ju n a t h ,   T e x tu re   Fea tu re a n d   KNN  in   Cla ss if ica ti o n   o Fl o we Ima g e s ,   IJCA   S p e c ial  Iss u e s o n   Re c e n T re n d s in   Im a g e   P ro c e ss in g   a n d   P a tt e rn   Re c o g n it io n ,   2 0 1 0 .       Evaluation Warning : The document was created with Spire.PDF for Python.