ISSN: 1693-6 930                                         ¢     7     Klasifika s i Se cara Efisien  Pada Data ba se Multi Rel a si De nga n… …(Sarwo s ri)  KLASIFIKASI SECARA EFISIEN PADA DATABASE  MULTI RELASI  DENGAN ALGORITM A CROSSMINE      Sar w osri, Darlis Herumu rti, Indri Sulis t y o w ati  Jurusan Te kn ik Informati k a ,  Fakulta s  Te knol ogi Informasi,   Institut Tekn o l ogi Sepulu h  Nop e mbe r   e-mail:  s r i @ it s- sby . edu  ,  d a rlis@it s -sby.edu        A b st r a ct   Multi-rel a tion cla ssifi cation s can be wid e ly  u s e d   in m any  di sci pli nes, su ch as  financi a l   deci s io n m a king, m edical  resea r ch, an d geo gra phi cal appli c atio n s , and  inform ation store d  in  m u ltiple relati ons  nee ds to  be u s ed  in d e ci sion m a ki ng. Cro ssm in e is  an effici e n t and  scalab le  approa ch  fo r m u lti-relation cla ssifi cation.   Crossm i ne  a l goritm  ha s t h ree  ste p , first is find -rul e s,  the rul e  h a been  gotten f r om  find a  ru le process  th an rem o ve  al l po sitif tuple s   satisf ying  rule  while there are more than ten pe rc ent  pos itif tuple left. The  s e c o nd is  find a  rule, this s t ep  has  input from  th e re sult  of find be st p r e d icate  pro c e s s, that is th com p lex p r edi cate  with m o st  foilgain. If foilgain val ue is m o re than m i ngain, the predi cate i s  adde d with rule, and m a x rule   length less than si x. Third is find best  predi cate , in this step we  find the best predicate with  definition, if the foilgain  va lue m o re tha n  the  m a x gai n val ue, the p r edi cate  will b e  sa ve d and t h e   bigger gain  value  will  repl ace the last gain value fo r next com perative proces s. I n  other  side,  the   accuracy i s   com puted f r o m  each  rule  that produ ce  in find rules   proc ess .   The tes t  for  this  appli c ation u s e the sum  tuple of 200, 5 00, 1000, 50 00 for m easu r ing the le vel  of accuracy from  rule which is  prod uced b y  cro s sm ine al goritm .     Key w ord :  crossm ine, posi t ive tuple, ne gativ e tupl e, rule, predi cate , accu ra cy.      Abs t rak  Klasifika s i m u lti-rel a si d a pat digun aka n  se ca ra lua s  dalam  ban ya k disi plin,  sep e rti  pem buatan kep u tusan keuan gan,  pe nelitian  m edi s,  dan  aplikasi g eog rafi, inform asi yang   disim pan dal am   m u lti-relasi dipe rlu k a n   dalam  p e m buatan ke putusan.  CrossMine, su atu   pend ekatan  yan g  efisie n dan da pat di skala untu k   kl a s ifika s i m u lti-rela si. Algoritm a  cro s sm ine   m e m iliki tiga langkah, pertam dim u lai dari  pencari an  sekum pul an  rule, rule didapatkan  dari  pro s e s  p enca r ian  seb uah  rule yang  kem udian  diam bil tuple po sitifn ya  sam pai te rsi s a l ebih  da ri  sep u luh  pe rsen. La ng kah   ked ua  adal ah  pen ca ria n   se buah  rule, p a da la ng kah  in i m e m iliki inp u dari h a sil   prose s  p e n c ari an predi kat terbai k, yaitu  predi kat  kom p lek  den gan  nilai foilgain,  nilai   foil gain dib andin g kan d enga n m i n gain jika h a sil n ya le bih be sar m i n gain  m a ka predi kat  terse but dita m bahkan  de ngan  rule, d a n  m a ksim a l kedalam an  rel a si a dalah  ku rang  da ri en a m Lang ka h keti ga ad alah fin d  be st pre d , pada la ng ka h ini dila ku ka n pen ca rian  predi kat te rb aik  deng an keten t uan jika  nilai  foilgain  lebih  besa r  da ri nil a i m a x gain  m a ka pre d ika t  akan di sim pan  dan  nilai gain yan g  leb i h besa r  aka n  m engganti k an nilai g a i n  sebel um nya untuk p r o s es   perb andi nga n  selanjutn y a.  Sedang kan  untuk a c cura cy dihitu ng d a ri m a sing m a sin g  rule ya n g   diha silkan pa da proses p e n ca rian  se ku m pulan rule.  Uji co ba a p lika s i ini m eng guna ka n jum l ah  tuple 200, 5 00, 1000, 5 000 untu k   m enguku r  tin g kat efi s ien s i  dan a k urasi  dari rule yang   diha silkan alg o ritm a cro s sm ine.    Kata kunci  : cro s sm ine, tuple po sitif, tu ple neg ative,  rule, predi kat, accura cy      1.  PEN D AHU LUAN   Kebanya k an  data terstru k tur sa at ini disimpa n  dala m  rela si  dat aba se Data base  ini   terdiri d a ri b anyak  rela si yang berhub unga n se ca ra kon s e p tual  melalui  link-l i nk entity-relation   dalam de sai n  skema - ske m a rela si da tabase. Kl asi f ikasi multi -re lasi dap at diguna ka n se cara   luas  dalam  banya k  di sipl in, sep e rti p e mbuat a n  ke putusan  keu anga n, penel itian medi s, dan   Evaluation Warning : The document was created with Spire.PDF for Python.