I nd o ne s ia n J o urna l o f   E lect rica l En g ineering   a nd   Co m p u t er   Science   Vo l.   13 ,   No .   1 J an u ar y   201 9 ,   p p .   41 ~ 47   I SS N:  2 5 0 2 - 4 7 5 2 ,   DOI : 1 0 . 1 1 5 9 1 /i j ee cs.v 1 3 .i 1 . p p 41 - 47          41       J o ur na l ho m ep a g e h ttp : //ia e s co r e. co m/jo u r n a ls /in d ex . p h p / ijeec s   Desig n and  devel o p m en o a n  alg o rith m   for  m ining   ra re  ite m sets       Sa chin Sh a r m a ,   S ha v et a   B h a t ia   F a c u lt y   o f   Co m p u ter A p p li c a ti o n s,  M a n a v   Ra c h n a   In ter n a ti o n a In stit u te o f   Re se a rc h   a n d   S t u d ies ,   F a rid a b a d ,   I n d ia       Art icle  I nfo     AB ST RAC T   A r ticle  his to r y:   R ec eiv ed   Ma y   1 6 ,   2 0 1 8   R ev i s ed   J u l 1 7 ,   2 0 1 8   A cc ep ted   Ju l 3 1 ,   2 0 1 8       F re q u e n it e m   se m in in g   e m p h a se o n   e x c a v a ti n g   it e m   se t w h ich   f o ll o w   f re q u e n tl y   in   a   tran sa c ti o n a d a tab a se .   In v e stig a to rs  h a v e   p ro jec ted   n u m e ro u s   p ro c e ss e to   m in e   ra r e   it e m   s e ts ,   h o w e v e it   is  stil sti m u latin g .   In   c u rre n t   stu d ies ,   t o   c a tch   ra re   it e m   se ts,   c u sto m e r   d e m a rc a ted   sin g le  th re sh o l d   v a lu e   o u g h b e   f ix e d   s m a ll   ad e q u a te   w h ich   o u tco m e in   g e n e ra ti o n   o f   e n o rm o u s   q u a n t it y   o f   d u p li c a te  it e m   se ts.   Th e   ra re   it e m   se ts  m a y   n o in it iate   if   a   h ig h   th re sh o l d   v a lu e   is  f ix e d .   In   th is  st u d y ,   a n   e x e rti o n   is  g e n e ra ted   t o   a n a ly s e   th e   ra re   it e m f o d isc o v e ry   o f   a ll   p ro b a b le  ra re   it e m   se ts  f ro m   th e   tran sa c ti o n   d a tab a se .   T o   m in e   ra re   it e m   se ts   e ff e c tu a ll y ,   a   m e th o d   h a b e e n   a n ti c ip a ted   th a w o u ld   p e rm it   c u sto m e to   id e n ti fy   m a n y   lo w e st  su p p o rt  t h a i m it a te th e   it e m s an d   th e ir  d iv e rse   o c c u rre n c e s in   li st.   K ey w o r d s :   A p r io r i   Mu ltip le   m i n i m u m   s u p p o r th r es h o ld   R ar ite m   s et   Co p y rig h ©   2 0 1 9   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e   Al rig h ts  re se rv e d .   C o r r e s p o nd ing   A uth o r :   Sach i n   S h ar m a   Facu lt y   o f   C o m p u ter   A p p licat io n s ,     Ma n av   R ac h n a   I n ter n atio n al  I n s ti tu te  o f   R esear c h   an d   St u d i es,     Far id ab ad ,   I n d ia.   E m ail s ac h i n . f ca @ m r i u . ed u . i n       1.   I NT RO D UCT I O N   E x ca v at in g   p atter n s   in   p r o f e s s io n a l   r elatio n s ,   ti m e - s er ie s ,   h er itab le   ar ch i v es,  an d   s e v er al  o th er   class es o f   d ata  is   s i m p le   s ta g in   ar tic u lati n g   p r o p o s itio n s   a n d   r ea lizin g   li n k s   a m o n g   ite m s .   Fo r   ex a m p le,   t h e   m ar k et   b as k et  e x p lo r atio n   i n   t h r etai b u s i n ess   is   d ir ec ted   at  d eter m i n i n g   w h ic h   p r o d u cts  is   to   b e   b o u g h tto g et h er   in   o r d er   to   ca p tu r th b u y i n g h ab its   o f   co n s u m er s   o r   clien t s ,   to   r ec o g n is th eir   r eq u ir e m e n ts ,   to   im p r o v cr o s s - p r o m o tio n al   s er ies,  to   g et  n e w   co n s u m er s   o r ,   ad d itio n al  in   g e n er al,   to   d ev elo p   co r p o r ate   r o u tin es.  I n   o r d er   to   d o   th is ,   u s u all y   e x p er ts   lo o k   at   th m o s p er s is te n p a tter n s ,   w h ile  als o   o b s er v in g   at  t h e   m i n i m u m   r ep ea ted   co - o cc u r r en ce s   ca n   d eliv er   s ti m u lati n g   i n s i g h ts ,   r e g ar d in g   le s s er   b u n o les s   m o ti v ati n g   g r o u p s [ 1 ] .     1 . 1 .      B a ck g ro un d   Fo r   g e n er atin g   r ar ite m s et s ,   v ar io u s   r esear c h er s   h a v d esi g n ed   th a lg o r it h m s .   R ar ite m   p r o b lem   is   o n o f   t h s i g n if ican c h alle n g es  i n   as s o ciatio n   a n al y s i s .   H y p o t h etica ll y   r e v ie w i n g   t h r a r ite m   p r o b le m   in   ass o ciatio n   a n al y s i s   s tar ted   b y   L i u ,   Hs u ,   an d   Ma   [ 2 ] .   T h ey   a n ticip ated   m u lt ip le  m i n i m u m - s u p p o r m et h o d o lo g y   in   w h ich   ev er y   ite m   in   t h d ata  s et  is   h av i n g   its   o w n   m in i m u m   ite m   s u p p o r ( MI S).   MI is   co m p u ted   b y   as s o ciatin g   s m allest  p er m i s s ib le  s u p p o r an d   th s u p p o r o f   th ite m   ti m es   p ar am eter ,   ß .   I n   th is   m ea n s ,   r ar ite m s   h a v s m aller   m i n i m u m - s u p p o r ass o ciate d   to   co m m o n   i te m s ,   t h er ef o r th e y   w i ll  n o b e   u n n o ticed   in   t h r u le  g e n er ati o n   p r o ce s s .   T h er a r tw o   k e y   h itc h es  o f   th i s   m e th o d o lo g y .   First,  s tip u lati n g   MI w h e n   t h a m o u n o f   i tem s   i n   t h d ataset  is   h u g i s   m o n o to n o u s   w o r k ,   an d   s e co n d ,   d ef in i n g   th e   o p tim u m   v al u o f   ß   i s   n o i n f o r m al.   T o   r e p o r th ese  co n ce r n s ,   Szat h m ar y   an d   Valtc h ev   [ 3 ]   p r im ar il y   u s es   A p r io r i - R ar w h ic h   f i n d s   t h Min i m al  R ar I te m   s ets.  AR I MA   p r o ce ed s   th e s Mi n i m al  R ar I te m s   an d   g iv e s   th o u tp u as  r ar ite m   s et s .   T h k e y   b en e f it  is   t h at  t h ex is t in g   ap p r o ac h   is   ab le  to   ca tch   r ar ite m   s et   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l.  13 ,   No .   1 J an u ar y   2 0 1 9     41     47   42   d ep r iv ed   o f   m a k i n g   ze r o   ite m   s ets.  Ho w e v er ,   it  is   b ased   o n   t w o   t h r es h o ld   s ta n d ar d s ,   i.e .   m i n i m u m   s u p p o r an d   m a x i m u m   s u p p o r t.   A   tr a n s ac tio n   m ap p in g   al g o r ith m   w as  d esi g n ed   b y   So n g   an d   San g u th e v ar [ 4 ] .   T h m ai n   b en ef it  o f   th is   al g o r it h m   i s   t h at  it  ca n   g e n er ate  r ar ite m   s et s .   Sti l l,  th i s   alg o r ith m   is   r elia n o n   a lg o r it h m s   M R GE x p   a n d   A p r io r i - R ar e.   I n   th e   p ap er   [ 5 ] ,   A r n ab   d as   ti n ted   t h s ig n i f ican ce   o f   r ar ite m   s e ts   i n   s o m ar ea s .   He   an ticip ated   an   ap p r o ac h   f o r   d eter m i n in g   t h n o n - ze r o   r ar ite m   s et  an d   g en er ated   m o tiv atin g   ar r an g e m e n t s   f r o m   v ar io u s   ite m   s e ts . Y u n ,   Ha,   H w a n g ,   an d   R y u   [ 6 ]   p r esen ted   r elati v s u p p o r t.  T h eir   p r o ce d u r d o es  n o t   co n tain   t h f ac to r   ß ,   th er ef o r th e y   d id   n o h av t h tas k   o f   d eter m i n in g   t h o p ti m u m   v al u e   f o r   ß .   Gee v li n   an d   Ma la  [ 7 - 8 ]   p r o jecte d   an   alg o r ith m   f o r   m i n i n g   f r eq u e n ite m   s e an d   p r o d u cin g   r ar ite m s   f r o m   v ar io u s   d ata  b as es.  I n   th i s   s tu d y ,   t w o   co r g litc h es  w it h   cu r r e n m et h o d s   w er p r o j ec te d .   E x ca v at in g   p r o g r ess io n   is   b ei n g   p r ep ar ed   w it h   s ta ti s tical  m e th o d s   lik P o is s o n   d is tr ib u tio n .     Kir an   a n d   R [ 9 ]   a n ticip ate d   b etter   m u ltip le  m i n i m u m - s u p p o r m et h o d   f o r   m in i n g   t h r ar ass o ciatio n   r u le s .   T h eir   m et h o d   n ee d s   s p ec if y i n g   m u ltip le  m in i m u m   s u p p o r t,  w h ic h   is   p r o b le m atic  r elate d   to   s i n g le   m in i m u m   ad j u s ted   s u p p o r t.  Srik an t   an d   Ag r a w ali n   1 9 9 7   p r o d u ce d   s m all  al t er atio n   o f   cla s s ica l   alg o r ith m .   I n   t h i s   s tu d y ,   t h r a r ite m s   ar m o r eo v er   co m p o s ed   o n   t h b asi s   o f   m i n i m u m   s u p p o r v al u e.   Sti ll,   it f lo p s   to   ca tch   all  t h r ar item   s et s .     Sev er al  i n v e s ti g ato r s   h av ap p lied   ass o ciatio n   r u les  f o r   d iab etic  p atien ts .   P ir et  al  [ 1 0 ]   an al y s ed   th e   d ata  o f   2 3 ,   1 7 ,   2 5 9   p atien ts   id en tifie d   w it h   h y p er ten s io n   a n d   d iab etes.  B y   p u o n   as s o ciatio n   an al y s i s ,   th e y   in itiate   h y p er ten s io n   an d   d iab etes  w a s   to u g h l y   co n n ec ted .   Mu s ta f e al  [ 1 1 ]   ex p lo r ed   v ar io u s   al g o r ith m s   f o r   g en er ati n g   as s o ciatio n   r u les.  T h ey   a n al y s ed   t h alg o r it h m s   o n   b en c h m ar k   d en s d atas ets  an d   f o u n d   FP - Gr o w t h   al g o r ith m   i s   b etter   as   co m p ar ed   to   o th er s .   P r asad   [ 1 2 ]   d esig n ed   n e w   al g o r ith m   w h o s ai m   w a s   to   eli m i n ate  lo w - p r o f it  ite m s ets.   T h alg o r ith m   u s es  s h o r tim f o r   g en er ati n g   h ig h - p r o f it   ite m s ets.  B u th e   li m ita tio n   i s   t h at  i t is   u n ab le  to   g e n er ate  r ar ite m s ets   an d   m a y   b ex ten d ed   f o r   b ig   d ataset s .   Hu s s ai n   et  al   [ 1 3 ]   u s ed   A p r io r alg o r it h m   f o r   g e n er ati n g   a s s o ciatio n   r u le s   a n d   an al y s ed   t h ac ad e m ic  p er f o r m an ce   o f   s tu d e n ts   u s i n g   W E KA .     T o   in cr ea s th q u alit y   o f   d r aw i n g   o u r ar ite m s ,   tec h n iq u n a m ed   M u ltip le  Mi n i m u m   S u p p o r t   Mo d el”  w a s   d e v elo p ed   b y   D ar r ab   et  al  [ 1 4 ] .   E v er y   ite m   i s   allo ca ted   alo n g   w it h   lea s t   s u p p o r co s ca lled   Mi n i m u m   I te m   S u p p o r t”  ( MI S)  in   th i s   m et h o d .   T h is   v al u i s   allo ca ted   to   e v er y   ite m   id en t ical  to   s ec t io n   o f   its   s u p p o r t.  T h ap p r o ac h ,   d escr ib es  th least  s u p p o r o f   r ar r u le  in   r elatio n s   o f   m i n i m u m   i te m   s u p p o r o f   th ite m s   t h at  lo o k   in   t h r u l e.   i.e .   ev er y   ite m   i n   th d ata   b ase  ca n   h av leas ite m   s u p p o r th at  ca n   b co n s id er ed   b y   m ea n s   o f   s o m m et h o d   o r   ca n   b e   q u an tif ie d   b y   th u s er .   B y   g i v i n g   v ar i o u s   MI v alu e s   f o r   v ar io u s   ite m s ,   th e   u s er   p o s iti v el y   s tates   d if f er en r u le s .   T h is   alg o r it h m   u s ed   t h d o w n w ar d   clo s u r p r o p er ty .   A cc o r d in g   to   th is   p r o p er ty ,   e v er y   s u b s et  o f   f r eq u en ite m s et  is   f r eq u en t.  I f   w u s t h is   p r o p er ty ,   v ar io u s   in ter esti n g   ite m s   m a y   b i g n o r ed   o r   d is ca r d ed .     A lter n ati v m et h o d o lo g y   f o r   p r o d u cin g   r ar p a tter n   ar e   r elativ s u p p o r A p r io r al g o r ith m   ( R S AA)   p r o p o s ed   b y   E lah e   et  a [ 1 5 ] .   T h is   al g o r ith m   u s es  th r ee   c u s to m er   s tated   s u p p o r ts   k n o wn   a s   Fir s s u p p o r t,  Seco n d   s u p p o r an d   R elat iv s u p p o r t.  I f   s u p p o r v al u o f   a n y   i te m   i s   s u p er io r   th an   o r   eq u al  to   f ir s s u p p o r v alu e,   it  is   ca lled   f r eq u en i te m .   I f   s u p p o r v alu o f   an   ite m   is   s m aller   th a n   f ir s s u p p o r v alu b u lar g er   th a n   o r   eq u al  to   s ec o n d   s u p p o r v alu e,   it  is   ca lled   r ar ite m it e m   s et s   h a v in g   r ar ite m s   h a v to   m o lli f y   2 n d   s u p p o r t a n d   its   r elativ s u p p o r t sh o u ld   f u lf il lo w est r elati v s u p p o r t id en tif ied   b y   t h u s er .     B h att  et  al  [ 1 6 ]   p r o p o s ed   an   ex ten s io n   o f   R P - T r ee   alg o r ith m   ca lled   a s   Ma x i m u m   C o n s tr ain R ar e   P atter n   T r ee   A lg o r it h m .   T h is   alg o r ith m   tak e s   t h tr a n s ac tio n al  d ata  s et.   W it h   p r e v io u s   MI Val u o f   ite m ,   th is   tech n iq u co n tr o ls   th e   r ar ite m   s et  f r o m   th d at s et.   T h is   tr ee   ch o o s e s   t h tr an s ac tio n s   o f   s in g le  r ar e   ite m   s et  i n   it.  T h m et h o d o lo g y   f i n d s   o n l y   r ar ite m s   a n d   cu ts   t h o th er   ite m   s et  f r o m   t h tr an s ac tio n   at  t h ti m o f   tr ee   co n s tr u ctio n .   T h is   tr ee   is   t h ex te n s io n   o f   R P - T r ee   W h ile  m in in g   t h r ar it e m s ets,  t h is   a lg o r it h m   u s e s   tr ee   g en er atio n .   A s   a n   in s er tio n   o f   n o d in   t h tr ee   g e n er atio n ,   th p r o ce s s   m a y   b ex p en s i v e.       1 . 2 .      T he  P ro ble m   I n   w h o lesale  p r o d u ctio n   [ 1 7 ] ,   th m ar k et - b ask e s t u d y   is   w i s h ed   f o r   d eter m in i n g   w h ic h   t h i n g s   ar to   b b o u g h to g et h er   s o   as  to   k e ep   b u y i n g   b e h av io u r   o f   co n s u m er s .   I n   m ar k et - b a s k et  s t u d y ,   s o m co llectio n s   o f   th i n g s ,   s u c h   as  to o t h p aste  a n d   to o th b r u s h ,   h ap p e n   co m m o n l y .   W h e n   as s o ciate d   to   m i lk   &   b r ea d ,   s o m t h i n g s   lik ch ai n   &   g o ld   r in g   ar e   r ar ely   r elate d   ite m   s ets,  b u r ef lecte d   to   b s ig n i f ica n r el atio n s h ip .   W m a y   also   d is co v er   s o m in f r eq u en t   r elatio n s   th at  w ca n n o v is u alis e.   T h p r o b lem   o f   d eter m i n in g   r ar ite m s   h a s   j u s t c au g h t t h atte n tio n   o f   th e   d ata  m i n i n g .     Sin g le  m i n i m u m   co n s tr ai n m o d el  ad o p ts   th at  all  ite m s   h a v e   an alo g o u s   o cc u r r en ce   i n   t h d ata  s et.   I n   s ev er al  ex is te n t a p p licatio n s ,   w w i ll e n co u n ter   f o llo w in g   g litch e s   [ 1 8 ]   a)   I f   th least  s u p p o r is   f ix ed   t o   u p p er   v alu e,   w ar u n ab le  to   ca tch   th r u les  th a co n t ain   o f   r ar   ite m   s e ts .     Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       Desig n   a n d   d ev elo p men o f a n   a lg o r ith fo r   min in g   r a r itemsets   ( S a ch in   S h a r ma )   43   b)   Fo r   f in d i n g   b o th   r ar an d   f r e q u en ite m s ,   it  i s   n ec e s s ar y   t o   f ix   litt le  s m alles s u p p o r v alu b u it   m ak e s   b ig   q u a n tit y   o f   co m m o n   ar r an g e m en ts   w h ic h   ar n o t v alu ed .   R ar ite m s   ca n   b u s ed   in   s e v er al  ar ea s   lik e   te x e x ca v at i n g   -   i n d ir ec r elatio n s   ca n   u s ed   to   ca tch   s u b s t itu te s ,   an to n y m   t h at  is   u s ed   in   d if f er e n t si tu at io n s .   I n f r e q u en t p atter n s   ca n   b u s ed   to   id en tify   er r o r s .     I n f r eq u e n t ite m   s et  h as  s ig n i f i ca n t p r ac tice  in   [ 1 9 ]   ( i)   R e m o v a o f   u n d esira b le  ass o ciatio n   r u les  f r o m   r ar ite m   s e ts   ( ii)  n u m er ical  d i s cl o s u r r is k   v alu a tio n   w h er r ar p atter n s   in   u n id en ti f ied   s u r v e y   d ata  ca n   lead   to   s tatis tical  r ev elat io n   ( iii)  s ca m   d is co v er y   w h er r ar p atter n s   i n   m o n eta r y   d ata  m a y   p r o p o s u n co m m o n   ac tiv it y   r elate d   w it h   f ak b eh av io u r   ( i v ) B io - in f o r m atic s   w h er r ar p atte r n s   i n   m icr o ar r ay   d ata  m a y   p r o p o s g en o m ic  d i s ar r a y s .   R ar i te m s   ca r r y   ex tr e m e l y   s ti m u la tin g   i n f o r m a tio n   to   s ev er al  s p h er es  w it h   m ed icatio n   o r   n at u r al  s cie n ce .     1 . 3 .      P ro po s ed  So lutio n   I n   th is   p ap er ,   th e   au t h o r   w ill   d esig n   n e w   a lg o r it h m tec h n iq u w h o s p u r p o s is   to   m i n r ar e   ite m s ets  f r o m   t h tr an s ac tio n a l d atab ase.   T h is   m e th o d   w ill al s o   o v er co m li m itatio n s   o f   e x i s tin g   ap p r o ac h .     a)   A p r io r i - R ar e,   A p r io r i - I n v er s is   n o t a b le  to   f i n d   r ar ite m   s et s .   b)   AR I M A   Alg o r it h m   i s   ab le  t o   g en er ate   r ar ite m   s et  b u t   th e   r u le s   p r o d u ce d   f r o m   t h e m   ar e   n o a ll  s ti m u la tin g .   c)   T h p r o ce s s   m a y   b e x p en s iv e   as th ex is ti n g   alg o r it h m   u s e s   tr ee   g en er atio n   m et h o d .     d)   Var io u s   R ar ite m s e ts   m a y   b ig n o r ed   o r   d is ca r d ed   b y   u s i n g   d o w n w ar d   clo s u r p r o p er ty .   T h o r g an izatio n   o f   t h r esear ch   p ap er   is   as  f o llo w I n   s ec ti o n   2 ,   p r o p o s ed   alg o r ith m   i s   o f f er ed   an d   I n v e s tig a tio n al  r es u lt s   ar s h o w n   i n   s ec tio n   3 .   C o n clu s io n   p ar t is g i v en   i n   s ec t io n   4 .         2.   P RO P O SE M E T H O D   Af ter   r ev ie w i n g   an d   an a l y s i n g   th v ar io u s   al g o r ith m s ,   it  i s   p er ce iv ed   th at  al g o r ith m s   m en tio n ed   ab o v h av e   s o m d r a w b ac k s .   T h ex is ti n g   al g o r ith m s   A p r io r i - ra r e,   A p r io r i - in v er s ar n o ab le  to   f i n d   all   r ar ite m   s et s .   W h i le  t h ex i s t in g   m e th o d / p r o ce d u r AR I M A   i s   ab le  to   g en er ate  r ar ite m   s e t.  A ls o ,   t h r u le s   p r o d u ce d   f r o m   th e m   ar n o a ll  s ti m u lati n g .   T o   r em o v e   th e   d r a w b ac k s   m e b y   th a ll  m et h o d s ,   w s u g g e s t   n e w   ap p r o ac h   w h ic h   f o llo w s   b id ir ec tio n al  ap p r o ac h .   T h n e w   m e th o d   u s e s   th d at aset  a nd   m i n i m u m   th r es h o ld   as  i n p u t   an d   y ield s   r ar ite m   s ets  a s   o u tp u t.  I h elp s   in   p r u n in g   t h ca n d id ate.   T h s tep s   o f   p r o p o s ed   ap p r o ac h   ar as f o llo w :     2 . 1 .       Ste ps :   a)   Scan   t h d atab ase  o n l y   o n ti m to   ca tch r ea l s u p p o r t o f   item s .   b)   I te m s   i n   th tr a n s ac t io n   ar in   ascen d i n g / d esce n d i n g   o r d er   ac co r d in g   to   m u ltip le  s u p p o r th r esh o ld s .   c)   C alcu late  MI S v al u f o r   ea ch   i te m   i n   tr an s ac tio n   d ata  s et.   MI S =   ß   S(ij )   if   ß   S(i j )   L S   S ( i j )   else   W h er ß   is   u s er   d ef in ed   v al u lie s   b et w ee n   ze r o   an d   o n e; ( ij )   d en o tes  th ep er ce n ta g s u p p o r o f   an y   ite m   eq u a l to   f   ( ij )   / N * 1 0 0 ; a n d   L S i s   u s er   d ef in ed   least   s u p p o r t v alu e.     d)   Fin d   t h least  m i n i m u m   s u p p o r t th r esh o ld .   e)   Fin d   r ar ite m   s et  i f   s u p p o r is   le s s   th a n   L S   an d   lar g er   t h an   o r   eq u al  to   lea s m i n i m u m   s u p p o r t   th r es h o ld .     f)   Fin d   t h tr an s ac t io n   h a v i n g   atl ea s t o n r ar ite m   s et  f r o m   tr a n s ac tio n   d ata  s et.     2 . 2 .      F lo w   Cha rt   Fo llo w i n g   is   t h d escr ip tio n   p r o v id ed   f o r   Giv en   tr a n s ac tio n   d atab ase  DB   as sh o w n   in   Fi g u r 1 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l.  13 ,   No .   1 J an u ar y   2 0 1 9     41     47   44       Fig u r 1 .   Giv en   tr a n s ac tio n   d atab ase  DB   as sh o w n       E x a m p le:  Giv e n   tr a n s ac tio n   d atab ase  DB   as  s h o w n   i n   th T ab le  1   w it h   Mi n i m u m   S u p p o r ( L S)   f i x ed   at  2 0 % a n d   ß =0 . 7 th m u ltip le  ite m   s u p p o r ts o f   ite m s   i n   T ab le  2 .       T ab le  1 .   T r an s ac tio n s   C o n tain in g   Var io u s   I te m s   TI D   I t e ms   T1   D , C , A , F   T2   G , C , A , F , E   T3   B , A , C , F , H   T4   G , B , F   T5   B,C       T ab le  2 .   C alcu latio n   o f   Su p p o r %ag e   I t e ms   A   B   C   D   E   F   G   H   M I S   42   42   56   20   20   56   28   20   S u p p o r t   %a g e   60   60   80   20   20   80   40   20       As  p er   th p r o p o s ed   ap p r o ac h ,   th ac tu a s u p p o r tp er ce n tag e   an d   m i n i m u m   s u p p o r th r esh o ld   v alu es   o f   v ar io u s   ite m s   ca lc u lated   ar s h o w n   in   T ab le  1 .   MI v alu e s   ar ca lcu lated   ac co r d i n g   to   th f o r m u l a   d escr ib ed   in   s tep   2   o f   p r o p o s ed   ap p r o ac h .   No tice,   if   ß =1   an d   Sij     L S,  m in i m u m   s u p p o r th r es h o ld   v alu o f   an y   ite m   ar th r ea s u p p o r o f   ite m s   Sij , w h er ea s   i f   ß =0 ,   th er is   o n l y   s i n g le  m in i m u m   s u p p o r t.  I is   to   b n o ted   th at  ß   p ar am eter   is   d et er m in ed   b y   t h f o r m u la[ 9 ] :           .   I n   T ab le  2 ,   th r esu lts   ar ar r an g ed   an d   s to r ed   ac co r d in g   to   Min i m u m   Su p p o r t T h r esh o ld   v alu es.    L ea s m i n i m u m   s u p p o r th r es h o ld   v al u is   2 0 .   D,   E ,   ar r ar item   s ets  a s   th e s ite m s   ar n o t   s m al ler   t h an   least   s u p p o r v al u b u lar g er   th a n   o r   eq u al  to   s m al lest   m in i m u m   t h r es h o ld   v alu e.   So ,   i n   th e   n e x t   s tep ,   w w ill  s elec t h tr an s a ctio n s   h a v i n g   at  leas s in g le  r ar item   s e t.   As  s h o w n   in   T ab le   4.   In   T a b le  3 ,   th e   re su lt   is   ar r an g e m e n t o f   ite m s   a cc o r d in g   o f   ite m s   ac co r d in g   to   m in i m u m   s u p p o r t th r esh o ld :       T ab le  3 .   A r r an g e m en t o f   I te m s   A cc o r d in g   o f   I te m s   A cc o r d i n g   to   Mi n i m u m   S u p p o r t T h r esh o ld   --   C   F   A   B   G   D   E   H   M I S   56   56   42   42   28   20   20   20   S u p p o r t   %a g e   80   80   60   60   40   20   20   20     Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       Desig n   a n d   d ev elo p men o f a n   a lg o r ith fo r   min in g   r a r itemsets   ( S a ch in   S h a r ma )   45   T ab le  4 .   Selectio n   o f   R ar I tem s   f r o m   T r an s ac tio n   I t e ms   T1   T2   T3   T4   T5   M I S   D   E   H   -   -       3.   RE SU L T S AN D I SCU SS I O N   Her e,   th p r o p o s ed   m et h o d   is eq u ated   w it h   t h ex is tin g   v er s io n s ,   to   d is co v er   r ar e   ite m   s et s   u n d er m u l tip les u p p o r tth r esh o l d s .   To   v er if y   t h e   ef f icac y   an d   p r o f icien c y   of   th e   n e w   m et h o d ,   s ev er al   ex p er i m e n ts   ar co n d u cted   u s in g   v ar io u s   d ata   s e ts   w it h   d if f er en t   f ea t u r es.  I n   t h ese   test s ,   w m ea s u r e   t h e   p er f o r m a n ce   w it h   r esp ec t to   ti m an d   m e m o r y   s p ac e.       3 . 1 .       E x peri m ent a l En v iro n m e nt  a nd   Da t a s et s     W co n d u ct  th ex p er i m e n ts   b y   m ea n s   o f   d if f er en k i n d   o f d atasets   to   f i n d   th p er f o r m an ce   a n d   ef f icien c y   o f   t h p r o p o s ed   m e th o d .   T h d ata  s ets  ar ex ec u t e d   an d   test ed   o n   m ac h i n I n te C o r 2 ,   2 . 0 0   Gh w it h   6 4   b it Op er atin g   s y s te m   an d   ar i m p le m e n ted   in   P y t h o n   p r o g r a m m in g   la n g u a g e.   W u s ed   th r ee   r ea l w o r ld   d ata s ets  ( Mo n k 1 ,   C h es s   an d   C an ce r ) .   T h r ea l   w o r ld   d atasets   ar tak en   f r o m   FIM I   r ep o s ito r y   [ 1 4 ] .   T h i m p o r tan t c h ar ac ter i s tics   r ea w o r ld   d atasets   ar g i v e n   in   T ab le  5 - 8       T ab le  5 .   C h ar ac ter is tics   o f   Da t asets   D a t a   S e t   I n st a n c e s   A t t r i b u t e s   C H ESS   3 0 2 4   37   M O N K 1   4 3 2   5   C A N C ER   5 6 9   30       T ab le  6 .   R esu lts   Ob tai n ed   f o r   C h e s s   D a t a   S e t s   T i me   Ex e c u t i o n   N o   o f   R a r e   i t e m se t s   M e mo r y   c o n su me d   ( M i B )   2 0 0   0 . 8 5   25   1   1 0 0 0   0 . 9   18   0 . 8   1 5 0 0   0 . 8 7   17   0 . 8   3 0 0 0   0 . 9   7   0 . 9       T ab le  7 .   R esu lts   Ob tai n ed   f o r   C an ce r   D a t a   S e t s   T i me   Ex e c u t i o n   N o   o f   R a r e   i t e m se t s   M e mo r y   c o n su me d   ( M i B )   5 6 0   0 . 7 1   3   1       T ab le  8 .   R esu lts   Ob tai n ed   f o r   Mo n k 1   D a t a   S e t s   T i me   Ex e c u t i o n   N o   o f   R a r e   i t e m se t s   M e mo r y   c o n su me d   ( M i B )   4 3 2   0 . 6   4   1       T h ex ec u t io n   t i m e   ev a lu at io n   o f   p r o p o s ed   an d   v ar io u s   e x i s tin g   v er s io n s   ar g iv e n   i n   T ab les   9 - 10 .   T h p er f o r m a n ce   o f   p r o p o s ed   alg o r ith m   w i th   s e v er alß   is d i g n i f ied   o n   th e   s p ec i f ied   d atas ets.  No te  th a t,   th e   ex ec u t io n   ti m m ea n s   th to tal   r u n t i m e,   w h ic h   i s   t h p er io d   am o n g   i n p u t a n d   o u tp u t.  T h e x p er i m e n tal  r es u lt s   d iv u l g t h at  p r o p o s ed   m et h o d   is   s u b s tan tiv e l y   f aster   t h an   ea r lier   v er s io n s .         T ab le  9 .   C o m p ar is o n   B et w ee n   P r o p o s ed   &   E x is ti n g   S y s te m   ( C h es s   Data s e t)     T i me   Ex e c u t i o n ( se c o n d s)   N o   o f   R a r e   i t e se t s   M S A p r i o r i   34   7   Ex i st i n g   [ G a n d h i   P ]   13   7   P r o p o se d   0 . 9   17       Fo llo w i n g   i s   t h d escr ip tio n   p r o v id ed   f o r   co m p ar is o n   f o r   C h e s s   d ata s et   as   s h o w n   in   Fig u r 2 Fo llo w i n g   is   t h d escr ip tio n   p r o v id ed   f o r   co m p ar is o n   f o r   C a n ce r   d ataset   as so o n   i n   Fi g u r 3       Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 5 0 2 - 4752   I n d o n esia n   J   E lec  E n g   &   C o m p   Sci,   Vo l.  13 ,   No .   1 J an u ar y   2 0 1 9     41     47   46       Fig u r 2 .   C o m p ar is o n   f o r   ch es s   d ataset       T ab le   1 0 .   C o m p ar is o n   B et w ee n   P r o p o s ed   E x is tin g   S y s te m   ( C an ce r   Data s et)     T i me   Ex e c u t i o n ( se c o n d s)   N o   o f   R a r e   i t e m se t s   A p r i o r i   1   0   Ex i st i n g   [ H o q u e   N ]   1   0   P r o p o se d   0 . 7   3           Fig u r 3 .   C o m p ar is o n   f o r   ca n c er   d ataset       C o m p ar is o n   b et w ee n   p r o p o s ed   &   ex is tin g   s y s te m   ( m o n k 1   d ataset)   as s h o w n   i n   T ab le  1 1 .       T ab le  1 1 .   C o m p ar is o n   b et w ee n   p r o p o s ed   &   ex is ti n g   s y s te m   ( m o n k 1   d ataset)     T i me   Ex e c u t i o n ( se c o n d s)   N o   o f   R a r e   i t e m se t s   A p r i o r i   1   0   Ex i st i n g   [ G a n d h i   P ]     1 . 5   5   P r o p o se d   0 . 6   4       Fo llo w i n g   is   t h d escr ip tio n   p r o v id ed   f o r   C o m p ar is o n   f o r   Mo n k 1   d ata   s et   as s h o w n   i n   Fi g u r 4.           Fig u r 4 .   C o m p ar is o n   f o r   Mo n k 1   d ataset   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esia n   J   E lec  E n g   &   C o m p   Sci     I SS N:  2502 - 4752       Desig n   a n d   d ev elo p men o f a n   a lg o r ith fo r   min in g   r a r itemsets   ( S a ch in   S h a r ma )   47   Fro m   t h e x p er i m e n tal   r es u lts ,   it i s   o b s er v ed   th at   p r o p o s ed   alg o r ith m   g i v es   b etter   r es u lt a s   co m p ar ed   to   p r ev io u s   al g o r ith m s .   Fo r   C h es s   d ata   s et,   it  is   f o u n d   th a p r o p o s ed   s y s te m   g iv e s   b etter   r esu lt  i.e .   n u m b er   o f   r ar ite m s   ar h ig h   a n d   ti m e   co n s u m p tio n   is   le s s .   I n   ca s o f   C a n ce r   d ata   s et,   p r ev io u s   al g o r ith m s   g i v e s   n o th i n g   b u o u r   m et h o d   f in d s   r ar item s ets.  Ho w e v er ,   f o r   M o n k 1   d ataset,   th p r ev io u s   al g o r ith m   g i v es  m o r e   r ar item s ets t h a n   o u r s   b u t i t n ee d s   m u c h   a m o u n t o f   ti m a n d   s a m n u m b er   o f   d atab ase  s c an   lik A p r io r i.       4.   CO NCLU SI O N   As  s i n g le  m i n i m u m   s u p p o r is   i n ad eq u ate  f o r   ass o ciat io n   r u le   m in in g ,   it  is   u n ab le  to   i m itate   f r eq u en c y   d if f er en ce s   o f   th d if f er en ite m s   i n   th d atab ase.   I n   r ea lis tic  ap p licatio n s ,   s u c h   t y p o f   d if f er e n ce s   ca n   b v er y   h u g e.   I is   n eit h er   ac ce p tab le  to   s et  th m in i m u m   s u p p o r to o   lar g e,   n o r   it  is   ap p r o p r iate  to   s et  it  to o   s m all.   I n   t h i s   p ap er ,   w h a v ex p lo r ed   th p r o b le m   o f   u s i n g   i te m   s p ec if ic  m in i m u m   s u p p o r t.  I t p e r m i ts   t h e   cu s to m er   to   s tip u late  m u ltip le  m i n i m u m   i te m .   T o   an s w er   th i s p r o b lem ,   w e   h a v p r o p o s ed   an   al g o r ith m   w h ic h   is   s k il f u o f   d r a w i n g   o u r ar p atter n s   e f f icie n tl y .   W h av e   ass es s ed   t h p er f o r m a n ce   o f   p r o p o s ed   alg o r ith m   b y   s h o w in g   a test   o n   v ar io u s   d atasets .   T h ab o v m e n tio n e d   r esu lt s   s h o w   t h at   p r o p o s ed   alg o r ith m   h as   co m e   o u f r o m   th r ar ite m p r o b lem   a n d   g i v es  u s er   m o r f lex ib le  an d   d o m i n an m o d el  to   s tat m i n i m u m   s u p p o r f o r   r ar ite m .   T h u s ,   p r o p o s ed   alg o r ith m   allo w s   u s   to   co llier y   r ar p atter n   w it h o u cr ea tin g   an y   u n e x citi n g a n d   ted io u s   p atter n .       RE F E R E NC E S   [1 ]   T ro ian o ,   S c i b e ll i,   Birt o lo .   A   f a st  a lg o rit h m   f o m in in g   ra re   it e m s e ts . Pro c e e d in g o Ni n t h   In ter n a ti o n a l   Co n fer e n c e   o n   In tell ig e n t   S y ste ms   De sig n   a n d   Ap p li c a ti o n s ,   2 0 0 9 1 1 4 9 - 55 .   [2 ]   L iu ,   Hs u ,   M a ,   M in i n g   a ss o c ia ti o n   r u les   w it h   m u lt ip le  m in imu m   su p p o rts Pro c e e d in g o ACM   S IGKD In ter n a t io n a C o n fer e n c e   o n   K n o wled g e   d isc o v e ry   a n d   d a ta   mi n in g ,   1 9 9 9 3 3 7 - 3 4 1 .   [3 ]   L a s z lo   S z a th m a r y ,   Am e d e o   Na p o li ,   P e tk o V a lt c h e v .   T o w a rd Ra re   Ite m se M in in g . 1 9 th   IEE In ter n a ti o n a l   Co n fer e n c e   o n   T o o ls  wi th   Art if ici a In telli g e n c e . 2 0 0 7 .   P a tras 3 0 5 - 3 1 2 .   [4 ]   S o n g ,   M . ,   S a n g u th e v a r,   R.   A t ra n sa c ti o n   m a p p in g   A l g o rit h m   f o fre q u e n it e m - se ts  m in in g . IEE T ra n sa c ti o n s o n   Kn o wled g e   a n d   D a ta   En g i n e e rin g ,   2 0 0 6 ; 1 8 ( 4 ):  4 7 2 4 8 1 .   [5 ]   A rn a b   Da s.  M in in g   ra re   it e m   se ts  u sin g   b o t h   T o p - d o w n   a n d   Bo tt o m - up  a p p ro a c h I n ter n a ti o n a J o u rn a o f   c o mp u ter   sc ien c e   a n d   i n f o rm a ti o n   tec h n o lo g ies .   2 0 1 6 ; 7 (3 ):   1 6 0 7 - 1 6 1 4 .   [6 ]   H.  Yu n ,   D.   Ha ,   B.   Hw a n g ,   K.  H.  Ry u .   M in i n g   a ss o c iatio n   ru les   o n   sig n if ica n ra re   d a ta  u sin g   re lativ e   su p p o rt .   J o u rn a o S y ste ms   a n d   S o f twa re - El se v ie r . 2 0 0 3 6 7 1 8 1 - 1 9 1 .   [7 ]   A . L .   G re e n ie  G e e v li n ,   A .   M a l a .   Eff icie n A l g o rit h m f o M in in g   Clo se d   F re q u e n Item se t   a n d   G e n e r a ti n g   Ra re   A s so c iatio n   Ru les   f ro m   Un c e rtai n   Da tab a se s In ter n a ti o n a J o u r n a o sc ien ti fi c   re se a rc h   a n d   ma n a g e me n t .   2 0 1 3 ;   1 (2 ):  9 4 - 1 0 8 .   [8 ]   S e th i,   S h a rm a .   Eff icie n A l g o rit h m f o M in in g   Ra re   Item se o v e T i m e   V a rian T ra n sa c ti o n a l   Da tab a se . In ter n a ti o n a l   J o u r n a o c o mp u ter   sc ien c e   a n d   i n fo rm a t io n   tec h n o lo g ies ,   2 0 1 4 5 (3 ):   3 4 6 5 - 3 4 6 8 .   [9 ]   R.   Ud a y Kira n ,   P .   Re d d y .   M in in g   ra re   a ss o c iatio n   ru les   i n   t h e   d a tas e ts  w it h   w id e l y   v a r y in g   it e m s ’  f re q u e n c ies .   Pro c e e d in g o 1 5 th   in ter n a ti o n a c o n fer e n c e   o n   d a ta b a se   sy ste ms   fo r A d v a n c e d   A p p l ica ti o n s .   2 0 1 0 1 4 9 - 62   [1 0 ]   P ir i,   De len ,   L iu ,   P a iv a .   De v e lo p m e n o f   a   n e m e tri c   to   id e n ti f y   ra re   p a tt e rn in   a ss o c iatio n   a n a ly sis:  th e   c a se   o f   a n a ly sin g   Dia b e tes   c o m Exp e rt sy ste ms   wit h   a p p li c a ti o n s ,   El se v ier   L td ,   2 0 1 7 ;9 4 1 1 2 - 1 2 5 .   [1 1 ]   M u sta f a   M a n ,   W a n   Ba k a r,   A b d u ll a h   Z,   Ja li M ,   He ra w a n   T .   M in in g   A ss o c iatio n   ru les c a se   stu d y   o n   Be n c h m a r k   d e n se   d a ta In d o n e si a n   J o u rn a o f   El e c trica l   En g in e e r in g   a n d   C o mp u ter   S c ien c e .   2 0 1 6 3 (3 ):  5 4 6 - 5 5 3 .   [1 2 ]   Ra jen d e ra   P ra sa d .   Op ti m iz e d   Hig h - Util it y   it e m se ts  m in in g   f o e ffe c ti v e   a ss o c iatio n   m in in g   p a p e r .   In d o n e sia n   J o u rn a o El e c trica a n d   C o mp u t e r E n g i n e e rin g .   2 0 1 7 7 ( 5 ):  2 9 1 1 - 18.   [1 3 ]   S a d iq Hu s sa in ,   Ne a m a A b d u laz izD a h a n ,   F a d lM u tah e Ba - A lw i,   Na jo u a Rib a ta.  Ed u c a ti o n a Da t a   M in in g   a n d   A n a l y si o S tu d e n ts’  A c a d e m i c   P e rf o rm a n c e   Us in g   W EK A .   In d o n e sia n   J o u rn a o El e c trica En g in e e rin g   a n d   Co mp u ter   S c ien c e .   2 0 1 8 9 (2 ):   4 4 7 - 4 5 9 .   [1 4 ]   Da rra b ,   Erg e n c .   V e rt ica P a tt e rn   M in i n g   a lg o rit h m   f o m u lt ip le  su p p o rt  t h re sh o ld s .   Pr o c e e d in g o In ter n a ti o n a l   c o n fer e n c e   o n   k n o wle d g e   b a se d   a n d   i n telli g e n in f o rm a ti o n   a n d   e n g in e e rin g   S y ste ms .   F ra n c e .   2 0 1 7 :   4 1 7 - 4 2 6 .   [1 5 ]   El a h e ,   Zh a n g .   M i n i n g   f re q u e n i tem se ts  a lo n g   w it h   ra re   i tem se ts  b a se d   o n   c a teg o rica m u lt ip le  m in im u m   su p p o rt J o u rn a o Co m p u ter   E n g i n e e rin g ,   2 0 1 6 1 8 (6 ) 1 0 9 - 1 1 4 .     [1 6 ]   Bh a tt ,   P a tel,   A   No v e a p p ro a c h   f o f in d in g   ra re   it e m b a se d   o n   m u lt ip le  m in im u m   su p p o rt  f ra m e w o r k Pro c e e d in g o 3 rd   In ter n a ti o n a c o n fer e n c e   o n   re c e n tre n d in   c o m p u ti n g .   2 0 1 5 5 7 : 1 0 8 8 - 1 0 9 5 .   [1 7 ]   Ka n im o z h iS e lv i.   M in in g   Ra re   it e m   s e w it h   a u to m a ted   su p p o rt  th re sh o l d s .   J o u rn a o Co mp u ter   sc ien c e 2 0 1 1 ; 7 (3 ):   3 9 4 - 3 9 9 .   [1 8 ]   S rik a n t,   R. ,   A g ra w a l,   R.   M in i n g   G e n e r a li z e d   A ss o c iatio n   Ru les Fu tu re   Ge n e ra ti o n   C o mp u ter   S y s tem s ,   1 9 9 7 ;   1 3 :   161 1 8 0 .   [1 9 ]   P a d m a v a th y ,   Jo e .   Ra re   u ti li t y   it e m se m in in g   w it h o u c a n d id a te  g e n e ra ti o n .   In ter n a ti o n a J o u rn a o A d v a n c e d   Res e a rc h   in   M a n a g e me n t,   Arc h i t e c tu re ,   T e c h n o l o g y   a n d   E n g i n e e rin g .   2 0 1 6 ;2 ( 1 2 ):   1 2 1 - 1 2 8 .   Evaluation Warning : The document was created with Spire.PDF for Python.