Indonesi an  Journa of El ect ri cal Engineer ing  an d  Comp ut er  Scie nce   Vo l.   24 ,  No.   2 N ov em ber   20 21 , pp.  108 4 ~ 10 90   IS S N: 25 02 - 4752, DO I: 10 .11 591/ijeecs .v 24 .i 2 . p p 108 4 - 10 9 0          1084       Journ al h om e page http: // ij eecs.i aesc or e.c om   IPOC:  a efficie nt appr oach fo r dynami associati on rul ge n eration u sing i ncreme ntal data  with upd ating sup ports       P.   Na res h, R.   Sugun a   Depa rtment  o C om pute Scie n ce a nd   Engi n ee rin g ,   Vel   T ec h   Ran gar ajan  Dr.   Sagu ntha l R&D  Instit ute of  Sc ie n ce  and  Te chno log y ,   Ch enna i ,   Ind ia       Art ic le  In f o     ABSTR A CT   Art ic le  history:   Re cei ved   Ma y   25 2021   Re vised  Sep   16 2021   Accepte Se p   21 2021       Acc ording  to  r e ce nt   statistic s ,   t her was   dra sti c   growth  in   online  business   sec tor  where   m ore   num ber   of  c ustom ers  int ends  to  purc hase   i t ems .   Due  to  the se  r et a ilers  a c cumulat es  hug volumes  of  data  from   da y   to   da y   oper ations   and  engr oss ed  in  ana l y zi ng  th d at to  watc th beha vior  of  c ustom ers  at   it ems   which  strengt hen  the   busin ess  prom oti ons  and  ca t al og  m ana gement.   It   rev eals  the  cust om er  int er esti ng ness  and  fre qu e nt  item from   la rge   data.  To   ca rr y   out this  there  was known a l gorit hm s pre sent   which  deals wi t stat ic   and  d y nami data.   Som of  the m   are   l ag  ti m an m emory   consum ing  and  invol ves  unnece ss ar y   proc ess.  T his  pape int ents   to  implement  an  eff icient  inc rement al   pr orde red   code tr ee   (IPO C)  gene r at ion  for  d ata  u pdat es  an d   appl i es  fre quen it em  set  ge n erati on  al gori thm  on  the   tr ee.  W hil i ncr emental  gene ra ti on  of  tr ee ,   new  data  it e m s   will   li nk  to  pre vious  nodes  in  tre b y   inc re asing  i ts  support  coun t.   T his  removes  the  la gging   issues  in  ex isti n g   al gorit hm and  d oes  not  nee d   to  m ine   from   scra tch  and  al so   r educes  the   t ime,   m emory   consu m pti on  b y   th use  of  nodese dat a   struct ur e.  The   r esult of   proposed  m et hod  was  observe d   and  an aly z ed  with  exi st ing  m et hods.  Th e   ant i ci pa te m ethod  show impr oved  result b m ea ns  of  generat ed  item s,   ti m and   m emory .   Ke yw or d s :   Dataset   In c rem ental  tree g e ner at io n   IP OC   Nodese t   This   is an  open   acc ess arti cl e   un der  the  CC  B Y - SA   l ic ense .     Corres pond in Aut h or :   P.   Nar es h   Dep a rtm ent o Com pu te Scie nce  a nd   E ng i ne erin g   Vel Tec Ra ng araj a n Dr. Sa gunt hala R& I ns ti tute o f   Scie nce a nd Tec hnology   Chen nai,  India   Em a il :   pan na ngina resh@ gm a il .co m       1.   INTROD U CTION   Now  day  the re  is  m or co m pet it ion   in  business  sect or   wh ic aim to  at tract   the  custom ers  wit h   la te st  and   inter est ed  it e m s.  At  the  sam t i m e   it   is  req uire t ide ntify  the  us er  i nterests  on  it e m by  appl yi ng   associat ion  it em   analy sis.  It  will   help   to  kn ow   the  fr e que nt   it e m bo ug ht  by  di ff e ren use rs  of  al trans act ion s   at   su per   m ark et   or   sto re.  B analy zi ng   these  data  on c an  sugge st  m or it e m to  cus tom ers  dep en di ng   on  their  fr e quency   wh ic inte rn   i ncr ease  the  sal es  and   al so   it   assist   in  m ai ntain in g oo an update cat al og   of  it e m s.  It  is  ach ie ved  by  t he  i m ple m entat ion of  var i ous  tre nd data  m ining   a ppr oach e a analy zi ng  dat a nd   m akes  ideal   de ci sion s.  Data  m ining   is  f undam ental   pr oc ess  in  kn ow le dge  m ining   w hich  disc overs  unkn own   facts,  nee dy  inf o rm at ion   an interest in patte rn form   m assive  data.  Fr eq ue nt  it em se m ining   [ 1]  and   associat ion r ul e m ining   play a cr ucial  role o n fin ding  us er  interests  from  tran sact io nal d at abase.     Associ at ion   rul gen e rati on  f ro m   fr eq ue nt  it e m fr om   retai and   real  wo rld  dataset em plo ys  vital   ro le Aprio ri  and   fr e quent  patte rn   gro wth  ( FP - gro wth )   are  the  f undam ental   al go rithm fo m i ning   transacti onal   da ta set   to  disco ver   f re qu e nt  it em s   [2 ] Aprio ri  gen e rates  can did at key  at   each  it e m set and   then   Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       IPO C : an ef fi ci ent appro ac f or   dy namic  as s ociatio r ule  ge ner ation  us i ng inc reme nta l …  ( P. Na res h )   1085   ver ifie the  s uppo r thres ho l d,   w hic is  tim con su m ing   proce ss.  T he   oth er  F P - gro wth  does n’ ge ner at cand i date  key  bu it   bu il ds   fr e qu e nt  patte r tree   ( FP - tree )   f or  al tra ns a ct ion al   it em s.  Wh il li nkin t he  it em   with  the  node   of   t ree  it   chec ks   it sup port  and  occ urre nc es  at   each  tra nsa ct ion Sup port  an Co nfi de nce  are   qu al it at ive  m easur e for  ref i ning  the  transa ct ion to  know   the  it e m   fr equencie s.  High  ut il i ty   [3 ] - [5 ]   A RM   is   ta sk   wh ic h per form m ining   by consi der in g uti li ti es o f res pecti ve  it em s [ 6] [ 7] :     Suppor t It is   the c ount  of o cc urren ce  of a  p a rtic ular  it em  I  at al l t ran sact io ns .     Confide nce  of  X Y It  is  the  pr oba bili ty   of   occurre nce  of  m or than  on it e m   or   it e m   co m bin at ion in  a   sing le   or all  tra ns act io ns .   T h e   T a b l e   1   c o n t a i n s   s a m pl e   t r a n s a c t i o n a l   d a t a   w i t h   t r a n s a c t i o n   i d   a n d   r e s p e c t i v e   i t e m s   w h i c h   w e r e   b r o u g h t   t o g e t h e r .   T h e   T a b l e   2   h o l d s   t he   i n f o r m a t i o n   a b o u t   a l l   i t e m s   a n d   t h e i r   r e s p e c t i v e   s u p p o r t s .   M o b i l e C h a r g e r   ( c o n f i d e n c e   7 0 % )   m e a n s   t ha t   7 0 %   o f   t h e   c u s t om e r s   w h o   b o u g h t   m o b i l e   a l s o   b u y   a   c h a r g e r .       Table  1.   Sam pl e transacti on al   data   Tr an sactio n s   Ite m s   T50 1   I2,I5,I6   T50 2   I3,I4,I6   T50 3   I1,I3,I5, I6   T50 4   I2,I4,I5   T50 5   I1,I3,I5, I6     Table  2 Item with s upport c ount   Ite m   Su p p o rt   I1   2   I2   2   I3   3   I4   2   I5   4         In   real  tim e,  new   data  ge ne rated  dr ast ic a l ly   as  con ti nuou t ran sact i ons  [ 8 ]   wer pe rfor m ed  by  diff e re nt  custo m ers  at   retai l   stores.   Furth erm or existi ng  dataset   ca be  up dated  with  ne in form ation  con ti nu ously   wh ic m akes  the  dataset   asy m m e tric al   du e   to  u pdat es  [ 9 ] an it   is  very   diff ic ult  to  a naly ze   t hese  kinds  of   dataset [1 0]  and   al so   inc re ase  the  com pl exity   on   m ining   fr e quent  it em s.   Pr evio us   m et ho ds  wh ic deal  with  fr e quent  it em s   m ining   we re  ap plica ble  to  sta ti dataset wh e re  no  c hanges  wer m ad e   furthe r.   T he re  e xist  so m al gorithm li ke   f r equ e nt  i te m set  with  node set   (F I N)   [11 ]   w hi ch  will   inc rea se  the   fast of m ining   process  but  unawar e  of  handl ing   with i ncr e m ental  o r dyna m ic  d at a.    C hiu   et   al .   [ 12]   i m ple m ented  tree  base m et hod  f or  deali ng   with  dynam ic   data  us i ng   F CFP   tree.  It  dep e nds  on  ge ner at io of  f ul com pr essio tree  ge ne rati on.  A fter ward  D eng  [ 13 ]   disc overe a   no vel  data  structu re  cal le no deset,  to  increase  th m ining   acc ur a cy In   t heir  pa per   t hey  ge nerat ed  pre  orde r   code ( PO C )   tree  an pre post  order   c od e ( P PC )   tree  de pends  on  or der e transacti onal   it e m to  fast  m ining.   Wh e ne ver  n e w   data  ad de to ex ist ing,  it   is  toug to  m ine  accuratel an s om eti m es  earlier  ge ne rated  it e m or  ru le gets  i nv a li d.   All  this   pr ocess  e ntirel beco m es  w or t hless  du e   to  st art  f ro m   s cratch  re cu rsively   f or   al l   new ly   ad de data.  To  c onquer  the se  issu es  and   to  dea with  dynam i dataset   [14 ] ,   this  pap e ai m s   to  i m ple m ent  no vel  a nd   e ff ic i ent  al gorithm   cal le increm e ntal  pr order e co de tree.  I wo r ks   with  node set   data  struct ur creati o a nd  app li es  f reque nt  it e m se m ining   ( F IM )   on   th e   tree  [15 ].   The   fo rt hc om ing   sect ions   of   this  pa pe exp l or es  a bout  li te ratur surve of   existi ng   a ppr oach es  relat ed  to  ARM  and   dynam ic   it e m   set   m ining ,   pro pos ed  al gorithm   wh ic ha ndle th dy nam ic   data  by  t he  us of  nodeset  data  st ru ct ur e,   a naly sis  of   resu lt (co m par is on  with e xis ti ng  alg ori thm s a nd f inall y e nds  with c oncl usi on secti on.   Dynam ic   it e mset  m ining   a nd   associat io r ul m ining   [16]   has  bee c halle ng in e ra  i data  m ining  from   increm en ta dataset s.  A the  data  in  retai industry   or  supe rm ark et   intends  to  changes co nti nuous   m ining   bec ome   co m plex  t ask.   S it   is   e ssentia to  devel op   data  structu re  m os tl su it able  for  ha nd li ng   updat in data   or   ne data.  It  m a intai ns   inform at ion   reg a rd i ng   a dd ed  tran sact ions  dynam ic al l [17 ].    This  proces di scov e rs  ne f reque nt  it e m se ts  by  el i m inatin in fr e quent  it e m set dep en ding  on  their  update su pp or t   [ 18 ]   th reshold s.  E xist ing   m et hods   sc an  the  d at ba s from   scratch f or  eac a dded   transacti on  w hi ch  is   tim con s umi ng  an ha un necessa ry  ta sks.  S finall th is  survey  ai m on  ide ntifyi ng  novel  a nd  im pr ove al gorithm s f or   fast m ining  a nd assim il a te s wi th d ynam ic  d a ta set s   us in m achine lea ning a ppr oac hes  [1 9] .   Sun   et   al [1 ]   in  their  pa per   In c rem ental   Fr equ e nt  Item sets  Mi nin gwit FCFP  Tree”  im ple m ented  a   new   tr ee  base data  struct ur for  m ai ntaining   both  fr e quen and   in fr e que nt  it e m to  ov e rco m tim wastage.   They  us e c om pr ession  te ch nique  to  sa ve  s p ace  w hile  sto r ing   it em set s.  Wh e s upport  of   it em chan ge ev e that t i m e also it  show e d g ood resu lt s.   Un il   a nd   Lee  [20],  w r ote  pap e on  "I ncre m ental   m ining   of   weig hted  m axi m al   fr equent  it e m set s   from   dyna m ic   databases” dis cusse how  to   m ine  m axi m a fr eq uen it em set by  con si de rin it e m   wei gh ts Dep e nds  on  it e m set   weigh ts,   tho se   set wit m axi m u m   weigh will   be  ta ken  first  as   m os fr equ e n it e m s.   Deng  [11],   F ast   m ining   fr e qu e nt  it em set s   us in N o de set s”,  de fine a   ne data  str uctur nam ed  no de set It   stores  t he  it e m s infor m at ion  in  tree str uctu re s eit her  pre  ord er or  post o r de of their a rr i va l i each tra ns a ct ion Ther e   after   ap plied  m ining  al gorithm   on   that  tree  to  m i ne  fa st.  T hey  pro ved   t heir   pro posal   incre as es  the   m ining   sp ee a nd   acc ur acy .   Y ao  an Ham il t on   [21],  in  thei arti cl “M ining   it em set   uti liti es  fr om   transacti on  Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   24 , N o.   2 N ove m ber  2 02 1 108 4   -   10 9 0   1086   databases” m e ntion e util it for  each  it em   and   dep e nds  on   it em   utilit m ining   of  it em se ts  and   r ules  was  done.   Item with  highest  util it will   be  pr e ferred  as  m axim u m   pr iority   and   it   will   be   con si der e as   first   it e m set .   Ba gu i   a nd  St anley   [ 22 ] i their  researc arti cl “M inin fr e qu e nt   it e m set fr om   strea m ing  transacti on  data  us in ge netic   al gorithm s”,  con si der e st rea m ing   da ta   a input  to   m ine  and  ge ne rate  f re qu e nt   it e m set s.  Stream ing   data  [ 23] ,   [24]  m eans  wh e re  data  in  and   out  ta kes  place  on  pa r ti cular  databa s e.  It  is   su bject e to  co ntinuo us   cha nges  res pect  to  tim e.  So   these  kinds  of  datase ts  wer ve ry  diff ic ult  to  m ine.  T he  auth or s   pr oj ect ed  ge netic   al gorithm   wh ic acce pts  data  i sli di ng  wi ndow  f or m at   as  input  a nd  use dr ift   con ce pt to  p ic k fr e quent it em s   Chiu  et   al .   [12 ] “In c rem enta m ining   of  cl os e inter - tran sact ion   it em sets  ov e data  str ea m   sli din windows”,   a ppl ie novel  m echan ism   to  fi nd  cl os e it e m set s.  T hey  al so  co ns ide re str ea m ing   data  to   m ine.   Fr om   that  they   first  m ine  sli di ng   wind ow  in form ation   a fter   that  sli de   will   m ov to  nex pa rt  of  dataset Th os e   it e m wh ic a r ver cl os re la ti on   to  f ulfill   stron g   ass ocia ti on   wer give highest  pri or it in  m ining They   pro ved it  is b et te ap plica ble  f or stream ing  dat a.   Vige et   al .   [ 25] “F HM+:   fa ste hi gh   util it it e m set   m ini ng  us i ng  le ngth  upper - bound  reducti on”,   discusse high   util it m ining .   They  def in ed  FH M+   al go rith m   fo fast  m ini ng  de pe nd s   on  it e m util i ty Wh il e   ta kin g i te m s u t il ities , also   fo c us e d on up per   bound o al l t ra ns act io ns  to  r e du ce  in fr e qu e nt  it e m s.   Deng   a nd  Lv   [26],  ti tl ed  “PreP os t + A eff ic ie nt  N - li sts - base al gorithm   fo m ining   fr e quent   it e m set s   via  C hildr e n Pare nt   Equ iv al ence  pru ning”,  w r ote  an  al go rithm   nam ed  Pr ePos t fo ef fici ent  m inin process tree   was  generate with  le ft  and   r igh child ’s  by  m ake  us of   N - li st  as  anetwork   [ 27] an ap plied   pru ning  at   le ft  par a nd   rig ht   par of   t he  tre ref e rr e as  e qu i valence  pru ning.  It  pro ve m or ef fici ent  than   existi ng appr oa ches.     Han   et   al .   [ 28 ] “M ining   fr e qu e nt  patte r ns  without  cand i date  gen e rati on:  a   fr eq ue nt - patte rn   tree   appr oach is  gen e ral  ap proach   for  m ining   freq ue nt  it em s.  It  do esn’ gen e rates  can di date  key  for  e ach  1 - it e m 2 -   it em se ts.  It  st or es   sup port  c ount o a ll   it e m in  ta ble  an ge ner at ed  a fp - tree w her e   each   no de   li nk s   with  res pecte it e m [2 9].  Daw ar  da G oya   [30],  “UP  -   Hist  tree:   An   eff i ci ent  data  struc ture  f or   m ining  hig util it patte rn from   transacti on   data bases”,  de rive no vel  tree  struct ur nam ed  UP - Hist  tree.  It  m ai ntain a   histo gr am   of   e ach  tra ns act io nal  it em and   associ at it   wi th  eac node  of  the  t ree.  T he  histo gr am   al lows  cal culat ion   of  enh a nce e ff ic acy  estim at es f or ef fectual  prun i ng of t he  se arch space .   Tsen et   al .   [31],  “Ef fici ent  al gorithm s   fo m ining   high  util it ite m set fr om   transacti onal   databases” im plem ent ed  UP - Grow t an U P - G r ow t h+  al gorithm fo m i ning  high  util ity  it e m set s.  At  each   sta ge  pr un i ng  was  done  t fil te irrele van it e m and   l ow  ut il i ty   it e m s   [3 2] Po st diff set   a lgorit hm   [3 3]  in  ra re   patte rn   re duces  can did at es c ount a nd c onsum ed  le ss ti m e f or lo ng transa c ti on al  d at a base s .       2.   PROP OSE D MET HO DOL OGY   Scan ning  th da ta base  is  not  m uch   com plex  w hen  volum of  data  is  fi xe bu w hen  it   is  grad ually   increasin the it ’s  diff ic ult  to  m ine.  In   this   reg a rd   it   is  ne eded   t hat  to  up date  curre nt  da ta structu re  with  ne data  with ou proces sin from   scratch.  T ac hieve  this  it   is  m and at ory   to  def i ne  an co nst ru ct   datast r uctu re   wh ic nee ds   one  scan  f or   dynam ic  m ining More ov e the  dataset   sh ould  be  sorte in  an   a pp r opriat order   t fasten  the  proc ess  an rem oves  barrier  on   s earchi ng   for  ra ndom   it e m s.  To  co nque the  m entioned   pro blem a   nodeset  str uctu re  was  s uggest ed.   T he  nodes e req uire ei ther  pr e o r der  o post  orde of  n odes  in  the  tree .   Her e   pr e orde r was t aken   f or im ple m entat ion  s it  is re qu i red to  gen e rate P OC t ree.    Along  with  no deset,  FIN  al gorithm   us ed  to  disco ver   fr e qu ent  it e m fr om  scratch.  It  was   achieve by  sel ect ing   node   by  node  in  se enu m erati on   tree,  an al so   avo i ds   re petit ive  searc by  usi ng   pru ni ng  at   each  node.   By   consi der i ng   pre  ord er  on ly   it   is  po ssible  to  sel ect   fr e qu e nt  it e m by  le vel  wise  fr om   tree.  To  achiev e   desire dynam ic   it e m set   m ining   t he  PO t ree  needs  dynam ic   updations  incessa ntly   f or  each   ne wly  ad de record It  is  do ne  by  m ai ntainin dataset   that  store each   and   e ve ry  transacti on  inf or m at ion   and   c al le as   In c rem ental  p r e orde red co de d ( IPOC )   tree.   The  ste ps   fo ll owed  in ge ner at ion   of  dynam ic  it e m s et s b y ad diti on   of  new da ta  are:   Inp ut :   datase t D .     Gen e rate a  nor m al   pr order e c od e d ( P OC )   tree f or  D .     Appe nd n e w d at a d 1 t o o rigina l data D .     Gen e rate I PO C  tree fo e xisti ng a nd n e w data   (lin k   new it e m s info wit e xis ti ng   nodes ) .     Apply FIM  alg or it hm s o n u pd at ed  data  to  m i ne fre qu e nt it e m se ts.     If   ne w data  d2 a dd e t hen re pe at  step  a nd  to  g et   update it em s .   Ou tp ut:   F re quent it em se ts for  dynam ic  d at a .   Co ns ide a  d a ta set  D , give as sho wn  in  T a ble 3 :     Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       IPO C : an ef fi ci ent appro ac f or   dy namic  as s ociatio r ule  ge ner ation  us i ng inc reme nta l …  ( P. Na res h )   1087   Table  3 .   T ra nsa ct ion   database  w it h o rd e red it e m s o m in_ s up  2   Tr an sactio n  I D   Ite m s   Ordered I te m s   T20 0   I1,I6,I7   I1,I6   T20 1   I1,I2,I3, I5   I2,I3,I5, I1   T20 2   I2,I3,I5, I9   I2,I3,I5   T20 3   I2,I3,I5, I8   I2,I3,I5,   T20 4   I2,I3,I4, I5,I6   I2,I3,I5, I6       This  T able  c on ta in trans ac ti on   id’ s,  it em resp ect   to  ea ch  tran sact ion   and   orde red   it e m der ive by  a pp ly in m i n_ s uppo rt( 2) .   I 4 I 7,   I 8   a nd  I are  el i m inate f or m   order e it e m li st  becau se,   their   s upport  is   le ss  than   m in_ su pp or t.   By   usi ng   t he  rest  or  it e m PO tr ee  is  goin to   be  gen e rated   a sho wn  i Fi gure  1.   So  i n nex ste p, ge ne rate a P O C t ree for gi ve n data D .           Figure  1.   P OC  t ree       ne data  d1   is  add ed  to  D ,   and   the the  P OC  will   becom IP OC  by  m aking   up date.   Af te a dd i ng  new  dataset   d1  to  D   in  Ta ble  4,   s om it e m su pp or sat isfie the  m in_ sup   crit eria.  S I and  I will   be  adde to  existi ng   tree   and   al so   ne fr e qu e nt  it e m will   be  gen e rat ed  inclu ding  ne data.  Dep e nd on  the  f requenc y   count  of   eac it e m   the  it e m s   order   will   change  in  orde red   it e m li st.  So   it  is  no need e to  m ine  fr om   sc ratc h   (ex ist in data).   In ste a of   t hat  new  it e m count  is  update i tree  str uct ur e by  seei ng  c ou nt  it   is  easy   to  m ine  fr e qu e nt it em s.  Th e  foll ow i ng tree  descr i bes t he  I PO struc ture.       Table  4 Orde r ed  it em s o ori gin al   (D) a nd new tra ns act io n database  (d1)     Tr an sactio n  I D   Ite m s   Ordered I te m s   Origin al Data   -   D   T20 0   I1,I6,I7   I1,I6,I7   T20 1   I2,I3,I5   I2,I3,I5   T20 2   I2,I3,I5, I9   I2,I3,I5   T20 3   I2,I3,I5, I8   I2,I3,I5, I8   T20 4   I2,I3,I4, I5,I6   I2,I3,I5, I6   New data  -   d1   T20 5   I1,I6,I7, I8   I1,I6,I8, I7   T20 6   I1,I2,I3, I8   I2,I3,I1, I8   T20 7   I1   I1       In  the  Fi gure 2,  root nod e is e m pt y no de  a nd h ad  chil d’ s . Each  nod repre sents one item   li ke  I1 , I2   al ong  with  it fr eq ue ncy  coun t.  Ou tsi de  the  e ach  node  the  it e m pr eo rd e is  rep r esente d.   I sh ows  the  or der   in   wh ic al the  t ran sact io nal  it em s   wer m ined  to  obta in  f re qu e nt  it e m s.  Fo rm   the  ob ta in ed  it e m s,  it   is  need e to  dr a valid  a sso ci at ion   r ules  wh ic gi ve  r el at ion sh i am ong  al it e m a nd   te ll the  an al yst   wh ic it em s   are   m os fr equ e nt.   By   us ing   IPOC  tree  str uctur e m or tim need e for  m ining   will   s ave  an m ining   fast,   eff ic ie ncy is i m pr ov e d.   T hes e are t he  m os t fr e qu e nt ass oci at ion   ru le dra wn from  D  a nd d1 wit h 4 item s :   {I1 I6 I8 I7 } , {I2 I3 I5 I 8}, {I 2 I3 I5 I 6}  a nd { I2 I3 I1 I 8}   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   24 , N o.   2 N ove m ber  2 02 1 108 4   -   10 9 0   1088       Fig ure  2.  IPOC  tree  f or  old   da ta  ( D a nd n e w  d at (d1)       3.   RESU LT S  AND DI SCUS S ION   Ex per im ental   backg rou nd :   Pyt hon  3.6 .4   was  use for   i m ple m entin the  need e al go rit hm s.    The  j upyt er  la us ed   as  inte grat ed  devel op m ent  env i ronm ent  (I DE )   wh e r source  co de  i wr it te an s uitable   dataset s w e re uplo a ded. T he  da ta set m ay  f ilt ered  t gi ve  m or e e ff ic ie nt in form ation , a nd h ere it  is possi ble t analy ze  the  da ta set and   outc om es  by  m eans  of  grap hs   a nd  scat te plo ts.   To  ac hieve  t hi it   is  m and at or t us buil t - in li braries  w hich  s uppo rt addit ion a l functi onal it ies.   Dataset us e d:   To  a naly ze  an disco ver   t he  fr e qu e nt  it em s   so m sta nd ar dataset we r nee ded.  I this  im ple m ent at ion   m us hro om con nect,   ch ess  an onli ne   retai dataset wer e   use d.   M ush r oom conne ct   an chess  da ta set wer do wn l oa ded   f r om   fr equent  it e m set  m i ning  i m ple m entat ion ( F IMI )   re posit ory   and   on li ne   retai dataset   was  ta ke fro m   UCI  m achine  le ar ning  re po sit or [ 34] The  fo ll owin T able  disp l ay the  dataset with  their  instance s,   at tribu te s,   siz and   no  of  it e m pr esent.  All  the  dataset wer tran sac ti on al   dataset m or su it able  f or  m i ning  of   fr e que nt  it e m s.   Table   6,   il lust rates  the  c om par at ive  stud (stat ist ic s)  of   existi ng and  propose al gorithm s b y m eans o f  tim e and  m em oy co ns u m ption s  for dif fer e nt d at aset s.       Table  5 Datas et s d esc riptio n   Dataset   No  of  I n stan ces   No  of  Attr ib u tes   Size   Ite m s   Ch ess   3196   36   3 4 9 KB   76   Mus h roo m   8124   22   3 6 5 KB   119   Co n n ect   6 7 5 5 7   42   5 8 2 9 KB   129   On lin e   Retail   5 4 1 9 0 9   8   2 3 1 6 0 KB   2603       Table  6 C om par iso n of al l d a ta set s   Alg o rith m /Dataset   Mus h roo m   Co n n ect   Ch ess   On lin e r etail   Ti m e   (sec)   Me m o r y   (M B)   Ti m e   (sec)   Me m o r y   (M B)   Ti m e   (sec)   Me m o r y   (M B)   Ti m e   (sec)   Me m o r y   (M B)   FP   0 .45   2 7 .29   1 9 .89   4 7 .85   0 .27   1 7 .95   5 6 .29   7 6 .25   sPOC   0 .77   1 9 .29   2 0 .47   4 4 .28   0 .36   1 5 .46   5 8 .65   7 4 .62   IPOC   ( Prop o sed )   2 .24   1 8 .87   2 1 .21   5 3 .49   0 .48   1 5 .93   6 1 .87   8 3 .54       The  F ig ur il lustrate tim t aken   by  FP,   P OC,  PPC  an I PO al gorithm fo m us hro om   dataset in  3( a a nd   c onne ct   dataset   in  3( b) The  IPOC  sh owe bette pe rfor m ance  whil m ining   fr e quent  it e m s.   Figu re 4   il lustrate tim e   ta ken   by  FP,   PO C,  PPC  a nd  IP OC  al gorith m s   fo ches da ta set in  4( a)  and   retai dataset   in   4(b) . T he IP O C sh ow e d bett er  perform ance whil e m ining f reque nt it e m s.       Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       IPO C : an ef fi ci ent appro ac f or   dy namic  as s ociatio r ule  ge ner ation  us i ng inc reme nta l …  ( P. Na res h )   1089       (a)   (b)     Figure  3.  Tim e   com par iso ns   of  dataset s ;   (a)  m us hr oom  ( b)   connect  d at aset s           (a)   (b)     Figure  4.  Tim e  co m par iso ns   of  dataset s ;   (a) c hess ( b ) o nline  retai l   dataset s       4.   CONCL US I O N   I n   t h i s   p a p e r ,   f i n d i n g   f r e q u e n t   i t e m s e t s   a n d   a s s o c i a t i o n   r u l e   m i n i n g   f o r   v a r i o u s   d a t a s e t s   w e r e   a n a l y z e d .   W h i l e   w o r k i n g   w i t h   s t a t i c   d a t s s e t s   t h e r e   i s   n o   i s s u e s   i n   c o m p l e x i t y   i n   m i n i n g   a n d   t i m e   c o n s u m p t i o n .   W h e n   d e a l i n g   w i t h   d y n a m i c   d a t s e t s   i t   i s   s u b j e c t   t o   c o n t i n u o u s   u p d a t e s   a n d   m i n i n g   b e c o m e   d i f f i c u l t   a s   d a t a s e t   v a r i e s   i n   s i z e   a n d   t r a n s a c t i o n   c o u n t .   S o m e   p r e v i o u s   a l g o r i t h m s   r e f e r r e d   i n   s u r v e y   w e r e   u n a w a r e   o f   d y n a m i c   d a t a   h a n d l i n g   a n d   s o m e   w e r e  d o i n g  u n w a n t e d   t a s k s  w h i c h  d e t e r i o r a t e   t h e   m i n i n g  p r o c e s s  b y  w a s t i n g   t i m e .   S o   t h o s e  i s s u e s  w e r e  h a n d l e d   i n   t h i s  p a p e r  b y   a d o p t i n g   t r e e  s t r u c t u r e s   a n d  F I M  a l g o r i t h m s  w h i c h   i n t e r n s   e n h a n c e d   t o  w o r k  w i t h  d y n a m i c   d a t a b a s e .   P r o p o s e d   I P O C   t r e e   w i t h   n o d e s e t   c o n s i d e r s   p r e o r d e r   o f   a l l   t r a n s a c t i o n a l   i t e m s   a n d   i n c r e m e n t a l l y   u p d a t e   t h e   t r e e   w h e n e v e r   n e w   d a t a i t e m s   w e r e   a d d e d .   F I N   a l g o r i t h m   p a r a l l e l l y   a n d   c o n t i n u o u s l y   w o r k s   o n   t r e e   t o   m i n e   f r e q u e n t   i t e m s   a n d   r e d u c e   n u m b e r   o f   c a n d i d a t e s   i n   t h e   p r o c e s s   o f   c o n s t r u c t i n g   t r e e s .   F o u r   d a t a   s e t s   w e r e   c o n s i d e r e d   t o   a n a l y z e   t i m e   a n d   m e m o r y   p a r a m e t e r s   o f   e x i s t i n g   a n d   p r o p o s e d .   T h e   p r o p o s e d   a p p r o a c h   p r o v e d   r e d u c e d   t i m e   c o n s u m p t i o n ,   t o o k   l e s s   m e m o r y   a n d   e f f i c i e n t   f o r   d y n a m i c   d a t a s e t s .       REFERE NCE S   [1]   J.  Sun,  Y.  Xun,  J.  Zha ng,   and  J.  Li ,   Inc remen ta l   Freque nt  Ite m se ts  Miningwit FC FP   Tre e , ”  IE E Ac c ess vol.   7 ,   pp.   136511 - 136 524,   20 19 ,   doi 1 0. 1109/ACCESS . 2019. 2943015 .   [2]   P.  S.  Yu,   and   Y.   Chi,   " As socia t i on  Rule   Mining   o Strea m s,"   In:   LIU   L.,   ÖZ SU  M. T ,   Boston,   MA ,   2009.   [Onl in e] .   Avail ab le :   htt ps: // li nk . springer . c om /re fer en ce wo rke ntr y /10 . 1007 %2F978 - 0 - 387 - 39940 - 9_25   [3]   T.   L.   Dam ,   H.  Ramam pia ro,   K.  Nørvåg,   and  Q.  H.  Duong Tow ard eff ic i ent l y   m ini ng  cl osed  high  uti li t y   i te m set s   from   inc rement a da ta base s ,   Kn owle dge - Based Syste ms vol .   16 5 ,   2019 ,   doi :   10 . 1016/j . knos y s . 2 018. 11. 019 .   [4]   U.  Yun,  and  H.  R y ang Inc re m ent al   high  util ity   p at t ern   m ining  wi th  stat ic   a nd  d y namic  da t aba ses,”   Appl i e d   int ellige n ce ,   vo l.  42,   pp.   323 - 352 2015 ,   doi 10 . 1 007/s10489 - 014 - 0601 - 6.   [5]   V .   G o ya l ,   S .   D a w a r ,   a n d   A .   S u r e k a ,   H i g h   u t i l i t r a r e   i t e m s e t   m i n i n g   o v e r   t r a n s a c t i o n   d a t a b a s e s ,   In   I n t e r n a t i o n a W o r k s h o p   o n   D a t a b a s e s   i n   N e t w o r k e d   I n f o r m a t i o n   S y s t e m s ,   p p .   2 7 - 40 ,   2 0 1 5 ,   d o i :   1 0 . 1 0 0 7 % 2 F 9 7 8 - 3 - 319 - 1 6 3 1 3 - 0_3 .   [6]   G.  Li u,   H.  Lu,  J.   X.  Yu,  W .   W ei ,   and  X.  Xiao,   AF OP T:   An  Eff ic ie n Im ple m ent at ion  of  Patt ern   Grow th   Approac h,   In   P roc.   IE EE ICDM  Workshop F req uent   I te ms et Mi n ing  Imple men tat i ons ,   vol. 80, No v.   2003 .   [7]   M.  Man,   A.  J.   Julai l y ,   S.   I.  A.  Sa an y ,   W .   A.  W .   A.  Bak ar,  and   M.  H.  Ibra him,   Anal y s is  stud y   on   R - Ec l at   al gori th in  infre qu ent   ite m sets  m ini ng,   Inte rnational   Jo urnal  of  Elec tri cal   and  Comput er  Engi ne ering  ( IJE CE) ,   vol.   9 ,     no.   6 ,   pp .   5446 - 5453,   2019 ,   doi :   10. 11591/ijece. v 9i6. pp5446 - 545 3.   [8]   W .   Gan,   J.  C .   W .   Li n ,   P.   Fournie r - Viger ,   H .   C.   Chao,   and  S.  Y.   Phili p HU OPM:  High - Util i t y   Oc cupa nc y   P at t ern   Mining,   IE EE   Tr ansacti ons on Cyb erne t ic s vol. 50, no. 3, 2020,  doi:   10 . 1109/T C YB.2019. 28962 67.   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   24 , N o.   2 N ove m ber  2 02 1 108 4   -   10 9 0   1090   [9]   H.  Qiu,   R .   Gu,   C.   Yuan,  and  Y .   Huang,   YA FIM A   par alle fr eque nt  item set  m ini ng  al gori th m   with  spark,   I n :   IEE E   internati onal  parallel   distribut ed   proce ss ing  sympos ium  workshops ,   p p 1 664 - 16 71 201 4,   doi:   10 . 1109/IP DP S W . 2014. 185.   [10]   L.   K.  Ramasam y ,   S.  Kadr y ,   Y.  Nam ,   and  M.  N.   Meqda d, Perform anc ana l y si of  senti m ent in  T witt er  datase using  SV m o del s,”   In te rnatio nal  Journal  of  El e ct rica and  Comp ute Enginee ring  ( IJE CE ) ,   vol.   1 1 ,   no .   3,     pp.   2275 - 2284 ,   2021 ,   doi :   10 . 11 591/i jece . v11i3 . pp2275 - 2284.   [11]   Z.   H.  Deng ,   an S.  L.   Lv ,   Fa st  m ini ng  fre qu ent   i te m sets  using  Nodeset s ,”   E xpe rt  Syst .   App l . ,   vol .   41 ,   no.   10 ,     pp.   4505 - 4512 ,   2014,   doi 10 . 10 16/j . eswa. 2014. 0 1. 025.   [12]   S .   C .   C h i u ,   H .   F .   L i ,   J .   L .   H u a n g ,   a n d   H .   H .   Y o u ,   I n c r e m e n t a l   m i n i n g   o f   c l o s e d   i n t e r - t r a n s a c t i o n   i t e m s e t s   o v e r   d a t a   s t r e a m   s l i d i n g   w i n d o w s ,   J o u r n a l   o f   I n f o r m a t i o n   S c i e n c e ,   v o l .   37 ,   n o .   2 ,   p p .   208 - 220 ,   2 0 1 1   d o i :   1 0 . 1 1 7 7 / 0 1 6 5 5 5 1 5 1 1 4 0 1 5 3 9 .   [13]   Z H .   Deng,   DiffNodeset s:  An  eff ic i ent   struc t ure   for  fast  m ini ng  fre quent   it e m sets,   Appl i ed   Soft   Computin g ,     vol.   41 ,   pp .   214 - 223,   2016 ,   doi 1 0. 1016/j.a soc . 20 16. 01. 010 .   [14]   Y.  Li ,   Z. - H .   Zh a ng,   W . - B.   Chen ,   and  F.  Min,  T DU P:  an  appr oa ch  to  in cre m enta m ini ng  of  fre q uent   item sets  wit h   thre e - wa y - d ecisi on  pat te rn  upd ating , ”  In te rnatio nal  Journal  of  Mac hine   Learni ng  and  Cybe rne ti cs ,   vol .   8,   no .   2,   pp.   441 - 453 ,   20 15,   doi 10 . 1007 /s13042 - 015 - 0337 - 6 .   [15]   T.   P.  Hong,   C . W .   Li n,   and   Y.   L.   W u,   Inc re m ent al l y   f ast  up dat ed  f r eque n pat t ern   trees,”   E xpe rt  syt ems  wit h   Appl ic a ti ons ,   vo l.   34 ,   no .   4 ,   pp .   2 424 - 2435,   2008 ,   doi: 10. 1016 /j . e sw a. 2007. 04. 009 .   [16]   K.  R.   Prasad ,   O pti m iz ed  High - U ti lit y   I te m sets  Mining  f or  Eff ecti ve  As socia ti on  Mining,   Int ernati onal  Journal  of  El e ct rica l   and   C omputer  Engi n e ering  ( IJE CE) ,   v ol.   7 ,   no .   5 ,   pp .   2 911 - 2918,   doi 1 0. 11591/i j ece. v7 i5. pp2911 - 2918.   [17]   C.   W .   Li n ,   T.   P. H ong,   G.  C.   L an ,   J.  W .   W ong,   an W . - Y.  Li n,   In cre m ent a lly   m ining high  uti l ity   p at t ern s ba sed  on  pre - la rg e concep t,   Applied   Int el l ige nc e ,   vol. 40,  no.   2 ,   pp .   343 - 3 57,   2014 ,   doi 10 . 1007/s10489 - 01 3 - 0467 - z .   [18]   M .   Shapol,   J.  Karwan,   and  Z .   Subhi,   stat e - of - the - ar surve y   on  sem ant ic   sim il arit y   for  docu m ent   cl usteri ng   using  GloV and  density - base al gorit hm s,”   Ind onesian  Journal   of  E lectric a En gine ering  and  C omputer  Sci en ce ,   vol.   22 ,   no .   1 ,   pp .   552 - 562 ,   2014 ,   doi:   10. 11591 /i j ee cs. v22 . i1 . pp55 2 - 562.   [19]   M.  Mahm ood,   B .   Al - Khateeb,   an W .   M.  Alwash ,   rev ie on  n eur al   ne tworks  appr oac on  cl ass i f y ing  ca n ce rs,   Inte rnational   Jo urnal  of  Arti f ic ia Int el l ige nc e ,   vo l.   9 ,   no .   2 ,   pp .   31 7 - 326,   2020 ,   doi :   10. 11591 /i j ai.v 9. i2. pp317 - 326 .   [20]   Y.  Unil,   and   G.  Le e ,   Inc r ement al   m ini ng   of  we i ghte m axi m al  f req uent  item sets  from   d y namic   d at ab ase s ,”   Ex p er t   Syste ms   wit h   Ap pli cations , vol .   5 4,   pp .   304 - 327 ,   2016 ,   doi 10 . 10 16/j . eswa. 2016. 0 1. 049.   [21]   H.  Yao  and  H.  J.  Ham il ton,   Mining  it ems et   uti liti es  from  tra nsac t ion  da ta base s, ”  Data  and  Knowle dg e   Engi ne ering ,   v ol .   59 ,   no .   3 ,   pp .   6 03 - 626,   2006 ,   d oi:   10. 1016/j.da t ak. 2005. 10 . 004 .   [22]   S.  Bagui ,   and  P.  St anl e y ,   Mini ng  fre quent   it e m sets  fro m   stre aming  tra nsac t io dat using  gene tic  al gori thms,”   Journal  of   Bi g   D ata ,   vo l.  7,   no.   54 ,   2020 doi 10 . 1186/s40537 - 020 - 00330 - 9.   [23]   F.  Nori,   M.   De ypir,   and  M.  H.   Sadre ddin i,   sli ding - window  ba sed  al gori thm  for  fre quen c lose i te m set  m ini n over   da ta stream s,”   Journal   of   Sy stems and  Soft w are ,   vol .   86 ,   no .   3 ,   2013 ,   doi 10 . 1016/j . jss.2012 . 10. 011 .   [24]   H.  R y ang ,   and  U.  Yun,  High  uti lit y   p at t ern   m ini ng  over   data  strea m with  slidi ng  window  te chni que ,   E xpe r Syste ms   wit h   Ap pli cations,   vo l. 5 7,   pp .   214 - 231 ,   2016,   doi 10 . 10 16/j . eswa. 2016. 0 3. 001 .   [25]   P.  Fournier - Vig er,   J.   C. - W .   L in,  Q. - H.  Duong,  T . - L.  Dam ,   FHM+:   faste h igh  uti lit y   item set  m ini ng  using  l eng th  upper - bound  re duct ion ,   I n In te rnational   Con fe renc on  Ind ustrial,   Eng ine e ring  and  Other  Appl i cat ions  o f   Appl ie d   Int el l igent  Syst ems ,   2016 ,   pp .   115 - 127 ,   d oi:   10 . 1007/978 - 3 - 319 - 42007 - 3_11.   [26]   Z.   H .   Deng an S.  L .   Lv,   PrePos t+ An  eff i ci en N - li sts - bas ed  a lgori thm  fo m ini ng  fre qu e nt  item sets  vi a   Chil dre n Pa r ent  Equi va le nc pr uning,   Ex p ert  Syste ms   wit Ap pli cations ,   vol .   42,   no.   13 ,   pp.   5424 - 5432 ,   201 5 doi:   10 . 1016/j.e s wa. 2015. 03 . 004 .   [27]   A.  R.   Hakim ,   T.  Djat na ,   and   A.  Febra ns y ah ,   Technol og y   Map Te xt  Mining  and  Network   Ana l y sis  Approac h ,   Indone sian  Journal  of  El ectric al   Engi nee ring  an Computer  Sci enc e   ( IJE ECS) ,   vol.   3 ,   no.   1,   pp .   200 - 208 ,   2016,   doi:   10 . 11591/ij ee cs. v3 . i1 . pp200 - 208.   [28]   J .   H a n ,   J .   P e i ,   Y .   Y i n ,   a n d   R .   M a o ,   M i n i n g   F r e q u e n t   P a t t e r n s   w i t h o u t   C a n d i d a t e   G e n e r a t i o n :   A   F r e q u e n t - P a t t e r n   T r e e   A p p r o a c h ,   D a t a   M i n i n g   a n d   K n o w l e d g e   D i s c o v e r y v o l .   8 ,   2 0 0 4 ,   d o i :   1 0 . 1 0 2 3 / B : D A M I . 0 0 0 0 0 0 5 2 5 8 . 3 1 4 1 8 . 8 3 .   [29]   D.  S.  Ma y l awa ti ,   H.  Aulawi ,   and  M.  A.  Ramdhani,   Flexi bil ity   of  Indone s ia te x pre - pro ce ss ing  li bra r y ,   Indone sian  Journal  of  El ectric al   Engi nee ring  an Computer  Sci enc e   ( IJE ECS) ,   vol.   13,   no.   1,   pp.   420 - 426,   2019,   doi:   10 . 11591/ij ee cs. v13 . i1 . pp42 0 - 426.   [30]   S.  Dawar,   and   V.  Go y a ,   UP - His tre e An  eff ic i e nt  dat struc ture  for  m ini ng  high   uti li t y   pa tterns  from   tra nsac ti on   dat ab ase s,”   In  Proce ed ings  of  the   19 th  in te rn ati onal  da tabase  eng ine ering   &   a ppli cat ions  sympos ium ,   2015,     pp.   56 - 61 ,   doi :   1 0. 1145/2790755.2790771.   [31]   V.  S,  Tseng,   B. - E,  Shie ,   C. - W.   W u,   and  P.  S.   Yu,  Eff ic ie n al gorit hm for  m ini ng  high  uti l ity   item sets  from   tra nsac ti ona d ataba ses ,   IE EE   T rans act ions  on  Knowle dge   and  Data  Engi n ee rin g vol .   25 ,   n o .   8 ,   pp.   1772 - 1786,   2013 ,   doi 10 . 11 09/T KD E. 2012. 59 .   [32]   M.  Man,   W .   A.   W .   A .   Baka r,  M.  M.  A.   Jali l,   and   J.  A.   Jus oh,   Pos tdi ffse al gori thm  in  rar patter n An   implementa t ion   via   ben chmark  ca se  st ud y ,   Inte rnational   Jo urnal  of  El e ct r ic al  and  Comp ute Engi n ee rin g   ( IJE CE) ,   vol.  8 ,   no.   6 ,   pp .   4477 - 4485,   2018 ,   doi 10. 11591/ijece. v 8i6. pp. 4477 - 448 5.   [33]   M .   D e y p i r ,   M .   H .   S a d r e d d i n i ,   a n d   M .   T a r a h o m i ,   A n   e f f i c i e n t   s l i d i n g - w i n d o w   b a s e d   a l g o r i t h m   f o r   a d a p t i v e   f r e q u e n t   i t e m s e t   m i n i n g   o v e r   d a t a   s t r e a m s ,”   J o u r n a l   o f   I n f o r m a t i o n   S c i e n c e   a n d   E n g i n e e r i n g ,   v o l .   29 ,   n o .   5 ,   p p .   1 001 - 1 0 2 0 ,   2 0 1 3 .   [34]   M .   M a n ,   a n d   M .   A .   J a l i l ,   F r e q u e n t   i t e m s e t   m i n i n g :   t e c h n i q u e   t o   i m p r o v e   e c l a t   b a s e d   a l g o r i t h m ,”   I n t e r n a t i o n a l   J o u r n a l   o f   E l e c t r i c a l   a n d   C o m p u t e r   E n g i n e e r i n g   ( I J E C E ) ,   v o l .   9 ,   n o .   6 ,   p p .   5 4 7 1 - 5 4 7 8 ,   2 0 1 9 ,   d o i :   1 0 . 1 1 5 9 1 / i j e c e . v 9 i 6 . p p 5 4 7 1 - 5 4 7 8 .     Evaluation Warning : The document was created with Spire.PDF for Python.