T E L K O MN I K A  T el eco m m u n i ca t i o n ,  C o m p u t i n g ,  E l ect ro n i cs  a n d  C o n t ro l   Vo l . 19 ,  N o.   5 O ct o b er   2021 , p p 1553 ~ 1564   I S S N :  1693 - 6930,  a c c r e di t e d F i r s t  G r a de  by K e m e nr i s t e kdi kt i ,  D e c r e e  N o:  21/ E / K P T / 2018   D O I :  10. 12928/ T E L K O M N I K A . v19i 5. 19273     1553       Jou r n al  h om e page ht t p: / / j our nal . uad . ac . i d/ i nde x . php/ T E L K O M N I K A   A na l y s i s  o f  f r eq ue n t  i t em s e t  g ene ra t i o n ba s e o n t ri e   d at s t ru ct ur e i n A pri o ri  a l g o ri t h m       A d e  H od i j ah U ri p   Te g u h   S e ti jo h a tmo   I nf or m a tic s a nd C om p ute r  E ng ine e r in g,  P ol ite kn ik   Ne ge r i B a nd un g,   B a nd un g,   I nd one sia       A rt i cl e I n f o     AB S T RACT   A r tic le  h is to r y :   R ecei v ed   D e c  30,  2020   R ev i s ed   A pr  10,  2021   A ccep t ed   A pr  22,  2021       Apr ior i   is o ne  te c hn iq ue  of  da ta  m in in g a s soc ia t io n r ul e s tha t a im to e x tr a c t   c or r e la ti on s be twe e n se ts of   ite m s i n t he  tr a nsa c ti on  da ta b a se .  T he  m a i n   pr o ble m  wi th t he  Apr ior i a lgor it hm  is t he  pr oc e s s of  sc a nni ng da ta ba se s   r e pe a te dl y t ge ne r a te  i te m se t c a nd ida t e s.   Th is r e s e a r c h e xa m ine the   c om b ina ti on of   pr un in g by us in t he   tr ie a ppr oa c h a n m ul ti - t h r e a d   im pl e m e n ta t io n in thr e e  a l gor it hm s t o ob ta i n f r e que nt i te m se t.  Tr ie  is a  da ta   str u c t ur e  in the  f or m  of  a n or de r e d tr e e  to s tor e  a  se t o f  str in gs w he r e  e ve r y   no d e  in th e  tr e e  c on ta i ns t he  sa m e  pr e f i x.  The  use  of  a  f ul l c om b ina ti on  tr ie   (d i ffere n t   fro f r e q ue n pa t te r ( F P )   t r e e   us in g   link s)   a ll ow the   im pl e m e n ta t io n of  a r r a ys a nd  the   ha s h c a lc u la t io n t o a c hie ve  t he  a d dr e s si ng   of  ite m se t c om b ina ti on.  I n t hi s r e se a r c h,  the  m e a sur e   to ge t t he  a d dr e s s i s   c a lle d Ha s h - n ode  c a lc u la t io n use d to  up da te  s up por t v a lue .  F or  t he se  t hr e e   a lte r na t ive s,  r un tim e  pr oc e ss in g is a na l yz e d ba se d o n the  num be r  of  it e m se t   c om b ina ti on s a nd tr a n sa c ti on da ta  a t a  c e r ta i n m in im u m  supp or t va lue .   T h e xpe r im e n ta l r e s ul ts s ho w tha t a n a l gor it hm  tha t e x pl oi ts  r e sour c e  c a pa bi li tie s   by a p pl yi ng  m ul ti - t h r e a d pe r f or m s a lm o st se ve n t im e s b e tte r tha n a n a l gor it hm   im pl e m e n te d in s in gle - thr e a in c a lc ula ti ng ha sh - no de .  T he  f a ste s t r un t im e   of   the  m ul ti - thr e a d a p pr oa c h is   43 m in ute s wi th  15 0 - i te m se c om bi na t io ns  on   100, 00 0 tr a nsa c ti on da ta .   Ke y wo r d s :   A pr i or i   H a sh - n o d e cal cu l at i o n   L e ve l  pr uni ng   M u lti - t h r ead   T r i ed at a s t r u ct u r e   T his  is  a o pe ac c e s ar tic le   u nde the   CC  B Y - SA lic e ns e .     C or r e s pon di n g A u t h or :   A de  H odi j a h     I nf or m a t i c s  a nd C om put e r  E ngi ne e r i ng   P ol i t e kni k N e ge r i  B a ndung   B a ndung,   I ndone s i a   E ma il:  a de hodi j a h@ j t k . pol ba n. a c . i d       1.   I NT RO DUC T I O N   S ev er al   s tu d ie s  r e la te d  to  th e  a p p lic a tio n  o f   th e  a  p r io r i a lg o r ith m h a v e   be e n c a r r i e d out  i nc l udi ng  f or   cl i ck s t r eam  d at a an al y zi n g   [ 1] ,  r e a s ons  f i ndi ng   [2 ] ,  d is p la y  ite m  ma x im iz in g   [ 3] ,  oz one  pr o f i l i ng   [ 4] T h m a i n pr obl e m  o f  t he  A pr i or i  a l go r i t hm  l i e s   i n  t he  pr oc e s s  of  ge ne r a t i ng  i t e m s e t  c a ndi da t e s  t ha t  us e s  t he   r e pe t i t i on of  t he  da t a ba s e  s c a nni ng a s  m uc h ( 2 n - 1 )* (re a d  e x t e rn a l ) t i m e s  o (2 n - 1) *( m / b bl oc k  r e a d) ,  w he r e     k:  a  s um  of  t he  i t e m ,  m :  a  s um  of  a  da t a ba s e  r e c or d,  b:  bl oc k  s i z e ;  i n t he  c ont e xt  of  c a l c ul a t i ng  s uppor t     c ount   [ 5] .  I t  w oul d c a r r y out  a  da t a ba s e  s c a nni ng a s   102410 t i m e s  f or  t he  s a l e  of  100 i t e m s .  A n a l t e r na t i ve  t ove r c om e  t he  p r obl e m  i s  t o a voi d  t he  da t a ba s e  s c a nni ng r e pe a t e dl y,  but  onl y onc e  i t he  pr oc e s s  of   upda t i ng  t he  s uppor t  c ount  ( f o r  a l l  ne w  t r a ns a c t i ons  t ha t  oc c ur  i n  a  s pe c i f i c  pe r i od ) .  U s i ng a  l i n ear  l i s t  h e r e u s i n g  a  tr ie   da t a  s t r uc t ur e  i s  t o  a c c om m oda t e  t he  da t a ba s e  s c a n ni ng t o onl y  be  done  onc e  or   ( m / b) .   T hi s  r e s e a r c h's  ba c kgr ound  i s  t ha t  t he r e  i s  s t i l l  r oo m  f o r  de ve l opi ng p r obl e m - s ol vi ng t o  ge t  f r e que nt   i t e m s e t  by c om bi ni ng m e t hods  f r om  t he  p r e vi ous   s t udy a nd e xpl oi t i ng c om put i ng  r e s our c e s .  T he  p r obl e m  of   Evaluation Warning : The document was created with Spire.PDF for Python.
      I SSN : 1693 - 6930   T E L KOM NI KA T el eco m m u n   C om put  E l  C ont r ol Vo l .   19 , N o 5 O c t obe r  2021:   1553  -   1563   1554   g e ttin g  a  f r e q u e n t ite ms e t w a s  f ir s t p r e s e n te d  a [ 5] ,  w hi c i s  c ons i de r e d one  of  t he  m os t  i m por t a nt   c ont r i but i ons  t o t he  s ubj e c t  w he r e  a n a l go r i t hm   c a l l e d A pr i or i  gr e a t l y  i nf l ue nc e s  t he  c om m u ni t y  of  da t a   m i ni ng a s s oc i a t i on r ul e s .  M a ny  r e s ul t s  of  A pr i o r i - b as ed  m o d i f i cat i o n  r es ear ch  h av e  em er g ed  ( e. g . ,   p r io r ity   m ode l i ng ite r a tio n   r e duc t i on w o lf   s ear ch i n g ,   r e d uc t i on  i n  s c a nni ng t r a ns a c t i on )   b [ 6] - [ 9] a nd  i n   [ 10]  t h tr ie d a ta  s tr u c tu r e  is  u s e d  b e c a u s e  it c o n s u me s  le s s  me mo r y  th a n  a  lin e a r  lis t .  A f te r  a ll ,  th e  s a me  in f o r ma tio n  is   s t or e d onc e .  F or  e xa m pl e ,  t he r e  a r e  100 t r a ns a c t i ons  t ha t  one  i t e m  i s  i n a l l  de a l i ngs ;   s t or a ge  of  one  i t e m  i s   onl y us e d onc e .   Wh er eas  i n  a  l i n ear  l i s t ,  t h e  i t em  i s  s t o r ed  o n e f o r  each  t r an s act i o n .   T he  s t udy   [ 1 0]   pr opos e d a n  a l gor i t h m  f or   f i ndi ng  a s s oc i a t i on r ul e s ,  na m e l y  a  pr i or i  a l gor i t hm  t ha t   ha s  be e n de ve l ope d us i ng t he  t r i e  da t a  s t r uc t u r e  s t or e d i n  a n a r r a y.  E a c h  e dge  i n  t he   t r e e  c ont a i ns  a  l a be l  a nd  l i nks  t o c hi l d node s .  E a c h node  c ont a i ns  t he  i t e m s e t  f r e que nc y w i t h t he  e dge  be i ng a  m e m be r  of  t ha t  i t e m s e t .   I t e m s e t  m e m be r s  c ons i s t  of  a  s e t  of  e dge s  f r om   pa t h node  l e ve l  1  t o t he  de s i gna t e d node .  T he  r oot  node   c ont a i ns   t h v al u e 0  b ecau s e t h er e i s   no i t e m s e t  po i nt e d t o by t he  r oot  node .   T he  i t e m s e t  l e ngt h c a n be  s e e n a t   t he  de pt h  node .   Ot h e r wi s e ,  r es ear ch   [ 1 1]   pr e s e nt s   a  ne w  a ppr oa c h  i n  da t a  s e pa r a t i on by  m odi f yi ng  t he  na t i ve   a  pr i or i  a l gor i t hm  us i ng  a  t r e e - ba s e d a ppr oa c h.  T hi s  s t udy pr e s e nt s  a n a ppr oa c h t ha t  he l ps  f i nd i t e m s e t  t ha t   ap p ear s  f r eq u en t l y   w h i ch  w er e  co n s t r u c t e d by  f i ndi ng 1 - ite ms e t f i r s t .   H o w ev er ,  t h i s   r es ear ch  al s o  u s es   f r eq u en t  i t em s et  g en er at ed  m et h o d ,  but  i n  c ont r a s t  t o   [1 1 ],  w e  m o d i f i ed  t h e  n ex t  l ev el  as  can d i d at e  i t em s et   g e n e r a tio n  s te p  in  A p r io r i b a s e d  o n  f u lf illme n s ta tu s  o f  th e  la s t f r e q u e n t ite ms e t  c om bi na t i on  ( l e ve l - i) n am el y   l ev el   pr uni ng ,   s o t ha t  t he   tr i e   i s  u s ed  t o  s av e f r eq u en t  i t em s et  can d i d at es .   O t h er  t h an  t h at ,  w e cr eat ed   t h e f o r m u l a cal l ed  H as h - node  c a l c ul a t i on t o  ge t   a n i nde x of  t he  n - i t e m s e t  w he n a ddi ng  t he  s upp or t  c ount   va l ue  of  t ha t  f r e q u e n t ite ms e t,  o th e r w is e ,  th e y   [ 1 1 ]  bui l t   a t r e e a n d  a l l  o f  t h e n - ite ms e t c o mb in a tio n  u s in g  th e   1 - ite ms e t   a nd i t  s t i l l  ha s  t o go  t h r ough  s e ve r a l  nod e s  s t a r t i ng f r om  1 - ite ms e t to  n - i t em s et  w h i ch  s ear ch ed  f o r .   H ow e ve r ,  t he  us i ng of  a   t r e e - b as ed  d at a s t r u ct u r [ 10] [ 11]   s t i l l  us e l a r ge  m e m o r y by  s c a nni ng t he  t r e e   m an y  t i m es ,  s o  i t  n eed s  t o  cr eat e  a n a l gor i t hm  f or  f i ndi ng t he  node  or  i nde x of  t he  t r e e  t ha t  i n t hi s  r e s e a r c n am el y  H as h - node  c a l c ul a t i on a nd m i ni m i z e  t he  c os t  of  I / O  pr oc e s s  by us i ng  a  pa r a l l e l  a l gor i t hm   t h a t  i n  t hi s   r es ear ch  cal l ed  as  m u l t - t hr e a d s ol ut i on.   F r om  a not he r  pe r s pe c t i ve ,  i t  i s   c om m on t us e   mu lti - t h r ead   a nd c om put i ng  pow e r  w i t h m u l t i c or e   ar ch i t ect u r [ 12]   i n s uppor t i ng  da t a  pr oc e s s i ng.   T hi s  r a i s e s  t he  s us pi c i on t ha t   mu lti - t h r ead   i [ 13]   a nd  [ 14]   c a n pr oduc e  be t t e r  pe r f or m a nc e  a l s o i n ge t t i ng  t hi s  f r e que nt  i t e m s e t ,  a s  w e l l  a s  a  c ha l l e nge  on how  t d et er m i n e t h e  b es t  p e r f o r m an ce  p r o ces s  ar ch i t ect u r e   t ha t   i s  a ppl i e d t o w hi c h s ubpr oc e s s e s  a s  t hr e a d s   a nd how   bi g i s  t he  i nc r e a s e  f or  t he  be s t   mu lti - t h r ead   a r c hi t e c t ur e  i n a  s i ngl e  s e r ve r  e nvi r onm e nt ,  w he r e  a n e x pe r i m e nt   in  mu lti - node  s e r ve r  e nvi r onm e nt  w a s  pr opos e d by   [ 15] [ 16]   T he  p r oc e s s  of  c a l c ul a t i ng  t he  va l ue  o f  s uppor t  i n  t he  c a ndi da t e  s e t s   g en er at i o n   in  th is  p r o b le m  is  a   bot t l e ne c k pr oc e s s ,  be c a us e  t hi s  pr oc e s s  w i l l  c a us e  de l a ys  a nd que ue s  t o be  f or w a r de d  t o t he  ne x t  p r o c e ss.  I f   you onl y us e   a   s ta n d a r d  a  p r io r i a lg o r ith m  w ith   a   t r ie  d a ta  s tr u c tu r e  it  w ill s till  ta k e  a  lo n g   time .  T h e r e f o r e ,   th e   mu lti - t h r ead   c onc e pt  i s  a ppl i e d i n  t hi s  s t udy t o  m i ni m i z e  t he  t i m e   r e qui r e f or  pr oc e s s i ng t he  s uppor t   can d i d at e s et s . F or  t h e  t hr e a d m ode l ,  t hi s  r e s e a r c h a ppl i e s  t hr e a d i n e a c h s um  of  t r a ns a c t i on da t a  a nd not  i n   e a c h  ite ms e t c o mb in a tio n  lik e   [ 17]   a n d  imp le me n ts   mu lti - t h r ead   not  l i ke   [ 1 8] ,  w h i ch  ev al u at es  i n     s i ngl e - t h r ead ed  p er f o r m an ce.       2.   R ES EA R C H  M ETH O D   T h e r es ear ch  co n d u ct ed  i s   q u an t i t at i v e  r es ear ch  u s i n g  ex p er i m en t al  r es ear ch  t ech n i q u es .   T h e   e xpe r i m e nt  i s  di vi de d i nt o t w o t ype s ,  na m e l s in g le - t hr e a d a nd  mu lti - t h r ead   p r o ces s es .  T h e p r o ces s i n g  t i m r un by e a c h m e t hod i s  c om pa r e d  t o be  a na l yz e d  i n t e r m s  o f  s pe e d e f f i c i e nc y f o r  a ddi ng t he  va l u e  of  t he   s uppor t   c ount   c a ndi da t e  s e t .  T he  p r oc e s s i ng t i m e  de t e r m i ne s  t he  qua l i t y of  t he  m e t hod de s i gne d a s  w e l l  a s  t he   qua l i t y of  t he  e f f i c i e nc y of  t he  t h r e a d us e d w i t h a  da t a  s t r uc t ur e  t ha t  ha s  be e n s pe c i a l l y de s i gne d by  a ppl yi ng  t h tr ie co n cep t.   T he  num be r  of  t r a ns a c t i ons  t ha t   c o n si st  d a t a se t   fo r t h e   e xpe r i m e nt  i s  100, 000 t r a ns a c t i ons  a nd 5 t 150 i t e m  va r i a nt s . T h e d at as et  u s ed  i s  d i f f er en t  f o r  each  ex p er i m en t ,  b ecau s e t h e d at a i s  g en er at ed  r an d o m l y   us i ng a  m e t hod.  T he   m e t hod w a s  s pe c i f i c a l l y m a de  i n t hi s  s t udy  t o ge ne r a t e  da t a  a c c or di ng t o  t he   ne e ds  of   t h i s  r es ear ch  s o f t w ar e.  T ab l 1   c ont a i ns  e xa m pl e s   of  da t a  ge ne r a t e d f or  e xpe r i m e nt a l  ne e ds  w i t h t he  num be r   of   15  i te m v a r ia n ts .   T o c a l c ul a t e  t he  va l ue  of  s uppor t   c ount ,  t r an s act i o n  d at a i s   vi e w e d one  by one .  I f  a  s ubs e t  of   t r a ns a c t i ons  i s  f ound,  t he  s uppor t   c ount   v al u e i n cr eas e d   by 1.   T r i e  not  onl y  s t or e s  c a ndi da t e s   but  a l s o a l l   i t em s et  f r o m  t h e g i v en  t r an s act i o n  d at a.  A f t er  t h e f i r s t  d at ab as e,  t h e f r eq u en cy  f o r  each  i t em  i s  o b t ai n ed .   S to r in g t he  s uppor t   c ount   an d  i t em s et  v al u es   w ill i n c r e a s e  th e  me mo r y  r e q u ir e me n t a  little ,  in  e x c h a n g e ,   th is   i n cr eas es  t h e s p eed  o f  r et r i ev i n g  i t em  ap p ear an ces  o r  t h e s u p p o r t   c ount   v al u es   o f  th e  ite ms e t   [ 19] .   T he  obj e c t i ve s  of  c onduc t i ng  t hi s  e xpe r i m e nt  a r e :   Evaluation Warning : The document was created with Spire.PDF for Python.
T E L KOM NI KA T el eco m m u n   C om put  E l  C ont r ol         A nal y s i s  of  f r e que nt  i t e m s e t  ge ne r at i on bas e d on t r i e  dat a s t r uc t ur e  i n A pr i or i  al gor i t hm   ( A de  H odi j a h )   1555     K now i ng t he  t i m e  r e qui r e d  t o c a l c ul a t e  t he  s uppor t   co unt   c a ndi da t e  va l ue ,  a nd  t f i nd ou t  w he t h e r  t he   c a l c ul a t i on of  t he  s uppor t c ount c a ndi da t e s e t  us i ng  mu lti - t h r ead   can   r u n  f as t e r  t ha n a  s i ngl e - t h r ead .     K now i ng t he  pe r f or m a nc e  of  t he  t hr e a ds  a ppl i e d t o  t he  s of t w a r e  t o t he  a va i l a bl e  p r oc e s s or s  ba s e d on t i m e ,   a l s o know i ng t he  num be r  of  t hr e a ds  a nd t he  e f f i c i e nt   mu lti - t h r ead   m ode l  i n t he  a ppl i c a t i on o f  t he   can d i d at e s et  cal cu l at i o n  p r o ces s .   A  th r e a d  is  lik e   s ma ll,  lig h tw e ig h t p r o c e s s  i n   p r o ces s .  A  co l l ect i o n  o f  t h r ead s  i s  cal l ed  a     p r o ces [ 20] .  M u lti - t h r ead   c a n  be  m a na ge d i nde pe nde nt l y,  a l s o de pe nde nt l y da t a - dr i ve n.  D i s t r i b ut i on of   t hr e a ds  on  mu lti - t h r ead   t h at  ar e m an ag ed  d at a - dr i ve n de pe nde nt l y onl y on t he  a m ount  of  da t a .  E a c h d a t a  goe s   t hr ough a l l  pr oc e s s e s ,  t he n t he  pr oc e s s  f or  n da t a  i s  a ppl i e d t o a  t hr e a d.  M e a nw hi l e ,  t he  di s t r i but i on o f  t hr e a ds   i mu lti - t h r ead   i s  m a na ge d i nde pe nde nt l y,  na m e l y i n e a c h pr oc e s s  onl y   [ 21] .  F i gur e   1 s how s  t hi s   r e s e a r c m e t hod.       T ab l e 1 .   D a t a  t o be  us e d f or  e xpe r i m e nt s   T  ID   I te ms   T1   { 1, 4, 7, 8, 9, 10, 14}   T2   { 2, 3, 4, 5, 6, 7, 8, 10, 13, 14}   T3   { 4, 6}       T 100000   { 1, 4, 7, 9, 12, 13}       Problem domain  analysis and  experimental design : -   index search  method of candidate  set ; -   support count  process ; -   multi - threaded model  design ; -   preparation of  experimental data and  scenario using random  data ; Results of the  problem  domain  analysis Experiment al data Experiment al scenario Software  development Software Conducting  experiments Multi - thread  experimental  results Single - thread  experimental  results Calculates the  average single - thread  processing time Calculates the  average multi - thread  processing time Single - thread  processing  average Multi - thread  processing  average Discussion of  experimental  results Quality of the  thread model in  the calculation  of support   F i gur e  1.   R es ear ch  m et h o d       3.   R ES U LTS   A ND  ANAL YS I S   I n   t h i s  r es ear ch ,   t h A pr i or i   a l gor i t hm  i s  de ve l o pe d ba s e d on a  t r e e  us i ng t he  t r i e  da t a  s t r uc t u r e   a ppr oa c h,  a s  s e e n i n  F i gur e   2 .  T he  m odi f i c a t i on of  t he   A pr i or i   a l gor i t h m  i s  c a r r i e d ou t  ba s e d  on  t he   r e l a t i ons hi p be t w e e n t he  pa r e nt  va l ue  a nd  t he   n u mb e r  o f  c h ild r e n  to  o b ta in  a  f o r mu la  to  c a lc u l at e t h   H a sh - n o d e cal cu l at i o n .   T ab l 2   e xpl a i ns  how  t he   t r i e  da t a  s t r uc t ur e  i s  us e d t o  de t e r m i ne   t he   va l ue  of  a n i nde x.           F i gur e   2 I l lu s tr a tio n  o f  tr ie  f o r  4 - ite ms e t g e n e r a tio n       1 0 2 3 4 5 1 2 3 4 2 6 3 7 4 11 3 4 15 4 13 4 8 3 9 4 14 4 10 4 12 Sum _ Child n - itemset Parent n - itemset Node Evaluation Warning : The document was created with Spire.PDF for Python.
      I SSN : 1693 - 6930   T E L KOM NI KA T el eco m m u n   C om put  E l  C ont r ol Vo l .   19 , N o 5 O c t obe r  2021:   1553  -   1563   1556   T ab l 2 I llu s tr a tio n  o f   n - i t em s et  can d i d at g en er at i o n   N ode   P ar en t   S u m_ C h ild   (n - I te ms e t)   0   -   4   0   1   0   3   1   2   0   2   2   3   0   1   3   4   0   0   4   5   1   2   1,2   6   1   1   1,3   7   1   0   1,4   8   2   1   2,3   9   2   0   2,4   10   3   0   3,4   11   5   1   1,2,3   12   5   0   1,2,4   13   6   0   1,3,4   14   8   0   2,3,4   15   11   0   1,2,3,4       3. 1.     A n al ays i s   T he  i nde x i n  t hi s  r e s e a r c h i s  not   l i ke  a  c or r e l a t i on  be t w e e n s om e t hi ngs   [ 22] ,  but i t  m e a ns  a n a ddr e s s   of   t he  c a ndi da t e  s e t   ( c ol um N ode s )  of  e a c h s ubs e t  ( c ol um n   n - I t em s et )  g en er at ed  i n   4   ite m v a r ia n t ,  a s se e n  i n   F i gur e  2 .   T h e  b as i c m ech an i s m  o f  t h A p ri o ri   a l gor i t hm   [ 5]   i s  u s ed  i n  t h e  r ev er s e d i r ect i o n ,  w h er t h e   d at ab as e acces s  i s  d o n f i r s t .   T h e s u p p o r t  co u n t   f o r  each  s u p er s et  o f  t h e  i t em s et  can d i d at e  i s  cal cu l at ed .  S o  i t   t ak es  t h e g en er at i o n  o f  a s u p er s et  o f  i t em s et  can d i d at e as  m u ch  as  ( 2 n - 1) .  F or  e xa m pl e ,  i n  t he  r i ght  c ol um n,   na m e l y,  t he  n - it e ms e t c o lu mn  s h o w s  a  s u b s e t o f  a  p a r tic u la r  ite ms e t th a t  u s e s  th e  f o r mu la .  F o r   e x a mp le ,     n - ite ms e t { 1 ,   3} i s  i N ode   6 ,  a nd i t  ha s  P a r e nt  w hi c h node  i s  1,  a nd i t  ha s  S um _C hi l d i s  1  t ha t  i s   N ode  13   w hi c h ha s n - ite m s e t { 1 ,   3,   4},  a s  s e e n i n F i gur e  3 .  T he  num b e r  of  s e t s  pr oduc e d by e a c h va r i a nt  i t e m  4 t o 6  c a n be  s e e n i n t he  f o l l ow i ng  f i gur e .         ( a)     ( c )     ( b)     F i gur e   3 .  C an d i d at e s et  f o r :  ( a )  4 - ite ms e t; ( b )  5 - ite ms e t; a n d  ( c )  6 - ite ms e t       T he  pa t t e r n  t ha t  r e s ul t s   f r om  t he  c a l c ul a t i on of  t he   num be r  of  c a ndi da t e  s e t s  i F i gur e  1  i s  t he  P a s c a l   tr ia n g le  p a tte r n   [ 23]   on n - i t e m s e t ,  w he r e  ( a )  n= 4 i s  4, 6 , 4, 1;  ( b)  n= 5 i s  5,   10,   10,   5,   1;  a nd  ( c )  n= 6 i s  6 ,   1 5,   2 0,   15,   6,   1.   T he  f o r m ul a  f o r  ge t t i ng t he  va l ue  of  t he   P a s c a l  t r i a ngl e  i n t he  k - c ol um n of  e a c h n - ite ms e t is  u s e d  b y   t he   f ol l ow i ng f or m ul a :       ( , ) = ! ! ( ) !   ( 1)   Evaluation Warning : The document was created with Spire.PDF for Python.
T E L KOM NI KA T el eco m m u n   C om put  E l  C ont r ol         A nal y s i s  of  f r e que nt  i t e m s e t  ge ne r at i on bas e d on t r i e  dat a s t r uc t ur e  i n A pr i or i  al gor i t hm   ( A de  H odi j a h )   1557   T he  c om bi na t i on va l ue s  obt a i ne d f r om  e a c h of  t h e s e  c ol um ns  a r e  t he n a dde d up unt i l  k  r e a c he s  l e n - 1.  T he t he  num be r  o f  s ubs e t s  c a n be  c a l c ul a t e d us i ng t he  f ol l ow i ng f or m ul a :     1 = ! ! ( ) !  1 = 1                                                                                                                                                                                                                                                                   ( 2 )     N e xt  i s  t o t r a c e  t he  br a nc h poi nt s   ( BP )   f or  he i ght / l e ve l  s t a r t i ng f r om   t he  2 - ite ms e t ( l ev el =2 )   a nd i t s   va l ue  i s   obt a i ne d f r o l en - 2 {… , l en - 2 ,  i,  j } ,  b es i d e t h at  t h e v al u e o f  B P  i s  0   ( zer o ) T h e b r a nc h poi n t s   its e lf   co n t ai n   node s  t ha t  pr oduc e  a  c e r t a i n  num be r  o f  s ubs e t s  ba s e d on t he  num be r  of  i t e m s e t  c om bi na t i ons .   T he  n um be r  of   br a nc h poi nt  c a n  be  c a l c ul a t e d  us i ng t he 2 f or m ul a ,   w hi c h c ons i s t s  of  t w f or m ul a s  of  ( 3   an d   4 ) ,  as  i t  can   b e s een  i n   f o llo w in g  f o r mu la :     2 = 3   ( 3)     2 i s  cal cu l at ed  b y   t r aci n g  t h e   tr i e t o t he  va l ue  of  br a n c h poi nt   t h at   b ei n g  s ear ch ed  f r o m  each  o f  t h es e co l u m n s   a nd t he n a dde d unt i l  k  r e a c he s   l en   o r   l ev el .   T h e ca l cu l at i o n  f o r  each  v al u e  o f  t h e b r an ch es  t h at  i s  a  s u b s et  can   be  c a l c ul a t e d us i ng t he  f ol l ow i ng  f o r m ul a :     3 = ( (  + 1 ) ) (  ) 2   ( 4)     y 3 i s  t he  t ot a l  of  node s  f r om  t he  f i r s t  node  of  a l l  t he  s i bl i ng c hi l dr e n node s  t o t he  l a s t  node  a t  t he  br a nc h i n t he   s am e p ar en t  n o d e.  A f t er  t h at ,  t h e v al u e o f   y 3   m us t  be  r e duc e d by t he  va l ue  of  t he  ol de r  br ot he r  node s  i n t he   s am e p ar en t  n o d e t h at  can  b e  cal c ul a t e d us i ng t he  f ol l ow i ng f or m ul a :     4 = (  1 ) (  1 + 1 ) 2   ( 5)     T he  l a s t  i s  t o t r a c e  t he  s e que nc e  of  c hi l dr e n i n a  s ubs e t  of  t he  br a nc h poi nt s  obt a i ne d.  T hi s  va l ue  i s   obt a i ne f r om  t he  l a s t  2  di gi t s  of  t he  s ubs e t .   F or  e xa m pl e ,  t he   s ubs e t  va l ue  {1 ,  3,  4}  i s  obt a i ne f r om  t he  c a l c ul a t i on of   4 - 3,  w hi c h i s  1,  w he r e  t he  s ubs e t  f or m  i s  c ha nge d i n f or m  {…,  i ,  j } .  H e r e  i s  t he  f o r m ul a  f o r  c a l c ul a t i ng t he   va l ue  of  t he  s e que nc e  of  c hi l dr e n:     5 =   ( 6)     A l l  t he  e qua t i ons  t ha t  ha ve  be e n obt a i ne d  a r e  t he n a dde d up t f i nd t he  f i na l  i nde x of  t he  s ubs e t .  T o ge t  t he   f i n al  i n d ex  o f  an   i t em s et ,  t h e cal cu l at i o n s  t h at  m u s t  b e d o n e ar e:        = 1 + 2 4 +   5   ( 7)     3. 2.     D e si g n   T r i e  o t h can d i d at e s et  i s  a  tr i e   tr e e  w h ic h  i s  a ll s u p e r s e ts  o f  th e  ite ms e t th a t r e p r e s e n t a ll  c om bi na t i ons  of  i t e m s  s ol d.  T he   tr ie   he r e  i s  us e t o c a l c ul a t e  t he  s uppor t  c ount  of  a l l  i t e m s e t  c om bi na t i ons .   S u p p o s e t h er e ar e 4  i t em  s et s ,  t h e  s u p er s et  i s  al l  p o s s i b l e s u b s et s ,  f o r  ex am p l e:       1 - i t e m s e t : {1},  {2},  {3} ,  {4};       2 - i t e m s e t : {1,  2},  {1 ,  3} ,  {1 ,  4} ,  {2 ,  3} ,  {2 ,  4} ,  {3 ,   4};       3 - i t e m s e t : {1,  2,  3} ,  {1 ,  2 ,  4} ,  {1 ,  3 ,  4} ,  {2 ,  3 ,  4};       4 - ite ms e t:{ 1 ,  2 ,  3 ,  4 } ,     T ot a l i ng 15  or  2 n - 1 w i t h n= 4.   T hi s  i s  a  c om p l e t e   c om bi na t i on pa t t e r ne d,  s o t ha t  t ach i ev e t h e  ad d r es s  o f  a  cer t ai n  s u b s et  a f o r m u l a  can  b e f o r m ed .   F ol l ow i ng i s  a n i l l us t r a t i on of  c a l c ul a t i ng node   va l ue s  f or  3 - ite ms e t c o mb in a tio n s ,  f o r  e x a mp le ,     { 2 ,  3 ,  4 }  w ith  to ta l ite ms e t c o mb in a tio n s  is  4 ,   a s  s how n i n F i gur e   4 .   A n e xa m pl e  of  us i ng H a s h - node   c a l c ul a t i on t o ge t  t he   i nde x va l ue  f o r  3 - ite ms e t { 2 ,  3,  4}   a s  il lu s tr a te d  in   F ig u r e  4 ,  w h er e   B P = 1 a nd 2,   i =3 ,   j =4 l en   o r  l ev el =3   i s a s   ex p l ai n ed  i n  d et ai l  at   T ab l e 3  an d  T ab l e  4 .   T h e o t h er   ex am p l e   o f  H as h - node   cal cu l at i o n   fo 4 - ite ms e t { 1,  2,   3,  4}   a s  illu s tr a te d  in  F ig u r e  4 ,  w h er e   BP = 1 ,   i =3 ,   j =4 l en   or  l e ve l = 4,  s o t he   i nde x va l ue  i s  15,  a nd f o r  2 - ite ms e t { 3 ,   4} i s  10  w i t h B P = 0.   Evaluation Warning : The document was created with Spire.PDF for Python.
      I SSN : 1693 - 6930   T E L KOM NI KA T el eco m m u n   C om put  E l  C ont r ol Vo l .   19 , N o 5 O c t obe r  2021:   1553  -   1563   1558       F i gur e   4 H a sh - n o d e cal cu l at i o n       T ab l 3 A n  ex am p l e o f  cal cu l at i n g  t h e   1 a nd  2   v a l ue   f or  t he  s ubs e t  { 2 ,  3,  4 us i ng H a s h - n o d e cal cu l at i o n       1 = ! ! ( ) ! 1 = 1       2 = 3         1 = 4 ! 1 ! ( 4 1 ) ! 2 = 1   +   4 ! 2 ! ( 4 2 ) ! 2 = 2   3 = ( (  + 1 ) ) (  ) 2       1 = 4 ! 1 ! ( 3 ) ! 2 = 1   +   4 ! 2 ! ( 2 ) ! 2 = 2   3 = ( 4 ( 1 + 1 ) ) ( 4 1 ) 2   +   3 = ( 4 ( 2 + 1 ) ) ( 4 2 ) 2   1 = 4 3 2 1 1 ( 3 2 1 ) 2 = 1   +   4 3 2 1 2 1 ( 2 1 ) 2 = 2   3 = ( 4 ( 2 ) ) ( 3 ) 2   +   3 = ( 4 ( 3 ) ) ( 2 ) 2   1 = 24 6 2 = 1   +   24 4 2 = 2   3 = 2 3 2   +   3 = 1 2 2   1 = 4   +   6   3 = 3   +   3 = 1   1 = 10   3 = 4         2 = 4           T ab l 4 A n  ex am p l e o f  cal cu l at i n g  t h e 4 5 ,  an d   i nde x va l ue  f or  t he  s ubs e t  { 2 ,  3,  4} us i ng H a s h - node   cal cu l at i o n   4   5   I nde x         4 = ( 1 ) ( 1 + 1 ) 2   5 =    = 1   +   2     4 +   5   4 = ( 4 3 ) ( 4 3 + 1 ) 2   5 = 4 3    = 10 + 4 1 + 1   4 = 1 2 2   5 = 1    = 14   4 = 1           D at a s t r u ct u r es ,  a s  s e e n i n F i gur e  5,   ar e ar r ay s  w i t h  at t r i b u t es   c ons i s t   of  :     N ode   a s  a n i nde x va l ue  of  H a s h - node  c a l c ul a t i on r e s ul t .       D at as   an   ar r ay  o f  n - ite ms e t c o mb in a tio n s ,  su c h  a s 3 - ite ms e { 2 ,  3,  4} .  T he  t ot a l  c om bi na t i ons   f or  4 i s   (2 n - 1) ,   t h at  i s  1 5 ,  as  s een   i n  F i gur e  4.     S uppor t   is th e va l ue  of  s uppor t  c ount .   T he  de f a ul t  f o r  e a c h da t a  i s  0 ( z e r o )  a nd i t  w i l l  be  c ount e d p l us  one  i f   i t  e xi s t e d i n da t a ,  a nd s o on .           F ig u r e 5 .  D at a s t r u ct u r e  f o r  n - I te ms e ttr ie of  c a ndi da t e   Evaluation Warning : The document was created with Spire.PDF for Python.
T E L KOM NI KA T el eco m m u n   C om put  E l  C ont r ol         A nal y s i s  of  f r e que nt  i t e m s e t  ge ne r at i on bas e d on t r i e  dat a s t r uc t ur e  i n A pr i or i  al gor i t hm   ( A de  H odi j a h )   1559   A f t e r  t he  i nde x va l ue   i s  obt a i ne d,  ne xt  i s  how  t o c a l c ul a t e  t he  s uppor t  va l ue  f o r  e a c h s ubs e t  by   a dopt i ng pr uni ng  f r om  A p r i or i .  T he  ge ne r a t i on  of  t he  i t e m s e t  c a ndi da t e  i s  done  pe r - le v e l.  O n ly  ite ms e c a ndi da t e s  w ho m e e t  t he  m i ni m um  s uppor t  ( f r e que nt )  a r e  f or m e d.   T he n f i nd t he  c a ndi da t e  i t e m s e t 's  pos i t i on  i n t he   tr ie   of  t he  c a ndi da t e  s e t  t o  i nc r e a s e  t he  s uppor t  c ount .   T he  s t e ps  f or  t he  A l t e r na t i ve _1 a l go r i t h m ar e :     E s t a bl i s hi ng a   tr ie   o f  t h e  can d i d at e s et  as  m u ch   ( 2n - 1) ,  w he r e  k  i s  t he  num be r  of   ite ms e ts  s o ld .     F o r m i n g  a l i n ear   l i s t  o f  d at ab as es  an d  s u p er s et  o f  i t em s et   f o r  each  t r an s act i o n  b y  co m b i n i n g  al l  i t e m s et   pur c ha s e d ( t r a ns a c t i on) ,  w hi c h i s  a s  m uc h a s  ( 2n - 1)  w he r e  ni  i s  t he  num be r  of  i t e m s e t s  pur c ha s e d i n t he   t r a ns a c t i on of  i .     F o r  each  t r an s a c t i on,  a l l  s ubs e t s  of  t he  s upe r s e t  a r e  s e a r c he d f or  a  pos i t i on  i n t he  c a ndi da t e  s e t 's   tr ie   t i nc r e a s e  t he  s uppor t  c ount .   T he  pr oc e s s  m ode l  of  t he  A l t e r na t i ve _1  a l gor i t hm   i s  s how n i n F i gur e   6   T h e d i f f er en ce b et w een  A l t er n at i v e_ 1  an d  A l t e r n at i v e_ 2  al g o r i t hm s  i s  t he  ge ne r a t i on  of  n - ite ms e t.   S uppos e  t he  c ons t r uc t i on o f  n - ite ms e t in  A lte r n a tiv e _ 1  is  to  c o mb in e  a ll   ite ms e t a n d  p r o d u c e   ite ms e t o f     (2 n - 1 ) ,  w h e r e  n i is   th e  n u mb e r  o f  ite ms e ts  in  tr a n s a c tio n  i.  H o w e v e r ,  th is  is  n o th e  c a s e  w ith  A lte r n a tiv e _ 2 .   Pr u ni ng i s  done  by  e l i m i na t i ng   [ 24] [ 25]   t he  p r e vi ous  l ong i t e m s e t  w hos e  f r e que nc y i s  be l ow  t he  m i ni m um   s uppor t  t hr e s hol ds  ( i nf r e que nt ) ,  a s  s e e n i n F i gur e   7 .       1 Read itembought  from data  transaction . 2 Generate combination  of i - itembought from  1 - itembought up to  n - itembought consists of data frequent . 3 Calculate  { node of i - itembought combination formula ( children  from  1 - itembought to  ( i - 1 ) - itembought ) +  ( sequence of children at  i - itembought ). EOF Yes No 6 Get frequent  itemset from  1 - itembought to  n - itembought if  { support ≥  minimum support Start End 4 node ( i - itembought ) =  node ( from  1 - itembought to  ( i - 1 ) - itembought ) 5 Update  { support } ( i - itembought ). Yes No     F ig u r e 6 .  T he  pr oc e s s  m ode l  of  A l t e r na t i ve _1 a l go r i t hm           F ig u r e 7 .  T he  pr oc e s s  m ode l  of  A l t e r na t i ve _ 2   a lg o r ith m   1 Read itembought from data  transaction . 2 Generate level - i - itembought  combination  { node data support } . 4 Calculate  { node of level - i - itembought combination formula ( children from  1 - itembought to  ( i - 1 ) - itembought ) + ( sequence of  children at i - itembought ). 12 There are still  frequent level - itembought ? 15 level  level + 1 7 EOF Yes Yes No 13 Get frequent from  1 - itembought combination  to  n - itembought  combination Start End 5 node ( i - itembought ) =  node ( from  1 - itembought to  ( i - 1 ) - itembought ) 6 Update  { support } ( i - itembought ). Yes 8 support ( from  1 - itembought to  n - itembought minimum  support 11 PRUNING delete  node ( i - itembought as  frequent level - itembought No No 14 item ( data ) =  item ( non _ frequent _ 1 _ Itemset ) 9 Level  1 ? 10 Set data ( i - itembought as  non _ frequent _ 1 _ itemset No No 3 item ( data ) =  item ( non _ frequent _ 1 _ Items et ) No Yes Yes Yes Yes No Evaluation Warning : The document was created with Spire.PDF for Python.
      I SSN : 1693 - 6930   T E L KOM NI KA T el eco m m u n   C om put  E l  C ont r ol Vo l .   19 , N o 5 O c t obe r  2021:   1553  -   1563   1560   A l t e r na t i ve _3 t r e a t s  s ubpr oc e s s e s - 2 a nd  s ubpr oc e s s e s - 3 of  A l t e r na t i ve _2 a s  t hr e a ds  by i ns t a l l i ng   c onc ur r e nt  a c c e s s  c ont r ol  t o  a voi d  r a c e  c ondi t i o ns  f i ght i ng  ove r  t he  va l ue  of  s uppor t  c ount  a t  t he  s a m e   pos itio n  in  th e  tr ie .   M u lti - t hr e a d a ppl i e d i n t hi s  r e s e a r c h us e d de pe nde n c y da t a - dr i ve [ 21] T r an s act i o n  d at i s  di vi de d i nt o 4 t hr e a ds  a nd 8 t hr e a ds .  A  di f f e r e n t  t hr e a d pr oc e s s e s   i n t hi s  r e s e a r c h ba s e d on t he   s u m  of  t he   t r an s act i o n  d at a   t h at  can  b e s een  i n   F i gur e   8 ( a ) ,  s o t ha t   r a c e  c ondi t i ons  m a y  oc c ur   w h ic h  is   illu s tr a te d  in   F i gur e   8   ( b) ,  c ons i s t i ng of  4 t h r e a ds .   T o ove r c om e  r a c e  c ondi t i on  w he n  upda t e  va l ue   of  S uppo r t C ount ,  m ut ua l  e xc l us i on i s  ne e de d t o   acces s  t h e s am e ad d r es s  o f  i t em s et  { 2 ,  3 }  as  o n e o f  i t e m s e t  c om bi na t i on  i n node  8 {2 ,  3} ,  node  11 { 1,  2 ,  3} ,   node  14 {2,  3,  4},  a nd node  15  {1,  2,  3,  4} a s  s e e n i T a bl e  1.  D i f f e r e nt  t hr e a ds  pr oc e s s  i t  w i t hou t  di s c a r di ng  one  of  t he  t hr e a ds  a s  c ol l i s i on ha ndl i ng  [ 26]   w h e n  tw o  th r e a d s  a tte mp t to  in s e r t tw o  d if f e r e n t s u b tr e e s  a t th e   s am e l o cat i o n .   I n  t h i s  r es ear ch ,  t h e m u t u al  ex cl u s i o n  m ec ha ni s m  us e s  a  m oni t or  us i ng  s ync hr oni z e c ons t r uc t s  w he n upda t i ng s uppor t  va l ue s ,  a s  s e e n i n F i gur e   9   T hr e a ds  i n  t hi s  r e s e a r c h do  not  pl a c e  on  e a c h i t e m s e t  c om bi na t i on a s  i t  i s  uni que .  F or  e xa m pl e ,   ite ms e t { 1 ,   3,   4}  pr oduc e s  7 c om bi na t i ons  a r e  {1} ,   {3} ,  {4} ,  {1 ,   3 },  { 1,   4 },  { 3,   4 },  { 1,   3,   4} ,  s o t ha t  t hr e a ds   i s  pl a c e d on s um  o f  t r a ns a c t i on da t a ba s e  w hi c h ha s  be e n di vi de d by  4 a nd  8 t h r e a ds .   T he  e xpe r i m e n t  s how s   t ha t  t he  i t e m s e t  c om bi na t i on  t hr e a ds  m e t hod ha s  a   l onge r  r un  t i m e  t ha n  t he  t r a ns a c t i on da t a  t hr e a ds  m e t hod.         ( a)       ( b)     F ig u r e 8 P r o c e ss  m ode l   o f  A lte r n a tiv e _ 3  a lg o r ith m w ith  th e  e x a mp le  o f  th e  d is tr ib u tio n  o f  tr a n s a c tio n  d a ta   ( a )  i nt o  4 t h r e a ds  ( b)       1 a Read itembought from data  transaction . 2 Generate level - i - itembought  combination  { node data support } . Start 1 b Divide the transaction data  record into  or  parts  ( threads ). T 1 { 1 , 4 } T 2 { 4 } T 3 { 1 , 2 , 3 } Tn { } ... ... T 2 { 2 , 3 } Tn { } C 1 { 1 },{ 4 },{ 1 , 4 } C 2 { 4 } C 3 { 1 },{ 2 },{ 3 },{ 1 , 2 },{ 1 , 3 }, { 2 , 3 } ,{ 1 , 2 , 3 } Cn { } ... ... C 2 { 2 },{ 3 }, { 2 , 3 } Cn { } Thread 1 Thread 2 Thread 3 Thread 4 Node Support Data 1 6 { 1 } 2 6 { 2 } 3 6 { 3 } 4 3 { 4 } 1 2 3 4 ... ... { , ... } 8 2 { 2 3 } 3 ... ... { , ... } ... { 2 3 } { 2 3 } ... Transaction  database Itemset combination Trie frequent  n - itemset with minimum support  > 2 Evaluation Warning : The document was created with Spire.PDF for Python.
T E L KOM NI KA T el eco m m u n   C om put  E l  C ont r ol         A nal y s i s  of  f r e que nt  i t e m s e t  ge ne r at i on bas e d on t r i e  dat a s t r uc t ur e  i n A pr i or i  al gor i t hm   ( A de  H odi j a h )   1561       F ig u r e 9 .  U pda t i ng s uppor t  va l ue  a l gor i t hm   ( s i m pl i f i e d)       3. 2.     E x p eri m en t s   T he  r un t i m e  of  ge ne r a t i ng  f r e que nt  i t e m s e t  of  e a c h pr opos e d a l gor i t hm  i n  t hi s  r e s e a r c h,  a  t e s t  i n a   s i ngl e  s e r ve r  e nvi r onm e nt  us i ng a  P C  w i t h I nt e l   ( R )  C or e  ( T M )  s pe c i f i c a t i ons  i 5 - 8250U  C P U  @  1. 60G H z   1. 80 G H z  us e s  12. 0 G B  R A M  a nd u s e s  t he  ope r a t i ng s ys t e m   M i c r o s of t  W i ndow s   10.  T e s t  da t a  obt a i ne d f r om   ge ne r a t i ng r a ndom  i t e m s e t  c om bi na t i ons  by a  s i m pl e  a ppl i c a t i on r e pr e s e nt i ng t he  s a l e s  t r a ns a c t i on da t a  s e t .   I n  g e ttin g   th e  a c c u r a te  r u n  time   r e s u lts ,  te s tin g  is  c a r r ie d  o u t  5  time s   f o r  e a c h   m i ni m um  s uppor t  va l ue .   T he r e  a r e  t w o t ype s  of  t he  pr opos e d a l gor i t hm ,  na m e l y S i ngl e - t hr e a d pr oc e s s i ng a ve r a ge  c on s i s t s  of   A l t e r na t i ve _1 a nd  A l t e r na t i ve _2;   mu lti - t h r ead   p r o ces s i n g  av er ag e co n s i s t s  o f  A lte r n a tiv e _ 3  w ith  4 ,   8 ,  a nd  20   t h r ead s .  T h e ex p er i m en t  w as  car r i ed  o u t  w i t h   5 ex p er i m en t al   s c e na r i os  f or  e a c h t ype  of  t he  p r opos e a l gor i t hm  m a de  ba s e d on  t he  3 a l t e r na t i ve s  m e nt i o ne d pr e vi ous l y,  e a c h of  w hi c h i s  de s c r i be d a s   f ol l o w s :     S 1 ( A l t e r na t i ve _1) :  P r oc e s s i ng t he   tr i e s   can d i d at e s et  w i t h  o n e m ai n  p r o ces s .   S cen ar i o - 1 i s  i nt e nde d t o   unde r s t a nd t he  w or ki ngs  a nd pe r f or m a nc e  of   tr ie s .     S 2( A l t e r na t i ve _2) :  P r oc e s s i ng w i t h one  m a i n  pr oc e s s  l i ke  s c e na r i o S 1 but  a dde d pr uni ng  t ha t   w or ks     p er - l e ve l  t r e e  he i ght ,  na m e l y L e ve l P r uni ng.   T h i s  s cen ar i o  i n t en d s  t o  m eas u r e w h et h er  t h er e i s  an  i n cr eas e   i n pe r f or m a nc e  w i t h pr un i ng.     S 3 ( A l t e r na t i ve _3 w i t h  4  t hr e a ds ) :  P r oc e s s i ng A l t e r na t i ve _2 w i t h  t he  us e  o f  t he  4  t hr e a ds .  S c e na r i o - i nt e nds  t o de t e r m i ne  t he  pe r f or m a nc e  i m pr ove m e nt  of   tr ie s   w ith   pr un i ng a nd 4 t hr e a ds  t o opt i m i z e  C P U   w or d u e  to  id le  ti me  I / O.     S 4 ( A l t e r na t i ve _3 w i t h  8  t hr e a ds ) :  P r oc e s s i ng A l t e r na t i ve _2 w i t h  t he  us e  o f  t he  8  t hr e a ds .  S c e na r i o - i n t en d s  t o  d et er m i n e w h et h er  t h er e i s  an  i n cr eas e i n  p er f o r m an ce w i t h  t h r ead s   c om pa r e d t S 3 .     S 5 ( A l t e r na t i ve _3 w i t h  20 t h r e a ds ) :  P r oc e s s i ng A l t e r na t i ve _2 w i t h t he  us e  of  t he  20 t h r e a ds .  S c e na r i o - i n t en d s  t o  d et er m i n e w h et h er  t h er e i s  an  i n cr eas e i n  p er f o r m an ce w i t h  t h r ead s  co m p ar ed   t o  S 3  an d  S 4 .   T o ge t  t he  qua l i t y o f  t he  t hr e a d  m o de l   i n t he  c a l c ul a t i on,  e a c h p r opos e d a l gor i t hm  a bove  t e s t e d by   100, 000 t r a ns a c t i on da t a   w ith   s i x  va r i a t i ons  of  n - i t em s et  as  E x p er i m en t al  d at a b as ed  o n  t h e R es ear ch  M et h o d .   T h e  v a r ia tio n  n u mb e r  o f  ite ms e t c o n s is ts  o f  5 - ite ms e t,  2 5 - ite ms e t,  5 0 - ite ms e t,  a n d   1 5 0  ite ms e ts   w ith  th e   t hr e s hol d of  s uppor t  va l ue   i s 2 5 %  f r o m th e  to ta l o f  tr a n s a c tio n  d a ta .         T ab l 5 .  E xpe r i m e nt a l  r e s ul t s  f o r  100 , 000 t r a ns a c t i on da t a ,  5 - i t e m s e t up t o150 - i t e m s e t ,  25%  m i ni m um  s uppor t   in  h o u r s :min u te s :s e c o n d s :millis e c o n d s   Id   5 - ite ms   25 - i te ms   50 - ite ms   75 - ite ms   100 - ite ms   150 - ite ms   S1   00: 00: 00: 906   X   X   X   X   X   S2   00: 00: 00: 361   00: 00: 09: 647   00: 01: 20: 484   00: 05: 50: 748   00: 16: 19: 50   05: 04: 14: 932   S3   00: 00: 00: 161   00: 00: 03: 368   00: 00: 31: 216   00: 01: 55: 805   00: 09: 05: 147   02: 00: 55: 783   S4   00: 00: 00: 205   00: 00: 04: 595   00: 00: 27: 16   00: 01: 37: 707   00: 06: 43: 385   00: 43: 50: 527   S5   00: 00: 00: 242   00: 00: 11: 888   00: 04: 34: 563   00: 19: 43: 225   01: 09: 36: 369   05: 54: 35: 530       T he  va r i a t i on  of  t he  t e s t  da t a  s how n i n  T a bl e   5   t h a t th e   r u n  time   is  th e  la te s t f o r  th e  n u mb e r  o f     5 - i t e m s e t  a nd 25%  o f  m i n i m um  s uppor t  i s  A l t e r na t i ve _1.   I t  ha ppe ns  be c a us e  be f or e  c a r r yi ng   out  t he   c ount i ng node   p r o c e s s ,  it ta k e s  a  f u ll ite ms e t c o mb in a tio n  g e n e r a tio n  p r o c e s s  f o r  a ll n - ite ms e t c o mb in a tio n s w h i ch  i s  as  m u ch  as   (2 n - 1 )  s o  t h at  at  n >5 - i t e m s e t  t a ke s  t he  l onge s t  r un  t i m e  pr oc e s s i ng unt i l  t he   pr oc e s s   r e s ul t s  i n a  ha ng.   T he r e f o r e  pr uni ng  ope r a t i ons  a r e  ne e de d i n t hi s  r e s e a r c h us i ng  l e ve l  pr un i ng .  I f  th e  r e s u lt  of  t he  ge ne r a t i on o f  a  c om bi na t i on   ( l ev el - 1) - ite ms e t me e ts  th e  min imu m  s u p p o r t th r e s h o ld s ,  th e n  th e  i te ms e t   w i l l  b e a  can d i d at e i t em s et  at  t h e n ex t  l ev el .  L ev el   pr uni ng's   e x is te n c e  in  g e n e r a tin g   ite ms e t c o mb i n a tio n s   ba s e d on t hi s   t r i t r ee - l ev el  can  s av e m em o r y  u s ag e.   T h e i t em  m at ch i n g  p r o c es s  f o r  each  t r an s act i o n   r eco r d   is  n o t d o n e  f o r  a ll  ite ms e t c o mb in a tio n s  ( n - i t e m s e t ) ,  s uc h a s  t he  p r opos e d a l gor i t hm  i n A l t e r na t i v e _2 a nd  A l t e r na t i ve _3.   Evaluation Warning : The document was created with Spire.PDF for Python.
      I SSN : 1693 - 6930   T E L KOM NI KA T el eco m m u n   C om put  E l  C ont r ol Vo l .   19 , N o 5 O c t obe r  2021:   1553  -   1563   1562   T he  r e s ul t s   f r om  t he  5 - ite ms e t u p  to  1 5 0 - i t e m s e t   of  t he  t hr e e  a l gor i t hm s  c a n be  s e e n i t he  gr a ph   be l ow   w i t h t he  va l ue  i s  c onve r t e d f r om  hour s  t o m i l l i s e c onds .  T he  hor i z ont a l  a xi s  i s  t he  num be r  of  i t e m s e t s ,   a nd t he  ve r t i c a l  a xi s  i s  r un  t i m e  pr oc e s s i ng ( i m i l l i s e c ond) ,  w he r e  r e d  i s  f or  A l t e r na t i ve _1,  gr e e n i s  f or   A l t e r na t i ve _2,  a nd bl ue  i s  f o r  A l t e r na t i ve _3   w ith  4   th r e a d s ,  y e llo w  is  f o r  A lte r n a tiv e _ 3  w ith  8   th r e a d s ,  a n or a nge  i s   f or  A l t e r na t i ve _3 w i t 20   t h r ead s ,  as  s een  i n  F i g u r 10 .   T he  f a s t e s t  r un t i m e  i s  00: 43: 50: 527 ( 2 , 630, 5 27 m s e c )  c a n be  done  by a n a l gor i t hm  f r o m   A lte r n a tiv e _ 3  w ith  8  th r e a d s   fo r t h e   num be r  of  150 - i t e m s e t  a nd 25%  o f  m i n i m um  s uppor t  on   100 , 000  t r a ns a c t i on da t a ,  w hi l e  t he  r un  t i m e  ge ne r a t e d b y A l t e r na t i ve _2  i s  05: 04: 14: 932  ( 18 , 254, 932  m s e c ) ,  a nd   A lte r v a tiv e _ 1  its e lf  is  in  h a n g   th a t o n ly  s e e n  in   5 - i t em s et ,  as  s een  i n   F i g ur e   10   ( a) ,  a nd  i t  di s a ppe a r e d f r om   F i gur e s   10  ( b)  t o 10  ( f ) .  U s i ng  mu lti - t h r ead   a f f e c ts  in c r e a s in g  r u n   time  th a t  it  is  a b o u t  7  ti me s  f a s te r  th a n   us i ng no t hr e a d ( A l t e r na t i ve _1 a nd A l t e r na t i ve _2 ) .  H ow e ve r ,  i t s   r un t i m e  pe r f or m a nc e  doe s  not  i n l i ne  w i t t he  num be r  of   mu lti - t h r ead ,  as  s een  i n  T ab l e  2 .  A l t e r na t i ve _3 w i t h 4  t hr e a ( S 3)  i s  f a s t e r  t ha n  8 t h r e a d ( S 4)   f or  t he  num be r  of  5 - ite ms e t   a nd 25 - ite ms e t ,  as  s een  i n  F i g u r e s   10   ( a)   a nd  10   ( b) .  I n  c ont r a s t ,  A l t e r na t i ve _3  w ith  8  th r e a d s   ( S 4 )  i s  f as t er  t h an  4  t h r ead s   (S 3 )  fo r   t h e  num be r  f r om   50 - ite ms e t to  1 5 0 - ite ms e t .  O t h er w i s e,   A lte r n a tiv e _ 3  w ith  2 0  th r e a d s  is  th e  la s te s t f r o m 5 - ite ms e t to  1 5 0 - i t em s et ,  s o  t h e m o r e t h r ead s  d i d  n o t  af f ect   t o  g et  t h e b et t er p er f o r m an ce.   F i g ur e  1 1   s how s  t ha t  t he  gr e a t e r  t he  num be r  o f  t he  i t e m  va r i a nt s ,  t he n t he   gr e a t e r  t he  t i m e  di f f e r e nc e  w a s  obt a i ne d,  but  t he  gr e a t e r  t he  num be r  of  t he  t hr e a ds  di d not  a l w a ys  ge t t i ng t he   f a s te r  th e  time  o f  p r o c e s s in g .             ( a)   ( b)   ( c)         ( d)   ( e)   (f)     F ig ur e  10 .  E xpe r i m e nt a l  r e s ul t s  f o r  100 , 000  t r an s act i o n  d at a   in  m illis e c o n d s :  (a ) 5 - ite ms e t ,  (b 2 5 - ite ms e t   (c 5 0 - ite ms e t ,  (d ) 7 5 - ite ms e t ,  ( e )  100 - ite ms e t ,   a n d ( f )  150 - i t e m s e t  w i t h 25%  of  m i ni m um  s uppor t           F i gur e   1 1.  T he  di f f e r e nc e  i n t he  pr oc e s s i ng t i m e       T he  di s c us s i on of  t he  e xpe r i m e nt a l  r e s ul t s   i n  T a b l e  4,  i t  s how s  t ha t  t he  a ve r a ge  t i m e  r e qui r e f or   pr oc e s s i ng us i ng  mu lti - t h r ead   is  f a s te r  th a n  th e  s in g le - t hr e a d m ode l ,  de s pi t e  f or  A l t e r na t i ve _3 w i t h 2 0 t hr e a ds   Evaluation Warning : The document was created with Spire.PDF for Python.