Int ern at i onal  Journ al of Ele ctrical  an d  Co mput er  En gin eeri ng   (IJ E C E)   Vo l.   8 , No .   6 Decem ber   201 8 , p p.   4568 ~ 4576   IS S N:  20 88 - 8708 DOI: 10 .11 591/ ijece . v 8 i 6 . pp 4568 - 45 76           4568       Journ al h om e page http: // ia es core .c om/ journa ls /i ndex. ph p/IJECE   Gener atin g Non - r edun da nt Mul tilev el Ass oc i ation  Rules Us ing  Min - m ax E xact  Rules       R.   Vij aya Pra ka sh 1 , SSV N.  Sa rm a 2 , M.  S heshikal a 3   1 Depa rt m ent   of C om pute Scie n ce   and Engi ne ering,  S R   Engi n eering  Coll ege,  Ind ia   2 Depa rt m ent   of C om pute Scie n ce   and Engi ne ering,  Va agde vi   Co ll eg of   Engi n eering,   Ind ia   3 Depa rtm nt  of   C om pute Scie n ce a nd  Engi n ee rin g,   S R   Engi n ee ri ng  Coll ege ,   Indi a       Art ic le  In f o     ABSTR A CT   Art ic le  history:   Re cei ved   Sep   22 201 7   Re vised  Ju l   13 ,  201 8   Accepte J ul   29 , 2 01 8       As socia ti on  Rul m ini ng  play s   an  important   role   in  the   dis cove r y   of  knowledge   and  i nform at ion.   As sociation  Rul m i ning  discove rs  h uge  num ber   of  rule for  an dat ase for  diff ere nt  support  an conf ide n ce   v a lue s,  among  thi m an y   of  t hem  are   red un dant ,   espe cially  in  the   ca se  of   m ult i - le ve dat ase ts.  Mining   non - red undant   As socia ti on  Rul es  in  m ult i - le vel  dat ase is  a   big  conc e rn  in  fi el of  Data   m ining.  In  thi pape r ,   we  pre sent  de fini ti on  fo r   red undancy   and   concise  r epr ese ntation  called  Reliable  Exact   b asis  for   rep rese nt ing  non - red undant   As sociation  Rule fro m   m ult i - le vel   da ta sets.   Th e   give non - red un dant   As socia ti o Rule are   loss   le ss   rep rese nt ation  for  a n y   dat ase ts.   Ke yw or d:   Associ at ion  R ul e   Fr e qu e nt I te m set s   Non - Re dunda nt  Rules   Re li able Rules   Copyright   ©   201 8   Instit ut o f Ad vanc ed   Engi n ee r ing  and  S cienc e   Al l   rights re serv ed .   Corres pond in Aut h or :   R. V i j ay a Pr a ka sh ,     Dep a rt m ent o f C om pu te Scie nce a nd E ng i ne erin g,   S R E ng i neer i ng C ollege,   An at hasa gar ,   Hasa np a rthy,  War a ngal , Tel ang a na, I ndia .   Em a il vij pr a k@h otm ail.co m       1.   INTROD U CTION   The  hu ge  am ount  of  the  e xtracted  ru le s   is  big   pro blem   fo Associ at ion   R ule  m ining   [ 21 ] .   Especial ly m a ny  of  t he  e xtra ct ed  r ules  a re  c on si der e re dund a nt  si nce  t he pro du ce   the   sam m eaning  to  the   us er   or  e xtract ed  ru le s   can   be   re placed   by  oth e ru le s.   M any  ef f or ts  ha ve   bee m ade  on  reducin the   siz of   the  ext racted  r ule  set T he re  are  nu m ber   of  represe ntati on s   of  f reque nt  pa tt ern hav e   be en  pro po se d,  one  of  them is  the  cl os e it em se ts,  is  of  pa rtic ular   interest   as  t hey  can  be  a ppli ed   f or   ge ner at in non - re dunda nt  r ules   [10 ] ,   [ 12 ] ,   [ 18 ] ,   [ 23] The  use   of   f re qu e nt  c losed  it em set pr ese nts  cl ear  prom ise   to  red uce  t he   num ber   of  extracte ru le s   [13 ] [ 17 ] [ 19] .   Mult i - le vel  dataset in  wh i ch  the  it e m are  no al at   the   sa m con cept  le vel   con ta in  in form at ion  at  dif fer e nt abst ract l eve ls.    The  a pproache us e to  fin f reque nt  it e m se ts  in  sin gle  le ve dataset m is inf or m at ion as  they   only   look at  on e le ve l i the  datase t. Thus tec hn i ques that c onsid er al l t he  le vels  are neede d [ 6 ] - [ 9 ] ,   [ 22] .   H ow ever,  ru le de rive f r om   m ult i - le vel  dataset ca ha ve  the   sam issues  with  re dund a ncy  as   th ose   from   sing le   le vel  dataset Wh i le   appr oach es   use to   rem ov re dundancy  i si ng le   le vel  data set [13 ] [ 17 ] [ 19]   ca be  a da pted  for  us i on e   r ule  at   giv e le ve gi ves  t he  sam inf orm at ion   as  a no t her  r ule  at   a   di ff ere nt  le vel.   In  thi s   pap e r,   w pr es ent  Re li able  basis  re pr ese nt at ion   of  non - re dundant  As so c ia ti on   Rules.  We  then  lo ok  into  thi s   hierar c hical   re dundancy  an pro po se  a ap proac from   w hich  m or non - re dundant  r ul es  can  be  der i ve d.   W us the  sam def i niti on   of   non - re dundant   ru le in  si ng l le vel  dataset s,  but  to  this  def i niti on   we  add   a   requirem ent that con side rs  th e d iffe ren t l eve ls of  the item (s)  in  determ ining  the r e dundan cy  r ule. By do ing  s o,   m or redu nd a nt  A sso ci at io Rules  ca be   el i m inate d.   W al so  sho th at   it   is  possibl to  de rive  al l   of  th e   Associ at ion  R ul es, w it ho ut   los e of in form at io n.   Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       G ene ra ti ng N on - r e dund an M ulti le vel  Asso ci ation R ules Us ing     ( R. Vija ya  Pr ak ash )   4569   The  pap e is  orga nized  a f ol lows Sect ion  bri efly   disc us ses  s om relat ed  w ork,   Se ct ion   3,   we  discuss  the   re dunda ncy  in   As so ci at ion  Rule an present   de finiti on  to   re dundant  r ules.  E xperim ent a nd   resu lt s a re  pr es ented  i Sect i on  4.   Finall y, Se ct ion   c on cl udes t he pape r.       2.   RELATE D  W ORK   The  a ppro ac he pro po se in  [13 ] [ 18 ]   m a ke  us of  the  cl os ure  of  the   Galois  co nne ct ion   [ 4]  to   extract  non - re dundant  r ules  f ro m   fr eq uen c losed  it em set instea of  f rom   fr eq uen it em se ts.  On di f fer e nce   betwee the  tw ap proac hes  is  the  def init io of   re dundancy The  ap proac pr op os e in  [18]  extracts  the  ru le s   with  shorte an te ceden an s horter  co ns e qu ent  as  well   a m ong  r ules  w hic ha ve  the  sa m con fide nce wh il the  m et ho propose i [ 13]   def i nes  t h at   th non - re dunda nt  r ules  a re  th ose   w hich  ha ve  m ini m al   antec eden t s   and m axi m al  c on s eq ue nts.    The  def i niti on  pro po se i [ 17 ]   is  li ke  tha of   [ 13] H oweve r,   t he  re quirem ent  to  re dundancy  is   relaxe d,   a nd  t he   le sser  re qu ir e m ent  m akes  m or ru le t be  c onside red  redu nd a nt  a nd  thu s   el i m inate d.   M os i m po rtantl y,  [ 17]   prov e that   the  el i m inati on   of  su c re du nd a nt  r ules  in creases  the  belie to  the  extr act ed  ru le a nd   t he   capaci ty   of   the  ext racted  non - re dunda nt  ru le f or  so l vin pro blem s.  Howe ver,  the   wor m entione a bo ve  has  only   focuse on  datas et wh e re  al ite m are  at   the  sam e   con ce pt  le vel.  T hu s the do  no nee to  c onside re dunda ncy  that  can  oc cur   w hen   t he re  is  hie rar c hy  am on the  it e m s.   m ulti - le vel   dataset   is  the  one  wh ic ha a im plicit  ta xono m or   c on ce pt  tree,  li ke   show i Fig ure  1.   T he  it em i the   dataset  ex ist  at  the lo west c oncept le vel  but a re  par of ahie r arch ic al  str uctu re a nd org a niz at ion .       F o o d B a n a n a A p p l e W h e a t W h i t e S k i m m e d 2   p e r ce n t F r u i t B r e a d M i l k     Figure  1 .   A  Si m ple ex a m ple o f  prod uct tax onom y       In   Fi gure  f or  an  exam ple,  the  fr e qu e nt  it e m set   { ' Dairylan d - 2% - m il k' ' wh it e - br ea d' is  cro ss - le vel  it e m set   as  the  first  it em   is  from   the  lo w est   le vel,  wh il e   the  sec ond  it em   is  from   dif fer e nt  c on ce pt  le vel.  In   fact  the  cr oss - le vel  idea  wa an  add it io to  the  wor bei ng   propose d.   F ur t her   w ork  pr opos e an  ap proac wh ic inclu de fin ding  cr os s - le vel  fr e quent   it e m se ts  [1 5].  This  la te wor al so   pe rfor m m or pru ning   of   the  dataset   to  m ake  fin ding  t he  frequ e nt  it em sets  m or eff ic ie nt H ow e ve r,   e ve with  al this   w ork  t he  f oc u has   been   on  fin ding  the  f re qu e nt  it e m set as  eff ic ie ntly   as  po ss ible  and   t he  iss ue  of  qual it and / or   redu nd a nc in   sing le   le vel  dat aset s.  S om br ie wor pr e sen te by  [5 ] - [ 6]  discusse rem ov in ru le wh i ch  are  hiera rc hi cal l redu nd a nt,  but  it   reli es  on  t he   us er   gi ving  a exp ect e c onfi den ce   va riat io m arg in  t de te rm ine  re dund ancy.   Ther e   a pp ea rs  to  be   void   in   deali ng  with   hi erarch ic al   re dunda ncy  in   As so ci at ion  Rule de rive from   m ulti - le vel  dataset s.  This w ork   at te m pts  to  fill   that  vo i an s ho a ap pr oac to  deal with h ie rar c hical   re dund a ncy   without l osi ng  any in form at io n.   Fr om   the  beg i nn i ng  of  Assoc ia ti on   Rule  m i ning  in   [ 1 ] [ 3 ] [ 21 ] [ 23 ] [ 25] the  first  ste has  al w ay been   t fi nd   t he   fr e qu e nt  patte rn or  it e m sets.   The  sim ples way  to  do  thi is  thr ough  th us of   th A pr i or i     al gorithm   [2 ] Howe ver,  A pri or is  not  de sig ned  to  w ork  on  e xtracti ng  frequ e nt  it em sets  at   m ulti ple  lev el in   m u lti - le vel  dataset It  is  design e f or   use   on   si ng le   le vel   dataset s.  But,  it   has  been   ad apted  f or   m ulti - le vel   dataset s.   On e   ada ptati on   of  Aprio ri  to   m ul ti - le vel  dat ase ts  is  the   ML_T 2L al go rithm   [5 ] - [ 6].  T he  ML _T 2L al gorithm   us es  transacti on  ta ble  that  h as  t he   hierar c hy  in f or m at ion   enc oded  i nto   it Eac le vel  in  the  da ta set  is  processe in div id ually Firs tl y,  le vel  ana ly zed  for  la rge   1 - it em set us i ng   A pr io ri.  T he   li st  of   le vel  la rg Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  8 , N o.   6 Dece m ber   201 8   :   4568   -   4576   4570   1 - it em set is  then  us e to f il te an pru ne  the   transacti on  dat aset   o a ny  it e m   that  do es  no hav a ances tor  i the  le vel  la r ge  1 - it em se list  and   rem ov any  transacti on  w hich  has  no  f reque nt  it em s.  Fr om   the  le vel  la rg 1 - it em set  li st,  le vel  lar ge  2 - it em set are  de rive d.   T hen   le vel  la r ge  3 - it e m set a re  der i ve an d   so   on,   un ti there  are  no   m or fr e qu ent  it e m set to  disco ver   at   le vel  1.   Si nce  ML_T 2L de fin es  that  on ly   the  it e m s   that  are  desce ndant  f r om   fr eq uen it em at  lev el   ca be  frequ e nt  them selv es,  the  le vel  it e m set are  der ive from   the  filt ered   transacti o ta ble.  For  le ve 2,   the  la rg 1 - it e m set are  discov e red,  fro m   wh ic the  la rg 2 - it e m set are  der ive an t hen large  3 - it em sets  et c.  A fter  al l t he  f reque nt  it em se ts  are  disc overe at   le vel 2 t he  le vel  la r ge  1 - it e m set are  disco ver e a nd  s on.  ML_ T2 L re peats  unti ei ther  al le vel are  sea rc hed  us in g   Aprio ri or  no l arg e  1 - it em se ts are a  foun at   a level .   As  the   ori gin al   wor s hows  [ 5 ] - [ 6],  ML _T2L1  do e not  fi nd  cr os s - le vel  fr e qu e nt  it em s et s.  W ha ve   add e the ab il it y fo it  to  do  this. A t eac le vel b e lo 1,   w hen  lar ge  2 - it em se ts or  lat er a re d eri ved  the  Aprio ri   al gorithm   is  no restrict ed  to  just  us in the  la rge  n - 1 - it e m set at   th curre nt  le ve l,  but  can  ge ner at e   com bin at ion us in the   la r ge   it e m set fr om  higher   le vels.   The  only   rest rict ion on  thi ar that  t he  der i ved  fr e qu e nt  it em s et (s)   ca not  c on ta in   a it em   that  has  a a ncesto r - desce ndant  relat ionsh ip  with   a no t he it e m   within  the  sa m i tem set  and   that  the  m in i m u m   su pp ort   threshold  use is  that  of   the  cur re nt  le vel  being  processe d.       3.   GENER ATIO O NON - R EDU NDA NT  MU LT I - LE V EL  A SS OCIA TION  R ULES   The  us of  f re qu e nt  it e m set as  the  basis  for   Asso ci at io Rule  m ining   of t en  res ults  in  the  gen erati on   of   m any  ru le s.  More  rece nt  w ork  has  dem on strat ed  that  the   us of   cl ose it e m set s   and   ge ner at or ca r edu c e   the   nu m be of   ru le ge ner at ed  [14 ] , [ 16 ] - [ 18 ] , [ 20 ] - [ 22] Desp it this,  r edun dan cy   sti ll   exists  in  the  ru le gen e rated  fro m   m ult i - le vel  dataset eve wh e us in s om of   the  m eth ods  desig ne to  rem ov re dunda ncy.  This  redu nd a nc we  cal hi erarc hical   re dunda ncy.  Her e   in  t his  sect i on  we   fi rst  i ntr oduce  hiera rch ic al   redu nd a ncy  in   m ulti - le vel  dataset and   then   we  detai ou r   wo r to  rem ov this  redu ndancy  without  losin inf or m at ion .     3.1.   Hier archic al  Redund an c y   Wh et her   r ule   is  interest ing   and / or   us ef ul  is  us ually   deter m ined  thr ough   the  su pp or a nd  co nf i den ce   values  that  it   ha s.  H ow e ve r,   this  does  not  guara ntee  that  a ll   of   the  r ules  that  ha ve  high  en ough  s upport  a nd   confide nce  act ually   co nv ey   new  in form at i on.  F ollo wing   is  an   e xam pl tran sact ion  t able  f or  m ulti - le vel   d at aset  Ta ble 1 .       Table  1.   Sim pl M ulti - le vel  T ran sact io n Dat aset .   Tr an sactio n  I D   Ite m s   1   [1 - 1 - 1 1 - 2 - 1 2 - 1 - 1 2 - 2 - 1]   2   [1 - 1 - 1 2 - 1 - 1 2 - 2 - 2 3 - 2 - 3]   3   [1 - 1 - 2 1 - 2 - 2 2 - 2 - 1 4 - 1 - 1]   4   [1 - 1 - 1 1 - 2 - 1]   5   [1 - 1 - 1 1 - 2 - 2 2 - 1 - 1 2 - 2 - 1 4 - 1 - 3]   6   [1 - 1 - 3 3 - 2 - 3 5 - 2 - 4]   7   [1 - 3 - 1 2 - 3 - 1]   8   [3 - 2 - 3 4 - 1 - 1 5 - 2 - 4 7 - 1 - 3]       This  sim ple  m ulti - le vel  trans act ion al   datase has  le vels  with  each  it e m   belonging  to  the  lo wes t   le vel.  The  it em   ID   in  the  ta ble  store/h ol ds  the  hierar c hy   info rm at ion   for  each  it em .   Thu s the  it em   1 - 2 - belo ngs  to  the  first  cat egory  at   le vel  and   f or  le vel  it   belo ng t the  seco nd   s ub - cat e gor of   the  first  le vel  cat egory.  Final ly at   le vel  i belongs  to  th first  subcat egory  of   t he  pa ren cat eg or at   le vel  2.   Fro m   this   transacti on  se we  us the  ML _T 2L1   al gorith m   with  the  cross - le vel  ad d - on   and   m ini m u m   su ppor valu of  f or   le vel  a nd   f or  le vels   an 3.  Fro m   these  fr eq ue nt  it e m set s,  the  cl os ed  it em s et and   gen e ra tors  are   der i ved Table   2 . T he  it e m set s , close it em se ts an d gen e ra to rs  c om e fr om  all  thr ee le vels .   Finall y,  from   the  cl ose it e m set an gen e r at or t he  Asso ci at ion   Rules   can  be  gen e rat ed.   I this  exam ple,  we  us the  Re li ableExact Rule  ap proac prese nted  in  [17 ] - [ 18]   to  ge ner at the ex act   basis  r ules.  The   disco ver e ru l es  are  f r om   mu lt iple  le vels  a nd   i nclu de  cr oss - le vel  r ules.  The  Re li ableE xactR ule  ap pro ach  ca rem ov re dund ant  r ules,  bu as  we  will   sh ow,  it   does  not  rem ov hiera rc hy  re dundancy The  r ules  gi ve in   Table  are  de rive from   the  cl os ed  it em s et and   gen e ra tors  in  Ta ble  w he the  m ini m u m   con fi de nce  thres ho l is set  to 0. 5 or 5 0%   as sho wn in  Ta ble 3 .   The  Re li ableE xactR ule  a lg or it h m   li sts  al t he  ru le i Ta ble  3   as  im portant  a nd  no n - redu nd a nt.   Howe ver,  we  argue  that  the re  are  sti ll   red un dan ru le s.   This  ty pe  of   r ed unda ncy  is  beyo nd   w ha the   Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       G ene ra ti ng N on - r e dund an M ulti le vel  Asso ci ation R ules Us ing     ( R. Vija ya  Pr ak ash )   4571   Re li ableExactR ule  al go rith m   was  designed  for.   L ooki ng   at   the  ru le in  Table  we  cl aim   that  ru le   is   redu nd a nt  to  r ule  1,   r ule  is  red un dan to  ru le   5,   ru le   is  redunda nt  to  ru le   an ru l 12   is  redu ndant  to     ru le   10.  For  e xam ple,  the  it e m   2 - 2 - (fro m   ru le   4)  is  child  of  the  m or ge ner al /a bst ract  it e m   2 - 2 - (f r om   ru le   1).  Th us   r ule  is  in  fact  m or sp eci fic  ver sio of   r ule  1.   Be cause   we  know   that   ru le   say 2 - 2 - is   enou gh  to  fire  the  r ule  with   c on s eq ue nt  C,  wh e reas  ru le   requires   2 - 2 - to  fire   with   co ns e qu e nt  C,  a ny   it e m   that  is  desce nd a nt  of  2 - 2 - will   cause  r ule  to  fire  with   con se quent  C.   It  do e not  ha ve  to  be  2 - 2 - 1.  Thus  ru le   is  m or restrict ive B ecause  2 - 2 - i pa rt  of  2 - 2 - ha ving  ru le   does  not  act ually   br i ng  a ny   ne w   inf or m at ion   to  the  use r,  as  t he   inf or m at ion   c on ta ine in  it   i act ually   pa rt  of  the  i nfor m at ion   c onta ine i ru le   1.   T hus  ru le   is  re dunda nt W de fine  hi erarch ic al   redunda ncy  in  e xa ct   Associ at ion   Rules  t hro ugh  the   fo ll owin g defi niti on       Ta ble  2.   Fr e quent  Cl os e d Item se ts  and   Ge ne rators  Der ive from  t he  Fr e qu e nt  Item set in Ta ble 1   Clo sed  I te m sets   Gen erators   [1 - * - *]   [1 - * - *]   [1 - 1 - *]   [1 - 1 - *]   [1 - 1 - 1]   [1 - 1 - 1]   [1 - * - * 2 - 2 - *]   [2 - 2 - *]   [2 - * - * 1 - 1 - *]   [2 - * - * 1 - 1 - *]   [1 - 1 - * 1 - 2 - *]   [1 - 2 - *]   [1 - 1 - * 2 - 2 - *]   [2 - 2 - *]   [1 - * - * 2 - 2 - 1]   [2 - 2 - 1]   [2 - * - * 1 - 1 - 1]   [2 - * - * 1 - 1 - 1]   [1 - 2 - * 1 - 1 - 1]   [1 - 2 - * 1 - 1 - 1]   [1 - * - * 2 - 1 - * 2 - 2 - *]   [2 - 1 - *]   [2 - * 1 - 1 - * 1 - 2 - *]   [2 - * - * 1 - 2 - *]   [1 - 1 - * 1 - 2 - * 2 - 2 - *]   [1 - 2 - * 2 - 2 - *]   [1 - 1 - * 2 - 1 - * 2 - 2 - *]   [2 - 1 - *]   [1 - * - * 2 - 1 - 1 2 - 2 - *]   [2 - 1 - 1]   [1 - 1 - * 2 - 1 - 1 2 - 2 - *]   [2 - 1 - 1]   [1 - 1 - * 2 - 2 - 1 1 - 2 - *]   [2 - 2 - 1]   [2 - 1 - * 1 - 1 - 1 2 - 2 - *]   [2 - 1 - * [ 2 - 2 - * 1 - 1 - 1]   [2 - 2 - * 1 - 1 - 1 2 - 1 - 1]   [2 - 1 - 1 [ 2 - 2 - * 1 - 1 - 1]       Table  3.  E xact  basis  Associ at ion R ules  De riv ed fr om   Cl os ed Ite m se ts  and  G ene rato rs  i n Table   2   No .   Ru le   Su p p   1   [2 - 2 - * ==> [ 1 - * - *]   0 .57 1   2   [1 - 2 - * ==> [ 1 - 1 - *]   0 .57 1   3   [2 - 2 - * ==> [ 1 - 1 - *]   0 .57 1   4   [2 - 2 - 1 ==> [ 1 - * - *]   0 .42 8   5   [2 - 1 - * ==> [ 1 - * - * 2 - 2 - *]   0 .42 8   6   [2 - 1 - * ==> [ 1 - 1 - * 2 - 2 - *]   0 .42 8   7   [2 - 1 - 1 ==> [ 1 - * - * 2 - 2 - *]   0 .42 8   8   [2 - 1 - 1 ==> [ 1 - 1 - * 2 - 2 - *]   0 .42 8   9   [2 - 2 - 1 ==> [ 1 - 1 - * 1 - 2 - *]   0 .42 8   10   [2 - 1 - * ==> [ 1 - 1 - 1 2 - 2 - *]   0 .42 8   11   [2 - 2 - * 1 - 1 - 1 ==>  [ 2 - 1 - *]   0 .42 8   12   [2 - 1 - 1 ==> [ 2 - 2 - * 1 - 1 - 1]   0 .42 8   13   [2 - 2 - * 1 - 1 - 1 ==>  [ 2 - 1 - 1]   0 .42 8       Def i niti on  1 L et   R1  = X1  = > Y  a nd  R2  =   X => Y  be  t wo ex act   A sso ci at i on  Rules,   with  ex act ly   the  sam it e m se as  t he  co ns e qu e nt.  R ule  R1   is  redu nd a nt  t r ule  R2   if  (1)  the  it em set   X1   is  m ade  up  of  it e m wh e re  at   le ast   on it em   in  X1  is  desce nd a nt  from   the  it e m s   in  X a nd  ( 2)   the  i tem set   X2  is  entirel m a de  up  of   it em wh ere   at   le ast   on it e m   in  X2   is  an   ancesto of  th it e m in  X1   and   ( 3)   the  othe no n - a ncesto it e m s   in X2 a re all   present in  it e m set  X 1.   Fr om   this  def i niti on if  for  a exact  A sso ci at ion   Rule  X =>  Y1   the re  does  not  exist  a ny  oth e r ule  X2  =>  Y2   su c that at  least  o ne  it e m  in  X1  s har es a a ncestor - de scen da nt r el at ion s hip   with X2 contai ni ng  t he   ancesto r( s an al oth er  it em s   X2   are  pre sent  in  X 1,   th en  X =>  Y1   is  no n - re dundant  r ule.  To  t est   fo r   redu nd a ncy,  w ta ke  t his  de finiti on   a nd  a dd   a nothe co nd it io f or   r ule   to  be  c ons idere valid r ule   =>   Y   is  valid  if   it   ha no  a ncesto r - desce ndant   relat io ns hi betwee a ny   it e m in  it em se ts  a nd  Y T hu s ,   for  exam ple  1 - 2 - =>  1 - 2 - i not  valid  r ul e,  but  1 - 2 - = 1 - 1 - 3   is  va li ru le If  this   conditi on  is  not  m e t   by  any  r ule  X =>  Y2   w hen   t est ing   to  s ee  if   X1   =>  Y is  r edun dan to   X =>  Y 2,   t hen  X1   =>  Y is  a   non - redu nd a nt rule  as X2 =>  Y2 is  not a  valid  ru l e. Subm it  you r  m anu script ele ct ronical ly  f or  rev ie w.       Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  8 , N o.   6 Dece m ber   201 8   :   4568   -   4576   4572   3.2.   Genera t in E xa c B as is  Ru l es   As  p re vious  work   has  s ho wn   [14,   17 - 18]   us in f requ ent  cl os ed  it e m se ts  in  the  gen e rati on  of   Associ at ion   R ules  can   re duc the  qua ntit of   disc ov e red  ru le s.   Be cause   we  wish   t re m ov redunda ncy  on   top   of  the  re dunda ncy  al read bein rem o ve d,   our  ap proac us e the   cl os ed  it e m set and   ge ner at or to   disco ver  th non - re dunda nt  r ules.  [14,  17 - 18]   ha ve  both  pro posed   co nde ns e d/m or conci se  bases   to  re pr ese nt   non - re dundant   exact  r ules.  E xact  r ules  ref e to   r ules  w hose  co nfi de nce  is  1.  T he  pro pose a ppr oach  will   be   exten ded to  ot her r ules ( i.e ., so  cal le d ap pro xim a te  r ules) . T he follo wing  def i niti on outl ine these  tw o b ases:   Def i niti on   2:  Fo r   the  Mi n - Ma xEx act   (MM E)  basis is  the  set   of  th disco ver e f reque nt  cl os e it e m set s.  Fo e ach  cl os e it e m se in  C,  G is  the  set   of  gen e rato rs  for  c.  From   this  the  exact  basis  f or   m in - m ax  is: MMEHR = { g   c | c C , g G C , g c   and   t her e xists  no   ru le g c   wh e re  c   ϵ  C,  g ϵ Gc ,                  c   ≠  c ′,   g′  ≠  c′   a nd g is  descend ant set  of   g , g   has n a ncesto r or   desce ndant  of c   or  g   Def i niti on   8:  ( Re li able  Exact   Ba sis  with out  Hiera rch Re dundancy Let   be  t he  set   of   freq ue nt   cl os ed   it e m set s F or   eac fr e quent  cl os e it em se c,  le Gc  be  the   set   of   m ini m al   gen erat or s   of  c.   T he  R el ia ble  exact ba sis i s:   REH R = { g   c   |   c C , g G C , REH R = { g c | c C , g G C ,   ¬   (c  or   c     g ),   wh e re  c   ϵ  C c     c, g   ϵ  Gc , and t her e e xists n o ru le g   c   w her e c   ≠  c , g   ≠  c   a nd  is de scen dan t set   of g , g   has no a ncesto r   or   descenda nt   of   c   or   g .   Th us   the  al go rithm to  extract  non - redu ndant  m ulti - le vel  ru le us in ei ther   Mi nm axEx act HR or Rel ia ble ExactHR a re giv en  as  fo ll ows:     Algori th m  1:  Minm ax E xa c t HR()   Inp ut:  C:   set   of   fr e qu e nt  cl ose it e m set G:  set   of   m inim al   gen erato rs For  g   ϵ   G,   g.cl os ure  is  the  cl os ed   it e m set  o g.   Ou t pu t:   set   of  non - re dundan m ulti le vel r ules.   1.   Mi nMaxE xa ct : =   ф   2.   f or  eac h k= 1 t o v   3.   f or  eac h k - ge ner at or   g   ϵ   Gk   4.   nonRe dunda nt = tr ue   5.  i f g   cl osu re    6.   f or  all   g′  ϵ  G   7.  i ( g ′  ≠ g)   8.  i (  g′ is a nc est or   set  of  g )  and ( (c′ =c)  or  ( g=  )) an d(g ′  is  no t a ncest or set  of c′   9.  t hen no nRed unda nt =  false   10. brea k   14. if  no nRed unda nt = t ru e   15. inse rt { (g   →  c) g.  s upp }  in  Mi nMa xE xa ct   20. ret urn  Mi nM axEx act     Algori th m  2:  Reli ab le Ex actHR  ()   Inp ut:  C:   set   of   fr e qu e nt  cl ose it e m set G:  set   of   m inim al   gen erato rs For  ϵ   G,   g.cl os ure  is  the  cl os ed   it e m set  o g.   Ou t pu t:   set   of  non - re dundan m ulti le vel r ules.   1.  Rel ia bleE xa ct : =   ф   2.   f or  all  c   ϵ   C   3.   f or  all   g   ϵ   Gc   4.   nonRe dunda nt =  false   5 . i f     c     C s uch that c c   and c  g  ϵ   Gc,   we have  ( c  or c )   ∪  g ′    g)   6.  t hen no nRed unda nt = tr ue     7.  else   8.   nonRe dunda nt =  false   9.   break   11. fo al l g ∈  G   12. if  g ′ ≠  g   13.  if  (g′  is  an cest or   set   of   g)  and   (c ′  =c  or  g ′  =   g)  an (g′  is  no ance stor  set   of   (c   or   g a nd   (g′  is  no desce nd a nt set  of ( c   or   g′)   14. th e n n on Re dundant =  tr ue break   19. if  no nRed unda nt = t ru e   20. inse rt { (g     or g,  g.  s upp }  in  Re li able Exact   24. ret urn  Re li ableExact     Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       G ene ra ti ng N on - r e dund an M ulti le vel  Asso ci ation R ules Us ing     ( R. Vija ya  Pr ak ash )   4573   3.3.   Derivin E xa c R ules f rom  the Ex act Basi Ru le s   The  Mi n - Ma xE xact  ap proac a nd   Re li able Exact  ap proac ha ve  pro ve that  they   can  deduce  al of   the  exact  ru le s   from   their  ba sis  set   [17].  C om par ing   with   the  Mi n - Ma xE xact  ap proac an Re li able Exact  appr oach,  our  work  re su lt i a   sm aller  ex act   basis  set   by   no t   only   re m ov ing   t he  re dundant  r ules  that  ar e   rem ov ed  by  th Mi n - Ma xE xa ct   appro ac a nd   Re li ableE xa ct   appro ac h,   bu al so   rem oving   the  hiera rc hical ly  redu nd a nt r ule s.  If  w e ca rec ov e al l t he  hierar c hical ly  r edu nda nt r ules, t hen   we  can d e r ive all  the e xact ru le s   by  us in the  Mi n - Ma xE xact  or  Re li ableExac reco ve ry  al gorithm This  wil ensu re  that  al the  exact  ru le ca sti ll   be  der ived   and   by  ac hiev ing   this,  our  ap proac will   be  lossless  repre sentat ion   of   th exact  Associ at io Rules.    The  f ollo wing   al go rit hm   is  desig ne to  re cov e the  hier arch ic al ly   redu nd a nt  r ules  f rom   the  exact  basis.  By   ad din it   to  the  al gorithm us ed  by   Mi n - Ma xE xa ct   and   Re li ableExact  to  de riv the  exact  r ules  it   is  then  able  for  t he  e xisti ng  Re li ableExact  rec ov e ry  al go rith m   to  de r ive   al the  e xact  ru le s.  T his  is  beca us our   al gorithm   will   giv t hem   basis  set   that  incl ud e the  hiera r chical ly   redundan ru le s   ( wh i ch  the   Re li ableExact   appr oach   w ou l not  hav e   re m ov ed  in  the   f irst  place).   Th basic  idea  is   that,  f or  each  exact  basis  r u le fir s t   from   gen erato r to  const ru ct   a ll   po ssible  exa ct   basis  ru le whose  a nteced ent  is  descendant  of   the  e xa ct   basis  ru le   (steps   to   i Algorith m   3) T hese  rul es  are  pote ntial   exact  basis  rul es  that  m igh hav e   be en   el i m inat e du e   to  t he  a nc est or - de sce nda nt  relat io ns hi p.  The c heck  to   m ake  su re  t he se  pote ntial   r ules  are  valid  (st eps  to  12 ),   finall y,  from   the  pote ntial   exact  r ul es  to  fin e xa ct   basis  ru le s.   These  e xact  ba sis  r ules  ha ve   bee el i m inate d du e  to  the  an c est or - desce ndant  rel at ion s hip   (ste ps 1 t o 18).     Algori th m  3:  DeriveE xa c tH ( )   Inpu t:   Set o e xact b a sis r ules  d e no te as Ex ac tba sis , set  of  frequ e nt clo sed  it e m set andg ener at or s   G.   Out p ut:  Set  of  rules t hat c ove rs  the  ex act   bas isa nd the  hiera rch ic al ly  r e dundant  r ules.   1.   Re c overe d:     2.   r   Exact  basi s   3.   Ca ndidate B asi s : =    4.   f or  all   gen e r at or   i G   5.   i a ny of the   it e m   in the  a ntecede nt  of  ru le   r: X   Y   i s the a ncesto r of  g .   6.  t hen ad al the possi ble s ubset of  into   S   8.   f or  all   in  S ,  ch ec e ver y,   x   if  do e sn’t ha ve  a  d esc e nd a nt in   s ,  add  to  t m ake  descenda nt  set   of  X   9.  i has  no a ncesto rs  i a nd  has n o des cend a nts i and f or all  it e m i   t her e a re  no a ncesto r - desce nd a nt r el at ion with it e m   i   s   a nd fo r  all  it e m   i   there  are n a nc e stor - desce nda nt r el at io n wit h i tem   i   Y   10. th e i ns ert  s   Y in Ca nd i da te Ba sis   13. fo al B   Ca nd i dateB asi s   14. if   B U D = it e m set   an =  g G i   15. inse rt { B   D g. s upp } i Re cov e red   19. ret urn  Exac tbasis  Re co ve red       4.   E X PERI MEN TS   Ex per im ents  wer c onduct ed  to  te st  and e valuate  the  ef f ect iveness  of   t he  pro pose hi erarch ic al ly   non - re dundant   exact  basis  a nd  toc onfirm   that  it   is  al so   l os sle ss  basis  s et This  sect io pr ese nts  a nd   detai ls  the expe rim ent s and t heir resu lt s.     4.1.   Datasets   We  us ed   dat aset t te st  our  a ppr oac to   disco ve w het her   it   r ed uce the  siz of  the   exact  basis   ru le   set   an t te st  that  the   ba sis  set   was   lo ssless,  m eaning   al the   r ules  cou l be  recov ered.  T hese  da ta set s   wer c om po se of  10 0,   20 0,  500,   2000  an 50 00   tra ns ac ti on an are   nam ed  to  r especti vely T he  key   sta ti sti cs f or  t he se buil tdata set s ar detai le i Ta ble  4.       Table  4.   O btained  F reque nt it e m set s u sin E xact Ba sis   Dataset   MM E   MM EHR   RE   REHR   A   15   10   13   9   B   106   68   80   58   C   174   134   113   89   D   577   429   383   305   E   450   405   315   287   F   725   602   91   80   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  8 , N o.   6 Dece m ber   201 8   :   4568   -   4576   4574   Wh e re  as  the  pro po se al gor it h m MM re du ce le ss  nu m ber   of   ru le com par ed  to  MM EHR.  Th e   MM EHR  al gorithm con side rs  the  cr os le vel  hierar c hy  a nd   c on ta in m or data,  at   this  le vel  it   red uc ed  the   m or nu m ber   of  r ules,  it   in di cat ed  that  at   hierar c hy  t he  data  is  duplica te an the  propose al gorithm is   reduce th os r eplic at ed dat a nd pr oduce m or e  r el ia ble a nd acc ur at r ules.   Si m il arly fo RE  an RE HR  al gorithm has  ge ner at e the   dif fer e nt  r ules   at   with  a nd  w it ho ut  c r oss   le vels  hie ra rchy At  cro ss  le ve there  will   be   m or data  so   m or ru le are  gen e rated  by  REHR  al gorith m   than  the  RE  al gorit hm   wh ere  as   the  ML _T2L1  al gorithm   has  gen e rated   th  sa m ru le wit and  with out  cr os le vel   hierar c hy.  T hu the  pro pose work   has  ge ne rated  m or re li able  and   acc ur at al gorit hm   than  the  M L_T 2L 1   al gorithm .       Fig ure   2. Mult i Level  Associ a ti on  R ules         Fig ure   3. Com par is on of MM E , MMEHR  A l gorithm s w it h M l_T2 L 1       40% 50% 60% 70% 80% 90% 100% MME ML_ T2L 1 MM EHR ML_ T2L 1 Redu ction  Ru le in % Co mpa ri so of   MM E,  MM EHR  Algo ri th ms  an ML_T2 L1 A B C D E F Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       G ene ra ti ng N on - r e dund an M ulti le vel  Asso ci ation R ules Us ing     ( R. Vija ya  Pr ak ash )   4575       Figure  4. Com par is on of RE , R EHR A l gorithm s w it Ml _T 2L 1       5.   CONCL US I O N   Re dundancy  i Associ at ion  Rules  af fects  th qual it of   th inf or m at ion   pr ese nted   an this  aff e ct s   and   reduces  t he  us of   t he  ru le   set T he  go al   of   redu ndancy  el im inati on   is  to  im pr ov t he  qual it y,  thu al lowing  them   to  bette s olve   pro blem bei ng   face d.   Our  work  ai m to   rem ov hiera rc hical   redu nd a nc in   m ul ti - le vel  dataset s,  thu reducin the  siz e   of   the  ru le   se to  i m pr ov t he  qual it and  us ef uln es s,  w it ho ut   causin t he  los of  a ny  inf orm at ion W e   ha ve  propose a ap proac w hi ch  rem ov es   hie rar c hical   re dundanc y   thr ough  t he  use   of   f re qu e nt  cl os ed  it em set and   ge ner at ors This  al lows  it   to  be  ad ded   t ot her   a ppro a che s   wh ic al s re m ov redu nd a nt  r ules,  t her e by   al lowing  use to   rem ov as  m uch   re dundancy  a po ssi ble.  T he   nex ste i our  work  is  to   ap ply  this  a ppr oa ch  to   th e   ap pro xim a te   basis  r ul set   to  rem ov re dundancy  t here .   We  will   al so   r eview  our  wor to  se if  the re  are  oth e hierar c hical redu nd a ncies  in   th basis  r ule  se ts  that   sh oul be  rem ov e a nd  will   inv e sti gate  w ha sh ould  an ca be   do ne  to  further  im pr ov t he  q ualit of   m ul ti - le vel A ss ociat ion R ules.       REFERE NCE S   [1]   Ba y ard o,   R . J.,   A gra wal,   R .   Gunopulos,  D.  Constrai nt - b ase rule   m ini ng  in  la rg e, dense   d at ab ase s”.   Data  Mini ng   and  Knowle dg e Dis cov ery ,   Vol  4 ,   pp .   217 - 240 ,   2 000.   [2]   Berr y ,   M.J.A.   &   Li noff,   G.S.  D at Mini ng  Tech nique for  Marke ti ng  Sale and  Custom er  Suppo rt” .   John  Wiley   and  Sons ,   1997 .   [3]   Brin,   S. ,   Motwa ni,   R. ,   Ul lman,   J . D.  Tsur,   S.  D y namic  it ems e counting  and  i m pli ca ti on   rule for  m ark et   bask e t   dat a ”  Pro ce ed in gs of   th 1997   A CM  SIGMO D Conf ere nc e,   pp.   2 5 5 - 264,   1997 .   [4]   Gante r, B.   &   W il le,  R .   Form al   Conce pt   Anal y si s: Ma the m atic al   Foundati ons”,   S pringer - Ve rlag ,   1999.   [5]   Han,   J.  Fu,  Y.  Discove r y   of  m ult ipl e - l eve As socia ti on  Rul es  from   la rge   dat ab ase s”,   Proc e edi ngs  of  the   21 st   Inte rnational   Co nfe renc on   Ve r Lar ge  Databas es ,   pp .   420 - 431 ,   1995.   [6]   Han,   J.  Fu,  Y.  Mining  m ult ipl e - l eve As soci at ion  Rul es  in  large  dat ab ase s”,   I EE Tr ansacti o ns  on  Knowle dge   and  Data  Eng in ee ring,   Vol  11   p p.   798 - 805 ,   199 9.   [7]   Han,   J.  Fu,  Y.  Mining  m ul ti ple - l eve As soci at ion  Rul es  in  large  dat ab ase s”,   I EE Tr ansacti o ns  on  Knowle dge   and  Data  Eng in ee ring ,   Vol  11 ,   p p.   798 - 804 ,   200 0.   [8]   Hong,  T. P . ,   Li n ,   K.Y.   Ch ie n ,   B. C .   Mining   fuz z y   m ul ti pl e - le ve As socia t io Rule from   q uant itati v d at a .   Applie In te l li ge n ce ,   Vol .   18 ,   p p.   79 - 90 ,   2003 .   [9]   Ka y a,   M.   Al haj j ,   R.   Minin m ult i - cro ss - level  fuz z y   we igh te As socia t ion   Rule s”  2nd  Int ernati onal  I EE E   Confe renc on   I nte lligent Sy st ems ,   pp.   225 - 230,   2 004.   [10]   Kr y szki ewic z ,   M.,   R y binski ,   H.  Ga je k ,   M.  Data le ss   tra nsi t ions  b et wee n   co nci se  rep rese nt a ti ons  of  fre qu en pat t ern s”,   Journ al  of   Intelli g ent I nformation  Syst e ms ,   Vol.   22 ,   pp .   41 - 70,   2004 .   [11]   Ng,  R. T . ,   L aks hm ana n,   V.,   H a n,   J.  Pang ,   A.  Expl ora tor m ini ng  and  pr uning  oti m izati o ns  of  constra ined   As socia ti on  Ru l es” .   Proceed ings   of the   SIGMO D c onf ere nc e ,   pp.   13 - 24,   1998 .   [12]   Pasquier,   N. ,   B asti de ,   Y.,   Ta ou il ,   R .   L akhal,  L.   Eff i ci en m ini ng  of  associa ti on  rultes  using  cl osed  i te m set   la ttic es” .   Journa of   Intelli g ent In formation  Syst e ms ,   Vol.   24 ,   pp .   25 - 46,   1999 .   [13]   Pasquier,   N. ,   T aoui l ,   R. ,   B astide,   Y. ,   Stum m e ,   G.  La kh al,   L.   Gene rating   conde nsed  r epr ese nt at ion  fo As socia ti on  Ru l es” , .   Journal   of   I nte lligent Inf orm ati on  S yste ms ,   V ol.   24 ,   pp .   29 - 60 ,   2005 .   [14]   Srikant ,   R. ,   Vu,   Q.  Agrawal ,   R.   Mining  Associ at ion  Ru le with  it em  cons tr ai nts” ,   Proceedi ngs  of  the   KDD  Confe renc e ,   pp.   67 - 73,   1997 .   50% 60% 70% 80% 90% 100% RE ML_ T2L 1 REH R ML_ T2L 1 Redu ction  Ru le in % Comparison of   RE RE HR  Algorit hms an ML_T 2L1 A B C D E F Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  8 , N o.   6 Dece m ber   201 8   :   4568   -   4576   4576   [15]   Tha kur,  R. S. ,   J ai n,   R. C .   &   Pa rda sani,  K.P.  Mining  le v el - cr oss ing  As socia tion  Rule from   la rge   databa ses” ,   Journal  of   Computer  Sc ie nc e ,   pp.   76 - 81,   2006.   [16]   W il le ,   R .   Restr uct uring  la t ti c es  the or y :   An  app r oac base d   on  h ie rar chi es  of  con ce pts  Order ed  Sets”,   Dor drec h t - Boston,   1982 .   [17]   Xu,  Y.  Li,  Y.  Gene rat ing  con ci se  As socia t ion   Rule s”,   Proc eedings  of  the  16 th   ACM  Conf ere n ce   on  Con fe renc on  Information  a nd  Knowle dg e Manageme nt  ( CIKM07) ,   pp.   781 - 790,   2007 .   [18]   Za ki ,   M.J.   Gene rating  nonr edun dent   As sociation   Rule s” ,   Proceed ings o f the   KDD   Confe renc e ,   pp.   34 - 43,   2000 .   [19]   Za ki ,   M.J.  Mining  non - red unda nt  As socia ti on  Rule s”,   Data  Mi ning  and  Knowle dge  Discov ery ,   Vol.   9,   pp.   223 - 248,   2004 .   [20]   Zi egler,   C . N.,   McNee ,   S.M. ,   Kons ta n,   J.A  La usen,   G.  Im proving  rec om m enda ti on  lis ts  through  topi dive rsifi ca t ion”,  Proce ed .   o th e 14 th   Int er.   World   Wide We b   Conf ere nce ,   pp .   22 - 3 2,   2005 .   [21]   Raj endr Prasad,   Optimiz ed  High - Utilit Ite m sets  Mini ng  for  Eff ec t iv As socia ti on   M ini ng  Paper ,   Inte rnational   Jo urnal  of El e ct ri c al  and  Comput er  Engi n ee ring   ( IJE CE) ,   Vol.   7,   No.  5 ,   pp   2911 - 29 18.   [22]   Sus hil   Kum ar  Verm a,   R. S.  Th akur ,   Shai le sh  Jaloree   . Fuz z y   As socia ti on  Rul Mining  base Model  to  Predi ct  Student s’  Perfor m anc e,   In te rnati onal  Jo urnal  of   El e ct rica and  C omputer  Engi ne ering  ( IJE CE) ,   Vol.   7,   No .   4,   p p.   2223 - 2231.     [23]   Harc Le sli Hendri Spits  W arn ars,   Us ing  A tt ribute  Orien t ed   Induc ti on  High  Le vel   Emergin Patt ern   (AO I - HEP)  to  Mine  Freque nt  Pat te rns ”,   Int ernati onal  Journal  of  Elec t ric al  and  Computer  Engi ne erin ( IJE CE) ,   Vol.   6,   No.  6,   pp.   3037    3046.     [24]   Bena ka  Santhos ha  S,  Chit ra  Kir an  N,  Sy ste m at ic   Review  of  Exi sting  Dat Mining  Approac hes  Envi sioned  f or   Know le dge  Disc over y   from   Mult imedia ,   In te rna ti onal  Journal  o f   Elec tri cal   and   C omputer  Engi n ee ring  ( IJE CE) Vol.   8 ,   No.   2,   pp .   908 - 916 ,   2018 .   [25]   Le en Deshpande ,   M.  Narsing  Rao,   Conce pt  Drift  Ide nti f ic a ti on  using  Cla ss ifi er  Ense m ble   Approac h” ,   Inte rnational   Jo urnal  of El e ct ri c al  and  Comput er  Engi n ee ring   ( IJE CE) ,   Vol.   8,   No.  1 ,   pp .   19 - 2 5 ,   2018.   Evaluation Warning : The document was created with Spire.PDF for Python.