I nte rna t io na l J o urna l o f   E lect rica l a nd   Co m p ute E ng in ee ring   ( I J E CE )   Vo l.   9 ,   No .   3 J u n e   201 9 ,   p p .   2 0 9 4 ~ 2 1 0 2   I SS N:  2 0 8 8 - 8708 DOI : 1 0 . 1 1 5 9 1 / i j ec e . v9 i 3 . p p 2 0 9 4 - 2102          2094       J o ur na l ho m ep a g e h ttp : //ia e s co r e . co m/ jo u r n a ls /in d ex . p h p / I JE C E   Da ta  m ining  t e ch ni ques a pplica tio n f o r pr ediction   in  O LA c ube       As m a   L a m a ni ,   B ra hi m   E rr a ha ,   M a lik a   E l k y a l,  Abda lla h   Sa ir   L a b o ra to ry   o f   In d u strial  En g in e e r in g   a n d   C o m p u ter S c ien c e   (L G 2 I ) Na ti o n a S c h o o o f   A p p li e d   S c i e n c e s,   Un iv e rsit y   Ib n   Z o h r   A g a d ir,   M o r o c c o       Art icle  I nfo     AB ST RAC T     A r ticle  his to r y:   R ec eiv ed   J u n   5 ,   2 0 1 8   R ev i s ed   No v   2 8 ,   2 0 1 8   A cc ep ted   Dec   2 5 ,   2 0 1 8       Da ta  wa re h o u se re p re se n c o ll e c ti o n s   o f   d a ta  o rg a n ize d   to   su p p o rt   a   p r o c e ss   o f   d e c isio n   su p p o rt ,   a n d   p ro v id e   a n   a p p ro p riate   so lu ti o n   f o m a n a g in g   larg e   v o lu m e o f   d a ta.  O LA P   o n li n e   a n a ly ti c s   is  a   t e c h n o lo g y   th a c o m p le m e n ts   d a ta  w a re h o u se to   m a k e   d a t a   u sa b le  a n d   u n d e rsta n d a b le  b y   u se rs,   b y   p ro v id in g   to o ls  f o v i su a li z a ti o n ,   e x p lo ra ti o n ,   a n d   n a v ig a ti o n   o f   d a ta - c u b e s.   On   th e   o th e h a n d ,   d a ta  m in in g   a ll o w th e   e x tra c ti o n   o f   k n o w led g e   f ro m   d a ta  w it h   d if f e r e n m e th o d o f   d e sc rip ti o n ,   c las sif ica ti o n ,   e x p lan a ti o n   a n d   p re d ictio n .   A p a rt  o f   th is  w o rk ,   w e   p ro p o se   n e w   wa y s   t o   im p ro v e   e x isti n g   a p p ro a c h e in   th e   p ro c e ss   o f   d e c isio n   su p p o rt.   I n   t h e   c o n ti n u it y   o th e   w o rk   trea ti n g   th e   c o u p li n g   b e t w e e n   th e   o n li n e   a n a ly sis a n d   d a ta m in in g   to   in teg ra te  p re d ictio n   in t o   OLA P ,   a n   a p p ro a c h   b a se d   o n   a u to m a ti c   lea rn in g   w it h   Clu ste rin g   i p ro p o se d   in   o rd e t o   p a rti ti o n   a n   i n it ial   d a ta   c u b e   i n t o   d e n se   su b - c u b e th a c o u l d   se rv e   a a   lea rn in g   se t   to   b u il d   a   p re d ictio n   m o d e l.   T h e   tec h n iq u e   o f   d a ta  m i n in g   b y   r e g re s sio n   tree is  th e n   a p p li e d   f o r   e a c h   su b - c u b e   to   p re d ict  t h e   v a lu e   o f   a   c e ll .   K ey w o r d s :   A u to m a tic  lear n i n g   C lu s ter i n g     D ata  m i n i n g     OL A P   P r ed ictio n   Co p y rig h ©   2 0 1 9   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e .     Al rig h ts re se rv e d .   C o r r e s p o nd ing   A uth o r :   As m L a m a n i,    L ab o r ato r y   o f   I n d u s tr ial  E n g i n ee r in g   a n d   C o m p u ter   Scie n ce   ( L G2 I ) ,   Natio n al  Sc h o o l o f   A p p lied   Scien cE ,   Un i v er s it y   I b n   Z o h r   Ag ad ir ,   Mo r o cc o .   E m ail: a s m a. la m a n i @ g m ail. c o m       1.   I NT RO D UCT I O N   Data   w ar eh o u s es   ar d atab ases   o f   i n f o r m atio n   s p ec i f icall y   s tr u ct u r ed   f o r   an a l y s is   a n d   d ec is io n   m ak in g   [ 1 ] .   T h d ata  a r s u b j ec t - o r ien ted ,   in te g r ated ,   ti m e - v ar ian t,  an d   n o n - v o latil o r g an ized   in   m u ltid i m en s io n al  w a y   [ 2 ].   T h s tar   s ch e m as  in itiall y   p r o d u ce   d ata  cu b es  s u itab le  f o r   an al y s i s .   Seco n d l y ,   it  is   to   th u s er   to   b r o w s e,   e x p lo r an d   a n al y ze   c u b e’ s   d ata  to   ex tr ac r ele v an t   in f o r m a tio n   f o r   d ec is io n   m ak i n g .   T h is   is   an   o n l in a n al y s is   u s i n g   O L A P   tech n o lo g y ,   d ata  cu b is   m u ltid i m e n s io n al  r ep r esen tatio n   o f   th e   d ata,   ea ch   ce l i n   a   d ata  c u b r ep r esen ts   a n   a g g r eg ated   f ac t   d escr ib ed   b y   an al y s is   ax e s .   T h ese   co r r esp o n d   to   th d i m en s io n s   o f   t h c u b e.     T h f ac is   o b s er v ed   b y   a   m ea s u r w h ic h   i s   as s o ciate d   w it h   an   ag g r eg at io n   f u n ctio n   ( SUM,   A VG,   M A X,   MI N) .   A   d i m en s io n   ca n   b o r g an ized   in   h ier ar ch y ,   th er e f o r th f ac ts   ca n   b o b s er v ed   ac co r d in g   to   d if f er e n le v els  o f   g r a n u lar i t y .   T h in f o r m atio n   is   t h er ef o r ag g r eg ated   in   t h c u b ac co r d in g   to   th u s er   n ee d s .     I n   an o th er   s id e,   d ata  m i n i n g   ca n   ex tr ac k n o w led g f r o m   d ata  an d   h as  w id v ar iet y   o f   m et h o d s   w it h   d if f er e n an al y tical  o b j ec tiv es.  I n   d ec is io n - m a k in g   p r o ce s s ,   u s er   o b s er v es  th OL A P   cu b f ac t s   in   o r d er   t o   ex tr ac u s ef u i n f o r m atio n .   T h is   also   allo w s   th u s er   to   an ticip ate  th r ea lizatio n   o f   f u t u r ev e n ts .   I n d ee d ,   th O L A P   tec h n o lo g y   is   li m ited   to   ex p lo r ato r y   ta s k s   an d   d o es  n o t p r o v id au to m ati to o ls   to   h elp   a n d   g u id th u s er   in   t h d ee p e n in g   o f   h i s   an al y s i s ,   to   ex p lain   v al u es  o f   ce lls ,   ex is ti n g   ass o ciatio n s   in   th e   m u ltid i m en s io n al  d ata,   o r   to   p r ed ict  v alu es i n   t h d ata  cu b e.   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g     I SS N:  2 0 8 8 - 8708       Da ta   min in g   tech n iq u es a p p li ca tio n   fo r   p r ed ictio n   i n   OLAP   cu b e   ( A s ma   La ma n i )   2095   W h ile  d ata m i n i n g   tech n iq u es  ar ef f ec ti v ap p r o ac h es  to   g u id t h an al y s an d   e x tr ac n e kn o w led g e .   T h u s   n e w   p r o b le m atic  O L A P   h as  ap p ea r ed .   Sin ce   t h en d   o f   th 9 0 s ,   s e v er al  w o r k s   [ 3 ] - [ 5 ]   p r o p o s to   ass o ciate   th e   p r in ci p les o f   th e   O L A P   w it h   t h m e th o d s   o f   d ata  m i n in g   to   en r ic h   th e   o n li n a n al y s i s   an d   n o   lo n g er   li m it it to   s i m p le  ex p lo r atio n   o r   s i m p le  d at v is u aliza tio n .   C o u p lin g   o n l i n an al y s is   a n d   d ata  m i n in g   is   t h e n   r ef er r ed   to   ter m s   as  O L AM   ( O n - L i n An al y tical   Mi n in g )   [ 3 ] ,   OL A P   I n te lli g en ce ,   Mu ltid i m e n s io n a l M in in g .   As  p ar o f   t h co u p li n g   b et w e en   o n li n a n al y s i s   a n d   d ata  m i n in g ,   w p r o p o s in   th i s   w o r k   d ec is io n   s u p p o r p r o ce s s   th at  co m b in e s   OL A P   tec h n o lo g y   w it h   u n s u p er v is ed   class if icatio n   tec h n iq u es  a n d   p r ed ictio n   tech n iq u es   to   i n te g r ate  t h p r ed ictio n   i n   c u b e.   I n   f ac t,  to   h a v m o r p r ec is io n   i n   t h p r ed ictio n ,   it  is   e s s e n tia l   to   w o r k   o n   h o m o g e n eo u s   d a taset,  th at 's  w h y   w p r o p o s t o   p ar titi o n   th in itial  cu b in   d en s s u b - cu b e s   b y   ap p ly i n g   m e th o d s   o f   clu s ter in g   th e n   ap p l y i n g   r eg r es s i o n   tr ee   tech n iq u f o r   th c o n s tr u ct io n   o f   th e   p r ed ictio n   m o d el.       2.   R E L AT E WO RK   Sev er al  ap p r o ac h es  h a v b ee n   p r o p o s ed   f o r   co u p lin g   d ata   m i n i n g   an d   o n li n a n al y s is   to   ex te n d   OL A P   to   p r ed ictio n .   I n   th e   w o r k   o f   R iad   B en   Me s s ao u d   [ 6 ] ,   th e   au t h o r   h as  d e f i n ed   t h r ee   co u p li n g   ap p r o ac h es,  p r o ce s s   o f   tr an s f o r m i n g   m u ltid i m en s io n al   d at in to   t w o - d i m e n s io n al  d ata,   t h s ec o n d   ap p r o ac h   is   b ased   o n   t h e x p lo itatio n   o f   to o ls   o f f er ed   b y   m u l tid i m e n s i o n al  d atab ase  m an a g e m en t   s y s te m s ,   a n d   th t h ir d   is   to   ev o lv t h d ata  m i n i n g   al g o r ith m s   to   ad ap t th e m   w it h   t h t y p es o f   d ata  h an d led   b y   t h cu b es.   As  p ar o f   t h co u p lin g ,   n e w   p r o p o s als  ar e m er g i n g .   T h e y   co n s i s o f   u s in g   s tati s tical  a n d   m ac h i n e   lear n in g   m et h o d s   f o r   p r ed ictio n   i n   o r d er   to   en r ich   t h ca p ab i liti es  o f   o n li n a n al y s i s .   Sar a w a g a n d   al  [ 7 ]   u s e   p r e d ictio n   b y   b u ild i n g   cu b o f   p r ed icted   v alu es  f r o m   t h i n itial  d ata  cu b e,   th lear n i n g   b ase  is   th o r ig in a cu b e,   an d   t h m o d el  i s   b ased   o n   lo g - li n ea r   r eg r es s io n .   De v iatio n s   b et w ee n   t h t w o   c u b es  ca n   in d icate   to   th e   u s er   ex ce p tio n a v al u es.  T h es ex ce p t io n al  ce lls   ar th e n   s i g n aled   to   th u s er   w h e n   n a v i g atin g   th d ata  cu b w it h   t h r ee   in d icato r s   t h at  also   s h o w   h i m   i n ter es tin g   p ath s   to   ex p lo r e.   T h w o r k   o f   C h e n g   [ 8 ]   is   ai m ed   at  p r ed ictin g   n e w   f ac t s .   So   h p r o p o s es  to   g e n er ate  a   n e w   c u b e   u s i n g   g en er alize d   lin ea r   m o d el.   T h r esu lti n g   cu b co r r es p o n d in g   to   th e   p r ed ictio n   m o d el.   Han   a n d   al  [ 9 p r o p o s es  to   p r ed ict  n e w   f ac m ea s u r b y   id en t if y i n g   s u b s ets  o f   i n ter esti n g   d ata.   T h p r ed ictiv m o d el  is   a   cu b w h er th m ea s u r in d ic ates  s co r o r   p r o b ab ilit y   d i s tr ib u tio n   a s s o ciate d   w it h   th m ea s u r v al u t h at   ca n   b ex p ec ted   in   th o r ig in al   cu b e,   r esu lti n g   c u b co r r esp o n d s   to   th m o d el  to   b u s ed   f o r   p r ed ictio n .   Y.   C h e n   a n d   P ei's  p r o p o s al  [ 10 ]   co n s is ts   o f   b u ild in g   c u b es  b ased   o n   li n ea r   r eg r e s s io n .   Fro m   t h e   in itial  d ata  c u b e,   cu b ic  m ea s u r is   g en er ated   w h er ea ch   v alu i n d icate s   t h w ei g h o f   e v id en ce .   C o n t in u i n g   o n   th w o r k   o f   Sar a w a g i,  w h ich   f o cu s e s   o n   t h aid   to   n a v ig atio n   a n d   also   o n   th e x p la n atio n   o f   t h f ac t s ,   A . Sa ir   [ 11 ]   p u s h e s   t h e   li m its   o f   e x p lo r a to r y   n av i g atio n   b y   i n j ec tin g   p r ed ictio n   tech n iq u es   at  t h h ea r o f   OL A P   p r o ce s s es,  th i s   w o r k   is   b ased   o n   t h i n te g r atio n   o f   a   co m p lete  lear n in g   p r o ce s s   in   OL A P   f o r   o n li n e   d ata  m in i n g .   A   co m p lete  p r o ce s s   th e n   i n cl u d es  s elec tio n   p h ase  o f   t h ex p la n ato r y   v a r i ab les,  f ac s h ar i n g   p h ase  in   lear n i n g   s a m p le  an d   test   s a m p le.   Nex t,  lear n in g   p h ase  a n d   v alid atio n   p h ase  ar ex ec u ted .   A . Sa ir   [ 11 ]   p r o p o s es  an   ap p r o ac h   b ased   o n   au to m atic   lear n in g   w i th   r eg r es s io n   tr ee s   i n   o r d er   to   p r ed ict  th v alu o f   an   a g g r e g a te  o r   m ea s u r e.   Oth er   w o r k   in v o lv e s   ap p l y i n g   m eth o d s   f o r   p ar titi o n i n g   O L A P   cu b es.  T h r esear c h   o f   R . Mis s ao u i   an d   C . Go u tte  [ 1 2 ]   p r o p o s es  to   an al y ze   th p o te n tial  o f   a   p r o b ab ilis tic  m o d elin g   tech n iq u e,   ca lled   “n o n - n eg at iv e   m u lt i - w a y   ar r a y   f ac to r izatio n ”,   f o r   ap p r o x i m atin g   a g g r e g a te  a n d   m u lt id i m e n s io n al  v alu e s .   Usi n g   s u c h   tec h n iq u e,   th e y   co m p u te  t h s et  o f   co m p o n e n ts   ( cl u s ter s )   th at  b es f i th in itial  d ata  s et  an d   w h o s s u p er p o s itio n   ap p r o x i m ates  th o r ig in al  d ata.   T h g en er ated   co m p o n e n t s   ca n   t h en   b e x p lo ited   f o r   ap p r o x im a tel y   a n s w er i n g   O L A P   q u er ies s u c h   as r o ll - u p ,   s li ce   an d   d ice  o p er atio n s .       3.   O UR  AP P RO ACH   Ou r   w o r k   is   p ar o f   ap p r o ac h   o f   th e   co u p li n g   b et w ee n   d ata   m i n in g   a n d   o n l in a n al y s is   to   p r ed ict  th e   m ea s u r ed   v al u f o r   n o n - e x is te n f ac ts   o r   f ac ts   w it h   m is s i n g   v a lu e.   T h id ea   i s   to   p ar titi o n ,   u s i n g   m et h o d s   o f   clu s ter i n g ,   an   i n itia d ata  cu b in to   d en s s u b - c u b es  th a c o u ld   s er v as  lear n i n g   s et  t o   b u ild   p r ed ictio n   m o d el.   T h ch o ice  to   u s i n g   d en s s u b - c u b es  i s   j u s tifie d   b y   th e   q u alit y   o f   t h in f o r m at io n   o b tain ed   b y   t h es e   d en s s u b - cu b e s ,   an d   it  w ill  b m o r in ter es tin g   to   s ea r ch   in   th p r ed ictiv m o d el  o f   s u b - c u b w h ic h   co n tain s   th ce ll d esi g n a ted   b y   t h u s er   th an   lo o k   t h r o u g h   o f   all  d ata  cu b e.   I n   th i s   w o r k ,   w d is c u s s   t h f i r s p ar co n ce r n in g   t h ap p licatio n   o f   cl u s ter i n g   f o r   t h p ar titi o n in g   o f   th i n itia cu b e;   w f ir s m a k an   e x p er i m e n tal  s t u d y   o f   t h clu s ter in g   m et h o d s   a n d   th e n   ap p l y   th c h o s e n   m et h o d   o n   o u r   r ea cu b e.   I n   t h s ec o n d   p ar t,  w ap p l y   th e   r eg r ess io n   tr ee   m et h o d   f o r   t h co n s tr u ctio n   an d   v alid atio n   o f   th p r ed ictio n   m o d el  f o r   ea ch   s u b - c u b e;   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  9 ,   No .   3 J u n 2 0 1 9   :   2 0 9 4   -   2 1 0 2   2096   Fin all y ,   w p r o ce ed   to   th p r ed ictio n   o f   t h v al u o f   t h ce ll  d esig n ated   b y   t h u s er   th r o u g h   t h e   m o d el  o f   th s u b - cu b i n   w h ic h   is   t h s elec ted   ce ll.     3 . 1 .     Clus t er ing   m et ho d s   W ith   t h in cr e a s o f   t h i n f o r m atio n   o b tain ed   d u r in g   t h wo r k   o f   in f o r m a tio n   p r o ce s s e s ,   tr ea t m e n t   b ec o m e s   d if f ic u lt.  T h n ee d   f o r   an   in it ial  tr ea t m en t   o f   t h i n f o r m atio n   f o r   its   s tr u ctu r i n g ,   th i s o latio n   o f   th e   ch ar ac ter is tic  f ea t u r es,  g e n er al izatio n ,   s o r tin g   ap p ea r s .   Fo r   th is   p u r p o s e,   clas s i f icatio n   a n d   clu s ter i n g   p r o ce s s es a r u s ed   to   p er f o r m   t h r eq u ir ed   i n f o r m atio n   tr ea t m e n f o r   later   an al y s is   b y   s p ec ialis t.   P ar titi o n in g   o b s er v atio n s   i n to   g r o u p s   o f   s i m il ar   o b j ec ts   m a k es  it   p o s s ib le  to   s i m p li f y   t h e   f u r t h e r   tr ea t m e n o f   d ata   an d   d ec i s i o n - m a k in g   b y   ap p l y in g   to   ea c h   cl u s ter   its   m et h o d   o f   an al y s i s .   C l u s ter in g   is   t h p r o ce s s   o f   g r o u p in g   s i m ilar   o b j ec ts   in to   d if f er e n g r o u p s ,   o r   m o r p r ec is el y ,   t h e   p ar titi o n in g   o f   d ata  s et  in to   s u b s ets,  s o   th at  t h d ata  in   ea ch   s u b s e a cc o r d in g   to   s o m d ef i n ed   d is tan ce   m ea s u r [ 1 3 ].   T h s tar tin g   p o in o f   o u r   ap p r o ac h   is   to   co n d u ct  e x p er i m e n t s   o n   th r ee   d i f f er e n al g o r ith m s ,   th f ir s t   is   b ased   o n   h ier ar ch ica m eth o d ,   w u s H A C   al g o r ith m ,   t h s ec o n d   i s   b ased   o n   t h d is ta n ce ,   w u s e   th K - m ea n s   alg o r it h m ,   a n d   t h last   is   m o d el - b ased   m et h o d ,   th E M   al g o r ith m .   T h ese  a l g o r ith m s   r eq u ir to   s p ec if y   th n u m b er   o f   cl u s ter s   as in p u t p ar a m e ter s .   T h ch o ice  o f   th e   cl u s ter i n g   m et h o d   u s ed   in   o u r   s tu d y   i s   b ased   o n   t h e v alu a tio n   o f   t h q u alit y   o f   th e   r es u lt.  I n d ee d   th e v al u ati o n   o f   a   clu s ter i n g   al w a y s   co n t ain s   p ar o f   s u b j ec tiv i t y   an d   th at  i is   i m p o s s ib le   to   d ef in a   u n i v er s al  cr iter io n   w h ic h   w o u ld   allo w   a n   u n b ia s ed   ev al u atio n   o f   all   th e   r esu l ts   p r o d u ce d   b y   all   th m et h o d s   o f   clu s ter i n g .   Ho w e v er ,   n u m b er   o f   cr iter ia  ex is an d   ar u s ed   r ec u r r en tl y   b y   m a n y   r esear c h er s   to   co m p ar t h r es u lt s   o b tain ed .   Sin ce   t h er ar lar g n u m b er   o f   p o s s ib le  cl u s ter in g   r esu lt s   f o r   th s a m e   d ataset,   th g o al  i s   to   ev al u ate  w h et h er   o n o f   th e s r es u lts   i s   b etter   th an   an o t h er .   B o th   alg o r it h m s   h a v b ee n   i m p le m en ted   o n   t h s a m d ataset  to   a n al y s e   th e ir   p er f o r m an ce s ,   b y   ta k i n g   s a m n u m b er   o f   clu s ter s   ( 3   clu s ter s )   an d   s a m n u m b er   o f   iter atio n s .   A f ter   i m p l e m en tatio n   o f   th e s e   alg o r ith m s ,   t h f o llo w in g   r es u lts   h a v b ee n   o b tai n ed   ( T ab le  1 ) .       T ab le   1 C o m p ar ativ R es u lt s   of   B o th   A lg o r it h m s   A l g o r i t h m   C o mp u t a t i o n   t i me   ( ms)   Er r o r   R a t i o   EM   1 5 1 4   0 , 2 1   K m e a n s   8 1 4   0 , 3 4   H A C   9 8 0   0 , 4       I n   th i s   co m p ar ati v s t u d y   f o u n d   th a E alg o r it h m   g i v es  th b etter   p er f o r m a n ce   a s   co m p ar e   to   K - Me a n s   a n d   H AC   w i th   m in i m u m   er r o r   r ate .   A s   r esu lt  o f   o u r   ex p er i m e n t,  t h E M   al g o r ith m   s ee m s   to   b th m o s s tr o n g e s f o r   clu s ter i n g ,   i allo w s   th p r o ce s s i n g   o f   h u g d atab ase s   an d   o f f er   h i g h   ac cu r ac y .   T h E M   alg o r ith m   is   d e f i n ed   as: [ 1 4 ]   Giv e n   a   s tati s tical  m o d el   w h i ch   g e n er ates  s e t   X   o f   o b s er v ed   d ata,   s et  o f   u n o b s er v ed   laten d ata   or   m i s s i n g   v al u es   Z ,   an d   v ec to r   o f   u n k n o w n   p ar a m eter s   θ  ,   alo n g   w it h   a   li k eli h o o d   f u n cti o n   ( 1 )     L ( θ ; X ; Z ) =   p ( X , Z θ )                                              ( 1 )     T h e   m a x i m u m   li k eli h o o d   esti m ate   ( ML E )   o f   th u n k n o w n   p ar am eter s   is   d eter m in ed   b y   t h e   m ar g in al   lik eli h o o d   o f   th o b s er v ed   d ata  ( 2 ) :     L ( θ ; X ) =   p ( X | θ ) =   p ( X , Z θ ) Z                          ( 2 )     T h E alg o r ith m   s ee k s   to   f i n d   th m a x i m u m   li k eli h o o d   esti m ate   ( M L E )   o f   th m ar g in al  lik eli h o o d   b y   iter ati v el y   ap p l y i n g   t h f o ll o w i n g   t w o   s tep s :   E x p ec tatio n   s tep   ( E   s tep ) C alcu late  t h e   ex p ec ted   v alu e   o f   th e   lo g   lik eli h o o d   f u n ctio n ,   w i th   r esp ec to   th e   co n d itio n al  d is tr i b u tio n   of   Z   g i v e n   X   u n d er   th cu r r en esti m ate  o f   th p ar a m eter s   θ  ( t) :     Q ( θ | θ ( t ) ) = E Z X , θ ( t )   [ l ogL ( θ ; X ; Z ) ]                       ( 3 )           Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g     I SS N:  2 0 8 8 - 8708       Da ta   min in g   tech n iq u es a p p li ca tio n   fo r   p r ed ictio n   i n   OLAP   cu b e   ( A s ma   La ma n i )   2097   Ma x i m i za tio n   s tep   ( s tep ) : Fin d   th p ar a m eter   t h at  m ax i m i ze s   th i s   q u an tit y :     ( + 1 ) =      ma x ( ( ) )                                  ( 4 )     T h m ai n   i s s u i s   th er e f o r t o   s elec t h e   co r r ec n u m b er   o f   cl u s ter s .   T h c h o ice  o f   t h n u m b er   o f   clu s ter s   h a s   o f te n   b ee n   s t u d i ed   as  m o d el  s elec t io n   p r o b le m .   I n   t h is   ca s e,   t h al g o r ith m   is   u s u all y   r u n   m u ltip le  ti m es  i n d ep en d en tl y   w it h   d if f er e n n u m b er   o f   cl u s ter s .   T h r esu l ts   ar th e n   co m p ar ed   b ased   o n   a   s elec t io n   cr iter io n   t h at  allo w s   y o u   to   ch o o s t h b est s o lu tio n .   T h p r o b ab ilis tic  m o d eli n g   f r a m e w o r k   o f f er s   to o ls   f o r   s ele ctin g   th ap p r o p r iate  m o d el  co m p le x it y .   On s o l u tio n   is   to   r el y   o n   i n f o r m atio n   cr iter ia  s u c h   B I C   ( B ay esia n   I n f o r m a tio n   C r iter io n )   [1 5 ] T h e s cr iter ia  ar g en er all y   b ased   o n   s tr o n g   s tatis t ical  b ases   a n d   ap p ly   n at u r all y   to   p r o b ab ilis tic  clu s ter i n g   m et h o d s  . So   w e   ch o o s to   u s t h m o d el  s elec t io n   cr iter io n   B I C   to   au to m atic all y   s elec t th n u m b er   o f   clu s t er s .                      B IC =   2   ln ( ) + ln ( )               ( 5 )               w it h   L   is   th lik e lih o o d   f u n ctio n ,   N   i s   t h n u m b er   o f   o b s er v atio n s K   i s   t h n u m b e r   o f   clu s ter s   to   b esti m ated .     3 . 2 .     Reg re s s io n t re e   A   clas s i f icatio n   o r   r eg r ess io n   tr ee   is   p r ed ictio n   m o d el  th at  ca n   b r ep r esen ted   as  d e cisi o n   tr ee .   R eg r es s io n   tr ee s   ar f o r   d ep en d en v ar iab les  th at  ta k co n ti n u o u s   o r   o r d er e d   d is cr ete  v alu es,  w it h   p r ed ictio n   er r o r   ty p icall y   m ea s u r ed   b y   th s q u ar ed   d if f er e n ce   b et w ee n   t h o b s er v ed   an d   p r ed icted   v alu es.   A   r e g r ess io n   tr ee   i s   b u ilt  i n   a n   iter ati v w a y ,   b y   d iv id i n g   i n   ea c h   s tep   t h p o p u latio n   i n t o   t w o   o r   k   s u b s et s .   T h d iv is io n   is   ca r r i ed   o u t   ac co r d in g   to   s i m p le  r u les  o n   ex p lan a to r y   v ar iab les,  b y   d eter m in i n g   th o p tim a r u le  w h ic h   m a k es  it  p o s s ib le  to   co n s tr u ct   t w o   o r   m o r e   m o s d i f f er e n tiated   p o p u latio n s   i n   ter m s   o f   v alu e s   o f   t h v ar iab le  to   b ex p lain ed .   T h ev alu at io n   cr iter ia  o f   r e g r ess io n   tr ee   ar t h a v er ag e r r o r   r ate  an d   th r ed u ctio n   o f   er r o r .   T h er r o r   r ate  in d icate s   th a v er ag d ev iatio n   b et w ee n   th o b s er v ed   v al u an d   t h tr u v al u o f   th v ar iab le  to   p r ed ict.   I f   th er r o r   r ate  is   clo s to   0   th en   th i s   m ea n s   t h at  t h p r ed ictio n   m o d el   ( th tr ee )   is   ac cu r ate.   T h r ed u ctio n   o f   er r o r 1 - R 2 ,   w it h   R 2   t h co e f f icien o f   d eter m i n atio n   w h ic h   m ea s u r es   th e   p r o p o r tio n   o f   v ar ia n ce   e x p lai n ed   b y   th e   m o d el  t h at  i s   to   s a y   t h q u al it y   o f   t h r e g r ess io n .   Am o n g   t h m et h o d s   f o r   co n s tr u ct in g   r eg r es s io n   t r ee ,   th t w o   m o s t c o m m o n   tech n iq u e s   ar C A R T   [ 16]   an d   A I D   [ 1 7 ] .   I n   o u r   ca s e,   w u s C AR T   to   b u ild   th r eg r ess io n   tr ee .   A   d ec is io n   tr ee   b u ilt  w it h   th C AR T   alg o r ith m   ca n   w o r k   w it h   all  ty p e s   o f   v ar iab les:   q u alita tiv e,   o r d in a an d   co n tin u o u s   q u a n ti tativ e.   T hi s   m et h o d   m ak e s   it p o s s ib le  to   cr ea te  d ec is io n   r u le s   m ix in g   all  t y p e s   o f   in f o r m atio n .   T h g en er al  p r in cip le  o f   C AR T   is   to   p a r titi o n   r ec u r s iv e l y   th in p u s p ac in   b in ar y   w a y ,   th e n   d eter m in a n   o p ti m al  s u b s et  f o r   th p r ed ictio n .   B u ild in g   C AR T   tr ee   is   d o n in   t w o   s tep s .   A   f ir s t p h a s is   t h co n s tr u ct io n   o f   a   m a x i m al   tr ee ,   w h ic h   m a x i m izes   th e   h o m o g en ei t y   o f   th e   g r o u p s   o n   th e   d ataset,   a n d   s ec o n d   p h ase,   ca lled   p r u n i n g ,   w h ic h   b u ild s   s eq u en ce   o f   o p ti m al  s u b - tr ee s   p r u n ed   f r o m   th m a x i m al  tr ee .     3 . 3 .     G ener a l   no t io n   W tak th d ef i n itio n s   p r o p o s ed   in   [ 3 ]   o f   d ata  cu b e.     C   is   d ata  cu b w it h   n o n - e m p t y   s et  o f   d   d i m en s io n s     D   = { D 1 , D i ,   …. .   ,   D d   an d   m   m ea s u r e m e n t s   M = {M 1 ,..., M q ,   . . . ,   M m }.     H i   is   th s et  o f   h ier ar ch ie s   o f   d i m e n s io n   Di.     H ij   is   th jth   o f   h ier ar c h ical  le v els o f   th d i m en s io n   D i .   A ij   r ep r esen ts   all  ter m s   o f   th h ier ar ch ical  le v el  H ij   o f   t h d im en s io n   D i .   Fro m   t h d ata  cu b C ,   th u s e r   s elec ts   a n   a n al y s is   co n te x i s   s u b - cu b o f   t h cu b C .   T o   d o   th is   w e   in tr o d u ce   th d e f in itio n   o f   d at s u b - c u b e.   L et  D'    D   n o n - e m p t y   s et   o f   p   d i m en s io n s   {D 1   , .   .   . ,   D p }   o f   d ata  cu b C   ( p     d) .   T h P - tu p le     ( θ 1 ,   θ 2 ,   …  ,   θ p )   is   d ata    s u b - cu b o f   C   alo n g   D’   if     {1 ,   .   .   .   ,   p },   θi     Ø   an d   t h er ex is ts   u n iq u   0   s u c h   as  θ i     A ij .   A   s u b - d ata  c u b co r r esp o n d s   to   p o r tio n   o f   th d ata  cu b C .   A   h ier ar ch ical  lev e H ij    is   f ix ed   f o r   ea ch   d i m e n s io n   D i     D'   a n d   a   s u b s et   θ i   n o n - e m p t y   ter m s   ar s elec ted   in   th is   h ier ar ch ical   lev el  a m o n g   all  th ter m s   A ij .         Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  9 ,   No .   3 J u n 2 0 1 9   :   2 0 9 4   -   2 1 0 2   2098   3 . 4 .     I nte rpre t a t io n   o f   t he  pr edict io m o del   Ou r   s tar tin g   p o in is   d ata  cu b w ith   n   o b s er v ed   f ac ts   ac co r d in g   to   th q u an titati v m ea s u r e m en M q   d ef in ed   b y   th u s er   in   d ata  cu b C .   Un li k th ap p r o ac h   o f   [ 11 ]   an d   [ 1 8 ],   w h er th u s er   s elec ted   co n tex t   o f   an al y s i s ,   in   o u r   ap p r o ac h ,   t h u s er   d esi g n a tes  d ir ec tl y   t h e   ce ll  c   to   p r ed ict  an d   d ete r m i n es  th s u b - c u b C i   w h ic h   co n tai n s   t h ce ll  an d   p r ed ict  th m ea s u r e m en M q   o f   t h ce ll  th r o u g h   th p r ed ictiv m o d el  b u ilt  o n   t h s u b - cu b e.   W u s E Alo g o r ith m   to   p ar tio n   th d ata  cu b i n to   a   k   d en s s u b - cu b e s   C i     C   {C 1   ,C 2 , C k }.     T h s u b - cu b d esig n ated ,   ca n   b co n s id er ed   as  r eg io n   c ar r y i n g   in f o r m atio n   an d   ca n   b co n s id er ed   as  tr ain i n g   s e t to   b u ild   th p r ed ictio n   m o d el.   C A R T   al lo w s   t h cr ea tio n   o f   b in ar y   tr ee   b ased   o n   s u p er v is ed   lear n i n g   m et h o d s ,   t h e x p lan ato r y   v ar iab les  ar th d i m en s io n s   o f   th s u b - cu b e s   an d   th v ar i ab le  to   b p r ed icted   r ep r esen ts   th co r r esp o n d in g   M q   m ea s u r e m e n t.   W b u ild   f o r   ea ch   s u b cu b C i   i n   C   r e g r ess io n   tr ee   th at  r et u r n s   d ec is io n   r u le s   d en o ted :   R i   =   {R i 1 , R i 2 , ..R i k }.   E ac h   r u le  co r r esp o n d s   to   ter m i n al  leaf   o f   th tr ee .   T h u s er   d ir ec tl y   d esi g n ate s   t h ce ll  to   p r ed ict  an d   d eter m i n e s   t h s u b - c u b co n tai n i n g   t h s elec ted   ce ll,  an d   th e n   p r ed ict s   th m ea s u r e m en t o f   th ce l th r o u g h   p r ed ictiv m o d el  b u ilt o n   t h c u b e .   L et  c   b th e m p t y   ce ll  s elec te d   b y   t h u s er .   M q   ( c)   is   th m ea s u r e m e n t v al u o f   ce ll  c .   L et  u s   s ee k   t h s u b - c u b C i   co n tai n in g   ce ll  c .   W ar lo o k in g   f o r   th r u le  R i j   d er iv ed   f r o m   th p r ed ictio n   m o d el  b u ilt f r o m   t h s u b - c u b C i .     ( s ee   A l g o r ith m   1 )     A l g o r ith m   1   Fo r   M q ( c)   Null   do     Fo r   ea ch   s u b - cu b C i     C   I f     C i   th e n     Fo r   ea ch   R i   R i   do   M q   ( c)   ←  Y   E n d   f o r   E n d   I f   E n d   f o r   E n d   f o r     T o   d ep lo y   o u r   ap p r o ac h   an d   f o r   th s a k o f   clar i f icatio n ,   w u s s i m p le  il lu s tr ati v e x a m p le  o f   f ictit io u s   th r ee   d i m en s io n a d ata  cu b w it h   t h r ee   D   {T i m e,   P r o d u ct,   Sto r es}. .   T h m ea s u r co r r esp o n d s   to   th n u m b er   o f   s a les  p r o d u cts  in   th s to r es.  T h h ier ar ch y   o f   th s to r es  d i m en s io n   h as  2   lev els B r an c h   an d   co u n tr y .   I n   t h s a m w a y ,   t h P r o d u cts  d i m e n s io n   co n s i s ts   o f   t h r ee   lev e ls p r o d u ct,   r an g a n d   t y p e.   I n   ad d itio n ,   T im e   d i m e n s io n   i s   o r g an ized   f o llo w in g   2   lev el s :   m o n th   an d   y ea r .   T h d ata  c u b co n s is ts   o f   1 0 6 9   ce lls   w h ic h   is   d etailed   r ep r esen t at io n   o f   t h cu b w it h   lo w er   lev el  o f   g r an u lar it y   f o r   ea ch   d i m en s io n :   ( Mo n th ,   p r o d u ct,   B r an ch ) .     W u s E alg o r ith m   w it h   B I C   as  m e th o d   o f   clu s ter in g   to   p ar titi o n   o u r   cu b e.   T h o b tain ed   clu s ter s   ar e   s h o w n   in   T ab le  2 .       T ab le  2 Nu m b er   o f   F ac ts   i n   O b tai n ed   C l u s ter s     N u mb e r   o f   f a c t s (ce l l s)   S u b - c u b e   1   1 8 1   S u b - c u b e   2   90   S u b - c u b e   3   3 9 0   S u b - c u b e   4   54   S u b - c u b e   5   1 4 8   S u b - c u b e   6   23   S u b - c u b e   7   1 1 7   S u b - c u b e   8   66       Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g     I SS N:  2 0 8 8 - 8708       Da ta   min in g   tech n iq u es a p p li ca tio n   fo r   p r ed ictio n   i n   OLAP   cu b e   ( A s ma   La ma n i )   2099   I n   o u r   e x a m p le ,   t h u s er   d e s ig n ates   t h ce ll   c ,   f o r   w h ic h   it   w i s h e s   to   p r ed ict  t h v a lu o f   t h e   m ea s u r e.   C ell  c   b elo n g s   to   t h e   s u b - c u b 7 ,   ap p ly i n g   th p r ed ictiv m o d el  co n s tr u cted   f r o m   th s u b - c u b e   7 ,   w e   o b tain   th r eg r es s io n   tr ee   i n   Fi g u r e   1   an d   th f o llo w i n g   r u les :     R 1   ( Mo n tr ea   T o r o n to     Ho n g Ko n g     L y o n     L o n d r es    T o k y o )   →  7 8 . 6 9 )     R2   ( ( Me x ico     Ma d r id     P ar i s 2     Fra n c f o r   Ma r s eille    B en elu x     C h a m o n i x     Or léan s )     (   A d ap   A r m o ir   B alan ce     C o r d   Ma s q     P at    P o lo     P s av o n     Sac    Sh o r   T ab   T ab     T éléc   )   →  1 0 6 . 8 2 )     R3   ( ( Me x ico     Ma d r id     P ar is 2     Fra n c f o r   Ma r s eille    B en elu x     C h a m o n ix     Or léa n s )     (   B lo u s o n     C h ai s   C h a u s s u r   C o m b in     Fo u r     J ea n     P an   Su r v e   S w ea b ic    S w ea b r     T s h ir t   )   →  4 9 7 . 6 6 )           Fig u r e   1 .   R eg r es s io n   tr ee   o b tain ed       Fo r   ex a m p le,   w h e n   w e   tar g e ted   th ce l d escr ib ed   b y   t h e   ter m s   ( A v r il2 0 0 9 ,   T éléc ,   P a r is   2 )   f o r   d i m en s io n s ,   r esp ec tiv el y Mo n th ,   p r o d u cts  an d   B r an c h ,   R 2   w as  s elec ted .   W n o te  th a s ales  m ea s u r o f   p r o d u cts T éléc   in   P a r is   2   w ill  b 1 0 6 . 8 2   r eg ar d less   o f   Mo n t h   o f   s ale   Fo r   an o th er   e x a m p le,   to   co m p lete  an   e m p t y   ce ll   o f   th e   cu b e,   w w an t   to   k n o w   w h a wo u ld   b th e   n u m b er   o f   s ale s   o f   t h p r o d u ct  " J ea n "   in   th B r an c h   " Ma r s e ille"   f o r   Ma r s 2 0 0 9   ?   T h q u an tit y   o f   s ales   ca n   b p r ed icted   b y   ap p ly i n g   r u le  R 3   an d   th e   r es u lt  w ill b 4 9 7 . 6 6       4.   CASE   S T UD AND  R E SU L T S   W test   o u r   w o r k   o n   s et  o f   r ea d ata.   W u s f o r   th i s   s tu d y   th d ata   o f   th e   u r b an i s m   a u t h o r izatio n s   s er v ice  o f   a n   u r b an   m u n icip a lit y .   T h d i m en s io n s   o f   an a l y s is   o f   t h w ar e h o u s an a l y s is   ar e:  au t h o r izatio n   t y p ( P er m it  to   co n s tr u ct,   P e r m it  to   d e m o lis h ,   e tc.   …) ,   s u b d iv is io n ,   n at u r o f   t h p r o j ec an d   f il in g   d ate;   D= { A u th o r izatio n   T y p e,   s u b d iv is io n n at u r e   P r o j ec t f ilin g   D ate }.   T h m ea s u r u s ed   is   th a u t h o r izatio n   d em a n d ' s   tr ea t m e n t d u r atio n   ( n u m b er   o f   d a y s ) .   T h h ier ar ch y   o f   th A u th o r izatio n T y p e   d i m e n s io n   an d     n atu r e P r o j ec t   d im en s io n   h as  1   lev el,   th s u b d iv i s io n   d i m en s io n   co n s i s ts   o f   2   lev el s d is tr ict  a n d   s u b d iv i s io n .   I n   ad d itio n ,   f i lin g   D ate   d i m en s io n   i s   o r g an ized   f o llo w i n g   2   le v els:   m o n t h   an d   y ea r .   T h F i g u r e   2   s h o w s   t h c u b e.     W s elec t   co n tex o f   an al y s i s   w i th   16757  ce lls ,   w h ic h   is   a   d etailed   r e p r esen tatio n   o f   t h e   cu b w it h   lo w er   lev el  o f   g r an u lar it y   f o r   ea ch   d i m e n s io n ( A u t h o r i za tio n   T y p e s u b d i v is io n n at u r e   P r o j ec t ,   m o n t h   Fil in g   D ate ).   E al g o r ith m   with   B I C   p ar titi o n   o u r   c u b e   i n   1 0   s u b - c u b es .   T h o b tain ed   cl u s ter s   ar s h o w n   i n   Fig u r e   3 .     T h u s er   w a n ts   to   k n o w   th tr ea t m e n d u r atio n   f o r   n e w   f il l ed   au th o r izatio n   d e m a n d ,   th e n   t h u s e r   d esig n ates  th ce ll  c ,   f o r   w h ic h   it  w i s h e s   to   p r ed ict  th v alu o f   th m ea s u r e.   C ell  c   b elo n g s   to   th s u b - cu b e   C 4 ,   a p p ly i n g   th p r ed ictiv m o d el  co n s tr u cted   f r o m   t h e   s u b - c u b C 4 W u s C AR T   as  m et h o d   o f   r eg r ess io n   tr ee   to   b u ild   th p r ed ictio n   m o d el   w it h   th a v er a g er r o r   is   0 . 0 7 4 .   Fig u r e .   4   r e p r esen R eg r es s io n   tr ee   o b tain ed .   W o b tain   th f o llo w i n g   r u les:     R 4 1 ( A C     53)     R 4 2 ( B r an ch     (   J u il    A o u t)   →  1 4 , 8 3     R 4 3 ( B r an ch     ( Sep   Oct    No v     Dec    J an     Fev     Ma r s     Av r     Ma   J u i)   →  1 1 , 0 1         Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  9 ,   No .   3 J u n 2 0 1 9   :   2 0 9 4   -   2 1 0 2   2100       Fig u r 2 .   I n itial d ata  cu b e           Fig u r 3 .   P r o d u ce d   clu s ter s   b y   th E alg o r it h m       ( X 1 )   A F D M _ 1 _ A x i s _ 2   v s .   ( X 2 )   A F D M _ 1 _ A x i s _ 1   b y   ( Y )   C l u s t e r _ E M _ 1 c _ e m _ 1 c _ e m _ 2 c _ e m _ 3 c _ e m _ 4 c _ e m _ 5 c _ e m _ 6 c _ e m _ 7 c _ e m _ 8 c _ e m _ 9 c _ e m _ 1 0 3 2 1 0 -1 -2 -3 -4 -5 4 3 2 1 0 -1 -2 -3 -4 Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g     I SS N:  2 0 8 8 - 8708       Da ta   min in g   tech n iq u es a p p li ca tio n   fo r   p r ed ictio n   i n   OLAP   cu b e   ( A s ma   La ma n i )   2101       Fig u r 4 .   R eg r es s io n   tr ee   o b tain ed   f r o m   s u b - cu b C 4       Usi n g   t h s e o f   r u les,  t h e m p t y   ce l l,  ca n   b est i m ated   s ee   T ab le  3 T o   in teg r ate  t h e   p r ed ictiv m o d u le  in   t h OL A P   en v ir o n m en t,  th u s er   d esi g n ate s   th e   ce ll  f o r   w h ic h   h w is h es  to   p r ed ict   th v alu e,   w d esi g n ate  t h r u le   o f   t h r eg r ess io n   tr ee   o b tain ed   w h ich   co r r esp o n d   to   all  th ter m s   d escr ib in g   th ce ll,   th en   w as s ig n   t h a v er ag v a lu o f   th p r ed ictio n   r u le  as  th m ea s u r e m en v al u o f   th ce ll.   T h is   in te g r atio n   o f   p r ed ictio n   allo w s   t h u s er   t o   u n d er s ta n d   t h e x p ec ted   v al u es   o f   a g g r eg ate s   f o r   h i g h er   lev el  o f   g r an u lar it y .   T h ag g r eg ate s   ar r ec alcu late d   co n s id er in g   t h n e w   p r ed icte d   v alu es.       T ab le  3 P r ed icted   V alu es   Ty p e   A u t o r i z a t i o n   M o n t h   D u r é e   d e   t r a i t e me n t   p r é v u e   B r a n c h   Ju i l l e t   1 4 , 8 3   AC   Jan v i e r   53       5.   CO NCLU SI O N   T h is   r esear ch   w i ll  b u s ed   to   ex tr ac u s e f u a n d   p r ac tical  k n o w led g e   to   s u p p o r th d ec is i o n - m a k in g   p r o ce s s   f r o m   d ata  w ar eh o u s e s   co n tain in g   h u g v o l u m o f   in f o r m atio n ,   w h ic h   w ill  en ab le  u s er s   i n   th e   d ec is io n - m a k i n g   s y s te m s   to   a ch iev h i g h   le v el  o f   p er f o r m an ce   b y   p r o v id in g   th e m   w i t h   n e w   ele m e n t s   to   u n d er s ta n d   e x i s ti n g   r elatio n s h ip s   o r   p h en o m en i n   t h d ata  an d   allo w i n g   th e m   to   an ticip ate  th r ea lizatio n   o f   ev en t s   ac co r d in g   to   n u m b er   o f   co n d itio n s .   Ou r   f ir s co n tr ib u t io n   is   s y n t h e s is   o f   t h v ar io u s   w o r k s   th at  h av co v er ed   th s u b ject  o f   th e   co u p lin g   d ata  m i n i n g   a n d   o n lin a n al y s is   f o r   th p r ed icti o n ,   an d   th w o r k   th at  h as  tr ea ted   th s u b j ec o f   clu s ter i n g   a n d   p ar titi o n i n g   OL A P   c u b es.   O u r   s ec o n d   c o n tr ib u tio n   is   to   o f f er   n e w   ap p r o ac h   f o r   t h p r ed ictio n   in   OL A P   cu b es,  w h ic h   p r o v id es  ac cu r ate  an d   u n d er s ta n d ab le  r esu lts ,   O u r   g o al  is   to   allo w   th e   an al y s to   p r ed ict  th v a lu o f   m ea s u r f o r   n e w   f ac a n d   th u s   co m p le te  th c u b u s in g   th co u p li n g   o f   o n lin a n al y s i s   a n d   d ata  m i n i n g ,   An d   i n teg r ate  t h lear n in g   p r o ce s s ap p ly   a n   u n s u p er v is ed   lear n in g   m eth o d :   C lu s ter i n g ,   a n d   s u p er v i s ed   lear n in g   m eth o d : Re g r es s io n   tr ee .       RE F E R E NC E S     [1 ]   Kim b a ll   R. ,   T h e   Da ta  W a re h o u se   T o o lk it ,   Jo h n   W il e y   &   S o n s ,   1 9 9 6 .   [2 ]   In m o n   W .   H.,   Bu il d in g   t h e   Da ta W a re h o u se ,   Jo h n   W il e y   &   S o n s ,   1 9 9 6 .   [3 ]   Ha n   J.,   O LA P   M in in g :   a n   In teg ra ti o n   o f   OLA P   w it h   Da ta   M in in g ,   Pro c e e d in g o th e   7 th   IFI Co n fer e n c e   o n   Da ta   S e ma n t ics ,   L e y sin ,   S wit ze rla n d ,   1 9 9 7 .   [4 ]   G .   S a th e   a n d   S .   S a ra w a g i ,   In telli g e n ro ll u p i n   m u lt id im e n sio n a OL A P   d a ta ,”   Pro c e e d in g o th e   2 7 t h   In ter n a t io n a C o n fer e n c e   o n   Ver y   L a rg e   D a ta   Ba se s,  M o rg a n   Ka u f ma n n   Pu b li sh e rs   In c .,   p p .   5 3 1 - 5 4 0 ,   2 0 0 1 .   [5 ]   S .   G o il   a n d   A .   Ch o u d h a ry ,   P A RS IM ON Y a n   in f ra stru c tu re   f o p a ra ll e m u lt id im e n sio n a a n a l y sis  a n d   d a ta   m in in g ,”   J .   Pa ra ll e Distri b .   C o m p u t. v o l/ issu e :   6 1 (3 ) ,   p p .   2 8 5 - 3 2 1 ,   2 0 0 1 .   [6 ]   R.   B .   M e ss a o u d ,   Co u p lag e   d e   l’an a ly s e   e n   li g n e   e la  f o u il le  d e   d o n n é e p o u l’ex p l o it a ti o n ,   l’ag g a ti o n   e t   l’ex p li c a ti o n   d e s d o n n é e s c o m p lex e s ,”   P h D t h e sis,  Un iv e rsité L u m ière   Ly o n   2 ,   Ly o n ,   F ra n c e ,   2 0 0 6 .   [7 ]   S a ra wa g S . ,   e a l .,  Disc o v e r y - d riv e n   Ex p lo ra ti o n   o f   OLA P   Da ta  Cu b e s,   Pro c e e d in g o th e   6 t h   In ter n a ti o n a Co n fer e n c e   o n   Exte n d in g   Da t a b a se   T e c h n o l o g y   ( EDBT ' 1 9 9 8 ),   V a l e n c ia ,   S p a in S p ri n g e r p p .   1 6 8 - 1 8 2 ,   1 9 9 8 .   [8 ]   Ch e n g   S . ,   S tatisti c a A p p ro a c h e to   P re d ictiv e   M o d e li n g   in   L a rg e   D a tab a se s,   M a ste r’s  th e sis ,   S im o n   F ra se r   Un iv e rsit y ,   Br it ish   Co lu m b ia,  Ca n a d a ,   1 9 9 8 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  9 ,   No .   3 J u n 2 0 1 9   :   2 0 9 4   -   2 1 0 2   2102   [9 ]   J.  Ha n ,   e a l . ,   Cu b e   e x p lo re r:  o n l in e   e x p lo ra ti o n   o f   d a ta  c u b e s ,”   S IGM OD   0 2 Pro c e e d in g o th e   2 0 0 2   ACM   S IG   M OD   in ter n a ti o n a c o n fer e n c e   o n   M a n a g e me n o d a ta ,   Ne Y o rk ,   NY ,   US A p p .   6 2 6 - 6 2 6 ,   2 0 0 2 .   [1 0 ]   Y.  Ch e n   a n d   J.  P e i ,   Re g re ss i o n   c u b e w it h   lo ss l e ss   c o m p re ss io n   a n d   a g g re g a ti o n ,”   IEE T ra n sa c ti o n o n   Kn o wled g e   a n d   D a ta   En g i n e e rin g v o l/ iss u e 1 8 (1 2 ) ,   p p .   1 5 8 5 - 1 5 9 9 ,   2 0 0 6 .     [1 1 ]   A .   S a ir,   e a l . P re d ictio n   in   O LA P   C ube ,   IJ CS In ter n a ti o n a l   J o u rn a o Co mp u ter   S c ien c e   Iss u e s ,   v ol /i ss u e :   9 ( 3 ) ,   2 0 1 2 .   [1 2 ]   R.   M issa o u i,   e a l . A   P ro b a b il ist ic M o d e f o Da ta Cu b e   Co m p re s sio n   a n d   Qu e ry   A p p ro x i m a ti o n ,   Pro c e e d in g s o f   th e   Co u p l in g   OLA P   a n d   d a ta   mi n in g   f o p re d ict io n   1 5   1 0 t h   AC M   In ter n a ti o n a W o rk sh o p   o n   D a ta   W a re h o u sin g   a n d   OLA ( DO L AP ' 2 0 0 7 ),   L isb o n ,   P o rtu g a l   ACM   Pre ss ,   p p .   3 3 - 40,   2 0 0 7 .   [1 3 ]   T .   S .   M a d h u lath a ,   A n   o v e rv ie w   o n   c l u ste rin g   m e th o d s ,   A ll u ri   In s ti tu te  o f   M a n a g e m e n S c ien c e s,  W a ra n g a l.   [1 4 ]   A .   P .   De m p ste r ,   e a l . M a x im u m   L ik e li h o o d   f ro m   In c o m p lete   D a ta  v ia  th e   EM   A lg o rit h m ,”   J o u rn a o t h e   Ro y a l   S ta ti st ica S o c iety .   S e rie s B   ( M e th o d o lo g ica l) v ol /i ss u e :   39 ( 1 ),   p p .   1 - 38 1 9 7 7 .   [1 5 ]   E.  W it ,   e a l . ,   “’ Al m o d e ls  a re   w ro n g . . . ’:  a n   in tr o d u c ti o n   t o   m o d e u n c e rtain ty ,”   S ta ti stica   Ne e rla n d ica ,   v o l/ issu e :   66 ( 3 ) ,   p p .   2 1 7 - 23 .   [1 6 ]   L .   Bre i m a n ,   e a l .,   Clas sif ica ti o n   a n d   Re g re ss io n   T re e s ,”   1 9 8 4 .   [1 7 ]   J.  N.  M o rg a n   a n d   J.  A .   S o n q u i st ,   P r o b lem in   th e   a n a ly sis  o su rv e y   d a ta,   a n d   a   p ro p o sa l ,   J o u rn a o t h e   Ame ric a n   S t a ti stica Asso c i a ti o n v o l/ issu e 5 8 (3 0 2 ) ,   p p .   4 1 5 - 4 3 4 ,   1 9 6 3 .   [1 8 ]   A.   B Nie m c z u k ,   e a l . ,   V e rs  l’i n tég ra ti o n   d e   la  p d ictio n   d a n l e c u b e OLA P ,”   L a b o ra to ire  ERIC,   Un iv e rsité   L u m ière   Ly o n   2 .     Evaluation Warning : The document was created with Spire.PDF for Python.