I nte rna t io na l J o urna l o f   E lect rica l a nd   Co m p ute E ng in ee ring   ( I J E CE )   Vo l.   7 ,   No .   4 A u g u s t   201 7 ,   p p .   2 1 4 2 ~ 2 1 5 1   I SS N:  2 0 8 8 - 8708 DOI : 1 0 . 1 1 5 9 1 / i j ec e . v7 i 4 . p p 2 1 4 2 - 2151          2142       J o ur na l ho m ep a g e h ttp : //ia e s jo u r n a l.c o m/o n lin e/in d ex . p h p /I JE C E   Cla ss ificatio n w ith  Sing le Cons traint  P ro g ress iv e Mining  of  Sequential  P a tt er ns       Reg ina   Yulia   Ya s m in,  P utr Sa pta w a t i,  B enha rd  Sito ha ng   S c h o o o f   El e c tri c a En g in e e ri n g   &   In f o rm a ti c s,  In stit u T e k n o lo g Ba n d u n g ,   Jl.  G a n e sh a   1 0 ,   Ba n d u n g   4 0 1 3 2 ,   In d o n e sia       Art icle  I nfo     AB ST RAC T   A r ticle  his to r y:   R ec eiv ed   Dec  4 ,   2 0 1 6   R ev i s ed   A p r   4 ,   2 0 1 7   A cc ep ted   A p r   1 8 ,   2 0 1 7       Clas sif ic a ti o n   b a se d   o n   se q u e n t ial  p a tt e rn   d a ta h a s b e c o m e   a n   i m p o rtan to p ic   to   e x p l o re .   On e   o f   re se a rc h   h a b e e n   c a rried   w a th e   Clas sify - By - S e q u e n c e ,   CBS .   CBS   c las sif ied   d a ta  b a se d   o n   se q u e n ti a p a tt e r n o b tain e d   f ro m   A p rio riL ik e   s e q u e n ti a p a tt e r n   m in in g .   S e q u e n ti a p a tt e rn o b t a in e d   we re   c a ll e d   CS P ,   Clas sif i a b le  S e q u e n ti a P a tt e rn s.  CS P   w a u se d   a c las sif ier  ru le o f e a tu re s   f o th e   c las si f ica ti o n   tas k .   CBS   u se d   A p rio riL ik e   a l g o rit h m   to   se a rc h   f o se q u e n ti a p a tt e r n s.  H o w e v e r,   A p rio riL ik e   a l g o rit h m   to o k   a   l o n g   ti m e   to   se a rc h   f o th e m .   M o re o v e r,   n o a ll   se q u e n ti a p a tt e rn w e re   im p o rtan t   f o th e   u se r.   In   o r d e to   g e th e   rig h a n d   m e a n in g f u f e a tu re f o c las si f ica ti o n ,   u se u se a   c o n stra in in   se q u e n ti a p a tt e rn   m in in g C o n stra in t   is  a lso   e x p e c ted   to   re d u c e   th e   n u m b e o f   se q u e n ti a p a tt e rn s th a a re   sh o rt  a n d   les m e a n in g f u t o   th e   u se r.   T h e re f o re ,   we   d e v e lo p ed   CBS _ CL A S S *   w it h   S in g le  Co n stra in P ro g re ss iv e   M in i n g   o f   S e q u e n ti a P a tt e rn s   o S i n g le  Co n stra in P IS A   o P IS A* .   CBS _ Clas s *   w it h   P I S A*   wa p ro v e n   to   c las sif y   d a ta  in   f a ste ti m e   sin c e   it   o n ly   p ro c e ss e d   les se n u m b e o se q u e n ti a l   p a tt e rn b u sti ll   c o n f o rm   to   u se r’s  n e e d .   T h e   e x p e rim e n t   re su lt   sh o w e d   th a t   c o m p a re d   to   CBS _ CL A S S ,   CBS _ Clas s *   re d u c e d   th e   c las sif ica ti o n   e x e c u ti o n   ti m e   b y   8 9 . 8 % .   M o re o v e r,   th e   a c c u ra c y   o f   th e   c las si f ica ti o n   p ro c e ss   c a n   stil b e   m a in tain e d .   K ey w o r d :   C B S_ C L A S S *   C las s i f icatio n - by - s eq u e n ce   w i th   s in g le  co n s tr ain t p is a   P I SA*   Seq u en t ial  p atter n   m in in g   Sin g le  co n s tr ain t p r o g r es s iv m i n in g   o f   s eq u e n tial p atter n s   Co p y rig h ©   2 0 1 7   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e .     Al rig h ts  re se rv e d .   C o r r e s p o nd ing   A uth o r :   R eg i n Y u lia  Yas m i n   Sch o o l o f   E lectr ical  E n g i n ee r i n g   &   I n f o r m at ics,    I n s tit u t T ek n o lo g i B an d u n g ,   J l.  Gan esh 1 0 ,   B an d u n g   4 0 1 3 2 ,   I n d o n esia .   E m ail:  r eg in a. y as m i n @ g m ail. co m       1.   I NT RO D UCT I O N   T h class i f icatio n   p r o ce s s   is   n ee d ed   to   ca teg o r ize  d ata  w it h   v ar io u s   t y p es  f o r   v ar io u s   p u r p o s es,  f o r   in s ta n ce   c lass if y i n g   w eb   clic k   d ata  to   f in d   o u t h w eb s ite  s ea r ch   p atter n s   o f   ac ti v i n ter n et  u s er s ,   cla s s i f y in g   f ac o r   v o ice  b io m etr ic  d ata   to   r ec o g n ize   its   t y p o f   s o u r c an d   class i f y in g   e - co m m er ce   d ata  to   ca teg o r ize  p r o s p ec tiv cu s to m er s   etc.   T h lar g a m o u n t o f   d ata  w ith   h i g h   i n cr ea s i n g   g r o w t h   r ates a n d   v ar io u s   d ata  t y p e s ,   esp ec iall y   b ig   d ata,   r eq u ir t h d ev elo p m e n o f   m o r e   ef f ici en cla s s i f icat io n   m e t h o d   [ 1 ] .   Mo r eo v er ,   th ti m e   o r d er   o f   d ata  ap p ea r an ce   is   e x p ec ted   to   b r in g   k n o w led g t h at  ca n   b u til ized   to   clas s i f y   d ata.   C la s s i f icatio n   m et h o d   o f   d ata  th at  ap p ea r   in   ti m s eq u en ce   ca n   b u s ed   to   ca teg o r ize  th clas s   o f   p o k er   s tep   s eq u en ce s   [ 2 ] T h s tu d y   w a s   co n d u cted   to   d eter m in w h et h er   p ar ticu la r   p o k er   s tep   w ill  r es u lt  in   v ic to r y   o r   d ef ea [ 2 ] C las s i f icatio n   o f   d ata  th at  ap p ea r   in   ti m s eq u e n ce   is   ca lled   s eq u en t ial  d ata  class i f icat io n .   Seq u en t ial  d ata  a s   t h i n p u t   f o r   class i f icatio n   p r o ce s s   ca n   b p r o v id ed   d ir ec tly   o r   p r ep r o ce s s ed   u s in g   s eq u en tia p atter n   m i n in g .   Var io u s   s t u d ies  o n   s eq u e n tial   p atter n   m i n i n g   h ad   b ee n   d o n w it h   v ar iet y   o f   m i n in g   tec h n iq u es  [ 3 ] [ 4 ] .   Se v er al  ap p r o ac h es  in   s eq u e n t ial   p atter n   m i n i n g   ar A p r io r [ 5 ] ,   GSP   [ 6 ] ,   SP A DE   [ 7 ] ,   P r ef ix   Sp an   [ 8 ] ,   P I SA   [ 9 ]   etc.   R esear ch   o n   i n teg r at in g   class if icatio n   p r o ce s s   w it h   p r ep r o ce s s i n g   u s i n g   s eq u en tial  p atter n   m i n in g   h ad   b ee n   d o n e,   as  w el as  i n teg r at in g   s eq u en tial  p atter n   m i n i n g   w i th   c lu s ter in g   p r o ce s s .   B y   i n te g r atin g   Evaluation Warning : The document was created with Spire.PDF for Python.
I J E C E     I SS N:  2 0 8 8 - 8708       C la s s i fica tio n   w ith   S in g le  C o n s tr a in t P r o g r ess ive  Min in g   o f S eq u en tia l P a tter n s   ( R eg in a   Yu lia   Ya s min )   2143   s eq u en tial p atter n   m in i n g   i n   p r ep r o ce s s in g   w it h   t h n e x m i n in g   p r o ce s s ,   th p er f o r m an ce   w a s   i m p r o v ed   [ 1 0 ] R esear ch   o n   c las s i f icatio n   o f   s eq u en tial  p atter n s   h a s   b ee n   d o n b y   co m b i n in g   A p r io r iLik s eq u en tial  p atter n   m i n in g   w i th   th e   clas s if icatio n   p r o ce s s .   T h ap p r o ac h   w a s   c alled   C B S,  C la s s i f y - by - Seq u e n ce   [ 1 1 ] .   B asicall y ,   A p r io r iL i k a lg o r it h m   s ea r c h e s   f o r   s eq u e n tial p atter n s   b y   g e n er atin g   s eq u e n ce   ca n d id ates t h at  ar co n s tr u cted   f r o m   t h s h o r test   s eq u e n ce s   to   g et   lo n g er   s eq u e n ce s   iter ati v e l y .   Ho w e v er ,   A p r io r iL i k al g o r it h m   co n s u m ed   lo n g   ti m e   b ec au s e   th e   iter ati v p r o ce s s   w a s   r ep ea ted   f o r   lo ts   o f   d ata.   Mo r eo v er ,   th n u m b er   o f   g e n er ated   s eq u e n tia p atter n s   w a s   o v er m u c h   a n d   m o s tl y   t h e y   w er e   s h o r an d   tr i v ial  to   u s er s   s o   th at  t h e y   b u r d en ed   t h n e x class i f icatio n   p r o ce s s Hen ce ,   th cla s s i f icatio n   p r o ce s s   u s i n g   A p r io r iL i k s e q u en tial  p atter n   m i n i n g   to o k   lo n g er   ti m e.   Mo r eo v er ,   f r o m   b u s i n es s   p o in o f   v ie w ,   u s er s   o f   d ata  m i n in g   s o m eti m es  o n l y   r eq u ir th d ata  an al y s is   f r o m   ce r tai n   p er s p ec tiv e.   T h is   v ie w p o in i s   ad o p ted   f r o m   th e   o r g an izatio n   n ee d s .   Fo r   ex a m p le,   u s er s   ar g en er all y   m o r in ter ested   in   g etti n g   k n o w led g o f   t h late s d ata   t h an   o f   th e   o ld   o n es.   T h er ef o r e,   th er e ' s   n ec es s it y   to   i m p r o v s eq u e n tial   p atter n   m i n i n g   p er f o r m a n ce   i n   p r ep r o ce s s i n g   b y   i m p r o v i n g   ex ec u tio n   ti m to   g et  s eq u en tial p atter n s   a n d   r ed u cin g   th e   n u m b er   o f   s eq u e n tia l p atter n s   to   o n l y   th o s th at  s atis f y   th u s er 's n ee d .     C o n s tr ain i n   s eq u e n tial  p atter n   m i n i n g   i s   ex p ec ted   to   an s wer   th is   n ec e s s it y .   T h s eq u en t ial  p atter n   m i n in g   al g o r it h m   is   d e v elo p ed   b ased   o n   P r o g r ess iv Min i n g   o f   Seq u e n tial  P atter n s ,   P I S A .   P I SA   a lg o r it h m   ar r an g es  a   s eq u e n ce   d atab ase   in   t h f o r m   o f   P r o g r ess i v Seq u en ce   T r ee ,   P S - tr ee ,   an d   d o es  n o g e n er ate   s eq u en ce   ca n d id ates   s o   t h at   t h m i n in g   p r o ce s s   b ec o m es   f aster .   W n a m ed   t h s in g le   c o n s tr ain p r o g r ess iv e   m i n in g   o f   s eq u e n tial  p atter n s ,   as  P I SA* .   I n   ad d itio n   to   its   ab ilit y   to   g e n er ate  s eq u en t ial  p atter n s   t h at  s ati s f y   th u s er s’   n ee d ,   co n s tr ai n ca n   r ed u ce   th n u m b er   o f   s h o r t   an d   t r iv ial  s eq u e n tial  p atter n s   [ 1 3 ] .   T h l ess er   n u m b er   o f   s eq u e n tia p atter n s   w ill  r ed u ce   w o r k lo ad   o f   th n ex cla s s i f icat io n   p r o ce s s .   I is   b eliev ed   th at  t h e   class i f icatio n   p r o ce s s   w ill  b f aster   w it h   b etter   ac c u r ac y   le v el.   T h er ef o r e,   t h is   s t u d y   is   e x p ec ted   to   p r o v id e   s o lu tio n s   to   t h p r o b le m   ( 1 )   w h et h er   s eq u e n tial   p atter n   m i n in g ,   e s p ec iall y   P I SA*   ca n   lo w er   t h n u m b er   o f   s eq u en tial  p atter n s   an d ,   ( 2 )   im p r o v clas s if icatio n   t i m p er f o r m an ce   a n d   m ain tain   ac c u r ac y   le v el  o f   th e   class i f icatio n   p r o ce s s .   I n   o r d er   to   s o lv t h p r o b le m ,   w e   p r o p o s m et h o d   C la s s i f y - By - Seq u e n ce _ C la s s * ,   C B S_ C L A S S *   w h ic h   in teg r at es P I SA*   to   f i n d   s eq u e n tial p a tter n s   a n d   class i f icat io n   p r o ce s s .   T h o b j ec tiv o f   th is   r esear ch   is   to   class if y   d ata  b ased   o n   s eq u en tial  p atter n s   th at  w er f o u n d   u s in g   P I SA* .   T h er ef o r e,   C B S_ C L ASS  is   m o d if ied   to   in te g r ate  P I SA*   al g o r ith m   a n d   clas s if ic atio n   p r o ce s s .   T h is   s tu d y   is   e x p ec ted   to   im p r o v th p er f o r m a n ce   o f   clas s i f icat io n s   to tal  ex ec u tio n   t i m w h i le  m ai n tai n in g   t h e   ac cu r ac y   le v el.   T h is   p ap er   is   o r g an is ed   a s   f o ll o w s .   Sectio n   I   co n tain s   i n tr o d u ctio n ,   r elate d   w o r k ,   C B ap p r o ac h   an d   P I SA* .   Sectio n   I I   ex p lain s   a b o u C B S_ C L A SS *   w it h   P I SA* t h p r o p o s ed   ap p r o ac h .   Sectio n   I I I   ex p lain s   ab o u t   th r esu lts   a n d   an al y s i s .   Sectio n   I co n tai n s   co n c lu s io n   o f   t h is   p ap er   an d   f u tu r r ese ar ch .     1 . 1 .   Rela t ed  Wo rk   Seq u en t ial  p atter n   m i n i n g   is   o n o f   th d ev elo p m e n o f   f r eq u en ite m s e m i n i n g   [ 5 ] .   Den o ted   b y     I   {i 1 ,   i 2 ,   .   .   .   ,   i k }   w h ic h   is   s et  o f   all  ite m s ,   s u b s et  o f   I   is   c alled   ite m s e t.   Seq u e n ce   α   t 1 ,   t 2 ,   .   .   .   ,   t m   w h er e   (t i     I )   is   o r d er ed   lis t .   E ac h   ite m s e in   s eq u e n ce   r ep r esen ts   t h s et  o f   e v en ts   t h at  o cc u r   at  th s a m ti m e   ( s a m ti m es ta m p ) .   Di f f er e n ite m s et  ap p ea r s   at  d if f er e n t i m e   [ 1 4 ] .   Seq u en ce   α   a 1 ,     a 2 ,   .   .   .   ,   a n   is   a   s u b s eq u en ce   o f   s eq u e n ce   b 1 , b 2 , . . . , b m   i f   t h er e x is t   i n teg er s   i 1   < i 2     i n   s u ch   t h at  a 1     b i1 , a 2     b i2 …,   a n     b in   [ 6 ] .   R esear ch   o n   t h m i n in g   s eq u en ce   a s   f ea t u r es  f o r   class i f i ca tio n   h ad   b ee n   d o n to   cla s s i f y   s tep s   s eq u en ce   i n   o r d er   to   p r ed ict  w h et h er   t h s tep s   w i ll  lead   t o   v icto r y   o r   d e f ea t   [ 2 ] .   T h s t u d y   i n tr o d u ce d   a   Featu r Mi n i n g   ap p r o ac h .   I n   th is   s t u d y ,   t h er w er 3   s te p s   tak e n ,   i.e .   ( 1 )   th r ep ea te d   s i m u latio n   s tep   to   g en er ate  e x ec u t io n   tr ac es,  ( 2 )   m i n in g   t h s i m u lated   ex ec u tio n   tr ac es  to   o b tain   f ea tu r e s   an d   ( 3 )   t r ain   class i f ier   u s i n g   f ea t u r es  to   p r ed ict  t h s u cc es s   o r   f a ilu r o f   s i m u la ted   tr ac es.  T h is   s tu d y   u s ed   t w o   p r o ce s s es,  s eq u e n tial  p atter n   m i n i n g   p r o ce s s   to   o b tain   s eq u e n tial  p atter n s   t h at  co r r elate   w it h   tar g e clas s   an d   th clas s i f icatio n   p r o ce s s   u s i n g   f ea tu r e s   o b tain ed   f r o m   t h p r ev io u s   p r o c ess   [ 2 ] .   Ho w e v er ,   C B w as  p r o v en   to   h a v b etter   ac cu r ac y   p er f o r m a n ce   t h a n   th Featu r Mi n i n g   s i n ce   C B in te g r ates  A p r io r iL i k s eq u en tial  p atter n   m in in g   w it h   p r o b ab ilis tic  in d u ctio n   s o   th at  s eq u e n tia l p atter n s   ca n   b u s ed   as a   clas s if ier   r u le   [ 1 1 ] .     1 . 2 .   Cla s s if y - b y - Sequ ence ,   C bs   A pp ro a ch   C las s i f y - by - Seq u en ce ,   C B S,  is   class i f icatio n   p r o ce s s   th at   b u ild s   m o d el  f r o m   s eq u e n tia p atter n s .   As  s h o w n   i n   Fi g u r 1 ,   C B p er f o r m s   t w o   p r o ce s s es  s eq u e n tiall y ,   ( 1 )   s ea r ch es  f o r   s eq u e n t ial  p atter n s   t h r o u g h   A p r io r iL i k s eq u e n tial   p atter n   m i n i n g ,   ( 2 )   class i f ie s   b ased   o n   t h s eq u e n tial  p atter n s   w h i c h   ac t   as  a   clas s i f ier   r u le   [ 1 1 ] .   Seq u en tial  p atter n s   th at  ar o b tain ed   f r o m   A p r io r i L i k s eq u e n tia p atter n   m in in g   ar also   ca lled   as   C las s i f iab le  Seq u en t ial  P atter n s ,   C SP .   A p r io r iL i k e   s ee k s   s e q u en tial   p atter n s   w i th   le n g th - ( n +1 )   f r o m   le n g th - n .   B y   t h iter ati v p r o ce s s ,   A p r io r iL i k r eq u ir es a   lo n g   ti m to   g et  s eq u e n tia l p atter n s .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I J E C E     Vo l.  7 ,   No .   4 A u g u s 2 0 1 7     2 1 4 2     2 1 5 1   2144       Fig u r 1 .   C B S Sch e m [ 1 3 ]       Data   t h at  ar p r o ce s s ed   in   C B ar ca teg o r ical   d ata .   E ac h   r ec o r d   is   as s o ciate d   to   a   p ar ticu lar   cla s s   lab el.   Den o te  D i   t h at  co n s is t s   o f   ti m s er ies  o f   d ata  as s o ciate d   w it h   cla s s   n ,       { D 1 ,   D 2 ,D 3 ,   …,   D n } A p r io r iL i k e   s ea r ch e s   f o r   C las s if iab le   Seq u e n tia P atter n s   ( C SP )   as  c lass if ier   r u le s .   T h er ef o r e,   s eq u en tial   p atter n   i c o r r esp o n d s   to   class   m ,   SP i     C m ,   w it h   SP i   is   s eq u en ce   o f   a 1     a 3     a 7   a n d   C m   is   th clas s   m   [ 1 1 ] .   C B S a lg o r it h m   is   d i v id ed   in to   t w o   t y p es,  n a m el y   C B S_ A L L   an d   C B S_ C L ASS.  C B S_ AL L   m i n es a l l   d ata  in   t h d atab ase  w h ile  C B S_ C L ASS  f ir s t   d iv id es  th d ata  b ased   o n   co r r esp o n d in g   class   to   b m i n ed   f u r t h er .   Sin ce   C B S_ C L A S b u ild s   clas s i f icatio n   m o d el  f r o m   ea ch   cla s s ,   C B S_ C L ASS  was  p r o v en   to   ac h iev e   b etter   ac cu r ac y   co m p ar ed   to   C B S_ AL L   [ 1 1 ] .   T h C B S_ C L A S m eth o d   is   a s   f o llo w s ,   ( 1 )   d iv id es  th d ata   b ased   o n   t h co r r esp o n d in g   c l ass   o r   lab el,   ( 2 )   f r o m   ea ch   cla s s ,   A p r io r iLik e   s ea r ch e s   th e   s eq u en tial   p atter n s ,   ( 3 )   class i f ies   d ata  u s i n g   t h s e q u en tial   p atter n s   t h at   ac a s   C lass i f iab le  Seq u e n tial   P atter n s ,   C SP .   T h C SP   is   u s ed   as   clas s i f ier   r u le.   T o   f i n d   s eq u e n tial   p atter n s ,   A p r io r iL i k u s e s   t h m in i m u m   s u p p o r t.  E ac h   C SP   w il b g iv en   s co r b ased   o n   th len g t h   o f   s eq u e n tial  p atte r n .   T h en ,   C SP   s co r is   n o r m alize d   s o   th at  t h m ax i m u m   s co r is   1   [ 1 1 ]   Fig u r 2   s h o w s   ab o u C B S_ C L A SS   al g o r it h m   t h at  c o n s is ts   o f   A p r io r iLik al g o r ith m   a n d   class i f icatio n   p r o ce s s   [ 1 1 ] .             Fig u r 2 .   C B S_ C L ASS al g o r it h m   [ 1 1 ]   Input:    dataset, minimum support   Output:    class of sequential patterns   Method:     CBS_CLASS (Dataset D, min_sup)   {   For   each c i   ϵ class_ set(D)   do     D i   =   class_dataset(D, c i );       CSP i   =   FindSP(D i mi n _s up )   //to get CSP using AprioriLike   End   }       //Start  program  of  AprioriLike  algorithm  for  finding  sequential patterns   FindSP (Dataset D, min_sup)   {     Sp 1   = {large - it em s }   For   (i=2; Sp i - 1 ;i ++)  do       SP_C i   = gen _candidat eSP(Sp i - 1 );       For   each data d  ϵ   do         SP s   = SP_C i   ∩ subseq( d);         For   each sp  ϵ   SP s   do           Sp.sup++;         End       End   Sp i   = {sp | sp  ϵ   SP s ,  s p. su ≥  mi su p}     End   Return  SP i   }   //This is the end of AprioriLike algorithm     //S tart program for classifying test data   Class_of_sequence (x )   {   Total_score = new array[class_count(D)];   For   each csp i   ϵ CSP  do     Total_score[csp i .c la ss +=  c sp i .sp.lengt h;   End   Score_array[]=new   array [class_count(D)];   For   each csp i   ϵ CSP  do     If   csp i   ϵ subseq( x )       For   each c m   ϵ belong _class_set(csp i )         Score_array  y[m]  +=  csp i .sp.length/total _score[m];   //count score for test data       End     End if   End       k = index_of(max{score_array[]});   return c k ;   }   //End program for classifying test data   Evaluation Warning : The document was created with Spire.PDF for Python.
I J E C E     I SS N:  2 0 8 8 - 8708       C la s s i fica tio n   w ith   S in g le  C o n s tr a in t P r o g r ess ive  Min in g   o f S eq u en tia l P a tter n s   ( R eg in a   Yu lia   Ya s min )   2145   1 . 3 .   P ro g re s s iv M ini ng   o f   Sequ ent ia l P a t t er ns ,   P I SA   A   co n s tr ai n i s   li m i tatio n   s et  b y   u s er   b ef o r t h m in in g   p r o ce s s   b eg in s .   C o n s tr ai n i n   s eq u en tial   p atter n   m i n in g   is   e x p ec ted   to   r ed u ce   th n u m b er   o f   s eq u e n tial  p atter n s   [ 1 3 ] .   T h er ar m an y   t y p e s   o f   u s er   co n s tr ain ts ,   s u c h   as  ite m ,   len g th ,   s u p er - p atter n ,   ag g r eg ate,   r eg u lar   ex p r es s io n ,   d u r atio n   an d   g ap   co n s tr ai n t   [ 1 5 ] .   C o n s tr ain ca n   b ei th er   ( 1 )   ite m   co n s tr ain t,   is   a   li m ita tio n   w h er s eq u en tial  p atter n   s h o u ld   co n tai n   o r   n o co n tai n   ce r tain   ite m ,   ( 2 )   l en g t h   les s   co n s tr ain t,  r eq u ir es   th at  th le n g th   o f   s eq u e n tial   p atter n   s h o u ld   b e   s h o r ter   th an   t h g i v en   v alu e,   ( 3 )   len g th   m o r co n s tr ai n t,  r eq u ir es  th at  t h len g t h   o f   s eq u e n tial  p atter n   s h o u ld   b lo n g er   th a n   th e   g iv e n   v al u e,   ( 4 )   s u p er - p atter n   co n s tr ain t,  i s   a   c o n s tr ain t   ad o p ted   to   lo o k   f o r   s eq u e n tia l   p atter n   th a co n tai n s   p ar ticu l ar   p atter n   as  s et  o f   s u b - p atte r n ,   ( 5 )   ag g r e g ate  co n s tr ain t,  is   co n s tr ai n o n   th e   ag g r e g ate  o f   ite m s   in   t h p att er n ,   ( 6 )   r eg u lar   ex p r ess io n   co n s tr ai n t,  is   co n s tr ain w it h   r eg u lar   e x p r ess io n ,   s u c h   as  d is j u n tio n   a n d   Klee n clo s u r o f   th s e o f   ite m s ,   ( 7 )   d u r atio n   co n s tr ai n t,  is   a   co n s tr ain o n   th e   s eq u en ce   d atab ase  t h at  r eq u ir es  s eq u e n tial  p atter n   to   s ati s f y   th ti m d if f er e n ce   b et w ee n   p r ed eter m in ed   s tar t   an d   en d   tr an s ac tio n s ,   ( 8 )   g ap   co n s tr ain t,  r eq u ir es  to   s atis f y   p r ed ef in ed   ti m d i f f er en ce   b et w ee n   t w o   ad j ac en tr an s ac tio n s   [ 1 5 ] .   B ased   o n   h o w   to   ch ec k   co n s tr ai n o n   s eq u en t ial  p atter n s ,   co n s tr ain t s   ca n   b ca teg o r ized   in to   m o n o to n ic  o r   a n ti - m o n o to n ic  co n s tr ain t.  C o n s tr ai n ch ec k i n g   u t ilizes  c h ar ac ter is t ic  o f   s u b s eq u en ce   a n d   s u p er   s eq u en ce .   co n s t r ain t,  d e n o ted   b y   C M ,   i s   s aid   a s   m o n o t o n ic  co n s tr ain if   th er i s   s e q u en ce   α   m ee ts   C M   co n s tr ain th e n   an y   s u p er - s eq u en ce   o f   α   al s o   s atis f ie s   co n s tr a in C M .   Me an w h ile,   co n s tr ai n t,  d en o ted   b y   C A is   s aid   as  an ti - m o n o to n ic  co n s tr ain if   t h er is   s eq u e n ce   o f   α   s ati s f y   th co n s tr ai n C A   t h e n   an y   s u b s eq u e n ce   o f   α   also   s at is f ies co n s tr ai n t C A   [ 1 5 ] .   P I SA   r ep r esen ts   s eq u e n ce   d atab ase  in to   p r o g r ess i v s eq u en t ial  tr ee ,   P S - tr ee   [ 9 ] .   P I S A   u s e s   th e   co n ce p o f   a   ti m f r a m n a m e d   as  P er io d   o f   I n ter e s t,  P OI ,   w h ic h   i s   a   s lid i n g   w i n d o w   a n d   m o v e   c o n ti n u o u s l y   in   t i m e   [ 9 ] P OI   m ad P I S A   t o   b f le x ib le  in   ad d in g   o r   d el etin g   d ata  [ 9 ] P I S A   p r o ce s s e s   s eq u en ce   d atab ase   th at  i s   co m p o s ed   f r o m   ite m s e f r o m   ea c h   s eq u e n ce   I b as ed   o n   o cc u r r en ce   ti m es ta m p .   P S - tr ee   w it h   P I SA  alg o r ith m   [ 9 ]   r ec o r d s   s eq u e n c I D,   lab el  an d   ti m es ta m p .   P I S A   al g o r ith m   tr a v er s es  f r o m   t h r o o n o d to   th e   leaf   o n a n d   ca lc u late  t h o c cu r r en ce   f r eq u en c y   o f   ite m .   I f   t h o cc u r r en ce   f r eq u e n c y   o f   ite m   i s   lar g e r   th a n   m i n i m u m   s u p p o r th en   it  w i ll  b co n s id er ed   as  s eq u e n tial  p atter n .   Ho w e v er ,   o r ig i n al  P I S ap p r o ac h   h as   n o t   ac co m m o d ated   co n s tr ai n ch ec k in g   w h en   s ea r c h in g   f o r   s eq u en tial  p atter n s .   T h er ef o r e,   P I SA*   h as  b ee n   d ev elo p ed   s o   th at  it is   ab le  to   ch ec k   s in g le   co n s tr ai n t .       2.   CB S_ CL ASS*   W I T H   P I SA * :   T H E   P RO P O SE AP P R O ACH   C las s i f icatio n   C B S *   w i th   Si n g le  C o n s tr ain t   P r o g r ess i v Mi n in g   o f   Seq u e n tial  P atter n s   o r   P I SA* ,   is   class if icatio n   ap p r o ac h   th at  in teg r ate s   s eq u e n tial  p atter n   m i n in g   P I SA*   w it h   class i f icatio n   p r o ce s s .   C las s i f icatio n   p r o ce s s   n ee d s   s eq u en t ial  p atter n s   a s   in p u t .   Fig u r 3   s h o w s   t h at  s eq u e n tial  p atter n s   w er o b tain ed   f r o m   s eq u e n tial  p att er n   m i n i n g   P I SA*   t h at  w as  c o n d u cted   b ef o r th class i f ic atio n   s tar ts .   Si n g le  co n s tr ain P I SA ,   P I SA*   s ea r c h es  f o r   s eq u en t ial  p atter n s   t h at  m ee m i n i m u m   s u p p o r t,  s in g le  co n s tr ain t   w it h i n   t h u s er - d ef i n ed   P OI Min i m u m   s u p p o r t,  s in g le  co n s tr ain a n d   P OI   w er s et  b e f o r s eq u e n tia p atter n   m i n in g   p r o ce s s   s tar ts .   T h ad v an ta g e s   o f   P I SA*   ar ( 1 )   th f lex ib ili t y   i n   ad d in g   o r   s u b tr ac tin g   d ata,   ( 2 )   th co n f o r m a n ce   o f   s eq u en tial p at ter n s   w it h   u s er s   n ee d ,   ( 3 )   th r e m o v al  o f   s h o r t a n d   tr i v ial  s e q u en tial p atter n s .   Seq u en t ial  p atter n   w ill  b u s e d   as  C SP ,   C las s if iab le  Seq u en tial  P atter n   th at   ac as   cla s s i f icatio n   r u le ,   w h ic h   i s   d e n o ted   as  Sp i     C m ,   s eq u en t ial  p atter n - b el o n g s   to   t h clas s   m .   C las s if ic atio n   r u les  ar u s ed   to   d eter m i n t h class   o f   n e w   d ata   [ 1 1 ] .           Fig u r 3.   C lass if ica tio n   b y   s eq u en ce   w i th   p r io r   p r o ce s s   P I SA *   [ 1 3 ]       T h is   ap p r o ac h   p r o v ed   to   p er f o r m   b etter   in   s ea r ch i n g   f o r   s eq u en tial   p atter n s   b ased   o n   a   m i n i m u m   s u p p o r an d   s in g le  u s er - d ef i n ed   co n s tr ain t.  Si n g le   co n s tr ai n th at  h a s   b ee n   test ed   ar co n s tr ain ite m ,   len g t h   less   co n s tr ai n a n d   le n g th   m o r co n s tr ai n t.  Mo r eo v er ,   t h is   a p p r o ac h   w as   also   p r o v e n   to   d ec r ea s th e   n u m b er   o f   s h o r t a n d   tr i v ial  s eq u en t ial  p atter n s   an d   p er f o r m ed   i n   f a s t er   ti m th a n   t h o r ig i n al  P I SA   alg o r ith m .   L i k C B S_ C L ASS,  C B S_ C L ASS *   al s o   s p lits   d atab ase  b ased   o n   th co r r esp o n d in g   class .   Den o tes,   D m   co n tai n s   s eq u en t ial  d ata  th at  co r r esp o n d s   to   class   m .   Da tab ase  is   r ep r esen ted   as    Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I J E C E     Vo l.  7 ,   No .   4 A u g u s 2 0 1 7     2 1 4 2     2 1 5 1   2146   {D 1 ,   D 2 ,   D 3 ,   D 4 ,   …  D n },   w it h   n   cla s s e s .   Data   s ets  i n   D m   co n s i s ts   o f   ti m e - s er ie s   d ata  in s ta n ce s   {i m1 ,   i m2 i m3 , …. ,   i mn },   w h er i mn   r ep r esen t s   t h v al u o f   D m   at  t h e   n th   ti m p o in t.  At  ea ch   d atab ase  th at  r elate s   to   co r r esp o n d in g   clas s ,   P I S A*   s ee k s   s eq u e n tial  p atter n s   t h at  m ee m i n i m u m   s u p p o r an d   s in g le  co n s tr ai n t.   Seq u en t ial  p atter n   o b tain ed   i s   ca lled   C SP ,   C la s s i f iab le   Se q u en tial   P atter n .   C SP   is   w ei g h ted   b ased   o n   th e   len g th   o f   s eq u e n tial  p atter n .   L o n g er   s eq u e n tial  p atter n   i s   g iv en   g r ea ter   w ei g h t.  Ma x i m u m   w e ig h o f   ea c h   C SP   is   1 .   C B S_ C L A S S *   w i th   P I S A*   i s   ex p lain ed   as  f o llo w s :   1.   Fo r   ea ch   d atab ase  D m   p er   class   m ,   m in i m u m   s u p p o r t,  s in g le   co n s tr ain a n d   P OI   ar p r ed ef in ed   b ased   o n   u s er   r eq u ir e m e n ts .   Si n g le   co n s tr ai n m a y   b a n   ite m   o r   l en g t h   les s   o r   len g t h   m o r co n s tr ai n t.  Fin d   s eq u en tial p atter n s   u s in g   P I SA*   as  f o llo w s :   a.   T r an s f o r m   t h d atab ase  i n to   s eq u en ce   d atab ase  t h at  h as  p r o p er ty   o f   s eq u e n ce   id ,   ti m e s ta m p   a n d   lab el.   L ab el  is   also   ca lled   as it e m s et.   b.   Usi n g   P r o ce d u r T r av er s e:  De v elo p   an d   tr a v er s P S - tr ee   o f   i te m s e ele m e n ts   w it h in   P OI .   E v er y   n e ele m e n i s   r ec o r d ed   at  t h e   r o o n o d e,   w h ile   ev er y   ele m e n t h at   h a s   p r ed ec ess o r   is   r e co r d ed   at   co m m o n   n o d e.   W h ile  tr a v er s i n g ,   ch ec k   w h et h er   s eq u en tial  p atter n   s ati s f ies   m in i m u m   s u p p o r t,  w h ic h   is   th s eq u en ce   l is t s ize    m i n i m u m   s u p p o r *   n u m b er   o f   s eq u en ce .   c.   Usi n g   P r o ce d u r P is aCo n s tr ai n tI te m T o   o b tain   s eq u en t ial  p atter n s   t h at  s ati s f y   t h s i n g le  co n s tr ain t,   ch ec k   s eq u en t ial  p atter n   ag ai n s s i n g le  co n s tr ai n in   P OI   ti m f r a m e.   C h ec k   co n s tr ain t   b ased   o n   p r o p er ty   an ti  m o n o to n ic  o r   m o n o to n ic  co n s tr ain t a n d   ap p l y   it   to   all  s eq u en tia l p a tter n s .   Fo r   an ti - m o n o to n ic  co n s tr ai n t   s u c h   a s   le n g th   les s   co n s tr ain t ,   if   s eq u e n ce   o f   α   s ati s f ies  t h e   co n s tr ai n t   an ti - m o n o to n ic  C A   t h e n   an y   s u b s eq u e n ce   o f   α   al s o   s ati s f ies  co n s tr ain t C A .   I f   t h SP Existin g   s atis f ies t h e   co n s tr ain t a n d   i f   SP   is   s u b s eq u en ce   o f   SP Existin g   t h en   SP   also   s atis f ies t h co n s tr ai n t.   Fo r   m o n o to n ic  co n s tr ai n s u c h   as  ite m ,   le n g t h   m o r e,   s u p er   p atter n   co n s tr ain t,  if   th er i s   s eq u en ce   α   s atis f ies  co n s tr ai n m o n o to n ic   C M   th e n   a n y   s u p er - s eq u e n ce   o f   α   al s o   s atis f ie s   co n s tr ai n C M .   I f   t h e   SP Existing   m ee t s   th co n s tr ai n t   an d   if   SP Existin g   i s   s u b s eq u e n ce   o f   SP   o r   SP   is   s u p er - s e q u en ce   o f   SP Existing   t h e n   SP   also   s atis f ie s   th co n s tr ain t.   2.   Usi n g   P r o ce d u r C lass _ o f _ s eq u en ce C las s i f y   t h d ata   a.   Fo r   ea ch   o b tain ed   s eq u en tia p atter n   o r   C SP ,   co m p u te  C SP   s co r b y   ac cu m u lati n g   len g t h   o f   s eq u en tial p atter n .   b.   Fo r   ea ch   C SP ,   n o r m aliza tio n   o f   s co r es is   co u n ted .   I f   C SP   is   s u b s eq u e n ce   o f   t h e x is ti n g   C SP   ar r ay ,   th en   s co r ac cu m u lated   o f   ( l en g t h   o f   s eq u e n ce   / to tal  s co r e) .   c.   C h ec k   th s eq u e n tial  p atter n s   f o u n d   f r o m   tes d ata  ag ain s li s o f   C SP .   I f   th co r r esp o n d in g   class   i s   f ailed   to   g et,   t h en   c h ec k   t h s u b s eq u e n ce   o f   s eq u e n tial   p att er n s   f r o m   te s d ata,   f r o m   t h lo n g e s to   th s h o r test   le n g t h ,   ag a in s t th e   lis t o f   C SP   r ec u r s iv e l y   u n til it s   co r r esp o n d en ce   class   is   f o u n d .   d.   B ased   o n   th s co r es  o b tain ed   in   p o in 4 ,   in d e x   k   w ill  b o b tain ed ,   w h er k   i s   t h m a x i m u m   s co r e.   C las s   o b tain ed   is   class   w ith   i n d ex   k .   C B S_ C L A S S *   w i th   P I S A*   al g o r ith m   is   d escr ib ed   in   Fi g u r e   4 :   Evaluation Warning : The document was created with Spire.PDF for Python.
I J E C E     I SS N:  2 0 8 8 - 8708       C la s s i fica tio n   w ith   S in g le  C o n s tr a in t P r o g r ess ive  Min in g   o f S eq u en tia l P a tter n s   ( R eg in a   Yu lia   Ya s min )   2147       Fig u r e   4 .   T h p r o p o s ed   C B S_ C L ASS *   al g o r ith m       3.   RE SU L T A ND  AN AL Y SI S   E x p er i m e n u s es  e - co m m er ce   s ales  d ata  w h ich   co n tai n s   c ateg o r ical  d ata.   T h am o u n o f   d ata  is   ab o u 2 2 , 6 9 9   tr an s ac tio n s   w it h   attr ib u te s   ar p r o d u ct  I D,   d ate  o f   s ale s ,   cu s to m er   I D,   o r d er   I D.   T h o b j ec tiv o f   th e   ex p er i m en ts   i s   to   co m p ar th cla s s i f icatio n   ti m p er f o r m a n ce   a n d   th e   ac cu r ac y   b et w ee n   C B S_ C L A S S   an d   C B S_ C L A S S * .   I n   o r d er   to   g et  th ac cu r ac y   lev el,   k - f o ld   s tr atif ied   cr o s s   v alid atio n   is   u s ed   as  test in g   s ce n ar io .   I n   t h i s   ex p er i m en t,  C B S_ C L A S u s es  o r i g in a P I S A   m e th o d   f o r   s ea r ch i n g   s eq u en t ial  p atter n s ,   an d   C B S_ C L A S S *   u s e s   P I SA*   w i th   s i n g le  co n s tr ai n t.   C o n s tr ain u s ed   is   ei th er   a n   it e m   co n s tr ai n o r   len g t h   le s s   o r   len g th   m o r co n s tr ai n t.  I te m   co n s tr ai n t   r eq u ir es seq u e n ti al  p atter n s   to   co n tain   1   s p ec i f ic  ite m .   L en g t h   les s   co n s tr ai n t r eq u ir es t h at  l en g t h   o f   s eq u e n tia l   p atter n s   m u s b less   t h an   ce r tain   n u m b er .   On   th co n tr ar y ,   len g th   m o r co n s tr ain r eq u ir es  th a len g th   o f   s eq u en tial p atter n s   m u s t b m o r o r   th s am t h a n   ce r tain   n u m b er .   First,  d ata  in   ea ch   d atab ase  D m   t h at  co r r esp o n d s   to   class   m ,   w er r ep r esen ted   in   s eq u e n ce   d atab ase  b ased   o n   s ales  d ate  an d   tim e .   Fig u r 5   r ep r esen ts   th s eq u en ce   d atab ase.   Seq u e n ce   I o r   SID   r ep r esen ts   s eq u en ce s   b ased   o n   u s er s   p o in o f   v ie w   to   an al y ze .   I n   t h is   ca s e,   s eq u en ce   I is   b ased   o n   s ales  d ate.   E ac h     Input:    dataset,  minimum  suppo rt,  POI  and  single  con straint  criteria,  for  example  item constraint   Output:    class of sequent ial patterns   Method:     CBS_CLASS* (Dataset D, min_sup, POI, label)   {   For   each c i   ϵ class_set(D)  do     D = class_dataset(D,c i );     CSP = PISA*(D i , min_sup, POI, label)   End   }     PISA* (Dataset D, min_sup, POI, label)   {   1.   Var PS; //PS Tree   2.   Var currentTime; //tim estamp now   3.   Var eleSet; //used to store elements ele   4.   While (there is still new transaction)   5.   eleSet = read all ele at currentTime;   6.   traverse(currentTime, PS);   7.   PisaConstraintItem(sp, label); //item constraint checking   8.   currentTime++;     //This i s the start of modified PISA algorithm   Procedure traverse ( currentTime,PS )   For (each node of  PS   in post order)  do     If ( node   is Root)       For ( ele   of every  seq   in  eleSet )   do         For (all combination of elements in the  ele )   do           If ( element ==label of one of  node.ch ild )               Update timestamp of  seq   to  currentTime ;           Else               Create a new sequence with  currentTime ;           Else   //create a child             Create a new child with  element seq   and  currentTime ;     Else   //the node is a common node       For (every  seq   in the  seq_list )   do         If ( seq.timestamp <= currentTime - POI           Delete  seq   from  seq_list   and continue to the next  seq ;           If (there is new  ele   of the seq in  eleSet )             For (all combination of elements in the  ele )   do               If ( element   is not on the path from Root)                 If ( element ==label of one of  node.child )                     Child.seq_list.seq.timestamp = seq.timestamp ;                 Else                     Create  new  sequence  with  seq.timestamp ;                 Endif               Else   //create a child                   Create  new  child  with  element,  seq   and  seq.timestamp ;               Endif             EndFor           Endif         Endif       If ( seq_list.size ==0)         Delete this node and all of its children from its parent;     If ( seq_list.size >=support*sequence number)       Output the labels of path from Root to this node as a SP   End   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I J E C E     Vo l.  7 ,   No .   4 A u g u s 2 0 1 7     2 1 4 2     2 1 5 1   2148   SID   co n s i s ts   o f   s er ies  o f   ite m s et.   E ac h   i te m s et  co n s is ts   o f   p r o d u ct  I D.   I te m s et  in   ea c h   SID   is   g r o u p ed   b y   t h e   s a m ti m es ta m p .   I n   th is   ex p er i m e n t,  ti m o r   ti m e s ta m p   i s   in   s ales  h o u r   u n it.  Mo r eo v er ,   POI   is   u s ed   as  u s er   d ef in ed   t i m e   s l id in g   w i n d o w   b et w ee n   s p ec i f ied   s ale s   h o u r s   i n ter v al.   T h er ef o r e,   b ased   o n   s ale s   h o u r s ,   m ax i m u m   n u m b er   o f   P OI   is   2 3 .   I n   th is   ex p er i m en t,  P OI   is   s et  o f   5 ,   m ea n s   t h at  ti m e   s li d in g   w i n d o w   i s   s e t   b et w ee n   5   h o u r s .           Fig u r e   5 Seq u en tia l d atab ase  r ep r esen tatio n   i n   ea ch   D m   [ 1 3 ]         Seq u en t ial  p atter n s   ar s eq u en ce   o f   ite m s ets t h at  co n tai n :   a.   Seq u en t ial  p atter n   1 : < ( p r o d u ct 11 ) ,   <( p r o d u ct 12 ) ,   . . . ,   <( p r o d u ct 1n ) >,   b.   Seq u en t ial  p atter n   2 : < ( p r o d u ct 21 ) ,   <( p r o d u ct 22 ) ,   . . . ,   <( p r o d u ct 2n ) >,   c.   Seq u en t ial  p atter n   m : < ( p r o d u ct m1 ) ,   <( p r o d u ct m2 ) ,   . . . ,   <( p r o d u ct mn ) >.   I n   th i s   ex p er i m en t,  cla s s i f icat io n   p r o ce s s   ca teg o r izes  s eq u e n tial  p atter n s   i n   t w o   cla s s e s ,   p r o s p ec an d   n o n   p r o s p ec p r o d u cts.  Fo r   ex am p le,   s eq u e n tial  p atter n s   g e n er ated   b y   P I S A*   t h at  ac as  f ea t u r es  f o r   th e   class i f icatio n   p r o ce s s   ar as f o llo w s :   a.   C las s   o f   p r o s p ec t p r o d u ct  :   1)   Seq u en t ial  p atter n s   1 : < ( Sa m s u n g   Gala x y   S M - G3 1 3 H Z   W h ite) ,   ( Sa m s u n g   Gala x y   T ab   S 8 . 4   " -   SM - T 7 0 5 N T   -   T itan iu m   B r o w n ) >,   2)   Seq u en t ial  p atter n s   2 <( P r eo r d er   Mic r o s o f L u m ia  5 3 5   B lack ) ,   ( Sa m s u n g   Ga lax y   SM - G3 1 3 HZ   W h ite) an d   s o   o n .   b.   C las s   o f   n o n   p r o s p ec t p r o d u ct  :   1)   Seq u en t ial  p atter n s   1 <( E m te USB   2 . 0   Flas h   Dr i v 8   GB   B lack   P an th er ) ,   ( V - Ge n   Mic r o   SDHC   1 6   GB ) >   2)   Seq u en t ial  p atter n s   2 <( P NY  Du al  U SB   Flas h   Dr i v -   OU1   1 6 GB ) ,     ( u NiQu L ap to p   B ac k p ac k   i - P r o tect  B ir u ) ,   ( V - Gen   Mic r o   SDHC   1 6   GB ) an d   s o   o n .   T h o b j ec tiv o f   th e   f ir s e x p er i m en w as   to   co m p ar t h n u m b er   o f   s eq u en tial  p atter n s   f r o m   P I SA  in   C B S_ C L A SS   a n d   P I SA*   f r o m   C B S_ C L A S S * .   T h e x p er i m en w as  co n d u cted   at  m i n i m u m   s u p p o r 0 . 2 .   T h r esu lt i s   s h o w n   i n   F ig u r 6   th at  n u m b er   o f   s eq u e n tia l p atter n s   o b tai n ed   f r o m   P I SA*   in   C B S_ C L A S S *   ar e   lo w er   t h a n   i n   C B S_ C L A SS .   F r o m   th e   r esu lt,  t h h y p o th e s is   w a s   p r o v en   th a t CB S_ C L ASS *   w it h   p r io r   P I SA*   p r o ce s s   ca n   r ed u ce   th n u m b e r   o f   s eq u en t ial  p atter n s   to   o n l y   th o s th a t sati s f y   u s er   co n s tr a in t.             Fig u r 3 .   C o m p ar is o n   o f   n u m b er   o f   s eq u en tial  p atter n s   at  m in i m u m   s u p p o r t 0 . 2     Fig u r 4 .   C o m p ar is o n   o f   cla s s if icatio n   ex ec u tio n   t i m at  m i n i m u m   s u p p o r t 0 . 2     Evaluation Warning : The document was created with Spire.PDF for Python.
I J E C E     I SS N:  2 0 8 8 - 8708       C la s s i fica tio n   w ith   S in g le  C o n s tr a in t P r o g r ess ive  Min in g   o f S eq u en tia l P a tter n s   ( R eg in a   Yu lia   Ya s min )   2149   T h o b j ec tiv o f   th s ec o n d   e x p er i m e n w as  to   co m p ar th class i f icatio n   ex ec u tio n   ti m b et w ee n   C B S_ C L A S an d   C B S_ C L ASS * .   T h e x p er i m e n w as   co n d u cted   at  m i n i m u m   s u p p o r 0 . 2 .   T h r esu lt  i s   s h o w n   in   Fig u r 7   th at  cla s s i f icatio n   ex ec u tio n   t i m o f   C B S_ C L ASS *   is   m u ch   lo w er   th an   C B S_ C L AS S.   Fro m   th r es u lt,  t h h y p o t h e s is   w as  p r o v e n   th at  C B S_ C L ASS *   w it h   p r io r   P I SA*   p r o ce s s   ca n   r ed u ce   t h e   class i f icatio n   ex ec u tio n   t i m s in ce   cla s s i f icatio n   p r o ce s s es  less e r   n u m b er   o f   s eq u e n tial  p atter n s   s o   t h at  t h e y   d o   n o t b u r d en   th class if ica tio n   p r o ce s s .   T h th ir d   ex p er i m e n w a s   a i m ed   to   co m p ar e   th e   ac c u r ac y   le v el  b et w ee n   C B S_ C L ASS *   an d   C B S_ C L A S at  m i n i m u m   s u p p o r 0 . 2 .   A s   s h o w n   i n   F ig u r e   th at   th ac c u r ac y   lev e o f   C B S_ C L A SS *   i s   h ig h er   t h an   C B S_ C L A S S.  Fro m   t h r es u lt,  it  ca n   b co n cl u d ed   th at  th le s s er   n u m b er   o f   s eq u e n tial  p atter n s   th at  s atis f y   u s er s   co n s tr ai n i n cr ea s es  th e   ac cu r ac y   o f   c lass if icatio n .   Mo r eo v er ,   s u b s eq u e n ce   c h ec k i n g   o f   te s t   d ata  to   th e   li s o f   C SP   i n cr ea s es  clas s i f icatio n s   ac c u r ac y   le v el.   I t   m ee t s   th e   ex p ec tatio n   t h at  b es id es  r ed u ci n g   class i f icatio n   ex ec u tio n   ti m e,   C B S_ C L A SS *   i s   ca p ab le  o f   m ai n tain in g   t h ac cu r ac y   le v el  o f   cla s s i f icatio n   p r o ce s s .             Fig u r e   8.   C o m p ar is o n   o f   cla s s if icatio n s   ac cu r ac y   at  m in i m u m   s u p p o r t 0 . 2       T h f o r th   ex p er i m en t   w a s   c o n d u cted   to   k n o w   t h co m p ar atio n   o f   clas s i f icatio n   e x ec u tio n   ti m e   b et w ee n   C B S_ C L A SS *   a n d   C B S_ C L A S at  s ev er al  m i n i m u m   s u p p o r ts .   T h r esu lt  w a s   s h o w n   in   Fi g u r 9   th at  C B S_ C L A SS *   co n s u m e s   lo w er   cla s s i f icatio n   ex ec u ti o n   ti m t h a n   C B S_ C L ASS  a s ev er al  m i n i m u m   s u p p o r t.  I t m ee t s   th e x p ec tati o n   th at  C B S_ C L A S S *   i s   m o r e   ef f ic ien t t h a n   C B S_ C L ASS.           Fig u r e   9 .   C o m p ar is o n   o f   cla s s if icatio n   ex ec u tio n   t i m at  d i f f er en m i n i m u m   s u p p o r t       T h f if t h   ex p er i m e n w as  a i m ed   to   co m p ar th ac cu r ac y   lev el  b et w ee n   C B S_ C L ASS *   a n d   C B S_ C L A S at  s ev er al  m i n i m u m   s u p p o r t.  I is   s h o w n   i n   Fig u r 1 0   th at  C B S_ C L A S S *   ca n   m ai n tai n   th e     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I J E C E     Vo l.  7 ,   No .   4 A u g u s 2 0 1 7     2 1 4 2     2 1 5 1   2150   ac cu r ac y   lev el,   co m p ar ed   to   C B S_ C L A S S.  I i s   co n cl u d ed   th at   C B S_ C L A S S *   ca n   lo w e r   th e   ex ec u tio n   ti m e   an d   m ai n tai n   th ac c u r ac y   le v el  as  w e ll.           Fig u r 10.   C o m p ar is o n   o f   n u m b er   o f   s eq u e n ce s   at  d i f f er e n t   m in i m u m   s u p p o r t.       4.   CO NCLU SI O N   T h ex p er im e n r es u lt s   p r o v ed   th at  th p r o p o s ed   m et h o d   C B S_ C L A SS *   g iv e s   b etter   r esu lts   i n   class i f icatio n   ex ec u tio n   ti m e   th an   C B S_ C L A S s i g n i f ica n tl y   a n d   also   ca n   m ai n tain   t h ac cu r ac y   le v el .   C o m p ar ed   to   C B S_ C L A S S,  C B S_ C L ASS *   ca n   r ed u ce   t h c lass i f icatio n   e x ec u tio n   ti m b y   8 9 %.  T h is   is   d u e   to   C B S_ C L ASS *   o n l y   p r o ce s s es  le s s er   n u m b er   o f   s eq u en tial  p atter n s   t h at  s ati s f y   u s er s   co n s tr ai n s o   th a t   class i f icatio n   ex ec u tio n   t i m i s   r ed u ce d .   Mo r eo v er ,   s u b s eq u en ce   ch ec k i n g   o f   te s d ata  to   th lis o f   C SP   ca n   in cr ea s e   t h class if icatio n s   ac cu r ac y   le v el.   T h is   r esu lt  g i v es  g o o d   ex p ec tatio n   f o r   f u r t h er   r esear ch   to   in co r p o r ate  m u ltip le  co n s tr ain ts   i n   s eq u en tial  p atter n   m i n i n g   a n d   in teg r ate  it  w it h   class if icati o n   p r o ce s s .   W b eliev th i s   ap p r o ac h   ca n   y ield   m u c h   b etter   p er f o r m a n ce .       ACK NO WL E D G E M E NT S   We   w o u ld   li k to   th a n k   P r o f .   Sit o h an g   an d   Dr .   Sap ta w ati   f o r   th g u id an ce ,   as s is ta n ce   w it h   t h is   r esear ch   an d   co m m e n ts   t h at  g r ea tl y   i m p r o v ed   th m a n u s cr ip t .       RE F E R E NC E S   [1 ]   X .   Ya n ,   De sig n   a n d   A n a l y sis  o f   P a ra ll e M a p Re d u c e   b a se d   KN N - jo in   A lg o ri th m   f o Big   Da ta  Clas sif ic a ti o n ,   In d o n e s.  J .   E lec tr.   En g .   C o mp u t.   S c i. ,   v o l .   1 2 ,   n o .   1 1 ,   p p .   7 9 2 7 7 9 3 4 ,   2 0 1 4 .   [2 ]   N.  L e sh ,   M .   J.  Zak i,   M .   Og ih a ra ,   M in in g   Fea t u re fo S e q u e n c e   Cla ss if ica ti o n ,   in   P r o c e e d in g o f   th e   f i f th   A CM   S IG KD D In tern a ti o n a Co n f e re n c e   o n   K n o w led g e   Disc o v e r y   a n d   Da ta M in in g ,   AC M ,   1 9 9 9 ,   p p .   3 4 2 3 4 6 .   [3 ]   R.   Y.  Ya sm in ,   G .   A .   P .   S a p taw a ti ,   B.   S i to h a n g ,   S u rv e y   o n   S e q u e n ti a P a tt e rn   M in i n g ,   in   ICI BA ,   2 0 1 3 .   [4 ]   D.  W u ,   J.  Re n ,   S e q u e n c e   Clu st e rin g   A l g o rit h m   Ba se d   o n   W e ig h e d   S e q u e n ti a P a t tern   S im il a rit y ,   In d o n e s.  J .   El e c tr.   En g .   Co m p u t .   S c i. ,   v o l.   1 2 ,   n o .   7 ,   p p .   5 5 2 9 5 5 3 6 ,   2 0 1 4 .   [5 ]   R.   Ag ra w a l,   R.   S rik a n t,   M in in g   S e q u e n ti a P a tt e rn s ,   in   P r o c e e d i n g o f   th e   El e v e n th   In tern a ti o n a Co n f e re n c e   o n   Da ta E n g in e e rin g ,   1 9 9 5 ,   p p .   3 14.   [6 ]   R.   S rik a n t,   R.   A g ra w a l,   M in in g   S e q u e n ti a P a tt e rn s :   Ge n e ra li z a ti o n a n d   Per fo rm a n c e   Imp r o v e me n ts ,   i n   5 t h   In tern a ti o n a C o n f e re n c e   o n   Ex ten d i n g   Da tab a se   T e c h n o l o g y   (ED BT   ’9 6 ) ,   1 9 9 6 ,   p p .   1 1 7 .   [7 ]   M .   J.  Zak i,   S P A DE :  A n   Eff icie n A lg o rit h m   f o M in in g   F re q u e n S e q u e n c e s,”  M a c h .   L e a rn . ,   v o l .   4 2 ,   n o .   1 2 ,   p p .   31 6 0 ,   2 0 0 1 .   [8 ]   J.  P e i,   J.  Ha n ,   P .   He len ,   Be h z a d   M o rta z a v i - a sl,  Q.  Ch e n ,   U.  Da y a l,   M. - C.   Hs u ,   P re f ix S p a n  :  M i n in g   S e q u e n ti a l   P a tt e r n s E f f icie n tl y   b y   P re f ix - P ro jec ted   P a t tern   G ro w th ,   2 0 0 1 .   [9 ]   J.  Hu a n g ,   C.   T se n g ,   J.  Ou ,   a n d   M .   Ch e n ,   A   G e n e ra M o d e f o S e q u e n ti a P a tt e r n   M in in g   w i th   a   P ro g re ss iv e   Da tab a se ,   in   IEE T r a n sa c ti o n s   o n   K n o wle d g e   a n d   Da t a   E n g i n e e rin g ,   2 0 0 8 ,   v o l.   2 0 ,   n o .   9 ,   p p .   1 1 5 3 1 1 6 7 .   [1 0 ]   R.   Y.  Ya s m in ,   G .   A .   P .   S a p taw a ti ,   a n d   B.   S it o h a n g ,   S u rv e y   o n   S e q u e n ti a P a t tern   in   P re p r o c e ss in g   P h a se   f o Kn o w led g e   Da ta Disc o v e ry ,   in   ICIBA ,   2 0 1 3 .   [1 1 ]   C.   L e e ,   CBS  :  Ne Cla ss if ic a ti o n   M e th o d   b y   Us in g   S e q u e n ti a Pa tt e rn s ,   i n   P r o c e e d in g o f   th e   2 0 0 5   S IA M   In tern a ti o n a C o n f e re n c e   o n   Da ta  M in i n g .   S o c iety   f o In d u strial  a n d   A p p li e d   M a t h e m a ti c s ,   2 0 0 5 ,   p p .   5 9 6 6 0 0 .   [1 2 ]   R.   Y.  Ya s m in ,   G .   A .   P .   S a p taw a ti ,   B.   S it o h a n g ,   Cla ss if ica t io n   Ba se d   o n   Co n stra i n e d   Pro g re s siv e   S e q u e n ti a l     Evaluation Warning : The document was created with Spire.PDF for Python.
I J E C E     I SS N:  2 0 8 8 - 8708       C la s s i fica tio n   w ith   S in g le  C o n s tr a in t P r o g r ess ive  Min in g   o f S eq u en tia l P a tter n s   ( R eg in a   Yu lia   Ya s min )   2151   Pa tt e rn   M in in g  :  P ro p o se d   M o d e l ,   i n   2 0 1 6   I n tern a ti o n a Co n f e re n c e   o n   Da ta  a n d   S o f twa re   En g in e e rin g   (Ic o DSE ) ,   2 0 1 6 .   [1 3 ]   J.  Ha n ,   H.  Ch e n g ,   D.  X in ,   X .   Y a n ,   F re q u e n P a tt e rn   M i n i n g Cu rre n S tat u a n d   F u t u re   Dire c ti o n s ,   Da ta   M i n .   Kn o wl.   Disc o v . ,   v o l.   1 5 ,   n o .   1 ,   p p .   5 5 8 6 ,   Ja n .   2 0 0 7 .   [1 4 ]   J.  P e i,   Ha n   Jia w e i,   W .   Wan g ,   M in in g   S e q u e n t ia P a tt e rn wit h   Co n stra i n ts  in   L a rg e   Da ta b a se s ,   in   P r o c e e d in g o f   th e   e lev e n th   in ter n a ti o n a c o n f e re n c e   o n   In f o rm a ti o n   a n d   k n o w led g e   m a n a g e m e n t.   A CM ,   2 0 0 2 ,   p p .   18 2 5 .       Evaluation Warning : The document was created with Spire.PDF for Python.