I nte rna t io na l J o urna l o f   I nfo rm a t ics a nd   Co m m un ica t io n T ec hn o lo g y   ( I J - I CT )   Vo l. 9 ,   No . 1 Ap r il   2 0 2 0 ,   p p .   9 ~ 1 8   I SS N:  2252 - 8 7 7 6 ,   DOI 1 0 . 1 1 5 9 1 /iji ct. v 9 i1 . p p 9 - 1 8          9       J o ur na l ho m ep a g e h ttp : //ij ict. ia esco r e. co m   M emetic  a lg o rith m for sho rt  mess a g ing  serv ice spa m filt e r using   text norma liza tio n and  sema ntic  appro a ch       Arno ld Adim a bu a   O j ug o 1 Andrew  O k o nji  E bo k a 2   1 De p a rtme n o M a t h e m a ti c s/Co m p u ter S c ien c e ,   F e d e ra Un iv e rsi ty   o f   P e tro leu m   Re so u rc e s E ffu r u n ,   Nig e ria    2 De p a rtme n o Co m p u ter  S c ien c e   Ed u c a ti o n ,   F e d e ra Co ll e g e   o E d u c a ti o n   (Tec h n ica l)  As a b a ,   Nig e ria       Art icle  I nfo     AB S T RAC T     A r ticle  his to r y:   R ec eiv ed   J u l 1 2 ,   2 0 19   R ev is ed   No v   13 ,   2 0 19   Acc ep ted   J an   12 ,   2 0 20       To d a y ’s  p o p u lari ty   o th e   s h o rt   m e ss a g e s e rv ice (S M S h a s   c re a ted   a   p ro p it io u e n v iro n m e n fo s p a m m in g   to   t h ri v e .   S p a m a re   u n so l icited   a d v e rti sin g ,   a d u l t - th e m e d   o r   in a p p ro p riate   c o n ten t,   p re m iu m   fra u d ,   sm ish in g   a n d   m a lwa re .   Th e y   a re   a   c o n sta n t   re m in d e r   o t h e   n e e d   fo a n   e ffe c ti v e   sp a m   fil ter.  Ho we v e r,   S M S   li m it a ti o n o 1 6 0 - c h a rc a ters   a n d   1 4 0 - b y t e siz e   a s   we ll   a it b e i n g   rip p led   wi th   sla n g s,  e m o ti c o n a n d   a b b re v iat io n fu rt h e r   in h i b it e ffe c ti v e   train in g   o m o d e ls  to   a id   a c c u ra te  c las sifica ti o n .   Th e   stu d y   p ro p o se G e n e ti c   Alg o r it h m   Trai n e d   Ba y e sia n   Ne two r k   s o lu t io n   t h a se e k to   n o rm a li z e   n o isy   fe a ts,  e x p a n d   t e x v ia  u se   o f   lex ico g ra p h ic   a n d   se m a n ti c   d ictio n a ries   th a t   u se wo r d   se n se   d isa m b ig u a ti o n   tec h n iq u e   t o   train   th e   u n d e rl y i n g   lea rn i n g   h e u risti c s.  A n d   i n   tu r n ,   e ffe c ti v e ly   h e lp   t o   c las sify   S M S   in   sp a m   a n d   leg it ima te  c las se s.  Hy b rid   m o d e c o m p rise o tex t   p re p ro c e ss in g ,   fe a tu re   se lec ti o n   a we ll   a train in g   a n d   c las sifica ti o n   se c ti o n .   S tu d y   u se a   h y b ri d   G e n e ti c   Alg o rit h m   train e d   Ba y e sia n   m o d e fo r   wh ich   th e   G is  u se d   fo fe a tu re   se lec ti o n wh il e ,   t h e   Ba y e sia n   a lg o ri th m   is  u se d   a c las sifier .   K ey w o r d s :   B ay es th eo r em   Me m etic  alg o r ith m   Sem an tic  p r o ce s s in g   Sp am   f ilter s   T ex t n o r m aliza tio n   T ex t p r o ce s s in g   T h is i a n   o p e n   a c c e ss   a rticle   u n d e r th e   CC B Y - SA   li c e n se .     C o r r e s p o nd ing   A uth o r :   Ar n o ld   Ad im a b u Oju g o ,   Dep ar tm en t o f   Ma th em atics/C o m p u ter   Scien ce ,   Fed er al  Un iv er s ity   o f   Petr o le u m   R eso u r ce s   E f f u r u n ,   P.M . B   1 2 2 1 ,   E f f u r u n ,   W ar r i,  Delta  State,   Nig er ia .   E m ail:  a rn o ld o j u g o @g m a il . c o m       1.   I NT RO D UCT I O N     T h e   ad v e n o f   s h o r m ess ag in g   s er v ices  b y   Neil  Pap wo r th   s i n ce   1 9 9 2 ,   h as  s ee n   g r ea p en et r atio n   an d   tr em en d o u s   g r o wth   r ate  o f   t h s er v ice.   A d v en t   o f   m o b ile   p h o n es  with   en h a n ce   f ea t u r es  h as  co n tr ib u ted   to   th lar g s ca le  ad o p tio n   o f   SMS  b y   u s er s .   T h p o r tab il ity ,   m o b ilit y ,   u b iq u ity   o f   s er v ices  an d   its   lo co s co n tin u es  to   p r o m o te  tex m ess ag es  to   b ec o m th m o s u s ed   m ea n s   o f   elec tr o n ic  co m m u n icatio n   in   th wo r ld   to d ay   [1 - 2] .   Sh o r Me s s ag Ser v ice  ( SMS)   i s   tex s er v ice  co m p o n e n o f   p h o n es  o r   m o b ile   co m m u n icatio n   s y s tem s   with   s tan d ar d ized   p r o to c o ls   th at  all o th ex c h an g e   o f   s h o r te x t   m ess ag es  b etwe en   f ix ed   lin o r   m o b ile  p h o n d e v ices.  An   esti m ated   2 3 - b illi o n   SMS  i s   s en d ai ly   wo r ld wid in   2 0 1 4 W h ile,   a   to tal  o f   8 . 3   tr illi o n   SMS  was  s en wo r ld wid in   th s am y ea r   with   n et  m ar k et  r ev e n u o f   o v er   $ 1 2 8 B illi o n   in   2 0 1 1 .   I n   2 0 1 6 ,   th r ev en u was  f o r ec asted   to   b o v er   $ 1 5 3 B illi o n An d ,   ev id en ce   h as  s h o wn   th at  3 . 3 9 b illi o n   SMS  was  s en an d   r ec eiv ed   i n   Nig er ia  alo n i n   th y ea r   2 0 1 3   [ 1 ] .   T h in cr ea s ed   p o p u lar ity   an d   c o n s eq u en t   p r o life r atio n   o f   SMS  p latf o r m s ,   h as  also   s ee n   co r r esp o n d i n g   r is in   u n s o licited   SMS  ca lled   s p am s .   T h I T U   2 0 0 5   ca m p aig n   witn ess ed   r is in   th u n s o licited   co m m e r cial  ad v er ts   as  s en to   m o b ile   p h o n es  v ia  SMS.   R ec en d r if f r o m   em ail  to   SMS  s p am s   is   attr ib u ted   to   th av ailab ilit y   o f   ef f ec tiv e   em ail  f ilter s ,   u s er   awa r en ess   an d   in d u s tr y   co llab o r atio n   [3 - 6] .     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 7 7 6   I n t J I n f   &   C o m m u n   T ec h n o l Vo l.  9 ,   No .   1,   Ap r il   20 20 9     1 8   10   Sp am s   ar u n s o licited   elec tr o n ic  m ess ag es  th at  in clu d e ,   an d   n o lim ited   to ,   e m ails ,   SMS,  Vo ice  o v er   I P ( Vo I P)  an d   in s tan m ess ag in g   f r o m   ch ats.  Sp am s   ar u n s o licited   o r   u n wan ted   m ess ag es f r o m   s en d er ,   s en t   in d is cr im in ately   with   n o   p r io r   r elatio n s h ip   to   u s er   m o s tly   f o r   co m m er cial  r ea s o n s   [7 - 8] .   SMS  Sp am s   r an g e s   f r o m   a d u lt - th em e d   an d   in ap p r o p r iate  co n ten ts ,   u n s o licited   a d v er ts ,   s m is h in g   an d   m o b ile  m alwa r etc.   SMS   s p am s   h av s in ce   b ec o m en o r m o u s   ch allen g   ca u s in g   g r ea lo s s   o f   r ev en u to   I n ter n et   Ser v ice  Pro v id er s ,   Mo b ile  Netwo r k   Op er ato r s   an d   u s er s   in   g e n er al.   On   o v er a ll s p am s   g r ew  b y   3 0 0 f r o m   ju s 2 0 1 1   t o   2 0 1 2   f r o m   m illi o n s   o f   SMS  r ec eiv e d   wo r ld wid e;  An d   3 3 . 3 attr i b u ted   to   s p am - r elate d   m ess ag es  [ 2 ,   8 ] In   Nig er ia   alo n e,   an   esti m ated   3 3 4 , 8 5 7 , 6 8 5   SMS  s p am s   wer r ec eiv ed   d aily   in   2 0 1 5 I m p ly in g   t h at  lo ts   o f   m o b ile  p h o n e   u s er s   ar h an d icap p ed   in   th co n tr o o f   th n u m b er   o f   s p am s   th ey   r ec eiv e   [ 9 ,   10 ] .   B esid es  b ein g   d is tr ac tiv an d   an n o y in g ,   u s er s   n ee d   ce r tain   d eg r ee   o f   p r iv ac y   wit h   th eir   p h o n es  an d   f r ee   f r o m   Sp am   an d   v ir u s es   in v asio n s   [ 1 1 - 1 4 ] .   Mo b ile  n et wo r k   o p er at o r s   ar g ea r ed   to war d s   r ed u cin g   th n u m b er   o f   s p am s   o v er   th eir   n etwo r k   as su ch   f l o o d in g   m ak es th SMS c h an n el  m o r i n v a s iv an d   less   s ec u r e   [ 1 5 - 17] .   T h tr em en d o u s   r is in   th u s ag o f   SMS  is   attr ib u ted   to   [ 1 6 ,   1 - 2] :   a T r u s in   SMS  ch an n el:  SMS  i s   p r iv ate  co m m u n icatio n   b etw ee n   two   p ar ties   o n ly   h as  cr ea ted   s o m lev el  o f   tr u s an d   ac c ep tan ce   all  o v er   th e   wo r ld   s u ch   th at  f in an cial  in s titu tio n   h as  ad o p ted   its   u s in   p ay m en au th o r izatio n b Hig h   o p en   r ate:  Av er ag e   tim it  tak es   to   r esp o n d   to   SMS  is   f aster   th an   em ail  an d   v o ice  ca ll    m ak in g   it  p r ef er r ed   ch o ice.   Statis tic s   h av s h o wn   SMS h as a n   a v er a g o p en   r ate  o f   9 9 % a n d   o p e n s   with in   1 5 - m in u tes;   W h ile,   a n   em ail  h as a n   o p en   r ate  o f   2 0 - 2 5 an d   o p e n   wi th   2 4 - h o u r s .   c)   L o co s o f   tr an s ac tio n Av er ag c o s p er   SMS  is   alm o s t   n eg lig ib le,   an d   f r ee   f o r   s o m e   n etwo r k s     af f o r d in g   m o b il p h o n e   u s er s   th o p p o r tu n ity   to   s en d   as  m an y   with o u r ec o u r s to   co s t.  M ar k eter s   an d   m a n y   o th er   in s titu tio n   h as  em b r ac e   b u lk   S MS  m ed iu m   f o r   ad v er tis in g   an d   in ter ac with   cu s to m er s .   d )   E ase  an d   C o n v en ien ce   o f   tex tin g   e n ab les  its   u s in   n ea r ly   ev er y   en v ir o n m en with o u d is r u p ti n g   p eo p le  ar o u n d   p h o n u s er s Un lik in   v o ice  ca ll,  SMS  ca n   b in   ab s o lu te  s ilen ce   with o u in co n v en ien cin g   p eo p le  ar o u n d .   Aid ed   b y   th p o r tab le  s ize  o f   m o s m o b ile  d ev ices,  co m m u n icatio n   ca n   b d o n al m o s t e v er y wh er e   an d   a n y   p o s itio n .   SMS  h as  g r ea b en ef it   f o r   b o th   s u b s cr ib er s   an d   o p e r ato r s   in   d iv er s e   way s   ce n ter e d   o n   c o n v en ien ce ,   f lex ib ilit y ,   s ea m less   in teg r atio n   o f   m ess ag in g   s er v ices  an d   d ata  ac ce s s .   Oth er s   m ay   in clu d e   [1 - 2] ( a)   d eliv e r y   o f   n o tific atio n s ,   ( b )   g u ar an tee d   d eliv er y ,   ( c )   r eliab le,   lo w - co s f o r   co n cise  d ata,   ( d )   ab ilit y   to   s cr ee n   m ess ag es   an d   r et u r n   ca lls ,   ( e)   in c r ea s es  p r o d u ctiv ity ,   ( f )   m o r e   s o p h is ticated   f u n ctio n ality   p r o v i d es  en h an ce d   u s er   b en ef its ,   ( g )   d eliv er y   to   m u lt ip le  u s er s   at  s am tim e,   ( h )   ab ilit y   to   r ec eiv d iv er s in f o r m atio n ,   ( i)   e - m ail  g en er atio n ,   ( l)   c r ea tio n   o f   u s er   g r o u p s ,   ( m )   in teg r atio n   with   o th er   d ata  a n d   I n ter n et - b ased   ap p licatio n ,   an d   ( n )   in cr ea s in   r ev en u f o r   m o b ile  n et wo r k   o p er ato r s   ( MN O ) .       2.   SM S,  SPA M AND  F I L T E RS   T h tr em e n d o u s   r is in   th e   u s ag o f   SMS  is   attr ib u ted   to   its   ea s o f   u s e,   u b iq u ity   in   n atu r e,   h ig h   o p en   r ates,  lo co s o f   tr an s ac tio n   an d   in h er e n tr u s in   th ch an n el.   T h ea s o f   u s e,   p o r tab ilit y ,   u b iq u ity ,   lo o p en   r ate  an d   lo co s o f   SMS  ar m ajo r   f ac to r s   f o r   its   p o p u lar ity   an d   u s ag e.   T h is   g r o wth   r ate  h as  eq u ally   attr ac ted   s p a m m in g   to   th ch an n el.   Sp am m e r s   ar w ell  o r g an ized   b u s in ess es  s ee k in g   to   m ak m o n ey   th r o u g h   th u s o f   em ail,   m o b ile  ( SMS) ,   I n s tan m ess ag e,   UseNet  n ewsg r o u p ,   So cial  n e two r k   an d   in ter n et   telep h o n y   ch a n n el  with o u th co n s en o f   s u b s cr ib er   ( u s er ) .   T h eir   m er ch an d is ar u n s o licited   ad v er tis in g ,   in ap p r o p r iate  o r   ad u lt - th e m ed   co n ten t,  p r em iu m   f r au d ,   s m is h in g   an d   ev e n   d is tr ib u tio n   o f   m alwa r g en er ally   ca lled   s p am .   SMS  s p am s   ar e   th u s ,   u n s o licited   an d   u n wan t ed   m ess ag es  s en to   m o b ile  p h o n e   u s er s .   Sp am   tr en d   is   o n   th r is an d   its   to ll  o n   s u b s cr ib er s   an d   ev en   M NO  is   g ettin g   in ten s iv an d   p r o v en   to   b o f   g r ea t   co n ce r n   t o   al l   [ 1 8 -   20 ] .     2 . 1 .    Sp a m s :   s o urce s   a nd   co ns equent s   SMS  s p am   is   g en er ates  f r o m   v ar io u s   s o u r ce s o n o f   th ty p ical  s p am   s o u r ce s   is   n u m b er   h ar v esti n g ,   wh ich   is   ca r r ied   o u t   b y   I n te r n et  s ites   o f f er in g   f r ee ”  s er v ices.  E n d   u s er s   ca n   also   r ec eiv e   m o b ile  s p am   f r o m   th f o llo win g   s o u r ce s   [ 1 2 ]     Or g an izatio n s   an d   in d iv id u als  th at  p ay   MN to   d eliv er   SM to   th s u b s cr ib er s T h ey   ar e   r esp o n s ib le  f o r   th h ig h est  n u m b er   o f   s p am   r ec eiv ed   o n   s u b s cr ib er s   m o b il p h o n es.  Alth o u g h ,   MN Os  h av ad o p ted   an d   en f o r ce d   u s o f   o p t - o u t,  o r   ev e n   o p t - in   p r o ce s s es f o r   th u s er   to   s to p   r ec eiv in g   p r o m o s   o r   ad s .     Or g an izatio n s   th at  d o   n o p ay   f o r   th SMS  th at  ar d eliv er ed   to   th s u b s cr ib er s th ey   ar u s u ally   wo r s an d   co n s id er ed   as f r a u d   b ec a u s it d am ag es M NO  b r an d s .     I n d iv id u al  o r ig i n ated   m ess ag e s   th at  d is tu r b   r ec ip ien ts .   Ap ar f r o m   th d i s tr ac tin g   a n d   an n o y in g   ef f ec ts   o f   s p am ,   th er ar e   o th er   s er io u s   co n s eq u en ce s   g en er ated .   T h e r is   th is s u o f   co m p etitio n   f o r   r eso u r ce s   b etwe en   m illi o n s   o f   illeg iti m ate  an d   leg itima te  m ess ag es  b ein g   tr an s m itted .   T h ese  m ess ag es  co n s u m n etwo r k   r eso u r ce s   th a co u ld   h a v o th er wis b ee n   allo ca ted   to   o th er   le g itima te  s er v ices  b y   MN O   [ 1 5 ] .   Sp am m in g   ac tiv ities   attr ac ts   ex tr co s f o r   m o b ile   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J I n f   &   C o m m u n   T ec h n o l   I SS N:  2252 - 8 7 7 6       Memetic  a lg o r ith fo r   s h o r mess a g in g   s ervice  s p a filt er  u s in g   text    ( A r n o ld   A d ima b u a   Oju g o )   11   o p er ato r s   t o   ad eq u ately   m ain t ain   an d   s er v ice  t h eir   m o b ile  c o m m u n icatio n   in f r astru ctu r es  f o r   e f f ec tiv s er v ice   d eliv er y .   Als o   f lo o d in g   o f   M NO  in f r astru ctu r with   illeg itima te  m ass ag es  ca n   ca u s leg it im ate  u s er s   to   s u f f er   d en ial  o f   s er v ice.   Hu g e   am o u n o f   s p am   m ess ag es  also   co n ce r n s   th ce llu la r   ca r r ier s   as  t h m ess ag es  tr av er s e   th r o u g h   th n etwo r k ,   ca u s i n g   co n g esti o n   an d   h en ce   d e g r ad n etwo r k   p er f o r m an ce   [ 1 6 ] .   Mo b ile   co m m u n icatio n   in d u s tr ies  ar also   f ac ed   with   th r ea f r o m   v ir u s ,   T r o ja n   h o r s e,   wo r m s   an d   m alwa r e   p r o p a g ated   b y   s p am   SMS  [ 1 5 ] .   Fra u d u len t   m ess ag in g   ac t iv ities   s u ch   as  p h is h in g   id en t ity   th ef an d   o th er   f r au d   r elate d   ac ti v ities   wh ich   wer p r o m in en t   in   em ail   m ess ag in g   s er v ices  h as  m ig r ate d   to   SMS  p latf o r m   [ 1 7 ,   18] .   Fin an cial  lo s s ,   d am a g to   m o b ile  u s er s   r ep u tatio n   an d   t h at  o f   th MN ar e   is s u es to   b co n s id er ed   [ 1 9 ]     2 . 2 .    Sp a m   f ilte rs   SMS  s p am   f ilter s   s h ar es  s im ilar   f ea tu r es  an d   ch allen g es  with   em ail  s p am   f ilter s .   T h ey   ar b o th   s ad d led   with   th task   o f   r ea l - tim f ilter in g   ef f icien cy   an d   t h o p tio n   t o   d ec i d b etwe en   clien t - s id an d   o r   s er v er - s id f ilter in g .   T h m o b ile  s p ac is   also   f ac ed   with   th ch allen g o f   o v er co m in g   m i s class if icatio n   co s an d   elim in ate  f alse - p o s itiv es ( g en u in SMS in co r r ec tly   class if ied   as sp am   b y   f ilter ) ,   an d   is s u o f   co n ce p t d r if t   in   o r d er   t o   ev ad f ilter s .   T h u s ,   m o s ex is tin g   ap p r o ac h es  o f   co m b atin g   SMS  s p am   ar im p o r ted   f r o m   s u cc ess f u em ail - s o lu ti ons   [2 1 ,   2 2 ] .   N o all  s o lu tio n s   to   em ai s p am   ar ap p licab le  to   SMS  d u to   th f ac th at  estab lis h ed   em ail  s p am   f ilter s   ar u n ab le  to   tack le  SMS  Sp am   b ec au s p e r f o r m an ce   o f   e m ail  s p am   f ilter s   is   s er io u s ly   d eg r ad ed   wh e n   u s ed   to   f ilter   SM s p am .   T h is   is   at tr ib u ted   to   its   lim ited   1 6 0 - ch ar ac ter   o f   1 4 0 - b y tes   s ized   m ess ag es.  Als o ,   th ese  m ess ag es  ar r if with   s lan g s ,   s y m b o ls ,   em o tico n s   a n d   a b b r e v iatio n s   th at  in h ib it   p r o p er   class if icatio n   [2 3 - 2 4 ] .   T o   o v er co m th e   s h o r tf all  o f   em ail  f ilter s   in   h an d lin g   SMS  s p am   s u c ce s s f u lly ,   co m b in ed   f ilter in g   tech n i q u e   t o   r ed u ce   n o is in   SMS  an d   ex p an d s   th e   m ess ag s ize  [2 5 2 6 ]     is   th f o cu s   o f   th is   r esear ch .   Sp am   f ilter s   ca n   b d i v id ed   i n to   n u m b e r   o f   b r o a d   ca teg o r ies  b ased   o n   t h m eth o d   u s ed   to   f ilter   Sp am .   T h e y   in clu d [2 7 ] lis b ased ,   ch allen g e/r esp o n s s y s tem ,   co n te n b ased ,   co llab o r ativ e   an d   Heu r is tics   B a s ed   f ilter s .     2 . 3 .     Cha lleng e - re s po ns f ilte rs   T h is   f ilter   f o r ce s   m ess ag e   s en d er   to   p r o v th e y   ar h u m an   v ia  s o m test .   T h is   f ilter   b lo ck s   u n d esira b le  m ess ag es  b y   f o r c in g   th s en d er   to   p er f o r m   t ask   b ef o r th eir   m ess ag is   d eliv er ed .   W ith   task   s u cc ess ,   th m es s ag ( an d   f u tu r m ess ag es)  will  b d eliv er ed   to   th r ec ip ien t;  W h ile,   f ail u r to   co m p lete  th e   ch allen g af ter   ce r tain   tim p er io d ,   lead s   to   m ess ag r ejec tio n   [2 4 ] .   T h m o s t c o m m o n   c h allen g co n s is ts   o f   d is to r ted   im ag es  an d   te x t.  T o   tr iu m p h   th is   ch allen g e,   u s er   m u s ty p tex o r   ar r an g im a g es  co r r ec tly .   W ith   ch allen g e/r esp o n s f alse  p o s itiv es  ca n   b r ed u ce d   to   b ar est  m in im u m .   An o th er   m er it  o f   th is   ap p r o ac h   is   in   its   lo s y s tem   r eso u r ce   r eq u ir e m en ts ,   s in ce   n o   C PU - in ten s i v p atter n   m atch i n g   is   r eq u i r ed .   Ho wev er ,   th is   ap p r o ac h   ca u s es  m o r p r o b le m s   th an   it  s o lv es.  Fo r   in ex p e r i en ce d   o r   v is u al  h an d icap p ed   u s er s ,   th ch allen g es  ar co m p letely   u n s o lv ab le.   R e g u lar   u s er s   ar p r o v o k ed   b y   t h ch allen g es  an d   c h o o s n o to   d o   s o   s in ce   th ey   v iew  it  as  an   u n ac ce p tab le  i r r itatio n .   Als o ,   au to m ate d   e m ail  th at  u s er   wo u ld   wa n to   r ec eiv ( tr a v el  co n f ir m atio n s ,   o n lin p u r c h ase  r ec eip ts ,   etc)   ar tr a p p ed   b y   th is   ap p r o ac h   an d   n ev er   d eliv e r ed   [2 8 - 30 ] .     2 . 4 .     L is t - ba s ed  f ilte rs     B lack lis t:  T h is   ea r lie s s p am - f ilter in g   m eth o d   s ee k s   to   b lo ck   u n wan ted   m ess ag es  f r o m   an   alr ea d y   cr ea ted   lis o f   s en d er s .   B lack lis t s   ar e   r ec o r d s   o f   em ail  ad d r ess es,  I n ter n et  Pro to co ( I P)  ad d r e s s es   an d   p h o n e   n u m b er s   th at  h av b ee n   p r e v io u s ly   u s ed   to   s en d   s p am .   W h en   in co m in g   m ess ag ar r iv es,  s p am   f ilter   ch ec k s   if   I P ,   e m ail  ad d r ess   o r   p h o n n u m b er   is   o n   b lack li s t.  I f   s o ,   th e   m ess ag is   co n s i d er ed   s p am   an d   r ejec ted .   B lack lis ts   en s u r k n o wn   s p am m er s   ca n n o r ea ch   u s er s '   in b o x es.  T h eir   o n ly   d e m er it  is   th at  th ey   ca n   also   m is id en tify   leg itima t s en d er s   as sp am m er s   [2 4 29 ] ] .     W h itelis t:  T o   b lo ck   s p am s ,   wh itelis r ath er   th an   s p ec if y   s en d er s   to   b lo c k   m ess ag es  f r o m ,   it  s p ec if ies   wh ich   s en d er s   to   allo m ess ag es  f r o m .   T h ese  a d d r ess es  ar s to r ed   in   tr u s ted - u s er s   lis t.  M o s s p am   f ilter s   u s es  wh itelis alo n g s id o th er   tech n iq u es  to   cu d o wn   o n   th n u m b e r   o f   g en u in SMS  t h at  ac cid en tally   g et  f lag g ed   as  s p am .   f ilter   th at  u s es  ju s wh itel is im p li es  th at  an y o n n o a p p r o v ed   is   au to m atica lly   b lo ck ed .   So m a n ti - s p am s   u s wh itelis v ar iatio n   ca lled   au to m atic  wh itelis t.  Her e,   an   u n k n o wn   s en d er   ad d r ess   is   ch ec k ed   ag ain s d atab ase;  if   th ey   h av n o   h is to r y   o f   s p am m in g     th eir   m ess ag is   d eliv er ed   to   th r ec ip ien t' s   in b o x   an d   ad d e d   to   th wh itelis t   [2 4 ,   2 9 ] .     Gr ey lis t:  T h is   f ilter   wo r k s   wi t h   th ass u m p tio n   th at  m o s s p am m er s   s en d s   b atch   o f   m ess ag es  o n ce .   W h en   m ess ag f r o m   u n k n o wn   a d d r e s s   is   r ec eiv ed ,   it  b lo ck s   an d   r e v er f ailu r d eliv e r y   to   th s en d in g   s er v e r .   I f   th m ess ag is   r esen t,  w h ich   m o s leg itima te  s er v e r s   d o ,   f ilter   r ec eiv es  it  a n d   a d d s   th ad d r ess /p h o n e   n u m b er   to   th li s t.  Alth o u g h   o v er h ea d   o f   th f ilter   is   l o w,   its   d em er it  i s   th u n ju s d elay   d eliv er y   ex p er ien ce d   b y   g en u i n m ess ag es to   its   r ec ip ien t   [2 4 , 2 9 ] .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 7 7 6   I n t J I n f   &   C o m m u n   T ec h n o l Vo l.  9 ,   No .   1,   Ap r il   20 20 9     1 8   12   2 . 5 .     Co nte nt - ba s ed  f ilte rs   C o n ten t - b ased   f ilter in g   m eth o d s   ar b ased   o n   th e v alu atio n   o f   i n d iv id u al  wo r d s   o r   p h r ase s   f o u n d   in   th m ail/m ess ag to   d eter m in if   m ess ag is   s p am   o r   n o t.  T h is   m eth o d   a n aly ze s   m ess ag h ea d er ,   s u b ject  an d   b o d y   to   d is co v er   an y   d is tin ctiv ch ar ac ter is tic   [ 30 ] .   T h ey   ar f u r th er   class if ied   in to   wo r d - b ased   an d   h e u r is tic  f ilter s .   W o r d - b ased   f i lter s   u s s et  o f   r u les  to   d etec g en u i n f r o m   s p am   SMS.  Als o   k n o wn   as  r u le - f ilter s ,   th ey   u s r u les  ab o u ac tu al   wo r d ( s )   o r   p h r ase( s )   i n   a   m ess ag to   class if y   m ess ag es  in to   g en u i n an d   s p a m   class es.  R u le  f ea tu r es  in clu d e   wo r d   t y p e,   f r e q u en c y   o f   o cc u r r en ce ,   s tr u ct u r e   o f   tex t ( e. g .   f o n s ize,   co l o u r   etc) ,   p r esen ce   o f   m an y   p er io d s   b et wee n   letter s   ( e. g .   F.R . E . E ) ,   ex is ten ce   o f   im ag e,   etc.   R u les  ar f ilter - d ep en d en t   an d   ca n   v a r y   f r o m   s im p le  to   v er y   co m p lex .   d em e r it  o f   r u le - b ased   f ilter s   is   th at:  ( a)   th ey   ar k n o wled g e   in ten s iv e,   ( b )   tim co n s u m in g   p r o ce s s   in   r ev iewin g   s p am   m ess ag es  to   d eter m in t h r u les,  an d   ( c )   n ee d s   r eg u lar   u p d ate  o f   r u les as sp am m er s   ch an g es th eir   tactics  [3 1 - 3 4 ] .   C o n v er s ely ,   h eu r is tic - b ased   f ilter   ex am in es   m ess ag co n ten th r o u g h   v ar io u s   alg o r i th m s   an d   r eso u r ce s ,   an d   ass ig n s   p o in ts   to   wo r d s   o r   p h r ases .   W o r d s   co m m o n ly   f o u n d   i n   s p am s   s u ch   as  “FR E E ”  o r   "SE X, r ec eiv h ig h e r   s co r es.   T er m s   co m m o n ly   f o u n d   in   n o r m al  m ess a g es  r ec eiv lo we r   s co r es.  T h f ilter   th en   ad d s   u p   t o tal  s co r es.  I f   th m ess ag r ec eiv es  ce r tain   s co r o r   h ig h er   ( d ete r m in ed   b y   a n ti - s p am   ap p licatio n ' s   ad m in is tr ato r ) ,   t h f ilter   id en tifie s   it  as  s p am   an d   b lo ck s   it.   Me s s ag es  with   s co r e( s )   lo wer   th an   th t ar g et   n u m b er   ar e   d eliv er ed   to   th e   u s [3 5 ] .   B ay es ian   f ilter ,   KNN  class if ier ,   Ad aBo o s class if ier ,     Gar y   R o b in s o n   tech n iq u e,   Su p p o r t   Vec to r   Ma ch i n e,   Neu r a Netwo r k   ar e   ex am p les  [3 6 ] .   Usi n g   h eu r is tic  f ilter   allo ws  m an y   s p am   f ilter i n g   m eth o d s   to   b u s ed ,   r e s u ltin g   in   b etter   p er f o r m an ce   th an   an y   s in g le  m eth o d   b y   its elf .         3.   SO F T - CO M P U T I NG   F RA M E WO RK   3 . 1 .     B a y esia net wo r k s   Ar b ased   o n   th B ay esian   th eo r em   o f   co n d itio n al  p r o b ab il ity .   T h ey   h av b ee n   s u cc ess f u lly   ap p lied   to   m an y   d o m ain s   s u ch   as  m ed icin e,   m ac h in lea r n in g ,   s p ee ch   r ec o g n itio n ,   s ig n al   p r o ce s s in g ,   n atu r al  lan g u ag e   p r o ce s s in g   an d   ce llu lar   n etwo r k s .   T h e y   a r an   attr ac tiv m ac h in e   lear n i n g   tec h n iq u th at   r ep r esen ts   d o m ain   k n o wled g e   an d   d ata   in   a n   ele g an m ath em atica s tr u ctu r e   with   s im p lifie d   v i s u al  r ep r esen tatio n .   B ay esian   n et  s h o ws  g r ap h ic  p r o b a b ilit y   r elatio n s h ip s   b e twee n   s et  o f   v ar iab les  u n d er   th d o m ain   o f   u n ce r tain ty .   T h e y   ar e   u s u ally   s tr u ctu r ed   as  a   d ir ec ted   ac y cli g r ap h   an d   c o n d itio n al   p r o b a b ilit y   tab les  ( C PTs).   C PT  tab les  r ep r esen p r o b ab ilit y   o f   r an d o m   v ar iab le  wh e r e,   g iv en   th o cc u r r e n ce   o f   it s   p ar en n o d es.  W ca n   ap p ly   s am co n ce p t u al  s tr ateg y   to   s p am   f ilter s   [3 7 ] .   B ay esian   n et  class if ier s   ar b u ilt  b ased   o n   th tr ain in g   d at a.   I ts   b u ild in g   p r o ce s s   in clu d es  s tr u ctu r e   lear n in g ,   p ar a m eter   lear n in g ,   an d   b u ild in g   p r o b ab ilit y   d is tr i b u tio n   tab les  f o r   ea c h   n o d in   th n etwo r k .   T h er e   ar two   m ajo r   lear n in g   p r o ce s s es  n am ely ( a)   s tr u ct u r ed   lear n in g   o r   ca s u al  d is co v er y   in   w h ich   n etwo r k   lear n s   th s tr u ctu r an d   p ar a m eter s   with   th p r o v id ed   in p u d ata.   T h ca u s al  d is co v er y   aim s   to   lear n   th s tr u ctu r an d   lear n   t h p ar a m eter s .   I t   ac h iev es  th is   u s in g   eith er   o f   K2 ,   Hill  clim b in g   an d   T ab u - Sear ch a n d   ( b )   p r o b a b ilit y   d is tr ib u tio n   lear n in g   is   ac h iev ed   with   alg o r ith m s   lik B ay es  Net  esti m ato r ,   B MA   esti m ato r   an d   m u ltin o m ial  esti m ato r .   On ce   s tr u ctu r lear n i n g   is   co m p lete,   p ar am eter   lear n i n g   co m p letes  th C PT  tab les  f o r   ea ch   f ea tu r in   th B ay esian   Netwo r k .   T h n etwo r k   d esig n   in   f ig   1   is   f o r   d etec tin g   tex ts   in   SMS  an d   h elp in g   th m o d el  an d   alg o r ith m   to   c la s s if y   th ese  SM in to   eith er   o f   g en u i n e/leg itima te  an d   s p am   SMS.  B ay esian   n etwo r k   d esig n   n ee d s   to   co n s i d er   th e   attr ib u tes,  s ea r c h   alg o r ith m   an d   esti m atio n   alg o r ith m s .   T h u s ,   we   u s th e   h ill - clim b er   s ea r ch   alg o r ith m   with   f iv p a r en ts   u s ed   as  th s ea r ch   alg o r i th m   f o r   th is   n etwo r k   with   s im p le   esti m ato r   as a n   esti m ate  o n   alg o r ith m   with   th r esh o ld   v alu 0 . 5 ”  [3 8 ]     3. 2 .   G enet ic  a lg o rit h m   ( G A)   I n s p ir ed   b y   Dar win ia n   ev o lu tio n   o f   s u r v iv al   o f   f ittes t,  it  co n s is ts   o f   c h o s en   p o p u latio n   with   p o ten tial  s o lu tio n s   to   s p ec if i task .   E ac h   p o ten tial  s o lu tio n   is   an   in d iv i d u al  f o r   wh ic h   o p tim al  is   f o u n d   u s in g   f o u r   o p e r ato r s   n a m ely in itialize,   s elec t,  cr o s s o v er   an d   m u tat io n   [3 9 ] .   I n d iv id u als  with   g en es  clo s to   o p tim al,   is   s aid   to   b e   f it.  Fit n ess   f u n ctio n   d eter m in es  h o clo s a n   in d iv id u al  is   to   o p tim al  s o lu tio n .   [ 40 - 4 2 ].   T h b asic   o p er ato r s   f o r   GA  in clu d e :     I n itialize    I n d iv i d u al  d ata  ar en co d ed   i n to   f o r m s   s u itab le  f o r   s elec tio n .   E ac h   e n co d i n g s   ty p u s ed   h as   its   m er it.  B in ar y   e n co d i n g s   ar co m p u tatio n ally   m o r e   ex p en s iv e.   D ec im al  en co d in g   h as  g r ea ter   d iv er s ity   in   ch r o m o s o m an d   g r ea ter   v a r ian ce   o f   p o o ls   g en er ated f l o at - p o in en co d in g   o r   its   co m b i n atio n   is   m o r ef f icien th an   b in ar y .   T h u s ,   it   en co d es   as  f ix ed   len g th   v ec t o r s   f o r   o n o r   m o r p o o ls   o f   d if f er en ty p es.  T h f itn ess   f u n ctio n   ev alu ates   h o cl o s s o lu tio n   is   to   its   o p tim al    af ter   wh ich   t h ey   ar ch o s en   f o r   r ep r o d u ctio n .   I f   s o lu tio n   is   f o u n d ,   f u n ctio n   is   g o o d   an d   s elec ted   f o r   cr o s s o v er .   T h e   f itn ess   f u n ctio n   is   th e   o n ly   p a r t w ith   k n o wled g o f   t ask .   I f   m o r s o lu tio n s   ar f o u n d ,   th h i g h er   its   f itn ess   v alu e.     Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J I n f   &   C o m m u n   T ec h n o l   I SS N:  2252 - 8 7 7 6       Memetic  a lg o r ith fo r   s h o r mess a g in g   s ervice  s p a filt er  u s in g   text    ( A r n o ld   A d ima b u a   Oju g o )   13     Selectio n     b est  f it  in d iv id u al s   clo s to   o p tim al  ar e   ch o s en   to   m ate.   T h e   lar g er   th n u m b er   o f   s elec ted ,   th b etter   th ch an ce s   o f   y iel d in g   f itter   in d iv id u als.  T h is   co n tin u es  u n til  o n is   ch o s en ,   f r o m   th last   two /th r ee   r em ain in g   s o lu tio n s ,   to   b ec o m s elec ted   p ar en ts   t o   n ew  o f f s p r in g .   Selectio n   en s u r es  th f ittes t   in d iv id u als  ar ch o s en   f o r   m a tin g   b u also   allo ws  f o r   less   f i in d iv id u als  f r o m   th p o o an d   th f ittes to   b s elec ted .   s elec tio n   th at  o n ly   m ates th f ittes t is elitis t a n d   o f te n   lead s   to   co n v er g in g   a t lo ca l o p tim a.     C r o s s o v er   en s u r es  b est  f it  i n d iv id u al   g en es  a r e x ch an g e d   to   y ield   n ew,   f itter   p o o l.   T h er e   ar e   two   cr o s s o v er   ty p e s   ( d ep en d s   o n   e n co d in g   ty p u s ed ) ( a)   s im p le   cr o s s o v er   f o r   b in ar y   en c o d ed   p o o l.   I allo ws   s in g le -   o r   m u lti - p o i n cr o s s   with   all  g en es  f r o m   p ar en t,  a n d   ( b )   ar ith m etic  cr o s s o v er   allo ws  n ew  p o o to   b cr ea ted   b y   ad d in g   a n   in d iv i d u al’ s   p er ce n ta g to   an o th er .     Mu tatio n   alter s   ch r o m o s o m es   b y   c h an g i n g   its   g e n es  o r   its   s eq u en ce ,   to   en s u r e   n ew  p o o l   co n v e r g es  to   g lo b al  m in im a   ( in s tead   o f   lo c al  o p tim a) .   Alg o r ith m   s to p s   if   o p tim al  is   f o u n d ,   o r   af te r   n u m b er   o f   r u n s   if   n ew  p o o ls   ar e   cr ea ted   ( th o u g h   co m p u tatio n ally   ex p e n s iv e) ,   o r   wh en   n o   b etter   s o lu tio n   is   f o u n d .   Gen es   m ay   ch an g b ased   o n   p r o b a b ilit y   o f   m u tatio n   r ate.   Mu tatio n   im p r o v es  th m u ch - n ee d ed   d iv er s ity   in   r ep r o d u ctio n .   C u ltu r al  GA  is   v ar ian ts   o f   GA  with   b elief   s p ac d ef in a s   th u s ( a)   No r m ativ ( h as  s p e cif i v alu r an g es  to   wh ich   a n   in d iv i d u al   is   b o u n d ) ,   ( b )   Do m ain   ( h as  d ata  ab o u task   d o m ain ) ,   ( c)   T em p o r al  ( h as  d ata  ab o u e v en ts   s p ac e   is   av ailab le) ,   an d   ( d )   Sp atial  ( h as  to p o g r ap h ical  d ata ) .   I n   a d d itio n ,   an   in f lu en ce   f u n ctio n   m ed iates  b etwe en   b elief   s p ac e   a n d   th e   p o o   to   en s u r e   an d   alter   in d iv id u als  in   th p o o l   to   co n f o r m   to   b elief   s p ac e.   C GA  is   ch o s en   to   y ie ld   p o o th at  d o es  n o v io la te  its   b elief   s p ac an d   h elp s   r ed u ce   n u m b er   o f   p o s s ib le  in d iv id u als GA  g en er ates till a n   o p tim u m   is   f o u n d   [4 3 , 4 4 ] .     3. 3 .    M o t iv a t io n /  s t a t e m ent   o f   pro blem   a.   Sp am s   h av co n tin u ed   to   s o a r   with   th ad v e n o f   SMS.  T h alar m in g   g r o wth   r ate  o f   s p a m s   with   SMS   p o p u lar ity   h av n o cr ea te d   p r o p itio u s   en v ir o n   f o r   s p a m m er s   to   ex p l o it  s u b s cr ib er s T h u s ,   ca u s in g   b o th   f in an cial  lo s s   an d   em o t io n al  in s tab ilit y   as  co n s eq u en ce s   to   u s er s ,   co r p o r ate  o r g a n s   an d   m o b ile   n etwo r k   o p er ato r ( s ) .   b.   Aca d em ic  r esear ch es  an d   co m p an ies  ar to d ay ,   f ac ed   with   th ch allen g o f   d ea lin g   with   SMS  s p am .   A   m ajo r   is s u h as  b ee n   th at  ex is tin g   ap p r o ac h es  to   r eso lv in g   SMS  s p am   ar im p o r ted   f r o m   s u cc ess f u em ail  an ti - s p am   s o lu tio n s   ( W an g   et  al. ,   2 0 1 0 ) .   T h u s ,   ar q u ite  u n ab le  to   ef f ec tiv ely   an d   ef f icien tly   tack le  SMS  s p am   s u cc ess f u lly     as  th eir   p e r f o r m an ce   is   s er io u s ly   h am p er ed   an d   d e g r ad e d   b y   t h p a r am etr ic  f ea ts   u s ed   to   f ilter   s p am s .   c.   T h f o r m u latio n   an d   d esig n   o f   an   ef f ec tiv SMS  f ilter   h as  co n tin u ed   t o   s u f f er ed   s etb ac k ( s )   d u to   th e   in h er en t r ea s o n   th at  SMS  f ilte r s   b y   d esig n   ar n o as  s im p le  as  em ail  f ilter s   d u to   its   lim it ed   s ize  o f   1 6 0 - ch ar ac ter s   o f   1 4 0 b y tes  s ize d   d ata.   T h ese  am o n g s o th er   co n s tr ain ts ,   co n tin u to   cr ea te  r ip p led   im p ed im en in   s ize  o f   f ea tu r e   to   b s elec ted   f o r   tr ain in g   an d   co n s eq u en tly   c o n tr ib u tin g   t o   p o o r   lear n in g   an d   class if icatio n   o f   lear n i n g   a lg o r ith m .   d.   Fu r th er m o r e ,   SMS  ar r ip p led   with   s lan g s ,   ab b r ev iatio n s ,   s y m b o ls   an d   em o tico n s   th at   in h ib it  p r o p e r   class if icatio n   o f   wo r d s   o r   te x ts   [4 5 ]     T o   o v e r co m th ese  am o n g s t   m an y   o th er   s h o r tf alls   in h er en in   th a d o p tio n   o f   em ail  f ilter s   as  ad ap ted   to   h an d lin g   SMS  s p a m   s u cc ess f u lly ,   h y b r id   f ilter in g   tech n i q u e   th at   r ed u ce s   n o is in   f o r m   o f   s lan g s ,   em o tico n s ,   ab b r ev iatio n s   in   S MS  as  well  a s   ex p an d   m es s ag s ize  m u s b em p lo y ed   t o   en h an ce   ad e q u ate  class if icatio n .   T h u s ,   o u r   r esear ch   g o al ( s )   is   to   p r o p o s h y b r id   d ee p   lear n in g   n e u r al  n et wo r k   m o d el  f o r   tex t   n o r m aliza tio n   a n d   s em an tic  ex p an s io n   in   SMS sp am   f ilter in g .     T h p r o p o s ed   m o d el  p r o p e r ties   an d   g o al s   will in clu d e:     Per f o r m   r e p etitiv task s   with o u t e m o tio n al  d ef ec ts     E m b o d y   th e   k n o wled g e   o f   h u m an   e x p er ts   with   th h elp   o f   s p ec ial  s o f twar e   to o ls ,   m a n ip u late  d ata  t o   s o lv p r o b le m s   an d   m a k d ec i s io n s   in   th at  d o m ain .     Pro ce s s es a r b etter   f o r m alize d   an d   d ef in ed   o n   m ac h in es.      Kn o wled g eb ase  u p d ate  is   au to m atic     Pro ce s s es a r b etter   f o r m alize d   an d   d ef in ed   o n   m ac h in es.       4.   M E M E T I B AY E S I AN  N E T WO RK   E XP E RI M E N T A L   F RAM E WO RK   SMS  s p am   f ilter s   ca n   h av ca p ac ity   an d   g r a n ted   ca p a b ilit y   to   tr an s cr ib em o tico n s ,   ab b r e v iatio n s   a nd  s lan g s   in to   s tan d ar d   ter m s   as  well  as  ex p an d   m ess ag s ize  to   en h an ce   b etter   f ea tu r ex tr ac tio n   f o r   class if icatio n   alg o r ith m s   an d   ap p r o ac h es.  T h s tu d y   will  a ls o   s er v to   r ed u ce   o r th o g r ap h ic  er r o r   f o u n d   in   SMS,  ch at  g r o u p s   a n d   an o t h er   s o cial  n etwo r k   co m m u n i ca tio n   m ed i u m   t h at  im p e d es  m ac h in e   lear n in g   alg o r ith m .   T h is   is   b ec au s f r o m   th v ar i o u s   ap p r o ac h es  a d o p ted   to   SMS  s p am   f ilter s     th co n te n t - b ased   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 7 7 6   I n t J I n f   &   C o m m u n   T ec h n o l Vo l.  9 ,   No .   1,   Ap r il   20 20 9     1 8   14   m o d els  with   tex p r e - p r o ce s s in g   h as  s h o wn   to   p er f o r m   b etter .   Ma ch in tr an s latio n   ( MT )   p er f o r m s   b etter   wh en   ap p lied   to   n o r m alize d   tex m ess ag es   [ 4 6 ] .   I ca n   co m b in ed   m u ltip le  ap p r o ac h es  in   n o is y   d ata,   tex t   n o r m aliza tio n   to   cr ea te  a   b et ter   o u t p u t.  B u t,   ex tr ac tin g   o n ly   r ele v an f ea ts   an d /o r   p ar am eter   to   tr ain   th class if ier   h as b ee n   r ep o r ted   to   co n tr ib u te  to   th ef f icien c y   o f   SMS  s p am   f ilter s   [4 7 - 50 ] .   T h u s ,   we  p r o p o s tex p r ep r o ce s s in g   SMS  s p am   f ilt er   m o d el  with   th ca p a b ilit y   o f   n o r m alizin g ,   ex p an d in g   t ex m ess ag es  an d   ex tr ac tin g   s u itab le  f ea tu r es  as  d ataset  in p u p ar a m eter s   f o r   tr ain in g   th a d o p ted   class if icati o n   alg o r ith m   an d   m o d el.   Stu d y   u s es KD D - C UP  9 9   d ataset.             F ig u re   1 .   P ro p o se d   g e n e ti c   a l g o rit h m   train e d   b a y e sia n   n e two rk       T h m o d el  is   r e p r esen ted   in   Fi g u r 1   ex p lain e d   as th u s :   a.   R aw  tex t r ep r esen ts   th o r ig in al  tex t f r o m   t h s en d er   f o r   n o r m aliza tio n   an d   e x p an s io n .   b.   T ex n o r m aliza tio n   em p lo y s   two   d ictio n ar ies:   ( a)   f ir s t,  an   E n g lis h   d ictio n a r y   t o   c h ec k   i f   t ex ar e   E n g lis h   s o   as  to   th en   n o r m alize   tex to   its   r o o f o r m ,   a n d   ( b )   s ec o n d ,   is   s lan g   d ictio n ar y   to   tr an s l ate  s lan g s   in to   E n g lis h   te x t.   T h e   b asic  o p er atio n   o f   th is   s tag e   is   to   r ep lace   s l an g s   an d   ab b r ev iatio n   with   s ta n d ar d   E n g lis h   wo r d s   f r o m   th ese  d ictio n ar ies .   T h Fre elin g   E n g lis h   d ictio n a r y   an d   No   s lan g   d ictio n ar y   a r e   p r o p o s ed .   c.   C o n ce p ts   g en er atio n   ar s em an tically   an aly ze d   alr ea d y   n o r m alize d   tex to   d ed u ce   th eir   co n ce p t.  T h e   co n ce p ts   ar p r o v id e d   b y   L an g u ag Data   B ase  B ab elNe t r ep o s ito r y .   d.   W o r d   s en s d is am b ig u atio n   ( W SD) Her e,   f r o m   a   v ar iety   o f   co n ce p g en e r ated ,   t h is   s tag is   u s ed   to   f i n d   th co n ce p th at   is   m o r r ele v an ac co r d in g   to   th c o n tex t   o f   th e   o r ig i n al  m ess ag e,   a m o n g   all  g en er ated   co n ce p ts   r elate d   to   ce r tain   wo r d .   I e q u ally   r elies  o n   co n ce p ts   ar p r o v id e d   b y   L an g u ag Data   B ase   ( L DB )   B ab elNe t r ep o s ito r y   e.   T o k en is atio n   u n it:  T o k en izati o n   is   t h p r o ce s s   o f   b r ea k in g   d o wn   a   tex t   co r p u s   in t o   in d iv id u al  elem en ts   th at  s er v as  in p u f o r   v ar io u s   n atu r al  lan g u ag p r o ce s s in g   alg o r ith m s .   No r m alis ed   tex ts   ar b r o k e n   in to   in d iv id u al  wo r d s   an d   s to p   wo r d s   an d   p u n ctu atio n   ch ar ac ter s   ar e   eq u ally   r em o v e d   in   th is   u n it.   f.   Me r g in g   R u le:  I em p lo y s   p a r am eter s   th at  d ef in th co m b in atio n   o f   r esu lt  o f   p r e - p r o c ess in g   ( o r ig in al  tex t,  n o r m aliza tio n   an d   d is a m b ig u atio n   s tag e) .   Me r g in g   r u le  an s wer s   th q u esti o n   f r o m   ea ch   s tag as  f o llo ws:   ( a)   s h o u ld   it   k ee p   th o r ig in al  to k en ( s ) ?,   ( b )   s h o u ld   t ex n o r m aliza tio n   b p e r f o r m e d ?,   ( c)   s h o u ld   it p er f o r m   co n ce p ts   g en er atio n ?,   an d   ( d )   s h o u ld   it p e r f o r m   th wo r d   s en s d is am b ig u ati o n ?   g.   No r m alize d   a n d   E x p a n d ed   tex is   co m b in atio n   o f   te x o b tain ed   f r o m   v ar i o u s   o u tp u t   o f   p r ef er r ed   s tag es   o f   th p r e - p r o ce s s in g   m o d el.     4 .1 .   F e a t ure  s elec t io n t ra ini ng   a nd   ra t io na le  f o cho ice  o f   m o del   Nee d   to   m in im ize  th n u m b e r   o f   f ea tu r es  as  in p u p ar am ete r s   f o r   class if icatio n     s in ce ,   a n   in cr ea s in   th n u m b er   o f   f ea tu r es  u s ed   will  ad d   to   th co m p u tati o n al  co m p lex ity   o f   th s y s tem .   T h u s ,   th C GA   alg o r ith m   is   u s ed   in   s elec tio n   o f   f ea tu r es  o b tain ed   f r o m   t h tex p r e - p r o ce s s in g   s ec tio n .   T h e   in p u is   th d ataset  ( to k en s   o b tain ed   v ia  t o k en izatio n   o f   n o r m alize d   an d   ex p an d ed   tex f r o m   tex p r e - p r o ce s s in g   s ec tio n ) .   T h m o d el  is   m a d u p   o f   th e   f o llo win g   s ec tio n s :   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J I n f   &   C o m m u n   T ec h n o l   I SS N:  2252 - 8 7 7 6       Memetic  a lg o r ith fo r   s h o r mess a g in g   s ervice  s p a filt er  u s in g   text    ( A r n o ld   A d ima b u a   Oju g o )   15     GA  Un it    y ield s   r u le - b as ed ,   g e n etic  r ep r esen tatio n   o f   n o r m alize d   a n d   ex p a n d ed   test   d ef in ed .   T h e   alg o r ith m   th en   in itializes  m o d el  with   r an d o m   p o p u latio n   th at  is   cr ea ted   an d   s u b jec t ed   to   r ep etitiv e   ap p licatio n   o f   r ec o m b in atio n ,   m u tatio n ,   i n v er s io n   an d   s elec tio n   o p e r ato r s   to   im p r o v th g en er ate d   p o p u latio n   f r o m   th o r ig in al  d ataset.     E v alu atio n   Un it  co n tain s   f itn ess   f u n ctio n   th at  m ea s u r es  th q u ality   o f   r ep r esen ted   s o lu ti o n .   I co m p u tes  o p tim ality   o f   a   s o lu tio n   b y   co m p ar in g   th e   ch r o m o s o m es   ag ain s all  o th er   ch r o m o s o m u s in g   s o m e   p r ed ef in e d   f u n ctio n .     T r ain in g   Un it:  T r ain s   th f ilter   b ased   o n   B ay es  Pro b ab ilit y   T h eo r em .   I t u s es  k n o wn   SMS  co r p u s   o f   s p am   an d   g en u in m ess ag es/t ex ts .   co llectio n   o f   to k en s   ap p ea r in g   in   ea ch   co r p u s   an d   th eir   to tal  o cc u r r en ce s   ( s co r es)  ar m ain tain e d   in   th d atab ase    s o   th at  b ased   o n   th eir   o cc u r r en ce s ,   ea c h   s et  o f   s p am   an d   g en u in e   d ata   is   ass ig n ed   a   cr it er io n   o r   p r o b ab ilit y   s co r f o r   i ts   ca p ac ity   o f   d eter m in in g   a   te x o r   m ess ag to   eith er   b s p a m   o r   g en u i n e   tex t.     4. 2 .   Cla s s if ica t io s ec t io n   B ased   o n   th e   f r e q u en c y   p r o b a b ilit y   o f   o cc u r r en ce   o f   ea ch   w o r d   ( to k e n s )   as  s p am   o r   leg iti m ate,   ea ch   in co m in g   u n s ee n   n o r m alize d   m ess ag d ata  is   p r o c ess ed   an d   class if ied   as  eith er   leg itima te  o r   s p am   b y   th e   B ay esian   clas s if ier .   I n   th ev en o f   m is class if icatio n ,   u s er s   ca n   r ec tify   th is   class if icati o n   b y   r ea d in g   th e   m ess ag an d   r e - ad d in g   th e   m ess ag to   in b o x .   T h is   will  au to m atica lly   co r r ec t   an d   u p d ate  th e   d atab ase  f o r   f u tu r class if icatio n .   T h u s ,   m a k in g   B ay esian   f ilter s   q u ite  ad a p tiv e.     4. 3 .   O utput   s ec t io n   R esu lt o f   th class if icatio n   o f   th f ilter   in to   Sp am   o r   Ham ,   is   th ex p ec ted   o u tp u t o f   th is   u n i t.     4. 3 .   E x perim ent a m o del o p er a t io ns   Oju g o   [ 4 2 ]   d escr ib ed   a   g e n etic  alg o r ith m   tr ai n ed   n eu r al   n etwo r k   em p lo y ed   in   ea r ly   d iab etes  d etec tio n .   GANN   is   in itializ ed   with   ( n - r ! )   in d iv id u al  if - t h en ,   f u zz y   r u les  ( i.e .   6 - 4 ! ) .   I n d iv id u al  f itn ess   is   co m p u ted   as  3 0 - in d iv id u als  a r s elec ted   v ia   th e   to u r n am en t   m eth o d   to   d e ter m in e   n ew   p o o an d   s elec tio n   f o r   m atin g .   C r o s s o v er   a n d   m u tatio n   ar e   a p p lied   t o   h elp   n et  le ar n   th d y n am ic,   n o n - lin ea r   u n d er ly i n g   f ea ts   o f   in ter est  v ia  m u ltip o in cr o s s o v er   to   y ield   n ew  p ar en ts .   T h e   n ew  p ar en ts   co n tr ib u te  to   y ie ld   n ew  in d iv id u als.   Mu tatio n   is   r ea p p lied   an d   in d iv id u als  ar allo tted   n ew  r an d o m   v alu es  th at  s t ill  co n f o r m   t o   th b elief   s p ac e.   T h m u tatio n   ap p lied   d e p en d s   o n   h o f ar   C GA  is   p r o g r ess ed   o n   th n et  an d   h o f it  th e   f ittes in d iv id u al  in   th p o o ( i.e .   f itn ess   o f   t h f itt est  in d iv id u al  d iv i d ed   b y   2 ) .   New   in d iv id u als  r ep lace   o ld   with   lo f itn ess   s o   as   t o   cr ea te  n ew  p o o l.  Pro ce s s   co n tin u es  u n til  in d iv id u al  wit h   f itn ess   o f   0   ( i.e .   s o lu tio n )   is   f o u n d .   R u le - b ased   en co d ed   s p am   as sh o wn   in   T a b le  1 .   Gen er atio n   o f   p o p u latio n   f r o m   p ar e n ts   as sh o wn   in   T a b le  2 .       T ab le  1 .   R u le - b ased   e n co d e d   s co r e   C o d e   R u l e   I n p u t   P a r a me t e r s   G e n u i n e   S p a m   P 0 1   M e ss a g e   S i z e   0 . 5 0   0 . 5 0   P 0 2   M e ss a g e   C h a r a c t e r   0 . 5 0   0 . 5 0   P 0 3   M e ss a g e   F r o m   0 . 5 0   0 . 5 0   P 0 4   M e ss a g e   T o   0 . 5 0   0 . 5 0   P 0 5   S u b j e c t   0 . 3 0   0 . 7 0   P 0 6   B o d y   o f   M e ssa g e   0 . 2 5   0 . 7 5       T ab le  2 .   1 st   a n d   2 nd   g en e r atio n   o f   p o p u latio n   f r o m   p ar e n ts   S / N   S e l e c t i o n   C h r o mo so m e s (B i n a r y   0   o r   1 )   F i t n e ss  F u n c t i o n   P a r e n t   1 st   G e n   C r o ss o v e r   P a r e n t   2 n d   G e n   1   50   1 1 0 0 1 0   1   a n d   6   1 1 0 0 01   49   2   50   1 1 0 0 1 0   2   a n d   5   1 1 0 0 10   50   3   50   1 1 0 0 1 0   3   a n d   6   1 1 0 0 01   49   4   50   1 1 0 0 1 0   4   a n d   5   1 1 0 0 10   50   5   30   0 1 1 1 1 0   5   a n d   6   0 1 1 1 01   29   6   25   0 1 1 0 0 1   6   a n d   5   0 1 1 0 10   26       I n itializatio n / s elec tio n   v ia  AN en s u r es  th at  f ir s 3 - b elief s   a r m et;  m u tatio n   en s u r es  f o u r t h   b elief   is   m et.   I ts   in f lu e n ce   f u n ctio n   in f lu en ce s   h o w   m an y   m u tatio n s   tak p lace ,   an d   th k n o wled g o f   s o lu tio n   ( h o w   clo s its   s o lu tio n   is )   h as   d ir ec im p ac o n   h o alg o r ith m   is   p r o ce s s ed .   Alg o r ith m   s to p s   wh en   b est  in d iv id u al  h as  f itn ess   o f   0 .3 .   Mo d el   s to p s   if   s to p   cr iter i o n   is   m et.   GANN   u tili ze s   n u m b er   o f   e p o ch s   to   d eter m in e     s to p   cr iter io n .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 7 7 6   I n t J I n f   &   C o m m u n   T ec h n o l Vo l.  9 ,   No .   1,   Ap r il   20 20 9     1 8   16   5.   F I NDING S AN DI SCUS SI O N   W ith   N aïv B ay es  an d   GA  ( a s   s tan d alo n m o d el)   to   b en ch m ar k   th in tellig e n s y s tem   an d   a s ce r tain   h o well  o u r   h y b r id   GABN  alg o r ith m   p er f o r m ed ,   we  o b tai n   th r esu lts   in   Fig u r e   2   a n d   F ig u r e   3   r esp ec tiv ely   as  s ee n   b elo w th h y b r id   g a b n   ( m em etic)   al g o r ith m   o u tp er f o r m s   s tan d al o n e   n aïv e   b ay es  an d   GA   m o d el Ho wev er ,   f o r   th e   m ea n   p r o ce s s in g   tim r eq u ir e d   to   c o n v e r g   it  is   f o u n d   th at   GABN  p er f o r m e d   least.  T h is   ca n   b attr ib u ted   to   th f ac t th at:  ( a)   th h y b r id   m o d el  n ee d s   to   f ir s t u s GA  as p r e - p r o ce s s o r   to   tr ain   B ay esian   n etwo r k ,   ( b )   f o r   s u c h   h y b r i d s ,   th er ar alwa y s   s tr u ctu r al  d ep en d e n cies  with   th u n d er ly in g   h eu r is tics   em p lo y ed /m e r g ed   an d   co n f lic ts   in   d ata  e n co d i n g   th at  is   r e q u ir ed .   T h ese  m u s b e   r eso lv ed   in   o r d er   f o r   th e   m o d el  to   p er f o r m   ap p r o p r iately .             Fig u r 2 .   Mo d el/ h eu r is tic  ac cu r ac y   in   p e r ce n tag e       Fig u r 3 .   Mo d el/Heu r is tic  co n v er g en ce   tim i n   s ec o n d s       5 . 1 .     M o del Ev a lua t io n   I n   th is   s tu d y ,   ac cu r ac y ,   r e ca ll,  er r o r   r ate  ( E R )   an d   s p ec if icity   ar u s ed   to   e v alu ate  t h p er f o r m an ce   o f   th d etec tio n   m o d els.  T h f o r m u las o f   th a b o v c r iter ia  ar e   ca lcu lated   as f o llo ws:     =    +   +  +  +      (1 )      =     +    (2 )          =    +   +    +  +        (3 )      =     +        (4 )     tr u p o s itiv ( T P)   is   ca s ( r u le)   th at  co r r ec tly   d is t in g u is h es  s p am   f r o m   h am tr u n eg ativ e   ( T N)   s h o ws  n o r m al  tex d ata  class if ied   co r r ec tly   as  n o r m al.   f alse  n eg ativ ( FN)   is   a   ca s in   wh ich   tex is   class if ied   as  n o r m al  d ata,   an d   f alse  p o s itiv ( FP )   is   ca s in   wh ich   n o r m al   tex is   cl ass if ied   as  a   s p am .   T h ac cu r ac y   r ate  is   th e   o v e r all  co r r ec d etec tio n   ac cu r ac y   o f   th d ataset.   E R   r ef er s   to   t h r o b u s tn ess   o f   th e   class if ier ,   R ec all  i s   d eg r ee   o f   co r r ec tly   d etec ted   attac k   ty p es  o f   all  ca s es  class if ied   as  attac k s ;   wh ile,   s p ec if icity   is   th p er ce n tag o f   co r r ec tly   class if ied   d ata.   I n   th ab o v e,   h ig h er   ac cu r ac y   an d   r ec all  an d   lo wer   E R   in d icate   g o o d   p er f o r m an ce .   T o   f u r t h er   m ea s u r e f f ec tiv e n ess   an d   ac cu r ac y ,   we  m ea s u r th eir   r ate  o f   m is class if icatio n   an d   co r r esp o n d in g   im p r o v em e n p er ce n tag es  in   b o th   tr ain in g   an d   test   d ata  s ets  as  s u m m ar ize d   in   T ab les  3   an d   4   r esp ec tiv ely .   E q u atio n s   f o r   m i s class if icatio n   r ate  an d   its   im p r o v em en p e r ce n tag o f   u n s u p er v is ed   ( B )   m o d el  ag ain s t su p er v is ed   ( A)   m o d el  r esp ec tiv ely ,   is   ca lcu lated   as f o llo ws:   T ab les  3   an d   4   r esp ec tiv ely   s h o ws  m is class if icatio n   er r o r   r ate  with   Naïv B ay es,  GA  an d   GABN  at  2 3 . 2 %,  4 . 7 an d   1 . 0 2 ( i.e .   er r o r   r ate  in   f alse - p o s itiv an d   tr u e - n e g ativ e)   r esp ec tiv ely C o n s eq u en tly ,   th ey   all  p r o m is an   im p r o v em e n t r a te  as o f   3 . 6 %,  4 . 0 2 % a n d   0 . 1 2 %   r esp ec tiv ely .           =    .                .             (5 )     T ab le  3 .   Misclass if icatio n   R at o f   E ac h   m o d el   M o d e l   C l a s si f i c a t i o n   Er r o r s   Tr a i n i n g   D a t a   Te st i n g   D a t a   N a ï v e   B a y e s   5 2 . 5 %   2 3 . 2 %   G e n e t i c   A l g o r i t h m   4 8 . 4 %   4 . 7 %   G A B N   1 9 . 6 %   1 . 0 2 %   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J I n f   &   C o m m u n   T ec h n o l   I SS N:  2252 - 8 7 7 6       Memetic  a lg o r ith fo r   s h o r mess a g in g   s ervice  s p a filt er  u s in g   text    ( A r n o ld   A d ima b u a   Oju g o )   17   Als o ,   its   im p r o v em en t p e r ce n t ag is   co m p u ted   as th u s :             =    ( )  ( )  ( )     10 0     (6 )       T ab le  4 .   I m p r o v em en t Per ce n tag e   M o d e l   I mp r o v e m e n t   %   Tr a i n i n g   D a t a   Te st i n g   D a t a   N a ï v e   B a y e s   2 . 1 1 %   3 . 6 %   G e n e t i c   A l g o r i t h m   2 . 3 2 %   4 . 0 2 %   G A B N   0 . 0 9 %   0 . 1 2 %       3.   CO NCLU SI O N   Fro m   th c o n s eq u e n ce s   o f   s p am   to   u s er s ,   s ev er al  co n ce r ted   ef f o r ts   to   d etec s p am   in tr u s io n   in   v ar io u s   co m m u n icatio n   m e d ia   h as  p aid   o f f   esp ec ially   in   c o m b atin g   em ail  s p am .   Sp am   F ilter s   wo r k   b y   f ir s r ec eiv in g   p ar ( o r   all)   o f   t h m ess ag an d   th en   an aly zin g   it  in   s o m way   to   d ec id wh e th er   it  is   h am   ( i.e .   leg itima te  m ess ag e)   o r   s p am .   T h e   p er f o r m a n ce   o f   s p am   f ilter   ca n   b m ea s u r ed   b y   th n u m b er   o f   f alse - p o s itiv es  ( in co r r ec tly   m ar k ed   as  s p am )   an d   f alse - n eg ativ e s   ( u n id en tifie d   s p am )   t h at  it  g en er ates.  An   id ea l   s p am   f ilter   will  co r r ec tly   class if y   all  SMS  wi th   alm o s ze r o   er r o r   r ates  o f   f als p o s itiv e/n eg ativ   th r o u g h   tr ad eo f f s   b etwe en   th n u m b er   o f   f alse p o s itiv es a n d   f alse n eg ativ es.       RE F E R E NC E S     [1 ]   Oju g o ,   A.   a n d   Eb o k a ,   A.   O. ,   " Co m p a ra ti v e   e v a l u a ti o n   fo r   h i g h   in telli g e n p e rfo rm a n c e   a d a p ti v e   m o d e fo r   sp a m   p h ish in g   d e tec ti o n , "   Dig i ta l   T e c h n o l o g ies v o l .   3 ,   n o .   1 ,   p p .   9 - 15 2 0 1 8 .   [2 ]   Oju g o ,   A.A.,   Eb o k a ,   A.O. ,   " S i g n a tu re - b a se d   m a lwa re   d e tec ti o n   u sin g   a p p ro x ima te  Bo y e M o o re   s tri n g   m a tch in g   a lg o rit h m , "   I n t.   J .   o f   M a th e ma t ica S c ien c e s a n d   Co mp u ti n g v o l.   3 ,   n o .   5 ,   pp 49 - 62 2 0 1 9 .   [3 ]   Tex Re q u e st.  T h e   Co m p l e te  Ov e rv iew   o Bu sin e ss   Tex ti n g .   2 0 1 6 .   [we b ]:  a v a il a b le  a t   h tt p s:/ /www . tex treq u e st.co m /b l o g /t e x ti n g - sta ti stics - a n sw e r - q u e stio n s/   [4 ]   Ch a m in d a ,   T. ,   Da y a ra tn e ,   T.   T. ,   Am a ra sin g h e ,   H.  K.  N.,   Ja y a k o d y ,   J.  M .   R.   S . ,   " Co n ten t - b a se d   h y b rid   S M S   sp a m   fil terin g   sy ste m ,"   Pr o c e e d in g o IT RU  Res e a rc h   S y mp o siu m ,   Un i v e rsity   o M o ra t u wa ,   p p .   3 1 35 2 0 1 3 .   [5 ]   G o m e z   Hild a g o ,   J.  M . ,   B u e n a g a   Ro d g u e z ,   M   a n d   Co r ti z o   P e re z ,   J.  C. ,   " T h e   ro le  o w o rd   se n se   d isa m b ig u a ti o n   i n   a u to m a ted   tex t   c a teg o riza ti o n ,"   In   Pro c .   o t h e   1 0 th   N L DB p p .   2 9 8 3 0 9 ,   2 0 0 5 .   [6 ]   S h a h i,   T.   B . ,   Ya d a v   A. ,   " M o b il e   S M S   S p a m   F il terin g   fo r   Ne p a li   Tex u si n g   Na ïv e   Ba y e sia n   a n d   S u p p o rt   Ve c to r   M a c h in e ,"   I n t.   J .   o In tell ig e n c e   S c ien c e ,   Co mp u ter   S c ien c e   a n d   C o mm u n ica ti o n s v o l.   4 ,   n o . 1 ,   p p .   24 - 28 2 0 1 4 .   [7 ]   M u ry n e t,   S . ,   P i q u e ra Jo v e r,   R. ,   " Ho a n   S M S - Ba se d   m a lwa re   in f e c ti o n   wil g e t h ro tt led   b y   th e   wi re les li n k ," I n   Pro c e e d in g s   o f   IEE E   ICC  2 0 1 2   -   Co mm u n ica ti o n   a n d   In fo rm a t io n   S y ste ms   S e c u rity  S y mp o siu m   ( ICC’1 2   CIS S ) Ottaw a ,   Ca n a d a ,   2 0 1 2 .   [8 ]   M u ry n e t,   S . ,   P iq u e ra Jo v e r,   R. ,   " An a ly sis  o f   S M S   S p a m   in   M o b il i ty   Ne two r k s.  In ter n a ti o n a J o u rn a o A d v a n c e d   Co mp u ter   S c ien c e v o l.   1 ,   n o .   1   p p .   1 - 8 2 0 1 1 .   [9 ]   Ag wu .   C. O. ,   " T h e   C o n se q u e n c e o f   M o b il e   S p a m   in   Nig e ria   E m e rg in g   a n d   E v o l v i n g   M o b il e   Co m m u n ica ti o n   S e c to o th e   Eco n o m y ,"   I n ter n a ti o n a J o u rn a o A d v a n c e d   Res e a rc h   in   Co mp u ter   S c ien c e   a n d   S o f twa r e   En g i n e e rin g ,   v o l.   5 ,   n o . 5 ,   p p .   1 1 7 - 1 2 4 2 0 1 5 .   [1 0 ]   M o b i le E c o sy ste m   F o ru m ,   " 2 8 %   M o b i le Co n su m e rs Rec e iv e   S M S   S p a m   Ev e ry   Da y , "   2 0 1 7 .     [1 1 ]   Ne e lma y   De sa a n d   M e e ra   Na r v e k a r ,   " No rm a li z a ti o n   o No isy   T e x Da ta ,"   Pro c e d ia   Co m p u ter   S c ien c e ,   v o l.   4 5 ,     pp.   1 2 7 - 132 2 0 1 5 .     [1 2 ]   Jia n g ,   N.,   Jin ,   Y.,   S k u d lark ,   A. ,   Zh a n g ,   Z. ,   " Un d e rsta n d i n g   S M S   sp a m   in   larg e   Ce ll u lar   Ne two rk :   Ch a ra c teristics ,   S trate g ies   a n d   De fe n se s,  I n telli g e n S y ste m s, "   IEE E   v o l.   27 ,   n o .   6 ,   p p .   15 - 26 2 0 1 1 .   [1 3 ]   Zab lo ts k a y a ,   N.  F ra u d u len t   sp a m .   S e c u re li st,  2 0 0 8 .   [1 4 ]   He d ieh   S a jed i ,   G o laz in   Zarg h a m P a ra st,  F a tem e h   Ak b a ri ,   " S M S   S p a m   F il teri n g   Us in g   M a c h in e   Lea rn i n g   Tec h n iq u e s: A  S u rv e y ,"   M a c h in e   L e a rn in g   Res e a rc h v o l.   1 ,   n o .   1 ,   p p .   1 - 14 2 0 1 6 .     [1 5 ]   Wan g ,   C. ,   Z h a n g ,   Y.,   Ch e n ,   X.,   Li u ,   Z. ,   S h i,   L . ,   Ch e n ,   G . ,   " Be h a v io r - b a se d   S M S   An t i - S p a m   S y ste m ,"   IBM   J o u rn a o Res e a rc h   a n d   De v e lo p me n t ,   NJ ,   USA,   v o l .   54 ,   n o .   6 ,   p p .   6 5 1 - 6 6 6 ,   2 0 1 0 .   [1 6 ]   Ti a g o ,   A . A.,   Ti a g o ,   P . S . ,   Ig o r,   S . ,   Jo se ,   M   a n d   G o m e z   Hild a g o ,   J. M . ,   " Tex n o rm a li z a ti o n   a n d   se m a n ti c   in d e x in g   t o   e n h a n c e   In sta n t   M e ss a g in g   a n d   S M S   sp a m   fil teri n g , "   K n o wled g e - B a se d   S y ste ms v o l.   1 0 8 ,   n o .   15 ,   p p .   25 - 32 2 0 1 6 .   [1 7 ]   AiTi   A.W . ,   Z h a n g ,   M . ,   Xia o ,   J.,   S u ,   J. ,   " p h ra se - b a se d   sta t isti c a m o d e fo S M S   tex n o r m a li z a ti o n ,"   In   Pro c e e d in g o t h e   COLING/A CL   o n   M a in   c o n fer e n c e   p o ste r se ss io n s p p .   33 4 0 ,   2 0 0 6 .   [1 8 ]   Nu ru z z a m a n ,   T.   M . ,   Lee ,   C . ,   A b d u ll a h ,   M . F . A.,   C h o i ,   D. ,   " S im p le  S M S   sp a m   fil teri n g   o n   i n d e p e n d e n m o b il e   p h o n e ,"   J o u r n a o f   S e c u rity a n d   Co mm u n ica ti o n   Ne two rk s ,   v o l .   5 ,   n o . 10 ,   p p   1 2 0 9 1 2 2 0 2 0 1 2 .   [1 9 ]   Na ra y a n ,   A.,   S a x e n a ,   P . ,   " Th e   c u r se   o 1 4 0   c h a ra c ters Ev a lu a ti n g   t h e   e ffica c y   o S M S   sp a m   d e tec ti o n   o n   a n d ro id ,"   In   Pro c e e d in g o f   th e   1 3 t h   AC M   W o rk sh o p   o n   S e c u rity  a n d   Priv a c y   in   S m a rtp h o n e a n d   M o b il e   De v ice (S PS M   ’1 3 ) ,   Be rli n ,   G e rm a n y ,   p p . 3 3 42 2 0 1 2 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 7 7 6   I n t J I n f   &   C o m m u n   T ec h n o l Vo l.  9 ,   No .   1,   Ap r il   20 20 9     1 8   18   [2 0 ]   An d ro u li d a k is  I. ,   Vla c h o V.,   P a p a n ik o lao u ,   A.  F IM ES S fil terin g   m o b i le  e x tern a S M S   sp a m .   I n   P ro c e e d in g o f   th e   6 t h   Ba lk a n   Co n fe re n c e   in   I n fo rm a ti c s,  ACM,   Ne w Yo rk ,   USA ,   p p .   2 2 1 - 227 2 0 1 3 .   [2 1 ]   Ha sib ,   S . ,   M o twa n i ,   M . ,   S a x e n a ,   A. ,   " A n ti - S p a m   M e th o d o lo g ies Co m p a ra ti v e   S t u d y .   I n t.   J .   Co mp u ter   S c i .   In fo rm a t io n   T e c h n o l o g ies v o l.   3 ,   n o .   6 ,   p p .   5 3 4 1 - 5 3 4 5 2 0 1 2 .   [2 2 ]   Tri g g s R . ,   " Wh a is S M S   a n d   h o w d o e s it   w o rk ,"   2 0 1 3 .   [2 3 ]   P ra c h i,   G . J.,   P a teriy a ,   J.R. K. ,   " S u r v e y   o n   Ema il   S p a m   Ty p e a n d   S p a m   F i lt e rin g   Tec h n iq u e s ,"   In ter n a ti o n a l   J o u rn a o E n g i n e e rin g   Res e a rc h   &   T e c h n o l o g y   (IJ ER T ) 2 0 1 4 .   [2 4 ]   De lan y   S . J.  Us i n g   Ca se - Ba se d   Re a so n in g   f o S p a m   F i lt e rin g .   P u b l ish e d   P h T h e sis  su b m it te d   t o   th e   D u b l i In stit u te  o Tec h n o l o g y   i n   f u lfi l lme n o t h e   re q u irem e n ts  fo t h e   d e g re e   o f   Do c to o P h il o so p h y   S c h o o l   o f   Co m p u ti n g ,   Du b li n   In stit u te  o f   Tec h n o l o g y .   [we b ]:  a v a il a b le  a t   h tt p s:/ /p d fs.se m a n ti c sc h o lar.o r g /c 9 3 4 /9 d fe 8 0 c 7 6 2 2 4 9 b d b 0 3 0 1 8 5 c 4 8 1 6 5 3 c f b 2 b a 6 . p d f   [2 5 ]   Co rm a c k ,   G .   V.,   G o m e z   Hid a lg o ,   J.  M . ,   P u e rtas   S a n z ,   E. ,   " S p a m   F i lt e rin g   fo r   S h o rt   M e ss a g e s ,"   i n   Pr o c .   o t h e   1 6 t h   ACM   CIKM ,   p p .   3 1 3 3 2 0 ,   2 0 0 7 .   [2 6 ]   Xu ,   Q.,   E v a n ,   W.   X. ,   Qia n g ,   Y.,   Jia c h u n ,   D.,   Jie p in g , Z. ,   " S M S   S p a m   De tec ti o n   Us in g   No n - Co n te n F e a tu re s ,"   in   IEE In t e ll ig e n S y ste ms v o l.   27 ,   n o .   6 ,   p p .   44 - 51 2 0 1 2 .   [2 7 ]   Uy sa l,   A.  K.,   G u n a l,   S . ,   Erg in ,   S . ,   &   S o ra   G u n a l,   E. ,   " Th e   imp a c o fe a tu re   e x trac ti o n   a n d   se lec ti o n   o n   S M S   sp a m   fil terin g ,"   J o u rn a E lek tro n ika   IR  El e k tro tec h n ika v o l.   19 ,   n o .   5 ,   p p .   67 72 2 0 1 3 .     [2 8 ]   S a tt e rfield ,   B.   1 0   sp a m   fil teri n g   m e th o d s.  [we b ]   a v a il a b le at  h tt p : // ww w.t e c h so u p c a n a d a . c a /en /l e a rn in g _ c e n ter/1 0 _ sfm _ e x p lai n e d   [2 9 ]   Co o k ,   D. ,   " Ca tch i n g   S p a m   b e fo r e   it   a rriv e s:  Do m a in   S p e c ifi c   Dy n a m ic  Blac k li sts,  Au stra li a n   C o mp u ter   S o c iety ACM,   2 0 0 6 .   [3 0 ]   Ha n ,   B. ,   Co o k ,   P . ,   Ba l d win ,   T .   Lex ica No rm a li sa ti o n   o S h o rt  Tex M e ss a g e s.  ACM  Tran sa c ti o n   o n   I n telli g e n t   S y ste m s a n d   Tec h n o l o g y ,   2 0 1 1 .   Article     [3 1 ]   P e rlro th ,   N.  S p a m   In v a d e la st  Re fu g e ,   th e   Ce ll p h o n e .   Ne Yo rk   Ti m e s,  2 0 1 2 .   [we b ]:   a v a il a b le  a h tt p : // p re v iew . ti n y u rl . c o m /7 n wv m 3 g   [3 2 ]   Hu a n g ,   D.,   G a n ,   Z. ,   C h o w,   T. W . S . ,   " En h a n c e d   fe a tu re   se lec ti o n   m o d e ls  u si n g   g ra d ien t - b a se d   a n d   p o in t   i n jec ti o n   tec h n iq u e s,"   Ne u r o c o mp u ti n g ,   v o l.   7 1 ,   p p .   3 1 1 4 3 1 2 3 ,   2 0 0 8 .   [3 3 ]   G h e y a I. A.,   S m it h ,   L . S . ,   " F e a tu r e   su b se se lec ti o n   i n   larg e   d ime n sio n a l it y   d o m a in s, "   Pa tt e rn   Rec o g n it io n ,   v o l.   4 3 ,   p p .   5 1 3 ,   2 0 1 0 .   [3 4 ]   Va fa ie,  H.,   De - Jo n g ,   K.  G e n e ti c   Alg o rit h m   a a   To o fo F e a tu r e   S e lec ti o n   in   M a c h in e   Lea rn i n g ,   1 9 9 7 .   [we b re se a rc h g a te.n e t/ p u b li c a ti o n /2 7 2 2 3 5 3 _ G e n e ti c _ Alg o ri th m s_ a s_ T o o l_ fo r _ F e a tu re _ S e lec ti o n _ in _ M a c h in e _ Lea rn in g   [3 5 ]   S u n g - S a m ,   H.,   Wa n h e e ,   L. ,   M y u n g - M o o k ,   H.,   " Th e   F e a tu re   S e l e c ti o n   M e th o d   b a se d   o n   G e n e ti c   Alg o rit h m   fo r   Eff icie n o Te x Cl u ste rin g   a n d   Tex Clas sifica ti o n , "   In t.   J o u rn a l   o n   A d v a n c e   S o ft   C o mp u ti n g   A p p li c a ti o n v o l .   7 n o .   1 ,   p p .   23 - 40 2 0 1 5 .   [3 6 ]   Ca th e rin e ,   K. ,   F ra n ç o is,   Y.,   G é ra l d in e ,   D. ,   " N o rm a li z in g   S M S :   a re   two   m e tap h o rs  b e tt e th a n   o n e ,"   i n   Pr o c e e d in g s   o 2 2 n d   I n ter n a t io n a l   Co n fer e n c e   o n   C o mp u ta ti o n a l   L i n g u isti c s ,   p p   4 4 1 4 4 8 ,   2 0 0 8 .     [3 7 ]   Oju g o ,   A . a n d   Eb o k a ,   A.O. ,   " M o d e li n g   t h e   c o m p u tati o n a l   so l u ti o n   fo r   m a rk e b a sk e a ss o c iat iv e   r u le  m i n in g   a p p ro a c h e s u si n g   n e u ra n e two r k , "   Dig it a T e c h n o lo g ies v o l.   3 ,   n o .   1 ,   p p .   1 - 8 2 0 1 8 .   [3 8 ]   Oju g o ,   A.A. ,   E b o k a ,   A.O. ,   " I n v e n to ry   m a n a g e m e n a n d   p re d icti o n   u sin g   m a rk e t   b a sk e a n a ly sis  a ss o c iativ e   r u l e   m in in g m e m e ti c   a lg o rit h m   a p p ro a c h , "   In ter n a ti o n a J o u rn a o In fo rm a t ics   a n d   C o mm u n ica ti o n   T e c h n o l o g y     (IJ - ICT ) v o l.   8 ,   n o . 3 2 0 1 9 .   [3 9 ]   Oju g o ,   A.A.,   A .   Eb o k a . ,   E.   O k o n ta.,   R.   Yo r o . ,   F .   Ag h wa re . ,   " G e n e ti c   a lg o rit h m   ru le - b a se d   i n t ru sio n   d e tec ti o n   sy ste m , "   J o u r n a o Eme rg in g   T r e n d s in   Co mp u ti n g   In f o rm a ti o n   S y ste m v o l.   3 ,   n o .   8 ,   pp 1 1 8 2 - 1 1 9 4 ,   2 0 1 2 .   [4 0 ]   Oju g o ,   A.A.,   Y o ro ,   R . E. ,   " Co m p u tati o n a i n telli g e n c e   in   st o c h a stic  so lu ti o n   f o T o ro i d a N - q u e e n , "   I n telli g e n c e   Co mp u t in g   a n d   Ap p li c a t io n s v o l.   2 ,   n o .   1 p p .   46 - 56 2 0 1 3 .   [4 1 ]   Oju g o ,   A.A.,   Emu d ian u g h e ,   J.,   Yo ro ,   R. E . ,   Ok o n ta,  E. O. ,   Eb o k a ,   A.O. ,   " h y b r id   n e u ra n e two rk   g ra v it a ti o n a l   se a rc h   a lg o rit h m   f o ra i n fa ll   r u n o ff  m o d e li n g   a n d   sim u lati o n   in   h y d ro l o g y , "   Pro g re ss   in   In telli g e n c e   Co mp u ti n g   a n d   Ap p li c a ti o n s vo l.   2 ,   n o .   1 ,   p p .   22 - 3 3 ,   2 0 1 3 .   [4 2 ]   Oju g o ,   A.A.,   D.  Oy e m a d e . ,   Y o r o ,   R. E . ,   E b o k a ,   A.O.,   Ye ro k u n ,   M . O.,   Ug b o h ,   E. ,   " c o m p a ra ti v e   e v o l u ti o n a ry   m o d e ls f o s o lv i n g   S u d o k u , "   Au t o ma ti o n ,   C o n tr o &   In telli g e n S y st e ms v o l.   1 ,   n o .   5 ,   p p .   1 1 3 - 1 2 0 2 0 1 3   [4 3 ]   Re y n o l d s,  R . ,   " In tro d u c ti o n   to   c u lt u ra a lg o rit h m s, "   T ra n s a c ti o n   o n   Evo lu ti o n a ry   Pro g r a mm in g   (IE EE )   p p . 1 3 1 - 1 3 9 1 9 9 4 .   [4 4 ]   P e re z ,   M   a n d   M a rwa la,  T. ,   " S t o c h a stic  o p ti m iza ti o n   a p p r o a c h e fo so l v in g   S u d o k u , "   in   Pr o c e e d in g   o IEE E   Co n g re ss   o n   Evo lu ti o n a ry   Co m p u ti n g ,   p p   2 5 6     2 7 9 2 0 1 1 .   [4 5 ]   G o m e z   Hid a lg o ,   J .   M ,   Brin g a s,  G .   C. ,   S a n z ,   E .   P . ,   G ra c ia,  F . C. ,   " Co n ten t - b a se d   S M S   S p a m   fil terin g , "   i n   Pro c e e d in g o 2 0 0 6   ACM   S y mp o siu m o n   Do c u me n En g i n e e rin g ,   p p 1 0 7 - 1 1 4 2 0 0 6 .   [4 6 ]   46  Va fa ie,  H.,   De - Jo n g ,   K.  " G e n e ti c   Alg o ri th m   a s a   To o f o F e a tu r e   S e lec ti o n , "   in   M a c h i n e   L e a rn i n g ,   1 9 9 7 ,     [4 7 ]   G h e y a I. A.,   S m it h ,   L . S . ,   " F e a tu r e   su b se se lec ti o n   i n   larg e   d ime n sio n a li t y   d o m a in s, "   Pa tt e rn   Rec o g n it io n v o l.   43 p p .   5 13 2 0 1 0   [4 8 ]   Oju g o ,   A.A.,   A .   Eb o k a . ,   R.   Yo ro . ,   M .   Ye ro k u n . ,   F . N.  Ef o z ia. ,   " Hy b r id   m o d e fo r   e a rly   d ia b e tes   d iag n o sis, "   M a t h e ma ti c s a n d   Co mp u ter s in   S c ien c e   &   In d u stry ,   v o l .   50 pp 207 - 2 1 7 2 0 1 5 .     [4 9 ]   P h il li p ,   K. ,   Hie u ,   H. M . ,   " Op e n   s o u rc e   to o l k it   f o sta ti stica m a c h in e   tran sla ti o n ,"   T e c h n ica re p o rt,  An n u a M e e ti n g   o t h e   Asso c ia t io n   fo r C o mp u ta ti o n a L in g u isti c s (A CL ) ,   2 0 0 7 .   [5 0 ]   S e th i,   G . ,   Bh o o tn a ,   V. ,   " S M S   S p a m   F il terin g   Ap p li c a ti o n   u sin g   An d r o id ,"   I n ter n a ti o n a l   J o u r n a fo C o mp u ter   S c ien c e   a n d   In fo rm a t io n   T e c h n o l o g ies ,   v o l .   5 ,   n o 3 ,   p p.   1 4 2 4 - 1 4 2 6 2 0 1 4 .   Evaluation Warning : The document was created with Spire.PDF for Python.