I AE I nte rna t io na l J o urna l o f   Art if icia l In t ellig ence   ( I J - AI )   Vo l.   5 ,   No .   1 Ma r ch   2 0 1 6 ,   p p .   41 ~ 44   I SS N:  2252 - 8938          41     J o ur na l ho m ep a g e h ttp : //ia e s jo u r n a l.c o m/o n lin e/in d ex . p h p /I J AI   T w itt er Tw eet  Cla ss ifier       Ash w in V   De p a rte m e n o f   In f o r m a ti o n   T e c h n o l o g y S RM   Un iv e rsit y       Art icle  I nfo     AB ST RAC T   A r ticle  his to r y:   R ec eiv ed   Dec   4 ,   2 0 1 5   R ev i s ed   Feb   7 ,   2 0 1 6   A cc ep ted   Feb   2 5 ,   2 0 1 6       T h is  p a p e a d d re ss e th e   ta sk   o b u il d in g   a   c las si f ier  th a w o u ld   c a te g o rise   tw e e ts  in   T w it ter.  M icro b lo g g in g   n o w a d a y h a b e c o m e   a   to o l   o f   c o m m u n ica ti o n   f o In tern e u se rs.  T h e y   sh a re   o p in i o n   o n   d if f e re n a sp e c ts  o li f e .   A th e   p o p u larity   o f   th e   m i c ro b l o g g in g   sites   in c re a se th e   c lo se w e   g e to   th e   e ra   o f   In f o rm a ti o n   Ex p lo si o n . T w it ter  is  th e   se c o n d   m o st  u se d   m icro b lo g g in g   site   w h ich   h a n d l e m o re   th a n   5 0 0   m il li o n   tw e e ts  twe e ted   e v e r y d a y   w h ich   tran sla tes   to   m in d   b o g g li n g   5 , 7 0 0   tw e e ts  p e se c o n d .   De sp i te  th e   h u m o n g o u u sa g e   o t w it ter  th e re   isn ’t  a n y   sp e c i f ic   c las si f ier   f o th e s e   tw e e ts  th a a re   twe e ted   o n   t h is  sit e .   T h is  re se a rc h   a tt e m p ts  to   se g re g a te t w e e t s   a n d   c las sify   th e m   to   c a teg o ries   li k e   S p o rts,   Ne w s,  En terta in m e n t,   T e c h n o lo g y ,   M u sic ,   T V ,   M e m e ,   e tc .   Na ï v e   B a y e s,  a   m a c h in e   lea rn in g   a lg o rit h m   is  u se d   f o b u il d in g   a   c las si f ier  w h ich   c las si f ies   th e   twe e ts  w h e n   train e d   w it h   th e   t w it ter  c o rp u s.  W it h   th is  k in d   o f   c la ss i f ier  th e   u se m a y   sim p l y   s k i m   th e   twe e ts  w it h o u g o in g   th ro u g h   th e   te d io u w o rk   o f   sk i m m in g   th e   n e w s f e e d .   K ey w o r d :   Mic r o b lo g g in g   T w ee t s   Ste m m i n g   Ma ch i n lear n i n g   al g o r it h m   Co p y rig h ©   2 0 1 6   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e   Al rig h ts  re se rv e d .   C o r r e s p o nd ing   A uth o r :   Ash w i n   V   Dep t.  o f   I n f o r m at io n   T ec h n o l o g y ,   SR U n i v er s it y ,   Kattan k u lath u r   C h e n n ai,   I n d ia .   E m ail:  9 4 . ash w i n v ee @ g m ail. c o m       1.   I NT RO D UCT I O N     Su cc es s f u m icr o b lo g g in g   s er v ices  s u c h   as  t w itter   h av co m to   an   i n te g r al  p ar o f   d ai l y   li f o f   m illi o n s   o f   I n ter n et  u s er s .   I n t er est  in   m i n i n g   in   t w itter   i n cr ea s ed   w ith   th w id esp r ea d   u s o f   th e s s er v ices.   B ec au s t h e y   b ec o m th e   w ar h o u s o f   p eo p les  o p in io n   o n   c u r r en is s u e s .   T w itter   is   th m o s t   p o p u lar   a n d   th s ec o n d   m o s u s ed   s o cial  n et w o r k i n g   s ite.   S in ce   it s   la u n ch   i n   2 0 0 6 ,   th p o p u lar it y   o f   its   u s h as  b ee n   d r asti ca ll y   in cr ea s in g ,   t h at  m o r th an   1 0 0   m illi o n   u s er   p o s 3 4 0   m illi o n   t w ee t s   d a y   i n   2 0 1 2 .   A s   o f   m ar c h   2 0 1 6 ,   T w itter   h a s   m o r th a n   3 1 0   m ill io n   m o n t h l y   ac tiv u s er .   I n   t w itter ,   u s er s   ar allo w ed   t o   cr ea te  s tatu s   m e s s a g es  w h i ch   ar ca lled   t w ee ts .   T w ee ts   ar o f   1 4 0   ch ar ac ter s   w h ic h   ar w r itte n   b y   r eg is ter ed   t w itter   u s er s   ab o u th eir   lif e,   o p in io n s   o n   v a r iet y   o f   to p ics  an d   d is cu s s io n s   o n   c u r r en i s s u es.   As  m o r an d   m o r u s er s   s h a r th eir   o p in io n   o n   s ev er al  f i eld s ,   th eir   v ie w   o n   cu r r en t is s u es,  m icr o b lo g g i n g   s ites   b ec o m t h ass e ts   o f   u s er s   o p in io n   an d   s e n ti m e n ts .   I n   th i s   r esea r ch   w u s d ataset  f o r m ed   b y   co llecti n g   t w i tt er   t w ee ts .   T h ese  t w ee ts   ar co llected   an d   ar f ed   to   th class if ier   w h i ch   clas s if ies  t h e m   in to   s ev er al  ca teg o r ies  li k Sp o r ts ,   Ne w s ,   E n ter tai n m en t,   P o liti cs,  an d   Me m e.   W it h   t h e   h elp   o f   t h ese  ca teg o r ies  u s er   m a y   j u s h av e   to   ch o o s t h ca teg o r y   o f   h i s / h er   in ter est s .       2.   RE L AT E WO RK   W ith   t h in cr ea s in   p o p u lar ity   o f   s o cial  n e t w o r k s   a n d   b lo g s ,   an al y s is   a n d   m i n in g   h as b ec o m f ield   o f   i n ter est  f o r   m an y   r esear c h er s .   T h er ar lo o f   r esear ch es  d o n e   in   t w it ter   s u c h   as  u s er   cla s s i f icatio n ,   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8938   IJ - AI    Vo l.  5 ,   No .   1 ,     Ma r ch   2 0 1 6   :   41     44         42   T r en d   d etec tio n ,   Sen ti m e n cl ass i f icatio n ,   tr en d   d etec tio n   et c.   B u th i s   r esear ch   m ai n l y   ca r r ies  o u th ta s k   o f   s eg r e g atin g   t w ee t s   i n to   s ev er a l c ateg o r ies f o r   u s er s   co n v e n i en ce .   I n   o v er v ie w in g   L . H u ag ,   R . B h a y an i   an d   A . Go v in d ,   2 0 0 9   r e s ea r ch ,   t h e y   ad d r ess ed   t h cla s s i f icatio n   o f   t w ee ts   b ased   o n   s e n ti m e n t.  T h ese  t w ee ts   ar cla s s i f ied   i n t o   eith er   p o s iti v o r   n e g ati v with   r esp ec t to   q u er y   ter m .   T h e y   h a v al s o   u s ed   th e   e m o tico n s   o cc u r r in g   in   t w ee ts   as  s ilv er ”  lab els i.e . ,   lab els   w it h   m o r u n ce r tai n   s tatu s   t h an   t h o n e s   f o u n d   i n   u s u a “g o ld ”  s ta n d ar d s   f o r   t w ee s en ti m en a n al y s i s T h is   r esear c h   m a in l y   b en ef it s   co n s u m er s   w h o   w an t   to   k n o w   ab o u t h s e n ti m e n t   o f   p r o d u cts  b ef o r p u r c h ase,   o r   co m p a n ies  th a t   w a n to   m o n i to r   th p u b lic  s e n ti m e n o f   th eir   b r an d .   W h ile   J . R ea d   in   h is   r esear ch   ( R ea d ,   2 0 0 5 )   h h as  u s ed   e m o tico n s   s u c h   as  : - ) ”  an d   : - ( ”  w h ic h   s er v as  n o i s y   lab els  an d   f o r m ed   tr ain i n g   s et  f o r   s en t i m e n t   class i f icatio n .   Fo r   t h is   p u r p o s e,   th a u t h o r   co llected   te x ts   c o n tain i n g   e m o tico n s   a n d   d iv i d ed   th d ata  s e i n to   p o s itiv an d   n eg at iv s a m p le s   San k ar an ar a y a n a n   et  al.   2 0 0 9 ,   b u ilt  n e w s   p r o ce s s i n g   s y s te m   f o r   id en ti f y i n g   t h t w ee t s   th a co r r esp o n d s   to   late  b r ea k in g   n e w s .   T h e y   co llected   th t wee ts   an d   th e y   r e m o v ed   n o is e s   f r o m   th e m .   T h e y   c lu s ter ed   t h t w ee ts   u s i n g   t h cl u s ter i n g   al g o r ith m   ca lle d   lead er - f o llo w er   cl u s ter i n g ,   w h ic h   allo w s   f o r   clu s ter i n g   i n   b o th   co n ten a n d   ti m e.   T h o th er   is s u w h ic h   i s   ad d r ess ed   in   t h i s   r esear ch   is   i d en tify i n g   r elev a n t   lo ca tio n s   as s o ciate d   w it h   t h e   t w ee t s .   P a n g   a n d   L ee ,   2 0 0 2   r esear ch ed   th p er f o r m a n ce   o f   v ar io u s   m ac h i n e   lear n in g   tech n iq u es  lik e   Nai v B a y es,  Ma x i m u m   e n tr o p y   a n d   SVM   i n   t h e   s p ec i c   d o m ai n   o f   m o v ie   r ev ie w s .   B y   t h i s   th e y   w er ab le  to   ac h i ev an   ac c u r ac y   o f   8 2 %.     Srir a m   et  al.   2 0 1 0 ,   th eir   w o r k   is   m o r r ele v a n to   o u r s .   T h ey   clas s i f ied   t w ee t s   i n to   p r ed ef in ed   s et  o f   class es  s u c h   as  n e w s ,   e v e n ts ,   o p in io n ,   d ea ls   an d   p r iv ate  m es s ag e s   w it h   t h u s o f   i n f o r m at io n   ab o u t h e   au th o r   a n d   also   f ea tu r w h ic h   ar ex tr ac ted   f r o m   t w ee t s   s u ch   as  “@ u s er n a m e” ,   s h o r te n i n g   o f   w o r d s ,   s la n g ,   etc.   T h e y   class i f ied   t w ee ts   i n   o r d er   to   im p r o v in f o r m atio n   f ilter i n g .   T h eir   f ea tu r o u tp er f o r m ed   th b ag .   O f   w o r d   m o d el  ap p r o ac h   in   th cl ass i f icatio n   o f   t w ee t s .     Dif f er en f r o m   t h ab o v w o r k s ,   th i s   r esear ch   d ef i n e s   s y s te m   t h at  w o u l d   clas s i f y   all   th t w ee t s   ir r esp ec tiv o f   th tr e n d ,   s en ti m en t,  u s er   i n to   ca teg o r ies  li k e   Ne w s ,   Me m e,   Sp o r t,  E n ter tain m e n w h ic h   w o u ld   m ak t w itter   f ar   m o r co n v e n i en t to   u s a n d   also   s a v es a m p l a m o u n t o f   ti m f o r   th u s er .       3.   SYST E M   DE SI G N   Ou r   s y s te m   h er e   i s   s e g r eg ated   in to   d if f er en m o d u le s .     3 . 1 .     T w ee t   Ret riev a M o du le            T h b asic r eq u ir em e n f o r   th r etr iev al  o f   T w ee t s   is   t h T w it ter   A P I .   R eg i s tr atio n   f o r   th AP I   is   d o n u s i n g   an   e x is ti n g   T w itter   ac c o u n t.  O n ce   r eg is ter ed ,   th u s e r   is   p r o v id ed   w it h   C o n s u m e r   Key ,   C o n s u m er   Secr et  Ke y ,   an   A cc es s   T o k en   a n d   an   A cc es s   T o k en   Secr et  u s in g   w h ic h   th e   t w ee ts   ar e   r etr iev ed   f r o m   t h e   u s er s   ti m eli n e.   3 . 2 .     T ex t   P ro ce s s ing   M o du le              T o   an al y s an d   class if y   tex t,   th er ar ce r tain   p r e - r eq u is ite  ac tio n s   th at  m u s b p er f o r m ed .   T h r etr iev ed   t w ee ts   ar w r itte n   o n to   T ex Fil e.   E ac h   t w ee m u s b w r itte n   o n   to   d if f e r en tex f ile,   all  o f   w h ic h   m u s t   b i n   t h s a m d ir ec to r y .   T h ese  te x f i les ar e   th e   Do cu m en ts   th a w i ll b u s ed .   T h d o cu m e n ts   ar e   f ir s t   p u t   th r o u g h   t h p r o ce s s   o f   clea n in g .   C lea n i n g   r ef er s   t o   th r e m o v al   o f   an y   a n d   all   p u n ct u atio n   m ar k s   f r o m   w it h i n   t h d o cu m e n t.  O n ce   th d o cu m e n ts   ar clea n e d ,   th n ex p r o ce s s   is   to   r e m o v th Sto p   W o r d s .   Sto p   W o r d s   ar w o r d s   lik a r ticles,  p r o n o u n s ,   p r ep o s itio n s   an d   co n j u n ctio n s   w h ic h   w o u ld   n o af f ec th e   ev en t u al  cla s s i f icatio n .   T h en ,   s te m m i n g   w h ic h   is   t h p r o c ess   o f   ex tr ac tin g   th r o o w o r d   f r o m   ea ch   o f   th e   w o r d s   in   t h d o cu m en is   ca r r ied   o u t.  Ste m m i n g   r et u r n s   s et  o f   r o o w o r d s   th at  ca n   t h en   b f ed   i n to   th e   cla s s i f ier .     3 . 3   Co nv er s io M o du le               T h co n v er s io n   t h at  h as   to   o cc u r   is   to   g et   a n   AR FF   Fi le  to   b f ed   in to   W ek i.e . ,   W aik ato   E n v ir o n m e n t   f o r   K n o w led g e   A n al y s is   w h ich   is   Ma c h i n L ea r n in g   to o d e v elo p ed   at  th e   U n iv er s it y   o f   W aik ato   in   Ne w   Z ea la n d .   T h w h o le  d ir ec to r y   o f   Do cu m en ts   is   co n v er ted   i n to   o n AR FF   Fil u s in g   t h e   W ek a’ s   C o r e. C o n v er ter s   L ib r ar y .   T h co n v er s io n   is   d o n u s in g   th e   TextDi r ec to r yLo a d er   m et h o d   th at   d er iv e s   f r o m   t h TextTo A r ff   cla s s   i n   W ek a.   T h co m m an d   w ek a . co r e. co n ve r ters . Text Dir ec to r y Lo a d er  d ir   <Dir ec to r y   P a th <A R F F   F ile  P a th >   m u s t   b en ter ed   i n   W e k a’ s   C o m m a n d   L in e   I n ter f ac w h ich   ca r r ies   o u t h e   co n v er s io n .   Evaluation Warning : The document was created with Spire.PDF for Python.
IJ - AI     I SS N:  2252 - 8938     T w it ter T w e e t C lass if ier  ( Ashw in V )         43   3 . 4       Cla s s if ier  M o du le   W b u ild   cla s s i f ier   u s in g   t h Naï v e   B a y es   clas s i f ier .   N aıv B a y e s   cla s s i fier   i s   b ased   o n   B a y e s   th eo r e m .                                                                                                                                   ( 1 )                   W h er d   is   th Do cu m en t,  an d   is   th C ate g o r y .     T h b est cla s s   in   NB   clas s if ica tio n   is   t h m o s t lik e l y   o r   ma ximu a   p o s teri o r i   ( M A P )   C M AP   class :                                                                                                                                           ( 2 )     Do cu m e n t d   is   r ep r esen ted   as  f ea t u r d 1 ,   d 2 …,   d n .     T h class if ier   w o r k s   a f ter   th e   A ttrib u te s   ( C las s i f icatio n   Fe atu r e)   ar m e n tio n ed   o n   th AR FF   F ile.   Of   t h d o cu m en ts   i n   th w h o le  s et,   7 0 ar u s ed   as  th tr ain i n g   s et,   i.e . ,   th ese  7 0 o f   th t w ee t s   ar m a n u al l y   lab elled   as  Sp o r ts ,   New s ,   E n te r tain m en t,  T ec h n o lo g y ,   Mu s ic ,   T V,   Me m e,   etc.   an d   th r e m ain i n g   3 0 is   u s ed   as th T est s et.     3 . 5 .     User  M o d ule   T h is   ca n   b ca lled   th f r o n t - e n d   o f   th ap p licatio n .   T h is   i n c lu d es  t h Gr ap h ic  User   I n ter f ac ( GUI ) .   T h is   p r o v id es  th lin k   b et w ee n   th ap p licatio n   a n d   th u s er .   T h is   th m o d u le  w h er th u s er   w ill  b d is p la y ed   w it h   t w ee t s   t h at  ar ca teg o r is e d   as Sp o r t s ,   E n ter tain m en t,  New s ,   Me m e,   P r iv ate  Me s s ag e.       4.   RE SU L T   T h is   g r ap h   s h o w s   t h ac c u r ac ies  p er   class es  u s i n g   N aïv B a y es  c lass if ica tio n .   T h is   g r ap h   s u m m ar izes   th e   r es u lt  o f   o u r   c lass i f ier .   T h ac c u r ac ies   in   cla s s i f icatio n   i n to   ca t g o r ies  ar e   p r ett y   h i g h   w h ic h   i s   v er y   g o o d .   T h class i f icatio n   o f   t w ee ts   i n to   ca te g o r ies  ar o n l y   b ased   o n   t h w o r d s   co n t ain ed   in   t h t w ee t s   th at  w u s ed   i n   t h tr ain i n g   s e t .   T h ese  w o r d s   m a y   co n tr ad ict  in   m o r t h an   o n ca te g o r ies   wh ich   w ill   a f f ec t   t h ac cu r ac y .   B u t i n   o u r   ca s t h at  i m p ac h as b ee n   v er y   lo w   ex c ep t f o r   th e   ca teg o r y   Ot h er s   b e ca u s th a m b i g u it y   in   t w ee ts   t h at  f al u n d er   t h o t h er s   ca te g o r y   i s   v er y   h i g h   a n d   s o   th e y   f all   in to   s o m e   o th er   c ateg o r y   r es u lti n g   i n   th is   lo w   ac c u r ac y .   T h er ar s ev er al  ap p r o ac h es lik 8 F,  B OW ,   9 F th at  ca n   b u s ed   to   in cr ea s th ac c u r ac y .                                   Fig u r 1 .   A cc u r ac ies  p er   ca teg o r y   u s i n g   Naïv B a y es       5.   F UT UR E   E NH AN CE M E N T   Miss io n   lear n in g   tec h n iq u e s   p er f o r m   w ell  f o r   clas s i f icatio n   o f   t w ee ts .   W b elie v t h at   ac cu r ac y   co u ld   s till   b i m p r o v ed .   Mo r e   ad v an ce d   co m p ar is o n   ap p r o ac h es  ca n   b tak en   i n to   co n s id er atio n   s u c h   as   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8938   IJ - AI    Vo l.  5 ,   No .   1 ,     Ma r ch   2 0 1 6   :   41     44         44   clu s ter i n g .   A n d   also   u s i n g   m a ch in lear n i n g   a lg o r it h m s   li k SVM,   Ma x i m u m   en tr o p y   ca n   b u s ed   in   ad d itio n   to   th Naïv B a y e s   clas s i f ier   to   im p r o v t h ef f ic ien c y   in   cla s s i f icatio n .     As  m e n tio n ed   ea r lier ,   t w itt er   h as  5 0 0   m illi o n   t w ee t s   ev er y   d a y ,   h e n ce   in   n ea r   f u tu r t h i s   m i n d b o g g li n g   n u m b er   is   b o u n d   to   in cr ea s an d   s u b s eq u en t c ateg o r ies n ee d   to   b ac co r d in g l y   i m p le m e n ted .       6.   CO NCLU SI O N   As  d is c u s s ed   ea r lier   m icr o b lo g g i n g   n o w ad a y s   h as  b e co m e   o n o f   t h m aj o r   m o d e s   o f   co m m u n icatio n   a m o n g   i n ter n et  u s er s .   A   r ec en r esear ch   h a s   id en ti ed   it  as  o n li n w o r d - of - m o u t h   b r an d in g   ( J an s en   et  al. ,   2 0 0 9 ) .   T h lar g a m o u n o f   in f o r m a tio n   co n t ain ed   in   m icr o b lo g g i n g   w eb - s ites   is   w h at  m a k e s   th e m   a n   at tr ac tiv e   s o u r ce   o f   d ata   f o r   m i n i n g   an d   an al y s i s .   A lt h o u g h   t w itter   m e s s ag es   h a v u n iq u e   ch ar ac ter is tic  co m p ar ed   to   o t h er   co r p o r a,   m ac h in lear n i n g   al g o r ith m   h av s h o w n   to   c lass i f y   t w ee t s   w it h   s i m ilar   p er f o r m an ce .     I n   th i s   p ap er   w u s t w itter   f ee d s   as  o u r   d ata  s et  an d   ca t eg o r ies  t h e m   b ased   o n   th eir   n atu r a n d   s ig n i f ica n ce   o f   t w ee t.  Fu r t h er   r esear ch ed   is   n ee d ed   to   c o n tin u to   i m p r o v t h ac cu r ac y   i n   d if f icu lt  d o m ain .   Ma ch i n lear n i n g   al g o r it h m   c an   ac h ie v h ig h   ac cu r ac y   f o r   c lass i f y in g   w h en   u s in g   t h is   m et h o d .           Fig u r e   2 .   S y s te m   De s ig n       RE F E R E NC E S   [1 ]   J S a n k a ra n a ra y a n a n ,   H S a m e t,   BE  T e it ler,  M D L ieb e r m a n J   S p e rl in g T w it ters tan d n e w s in   tw e e ts 2 0 0 9 .   [2 ]   S riram ,   D   F u h ry ,   De m ir,   H   F e rh a to sm a n o g lu ,   M   De m irb a s S h o rt  tex c las sifi c a ti o n   in   twit ter  to   im p ro v e   in f o rm a ti o n   lt e rin g 2 0 1 0 .   [3 ]   A   G o ,   R   Bh a y a n i,   L   Hu a n g .   Tw it t e se n ti m e n c las si c a t io n   u sin g   d istan su p e rv isio n .   2 0 0 9 .   [4 ]   M   Bu sh ,   L e e ,   T   W u NL P - b a se d   a p p ro a c h   to   T w it ter Us e Clas si f i c a ti o n .   2 0 1 0 .   [5 ]   J   Re a d Us in g   e m o ti c o n s to   re d u c e   d e p e n d e n c y   in   m a c h in e   lea rn in g   tec h n iq u e s f o se n ti m e n c las sifi c a ti o n .   2 0 0 5 .   [6 ]   Ka th y   L e e ,   Dia n a   P a lse ti a ,   Ra m a n a th a n   Na ra y a n a n ,   M d .   M o sto f a   A li   P a tw a r y ,   A n k it   Ag ra w a l,   a n d   A lo k   Ch o u d h a ry Tw it ter T re n d in g   T o p ic Cl a ss if ica ti o n 2 0 0 9 .   [7 ]   J Be n h a rd u s .   S trea m in g   T re n d   De tec ti o n   i n   T w it ter .   2 0 1 0 .   [8 ]   P a n g ,   L   L e e ,   S   V a it h y a n a th a n S e n ti m e n c las sifi c a ti o n   u si n g   m a c h in e   lea rn i n g   tec h n i q u e s .   2 0 0 2 .   [9 ]   S   k a b ir  a n d   M   T a h m i m L o c a li z e d   tw it ter o p i n i o n   m in in g   u si n g   se n ti m e n a n a ly sis .   2 0 0 9 .   [1 0 ]   T e d   P e d e rse n .   A   sim p le  a p p ro a c h   to   b u i ld i n g   e n se m b les   o f   n a iv e   b a y e sia n   c las si e rs  fo w o rd   se n se      d isa m b ig u a ti o n .   2 0 0 0 .   [1 1 ]   YS  Ye g in   G e n c ,   JV   Nic k e rso n Disc o v e rin g   c o n tex t:  Cla ss if y in g   twee ts  th ro u g h   a   se ma n ti c   tra n sfo rm   b a se d   o n   W ikip e d ia .   P ro c e e d in g o f   HCI In tern a ti o n a l .   2 0 1 1 .   [1 2 ]   T M   M it c h e ll .   M a c h i n e   L e a rn in g .   M c G ra w - Hill ,   Ne w   Yo rk .   19 97.   [1 3 ]   W e k a   3 Da ta M in i n g   S o f tw a re   in   Ja v a ,   h tt p :/ /w ww . c s.  w a i k a to . a c . n z /m l/ w e k a /.   [1 4 ]   Na ïv e   Ba y e s cla ss i f ier.  Re tri e v e d   f ro m   h tt p s:// w e b . sta n f o rd . e d u /cla ss /cs 1 2 4 /l e c /n a iv e b a y e s.p d f   [1 5 ]   Na iv e   B a y e s   tex c l a ss i f ica ti o n .     Re tri e v e d   f ro m   h tt p :/ / n lp . sta n f o rd . e d u /IR - b o o k /h tm l/ h tm led it io n /n a iv e - b a y e s - tex t - c las si f ica ti o n - 1 . h tm l.     Evaluation Warning : The document was created with Spire.PDF for Python.
IJ - AI     I SS N:  2252 - 8938     T w it ter T w e e t C lass if ier  ( Ashw in V )         45     B I B L I O G R AP H O F   AUT H O R       A sh w in   V   is  f ro m   Ch e n n a b o r n   o n   0 5 / 1 0 /1 9 9 4   Ha c o m p lete d   Un d e rg ra d u a te  B. T e c h   d e g re e   in   In f o rm a ti o n   T e c h n o lo g y   a t   S RM   Un iv e rsit y   Ch e n n a i,   In d ia  in   th e   y e a r   o 2 0 1 6 .   A n d   c u rre n tl y   w o rk in g   a E m e rio   T e c h n o l o g ies ,   G u in d y ,   Ch e n n a i,   I n d ia.   T h is  is  th e   A u th o r’s f irst  re se a rc h   w o rk .               Evaluation Warning : The document was created with Spire.PDF for Python.