Indonesi an  Journa of El ect ri cal Engineer i ng   an d  Comp ut er  Scie nce   Vo l.   12 ,  No.   1 O c to be r   201 8 ,  pp.  46~5 0   IS S N:  25 02 - 4752 DOI: 10 .11 591/ ijeecs . v 1 2 .i 1 .pp 46 - 50           46       Journ al h om e page http: // ia es core.c om/j ourn als/i ndex. ph p/ij eecs   Random  Forest  Approach  fo   S entiment A nalysis i n Ind onesian  Langu age       M.   Ali F au z i   Facul t y   of  Com pute Sc ie nc e, Br awij a y a   Univ ersi t y ,   Ma la ng ,   Indo nesia       Art ic le  In f o     ABSTR A CT    Art ic le  history:   Re cei ved   Ma 5 , 2 01 8   Re vised  Ju 6 ,   201 8   Accepte J ul  10 , 2 01 8       Senti m ent   an alys is  bec om es   ver y   usefu since  t he  rise  of  soc ia l   m edi an d   onli ne  r eview  website   and,  thus,   the   r equi rement   of  anal y zi ng   thei senti m ent  in  an  eff e ct iv a nd  eff i ci en wa y.   W c an  consid er  sent iment  an a l y sis  as  te x cl assifi ca t ion  pr oble m   with  senti m ent   as  it c a te gor i es.   In  thi s   stud y ,   we   expl ore   the   us of  Random  Forest  for  senti m ent  cl assifi ca t ion  in  Indone sian   la nguag e.   W a lso  expl ore   the  use  of  bag  of  words   (BOW f ea tur es  with   som te rm   weight ing  m et hods  var ia t ion  such   as  Bina r y   TF,   Raw  TF,   Loga ri thmic  TF   and  TF. IDF .   T he  expe r iment  r esult   show ed  th at   senti m en ana l y sis  s y stem   using  ran dom   fore st  giv goo per form ance  with  av era g e   OO score   0. 82 9.   The  result   al s depi c te tha a ll   of  th four  t er m   weight ing  m et hod  has  co m pet it ive  resul t .   Sinc th sc ore   diff ere n ce  is  not  v e r y   signifi c ant ,   we  c an  sa y   th at   th t erm  weight ing  m et hod  var iatio in  stud y   ha s   no  remarka b le   ef fec t   for  sen ti m en an aly sis using   Random Forest.   Ke yw or d s :   Ra ndom  f or est   Sentim ent an al ysi s   Term  w ei gh ti ng   Text cla ssific at ion   TF.IDF   Copyright   ©   201 8   Instit ut o f Ad vanc ed   Engi n ee r ing  and  S cienc e   Al l   rights re serv ed .   Corres pond in Aut h or :   M. Ali Fa uzi,   Faculty  of Com pu te Scie nc e,   Brawijaya  U niv ersit y, Ma la ng, I ndonesi a.   Em a il m och .ali .f auzi@ ub.ac .id       1.   INTROD U CTION     Nowa days,  pe op le  te nd  t w r it e their experi ence, feel ing,  opinio ns, an d views a bout ev e nts, product s   or   se rv ic es  i on li ne  platf orm s   su ch  as  s oc ia m edia,  blog,  f orum sh op ping  sit es,  or  r eview  sit es.  It  m akes  on li ne   platf orm beco m source  of  hi gh ly   va l ua ble  inf or m at ion   for  both   co nsum ers  and   produce rs .   Custom ers  ge second  op i nions  befor purc hasin s om pr od ucts  or   se r vices.  On   t he  oth e r   hand,      pro ducers  get  inf or m at ion   ab ou w hat  pe op le   think   ab out  their  pro duct or   se rv ic es  a nd  predict   the  public  ac ceptance  r at e  level. T his i nfor m at ion  can  be ve ry u se f ul for i m pr ov em ent an d m ark et ing  strate gies [1] .   Sentim ent  analy sis  is  ta sk   of  analy zi ng  pe op le ’s  opini ons  from   piece  of   te xt  in  ord er  to  s pecify   wh et her   t he  se nti m ents  are  posit ive,  ne gative  or   ne u tral Sentim ent  An a ly sis  hav bee ob ta ini ng  po pu la rity  ov e t he  past  y ears  as   resu lt   of  the   rise   of  s ocial   m edia  and   on li ne   re vie websi te   an d,  thus,  t he  requi rem ent   of  analy zi ng  t heir  se ntim ent   in  a e ff ect i ve  a nd  ef fici ent  way.   Se ntim ent  analy sis  is  c urre ntly   m ajo r   researc fiel with  m any   app li cat io ns  in  la rg e   nu m ber   of  do m ai ns   suc as  el ect io res ults     pr e dicti on  [ 2 ] - [ 4],  st ock  m ark et   predict io [5 ] [ 6],  pr oducts  an m erch ants  ra nk i ng  [7 ] m ov ie   re ve nu e pr e dicti on [8 ] - [ 10 ] ,  learni ng e valuati on  [11 ] [ 12] , a nd etc.   We  can  c onsid er  sentim ent  a naly sis  as  te xt  cl assifi cat ion   pro blem   with  senti m ent  as  it cat egories.   Ther e f or e,  we  can  us s uper vi sed  m achine  l earn i ng   a ppr oa ches  to  ta ckle  this  pro blem T his  ap proach   is   ver popula i se nti m ent  analy si and  pro ve to   be  ver good  i this  file d.  S om m achine  le arn i ng  ap proac that   hav e   bee use in   this  fiel f or  e xam ple   Naive   Ba ye [13 ] - [ 17] S uppo rt  Vect or   Ma chines  [ 18 ] - [ 19 ] ,     Ma xim u m  En trop [ 20 ] , Ne ural  N et w ork [21 ] [ 22]   decisi on tree a nd K - Ne arest  Nei ghbor  ( K N N) [ 23 ] - [ 26 ] .   In   t his  stu dy,  we  e xp l or t he   us of   Ra ndom   Fo re st  f or  sentim ent  cl assifi cat ion   i Ind on esi a n   la nguag e Ra ndom   Fo rest  is   an  ensem ble  le arn in te ch nique  bas ed  on   decisi on  tr ee  al gorithm   [27].     Ra ndom   Fo res ts  ha ve  bee i ncr e dib le   i n   re cent  ye ars   sinc the  pe rfor m ance  of  this   ty pe   of  al gorithm ha ve   Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       Ra ndom F or es t Ap pr oac fo Sen ti me nt A naly sis i n Ind on es ian   Lan guage  ( M. Ali F au zi )   47   su r pass  S VMs,   Naïve  Ba ye and   oth e m ac hin le ar ning  al gorithm fo r   cl assifi cat ion   ta sk   in  so m do m ai n   li ke  bio in form at ic and   com pu ta ti on al   bi ology  [28].  W w il try   wh et her   this  ty pe  of   en sem ble  m et ho ds  sti ll  ou tst a nd i ng  on   sentim ent  ana ly sis  ta sk s.  In  this  stu dy,  we   will   al so   e xplo re  the   us of  ba of  w ords   ( BO W)   featur e with  so m te r m   weigh ti ng  m et ho ds   va riat ion   s uch   as  Bi na ry  TF,  Ra TF,   Log a rithm ic   TF  an TF.IDF .       2.   RESEA R CH MET HO D     A dep ic te in  Fi gure  1,   se nti m ent  analy sis  syst e m   in  this  stu dy  co nsi sts  of   t hr ee  m ai sta ges ,   pr e processi ng,  featur e e xtrac ti on   a nd  cl assif ic at ion   usi ng  R andom   Fo rest.   The  oupt ut  of  cl assifi cat ion   r esult   is t wo cat eg or y , pos it ive a nd  ne gative.           Figure  1. Syst em   m ai flow c ha rt       2 . 1.     Prepr oce ssing   The  fi rst  sta ge   of   this  syst e m   is  pr eproce ssing.  This  sta ge  in vo l ves  se ver al   processe inclu ding   tok e nizat ion,  c ase  f old in a nd  cl eani ng.  T okenizat io is  a   ta sk   of   s plit ti ng  re view  te xt  into  sm al le un it cal le to ken s   or  te rm [29 ] [ 30] Ca se   f old in is  a   ta sk  of  m aking   al of  cha racters   in  rev ie te xt  beco m lowe rcase  [ 31 ] [ 32] Me an wh il e,  cl eani ng  is  ta sk   of   rem ov ing   punct uation,  nu m ber s,  ht m t ag  an char act e rs  ou t side  of   t he  al ph a bet.  I this   stu dy,  we  don’ em plo ste m m ing   and  fil te ring  since   in   so m e   pr e vious  w orks  abou sentim e nt an al ysi s, st em m ing  an d fil te rin ca nnot i m pr ov e cla ssifi cat ion   perform ance.     2 . 2   Fe at ure   Extr act i on   Ba g - of - w ord  ( BO W)   feat ur e will   be  us e in  this  stu dy.  Each  do c um ent  would  be  re presente as  a   vecto in   spa ce  te rm with  t he  un i qu e   t erm fr om   pr e processi ng   sta ge  bec om it s   featu res.  T he   featu re  vecto r value is  determ ined  us i ng so m e term   weig hting m eth od.  The m os t pop ular  te rm  wei gh ti ng m et ho ds  a re   Term   Fr eq uency   (TF),  Invers D ocu m ent  Fre qu e ncy  (IDF)  an the   com bin at ion  of  t he  t wo,  Te rm   Fr eq uen cy   Inverse  Do c ume nt F reque ncy  (TF.IDF)  [33 ] .   Term   Fr equ e nc is  assigning  wei gh ts  by  assum ing   that  each  te rm   hav co ntribut ion   that  is  pro portion al   to   the  nu m ber   of   it occu r ren ce in  the  docum ent  [34 ] [ 35 ] Ther a re  so m popu la va riat ion   of   TF  su c as  Bi nar TF R aw  TF,  an L ogar it h m ic   TF.  Usin Bi na ry  TF,   each  doc um e nt  is  represe nted  as  a   bin a ry v ect or .   te rm  that oc cur s  in  doc um ent w il l get va lue 1 in t he d ocu m ent v ect or,  oth e rw ise  a  term  that   nev e occ urs  in  do c um ent  will   get  value  0.   T his  kind  of  te rm   weig hti ng   do e not  co ns ide the  num ber   of  te rm   occu rr e nc es,  on ly   0/1   va lues.  In  c on tra st  to  Bi na ry  T F,  Ra TF   m e thod  do e c onsider  t he  num ber  of   te rm   occu r rence s.  te rm   will   get  valu based   on   how  m any  tim es  it  app ear in  the  do c um ent.    Me anwhil Lo gar it hm ic   TF  a lso  consi de the  nu m ber   of   te rm   occu r re nce s.  The  dif fer e nc is  Log arit hm ic   TF   Do c u men t   Pre pr oce s si ng   Feat ure  Ex t r act i on   Senti me nt  classi f i cat i on  usi ng  Random F or est   Senti me nt  Ana l ysis  Re sul t   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vol 1 2 , N o.   1 O c t o b e r   201 8   :   46     50   48   assum that  th i m po rtance  of  te rm   in  do cum ent  do es  no inc rease  pr oport ion al ly   w it te r m   ho m any   tim es it  o ccur s.  Th e  w ei gh ts  of term  t in doc um ent d  usi ng  Lo gar it hm ic   TF can be  cou nted  as  foll ows:     d t f d t TF , l og 1 ) , (                 (1)     wh e re  d t f ,   is t he n um ber  of the  how m any tim es  term  t app ears  in  the  doc um e nt d.   Me anwhil e,  I nverse  D ocu m ent  Fr e quency  i global  te rm   weig hting   t hat  been   c ounte by  regar ding  the  distrib ution  of  the   te rm   in  the  dataset T his  te rm   weig ht ing   will   giv e   higher   val ue  f or  rar e   te rm te rm   that o nly ap pea rs  in  certai n d oc um ents. Th e   weig hts  of  te r m   t usin I DF  form ulate as foll ows:     t d df N t I D F l o g 1 ) (                 (2)     whe re  d N   is  the  nu m ber   of   do c um ents  in  dataset   and   t df   is  the  nu m ber   of   do c um ents  in  dataset   that  wh ere   te rm  t app ears.   The  m os popu la te rm   weight ing   is  T F.IDF .   TF. IDF  is  m ulti plica ti on   of  TF  a nd  I DF.  The  weig ht  com bin at ion   of term  t in d oc um ent d  ca n be  counted  as  fo ll ow s  [3 6]:     ) ( ) , ( ) , ( t I D F d t TF d t I D F TF               (3)     wh e re  ) , ( d t TF   is t he T F v al ue of   ter m   t i docum ent d an ) ( t I D F   is t he   ID F  v al ue of  term  t.     2.3.  Sen timen t   Cl as sific at i on usin g Rand om  F ores t   The  la st  sta ge  is  senti m ent  classificat ion E ach  re view  wi ll   be  cl assifi ed  into  po sit ive  or   ne gative   cat egory.  I th is  stud y,  we  e m plo ran dom   forest  for  the  cl assifi cat ion   ta sk Ra ndom   fo rest  al gorit hm   is  a   su pe r vised   c la ssific at ion   al gorithm It  is  an  e ns em ble  le arn in t echn i qu e   ba se on  decisi on  tree     al gorithm   [2 7].   This  E ns em ble  te chn i qu c om bin es  the  pr e dicti on of  s om base  est i m at or c onstr ucted  wit decisi on  tree  al gorithm   to  enh ance  r obust ne ss  ov e an  in div id ual   est i m at or Ra nd om   Fo r est   grows  lot  of   cl assifi cat ion   trees,  w hic is  cal le fo re st.  If   we  wa nt  to  cl assify   new  data,  each  tre giv es  it cat egor y   pr e dicti on   as  one  vote T he  f orest   ch oo se th cat egory  that  has  m ajo rity   vo ti ng.  I ge ne r al the  m or tr ees  in  the r a ndom  f or est  the  higher  a ccur acy   res ults giv e n.   Ra ndom   Fo res ts  hav bee ga ining   popula r it y   in  recent  ye ars  since  t he  perform ance  of  this  ty pe  of   al gorithm have  ou tst a nd i ng   for  cl assifi cat ion   ta s in   som do m ai li ke  bio i nfor m at i cs  an com pu t a ti on al   bio lo gy The r al so   so m works  in   te xt   cl assifi cat ion  us i ng  Ra nd om   fo rest  s uch  as  for  hates peech    detect ion [ 37 ]   and aut hors hip p rofil ing   [ 38 ] .       3.   RESU LT S   A ND AN ALYSIS     Ex per im ent  con duct ed   by  usi ng   386  rev ie ws  ta ke from   Fem al eDaily.  All  of   t he  re views  is  i Ind on esi a la ngua ge.   In ste a of   us i ng   cr os s   validat ion Ra ndom   Fo rest  use   ou t - of - bag   ( OO B error   est i m ate   to  get  a unbia sed  est im at of   the  cl assifi cat ion  pe rfor m an ce.  O OB  sc or r ang e   f or m   to   1.   The  highe OO B   scor the  bette cl assifi cat ion  per f or m ance,  oth e rw ise   the  lowe OO sc or in dicat es  worse  cl assifi c at ion   perform ance.  I the  experim ent, Ran dom  Fo rest w il l be  test ed usin se veral  term  w ei gh ti ng m et ho incl u di ng   Bi nar TF,  R aw  TF,  Lo ga rithm ic   TF,  a nd   T F. IDF.  T he  ex per im ent  is  condu ct e us in Scikit - le arn    li br ary  [39]. T her es ult can  be  seen  in Fi gure  2 .           Figure  2. Se ntim ent  analy sis  exp e rim ent r eu slt  u sin g ran do m  f or est   0.8 0.82 0.84 B i n ar TF R aw TF Loga rith m ic   TF TF . I DF O O B   Score Term   We igh tin Met h od Sen timen An aly sis  u sin Ran d om  Fores t Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       Ra ndom F or es t Ap pr oac fo Sen ti me nt A naly sis i n Ind on es ian   Lan guage  ( M. Ali F au zi )   49   Figure  sho w   that  sentim ent   analy s is  us in rando m   fo r est   giv good  pe r form ance  with  aver a ge  OO B   scor 0.8 29.  We  can  al so   see  f or m   Figu re  that  al of   the  f our  te rm   weight ing   m et ho ha com petit ive  resu lt .   The  O OB  sco re  betwee is  j ust   sli gh tl diff e ren t.  T he  be st  OO sco r is  gained   by   Ra TF  by  0.837 .     The  l ow est   O OB  sc or e   is  ga ined  by  L ogari thm ic   TF  by  0.8 21.  In  the  se cond  place  is   Bi nar TF   wit OO scor 0.8 29   a nd  the  thir place  is  TF.IDF  with  O OB  sco re  0.8 28.  This  resu lt   is  act ually   su rprisi ng  be caus e   us ua ll TF.I D can  outpe rfo rm   an oth er  te rm   weigh ti ng   m et ho d.   Howe ver,  since  the  s cor diff e re nce   is  no t   ver si gn ific a nt we  ca say   t hat  the  te rm   weigh ti ng  m et ho var ia ti on  in  stud has  no  r e m ark able  e ff e ct   f or   sentim ent  analy sis using Ra ndom  Forest.       4.   CONCL US I O N     In   t his  stu dy,  we  e xp l or Ra ndom   Fo rest  w it seve ral  te r m   weigh ti ng   m et ho f or   se nt i m ent  analy sis   i Ind on esi a L angua ge.   Thi syst e m   in  this  stu dy  consi sts  of  t hr ee  m ai sta ges,   prep roc essing,    featur e e xtrac ti on   a nd  cl assif ic at ion   usi ng  r andom   fo re st.  T he  oupt ut  of  cl assifi cat ion   r esult  is  tw cat egory,  po sit ive  a nd  ne gative.  T he  e xp e rim ent  resul sh owed  t hat  sentim ent  anal ysi us in ra ndom   fo re st  give   go od   perform ance  with  ave rag OO sc or 0.829.  T he  res ul al so   dep ic te that  al of   the  four   te rm   weigh ting  m et ho has   c om pet it ive  resu l t.  Since   the   sc or e   di ff e ren ce   is  not  ve ry  si gnific ant,   we   ca say   t hat  the   ter m   weig hting m eth od  va riat ion  i st ud has n o rem ark able ef f ect  f or se ntim e nt an al ysi us i ng Ran dom  Fo rest.       REFERE NCE   [1]   Jansen  BJ,  Zha n M,  Sobe K,  Chowdur y   A.  T witt er  power T wee ts  as  elec tro nic   word  of  m outh.   Journal  of  t he  As socia ti on  for   I nform at ion  Sci e nce   and Technol og y .   2009   Nov 1 ;60(11): 2169 - 88.   [2]   Tumasjan  A,  Sprenge TO,   Sand ner   PG ,   W el pe  IM.  Predic ti ng  e l ec t ions  with  twit te r:  W hat   140  c ha racte rs  rev e al   about   po li t ic a s ent iment .   I cwsm.   2010   Ma y   23;1 0(1):178 - 85.   [3]   Bermingham  A,  S m ea ton  A.  On  using  Twit te to  m onit or  poli tical   sent iment  and  pre di ct  el ec t ion  results .   InProce edi ngs of   the Works hop  on  Senti m ent Ana l y sis wh ere   AI   m ee ts Ps y cho log y   (SA AIP   2011)  2011  (pp. 2 - 10).   [4]   Sang  ET ,   Bos  J.   Predic ti ng  the   2 011  dutc sena t el e ction  results   with  twit te r .   I nProce edi ngs  of   the   works hop  on   sem ant ic   anal y s i s in  soci al m edi a   2012  Apr 23   (p p.   53 - 60) .   As socia ti on   for   Com puta ti on al L ingu isti cs.   [5]   Boll en  J ,   M ao   H,  Ze ng   X.   Twi tt er   m ood  pre di ct th stock   m a rke t.  Journal   of  computat ion al   s ci en ce.  2011  M ar  31;2(1): 1 - 8.   [6]   Zha ng  X,  Fuehre s H,  Gloor  PA .   P red icting  stock m ark et   indicat or s thr ough  twit te r   hope  it   is not   as  bad  as  fear .   Proce dia - Soc ia l   and  Beh avi or al   Scie nc es.   2011   Jan  1;26 :55 - 62.   [7]   McGlohon  M,  Glanc NS ,   Re it er  Z.   Star  Qu al ity :   Aggrega ting  Revi ews  to   Rank  Products  and  Merc han ts .   InICW SM   2010  Ma y   16.   [8]   Mishne  G,  Glanc NS .   Pred ic ti ng  Movi Sale from   Blogge Senti m en t.   InAA AI  Spr ing  S y m posium:   Com puta ti onal  Approac hes  to   A naly z ing  W ebl o gs 2006  Mar  27   (pp.   155 - 158) .   [9]   Jos hi  M,  Das  D,   Gim pel   K,  Sm i th  NA .   Movie   r evi ews  and   rev e nues:  An  exp erim ent   in  t ext  reg ression.   InHum an   La nguag Tech nologi es:  Th 2 010  Annual  Confer ence  of  the  North  Am eri ca Chapt er  of  th e   As socia ti on  f or  Com puta ti onal L ingui stic 2010  J un  (pp .   293 - 29 6).   As socia t ion  f or  Com puta ti on a L ingui sti cs.   [10]   Sadikov  E ,   Par a m eswara AG ,   Vene ti s P.   Blogs   as  Predi ct ors of   Movie  Succ ess. InICW SM   2009  Mar  20.   [11]   Ortigosa  A,  Ma r JM ,   C arr R M.  Senti m ent  an a l y s is  in  Fa ce bo ok  and  it app li c at ion  to  e - learni ng.   Com pute rs  i n   Hum an  Beha vio r.   2014   Feb  28;3 1:527 - 41.   [12]   Munez ero   M,  Montero  CS ,   Moz govo y   M,  Sutin en  E.   Exp loi t ing   senti m ent   anal ysis  to  tra ck  emot ions  in  student s'  le arn ing  di aries.   InProce ed ings  of  th 13 th   K oli   C al li ng   Int e rna ti on al   Conf e ren ce  on  Com p uti ng  Educ a ti on  Resea rch   2013  Nov 14  (pp. 145 - 152).   ACM .   [13]   Kang  H,  Yoo   SJ,   Han  D.  Senti - le xic on  and  improved  Naïve   Ba yes  al gorit hm for  senti m ent   ana l y sis  of  resta ura n rev ie ws .   Expe r t S y stems   with  A ppli c at ions.   201 Apr 30; 39(5) :6 000 - 10.   [14]   Antina sari  P,  Perda na  RS ,   Fauzi  MA .   Anali sis  S ent imen  Te nt an Opini  Film   Pa da  Dokum en  T witt er  Berb aha s a   Indone sia  Meng gunaka Na ive   Ba y es  Denga Perba ika K at a   Ti dak   Baku .   Jurnal  Pengemba ngan  Te kno lo g i   Inform asi  dan  I l m Kom pute r .   2 017;  1(12):1733 - 41.   [15]   Gunawan  F,  Fauzi   MA ,   Adikar PP .   Anali sis  Sen ti m en  Pada  Ulasa Aplika si  Mobile   Menggunak an  Naive   Ba y e s   Dan  Norm al isasi  Kata   Berb asis  Le vensht ei Dis ta nc (Studi  Kas us  Aplika si  BCA  Mobile ).   S y st emic:   Inform at io n   S y stem a nd   Info rm at ic s   Journal .   2017  Des 31;   3( 2):1 - 6.   [16]   Fauzi   MA ,   Afiria nto  T .   Im proving  Senti m ent   Anal y sis  of  Short  Inform al   Indone sian  Product  Reviews   using   S y non y m   Based   Feat ure   Expa ns ion.   T EL KO MN IKA   (Te le comm unic a ti on  Com puti ng  Elec troni c and  Control ) .   2018  Jun 1; 16(3 ).   [17]   Fan issa  S,  Fauzi  MA ,   Adinugroho  S.  Anali sis  S ent imen  Par iwisat d Kot Mal ang  Menggunak an  Metod Nai v e   Ba y es  dan  Sel eksi  Fitur  Query   Exp ansion  Ranki ng.   Jurnal  Pengembanga Te knologi   Infor m asi  dan  Ilmu   Kom pute r. 2018;   2(8):2766 - 70 .   [18]   Mulle T ,   Co ll i er  N.  Sen ti m e nt   Anal y s is  using   Support  Vec to Mac hin es  wit Diver se  Info r m at ion  Source s.   InEMNLP 2004 J ul  (Vol.   4,   pp.   4 12 - 418).   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vol 1 2 , N o.   1 O c t o b e r   201 8   :   46     50   50   [19]   Rofiqoh  U,  Perda na  RS ,   Fauzi   MA .   Anali sis  Senti m en  Ti ngkat   Kepua sa Pengguna  Pen y ed ia   L a y anan   Te l ekomunikasi   Selul er  Indone sia  Pada  Twitte Denga Meto de  Support  Vec tor  Mac hine   d a Le xic on  B ase d   Feat ure s.   Jurnal   Pengembanga Te knologi Infor m asi  dan  I lmu Kom pute r.   2017;   1(12):1725 - 32.   [20]   Bat ista F,  R ibeir R.   Sen ti m ent anal y s is a nd   topic   class ifi cation   ba sed  on  bin ar y   m axi m um   ent rop class ifi ers.   [21]   Munir  MM ,   Fauzi   MA ,   Perda n RS .   Im ple m ent asi  Metode   B a ckpr opagation  Neura Network   ber basis  Le xi c on   Based  Feat ur es  dan  Bag  of  W ords  Untuk  Ide nti fika si  Uja ran   Kebe ncian  Pada   Twit te r .   Jurnal   Pengembanga n   Te knologi Infor m asi  dan  I lmu Kom pute e - ISS N.   2017;254 8:964 X.   [22]   La m   SL,   Le e   DL.   Fea ture   r e duct ion  for   neu ral   n et work  bas ed  te x ca t egor i za t ion.   InDa ta b ase   S y st ems   for  Advanc ed  Appl i ca t ions,  1999 .   Pr oce ed ings., 6t h   I nte rna ti ona Con fer ence  on   1999  (pp.   195 - 202) .   I EE E .   [23]   Bil al  M,  Isr ar  H,  Shahid  M ,   Khan  A.  Sent imen cl assifi catio of  Rom an - Urdu  opini ons  usi ng  Naïve  Ba y es ia n ,   Dec ision  Tr ee   a nd  KN cl assific a ti on  t ec hn iqu es.   Journal  of   King  Saud  Univer sit y - Com puter  and  Inform at i on  Scie nc es.   2016   Jul 31 ;28(3) :330 - 44.   [24]   Nurja nah  W E,   Perda na  RS ,   Fauzi   MA .   Anal isis  Senti m en   Te rha d ap  Tay a ngan  Telev isi  Berda sarka Op in i   Mas y ar aka p ad Media   Sos ial   Twit t er  m engg unaka Metod e   K - Nea rest  Nei ghbor  dan  Pem bobota Jum la Ret wee t. Jurnal  Pengembanga Te knologi Infor m asi  dan  I lmu Kom pute r.   2017;   (12), 1750 - 57.   [25]   Menta ri  ND ,   F auz MA ,   Muf li khah  L .   Anal isis  Senti m en  Kurikulum  2013  Pada  Sos ia l   Media   Twi tt e Menggunaka Metode   K - Nea rest  Neighbor   dan  Feat ure   Sele ct ion  Qu er y   Exp ansion   Ranki ng.   Jurnal   Pengembanga Te knologi Infor m asi  dan  I lmu Kom pute r.   2018;   (8):2739 - 43 .   [26]   Cla ud y   YI,   Perd ana   RS ,   Fauzi  MA .   Klasifi kasi   Dokum en  Twitter  Untuk   Meng et ahu Kara k te r   Cal on  Kar y aw a n   Menggunaka Algorit m K - Nea rest   Neighbor   (KN N).  Jurnal   Pengembanga n   Te kno logi   Inf orm asi  dan  Ilm u   Kom pute r.   2018 2(8):2761 - 65 .   [27]   Brei m an  L .   R an dom   fore sts.  Ma chi ne   learni ng .   2 001  Oct  1 ;45(1):5 - 32.   [28]   Stat nikov  A,   Al ife ris  CF .   Are   r andom  fore sts  bet t er  th an  support  vector  m ac h i nes  for  m ic roa rr a y - b ase ca nc er   cl assifi ca t ion ? .   I nAM IA  annua s y m posium   proc ee dings  2007   (Vol.   2007 ,   p .   686 ).   Am eri c an  Me dic a Inform atic s   As socia ti on.     [29]   Fau zi   MA ,   Arifi AZ,   Gos ari SC .   Indone sian  News   Cla ss ifi cation  Us ing  Naïve   Ba y es  and  T wo - Phase  Feat ure   Sele c ti on  Mode l .   Indone si an  Jou rna of   E le c trica l   Engi n ee ring   an Com pute Sci e nce .   2017  De 1 ; 8(3).   [30]   Rosi  F,  Fauzi   MA ,   Perda na  R S.  Prediksi  Rati ng  Pada  Rev ie w   Produk  Kec anti kan  Menggunak an  Metode  Naïv Ba y es  dan  Ca tegorical  Proporti onal   Diffe r ence   (CPD ).   Jurnal  Pengembanga n   Te knologi   Inf orm asi  dan  Ilmu   Kom pute r.   2018 2(5):1991 - 97 .   [31]   Le star AR,  Perda na  RS ,   Fauzi   MA .   Anali sis  S ent imen  Te n ta n Opini  Pilka da   Dki   2017  Pada  Dokum en  Twit te r   Berba hasa   Indo nesia   Menggun aka ive   B a y es  d an  Pem bobota Emoji .   J urna Peng embanga T eknol o gi  Inform asi  dan  I l m Kom pute r.   2 017;  1(12):1718 - 24.   [32]   M.  Ali  Fauzi ,   D joko  Cah y Utom o,   Budi  Darm Seti awa n ,   and  Eko  Sakti   Pram ukant oro.   2 017 .   Autom at ic   Es s a y   Scoring  Sy st em  Us ing  N - Gra m   and  Cosine  Simi la ri t y   for  Gam if ic a ti on  Based  E - Le arn ing.   In  Proce ed ings  of  the   Inte rna ti ona Confer ence  on  Advanc es  in  Im age   Proce ss ing  (ICAIP   2017).   ACM ,   New  York,  NY,   US A,  151 - 155.   DO I:  htt ps:/ /doi . org/10. 1145/313 3264. 3133303   [33]   Pram ukant oro  E S,  Fauzi  MA .   C om par at ive  an aly sis  of  str ing  si m il ari t y   and  cor pus - base sim il a rity   for   aut om ati essa y   scor ing  s y stem  on  e - lea rning  gamificat i on.   InAdvanc ed   Com pute Sci enc and  Infor m at ion  S y st em s   (ICACS IS),  2016  Inte rn a ti on al C onfe ren c on   20 16  Oct  15   (pp .   1 49 - 155).   I EE E .   [34]   Fauzi   MA ,   Arifin  A,  Yuniar ti   A.  Te rm   W ei ghti ng  Berba sis  Inde ks  Buku  dan  Kela untuk  Pera ngkinga Dokum en  Berba hasa   Arab .   Lontar  Kom put er:   Jurna I lmiah   Te kno logi   Infor m asi.   2013;5(2) .   [35]   Suharno  CF ,   Fauzi   MA ,   Perda n RS .   Klasifi k asi   Te ks  Baha sa  In donesia   Pada  Do kum en  Pengadua Sam bat   Onlin e   Menggunaka Metode   K - Nea r est  Neighbor Dan  Chi - Square .   S y stemic Inf orm at ion  S y ste m   and  Inform at ic s   Journal.   2017   D ec   7 ;3(1): 25 - 32 .   [36]   Fauzi   MA ,   Arifi AZ,   Yuniar t A.  Arab ic   Book   Ret ri eva using   Cla ss   and  Book  Inde Based  Te rm   W ei ghti ng .   Inte rna ti ona Jou rna of   E le c trica l   and  Com puter Enginee r ing  (IJE CE).   2017   Dec   1 ;7(6): 3705 - 10.   [37]   Alfina   I,   Mulia   R,   Fanan y   MI,  Eka na ta   Y.  Hat Speec Detect ion  in  the   Indone sian  La ngu ag e:   D at ase and   Preli m ina r y   Stud y .   [38]   Palomino - Gari b a y   A,  Cama cho - Gonzá lez  AT,  Fierro - Vil la ned RA,  Herná nde z - Faria I,   Busc aldi  D,  Mez a - Rui IV.  A ra ndom   fo rest  appr o ac h   for   aut horship   profi li ng.   Cappell at et   al.[8] .   2015.   [39]   Pedre gosa  F,  V aro quaux  G,   Gram fort  A,  M ic h el   V,   Thi r ion  B ,   Grisel   O,  Blo ndel   M,   Pretten hofe P,  W ei ss   R,   Dubourg  V,  Va nder pla J.  Scik it - learn:   Mac h in le arn ing  in  Py thon .   Journal  of  Mac hine   Lea rning  Resea rch .   2011;12(Oc t): 28 25 - 30.   Evaluation Warning : The document was created with Spire.PDF for Python.