Int ern at i onal  Journ al of Ele ctrical  an d  Co mput er  En gin eeri ng   (IJ E C E)   Vo l.   9 , No .   6 Decem ber   201 9 , p p.   5185 ~ 5191   IS S N:  20 88 - 8708 DOI: 10 .11 591/ ijece . v 9 i 6 . pp5185 - 51 91           5185       Journ al h om e page http: // ia es core .c om/ journa ls /i ndex. ph p/IJECE   Convolu ti onal n eu ra l n etwork - ba sed mod el   for web - based te xt classif icat i on        Sa t yabr ata Ai ch , Sab yasa c h i Ch ak r abort y , H ee - C heol  K im   Depa rt m ent   o C om pute Engi n e eri ng/Institut of   Digital  Ant i - Aging  H ealthcare,  I nje   Univ ersity ,   Republ ic of   Korea       Art ic le  In f o     ABSTR A CT   Art ic le  history:   Re cei ved   A pr   18 , 201 9   Re vised  Ju 8 ,   201 9   Accepte J ul   1 7 , 2 01 9       The re   is  an   in creasing  amount  of   te xt  d ata  av ailab le   on   the  web  wi th  m ult iple   topi c al   gr anul ar i ti es;  thi ne ce ss i ta t es  prope cate goriz a ti on/ cl assi fic a ti on  of   te xt  to  fa cilitate  obta in ing  usef ul  informa ti on   as  per   th n ee d of  users.   Som tra dit ional  appr oac h es  such  as  bag - of - words   and  bag - of - ngra m s   m odel provide   good  result for  t ext   cl assifi catio n.   How eve r,  te x t ava ilable  on  the   web  in  the   cur r ent   sta t contain  high  eve nt - r el a te gr anul ar ity   on   diffe ren topics  at   diff ere nt  le v els ,   which  m a y   ad ver sel y   aff ect  th accur a c y   of  tra ditional   ap proa che s.  W it t he  inve nt ion  of  dee learn ing  m odel s,  whic h   al re ad y   h ave   the  ca pability   of  pr ovidi ng  good  accura c y   in  th field  of  image  proc essing  and   spee ch  r ec ogn it i on,   th prob le m inhe ren in   th tr adi t ional   te xt  c la ss ifica t io m odel   ca be  over come.   Curr e ntly ,   th ere   are   s eve ra dee p   le arn ing   m odel such  as  conv olut ional  neur al   net works   (CNNs),   rec urr ent  neur al  net works   (RNN s),  and  lo ng - short  te rm   m emor y   th at  are  widely   used   for  var ious  t ext - rel a te ta sks howeve r,   among  the m ,   th C NN   m odel   is  popula becaus it   is  sim ple   to  use  and  has  high   ac cur a c y   for  t ext  cl assifi ca t ion.   I thi stud y ,   c la ss ifi c at ion  of   ran dom   te xts  on  the   we b     int cate gori es  is  at te m pte using  CNN - base m odel   by   ch angi n g     the   h y per p ara m e te rs  and  seque n c of  te x vectors.  W at t empt  to  tune   ev e r y   h y per p ara m eter   tha is   uniqu for  th class ifi cation  t ask  al ong  wit h     the   seque nc es  of  word  vec tors  to  obta in  the   d esir ed  ac cu racy the  ac cur acy   is   found  to  be  in  the   ran ge  of  85 92%.   Thi mode ca be  co nsidere as     re li ab le   m odel  and  app lied  to   solve  re al - world   proble m   or  e xt rac t   useful   informati on  for   var ious text   m ining a ppl ic a ti ons.   Ke yw or d s :   Conv olu ti onal   neural  netw ork s   Deep l ear ning   Text cla ssficat i on   Text m ining   Web - based te xt  classi ifcat ion   Copyright   ©   201 9   Instit ut o f Ad vanc ed   Engi n ee r ing  and  S cienc e   Al l   rights re serv ed .   Corres pond in Aut h or :   Hee - C heo Ki m   Dep a rtem ent o Com pu te r  Enginee rin g/Insti tute o f Digit al   An ti - A ging  He al thcare ,   Inje U niv er sit y,   197, I nje - ro,  G i m hae - si, G ye ongsa ng nam - do ,  Rep ub li of   K or ea  50 834 .   Em a il heek i@ inj e.ac .kr       1.   INTROD U CTION   Ca te go rizat io or  cl assifi cat ion  of  te xt  is  c onside red  to   be   on e   of  t he  im po rta nt  to pics  in   the  fiel of   natu ral  la ngua ge  proces sin (N L P) it   is  al s an  esse ntial   t oo in  div er se  fiel ds   su c as  filt ering   in for m at ion ,   cat egorizat ion  of   top ic s ,   searchi ng   the  w eb,   an senti m ental   analy si [1 ] O ne  of  the  si m ple  ways  of   exp la ini ng  te xt   cl assifi cat ion   is  descr i bed   a fo ll ows:  Give gr oup  of  do c um ents  co ntainin gro up   of  cl asses,  fun ct ion   is  def in ed  that  will   a ssign   val ue   to  the  gr ou of   cl a sses  for  each   doc ume nt  [2 ] .   Text  cl assifi cat ion   or  te xt  m ining   ap proac hes   are  us ed  to  e xt ract  i m po rtant   inform ation   from   a   la rg a m ount   of   te xt  data  in  sh ort   tim [3 ] From   t he  be ginnin g,  te xt  cl assifi c at ion   has  bee co ns ide red   to  be   com plica te pro ble m   becau se  te xt  data  ar m os tl un str uctu red  an c onta in  a   lot  of  te xt  vect ors.  Pre viou s   appr oach es  a va il able  are  su it able  for  s m all  a m ou nt  of   te xt  with  le ss  com plexit y;   ho w ever,  these  ap proac hes  are  not  su it able   fo la r ge  am ount  of  te xt  be cause  this  re duces  their  accur acy Fo this  pur pose,  dee le arn i ng  m od el are  popu la beca us they   pr ovide  good  accu racy  wh e us e f or  la rg a m ou nt  of   data  an these  Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  9 , N o.   6 Dece m ber   201 9   :   5185   -   5191   5186   m od el hav a lready  s how their  pote ntial   in  the  fiel of  s peech  rec ognit ion   a nd  c om pu te visio [4,  5].   The  proce dure  that  m os deep   le arn ing   a ppr oa ches  f ollow   is   as  fo ll ow s:  Fir st,  inp ut  sente nc es  are  represe nted  as  sequ e nce  of   w ords te rm   ca ll ed  “on e - hot  vecto r”  re pr ese nts  each  word   i that  m od el T he n,   weig ht  m at rix  is  m ult i plied  by  the  se qu e nce   of  w or ds   a nd  pro j ect ed  to   ve ct or  sp ace  th at   is  c on ti nu ous  in  na ture  t form   a   den se  vecto that  con ta ins  sequ e nce  of   real  val ues.   T his  sequence  of   words   will   be  con sidere a s   input  to  the  de ep  ne ur al   ne tw ork  in  w hich  m ul ti ple  la ye rs   pr e dict  the  de sire out pu t.  B ased  on  the  tu ning  of   su it able  hyperparam et ers  an the   se qu e nc of  w ord   ve ct or s,   m axi m u m   accuracy  can  be  ac hieve i n   the  trai ning  set   [6 - 8].  Althou gh  dif fere nt  de e le ar ning  m od el are  avail abl su ch  a lo ng - sh ort - te rm   m e m or (LSTM ),   recur ren n e ur al   net works  (R N Ns),  an c onvolut ion al   neural  ne tworks   (C NNs),   we  us e   CNN   because   of   it si m plici t and   al so   beca us it   pr ovide high  accuracy  f or   te xt  cl assifi cat ion The refo re,  in  this   stud y,  CN m od el   is  dev el op e with  t he  best  possible  tun i ng   of   hype r par am et ers  and  sequ e ncin of   word  vecto rs  to  im pr ov e  the classi ficat ion  acc ur ac y of t exts int o diff e re nt cate gories .   The  pap e is  orga nized  as  f ollows:   Sect io pro vid e backg rou nd   a nd  relat ed  w ork.   Sect io descr i bes  t he  m et ho dolo gy.  In  Sect io 4,  the  e valuati on   of  the   m od el   is  disc us se d.  Sect io prov i des   con cl us io a nd  futur e  wo rk.       2.   BACKG ROU ND    Kim   [9 ]   pr op os e m et ho to  perform   cl assifi cat ion   of   sentence  us in CNN  by  us in one  conv olu ti on  la ye with   the  ve ry  li tt le   tun in of  hy perpara m et e rs;  four  di ff e ren m od el s   su c as   CN N - ra nd,   CNN - sta ti c,  CNN - non - sta ti c,   and   CN N - m ulti chan nel  we r us ed  a nd  an  accuracy  ra nging   from   81 .5 89.6%  was  ac hieve d.   The  a uthor  c on cl ud e that  pr i or   trai ning  of  un s uper vise word   vect or i one  of  the  im portant  aspec ts  w hile  perform ing   N LP - relat ed  ta s ks   us in deep   le arn in g.   Zha ng  et   al [ 10 ]   pro posed  a em pirical   stud t hat  us e s   cha racter - le ve CNN  f or   la rge - scal dataset s;  they   f ound  t hat  C NN  that   us es   cha racter - le vel  featur e as  in pu is  e ff ect iv wh e s ubj e ct ed  t datase ts  of   ce rtai siz e,  c ur at e te xt,  a nd  ch oice  of   al ph a bets.  T he   resu lt   w ou l be  dif fer e nt  if   there  is  chan ge  in  dataset   siz e,  cur at ed  te xts,  an ch oice  of   al ph a bets.  J ohns on  a nd   Z ha ng   [11]  pro po sed  m et ho to  ver i fy  the  eff ect   of  the   word   orde r   on   te xt   cl assifi cat ion   a ccur acy he re,   instea of  ap plyi ng   CN N   to  low - dim ens io nal  w ord   vector,  they   app li ed   the  m e tho to   high - dim ensi on al   te xt  data   to  achieve  be tt er  m od el   accu racy.  T hey  use pa rall el   CNN ,   in  wh ic m or than  tw co nv olu ti on  la ye rs  are  us e in  paral le fo le arn i ng   m or em bed di ng   te xts  to  im pr ov e   m od el   accurac y;   they   fo und  t his  m e thod  to  be  ef fecti ve.   H ughes  et   al [12]  pro po se a appro ac base on    the  sem antic   c la ssific at ion   pe rfor m ed  at   the  sentence  le ve l.  They  us e this  m et ho o m edical   te xt and  fou nd   that  de e CN Ns  facil it at in  analy zi ng   the  sem antics  of   se ntences  by  gen e rati ng  m or op tim al   f eat ur es,   wh ic in directl i m pr ov e the   accur acy T he found  t hat  th is  m et ho outp erfor m ed  ot her  ap proache s u s ed  f or  ta sk relat ed  to  N LP   Ri os   a nd  Ka vu lur [13]  propose a a ppr oa ch  t perform   te xt  cl assifi ca ti on   of  bio m edical   arti cl es  by  assig ning  m edical   su bj ect   hea ding  ( Me SH te rm   t the  a rtic le s.   They  f ound  an  im pr ovem e nt  of   appr ox im at ely  3%  wh e us in Me S te rm s   for  cl assifi cat ion   ta s ks   c ompare to  previ ou s   res ults  on  public   dataset s.  They   m entioned   th at   this  m e thod  has  stron pote ntial   for  cl assifi cat ion  of   te xts  relat ed  to  bio m edical   arti cl es.  Zha ng  et   al [ 14]   pro pos ed  novel  m eth od  t perform   sentim ental   a naly sis  on  te xt   data   by  us i ng  CN a nd   c r os s - m od al it co ns ist ent  re gr es sio (CCR an tra ns fe le ar ning.   They  use t hr e ty pes   of   em beddin gs  su c as  le xi con   em beddin g,   sem antic   em bed din g,  an sentim ent  em bed din t encode   the  te xts.   T i m pr ov t he  pe rfor m ance,  eac C NN  m od el   con ta ine one  of  the  em bed di ng s   as  well   as   CC and  tran sfe le arn i ng   was  pe rfor m ed.   It  ha bee f ound  t hat  al CNN   m od el per f or m   bette co m par ed  t   the  existi ng   m od el s.  W a ng   and   Kim   [1 5]   pr opose a i m pr ov e C NN   m od el   for   top ic   an senti m ent   cl assifi cat ion   on  fou be nch m ark   dataset an fou nd   that  th per f or m ance  of   the  ne m od el   ou t perform ed  al the pre vious m od el s .   Moriya  and Shibata [16] p r op os e a CNN  te chn i qu with deep lay ers  at  ch aracte le vel an t hen   us e trans fer   le a rn i ng  m et ho for  i m pr ov em ent  in  the  cl assifi cat ion  accu racy. Nii  et   al .,   [1 7 ]   pr opos e a fr am ework  that  us e word   vect or   representat io of  te xt  an C NN  f or   te xt   c la ssific at ion.It  wa f ound  tha t   the  perf or m ance  of   the  pro pos ed  m et ho is  be tt er  than  the  previ ou m et hods Li dong  an Hu [ 18]   propose d   te chn i qu e   na m ed  as  m ulti   m ixed  CN f or  cl assifi cat ion  of  te xt  se nti m ents.I was  fou nd  that  this  m et hod  i s   m or eff ect ive  com par ed  to  suppo rt  vector   m achine,  Naï ve  Ba ye sia and   oth e cl assic al   methods .   Kowsa ri  et   al . [ 19 ]   m entione good  revi ew  ab out  al the  cl assifi cat ion  m et ho a nd  it ad va ntag es  an disad va ntages.  From   of   the  a bovem entione pa st  w ork,   it   can  be  see that  CN Ns  have  en ough  pote ntial   for   te xt classi ficat ion - relat ed  task s whil e achie vin g hi gh accu ra cy .         Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       Con v olu ti on al  neural  network - base d model f or  we b - based  text  classif ic ation  ( Saty abra t a Ai ch )   5187   3.   CONV OLUT IONAL  NEU RA NETW ORKS   This  sect io giv es  a ov e rv ie of  C NN s   an their   arc hitec ture  for  a pp li c at ion   to   te xt  cl assifi cat ion.   ty pical   CN arc hitec ture  for  rec ognizin cha racters  is  sh ow in  Fig ure  1   [ 20 ] It  w as  m a inly   inv e nted  for   com pu te r visi on a nd no wad ay s a lm os t every  visio syst em   us es C NNs [9] .   CN is  a   ne ur al   netw ork - ba sed  a rc hitec ture,   wh ic basical ly   co ns ist of  m ult iple  sta ges;     the  net work   i trai na ble  for   perform ing   te xt  cl assifi cat ion - relat ed   ta sk s.  T he  sta ge of   CN are  as     fo ll ows  [ 21 - 23]:   a.   Con voluti onal   la ye rs:  These  a re  so m of   the i m po rtant  la ye rs  of  CN N.   T hese  la ye rs  co nt ai nu m ber  of   kernel  m a tric es.  In   t hese  la ye rs,   co nvol utio is  us ually   per f or m ed  by  the  ke rn el   m at rices  on   th input  an an  outp ut  as  biased  value - a dd e feat ur m at rix   is  ge ner at ed.   T he  wei gh t   of   kernel  an biases  is  le arned  by u si ng lear nin g p r ocedur e because  the  conn ect io n wei ghts are s har e a m on ne uro ns .   b.   Pooli ng   la ye rs:   These  la ye rs  are  fun dam ental  el e m ents  of   CNN.   T he  m ain   obj e ct ive  of  these  la ye rs  is  to   carry  o ut  dim ensio nalit red uctio of   t he   input,  w hic reduces  t he  nu m ber   of   ra ndom ly   gen er at ed   var ia bles  so   th at   the  data  analy ti pr ocess  is  faster  an sim pler.   T he  subsa m pl ing   of  the  conv olu ti on  la ye r   ou t pu is   pe rfo rm ed  by  the   poolin la ye r   by   com bin ing  ne igh borin el e m ents.  T he  m a x - poolin f un c ti on   is  the  m os com m on ly   us ed  poolin f un ct io t hat  us ua ll ta kes  the  m axi m um   value  a m on   the local  neig hbor hoods.   c.     Em bed ding  la ye r:  This  is  on of   the  s pec ia el e m ents  of   CNN  to  pe rfor m   te xt  c l assifi cat ion - rel at ed  ta sk s.  The   ob je ct ive  of  t his  l ay er  is  to   co nv ert  in pu t   te xt  docum ents  into   pro pe f orm a that  is  s uitabl e   for  th CN N.  In  this  la ye r each  w ord  of  the  in put  te xt  do c um ent  is  c onve rted  i nto  de ns vect or  of    a fix e siz e.   d.   Fu ll co nn ect e la ye r:  T his  is   a   hi dd e la ye r   of  feed - f orw ard   ne ur al   net work  ( FNN) This  la ye ca be   exp li cat ed   as  a   uniq ue  c onvol ution  la ye tha con ta i ns   ke rn el   m at rix  of  siz 1x1.  T his  ty pe  of  la ye i s   m e m ber   of   t he  gro up  that  c on ta in the   wei gh ts   of  t raina ble  la ye r.   This  la y er  is  m os tl us e i the   la s sta ge of  a  CN N.           Figure  1.  A rch i te ct ur of   c onvoluti onal   ne ur al   netw ork       backpro pagat ion   al go rith m   basical l us es  super vise le arn in a nd  c on ti nu ous - valu ed  f unct io n.  The  num erical  weigh ts  on  e ach  input  are  assigne ba s e on  histo rical   data  pr io to  the  trai ning  process .     In   t he  trai ning p r ocess the   op tim a weig ht  is  finali zed   by r e du ci ng  the  m ean  s qu a re  e rro   .Th e form ula  for   fin ding the  m e an  s quare e rro r       is as  f ollow s  [23 ] .       = 1 1 2 = = 1 = 1 = 1 ( )     Wh e re  n o   is t he  num ber  of  neurons of  the  outpu t l ay er  an e s 2 (p )  is the e rro of t he  s th   ou t put ne uro n for t he p th   patte rn of th e t rainin set .   To   m ini m iz t he  e rro funct ion         m ini - batc st oc hastic   gradie nt  desce nt   (m - S GD)  is   widely     us e [ 24] I m - SG D,   t he   m od el   coeffic ie nts  an m od el   er ror  est i m at ion are  pe rfor m ed  by  div idi ng     the  trai ni ng  set into  sm all  num ber   of   batch es.  T his  ty pe  of  al gorithm   ha the  a dvanta ge of  bo t stoc hastic   gr a dient  desce nt  al gorithm   as  wel as   batc gr a dient  des cent  al gorithm i.e.   r obus t nes f ro m   the  sto chasti c   gr a dient  desce nt  al gorithm   a nd   e ff ic ie ncy  the  batc gr a dient  desce nt  al gorithm This  al gorithm   is  th m ost   widely  used  algorit hm  in  the  fiel d of   dee le arn i ng [25 ] .   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  9 , N o.   6 Dece m ber   201 9   :   5185   -   5191   5188   4.   METHO DOL OGY   The  flo wch a rt  of the m et ho do log us e in  th is st ud y i s  sho wn in F ig ur e  2.           Figure  2 Flo w char of the te xt  classi ficat ion   us in C NN       The follo wing  ste ps  ca n be c onside red as t he  k ey  ste ps  to  perf or m  text cl assifi cat ion   us in CN Ns .   a.   Data  aggre gation  a nd   in gestion Th init ia dev el op m ent  of   the  m od el   re qu i res  huge  a m ou nt  of  data   to  be  us e f or   re viv in the  fea ture  vect or   to   com plete l c onvolve  th rou gh   the  te xt  m at rix  an to  s el f - op ti m iz the  s cor i ng   functi on  that  is  the  w ei gh ts.  T he  dat was  c ollec te f ro m   an  ope s ource  re pos it or that  co ntained  blogs  on   f our  diff e re nt  top ic s,  nam el y,  healt hcar e,  s ports,   m ov ie s,  a nd  f inance.   The   da ta   init ia ll con ta ined  l ot  of   noise   li ke  ad vert isem ent  data,  i m ages,  an li nk s T his  nois was  rem ov e at   the  ver init ia l   sta ge  to  sup port  pro per   i ngest io of  dat into  the  m od el .A the  pro du ct io le vel,  data  ing est io is  i m plem ented  by  us in the  Be autiful  Sou ob j ect w hich  ac cepts  hyper li nk   to  a ny  blo or  any  kind  of  w ebp a ge.   Af te fetchin the  li nk,  the  Be autiful  Sou o bj e ct   is  pr ocesse with  li nk   of   the  blog  or  te xtu al   data;   ini ti al l y,  it   captu res  c om plete   te xtu al   data  f r om   the   blog   by  ne gatin a ll     the  exces noi se  su c as  im a ges  a nd   li nks Af te fetchi ng   data  from   the  li nk t he  ob j ec is  processe in   the  init ia sta g su ch  as  by  re m ov al   of   punct uations  an le ftov e noise further,  two - degr ee  lemm at iz a tion   is  perform ed  on   the  te xt  t m ake  it   su it able  to  pr ocess  us in the  cl assifi e r.  The  sc op of  the  S oup  obj ect   is   su c that  eve r tim the  ob je ct   ru ns,  it   retrains  the  m odel   fu rt her   to  m ake  it   m or so phist ic at ed  a fter   pro per ly  test in g usin a  prede fine m od el .   b.   Data  prep r oces sing   a nd  gen e r at ion   of   vocab ulary:   This  is   the  init ia an t he  m os fun da m ental   par th at   needs  to   be   perform ed  for  t he  gen e rati on  of  a ny  m od el   of  s u ch  a   us e   case.   An kind   of  te xt  that  is   fetch ed   from   the  internet  co ntains  s om no ise w hich  is  requir ed  to  be  rem ov ed  from   the  input  pri or  to   it s   ing est io into  t he  m od el In   CNN,   few   as pe ct that  al ways  need   to  be  as certai ned   before   go in f orwa r with  any  a ppr oach   f or   m od e dev el opm ent  include  t he  le ngth  of   t he  doc um ent,  the  pa ddin re quired  f or  the  in pu m at ri x,   et c.  The refo re,  the   pri m ary   aim   is  al ways  to  analy ze  the   ty pe  of  data.   In   t he  ver fi r st  ste p,   we  rem ov al kin ds   of  punctuati ons  f ro m   the  te xt  data  to  dev el op  con sist ent  vo cabu la ry  that  can   be  us e f or  th m od el For  vocab ulary  ge ne rati on,  f ew   ge ner ic   functi ons   are  c reated w hich  first  form   a   Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       Con v olu ti on al  neural  network - base d model f or  we b - based  text  classif ic ation  ( Saty abra t a Ai ch )   5189   pro per  voca bula ry,  beca us e   neural  netw orks  ne ver  ta ke   strin gs   as  i nput   an re qu i re  work i ng  w it nu m e rical   inp ut s.  Ther e fore,  any  kind  of   in pu sho uld   be  conve rted  to  on e - ho in pu s that  it   per fec tl relat es  to  the   r esp on se   va riab le   or   t he  ou t put  var ia ble F or  the  re gula rizat ion  of  al the  se ntences   or  wor vecto rs  in   te xtu al   obj ect ,   th vect or s   nee to  be   c om bin ed  with  pro per  bindin gs .   F or   m ai ntaining   prope r   bindin f or  all  w ord vect ors,  we  pe rfor m  p add i ng   of  se nte nces s uc that  it  r end e rs  the leng t of all  v ect ors   to  be  of   th sa m s iz e.  Ther e fore,   we  us ually   hav hy perparam et er  in  ou sy s tem MA X _DOC _L ENGTH s t ha pro per  pa dding  s uch  as  < P AD >   (i our  c ase)  ca be  us e to   re gula rize  al the  w ord  vecto rs  into  sim ilar  segm ent  in  te rm of   le ng t h.   Mo re ov e r,   t his  pa ddin he lps  in  m on it or i ng  new  w ords  t ha the  cl assifi e rs  hav e   not  obser ve pr e viousl an c onv ert  to  pro pe se gm ent  so   that   the syst em   m a i ntains c onsist ency.   c.   CNN  m od el First,  we  ge ne rate  sp arse  m at rix  fr om   the  te xtu al   data  on   the  basis  of  the  sp li rati of     the  num ber   of   sentenc es  a nd  the  num ber   of  w ords Af te r   creati ng  s pa rse  m at rix,   we   look  it   up  i our   vo ca bula ry  f or  m at ching w hi ch  ge ner at es  the  batc siz e.  Our  pri m ary  d efau lt   batch  si ze  was  10  w ord s ,   wh e re  the  sm aller  sente nces  w ere  pa dded   wit with  re gard to  the  pr e vious  paddin pro vid e to  t hem   i the  earli er  ste p.  The refor e w con cl ud t hat  the  m axi m u m   le ng th  of  the  docum ent  ing est ed  into  t he  C N N   m od el   sh ou l be  45  w ords I the  em bed di ng   la ye r,   w hich  is  ge ner al ly   the  first  la ye of   CN m od el ,   we  m ap  each  vo ca bula ry  w ord  to  l ow - dim ensio nal  te xt  vecto rs.   On   t he   basis  of  the   e m bed di ng   la ye r   dev el op e i the  pre vious  sta ge,   c onvoluti on   la ye is  de ve lop e that  ta ke an  in put  f rom   the  e m bed di ng   la ye and   pass es  the  scal ar  pro duct of  the  functi ons  to  t he   m ax - po oling  la ye r.   For  the  com plete   syst e m ,   we  de velo pe two  c onvoluti on   la ye rs  fo ll owed  by  two  m ax - poolin la y ers  an f ully   connecte la ye r s.   Fo th first  co nvolu ti on  la ye r the  weig ht  m at rix  or   the  filt er  ha dim en sion   of  the  wi ndow  siz of   ea c conv olu ti on  fra m and   t he  e m bed din siz e for  the  seco nd  co nvol uti on  la ye r,   t he  w ei gh m at rix  ha d   the  dim ension   of   the  sam window  siz of   t he  seco nd  co nvol ution   la ye and   t he  siz of  weig ht  m at rix  or  filt er.  T he  siz e of  the   filt er  or  wei gh m at rix  trac m ajo r   us e   case  i determ ining   th pe rfor m ance  of   the  CN m odel   as  these  a re   an  i niti al ly   ra ndom iz ed  seq ue nce  of   num be rs,   w hich  a re  t hen  opti m iz ed  to   loss  gr a die nt  to  ho l the  m i nim a.  Af te co nvolu ti on,  t he  m at rix  is  po ole over  by  m ax - poolin la ye r wh ic dow ns a m ples  the  ind e to   m axi m um   value.   The   f ully   connecte la ye at   the  e nd  te nds  t acce pt  an  in put  f ro m   the  fi nal  m ax - poolin la ye t gen e rate  the   sco re  of   eac an e ver cl a ss  f or  ba tc of   word   vecto rs  passe into  th m od el Final ly the  o utput  is  pr ovi ded   by  the  ou t pu la ye r.   T he  act ivati on   functi on  that  was  us e in   the  m od el   wa s   the  Re L functi on  to  ge ne rali ze  the  path   of  the  syst em   for   con c urrin g res ults so  that it  re inf or ces  it sel to  diff e re nt w a ys for  pro per p red ic ti on.        5.   EVAL UA TI O NS   This  sect io c om par es  the  pe rfor m ance  of   our  m od el   with  so m existi ng   sta te - of - the - art  m e tho ds .     In  this  stu dy we   use CNN   m od el   us in t he  voc abu la ry  ge ne r at ed  f r om   the  in pu te xt  a nd  t un i ng    the  hy perpara m et ers;  we  f ound   t he  m axi m um   accuracy  to  be  92 % T he  hy perparam et ers  us e in our  stud a re   as  fo ll ows:  nu m ber   of   filt ers m axi m u m   len gt of  the  docum ent,  em b edd i ng   siz e w indow  siz e,  poolin window pooli ng   st rides nu m ber   of   co nv olu ti on  la ye rs,  and   num ber   of   poolin la ye rs.   I ou r   case,   we  achie ved   m axim u m   accuracy  by  assigni ng   t he  val ues  to  the  ab ovem e ntion e hype rparam et ers  as  fo ll ow s:   nu m ber   of  filt ers  10,   m axi m u m   le ng th   of   the  docum ent  80,   em bed di ng   siz 20,   wind ow  siz =   20 ,   poolin wi ndow  =   4,  poolin stride  = 2,   num ber   of   c onv ol ution   la ye =   2,   a nd  num ber   of   poolin la y ers  =   2.  W it h t he a bo ve m entioned c om bin at ion s, we  achieve d hi gher acc ur acy   The  m et ho by  Hug hes  et   al .  [ 12]   us e C N m od el   with  t heir  word2 vec ap pr oach  for   m edical   te xt  cl assifi cat ion   and  they   ac hie ved  m axi m um   accuracy  of  68%.   T he  m e thod  by  Kim   [9 ]   us e CN N - ran d   m od el in  w hich  w ords  we re  init ia li zed  rand om l and   m od ifie la te in   the   trai ning  ph ase CNN - sta ti m od el ,   in  w hich   pre - tr ai ned   vect or wer e   sta ti bu t   oth e par am et ers  wer e   up dated  base on  th pe r f or m ance;  CNN - non - sta ti m od el w he re  pe rtai ned   vect or a well   as  oth e p a r a m et ers  wer e   updated  bas ed  on   the  pe rfor m ance;  CNN - m ulti channel  m od el in  w hich  each  cha nnel   has  it own  s et ti ng   an is  tun e separ at el y.  Th accuracy  of  the  abovem e ntion e m od el ranges  from   81 . 5 89. % The  cl assifi cat io perform ance  i sh own  in  F i gure  3.   F ro m   the  F igu re   3 ,   it  is  cl ear  th at   ou pro pos ed  m e tho ac hieves   the  hi gh e st  ac cur acy .   The   s li gh m arg in  of   im pr ovem e nt,  of   a ppr oxim at ely  3%,   c an  al s facil it at in   achievin t he   de sired  cl assi ficat ion   obj ect ive s.   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  9 , N o.   6 Dece m ber   201 9   :   5185   -   5191   5190       Figure  3 Cl assifi cat ion   perfor m ance of  diff e ren t C NN m od el s       6.   CONCL US I O N   In   this  stu dy,  we  pro posed  novel  CNN - base m e tho to  cl assify   tex ts  belo ngin to  dif fer e nt   cat egories  colle ct ed  from   the  web   with  hi gh er  accu racy  co m par ed  to  oth e CN N - base m od el s.  The  pr opos e CNN  m od el   w as  buil by  co ns ide rin di ff e ren hyperpa ra m et ers,   wh ic wer t un e to  op ti m iz the  resu lt s.   We  f ound  ac cur aci es  rangi ng   from   85 92%  base on  the  hyperp a ram et er  tun ing   a nd  shu ff l ing   of   t he  seq ue nce  of  the  te xt  vect ors.  In   t he  f ut ure,  we  will   i m ple m ent  our  pro po s ed  m od el   at   m uch   la rg e r   scale   with  bette fin e - grai ne datas et s.  W hope  t hat  our  m od el   i niti at es  fu rthe r   stud ie as  well   as  helps  resear chers   in the fi el t c la ssify rand om t ex ts f r om  the w eb  and e xtrac t useful in f or m at ion   from  it .       ACKN OWLE DGE MENTS     This  resea rch   was  sup ported   by  Ba sic   Sci ence  Re searc Pr ogram   through  the  Nati onal   Re search   Foundati on  of  K orea  ( N RF)  f unde by  the  M inist ry  of  S ci ence,  ICT   F uture   Plan ning    (N RF - 20 17 R 1D1 A 3B0403 2905) .   This  pa pe is  re vised  a nd  ex pa nded   ve rsion  of   pa pe e ntit le   “A  Co nvolu ti onal   Neural  Net work   A ppro ac f or   Cl assifi c at ion   of  Text  base on  the  Texts  Coll ect ed  from     the  W eb”  pr e sented  at   “In t ern at io nal  Confere nce  on  Fut ur I nfor m at i on   Com m un ic at ion   E ng i ne erin (I CF ICE) , P at t ay a, Th ai la nd,   and 26  June - 1 July  20 18.       REFERE NCE S   [1]   C.   C.   Aggarwal,   and  C.   Zha i ,   surve y   of  te xt   cl assificat ion  algorithms ,”  In   mi ning  te x data ,   Springer,   Bosto n,   MA ,   pp.   163 - 22 2 ,   2012   [2]   M.R.   Murt y e al .,   Te x Docu m ent   Cla ss ifi cati on  base d - on  Le a st  Square   Support  Vec tor  Mac h i nes  with  Singular  Value   De compos it ion , In te rnati onal  Journal   of   Computer  Appli cat ions vol .   27 ,   pp.   21 - 26 ,   201 1 .   [3]   S.   Aich et   al . ,   A   te xt  m ini ng  appr oac to  id entif y   th relat ionship  bet wee g ai t - Parkinson' dise ase   (PD from   P base rese arc art i cl es ,"   In   Inv e nti v Computin and  Informati cs  ( ICICI ) ,   Inter nati onal  Confer enc on ,   IEEE ,     pp.   481 - 485 ,   20 1 7 .   [4]   A.  Krizh evsk y et   al .,   Im age Net  Cla ss ifica t ion   with  Dee Convolut ional  Neur al   Networks ,”  I Proce edi ngs  o NIPS ,   2012 .   [5]   A.  Grave s e al .,   Speec r ec ogn it ion  wi th  d ee p   r ec urre n n eur al n et works ,   In  Pro ce ed ings o f   ICA SSP 2013 .   [6]   Y.   Kim ,   Convolut ional  n eur al  net works   for   sente n ce   class ifi c at ion ,”   Proceedi ngs  of  th 2014   Confe ren ce  o n   Empiric al  Me th ods  in  Natural  Language  Pro ce ss ing  ( EMNL P) ,   Associat ion   for  Computati onal  li nguisti cs   2014,   pp .   1746 - 1751 .   [7]   Y.   Xiao,   and  K. Cho ,   Eff ic i ent   cha ra cter - le v el   document  cl assi fic a ti on  b y   combining  convol ut i on  and  rec urre n lay ers ,”   arX iv preprint   arX iv :   16 02. 00367 ,   2016.   [8]   A.   Hass an,   and   A.Mahm ood ,   Eff icient   De ep  Le arn ing  Model   for  Te xt  C la ss i fic a ti on  Based  on  Rec urre n an Convolut ional  L a y ers ,”   In   Ma chine  Learning  and  Appl ic a ti ons  ( ICMLA) ,   16th  IEE Int ernati onal   Confe renc on ,   IEE E ,   2017 ,   pp .   1108 - 1113 .   [9]   K.   Yoon,  Conv olut ional  n eur al  net works   for  sen te nc e cl assifi ca t i on ,”   arX iv preprint   arXi v:  1408 . 5882 ,   2014 .   [10]   X.   Zha ng et   al .,   Chara c te r - le ve convo lut i onal   n et works   for  te x c la ss if ic a ti on , ”  In   Ad v ance in   neura inf orm ati on  proc essing  systems p p.   649 - 657 ,   201 5.   Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       Con v olu ti on al  neural  network - base d model f or  we b - based  text  classif ic ation  ( Saty abra t a Ai ch )   5191   [11]   R.   Johns on,   an T.   Zh ang ,   Eff ective  use  o word  orde r   f or  te x c ategori za t ion  with   con volut ional  n eur al   net works ,   arXi preprint   arXi v:   1412. 1058 ,   201 4.   [12]   M.   Hughes   et   a l .,   Medi ca l   te x cl assifi ca t ion  usi ng  convol ut ional  neur al   n et work s ,”   Stud  H eal th  Technol   Inform vol.   235 ,   pp .   246 - 50 ,   2017 .   [13]   A.   Rios,  and  R.   Kavulur u ,   Convolut ional  ne ura net works   for  biomedic al   t ext   cl assifi catio n:  appl icati on  i inde xing  b iomedic a artic le s , ”  In  Proce ed ings  of  the   6 th  AC Confe renc on  Bi oin formatic s,  Computati on al   Bi ology and  H ea lt In formatic s,   ACM ,   2015 pp .   258 - 267 .   [14]   Z.   Zha ng et   a l .,   Te xtua sent iment  anal y s is  via   thre diff ere n attent ion  convol ut iona neur al   ne t work and  cro ss - m odal ity   consist ent   r egr ession , ”  Neurocomputi ng vol .   275 ,   pp .   14 07 - 1415 ,   2018 .   [15]   X.  W ang,   and  H.C.   Kim ,   Te xt  Cat egor i zation   with  Im prove Dee Le arn ing  Methods ,”  Jour nal  of  Information  and  Comm unic a ti on  Con ve rgenc Eng ine ering v ol .   16 ,   pp .   106 - 1 13 ,   2018 .   [16]   S.  Mori y a ,   and  C. Shibata,   Tra n sfer  le arn ing  m e thod  for  ver y   de ep  CNN   for  te xt  cl assificat ion  an m et hods  for  it s   eva lu at ion ,”   In  2018  IEE 42n Annual   Computer  Soft ware  a nd  Appl ic a ti ons   Confe renc ( C OMPSAC) IEEE ,     v ol.   2 ,   pp .   153 - 1 58,   2018 .   [17]   M.   Nii,   et   a l . ,   Nurs ing - ca re  te xt  cl assifi cati on  using  word  vec tor   rep r ese nta ti on   and  con volut ional  neur al   net works ,”   In   20 17  Joi nt  17th  W orld  Congress   o Inte rnationa Fuzzy  Syste ms   Associat ion  and   9th  Inte rnation al   Confe renc on   S oft   Computing   a nd  Intelli g ent Sys te ms   ( I FSA - SCIS) ,   IEE E ,   2017 ,   pp.   1 - 5.   [18]   H.  Li dong,   and  Z. Hui,   new  short  te xt  sentim ent al   class ifi c at ion  m et hod  ba sed  on  m ult i - m i xed  convol ution al   neur al   ne twork ,”   In   2018  IEEE   3rd  Inte rnational   Confe renc e   on  Cloud  Computing  and  Big  Data  An aly si s   ( ICCCBDA ) .   IE EE ,   2018 ,   pp.   93 - 99.   [19]   K. Kow sari e a l .,   Te xt   class ifi c at ion   al gor it hm s: A  surve y ,”   In fo rm ati on , v ol .   10 ,   p p.   150 ,   2019   [20]   Y.   Le Cun e al . ,   Gradi ent - b ase le arn ing  app lied  to  do cument  rec ogni ti on ,”   Pr oce ed ings  of  th e   IEE E ,   vol .   86 ,     pp.   2278 - 2324 ,   1998.   [21]   K.  Fukus hima ,   Neoc ognit ron:  self - orga ni zi n neur al   n et wor m odel   for  m ec hani sm   of  pat t ern   re cogni t io unaf fecte d   b y   sh ift   in  posit ion,”   Bi ological   Cyber net ic s ,   vol .   36 ,   pp.   193 202 ,   19 80.   [22]     S.V.   Georga kopoulos et   al .,   Convolut ional  Neura Networks  for  Toxi Com me nt  Cla ss ifi c at io n ,”  arXiv   pre pri nt   arXiv 1802 . 099 57 , 2018.   [23]   X.   Pan e al .,   compari son  of  neur al  net wo rk  bac kprop aga t ion  al gor it hm for  el e ct r ic i t y   lo ad  fore ca sting ,”     In  Intelli g ent E n ergy   Syst ems ( IWIE S) ,   2013  IE EE   In te rnationa l   Workshop on,   I EE E ,   pp .   22 - 27 , 2013.   [24]   L.   Bo tt ou ,   Online   learni ng  a nd  stocha st ic   a pproximati ons ,   On - li ne   le arni ng  in  n eural  net works ,   vo l. 17 ,     p p.   142 ,   1998 .   [25]   Jaso Brow nlee Gen tl I ntr oductio to  Mi ni - Ba tc Gradient  Desce nt   and   H ow   to  C onfi gure  Ba tc Size ,”  on   D eep  Learnin g 2017,  [ Onli ne],  Av ai la ble:  htt ps:// m a chi ne le arn ingma ster y . com/gen tle - int roduc t ion - m in i - batch - gra di ent - desc ent - conf igur e - batch - siz e/   [ ex tra c te on   14   Au gust  2018 ]       BIOGR AP H I ES   OF  A UTH ORS       Saty abrata  Aic h ,   is  working  as   rese arc h er  in   the   fie ld  of  co m pute engi nee r ing   and  digi tal  hea l thc ar e .   He  h as  publi shed   m an y   rese ar ch  p ap ers  in  journals  a nd  conf er ences  i the  re al m of   m ac hine   learni n g,   t ext   m ini ng,   a nd  suppl y   chain  m ana gement.   Hi rese arc intere sts  ar nat ura l   la nguag proc essing,   m ac hine   l ea r ning ,   suppl y   cha in  m ana g ement,   te xt  m ini ng ,   and  m edi c al   informati cs.         Sab y asachi  Chakraborty ,   is  working  as  m ast er  student   at   In j e   Univer sit y .   He   has  worked  in   m an y   re al   l ife   p roje c relat ed  to   dat m ini ng ,   text  m ini ng.   He  h as  al so  publi she few  pape rs   rel a te to  d at a   ana l y t ic and  bi data.   His  rese arc int er ests  ar na tura l   l anguage  proc essing,   m ac hine   learni n g,   big   da ta,  and   t ext   m ini ng .         Hee - Ch eol   K i m ,   recei ved  h is  BS at   Depa rt m ent   of  Mathem at ic s,  MS at  Depa rtment  of  Com pute Scie n ce   in  SoG ang   Univer sit y   in  Korea ,   and  Ph at   Num eri cal  Anal y s is  and   Com puti ng  Science ,   Stockhol m   Univer sit y   in   Sw ede in   2001.   He  is  Profess or  at   Dep art m ent   o f   Com pute Enginee ring   and  H ea of   the   Inst it ute  of.  Digita Anti - agi ng  H ea l thc ar e ,   Inj Univer sit y   in  Korea .   His  rese ar ch  int er ests  inc l ude  m ac hine   l earni ng,   te x m ining,  and  m edi c al  informati cs.     Evaluation Warning : The document was created with Spire.PDF for Python.