Int ern at i onal  Journ al of Ele ctrical  an d  Co mput er  En gin eeri ng   (IJ E C E)   Vo l.   10 ,  No.   4 A ugus t   2020 ,   pp.  3869 ~ 38 82   IS S N: 20 88 - 8708 DOI: 10 .11 591/ ijece . v10 i 4 . pp3869 - 38 82          3869       Journ al h om e page http: // ij ece.i aesc or e.c om/i nd ex .ph p/IJ ECE   Vertical  intent pr edicti on app roac h based on D oc2vec  and  co n vo lut ional n eu ra l n etworks f or imp rovin g verti ca l  se l ect ion  in agg regated se arch       Sa n ae Achs as,  El  Habib  Nfa ou i   LII AN   La bor at o r y ,   Facu lty   of  Sc ie nc es  Dhar El   Mahra z, Sidi Moham m ed  Ben  Ab del l ah  Univer si t y ,   Moroc co       Art ic le  In f o     ABSTR A CT   Art ic le  history:   Re cei ved   J ul  18 , 2 019   Re vised  Jan  13 ,   20 20   Accepte Fe b 1 , 2 020     Vert ical  sel ec t io is  the   ta sk  o sele cting  the   m ost  rel eva nt  v ert i ca ls  to     give quer y   i orde to  impr ove  the   dive rsit y   and  qualit y   o f   web  sea rch   result s.  Thi ta sk   req uire not  onl y   pre di cting  rel e vant   ver t ic a ls  but  al so  the se   ver tical m ust  b those  the   use expe ct to  be   rel eva n for  his  par ti cular   informati on  need.  Mos exi sting  works  foc used  on  using  tra dit io nal   m ac hin e   le arn ing  techniq ues  to  combine   m ult ipl t y pes   of  feature fo sele c ti ng   seve ral   re le v ant  ver ti c al s.  Alth ough  the se  te c hnique are   ver y   eff ic i ent,   handl ing  v ert i cal  select ion   with  high  accurac y   is   stil ch al l enging  rese ar ch   ta sk.  In  thi pap er,   we  propos a appr oa ch  for  i m proving  ver ti c al   sel ec t io n   in  orde to  sati s f y   th user  ver t i ca in te nt  and  r educ user’s  br ows ing  ti m e   and  eff or ts.  First,  i gen erate q uer y   embedding vec tors  using  t he  doc2v e c   al gorit hm   th at   pre serve s y n tactic  and  sem antic  informat ion  withi e ac h   quer y .   Se condly,  th is  vector  wi ll  be  used   as  inpu to   convol ut i onal   n eur al  net work  m odel   for  inc rea sin the   rep re sen ta ti on  of  the   quer y   wit h     m ult ipl l eve ls  of  abstra ction  in cl uding  ri ch  se m ant ic   informat i on  and  the cre a ti ng  glob al   sum m ari za t io of  the  quer feature s.  W e   demons tra te    the   eff e ct iv ene s of  our  appr o a ch  through   comprehe nsive   exp e rimen ta t ion  using  va rious  d at ase ts.  Our  ex per imental  find i ngs  show   tha our  s y stem  ac hi eve signif icant  ac cur acy .   Fu rthe r,  it  re al i ze ac cur ate  pre d ic t i ons  on  new    unsee da ta.    Ke yw or d s :   Aggregate se arch   Conv olu ti onal   neural  netw ork   Deep l ear ning   Do c 2vec   Inform at ion   ret rieval   Ver ti cal  intent   Ver ti cal  selec ti on     Copyright   ©   202 0   Instit ut o f Ad vanc ed   Engi n ee r ing  and  S cienc e   Al l   rights re serv ed .   Corres pond in Aut h or :   Sanae  Ac hs as,     Dep a rtm ent o f C om pu te Scie nce,   Faculty   of Sciences  Dhar  El Ma hraz,    Sidi Mo ham m ed  Be n Abdell ah Un i ver sit y,    Fez, M orocco.   Em a il : sanae.achsas @u sm ba.a c.m a       1.   INTROD U CTION   On of   t he  m os sig nificant   dev el op m ents  on li ne  i the  la st  few   ye ars   is  the  rising   popula rity   of  aggre gated  sea rch   (AS)  syst em s,  they   pr ese nt  m os popula web   searc prese ntati on  par a dig m   us e by   m ajo sea rch   e ng i nes  in  rece nt  ye ars,   this  te chn i qu c onsist of   integ rati ng   sea rch   res ul ts  fr om   var ie ty   of  div e rse  ver ti ca ls  su c a news,  im ages,  vi de os ,   healt h,  a nd  W i kip e dia  i nto  si ng le   i nter f ace  wit g e ne r al   we search As  s ho wn  in  F ig ur [ 1] researc in  a ggregat ed   searc has  ta ken  tw m ai directi ons.  Th first   directi on  stu dies  differe nt  m e thods  use for  pr e dicti ng   w hich  ve rtic al to  pr ese nt  kn own   as  ver ti cal   sel ect io (V S ),   a no t her   directi on  invol ves  te ch niques   that  analy ses  the  way  of   pr e sentin these  ver ti cal in  the   W e resu lt know as  ver ti cal   presentat io (VP),  the  resea r ch  pro blem   i nv e sti gated  i this  pap e f ocuses    on the  first  one .     Ver ti cal   sel ect ion  ta sk   c onsist of  sel ect ing  subset  of  t he   m os relevan t   ver ti cal to  giv e us er  inf or m at ion   ne ed  a nd  im pr oves  the  sea rc e ff ect ive ness  w hile  re du ci ng  the  loa of  que ryi ng   la r ge  s et   of   m ul ti ple  ver ti cal s.  The  m ai go al   beh i nd   this  ta sk   is  to   help  the  us e r   to  sat isfy  his   inf or m at ion   needs.   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  10 , No 4 A ugus 2020  :   3869   -   3882   3870   Id e ntifyi ng   the   intent  beh in the  us er  quer is  a   cru ci al   ste towa rd   re achin this  go al In   broa sense ,     the  aut om atic  pr e dicti on  of  use inte ntions  helps  i e nh a nc ing   t he  us er  e xp e rience   by  r et u r ning  m or releva nt   resu lt t us ers   an a da pting  these  re su lt t their  s pecific   needs.  T hus,   ve rtic al   sel ect ion   is  as so ci at ed   with   two  m ai chall eng e s that a re:  the d i ver sit of the  ver ti cal s a nd the  unde rsta nd i ng of t he us er in te nt.             Figure  1 .   A ggr egated  searc h process   [ 1]       Re gardin the   first  chall e ng e ,   va riet of   he te rogen e ous  ve rtic al   search   eng i nes  e xist  in  the   we b,   wh ic m eans  t hat  each  ve rtic al   has  it ow featur e s,  f or   e xam ple,  so m e   ver ti cal are  not  direct ly   searchab le   by  us ers  li ke  th weather  ve rtic al thu featu r es  gen e rated  f r om   the  ver ti cal   qu ery - lo will   no be  avail ab le   fo r   this  kin of   ve rtic al s.  Also f eat ur es  ge ne rated  from   ver ti c al   cor pus  will   no be  avail a ble  fo ve rtic al su c as   the  cal culat or   and  la ng uag e   translat ion  [ 2] .   The refo re,  re searche rs   m us t   deal  with  t he   fact  th at   di fferent   ver ti cal s m ay  r equ i re  diff e re nt  f eat ur e  r e pres entat ion s  whe n creat in g new v erti cal  selec ti on  a ppr oach es   The  sec ond  c ha ll eng is  relat ed  to  the  us er  i ntent;  we  know  that  ve rtic al   sel ect ion   syst e m   fo cuses   on  retrie ving  r el evan ver ti ca ls  for  s howi ng  it res ults  to  t he  us er F or  e xam ple,  if  the  us er   searc hes   im ages   and  ne ws   ve rtic al s,  he   s pecif ic al ly   need t he   res ults  of  t he se  ve rtic al s,  he  is n ' interest ed  in   the  c onte nt  of   the  ot her   ve rtic al su c as  s hoppin or   we at her e ve if  t heir  c on te nt  is   releva nt  beca us the   go al   is   to  not   on ly   hav e  r el e van res ults b ut  also satisfy  t he  u se inte nt.     Existi ng  re sea rch  pa pe rs  to   date  ha ve  st ud ie t he  pro blem   of   ve rtic al   sel ect ion   from   diff ere nt     ways  [3] s om e   pr io w ork  f oc us e on  co ns tr ucting  m od el that  aim   a detect ing   queries  with  co ntent - s pecific  ver ti cal   su c as  sho pp i ng   [ 4] ne ws  [ 5] j obs  [ 4]   or  Q uestio A nsw erin [ 6] Ot he w orks   f or   ver ti cal   sel ect ion   [7 - 10]   f ocu se on   us in t rad it io nal  m achine  le arn i ng  te ch niq ue to  c om bin m ulti ple  typ es  of   featur e f or  s el ect ing   se veral   releva nt  ve rtic al s.  Alth ough  these  te c hniq ues  a re  ve r eff ic ie nt,  ha nd li ng   v erti cal  selec ti on w it h hi gh a ccur acy  is  sti ll  a ch al le ngin g r esearch  task .     In   t his  pa pe r,  we  a re  inter est ed  in  te xtua qu e ries;   im age  qu e r ie te nd  to  ha ve  im age  res ults.   Our  pro posed   appr oach  f or  predict in ver ti cal   intent  c ons ist of  ge ne rati ng  que ry  em b edd i ngs  vecto rs   us i ng   do c 2vec  al gor it h m that  can   accuratel pr eserv synta ct ic   and   sem antic   inform at ion   within  eac qu e ry,   therefo re  we  pro pose  t us it   as  pr im ary  query  repres entat ion   in  our   ver ti cal   sel ection   m od el   pipe li ne;    then  it   will   be   us e as  i nput  to  c onvo luti on al   neural   netw ork  (CN N)   m od el   that   can  inc rease   this   represe ntati on   with  m ulti ple  l evels  of  abst ra ct ion   com pr isi ng   rich  sem antic   inform ation   and   c reati ng  global  su m m arization  of   the  query  f eat ur es.  T the   best  of   ou kn ow le dg e this   is  the  first  tim wh e the  be ne fits  of   deep   le a rn i ng   and   par a grap vectors  are  e xp l oited  in  the   con te xt  of   ve rtic al   sel ect ion w hich  ca achiev e     an  am azi ng   progressi on and  dev el op m ent in th is  area.     The  rem ai nd er   of   this  pap e is  structu red   as  fo ll ows.  I the   nex sect ion we  rev ie the  relat ed  wor con ce r ning  ve r ti cal   sel ection .   In   Sect ion   3,   we  pr ov i de  descr i ption  of  our  propose m et ho d.   Sect io is   devoted  to  t he   exp e rim ental  set ti ng s.  W present  an disc us the  ex pe rim ental   resu lt in  Sect ion   5.   F i nally we  c on cl ud e  th e stu dy and  dis cuss  t he fut ur issue.     Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       Vert ic al intent  pr e dicti on   approac h b as e d o n Do c 2vec  and co nvo l utio na neural  network s…  ( Sana e  Ac hsas )   3871   2.   RELATE D  W ORK   Aggregate se arch   ca be  c om par ed  to  fed e rated  searc h,   w hich  ai m to  prov i de  an  inte grat ed  searc acro s m ulti pl te xt  colle ct ion s re ferre to  as  res ource s,  into  one  sing le   rankin l ist   [11] Sim ilar  to   aggre gated  sea rch, f e der at e s earch  is t y pical ly  d ecom po sed  into  tw s ub - t asks: r e source   sel ect ion  a nd   r esults   m erg in g.   The   m a in  dif fer e nce  betwee f eder at e sea rc a nd  a ggre ga te sear ch   is  the  hete roge ne it of    the d at an t he  presentat io n of t he res ults.     Re gardin re source  s el ect ion existi ng   a ppr oa ches  ca be  c at egorized  i nto  two  cl asses   of   al gorithm s:   te rm - based   a nd  sam ple - base d.   For  t he  firs cl ass,  Te rm - base al go rith m rep resen t   sh ar ds  by  c ollec ti on  sta ti sti cs  abo ut  the  te r m in  t he  searc en gin e’s  vo ca bula r y.  Ca ll an  et   a l.  [12]   propose  the  CORI  al gor it h m ,     in  wh ic sha rd   is  re pr ese nted  by  the  num ber   of   it docum ents  that  con ta in  the  t erm of   vo c abu la ry.    The  s ha rd s   are   ra nk e us in t he  INDRI   ve rs ion   of  the    .    sco re   f unct ion  usi ng  the  m entione nu m ber   a s   the  fr e quency  of   eac que ry  te rm CORI  sel ect fixed   nu m ber   of   s ha rd from   the  t op   of   t his  ra nkin g.  Anothe w ork   of  [ 13]   pro poses  Tai ly novel  s hard  s el ect ion   al gori thm   that  m od el s   query ’s   sco re  distrib ution  i n ea ch  s hard as  a  G am m a d ist ribu ti on a nd   sel ect s sh ar ds   with  h ig hly scor e d do c um ents in  the tai of   the  distrib ution Tai ly   est im at es  the  par am et ers  of   sco r distribu ti ons  base on  the  m ean  and   va ri ance  of  the  sco re  f unct ion’   feat ur es  in  the  c ollec ti on a nd   s ha rd s . Co nce rn i ng  th al gorithm of  the  seco nd  cat egory,  they   us a   cent ral  sam ple  ind e (C SI)  of  do c um ents  fr om   each  s hard  for  s hard  sel ect io n.   Fo r   exam ple,  in  [ 14]   auth or pro po s ed  RED DE  al gorithm wh e re  they   rank  sh a r ds   acco rd i ng  to  the  num ber   of   the  highest  rank e do c um ents  that  belo ng  to   this shard,   wei gh te by  the r at io bet ween   t he  s ha rd’s  siz a nd  th siz of  the   sha rd’ s   do c um ents  in  the  CSI T he  SU S HI  al gorit hm   [15]   c hoose   the  best  fitt i ng  f unct ion  f r om   li st  of   possible   functi ons  betw een  the  est i m a te ranks  of  sh ar d’ doc um ents  in  the  CSI  an their  ob s er ved   sc or e fr o   the  init ia search.   Using  this  f un ct io n,   t he  al gorithm   est i m a te the  scores  of  the  to p - ra nk e doc um ents  of   ea c sh ar d.   SUSH sel ect sh ar ds   base on  their  est i m at ed  nu m ber   of   docum ents  am on num ber   of   t op - r ank e do c um ents in  t he glo bal r a nking.     In   the  oth e ha nd,  ide ntifyi ng  the  qu e ry  in te nt  of   us er  is  well - known  pro blem   in  Inform at ion   retrieval  a nd  ha ve  bee stu di ed  by  c onsid erab le   num ber   of  r esearc hers   in  t his  fiel d,  wh e re  it goal   is  to   sel ect   relevan t   do c um ents  or   web   searc re su lt tha can  sat isfy  the  us er  inf or m at ion   need.  For  this  reason ,   m os of   the   a ppr oach es   ci te in   the   li te ratur e   em plo qu ery  lo gs ,   supe rv ise d,  sem i - s up e r vised   cl assifi ers ,   diff e re nt  la ngua ge  m od el a nd  word  em beddin gs .   W e   ha ve   f or   e xam ple  so m popu la r   works  that  e xa m ined  qu e ry  intent  de te ct ion li ke  the  w ork  of  [16]   wh e re  the  auth or hav de velo ped   ne w   dataset   with  alm os 2,000  queries  t agg e i i nform at ion al na vi gational   an tr ansacti onal   cat egories.  They  cal c ulate fe at ur es   f or   each  of  these  qu e ries  us i ng   real - w or l query  lo g.   Jia ng  et   Yang  in  [17] ta ckle  th prob le m   of   qu e r y     intent  infe re nc by  integ rati ng   m ulti ple  inf or m at ion   sources  i se a m le ss  m ann er.  T hey  first  pro po s e     com pr ehensi ve  data  m od el   cal le Search  Qu e ry  Lo S tructu re  (SQL S)   that  re pr es ents  the  rela ti on s hi betwee searc queries  via  the  Use dim ension,  the  URL   di m ension,  th Session   dim ensio n,   a nd   th Ter m   dim ension T he they   pr opose   three  new   f ram ewo rks  tha are  eff ect ive   to  infe que r intents  by  m ining     the  m ulti di m e ns io nal  str uct ur c onstr ucte d   f r om   the  search  query  l og.  A no t her   w ork  in   [ 18]   exp l or es    the  com petence  of   l exical   sta ti sti cs  and   em bed din m eth od.  Fir st,  novel  te rm   exp an sio al gorithm   is   desig ne to  s ke tc al possib le   intent  can did at es.  Mo re over,  a ef fici ent   qu e ry  inte nt  gen e rati on  m od el   is   pro po se d,   w hich  le ar ns   la te nt   rep re sentat io ns   f or  intent  c and i date via  e m bed din g - base m et ho ds a nd  the vecto rized  inte nt  can did at es  a re  cl us te re a nd  detect e as  query  inte nts.  K i m   et   al [19]   us e en riche word  e m bed di ngs  to   force  sem an ti cal ly   si m il ar  or   dissim il ar  word s   to  be  cl os e or  far t her   a w ay   in  the  em bed di ng   sp ace  to  im pr ove  the  perform ance  of  inte nt  detect ion   ta s for  spo ken   la ngua ge  unde rstand i ng,  an th us  by   exp l oiti ng   se ve ral  se m antic  le xicon s,  s uc as  W or dN e t,  PPD (P a r aphra se  Data ba se),   an Ma c m illan  Dict ion a ry,  an us i ng   t hem   la te as  init ia l   representat io of   wor ds   f or  intent  detect ion.  Th us,  they   trai   an  e nd - to - en m od el   that  jointl le arn s   the  sl ot  an i ntent  cl asses   f ro m   the  trai ni ng  data  by  buil ding     bid irect io nal  LSTM  (L ong  Shor t - Term   M e m or y).  I [ 20] the  pr op os e appro ac ai m s   at   identify ing   qu e ry  intent  as  m ul ti - cl ass  cl assificati on   ta sk   w hi ch  extracte query  vect or   re pr ese ntati ons  usi ng   CN ins t ead  of   eng i neer i ng  qu ery  feat ur es T his  m et ho use dee le a rn i ng  to   fin que ry  vect or  re presentat ion s t he us e   them  as f eat ur e s to  cl assify   qu eries by i ntent.     As  we  ca see   in  th re view ed  a ppr oach e above,   the   pro blem   of   que ry  intent  de te ct ion   is  st ud i e without  c onsid erin the  ve rtic al   intent  issue knowin that  with  the   ap pea ran ce   of  a ggre gated  searc h,   va rio us  web  searc en gin es   do  not  re tur un if orm   lists  of  Web  pa ge s,  bu t hey  al s incl ude  re su l ts  of  dif fer e nt   ty pe  from   diff eren ver ti cal su c a i m ages,  news,  vid e os a nd   s on,  w hich  m eans  that  the  ke co m po ne nt  of   this   do m ai is  the  no ti on  of   ve rtic al s.  The refor e an  a ggre gated   search   syst em   m us m ake  pr e dicti on a bout  wh ic ver ti cal (s)  are  m or exp ect e to  a ns we the   issued  query,   wh ic al lo ws   r edu ci ng  the  l oa of   queryi ng   la rg set  o f  m ulti ple v erti cal s,  a nd t hen im pr ov es  the sea rch ef fec ti ven ess.     The  releva nce  of   a   ve rtic al   de pends  basical ly   on  tw fact ors,  t he  rele va nc of  the  doc um ents  within   the  ve rtic al   co ll ect ion   an on  the  us e r’ i nt ent  to  the  vert ic al   (V erti cal   In te nt).   F or  th first  one,  t m ake  Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  10 , No 4 A ugus 2020  :   3869   -   3882   3872   ver ti cal   sel ect i on   decisi on,  va rio us   ap proac hes  us tra diti on al   m achine  le arn in te ch niques  to  co m bin e   diff e re nt  s ourc es  of  e vid e nce   that  ca be  found  i Query  f eat ur es  (fea tur es  de pe nd  only   on  t he  qu e ry)  [ 6 - 9] in  Ver ti cal   fea tures  ( featu res   dep e nd  only   on   t he  ve rtic al [2 5 21 22]   and   i Ve r ti cal - Qu ery  fe at ur es   (f eat ures  ai m   to  m easur relat ion s hip between   t he  ve rtic al   and   the  query,  a nd   a re  therefo re  uniq ue  t   the  ver ti cal - qu ery  pai r)  [2 7 22 - 24] .   I nd ee d,  am on al the se  w orks th ere   are   th os t hat  integrate   the  c on te nt   from   sing le   ver ti cal   [3] In   this  respec t,  Li  et   al [4]   ad dress  the  ge ner al   prob le m   of   ve rtic al   sel ect ion   us i ng   an  a ppr oach  th at   fo c us es   on  sh op ping  a nd  job  ve rtic al to   extract  im plici feedback   usi ng   sem i - su pervise le arn in ba sed   on   cl ic kthr ough   data.  Diaz  [ 5]   inv est igate al so   the  ve rtic al   sel ect ion   prob le m   with  resp ect   t the  new ver t ic al wh ere  he   der ive feat ur es  f r om   ne ws  colle ct ion,   web   an ve r ti cal   qu ery - lo gs   an inco rpor at e cl ic k - fee dbac int the  m od el More  rece nt  w ork  in  [ 6]   has  al so   ta rg et ed  va riant  of   the v e rtic al  sel ect ion   pro bl e m wh e re  the   auth or   us C omm un it Qu est ion   An s we r ing   (CQ A)   V e rtic al fo det ect ing   qu e ries  with C QA intent.     Othe a ppr oac hes  ha ve  bee de velo pe where  se ver al   ve r ti cal are  co nsi der e sim ultan eo us ly   [3] Arguel lo et al [7]   propose  a  c la ssific at ion - ba sed  a ppr oach f or   ve rtic al  selec ti on  in  which  they  exploit  f e at ur es   from   the  ve rtic al   co ntent,  t he   query  strin g,  an t he  ver ti c al ’s  qu e ry  lo g.  The   cl ic k - t hroug data  is  use t const ru ct   a   des cripti ve  la ngua ge  m od el   f or  e ach  ver ti cal ’s  r el at ed  queries.   Diaz  an Arg ue ll [ 9]   al so   present  sever al   al gorit hm fo com bin in us e fee dback  with  offli ne  cl assifi er  in form ation the  fo c us   of  their  work   was  to m axi m i ze user  sati sfac ti on  b pr ese nt ing  the a ppr opr ia te  v erti cal  d isplay . Ano t her   work   from  A rguell et   al   [8]   ha ve  be en  pro po se wh e re  t he  go al   was   to  us e   trai ning  data  ass oc ia te with   set   of  e xisti ng  ve r ti cals   in  or der  to  le a rn  m od el   tha can  m ake  ve rtic al   sel ect ion  predict io ns   f or  ta rg et   ve rt ic al Re cent  w ork   in   the  sam con te xt  was  propos ed  f ro m   [10] i w hich  the  de sired  ver ti cal   of   t he  us e is  placed  on   th top   of   the w e b res ult pag e . T his is a chieve d by pre dicti ng   ve rtic al s b ase d o the   us er ’  s  p ast  b e h avi or.     Re gardin the   seco nd   facto r there  a re  few   w orks  a ddressi ng  the  ve rtic al   intent  issue  wh e stud yi ng  qu e ry   intent  detect io n.   F r om   the  use intent  pe rspect ive,  us e ve rtic al   intent  al so   play an  im po rta nt  ro le   i the   im pr ov em ent  of  the  a ggre ga te s ear ch   proces s.  For  e xam ple,  Zh ou  et   al [ 25]   pro po s e     m e tho dol og y   to  pr e dict  the  ver ti cal   intent   of  qu e ry  usi ng  searc e ngine  lo by  e xploit ing   cl ic k - th r ough   data.  Re cent  w ork  of  Ts ur   et   al [6]   present  su pe rv ise cl assifi cat ion   sc hem wh er th ey   aim  at   dete ct ing  qu e ries  with  quest io intent  as  var ia nt  of  the  ver ti cal   sel ect ion   pro blem They  intr oduc ed  two  cl assif ic at io schem es  that  c on si der   qu e ry  structu re.  I th first  approac h,   they   induce  featur e from   t he  query  str uctur as   an  in pu t s uper vised   li near  cl assifi cat ion .   In   t he  sec ond  ap proac h,   w ord  cl us te rs  a nd   t heir  posit ion s   in     the  query  are   us ed  as  in pu to  ran dom   fo r est   cl assifi er  to  ide ntify  discrim inati v structu ral  el e m ents     in the q uer y.     Desp it it interest ing   r ole,  the  re sea rch   i this  directi on  is  sti ll   lim ited,   a nd   t her is  no   huge   li te ratur re gardin ve rtic al   sel ect ion   base on   us e ve rtic al   intent,  especi al ly   with  the  evo l ution   sho w in  I R   (Infor m at ion   Re trie val)  duri ng  the  la st  ye ars.   The refor e we   will   fo cus  in  t his   w ork  on  th prob le m   of   ve rtic al   intent  predict io n,   wh e re  we  propose  new   a ppr oach   t hat  com bin es  the  do c2v ec  al gorith m s   and   co nvol ution a l   neural  net works  an ex plo it for  the  first  ti m the  ben e fits  of   both  te ch niques  in  orde to  im pr ove  ve rtic al   sel ect io ta s k.         3.   PROP OSE D APP ROAC H   Thro ugh  t he  ve rtic al   sel ect ion   process,   the  qu e ry  is  proce ssed  a nd  se nt  to  m ulti ple  ver t ic al as  well   as  the  We s earch   en gin e ,   in  orde to   decide   w hich   of  th os s houl be   sel ect ed   f or   giv e qu e ry,     this  dep e nds  on  w hat  are  t he  ver ti cal inten ded   to  be  retrie ved   by  the  us er we  ref e to  th is  as  the  us er  ve rtic al  intent ( VI) a nd  it  can be  def i ne as  foll ows:     Give us er ’s   query  ( )   and  s et   of   ca ndidate   ver ti cal =   { 1 , 2 , , } the  ver ti cal   intent    is  represe nted   by  the  vecto =   { 1 , 2 , , } ,   w her each   va lue    ind ic at es   the  im po rtanc of  the   gi ve ver ti cal     to  the  qu e ry  an for   each  ve rtic al   giv e a   th reshold  a bove  w hi ch  the  ve rtic al   is  assum ed   to h a ve  a  h i gh  intent f or the  query: i >     the n w e can sa y t hat t he verti cal     is i nten ded b y t he qu e ry  .   To  ad dress  thi pro blem we  propose  a a ppr oach   base on   Doc2 vec  and   C onvoluti on al   Neural   Netw orks.   Fir s t,  it   gen erates  qu ery  em bed di ng ve ct or   us ing   the  do c 2vec   al go rithm   that  pr eser ves  synt act ic   and   sem antic   i nfor m at ion   within  each  qu e ry.  Seco nd ly thi vector   will   be   us ed  as  inpu to  Con vo l ut ion al   Neural  Netw ork  m od el   for  increasi ng   t he  represe ntati on   of   the  query  with  m ulti ple  le vels  of   a bs tr act ion  includi ng  ric sem antic   i nf orm at ion   an the cr eat ing  glo bal  su m m ariz at ion   of  the  qu ery  featu res.  Fi gure  sh ows  the  overall   arch it ect ur of   ou propose ve rtic al   sel ect ion   sy stem It  con ta ins  two  m ai par ts ,     the  sem antic   rep rese ntati on  of   t he  query  a nd  the  query  l evel  feat ur e xt racti on .   S ub se ct ion bello descr i be   these tw o parts  and all  p e rfo r m ed  ste ps  i n d epth.         Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       Vert ic al intent  pr e dicti on   approac h b as e d o n Do c 2vec  and co nvo l utio na neural  network s…  ( Sana e  Ac hsas )   3873       Figure  2 .  Archi te ct ur of   t he p rop os ed  v e rtic al  selec ti on  syst e m       3.1.    Semantic   repr esent at i on   of the quer y   The  c or al go r it h m   of   this  st ep  is  doc 2v ec  wh ic is  an  unsupe rv ise m od el   that  is  use m os to   const ru ct   distri bu te re pr e sen ta ti on of  ar bitraril long  se nt ences.  It  is  a extensi on   of   word2 vec  that  le arn s   fix e d - le ng t f eat ur represe ntati on f or   va riable - le ng t pieces  of  te xts  su c as  se ntences pa ra grap hs ,     and  doc um ent [26] Doc2v ec   or  par a gr a ph  vect or s   has  t wo   dif f eren a rch it ect ur es:   T he  Dis tribu t e   Ba g - of - Word s   m od el   and   t he   Distribu te Mem or m od el The  Distrib ut ed  Ba g - of - Wo r ds   ( DBO W)  m od el   trai ns   f ast er  a nd  do es   not  c onsider  w ord  ord er;  it   pr e dicts  a   rand om   gr ou of  w ords   in  par a gr a ph  base on  the  pro vid e pa ragrap vecto r.   I the  Distri bu te Me m or (D M)  m od el the  par a grap is  treat ed  as  an  extra   word,  wh ic is  then  a ve rag e with   the  loc al   relevan w ord  vecto rs  for  m aking   pr e dic ti on s.  This  m et hod,  howe ver, ac qu i res  a dd it io nal c al culat ion   but  can ac hieve  b e tt er r es ults tha n DBO W.     We  c hose  Doc2V ec   m od el   because   it   ov erco m es  the  di sadv a ntages   of  the   ot her  ba g - of - w ords   m od el by  le ar ning  sem antic   relat ion s hip s   be tween  w ords,  this  is  wh it   has  bee wide ly   us ed   rece nt ly   in  var i ou s   NL t asks  [27 - 29]   a nd  I nfor m at ion   Re trie val  w or ks   [30 - 35]   wh e re  it   ha pro ve that  it   is  able  to   captu re  the   se m antic of   pa r agr a phs  wh ic le ads  to   excel le nt  res ults.   I this  ste p,  the  goal   is  to  le a rn  good  sem antic  rep re sentat ion  o th inp ut  query, foll ow i ng   that  idea;   we  trie to  represe nt  each  query  as  vect or   an us e this   vect or  as  featu res   f or   our   cl ass ific at ion   m od e as  prese nted   in  Fig ur 2.  Ther e f or e,   Doc2v ec   al gorithm  co ntribute s effect iv el y fo r  im pr ov i ng the  pe rfor m ance  of our sy s tem .       3.2.    Query   le vel  fe at u re e xt r act i on   Un li ke   tra diti onal   a ppro ac he that  require   handc raf te fe at ur es   to  predi ct   releva nt  vert ic al s,  our   appr oach   c onsist of   us in Conv olu ti ona Neural  Net wor to  e xtract  th m os i m po rta nt  sem antic   featur es   that  rep re sent  each  query  an delet tho se  that  are  unnec essary.   Re cent ly CNNs  ha ve   achieved  pro m isi ng   perform ances  in  va rio us   NL ta sk s s uc as  I nfor m at ion  Extracti on  [ 36] S umm ariza ti on   [37] Ma chine   Transl at ion   [ 38] Cl assifi cat i on   [39] Q uestion   Answe rin [40]   and   oth e tradit i on al   N L ta sk [ 41 - 43] CN N   arch it ect ure  use in  this  pa per is sh own  in Fi gure  3.    -   Inp ut  L ayer:   F irst  of  al l,  once   the  query  em bed di ngs  vecto r are   ge ne rated   from   the  pr e vio us  ste p,  we  use   them   to  con str uct  the  i nput  m at rix  nee ded  in  the  em bedding  la ye w he re   each  query  is  bein represe nt ed   as a  2 - dim ensi on al  m at rix.     -   Con v olu ti on al layer:   The   pri m ar purpose  o f   this  la ye r   is t ca ptu re   the   s ynta ct ic   and  se m antic   featur e of  the  entire  que r and   co m pr e ss   these  val ua ble  sem antic into  featu re  m aps.   T hus,  w e   perform   sever al  conv olu ti ons  ov e the  em bed de que ry  vecto rs  us i ng  m ulti ple  filt e rs  with  diff e r e nt  wind ow   s iz e.    As  t he  filt er  m ov es  on,  va r iou s   feat ur es   are  pro du ce and  c om bin ed   into   featu r m ap.   Acti va ti on   functi ons a re a dd e t inc orp or at e ele m ent - wise  non - li nea rity .     Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  10 , No 4 A ugus 2020  :   3869   -   3882   3874   -   Po oling   la yer:   In   this  la ye r,   the  goal   is  to  extract  the  m os relevan fea tur es  within  e ach  feat ur m ap ,   therefo re,  we  us the  m ax - poolin strat e gy  fo t he  pooli ng   op e rati on.  Since  there  a r m ulti ple  feat ure   m aps,   we  ha ve   vecto after   each  po olin oper ation All  ve ct or that  a re  ob ta ine from   the  m ax - poolin la ye are c onca te nate i nto  a  fi xed - le ngth  fea ture vect or.     -   Fully   co nn ect e layers :   these   la ye rs  const it ute  the  cl assifi cat ion   pa rt  of  our  m od el their  m a in  pur po s is   to  us high - le ve featur es   obta ined  fr om   t he  previ ou la ye r and   passe t he m   to  the  final  s of tm ax  la ye f or   c la ssifyi ng  t he i nput que ry int o vari ou s  class es b ase d o it ver ti cal  intents  scores.     In   a dd it io to  these  dif fer e nt  la ye rs,   there  ar e   so m op tim iz a ti on that  we  ha ve  pe rfor m ed  in  order   t reduce  the  overf it ti ng   a nd   obta in  bette te st  accuracy.  T hese  opti m iz ation incl ud a pp ly in an  l2  norm   const raint  of  the  wei gh vect or in  t he  co nvol utions  an fu ll connecte la ye rs  as  we ll   as  add in sever al   Ba tc N or m alizat ion   la ye rs,  that  norm al ize  the  act ivati ons  of   t he  pr e vious  la ye for  each   batc duri ng   trai ning,   w hich  h el ps t o t rain   our  m od el  f a ste a nd conse quently  i m pr ove  our  m od el ’s  p e rfor m ance.             Figure  3 .  I ll us t rati on of the  C NN m od el  arc hitec ture   4.   E X PERI MEN TS   This  sect io de scribes  th da ta set us ed  a nd   t he  va rio us  hyperpa ram eter ch os e f or  evaluati ng     the p e rfo rm ance of  our  syst em , it al so   giv es  det ai ls about ho the  doc 2v ec   and CN N were  traine d.       4.1.     Datasets   In   th ese  ex pe r i m ents,  we  em plo th ree  pu bl ic   dataset fo r   the  trai ning,  validat io an te sti ng   our   pro po se syst e m   resp ect ively su m m ary  s ta ti sti of   these  dataset is  li ste in  Ta ble  1.   We  de scrib each   dataset  in deta il  b el ow:     Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       Vert ic al intent  pr e dicti on   approac h b as e d o n Do c 2vec  and co nvo l utio na neural  network s…  ( Sana e  Ac hsas )   3875   In   the  fi rst  da ta set we  us the  offici al   NTCIR - 12   IMi ne - ver ti cal   i ntent  colle ct ion  fo E ngli sh   Subto pics  [ 44 ]   wh ic was  de sign e to  e xplore  a nd  eval ua te   the  te chnolo gies  of  underst and i ng   us e in te nt s   beh i nd  the  qu e ry.  IMI NE - in cl ud es  set   of  100  to pics  (i.e.   qu e ries) Eac top ic   is  la bele by  s et   of  in te nts  with  prob a bili ti es,  an the re  i set   of  s ub t opic as  releva nc judgm ent  for  each   ve rtic al   intent.  s ub t opic   of  giv e que ry  is  viewe as   search  i nt ent  that  sp eci al iz es  and /o disam big uates   the  ori gin al   qu e ry,    the  num ber   of   these  subto pics   is  53 3.  The  ge ner al   idea  is  to   first  gen e rate  m or com plete   rep rese ntati on   of   the  diff e re nt  possible  intents  associat ed  wit the  input  qu ery,  an then  t pe rfor m   ver ti cal   sel ection   f or   eac intent se par at el y.    In   a dd it io n,   thi dataset   inclu des  fi ve  ty pes  of   qu e ries,  na m el “a m b iguou s ”,  “facet e d” “ver cl ear” “t a sk - or ie nted” a nd  “ve rtic al - ori ented” t his   al lows  us   t i nv e sti gate  the   perform ances  of  ou syst em   with   div e rse qu e ries  and  var ie to pi cs. Th e  d et ai ls  of the  f ive  que ry ty pes  a re as fo ll ows  [ 44 ] :   a.   Am big uous : T he  c on ce pts/o bject beh i nd th e query a re am biguous  ( e. g., " Jag uar - > ca r,   anim a l, etc .) .   b.   Facet ed:  The  inf or m at ion   nee ds   be hind  the  qu e ry  inclu de  m any  facets  or   aspects  (e.g.,  “harry   po tt er”  - m ov ie , b oo k,   W i kip e dia,  etc. ).   c.   Ver cl ear:  T he  in form ation  need   be hind  the  query  is  ve ry  cl ear  so   t hat  usual ly   sing le   rele va nt  do c um ent can sat isfy his in f orm ation   needs.  (e. g. ,  “ap ple.c om  h o m epag e”)   d.   Task - ori ented:   The  sea rch   i nt ent  be hind  th qu e ry  relat es   the  searc her’s   go al   (e. g. “l os weig ht”  - exer ci se,  h e al thy f ood, m edici ne,  etc. ).   e.   Ve rtic al - ori ent ed:  The  searc intent  beh i nd   t he  query  stron gly  ind ic at es  sp eci fic  ve rtic al   (e.g .,  “i P hone   photo   - >  I m a ge verti cal ).   We  use   this  dataset   as  trai ning  data  fro m   wh ic we  const ru ct   va li dation  set   by  sel ect ing     10%  rand om ly.   The  sec ond  da ta se us ed  in  this  pa per   is  Fe dW e b’1 [ 45 ]   that  is  us ed  in  the  TREC   FedWeb   track  2014,  t he   colle ct ion   c onta ins  sea rch  r esult  pa ges  fro m   10 we se arch   e ngines  ( e.g .   G oogle,  Y ahoo !,  YouT ube  an W i kip e dia) F or   eac e ng i ne 75  te st  top ic wer pro vide d,   from   wh ic 50  will   be  use f or   ver ti cal   sel ect ion   e valuati ons .   W co nduct  a   pr e dicti on   ta s f or   t hese  50  te st  qu eries  a nd  com par the  resu lt   ob ta ine d wit h t he real  v al ues  i the  d at aset .     The  la st  datase is  TREC   2009  Mi ll ion   Q ue r Track   [46] t his  colle ct ion  c on ta in 40 000  qu e ries  that  wer sam pled  from   two  la rg e   qu e ry  log s T hel an onym iz and   sel ect   qu e rie with  re la ti vely   hig volum e,   they   wer e   pr oc essed  by  a filt er  that  c onve rted  them   into  qu eries  with   r oughly   eq ual  f requ ency  in  t hir qu e ry  log .   T his  datas et   is  us e a tr ai nin data  f or  doc2 vec   al gor it h m   to  im pr ove  it perf or m ance  with  la rge  data .     More ov e r,   the  diff e re nt  qu e ri es  us ed  i thes exp e rim ents  hav dif fer e nt  le ng th s,  f ro m   sh ort   to  lo ng   queries   as sho wn in Fi gures 4,   5 an d 6. The  str ucture o f our m od el   al lows   us  t le arn b oth ki nd s .         Table  1 Stat ist ic al   inform at io o f  v a rio us   da ta set s   Dataset   Descripti o n   Size ( n u m b e o f  qu eries)   Max Qu er y   Leng th   (nu m b e o f  word s)   Task   NTCIR - 1 2  I MI NE - Eng lish  Sub to p ic  Minin g   [ 4 4 ]   It  co n tain s th e Que ry  un d erstand in g  su b task   an d  the Vertica l  I n co rpo rating  su b tas k .   533   12   9 0 % Tr ain in g   1 0 Valid atio n   Fed W eb ’14   [ 4 5 ]   It  is d esig n ed  to re so u rce  selectio n r esu lts  m e rgin g   an d  vertic al selectio n   task s.   50   9   Testin g   TREC  Million  Query  Tr ack 2 0 0 9   [ 4 6 ]   It  is an  exp lo ration  of  ad h o c r etrieval  ov er  large set of  qu eries  and  a  large  co llect io n  o d o cu m en ts, and  it  i n v estig ates q u estions  of   syste m   ev alu atio n .   4 0 0 0 0   16   d o c2 v ec'  trainin g  data             Figure  4 .  Quer y l eng th  for N TCIR - 12 I Mi ne - 2     Figure  5 .  Quer y l eng th  for Fe dW e b’1 4   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  10 , No 4 A ugus 2020  :   3869   -   3882   3876       Figure  6 .  Quer y l eng th  for T REC   m il l ion   query trac 2009       4.2.     H yp er parameter an d   tra ini n g   Firstl y,  in  order  to  t rain   and  e valuate   our   pr opos e syst em we   nee t a dj us se ver al   hype rp a ram et e rs.   I nd ee d,  re ga rd i ng  the  first   pa rt  of  ou r   arc hitec ture,  to   use   doc2 vec   f or  our  dataset s,  w first   trai ned   do c 2ve m od el   (P yt ho ge ns im   li br ar i m ple m entat i on)  on  TREC   2009  Mi ll ion   Qu e ry  Trac da ta set s   us in Distrib uted  Me m or m od el .   Th en  we   trans form ed  al the  queries  on  both  t rainin a nd   te sti n s et t Do c 2Vec  vector s . T he vari ous p a ram et ers  us ed fo trai ning  doc2vec m od e l are s how in   Table  2.     In  the   seco nd   pa rt,  t he  im ple m entat ion   of   our   netw ork   is  m ade  us i ng  Ker a fr am ewor with   Tens orFlo ba ckend. Fo the   input l ay er,  w e  u se Ge ns im ' s   do c 2vec em bed di ngs and c re at ed  in pu data  fro m   it instea of  usi ng  ke ras  em bed di ng  la ye r.   T bu il ou CN a rch it ect ure  there  a re  m any  hype r par am eter t choose  from .   Ther e fore,  we  first  c onsider  the  pe rfo rm ance  of   b asel ine  CN N   config ur at io us in g   the p a ram et ers  descr i bed in  T able 3.         Table  2 Dif fere nt  pa ram et ers  u se t trai D oc2Vec  m od el   Para m eters   alp h a   m in _ alp h a   m in _ co u n t   Vector size   Nu m b e o f  epo ch s   Librar y  us ed   Valu e   0 .02 5   0 .00 2 5   1   300   100   Gen si m       Table  3 Param et ers  o t he  bas el ine  CN c onfig ur at io n   f ilter  regio n   sizes   Featu re  m a p s   l2   regu larization   Drop o u rate   Batch   size   o p ti m iz er   Activ atio n   f u n ctio n   p o o lin g   Los s f u n ctio n   Nu m b e o f  epo ch s   [3 - 5]   100   0 .01   0 .5   64   ad a m   ReLU   m a x   p o o lin g   Mean sq u ared  err o r   100       The n,   we  e valuated  t he  ef fec of   eac of   t he   oth e par am e te rs  by  ho l ding   al oth er  set ti ng c on sta nt   and   var only   the  facto of  interest D ur i ng   t hese  ex per im ents,  we  c ho se  t us Re L act ivati on   f un ct i on   a nd  m ax - po oling   strat egy  f or  our   CNN  m od el   w it m ean  sq uared  er r or   l os functi on,  these   pa ram et ers  are  m os tly  us e in   CN a rch it ect ures  a nd  giv es   go od  pe rfor m ances.  F inall y,  we  c ombine al the   good  va riat ion   r esults   ob ta ine d from  these e xp e rim e nts,  a nd  us ed  them  f or   our   sugg e ste C NN  m od el .         5.   RESU LT S  AND DI SCUS S ION   In   this  sect io n,  we  pr e sent  an disc us ou exp e rim ental   re su lt ob ta i ned   by  each  pa rt  of   our  ve rtic al   sel ect ion  syst e m .       5.1.    Se ma nt i represe n tati on   of the q uer usin D oc2v ec   Starti ng  with   the  first  par of  ou propose syst em on c doc2 vec  m od el   is  trai ne d,  we  us it   t gen e rate  an  e m bed din vect or   f or  each  query  in  ou colle ct ion (trai set   and   validat ion   set   te st  set ).    These  em beddi ng  vect or s   m us captu re  sem antic   m eanin gs  of  eac of  the se  queries In  this  re sp ect ,   to  m ake  su re  t hat  this  m od el   achieve this  go al we   us e our  doc2 vec  m od el   to  f ind   the  m os sim il ar  qu eries  f or   t wo  sam ple  qu eries  in  ou dataset ,   the  resu lt ing  queries,  a nd   c orrespo nd i ng   sc ores  are  present ed  i Table  4.  As  we   can  see  in  this  ta ble,  the  sim il arity  scor es  between   the  first  qu e ries  and   the  sec ond  on es  are  sig ni ficant.     We  fig ur ou t   that  this  do c2v ec  m od el   is  m eaning f ul  m od el   and   c an  su ccess f ully   reco gniz sem antic   inf or m at ion  a m on que ries.     Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       Vert ic al intent  pr e dicti on   approac h b as e d o n Do c 2vec  and co nvo l utio na neural  network s…  ( Sana e  Ac hsas )   3877   Ta ble  4 Sim il a rity   scor e   f or two sam ple q ue ries  f ro m   o ur c ollec ti on s   First qu ery   Seco n d  qu ery   Their si m ilarit y  s c o re   Moth er’ s D ay  gif ts sh o p p in g  site   W allp ap er  co m p u ter   0 .24 3 7 0 5 6 6 0 6 6 2 6 3 7 6 3   Make re su m e on li n e f ree   Make re su m e f ree   te m p lates   0 .90 9 2 4 9 9 4 4 7 3 0 9 5 6 9   Ap p le latest news  p rod u cts   h o m e  cleanin g  pro d u cts   0 .85 4 6 9 0 2 9 4 8 5 6 9 0 2 6   b an an as seed s p lan t   b an an as seed  ins id e   0 .99 7 9 9 6 8 0 7 0 9 8 3 8 8 7   Virgin ia tou ris m   Ir aq  wa p ictu res   0 .14 6 3 2 5 7 6 4 9 6 4 2 1 6 3   wallp ap er  m ag azin e   Asian  cultu re   0 .29 1 0 7 1 2 8 8 4 5 1 4 8 0 6 7       5.2.    Query   le vel  fe at u re e xt r act i on   using   CNN   As  w ha ve  e va luate the qua li ty   of   the  quer vector s obtai ned   i the p re vi ou s p art,   we  procee now   to the e valuati on of  our  m od e l archite ct ure.  First o al l,  we st art b y asses sing t he  im pact o f va rio us   par a m et ers  us e in  ord e t c onfig ur e  ou CN m od el  a nd obtai t he b est  possible  res ults.       5.2.1.  I mp act  of  filter si z es   We  ex plore the  ef fect  of  va rio us   filt er  siz es,  w hile  kee pi ng   the  num ber   of  filt ers  for  each  re gion   siz fixe at   100.   Fi gure  s hows   that  th p lot  for  t he  filt er  siz of  [ 2 - 4]   was   at   the   to of  al the   ot he plo ts  thr oughout  the   r un,  a nd  it   yi el ded   bette r   acc ur acy   (69.9 4% c om par ed  t filt er  siz es  [ 3 - 5]  an [ 4 - 6]  ( 66. 39%  and 67. 22%  re sp ect ively as  re ported  in  T abl 5.             Figure  7 .  A cc uracy  co m par iso n of fil te siz var ia ti ons       Table  5 . Acc uracy  co m par iso n of fil te siz var ia ti ons   Filter  sizes   [2 - 4]   [3 - 5]   [4 - 6]   Accurac y   6 9 .94 %   6 6 .39 %   6 7 .22 %       5.2.2.  I mp act  o fe ature m aps   The  var ia ti ons  of   t he  nu m ber   of   filt ers  per   filt er  siz es  do n’ help  m uch   as   s how in   Fig ur e   8,  but  sti ll   there a re a  f e w  noti ceable  acc ur acy   res ults w hen the  num ber   of   filt ers  is  200 ( 68. 48 % as  shown i Ta bl e 6 .       5.2.3.  I mp act  of  r eg ulariz at i on   We  ha ve  us e two  com m on   regulariz at ion  strat egies  for  our  CN N,   that   are  dropo ut  and   l2  norm   const raints.  W e ex plo r e the e ff ect   of  t hese t wo strate gies  he re. we  pr ese nt ed  the  ef fect o f  the l2 n or m  im po sed  on   t he  weig ht  vecto rs  in  Fig ure  an Ta ble  7.   We  the e xperim ented  wit va ryi ng  the  dro pout  rate  fro m   0. 1   to  0.5  a s hown  in  in   Fig ure  10  a nd  Ta ble  8,  fi xing  t he  l2  norm   con st raint  to   0. 01.   T he  var ia t ion i regulariz at io sh ow  t hat  f or   the  l2  norm   con st raint,  t he  cl assifi cat ion   perform ance  i higher   with   va lue=0   wh ic pro du ce   best  resu lt co m par ed  to  hig he values  that  of te hurts  pe r form ance  as  sh own  in  F ig ur an Table 7.  Se pa r at el y, we  con si der e the ef fec t of  d r opout rat e. Fig ure 1 in dicat e that wh e set ti ng  the dr opout   rate  to   0.2   it   gi ves  t he  best  ac cur acy   res ults  (69.7 3%)  an t his  value   dec re ase  w he we  i ncr ease   the   dr opout  rate as  repor te in  Ta ble 8.       5.2.4.  I mp act  of batch  siz e   We  nex i nv e sti gated  the   ef fe ct   of  the  Ba tc siz e.  Fi gure  11  a nd  Ta ble  sh ow  t hat  var y ing   t he  batch   si ze al so   helps   li ttle, an the  best  accur a cy  r e su lt  obtai ne d w as 67. 01%  with a  batch  size  of v al ue 60.       Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  10 , No 4 A ugus 2020  :   3869   -   3882   3878         Figure  8 .  I m pact o f  the  num ber   of   filt ers per  f il te siz e         Figure  9 .  A cc uracy  co m par iso n wit var i ou s   var ia ti ons  of l2  nor m  co ns t raint   Table  6 . Im pact  of the  num ber  of   filt ers  pe r fil te siz e   Nu m b e o f  f ilters   Accurac y  ( %)   N=5 0   6 6 .39 %   N=1 0 0   6 6 .81 %   N=1 3 0   6 5 .97 %   N=1 5 0   6 6 .60 %   N=2 0 0   6 8 .48 %       Table  7 . Acc uracy  co m par iso n wit h vari ou s   var ia ti ons  of l2  nor m  co ns t raint   l2  no r m  con strain v alu e   Accurac y   0   7 5 .37 %   0 .01   6 5 .97 %   0 .1   6 5 .14 %   0 .25   6 5 .34 %   0 .4   6 4 .93 %           Figure  10 . Acc ur acy  c om par ison wit h va rio us  var ia ti ons  of  dr opout rate         Figure  11 . Acc ur acy  c om par ison wit h va rio us batc siz es     Table  8 . Acc uracy  co m par iso n wit h vari ou s   var ia ti ons  of dr opout rate   Drop o u t r ate   Accurac y   0 .1   6 7 .64 %   0 .2   6 9 .73 %   0 .3   6 7 .43 %   0 .4   6 5 .97 %   0 .5   6 5 .34 %     Table  9 . Acc uracy   com par iso n   with  var i ou s  bat ch  siz es   Batch si zes   A ccura cy   30   6 5 .34 %   60   6 7 .01 %   120   6 4 .72 %   240   6 6 .64 %         5.2.5.  I mp act  of  optimi z ers   Re gardin the  op ti m iz ers,   we   can  see  cl ea rly   fr om   Figure   12  that  on ly   the  c urves  of   adam ”  an “adad el ta ”  optim iz ers  wer at   the  top Th us they   pro duce  best  accu r acy   resu lt (66.81%  and   65.97%)  com par ed  t sg d”   ( 56. 16 % )   as  sho wn  in  Table  10.   Ne xt we  e xp l oited  the  obser vat ion giv e a bove   to   config ur e   our   CNN  m od el   w it the  be st  va r ia ti on of  par a m et ers.   W s um m arize  the  su ggest e pa ra m et ers  in  Table  11.    Evaluation Warning : The document was created with Spire.PDF for Python.