Int ern at i onal  Journ al of Ele ctrical  an d  Co mput er  En gin eeri ng   (IJ E C E)   Vo l.   9 , No .   5 Octo ber   201 9 , pp.  3642 ~ 36 48   IS S N:  20 88 - 8708 DOI: 10 .11 591/ ijece . v 9 i 5 . pp3642 - 36 48           3642       Journ al h om e page http: // ia es core .c om/ journa ls /i ndex. ph p/IJECE   Sp ee ch t o text  conversion  and su mm ar i zation for  eff ective  un derstandi ng and docum entation       Vinn ara s A . ,  D eep a V .   Jos e   Depa rtment  o C om pute Scie n ce,  CHRIS (De e m ed  to  b Unive rsit y ) ,   Ind ia       Art ic le  In f o     ABSTR A CT    Art ic le  history:   Re cei ved   J a n   17 , 2 01 9   Re vised  A pr   1 ,  201 9   Accepte Apr   1 0 , 20 19       Speec h,   is  th m ost  powerful   wa y   of   comm unic a ti on  wi th  w hic hum an   bei ngs  expr ess  the ir  thought and  fe el in gs  th rough  diffe r ent  la nguag es.   The   f ea tur es  of   spee ch   diffe rs  with  each  la ngu age .   How eve r,  eve whi le  comm unic at ing  in  the   sam la n guage ,   the   pa ce  and  the   di al e ct  var ie wit h   ea ch  p erson.   Th is  cre a te difficu lty   in  under st an ding  the   conv e yed  m essage   for  som peopl e.   Som et imes  l engt h y   sp eeche s   are   a lso  quit e   diffi cult  to   foll ow due   to  r eas ons such  as  diffe ren pronun ci a tion,  pace  and  so  on.   Speec h   rec ogni ti on  whi ch  is  an  int e di scipl inar y   f ield  of  computat ion a li nguisti cs  ai ds  in   dev el o ping  t ec hnolog i es  tha empow ers  the   rec ognit ion  and   tra nsla ti on  of  spee ch  in to  te xt .   Te xt  sum m ari za t ion  ext ra ct the   utmos important   infor m at ion  from   sour ce   which   is  te xt  an provide s   the   ad equate   su m m ary   of   th sa m e.   The re se arch work  pre sent e in  th is pa per   desc ribe an   ea s y   and  eff ec t ive   m et hod  for   spee ch  rec ogn it ion .   The   spee ch  is   conve rt ed  to  the  cor responding  t ext   and  produ ces   summ ari ze t e xt.   Th is  has   var ious  appl icat i ons  li ke  le ct ur note cre a ti on,   s um m ari zi ng  ca talogues  for  le ngth y   do cume nts  and  so  on.   Ext ensiv exp er imenta ti on   is  pe rform ed  t val id at e   th ef ficien c y   of the  p rop osed  m et hod.   Ke yw or d s :   Feat ur e  ex tr act ion   Natu ral  la ngua ge pr ocessi ng   Natu ral  la ngua ge  to olk it   Sp eec h reco gnit ion     Text s umm ariz at ion   Copyright   ©   201 9   Instit ut o f Ad vanc ed   Engi n ee r ing  and  S cienc e   Al l   rights  reserv ed .   Corres pond in Aut h or :   Vinnaras u A .   Dep a rtm ent o f C om pu te Scie nce,   CHRIST  (Dee m ed  to  be Un i ver sit y),     Be ng al uru,   Ka rn at a ka,   India .   Em a il : vinn ara su .a @cs.c hr ist un i ver sit y.i n       1.   INTROD U CTION   Sp eec is  the  m os i m po rtan par of   com m un ic at ion   be tween  hum an  bein gs T houg there  are  diff e re nt  m ea ns   to   e xpress   our  t houg hts  an feeli ng,   sp eec is  c onside red  as  t he  m ai m edu im   fo r   com m un ic at ion S peec rec ogniti on   is  the   process  of  m akin m achi ne  rec ognize  the  sp eec of  diffre nt  people  base on  ce rtai w ords   or  phrase s.  Va riat ion s   in  the  pro nunc ia ti on   are   qu it eviden i each  ind ivi du al ’s  s pe ech.  T he  or ig inal  form   of   th sp eec is  sign al a nd   si gn al   is  pr ocess ed  su c th at   al the  inf or m at ion   present  in  the  sign al   is  conve rted  in  to  the  te xt  fo rm at The  featur ext rac ti on   is  the  pro cess  of   ta kin sig nal   an c onver ti ng  it   to  t he  re qu ired  form at   wit certai lo gic.   Eve th ough  s peech  is  the  ea sie st   way  of  c omm un ic at io n,   t here  exist  s om pr oble m with  sp eech   rec ognit ion   li ke   the  flu ency,  pro nunci at ion ,   bro ken   wor ds,  stutt erin issues  et c.  All  these  ha ve  to  be  a ddre s sed  w hile  pr ocessin s peech.   Text  s umm arizat ion   is  on of  the  m ajo c on c epts  use i th fiel of   docu m entat ion Le ngthy  do c um ents  are   diff ic ult  to  read   an unde rs ta nd   as  it   con su m es  lot  of   tim e.  Text  s u m m arisat ion   so lves  this  pr ob le m   by pr ov i ding a  sh ort ene d sum m ary of  it   with  sem antic s.   In   the  pro pos ed  w ork  co m bin at ion   of   sp eec to  te xt   conversi on  and   te xt  su m m arisat ion   is   i m ple m ented.   This  hy br i m e thod  will   ai a pp li cat io ns   tha require  bri ef  su m m ary  of   le ng t hy  sp eec hes   wh ic is  quit us e fu l   f or   docum entat ion The   fl ow  diag ram   of   the  pr opos e a ppr oach  is  m e ntion e i Fig ure   1,   in  w hich   the  s peech  rec ognit ion   a nd  te xt  s um m arization   is   giv e as   tw diff e re nt  m od ul es.  The   com bin at ion   Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       Sp eec t te xt   con ve rsio n and  summariz atio fo r eff ect iv e u nderst anding  and d ocume ntat ion   ( Vin nara s A )   3643   of   the se  tw m odules  ai ds   a ny   app li cat ion   i w hich  s umm arizat ion   is  re quire d.   T he  first   and   forem os ste to  work   with  NL (N at ur al   La ngua ge  P ro ces sing)  is  to  e xtr act   the  featu re from   the  sp eech  w hich  has   so m values If   word   or  sentenc is  reco gn iz e as  m eaning le ss,  then  it   becom es  an  ob sta cl to  su m m ariz at io process E ve the  punct uation  play a   vital   ro le   in  su m m arization  as  sem antic is  im po rtant   w hile  su m m arisi ng  the text.           Figure  1. S pee ch reco gnit ion   and text s umm arisat ion   proce ss f lo w       2.   R EL ATED  W ORKS   Sp eec to  te xt  conver si on   fi nd a pp li cat io ns   in  var i ous  scenari os A eff ect ive  m et h od   to  gai flue ncy  in  En glish  la ngua ge   that  enh ance s   the  us er' way  of   sp eec th rou gh   co rrec tn ess  of   pr onunc ia ti on   fo ll owin the  En glish  ph on e ti cs  was  dev el op e by  J os et   al .   [1 ] com par at ive  an al ysi m entionin the   ben e fits  an de m erit of   the  va rio us   siz es  of   vo ca bula ry  s pe ech  rec ogniti on  syst em was  done  by  Siva kum ar  et   al [2 ] .   This   w ork  dem on s trat ed  the   r ole  of   la ngua ge  m od el   i im pr ov ing   t he  acc ur a cy   of   sp eec t te xt  conve rsion  with  diff e re nt sce nar i os   with  no i ses and  bro ke n w ords.     Yogita   et   al [3 ]   pr ese nted  a   m ulti l ing ual  s peech - to  te xt  conve rsion  sys tem   us ing   Me l - Fr e quency   Ce ps tral   Coe ffi ci ent  (MFCC )   featu re  e xtracti on   te c hn i qu e   and  Mi nim u m   Dista nce  Cl ass ifie r,   S upport  Vecto r   Ma chine  ( SVM m e tho ds  f or  sp eec cl assi ficat ion I [ 4]  m od el   to  c onver natu ral  Be ng al la ng uag e   to  te xt   was  pro po s ed   wh ic us e open  s ource  fr am ewor S phin 4.   A uthors  cl ai m   an  aver a ge  of  71.7 %   accu ra cy   for  their  ap p r oach  in  the  te ste dataset Eng l ish  te xt  su m marisat ion   ba se on  associat ion   sem antic   ru le is  pro po se by  Wan   [ 5]. Accor ding  to  the  aut hor  the  ne ex tract ion   schem pr ove to  ha ve  bette co nverg e nce   and   pr eci si on  per f orm ance  in  the  extra ct ion   proce ss.   LDA   is  the   m os acce pted  al gorithm   for  te xt  cl assifi cat ion   base on  pa rtic ular  t op ic .   An  im pr ov em ent  of  t he  sam is  pro pose in  novel  sim il arity   com pu ta ti on  m et hod.   Saiy ed  an Sa j j a   [ 6]  ga ve  a br ie f   intr od uction  to  t he  cat egories  of  su m m arization  te chn i qu e highli gh ti ng   t he ir  ad va ntages   an dra wb ac ks This  w ork giv e insi ghts  to  the  resea rch e rs  for  sel e ct ing  sp eci fic  m et ho ds   based  on  th ei re qu irem ent.  The  se ntenc sel ect ion   pro cess  m od el le as  m ulti - ob je ct iv e   op ti m iz ation   pro blem   was  de scribe in   [ 7].  The  a uthor use hu m an  le ar ning  op ti m iz ati on  al gorithm   fo t his   pur po se I [ 8]   feature   extra ct ion   base on  ne ur al   netw orks   was  propose wh ic the  a uthors  cl ai m   to  be  m or e   eff ect ive  com par ed  to  the  onli ne  extracti ve  opti ons.  Vythel i ngum   et  al .[ 9]  had   propo se a   te chn iq ue  for  error   detect ion   of  gr aph em to - phonem con ver si on   in  te xt - to - s peech   sy nth esi s.  Accor ding  to  them   their  appr oach  gav e   bette e rror   c orrecti on  r at wh ic can   ai the  hu m an  annotat or.  F r om   the  li te rature  that  was  rev i ewed   it   was  quit evid ent  the  require m ent  of   sp eec to  te xt  con ve r sion   as  well   as   the  su m m ariz at ion   of  the  sam is  a   necessit y an d h ence this  resea rch   w ork.   Zen ke rt at el . [10 ]  i ntr oduce a c r os s - dim ensional  text su m m ar iz at ion   wh ic us e th con ce pt  of  dim ension al   sel ect ion   an d   fi lt ering T he  m et hod  was  e xp erim ented  us in the  resu lt of  Mult idi m ension al   knowle dge  re presentat ion   database.  te xt  an al yz er  was  devel op e by  De va sen a   and  Hem al at ha   [ 11 ]   w hich  wa us e to  i den ti fy  the  struct ur e   of  the   te xt  give as   in pu t. Th aut hors  cl ai m the  pro po se syst e m   was  able  to  giv the  res ults  eff ect ively   w hi ch  ha us e th autom at ic   te xt  cat ego risat io an te xt  su m m arisat ion   The re  ex ist diff ere nt  te xt  su m m arisati on   te ch niques . detai le ov e r view  of  the  sa m i s   pro po se i n[1 2]  b y R ahim i et   al . A   sim il ar s tud was d one  by D al al  a nd  Ma li al so   [13 ]   m od ifie a ppr oach  of  K   Nea rest  Neighb or  f or  ac hieving   te xt  su m m arization  was   do ne   by  J o   [ 14] .   The  a utho f oc us se m or on  the   reli abi li ty   aspect.  A   Viet nam ese  la nguag e   base te xt   su m m arization  ap proac with  th ree  sta ges   us i ng  grap hs  was   pro po se by  Tra a nd  Nguyen   in  [15].   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  9 , N o.   5 Oct ober   201 9   :   3 6 4 2   -   3 6 4 8   3644   The  a uthor cl aim that  the  pro po se a ppr oach  wa able   to  gathe m or m eaning f ul  te xt  rele van t native   sp ea ker s Vim al aksh et   al .   [ 16 ]   pro vid e a   m e tho to  s um m arize  the  vi deo  so  as  to   sa m tim and   s pace  a s   well   as  helps  i a rch i ving.  A ov e r view  of  te xt  s umm arisat ion   fo c us si ng  m or on  the   te chn i qu e to   av oid  redu nd a ncy  wa done  in  [ 17] Ma tsub ay as hi  et   al .   [1 8]  pro pose syst e m   for  effe ct ive  te xt  retrieval  ba s ed  on   the  qu ery.  T he   auth or us e autom at ic   te xt  su m m arisat ion   ap proac f or  the  sam e.   The  rest  of   t he  pa per   is   orga nised  as  f ollows.  Sect io giv es  the  detai ls  of   the  pro po se m odel Sect ion   m entions   the  r esults  ob ta ine d f ollo wed b y C oncl usi on s  and  Fu t ure sc op e  in  Sec ti on   5.       3.   PROP OSE D MO DEL   3.1.    Ex peri ment al setup   The  s peec from   the  source   is  rec orde usi ng  m ic ro phone  a nd  the   featur e   is  e xtr act ed  in  te xt  form at   us ing  Goo gle  A ppli cat ion   Progr a m m ing   I nter face  ( AP I ).   Ho we ver,  the   te xt  extracte us i ng   the  Goo gle  AP does  not  inclu de  per i od   (. at   the  end   of   the  se ntence This  ca le ad  to  con f us io in   the  te rm inati o of  the  sta te m ents.  In   orde to  av oid   this ,   in  the  pro pos ed  ap proac custom   cod ha bee wr it te to  pro vid per i od   after  pa us of   2e+ µs  or   m or e.   T his  m akes   the  se nte nce  cl eare an it   is   pre - pr ocesse to  ad per i od  ( . an qu est io m ark   ( ? ) I order   t proce ed  with  the  c once pt  of  ad ding  a p eri od   to  the  ext racted  te xt,  2e+6   µ has  been   c on sidere as  the  m ini m u m   pau se  tim e.  If   there   is  pau se  f or  m ore   than  t he  sai ti m e also,  the  syst e m  w il l wait  f or th e  user i nput due t o vali da ti on .   Since  pe rio pl ay vital   ro le   in  the  c om pl et ion   of   se nt ence,  ne se ntence  will   be  sta rted  with   the  co nce pt  of   co njuncti on  in  the   ab sence   of   pe rio d.   This   pro blem   is  el i m inate in  th e   pro posed   m od el   by   the  us of   te m porar sto rag e .   Ther ef ore,  w he nev e there  is   pau se,  the  pe rio will   be  add e to  the  te xt   and   will   be  te m porar il sto red  in  t he  te m po ra ry  va riable.   I f   the  ne xt  se ntence  be gin s   w it c onjun ct i on,  t he   te m po rar var i able  will   be  cl eared  a nd   the  se ntence  will   be  app e nded  t previo us   sente nc us in co njun ct ion .   Conver sel to  the  conj un ct io n,   if  the  senten ce  beg ins  with  su bject   then  the  tem po ra ry  va riable  value  is   us e and   t he  pe rio will   be  app e nd ed  to  the   se ntence.  Wh - quest i on a re  ex pect ed  to  en wit qu est io m a rk( ? ) Hen ce w he ne ver   the  se nte nc beg i ns   with  t he  w h - sta tem e nt,  the  te m po ra ry  var ia ble  will   ho ld  ( ? on   pause  of   2e+6   or  m or e I case  the  ne xt  sente nce  be gins  wi th  the  quest io ta sta te m e n then  t he  va lue  in   the  te m po rar var ia ble  will   not  be   use d.  If   t he  se ntence   be gin s   with   ne s ubj ect   t hen  qu e sti on  m ark   will   be   app e n ded to t he  end  of the se ntence.   The  pro posed  m et ho su m m arizes  the  extr act ed  te xt  accor ding  to  the  r ank   of   the  sen te nces  wh ic can  be  determ i ned  th rou gh  th fr e quency   of   occ ur e nce  of  words.  The   se ntence  t okeniz an wor to ken iz e   te chn iq ues  fro m   the  pack a ge of   python  N LTK  are  us e to  fin the  f r equ e ny  of  w ords.   Wh e the  te xt  is   extracte f ro m   the  in put  us in Goo gle  A PI,   the   se ntence and  w ords   in  t he  te xt   are  obta ined  us i ng  se ntence   tok e nize  and   word   to ke nize  resp ect ively T he  input  giv e by  the  us er  as  sp eech  will   be   conver te to  sign al .   And  the  si gn al will   be  conve rted  to  te xt  f or m at   in  colla bo r at ion   with  t he  Goo gle  API.  I orde to  proc ess  the   gen e rated   te xt  with  the   pr opose m od el w ord   to ken iz a nd  se ntence   to ke nize  is  us ed The  c om plete   set   of  sentence  is  gi ven   as  in puts   to  the  senten ce  tok e nize,  ever sente nce   is  separ at ed  with  the  occ urre nce     of   t he  dot.  A ll   the  se ntenc es  are  gi ven   as  inputs  to  t he  w ord  to ke ni ze,  each  w ord  is  se par at e wit h   the o cc urence   of the s pace.   Wh e te xt  w it pro per   for m at   is  us ed  f or  su m m arisi ng it   is  le ss  co m plex  to  process  a it   is  in  the   exact  form at   a nd   is  oft en  pr eci se  and   cl ear.  But   this  is  no the  case  w hen   s peech   i ta ken   as  the   inp ut.   Her the  s peec has  to  be  c onve rted  to  te xt   and   the it   sh ou l be  su m m arized.  T he  pr ob le m to  be  t ackled   her are  t he  oc currence   of  repea te w ords bro ke w ords di ff ere nt  diale ct   an syn onym s   us e d   to   co nve the   m essage  et c.  T her e fore,  t overco m su ch  pro blem s,  the  w ords  with  le ss  i m po rtance   is  el i m inate d.   F or  this ,   m ini m u m   an m axi m u m   ran ge   is  set   f or  the  occ urren ce   of  any  sp eci fic   w ord.  E ven  th ough  th se nte nce  a nd   word f re qu e nc y are  us ed , to f ind  t he  im po rta nt se ntence i t he whole  c on te nt,  ra nk i ng m od el  is  appli ed.    Finall y,  after  the  wor ds   are   tok enize d,   th fr eq ue ncy  of  eve ry  w ord   is  cal culat ed  by  the  by   the  su m m ariza ti on   al gorithm   in  pro po se m od el T he  wei ght  of   the  se ntence  is  found  w it the  con si de rati on  of  the  fr e que nc of  w ords The  i nd e is  ranke acc ordi ng  to   the  wei gh of  the   se nt ence  a nd  wit th e   identific at ion  of  the   in de x,   t he   sente nce  is   sum m arized.  Pyt hon  nlar gest  f unct ion  is  us e t rank  t he  s ent ence  base on   the  weig ht  of   th sentence The  te xt  will   be  su m m arized  based   on  the  weigh of  the  sent ences.   The flo c har of im ple m entation   proce dure  of the  pro pose m od el  is as  s how in   F ig ure   2.     Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       Sp eec t te xt   con ve rsio n and  summariz atio fo r eff ect iv e u nderst anding  and d ocume ntat ion   ( Vin nara s A )   3645       Figure  2. Flo w  ch a rt of the  pr opos e m od el .       3. 2   Pr oposed  p roce dure   The  al gorithm   for   the  pr opos e m et ho is  g i ven b el ow.    Step  −  ST A RT   Step  −  declar e m ic ro ph on e   as a s ource   Step  −  declar e thr ee  li sts au dio Re c orded, t extForm at Of Re cord,  tem pr oa ryLi st   Step  --   w hile  sente nce!  =   e xi t exit   aud i oReco rd e d = l ist en( s ourc e)   extracte dT ext  = rec ognize_ google (a udioRe corde d)     If   ( pau se  &&  next se ntence  of  ex tract e dTe xt  sta rts w it h su bj ect )   sentence=” .”+s entence   el se if( pau se  & & n e xt se ntenc e of e xtractedT ext starts  with  conj un ct io n)   sentence=” ,”+s entence   end whil e   [Th e  whil e lo o is e xited  with  text “exit  e xit”]     Step  −  declar e w e bSpoke a s f il e   webSp oken= se ntence   Step  6− decl ar e two l ist s sen t ences,  words   Step  -   se nten ces=se nt_ t ok e nizer(we bspok en)   words = word_t ok e nize(se nte nc es)   com pu te _frequ encies( wor ds )       Step    init al iz e m inCut=0. 1 an m axCut=0.9   If   w ord fre que ncy>m axCut an d f reque ncy<m inCut   rem ov e the  w ord     Wh il e   rankin g i nd e x !  ( s or te d)    rankin g= nlarge st(Sorte d l ist  of se ntence )     Step    P rint t he  se ntence  in t he  or der   of r a nk i ng   Step  10    ST O P       4.   RESU LT S   The  rec orde s peech   ca be  c onve rted  to  te xt   with  the  help  of   Goo gle  AP I It  is  diff ic ult  to  separa te   the  te xt  i nto  s entence   w hich   is  ge ne rated   us in G oogle  AP I beca us the  e xtrated   te xt  do es   no ha ve  a   per i od(.).  T m ake  the  sent ences  disti nct,   in  the  propo s ed  m od el p eri od   is  a ppe nd e at   the  e nd   of   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  9 , N o.   5 Oct ober   201 9   :   3 6 4 2   -   3 6 4 8   3646   the  se ntence   wh e t her e   is  pa us e.   I t he   sente nce  is  a   w h - se nte nce,  quest io m ark( ? )   is  a pp e nded   to   the  en of  the   sente nce.  Thi m akes  it   easi er  to  t ok e nize   the  se ntence s,   as  python  st ring  to ken iz at io us e s   per i od   to  di ff e ren ti at senten ces.  If   the  sen te nce  has  pa us an if  it  beg ins  a no t he r   sentence  with  the   conj un ct io n,   com m a(,)   is  app e nded  t the  en of   the   sentence Thi m akes  it   easi er  to  to ken i ze  th e   sentences as  py tho strin to ken iz at io us e pe ri od   t differentia te   sente nces.  T he  pro pose m od el   co ns ide rs  the  punct uatio ns   ( ‘. ‘,’  an ? in  the  re cognized  te xt.   The  pro posed   m od el   recogni ti on   is  faster  wh e com par ed  to   the  basic  m od el   (sen te nces  w it ho ut  ‘.’,  ‘,   a nd  ? recog ni t ion T he  basi m od el   su m marizes   the  rec ognized  text  with ou a ny   pr e - proce ssing.  But  in   the p r opos e a ppr oach,  pre - proc essing  is use t ad a   per i od(.)  at   th en of  eac se ntence   to   ind ic at t he  te rm inati on   of  se ntence.   In  pyth on  se nt ence   tok e nizat ion,  sentences  ar t okenize base on   the  pr ese nc of   pe rio d.   T hough  the re  ar m any  pu nctu at ion  m ark that  ca be  i nclu ded  in  se nten ce,  t he  f oc us   i th pro posed   m od el   is  only   on  per i od  an quest io m ark Ta ble  show the   ti m ta ken   to   r ecognize   se nte nces  with  a nd   with ou pe rio a nd  quest io m ark   resp ect ively . B ased on  the r ec ognizti on  ti m e,  w e can  say  that the sen te ces wh ic inclu des  p erio an qu est ion  m ark  are  r ec og nized fast er  tha the  se ntences  w it hout it .       Table  1.  Rec og niti on  ti m e fo r   sentence  w it and w it ho ut (.)  a nd  ( ? )   Reco g n ized  sen ten ce   Reco g n itio n  ti m e f o sen ten ce  with o u t app en d i n g  ( .)  or  (? (in µs )   Reco g n itio n  ti m e f o sen ten ce  ap p en d in g  ( .)  or  ( ? (in µs )   Techn o lo g y  so lv es  pro b le m s an d  in t u rn cre ates p rob le m s   3 6 0 9 9 6   1 8 3 9 8 1   Stan d ards   are  alwa y o u o f   state  th at  is  wh at  m ak es  th e m   stan d ard   9 8 2 5 5   4 5 2 1 0 7   The  g reate st  en e m y   o f   k n o wled g is  no ig n o rance  it  is th illu sio n  o f  kn o wle d g e   2 4 0 1 7 8   1 1 0 3 6 7   W e   h av to   sto p   o p ti m izin g   f o p r o g ra m m e rs  an d   st art   o p ti m izin g  f o u ser s   3 9 6 6 5 8   7 8 1 3 4   Low lev el  p rog ra m m in g  is  no t that ea sy  f o b eg in n ers   6 6 1 4 1   1 0 8 3 2 6       The  gra ph   for  t i m ta ken   to  re cognize  se nten ces  with  an w it ho ut  per i od(.)   is  as  sh ow in   F ig ure   3.   The  gr a ph  is pl otted f or num ber  o f   sente nces   agai ns the   ti m ta ken   t re cognize  se nten ces  that  a re  m e ntion e in  T able  1.  Th blu li ne  sym bo li zes  reco gnit ion   ti m fo te xt  without  pe rio rec ogniti on  an the  or a nge  li ne   sta nd f or   recogn it io with  pe ri od.  T he  rec ogniti on   ti m i com pu te as   the  dif fer e nce   as  the  en ti m an sta rt  tim of   t he   rec ogniti on  proces s.  T he   ti m li br ary  in   py tho is  us e t record   ti m e.  The  dif fer e nce   tim e   can  be  c om pu te d usin g (1).       (1)     The  ti m ta ken   by  the  ge nsim   l ibrar an the  pro posed   m et ho to  s um m arize  te xt  is  sh ow in     T able  2.   For  va li dating  the  te xt  su m m arisat i on,  data  w as  gi ven   as  c on ti nuous  s peech,  do c um ents  of   f ifte en   pag e s,  an var i ou we bs it es  f or   e valuati ng  the  pe rfor m an c e.  Acc ordin to  the  data  in  th T able,  the  propose   m et ho c om par it ively   ta kes  le sser  ti m fo r   su m m arization   of   t he  sam e   num ber   of  li nes  as  c om pared  t Gen sim  li br ary .           Figure  3. Com par is on of s pee ch reco gnit ion   with  do t a nd  w it ho ut  dot     Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       Sp eec t te xt   con ve rsio n and  summariz atio fo r eff ect iv e u nderst anding  and d ocume ntat ion   ( Vin nara s A )   3647   Table  2.   Su m m arizat ion  ti m us in g Ge ns im  l ibrar y a nd  pro po s ed  m et ho d   Nu m b e o f  lines   Su m m a rized  lin es   Su m m a rization  ti m e  f o Gen si m  libra ry (in  µs )   Su m m a rization  ti m e  f o p rop o sed   m eth o d  ( in  µs )   10   1   1 6 3 6 8 0   6190   5   1   2336   1886   8   1   3675   3640   5   1   8 7 3 8 8 7   3279   6   1   5576   3279       Com par ing   to   the  Gen sim   su m m arization,  pro po se al gorith m   con sum es  le ss  t i m e   to  produce   the  re su lt I Gen sim   su m m arizat ion ,   th ou gh  do c um ent  is  ve ry  big ,   re s ult  of  t he  al gorithm   wo ul be   l ine   m os tly.  Pr opose al gorithm   can  su m m ari ze  the  whole   do c um ent  int nu m ber   of   li nes  by  the  us e requirem ent. T he fre qu e ncy  of wo rd s  are  com pu te us i ng (2) w hich  is use to   ra nk the  se ntences .       (2)     By   app ly ing   t his   f or m ula,  th fr e qu e ncy  of   the  sin gle  w ord  ca b f ound.  F r om   her the  in dex   of   the  se ntence   c an  be  f ound  by   the  rankin m et ho d.  I Fig ure   4,  blu e   li ne   sta nds  f or  th ge ns im   li br ary  an d   the  or a nge  li ne   sta nd for  the  pro po se a ppr oach.  Th x - ax is  sh ows  the  num ber   of   li nes  giv e as  in pu that  is  sh ow i the   T able  an y - a xis  s hows  t he  t i m ta ken T he   tim con s um e a nd  pe rfo rm ance  of  the  pro po s ed   appr oach is co ns ist ent  for dif fer e nt in pu t s.           Figure  4. Com par is on of s umm arizat ion  tim e f or   ge ns im  lib ra ry an d p rop os e m et ho d       5.   CONCL US I O N   Sp eec rec ogni ti on   an te xt  s umm arizat ion   are  tw va st  ar eas  to  be   ex plored Th pro po sed  re sear c work   ai m to  reduce  the  ti m and   ef fort   of   m anu al   docum entat ion   o le ngt hy  spe eches  in  a even t.   Sp eec rec ogni ti on   an te xt  s umm arizat ion   can  ease  the  w ork  of   do c um entat ion .   Eve f or   t he  ve rificat ion   of  the  su m m arize co ntent,  t he  syst e m   can  be  autom at ed  to  r ead  out  the  s um m arised  con t ent  with  th he lp  o te xt  to  s peec conve rsion.   As   of  now,  s pee ch  s umm arization   f or  sente nc es  te rm inati ng   with  a   f ull  s top   or  con ta ini ng  s m al pau se  s how by  c omm is  ex pe rim en te d.   T he   f uture   w ork  is   to   i nc lud e   al punct uation  m ark in  the  r ecognize s pe ech  w hich  hel ps   in  im pr ov in the  te xt  su m m arizat ion   perform ance.  This   m od el   can  be   us e w her e ve there   is  requirem ent  of  su m m arisi ng   le ngt hy  le ct ur es  int pr eci se  docum ents  as  the  autom at ed  syst e m   will   conve r the  s peec to   te xt  a nd  al so  su m m arise  the  co ntent.   It  ca be   of  great   he lp  f or   stud e nts to  arc hiv e lec t ur no te s f r om  classe s,  c onfer e nces  or sem inars .             Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  9 , N o.   5 Oct ober   201 9   :   3 6 4 2   -   3 6 4 8   3648   REFERE NCE S     [1]   Jos V,  Alfa te Mus ta fa,   Sha ran   R,   " Novel  Model  for  Spe ec to  T ext   Con ver sion ,"   Inte rn ati onal  R eferee d   Journal   of   Engi n ee ring a nd   Sc ie n ce   ( IRJES) , v ol   3,   no .   1 ,   2014 .   [2]   K.  M.  Shivakumar,   V.  V.  Jain  an P.  K.  Pri y a ,   " stud y   on  impact   of  la ngu age   m odel   in  improvin the   accurac y   o f   spee ch  to  t ext   conve rsion  s y st em,"  2017  Inte rnational   Confe r enc on  Comm unic ati on  and  S ignal   Proce ss in ( ICCSP ) ,   Chenn ai pp.   1148 - 115 1 2017 .   [3]   Y.  H.  Ghada ge   and  S.  D.  Shelke ,   "S pee ch  to  te xt  conv ersion  for  m ult il ingual   la nguage s , 2016  Inte rnationa l   Confe renc on   C omm unic ati on  a nd  Signal P roc e ss ing  ( ICCSP) ,   Melmaruva thur pp.   0236 - 0240 2016 .   [4]   Um ar  Nasib  Ab dull ah ,   Kab ir  H um a y un,   Ahm e Ruhan,   Uddin   Jia. ,   " Real  Ti m Speec to   Te xt  Conversio n   Te chn ique   for  Benga li  L anguage , 2018   Int ernati onal  Con fe r enc e   on  Compu te r,  Comm unic a ti on,   Chemic a l ,   Mate rial   and  E l ec troni Eng inee ring ( IC4ME2) pp.   1 - 4 2018 .   [5]   L.   W an ,   "Ex tracti on  Algo rit hm   of  Eng li sh  T e xt  Sum m ari za tion  for  Eng li sh   Teac hing , 20 18  Inte rnati ona l   Confe renc on   I nte lligent Tr anspor tat ion, B ig   D ata  &   S mar Cit ( ICITBS) ,   Xiamen,   China ,   201 8 ,   pp .   307 - 310 .   [6]   Sai y ed  S . ,   Sajja  P S . " Revi ew  on  te xt  sum m ar iz ation  eva lu at io m et hods , "   Ind ian  Journal  of  Computer  Sci en ce  and  Engi n ee ring v ol .   8 ,   n o .   4 ,   pp .   497 ,   2017 .   [7]   R.   Alguliy ev ,   R.   Aligul i y ev  and  N.  Isaz ade,  "A   sente nc sele c tion  m odel   and  H LO  al gorit hm   for  ext racti ve  t ext  summ ari za t ion, "   2016  IEE 10t Inte rnational   Confe renc on  Appl ic a ti on  of  I nformation  and  Comm unic ati o n   Technol ogi es  ( AICT) ,   Baku ,   pp .   1 - 4 ,   2016 .   [8]   Jain   D.  Bha ti and  M.  K.  Thakur,  "Extr ac t ive  Te xt  Sum m ari za t ion  Us ing  W ord  Vec tor  E m beddi ng, 201 7   Inte rnational   Co nfe renc on   Mac hine   Learning   a nd  Data  Sc ie n ce  ( ML DS ) ,   Noida pp.   51 - 55 2017 .   [9]   K.  V y th elingum ,   Y.  Estè ve   and  O.  Rosee,  "Erro det e ction  of  gr aphe m e - to - phon eme  conve rsion   in  te x t - to - spe ec h   s y nthe sis  using  spee ch  signal   an le xical  context , 2017  IEE A utomati Spe ec h   Re cognition  an Unders tandi ng  Workshop ( ASR U) ,   Okinawa pp .   692 - 697 2017 .   [10]   J.  Ze nker t,   A.  Kl ahol and  M.  Fa thi ,   "Towards Extra c ti ve Te xt  S um m ari za ti on  U sing Mult idi m en sional   Know le dg e   Repre sent at ion , 2018  IEE In t ernati onal  Conf ere nce   on  El e ctr o/Inf orm ati on  Technol ogy  ( E I T) ,   Roche ster,   MI ,   pp.   0826 - 0831 2018 .   [11]   C.   La kshm Deva sena   and  M.  He m al at ha ,   "A utomati Te x cate g oriz a ti on  and  sum m ari za ti on  usi ng  rule   red uctio n, IEE E - In te rnatio nal  Confe renc e   on  Adv ance s   in  Engi nee rin g,   Sci en ce   and   Manage ment  ( ICAE SM  - 2012) ,   Naga patt ina m ,   T amil  Nadu pp .   5 94 - 598 2012 .   [12]   S.  R.   R ahi m i,   A .   T .   Mozhde h a nd  M.  Abdolah i,  "A over vie on  ext r ac t ive   te x sum m ari za ti on , 2017  IEEE  4 th   Inte rnational   Co nfe renc on   Kno wle dge - Based E ngine ering   and  I nnovat ion   ( KBE I) ,   Te hra n pp .   00 54 - 0062 2017 .   [13]   V.  Dala l   and  L .   Mali k ,   "A   Surve y   of  Extrac tive  and  Abs tract ive   T ext   Sum ma rizati on  Techni ques, 2013  6 th   Inte rnational   Co nfe renc on   Eme rging Trends i Engi ne ering  and   Technol og y ,   Na gpur,   pp .   109 - 11 0 2013 .   [14]   T.   Jo,  "K   nea re st  nei ghbor  for  te xt  sum m ari za t ion  usi ng  fea tur sim il ari t y , 20 17  Inte rnational   Confe renc on   Comm unic ati on,   Control, Computi ng  and   Elec tronic s E ng ine ering   ( ICCCCEE ) ,   Khart oum pp .   1 - 5 2017 .   [15]   T.   Tr an  and  D .   T.   Ngu y en ,   "Te x Gene ra ti on  fro m   Abs tra ct   Sem ant i Repre s ent a ti on  for  Sum m ari zi ng  Vi et names e   Para gra phs  Hav ing  Co - ref er ences,"  2018  5th  NAF OST ED  Confe renc on  Inf orm ati on  and  Computer  Sci en ce   ( NICS ) ,   Ho Chi   Minh,  Vie tna m pp.   93 - 98 2018 .   [16]   A.  Vim al aksha ,   S.  Vina y ,   A.  Pre kash  and  N.  S.  Kum ar,   "A utomate Sum m ari za ti o of  Le ct ur Vid eos, 2018  IEE E   Tenth  Int ernati o nal  Conf ere nce  on  Technol og y f or E ducation  ( T4E) ,   Chennai,   In dia pp.   126 - 129 2018 .   [17]   S.  Biswas,  R.   Raut ra y ,   R.   Dash and R.   Dash,  "Te xt  Summ ari za t io n:  A Re vie w,"  2018  2nd  Inte rnational   Confe ren c e   on  Data  Sc ie n ce  and  Busine ss   An aly tics ( ICDSBA) ,   Changsha, China pp .   231 - 235,   2018 .   [18]   Matsuba y ashi  A.   Yam ashit a   H.  N onaka   and  Y .   Konno,  "A   Resea r ch  on  Docum ent  Summ ari za t ion  and   Presentation   S y stem  Based  o Feat ure   W ord   Ext ra ct ion  fro m   Stored  Inform at ions,"  2018  Confe renc on   Technol ogi es  and  App li ca ti ons o f Artif i ci al   Int el l ig enc e   ( TAAI) ,   Ta i chung,   Taiwan pp.   60 - 63 2018 .     Evaluation Warning : The document was created with Spire.PDF for Python.