Indonesi an  Journa of El ect ri cal Engineer ing  an d  Comp ut er  Scie nce   Vo l.   12 N o.   3 Decem ber   201 8 , p p.   995 ~ 1002   IS S N: 25 02 - 4752, DO I: 10 .11 591/ijeecs .v1 2 .i 3 .pp 995 - 10 02          995       Journ al h om e page http: // ia es core.c om/j ourn als/i ndex. ph p/ij eecs   Effici ent  H.264 D ecoder  A rc hit ecture  U sin g   Extern al Mem ory  and Pip eli nin g       G.R. P oornim a 1 , S C  Pr asan na   Kum ar 2   1 Dept.   of   E   &   C E,   Sri   Venka te sh wara   Col le g of   Engi ne eri ng,   Ba ngal ore   2 Dept.   of   E lectr o nic s &   Instrum e nta ti on   T ec hnolo g y ,   V   Coll ege  of  Engi n ee rin g,   Banga lor e       Art ic le  In f o     ABSTR A CT   Art ic le  history:   Re cei ved   A pr   30 , 201 8   Re vised  Ju l   14 ,  201 8   Accepte Aug   2 1 , 201 8       H.264  standa rd  is  one  of  the   most  popula coding  standa rd  with  signifi ca n t   improvem ent   in  vide broa dc asting  and  strea m in appl icati on .   How eve it ’s   signifi c ant   in  co m pre ss ion  but  n ee ds  huge   c al cu l at ion   and  complex  a lgori thm   for  providi ng  b et t er  image  qu alit y   and  compress ion  rat e .   In  H. 264  codi ng   te chn ique ,   desig ning  of  dec oder   is  ke y   fac tor  for  eff ic i ent   cod ing.   In  thi s   pape we  ar designi ng  de code r   using  complex  input .   W ens ure seve ra l   improvem ent   li ke  loopi ng  a rra ngement ,   buffe upgra da ti o n,   b uffe r   supplement,   m e m ory   reu sab il i t y   and  pip el in i ng  arc h it e ct ur e.  W have  m odifi ed  the   m e m ory   stru ct ur a lso.  Our  designed  dec oder   ac h ieves  bette r   fra m dec oding   eff ic i ency   against  stat e - of - art  m et hods.  The   proposed  appr oac al so provi des  good  are a   opti m iz ation  wi th  m axi m um   fr eque nc y   o f   355  MH z.   Ke yw or d s :   H.264  dec od e r   P ipeli ning  a rchi te ct ur e   Mem or y re us a bili ty   Lum a/ Chro m a   Copyright   ©   201 8   Instit ut o f Ad vanc ed   Engi n ee r ing  and  S cienc e   Al l   rights re serv ed .   Corres pond in Aut h or :   G. R.  Poo rn im a ,   Dep t.  of E  &  C E,   Sr i V en kat esh war a  Colle ge o E ng i nee ri ng,   Ba ng al or e .   Em a il po orni m a_g _r@ya hoo. c om       1.   INTROD U CTION   H.264  is   m os broad ly   use sta nd a r f or  vid e c od i ng  with  si gn i ficant  im pr ov e m ent  in  vide broa dcasti ng,  vid e stream ing   an op ti cal   disc.  It  is  est a blishe by  J V (J oin vi deo  Team of   IT U - a nd  IS O/ IEC and a lso know as MPEG - 4 part  10  a dvance  vide co ding.  Mo st of  the b it s tr ansm itted w ire le ssly  in   com m un ic ation   netw orks  us es  MPE G - par 10  a dv a nced   vid e c odin ( AV C ).   H.264  vid e cod i ng  com pr ise high  com pr essio eff ic ie ncy,  s it   is  m os fr equ e ntly   us e in  vi deo   c odin g.   It  has  s om e   new  featur e inclu di ng   inte r - pr e di ct ion i ntra  pre dicti on ,   va riab le   blo c siz a nd   c onte xt - bas ed  ada ptive  e nt ropy  cod i ng   [1 ] .   T he se   al new   fe at ur nee ds   c om plex  co m pr ession  al go rith m   and   huge  c al culat ion to  pro vid bette im age  qu al it and   c om pr ession  r at e.  H.2 64  co ding  te ch nique  in vo l ves  s ource  cod e   f ro m   dif fer e nt   do m ai li ke  c om pu ta ti on al   ph ysi cs,  com pu te sci ence   an m achine  le ar nin ap proac h,  wh ic m akes  c om plex   so urce  co de  a nd  ch al le ng es   in  synt hesis.  T he  c om plexity  of  the   H.264  decode is  i ncrea sed  l ot  c ompare   t MPEG - 4 dec oder .   Usu al ly   H. 264  decode co ntains  pip el i ning  arc hitec ture  of   4*4  sub  blo c k.   T he  dat pr oc essin tim e   and   the  c om plexity   of   each  sta ge  of  pi pelinin arc hitec ture  de pe nds   on   the  ty pe  of  data  an dec od i ng  m et ho ds.  The  t i m ing   of   eac sta ges  sho uld   be  know n,   s that  the  sta ges  wh ic re qu i res   m or processi ng   ti m e   can  be  no rm alized  by  eff ic ie nt  decode arc hite ct ur e.  An   eff ic ie nt  dec od er  arch it ect ure   can  ideal iz al th e   tim con su m ing   sta ges  by  re duci ng  the  c omplexit up   t c ertai le vel.I i obser ved   by  run  ti m e   analy sis  tha t   the  m otion   c om pen sat ion   ( MC us es   55 of  the   dec odin ti m e.  So ,   it ’s  c ru ci al   facto in   de sign i ng  a   decode arc hitec ture  [ 2 - 3]  c onside rin pe rfo rm ance.  Re ading   pix el   data  with  le ss  com plexity   can  incr ease  the   perform ance  of  the  de co der.  H.264  decode r usual ly   hav e   three  unit s.  O ne  is  the  MC   un it   disc us se above,  seco nd   is  the  deb l ock i ng   filt er  un it   an the   la st  is  data  ou un it   w hich  helps  in  tra ns f err in im age  data  on   disp la dev ic e.     Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   12 , N o.   3 Dece m ber  2 01 8   :   995     10 02   996   The  siz of   c ode,  c om plexity  of   data  str uctu re  an functi on  hierar c hy  s houl be  lim it e as  m uch   a s   po s sible.  T here  are  diff e ren t   m et ho do l og ie s,  wh ic affe c ts  the  eff ic ie nc of   dec od e r So m research ers   fo ll owe bo tt om - up   m et ho dolog ie w hich  inclu des  blo c le vel  desig al ong  with  syst em - le vel  design in g.   Wh e reas  s om e   researc he rs  f ol lowed  to p - down  m et ho do l ogie w hich   inc lud es  t he  whol functi on  as  a   sing l e   un it T her is  al so   dif fer e nce   between   HLS  gen e rated  ha r dw a re  an sta nd al on hard w are.  S o,   the  di ff e ren t   m et ho dolo gies   us es  in  di ff e r ent  goal   and   a pp li cat io n.   com plex  app li cat ion   m ay  be  m or eff ect iv with  appr oach es   tha br ea ks   the  c od piece wise  and   opti m i ze  e ach  piece  of  c od w her a si m ple  app li cat ion   m ay  r equ ire  m or e  m et ho ds  to  g et  e ff ect ive .s o,  it ’s  co m plete ly  d epe nds to   pur po se  of a pp li cat ion .   To  re duce  the   m e m or scope,  seve ral  opti m iz at ion   are  done  by  resea rc her s S om of   the  HE VC   hard war inter po la ti on  is  presented  in  [4 - 7],  w her the hav com par ed  diff e re nt  te chn i qu e s.  I thei r   appr oach,  they   did   not  us e m e m or based  i m ple m entation I [ 4],  they   hav im ple m e nted  th ree  di fferent  8 - ta FI filt er  by  us in co nf i gurab le   pat h,   w hich  ca evaluate  s in gle  filt er  ou tp ut  at   t i m e.  Du to  this   reason,  it   can  be  us e for  on ly   m otion   com pensat ion.  I [ 5],  the  prese nted  ha rdwa re  de sign   us es  m ulti plier   le ss  con sta nt  m ul ti plica ti on   (MCM ap pro ach  f or   m ul ti plyi ng   with  co nst ant  factor   i [6 - 7],  they   ha ve   us ed   add e rs  a nd s hif te rs  f or g e ne rati ng   FI filt ers.   In   t his  pap e we  hav e   dem on strat ed   H .26 vid e c odin with  it real  a pp li cat io an the  ty pes - of  com plexity   whic we  face  on  top   dow a ppro ac hes.   Desi gnin of  decode co re  is  ve ry  im po rtant  in  fa st  an powe eff ic ie nt  decodin g.   Ma ny  onli ne  platf or m   li ke  Yo uT ub a nd  Face book u sin h.2 64  te ch nique  f or  vid e cod i ng.  Pop ula m anu factur i ng  com pan li ke  app le   an sna pdra gon  al so   us es  H .26 vi deo   c od i ng  for   their  process or s Th is  pa per  inclu de that  how   w are   im pr ov i ng  t he  desig proces a nd  what   dif ficult ie we  a re   facin w hile  de sign i ng   dec od e r.   We  sy nth esi zed  t he  c ode,  op ti m iz ed  the  co de  a nd   a chieve th r ough pu t   wh ic h ou t perform s the state - of - a rt tec hniq ue s.    This  paper  is   orga nized   as  fo l lowing  way.   I sect ion   w ha ve  dem on strat ed  a   bri ef  relat ed  wor of  desig ning  a   de cod e rs.  I S ec ti on   3,   a ove rv ie of   H.2 64  decode is  presente d.   Sect ion  des cribe s   our  pro po se opti m iz at ion   te chni qu es  of  de sig ning  H.64  de cod e rs.  Th pe rfor m ance  an re su lt   e valua ti on   i s   s how in   S ect i on 5.   In last  se ct ion   we  c on cl ud e  ou r pape r.       2.   R EL ATED  W ORK   HLS   to ols  m u ch  hype to  ac hieve  prot otyp ing   an ra pid   desig ning  of  ha rdwar in  re gi ste transf e le vel.  J.  And ra de  et   al   [8 ]   has  pr ove this  cl aim   by  us ing   com plex  app li cat ion   desi gn i ng,  w hich  im ple m ents   low - de ns it pa rity - check  (L D PC). HLS   t oo l can h el us e t e xp l or la rg e   sp ace desi gn i ng  int m ulti ple   sm all  desig ning,  w hi ch  m ake  i ts  pr oductivit high.  HL too ca al so   ex plore  m ic ro   arch it ect ur of  the  ge ne rated   desig n. LD PC  decode rs  a re  de velo ped b usi ng  t his  HLS  t ools  on ly , w hich  h as  an ave rag e  thro ughput.   S.  Ba lde et .al  [ 9]  has   dev el oped   a e ff ic ie nt   5 - sta ge  pip el i ning  a rch it ect ure  of  da glo c king  filt er  f or   desig of  HE VC  dec od e r.   T he  lum a/ chr oma   sa m ples  are  app li ed  ver ti ca ll o edg filt ers  of   th desi gn to   get  m axi m u m   t hro ughput  a nd  m ini m iz es  the  nu m ber   of  cl oc cy cl e.  T his  pro posed   arc hitec ture  is  de velop e in  FP GA  an AS IC  platf or m   us in 90 - nm   t echn i qu e T he  resu lt   of   t his  pro pose  arc hitec ture  s hows  t ha the  UHD vide os   ar dec od e at  200f ps .   F.  Le duc - P rim eau  et .al  [10]  has  de velo ped  desi gn  ap pro ach,  know as   quasi - sy nchronous   desi gn   appr oach   .LDP decoder   al lo ws  ti m ing   vi olati on wh ic is   m od ifie t hro ugh  pro per   m od el ing   by  HLS.  The   new  desi gn e ci rcu it ca pro vid sam p er form ance  with  sam area  co ns trai nt  but  ha ving  a energy   reducti on  of   32 %.   Desig ning  of  Node  P ro ces sing   Un it in  L PD dec oder  [11]  is  ver im po rtant  for  both  ha r dw a re   resou rces  a nd  processi ng  e xp e riences N PU   a rch it ect ures  s upports  decode in  ke epin lo ha rdware   util iz at ion   with  m axi m u m   op erati ng  fr e qu ency.  T he  sy nth esi ou tc om e   pro ves  th ha rdwar e   ef fici ency  f or   pro po se a rc hitec ture.   T.  Ma ll ikarachc hi  et .al  [1 2]  has  pro posed  fr am ewo r to  reduce  the  c om plexity   of   deco di ng.  By   reducin the  c om plexity   of   de cod e r,   t hey  ha ve  re du c ed  the en er gy  co nsum ption  dur in m edia  play bac k.  Th ey   al so  im pr ov e d i bit - rate a nd  vid e o qu al it y b y desig ning t his f r am ewo rk.   H.   Kim   et .al  [13]  has  de ve lop e a ef fici ent  arch it ect ure  of  HEV for  s upportin ultra - hi gh   def i niti on   c on te nt  by  m ultico re  im ple m e ntati on In   st and a r HE VC  te chn iq ue  th ere  is  issue  of   data  dep e ndencies ,   wh ic m akes  it   ineff ic ie nt   fo par al le processin g.   The  no vel  ar chite ct ur of  m e m or orga nizat ion   s olv es  the  probl e m   of   data  dep en de ncies  an m akes  it s   eff i ci ent  for  pa r al le pr ocessin g.   T hey   hav e  im ple m en te de - blo c king  filt er w it h ski m od pip el in ing  t ac hieve   high  perform a nce  of thro ughput.           Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       Eff ic ie nt H .26 4 Dec od e ar chi te ct ur e u si ng E xt erna l Me m ory  and Pipel ini ng   ( G.R.  Po ornima )   997   3.   H.26 ST ANDAR D VID E O D E CODI N G   H.2 64   sta nd ard   ha nu m ber   of  pro file s,   wh ic c ov e rs  diff e re nt  encodin featu res,   fr am rates  and   reso l utions.  Th us it ’s  m and at ory   to  def i ne  the  pro file wh il des ign in dec oder so   that,  they   will   su pp or f or  tha sp eci fic  pro file In   this  pape r,   we   a re  de sig ning  dec oder   for  the  m ai pr ofi le norm al l us ed   in stan dard  vide stream ing  a nd br oad cast in g.     Inp ut  of  t he  de cod e is   an   en cod e Y UV  vi deo  co ntaini ng  colo s pace pix el s,   w her e   represe nts   lum inance  w he reas  a nd   re pr ese nts  chrom inance  com po ne nt.  H um an  ey es  are  m or sensit ive  to  br i gh t ness  t han colors,  for t his  r eas on chr om i nan ce  d at a  is c on si der e d f or  i m pr ov in e nc odin e ff ic ie ncy   In   H.264  sta ndar d,   vid e is   encode f ra m wise,  where  I - f ram es  are  enc oded  without  any   inf or m at ion   of   past  a nd  f utur fr am es.  Enc odin of   P - fr am re qu ire in form ation   of   pre vious  fr am wh ereas   encodin of   B - f ram req uire inform at ion   of   past  fr am as  well   as  fu t ur f ram es  al s o.   E ncode vi deo   is  store in  form   of   bit  stream Fil fo rm at   of   encode vid e pro vid es  i nform at ion   ab ou e ach  f ram e’s  typ e.  A   H.264 i nput  file  for m at  is sh own  in  F ig ur e   1.           Figure  1 .   Str uc ture of  H.2 64 e ncode d fil e       SPS  an PP un it   of  input  f il (f ram e)  con ta ins  inf orm a ti on   re gardin decodin pa r a m et ers  and  fr am siz e.  ID un it   of   the  i nput  file   is  the  first  sli ce  wh er fr am is   fu rt her   div ide int m acro   blo ck s.  Each   of   t he  sli ce  he ader   ha ving  basic  inf orm ation   of   sli ce  li ke  sli ce  iden ti fier,  num ber   of   m acro   bl ocks,   qu a ntiza ti on f a ct or  a nd fram e config ur at io n.   Dec od e get com pr essed  bit - stream   fr om   the  enco de inp ut  file   w he re  entr op dec od e dec odes  the  input  bit  stream   into  set   of   qua ntize coeffic ie nt.  T he   resid ual  i m a ge  inf orm ation  can  be  ob ta i ne by  us in i nv e rse   qu a ntiza ti on  a nd  in verse  tra nsfo rm at ion   unit The   c om bin ed  i nfor m at ion   of  resid ual  da ta pre - decode d data a nd pre dicti on  i nfor m at ion  is  ut il iz ed  in f inal  decode im age.    In   this  pap e r,   we  m ai nly   fo c us   on  ge tt ing   higher  reso l ution   dec od e im age  with  high  f ram rate.   Fo r   this  purpo se  we  need   to   consi de de sign   process wh e re  we  im p lem ent  the  para m et erized  buf fer   f or   tem po rar sto r age  so l ution.  A   H. 26 vid e de cod e f un ct io nal  blo c diag r a m   al on with  intra  pr e dicti on  unit   is sh own  i F i gure  2.           Figure  2 H .26 4 D eco de f un ct ion al  b l oc k d ia gr am   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   12 , N o.   3 Dece m ber  2 01 8   :   995     10 02   998   4.   IMP ROVED   H.26 4 DEC O DER WIT S IMU L ATIO N  ARCHIT EC TURE   In   this  sect ion  we  will   discuss   ab out  the  un iq ue  desi gnin an m eth od ology  to  get  i m pr ov e i m ple m entat io of   H.264  de c od e r.   We  are  m ai nly  con cen trat ing   on  dif fi culti es  in  p erfo rm ing   to  desig ning  m od ule,  w hich   can  dec od e   ou vi deo  f ram eff ic ie ntly I t otal  desi gn i ng  process us case  has   co ns i der e for  the  ha rdw are  m od ule  wh ic incl ud e requirem ent  ver i ficat ion ,   cod e   w riti ng   and  it erati ve  so urce   op ti m iz ation   w it sin gle   f unc ti on   or  m ulti pl f un ct io al ong  with   syst em   le vel  optim i zat ion The   si m ula te d   arch it ect ure  of  H. 26 decod er  is  sh own  in   F igu re  3.   Th arch it ect ur sh ows  the  co nnect ivit of   ex te rn al   m e m or y wit s har e d b us  a nd interf ace  unit .           Figure  3.   Sim ulate H.2 64 d e cod e a rch it ect ur e       4.1    Im prove d Synthesi s Pr ocess   In   this  sect io we  will   sta rt  i m pr ovin the  app li cat io it erati vely   by  i m p rovin the  co de W will   first  im pr ov i ng  the  desi gn  for  area   m ini m iz ing   by  im plem enting  m axim a ll par al le li ze  and   pipe li nin arch it ect ure.  T hough,  this  ar chite ct ur can no be  us e in   com plex  ap plica ti on beca us ap plyi ng   global  par al le li zat ion   m akes  area  cos too   high.  D ue   to  this  reaso n,   we  sh ould  m or sel ect ive  in  op ti m iz ing   area  and  op ti m iz ing  p er form ance in  c om plex  app li cat ion .     We  hav e   w ritt en  our  c ode  by  the  help  of  Xili nx   IS t oo i Ver il og  hard war e   desc ripti on  la ngua ge .   It’s  t oo w hi ch  gi ves  e nv i ronm ent  to  de velo the   desi gn  co de,   synt hesize  the  c od an sim ulate  the  dev el op e d desi gn code.     4.1.1 Buil din g Individ ua Fu nctio n   We  sta rt   buil di ng  eve ry  in div i du al   f un ct io i f as hion,  w hich  help in   ge tt ing   pe r form ance  on  cal l.   We  ha ve  div i de al sing le   functi on   int gro up a nd   perfor m ed  sever al   en han cem ent.  We  con ce ntrated   m or on p e rfo rm ance optim iz at ion  r at her tha a re a optim iz at ion .     4.2 .       Mem ory R eus ab il it w ith Pipel ini ng  Architec tu re   In   order   t m a ke  m e m or ref eren ces  e ff ic ie nt  in  refe re nce   so ft war CP U   i m ple m entat io is  key  factor.  T he  ha r dw a re  im ple m entat ion   of   sh a red   m e m or m igh be  ex pe nsi ve,   eve i ca se  of   l ocal  BR AM  blo c al so whic m ay   cause  per f or m ance  bo tt le nec of  the  syst e m T hu s by  ap plyi ng   s plit te indi vid ua l   reg ist er  or   sm al local   data  arr ay   reu sa bili ty   can  be  a im p or ta nt  facto in   syst e m   per for m ance.  The  de ci sion   of   s plit ti ng   re gi ste rs  or   sm al l   local   data  arra i m ple m entat ion   de pe nds  on  three  facto rs First,  the  fun ct ion s   wh ic in vo l ve in  ar ray  sho uld   be   sign i ficant  functi on  in div id ually Sec ond  thi ng   the  functi ons  w hic are  involve in   ar r ay   sh ould   ha ve   data - par al le li sm   and   m e m or port  li m it at ion   shou l no be  there.   The   la st  thin is t he  im ple m e nta ti on   of BR AM. T he re du c ing  BR AM ca n be m or e e ff ect ive tha n pr e ve nting t he re gister  us e.   This  strat e gy  is  ap plied  in   ou de sig im ple m entat ion B ut,  if  the   local   buf fer   siz is  no com plete l par ti ti on i ng   fe asi ble,  in  that  case  we  create   an  ad diti on al l loc al   bu f fers   wh ic can  be  reu se ef fici en tl y.  In   our  co de,   i each  it erati on   we   read   5 - overl app e data  it em s   wh ere  on ly   on data  it e m   is  new T he refor e by  creati ng local  buff e r we  read  a n e w data  in e ach ite rati on.   Til no w,   im pr ov em ent  is  do ne  for  eff ic i e nc and   m e m or reu sabili ty   by  low  le vel  functi on   cal li ng.  Now,  we   ca f ur t her  im pr ov our  syst em   f or  area   co nst raints.  pipe li nin arc hitec ture  help a   lot  in   i m pr ovin pe rfor m ance  as  we ll   as  sign ific an area  op ti m iz a ti on We  ha ve  pip el inin base on  the   nu m ber   of  it erati on s t im pro ve  f urt her p erfor m ance of  the syst em  alon g wit h area  optim iz at ion   Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       Eff ic ie nt H .26 4 Dec od e ar chi te ct ur e u si ng E xt erna l Me m ory  and Pipel ini ng   ( G.R.  Po ornima )   999   4.2.1 Im provi ng  Thr ough  Cross  Func tion  Exa mi n ati on   We  sta rt  dev el op i ng   f unct io sequ e nces  any   analy zed  their   i m po rtance  in  app li cat io n.   I desce nd i ng  order   o sig nif ic ance,  we  ca i m pr ove  the   le af  fu nctio seq uen ce w hich  is  m or effe ct ive  in  enh a ncin i m po rtant  cal seq uen ces Pro fili ng   data  is  updated  a nd   t her afte we  fin out  the  diff e ren seq ue nc es  of   functi on  cal ls.  These  f un ct io cal m igh be   the  im pr oved   le af  f un ct i on  or  oth er   se ver al   f un ct io i nclu ding   cal sta ck.   Each  f un ct io la te ncy  is  analy zed  al ong  wit the  num ber   of   cal ls  on   cal st ack.  T his  data  helps  us  in f i nd i ng criti cal  p at i cal sta ck.     4.2.2lum a nd  C hr om P ar al le l Da t Fl ow D esi gn   Fi gure  dem on st rates  the  Lum and   Ch r om par al le data  path  unit wh e re  buff e rs  are  util iz ed.   Weig ht  pr e dictor  est im a te the  weigh f or   both  L um and   Chrom data  s a m ples  wh ere  data  is  stored   i sm al l   buff e rs.  A ve ra ge  s um   of   t he   predict ed   weigh t,   bu ff e dat a   an i nd i vidu al   pr e dicte w ei gh is  ap plied  to   m ul ti plexer   for  f inali zi ng the   ou t pu t.             Figure  4. Lum a - Ch ro m a D at a flow  desig n       4.3    L ooping   Rea r r angeme nt   a nd  Fu ncti on  I nli ning   Ther a re  so m factor s w hich  can  sto the  pip el inin c omplet el in  loo p.  The  co ntr ol  f low  of  the  loop  m ay  deg r ade  the  pe rform ance  by  app l yi ng   co nd it io na check   in  eac loop  it erati on.  D ue  to  the se   reason,   we reo rd e e ve ry lo op where   op ti m iz ation   of both t he  la te nc y i s n ee ded co ns ide rin the  pi pelining s uitabil it y.   Durin si ng le   functi on  op ti m iz at ion it   has   bee fou nd  in  se ver al   ca se s,  that  t her is   nee of   functi on  inli ni ng  f or   both  la te ncy  an are optim iz at ion But  it   is  not   necessa ry  tha there  is  al w ay sign ific a nt  be ne fit  of   s pecial iz at ion   w ould  be   there  by  f un ct ion   in li ning.  Du t du plica ti on   of  res ourc es,  trade off  is  ther between   fun ct ion   cal ov er heads  an incr eased  area.  By   i m ple m enting  inli nin to ol,  we  can   achieve  un i versal ly   inli ne  or   we  can  pre vent   inli nin of  functi on.  I our  case,  we  trie to  get  m axi m u m   ben e fit  in  each  cal s it e.  Ho w ever,  in  so m c ases  it   is   ben ef ic ia on ly   after  inli nin subs et   of   fr e qu e ntly   us e functi on call  si te s.    Af te r   ide ntifyi ng  im po rtant  posit ion s   of  po t entia savin g,  we  im ple m ent ed  f unct io inl ining.  Using  prof il data  an ca ll   sit e   po sit ion s,  it   is  ob serv e that  the  sign ific a nce  of   al l   cal l   sit es  f or   can did at f unct ion.   We  ope m ult iple  al te rn at ive   op ti on   of  inli ning  di recti ves   wh ic helps  i fi nd i ng   la te nc savin an area   cost, B ut w e  have  finali zed i nline c ho ic es  by  inli ni ng m anu al ly  f or the  i m ple m ented  f unct ion.   Buffer  upgra da ti on   As  we  disc us s ed  earli er,  in  im pr ov in of  sing le   f unct ion   buff e r ole  is  ver sig nifican to  execu t e   par al le li sm   al g or it hm In it ia ll y,  we  sta rt  f r om   local   buf fer   insertio t im pro ve  sin gle  le af  f unct io n.   He re,  we   are  no c onsid erin the   plac es,  w he re  to   de fine  t he  buffer  f or  getti ng  m axi m u m   benefit   of  pa rall el iz at ion  durin the  cal sta ck.   W just  evaluate  the  ind i vidual  buff e to  de fine  in  cal stack Bu ff e can  aff e c t   par al le li sm   of   su b - f unct io n at   hig he le vel  of   cal sta ck,   bu at   the  sa m tim i le ads   com plexity  in  inter - blo c e dg es wh ic ex pe riences  ov e rhead   wh il c op yi ng  f or m   global  edg e s.  I t his  sit uation,   co nf li ct i on   com es  in  sh ari ng   of  pote ntial   data,  because   m ul ti ple  su b - f un ct io ns   re us e sam bu ff e r.  W a naly ze  the  cal l   sta ck  of   eac local   buff e an try   to  def ine   it   earli es plac es,  wh e re  over head   is  m ini mu m   and   su f unct i on   gets m axi m u m  b e nef it   durin g parall el ism .   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   12 , N o.   3 Dece m ber  2 01 8   :   995     10 02   1000   4.4    S ystem  Le vel Pa r allel  Pro ces sing   On ce  cal sta ck  i m pr ovem ent  is  do ne,   we  im pr ov e ever y   sing le   functi on  al ong  with  the  i m po rta nt   seq uen ce  of  f unct ion  in  cal s ta ck.   Now  in ste ad  of   optim izing   le ss  si gnific ant  f un ct i on,  we  sta rt  op ti m iz ing  data  bu ff e rin and  data  t rans portat ion  acr oss  dif fe re nt  por ti on of  dec od er,  w hich  is  not  di rectl connecte with  functi on c al l st ack.    Af te r   data  op ti m iz at ion   we  fi nd  out  to p - le ve dep e ndencies   in  pr of il in da ta w hich  helps   in  fi nd i ng   data d e pe nden cy  b et wee n buf fer s  of to le ve l functi on in  ca ll  stack.     4.4.1 Bu ff er  S upplemen a n d Ta s k Lev el   Par allel ism   As  we  discuss ed  earli er,  t he   input  data  str ea m   is  co m pl ex,   s after  c al sta ck  and   local   buff e insertio n,   t he  exter nal  data  e valuati on  is  c r it ic al   factor   in   perf or m ance  evaluati on.  Th at ’s  w hy  we  wan t d evel op   a   co re   syst e m wh ic shou l be  i ndepende nt  from   ta rg et   res olu ti on,  wh e re  s om e   par of   m e m or can   be  acce sse th r ough  exte rn al   bu f or   data  tr ansf e rat her   t ha us i ng   l ocal  m e m or ie s.  Mo reover im ple m ented   local   buf fer  ar well   op ti m ized   for  par al le l i s m   in  local   f un ct io n.  S o,  th ere  is  no  need  of  hav i ng  fac il it at e   reu si ng th rou ghout cal l st at e r egio n.   By   us ing  the  sta ti sti cs  of   pr of il in form at i on,  crit ic al   functi on  is  dete rm ined  and  cl us te rin is   dev el op e for  functi on  cal grap h.   Additi on al ly with  th help  of   t his  cl ust ering,  local   data  arr ay   is  c reated  for  syst em - le vel,  wh ic is  c om par at ively   lar ge  a nd  use by   directl or   in directl y.  Direct ly   us of  this  l arg e data  can  be  po ssible  wh e n,   th ere  is  no   nee of   s ub sta ntial   par al le li sm   wh ereas  ind i rectl us of   data  c an  be   po s sible  by  co pying  data   int nex le vel  of  buf fer.  Co pying  of  data  int ne xt  le vel  buf fer   m ay   exp e rience s   ov e r head,  bu it   protect fro m   la te ncy  pro du ce   by  l ocali zat ion   a nd  re usa bili ty Lat er  we  fi nd  out  t hose  s ub  functi on,  w hic i m pl e m ents  l ocal  buff e bas ed  on  the  obse rv at io of  their   bu ffe rin nece ssit and   proce ssing   tim e.    In   ou desig ni ng   process,  we   hav opti m iz e first  ind i vidu al   fu nctio or  cal sequ ences  and   ig nore ta sk - le vel  pa ra ll el is m .   Lat er  we  co ns ide red,   ta sk - le vel  paral le li s m   by  i m plem enting  two  m e tho ds   wh i ch  are   (a)   Bu ff e dupl ic at ion   and   ( b)   interface  dupli cat ion W us e   bu f fer   duplica ti on   m e tho in   case  of   us in input  data  by  m ult iple  fu nctio w he reas  inter face   duplica ti on   m et hod  in  case  of  par ti ti onin da ta   into  two  or   m or gro up accesse d i nd i viduall y b y functi on.     4.5    Ru n time  M em or y All oc at i on   In   or der   to  m i nim iz the  m e m or a ll ocati on   pro blem   H. 264  us es  dyna m ic   m e m or a ll ocati on I our  us e - case   a lso,  we  ha ve  us e dy nam ic  m e m or al locat ion   f or  inte rn al   buff e rs  w hich  will   conver in  par am et erized  sta ti al locat ion s.  T he  us a ge  of   dynam ic   m e m or al locat ion   de pends  on   the  siz of  th input   file   reso l ution.   It’s  not  go od  to  desig de cod e w hic will   su pport   only   on m axim u m   reso luti on.  T ov e rc om this   pro blem we  hav e   to  re design  our   m od el   for  eac ta r ge case  res olu t ion   w hich  i nc rease s   op ti m iz ation   c halle ng e s.  la rg am ount  of  in pu buff e conve rts  into  t op   le vel  m e mo ry  inte rf aces ,   wh ic will   us f or  m e m or banks It  m igh nee of  tra nsfer ring   data  us in m e m or i nterf ace.  T hat’s  w hy  we   op ti m iz ing  k er nel’s wit hout c on si der i ng the  vid e o reso l utio n.       5.   RESU LT   A N D ANALY SIS   We  us e Xili nx   VC U15 25   de velo pm ent  kit   as  synthesiz able  software   for  optim iz at i on   of   ea c interm ediat st age  of  desi gning.  We  perf orm ed  on - boar v erificat io us i ng  Om nitek  Z ynq  7000.   AR CP U   is util iz ed  f or da ta  trav el li ng  wh il e Zy nq acts as a sta ndal one F PGA.   Viva do   2015. too is  app li ed  to  determ ine  the  occupied  area  an oper at ing   fr e quen c fo each   desig process I or der   t m easur perform ance  of   in put  vi deo   file and  the  c orres pondin bo a rd - le vel   app li cat io n,   si m ula ti on   has  pe rfor m ed  in  H.264  vid e file .   H.2 64  vi deo  f il fo ll ows  a   r epeati ng  patte rn   li ke   on fr am is  I - fr am e,  nex is  P - f ram and   th en  B - f ram es  a nd   a gain  P - f ra m e.  The  la te ncy  of   de c od e f ram e   dep e nds  on  da ta   fo al m os a ll   fr a m t ype.  We  try   to  find  ou the  worst  case  la te ncy  (m axi m u m   la ten cy of   each fram e t ype in each  cy cl e. A   weig hted  a ver a ge  is pe rfo rm ed  twic e fo r  B - fr am es compare t I or  P f ram es.  Lat er,  the  ave r age  la te ncy  of   each  cy cl is  m ul ti plied  with  obta in  fr e que ncy  to  check   t he  ave rag la te ncy  go per f ram e. Moreov e r, we  h a ve  u se d In te l c or e  i5 - 2310 CP U ( 2.9GHz)  to  com ple te  the r e quire m od ific at ion .   Be cause,  our  c or de sig is  i nd e pe nd e nt  of   reso l ution,  we  te ste our  de si gn   with  m ulti ple  reso luti on   li ke  QC IF   144p  a nd  480p  of  input  file s.   W e   est i m at ed  syst e m   perform ance  f or  di ff e ren reso l utions.  W al s cov e re the   a ve rag e   la te ncy  for  per  m ic ro   blo c of  the   s yst e m W e   ha ve  c om par ed   our  pe rfor m ance  with  diff e re nt pre - de ve lo ped H.2 64 im ple m entat i on.          Evaluation Warning : The document was created with Spire.PDF for Python.
Ind on esi a J  E le c Eng &  Co m Sci     IS S N:  25 02 - 4752       Eff ic ie nt H .26 4 Dec od e ar chi te ct ur e u si ng E xt erna l Me m ory  and Pipel ini ng   ( G.R.  Po ornima )   1001   5.1    Per fo r m an ce E valua tion   a n Analys is   We  sy nth esi ze our  desi gn  a nd  e valuate  pe rfor m ance  w hi le   treat ing  wit QCIF  in put  vid e os .   At  each  op ti m iz a ti on   sta ge oc cup ie area   is  pr e sente with  pe rfo rm a nce  f or  co rr e sp on ding  synt he siz ed   i m ple m entat io n.   By   im ple menting   sin gle  functi on  im pr ov em ent,  li tt le   area  gets  op ti m iz ed  bu t   it   al so   i m pr oves  the   CPU  perform a nce,  w hich  i ndic at es  reu si ng  f un ct io is  well   orga nized T houg h,   optim iz a ti on   of  cro ss - f unct io with  the  hel of  local   buff e m aking   the  pi pelinin m or ef fecti ve  rises  perf orm ance   excell ently The  area  dep e nds  pri m aril on   FF DSP  an LU unit and   SRAMs  a re  util iz ed  m a inly   in   syst e m - le vel  buf fer  but  rar el us e in   loca buff e rs.  Op ti m iz at ion   in  sy stem   le vel  co nfi gurati on  m ak es  the  perform ance  low  in  CP le vel  de picts  dev ia ti on  in   our  desire   res ul t.  In  final  ste of  pa rall el iz ation ,   we   achieve  good t hro ughput.   Howe ver,  our  si m ulati on   pro cess  do  not  de sign   m e m or band width   at   syst e m   le vel.  H.264  syst em   requires  lot  of   c om pu ta ti on   proce ss,  s o,   it   sh ou l not  be   m e m or bo un ded   a ppli cat ion I e xp e r i m ent,  Xili nx   kin te x - 7 FP GA s  is  dem on st rated t o ge t a g ood  a rea  optim iz at ion  w it m axi m u m  f r equ e ncy.       T able  1 T he  num ber  of lum a and chr om a int ra  pr e dicti on unit  co m par iso n i s d e picte d   Desig n   LUT   FF   lu m a [ 1 4 ]   545   127   lu m a[ 1 5 ]   212   37   lu m a [ p rop o sed ]   83   284   ch ro m a[ 1 4 ]   216   59   ch ro m a[ 1 5 ]   163   33   ch ro m a [ p rop o sed ]   284   105       T able  2 C om par iso n of H .26 4 deco de rs wit h othe r H. 264 deco de rs  a nd  HEV C  d ec oder s ar show n     Ou p rop o sed   wo rk   ESSCIRC   1 4 [  1 6 ]   ISSCC  1 3 [17  ]   ASSCC   1 3 [18 ]   ISSCC  1 2 [19  ]   VLSI  10  [   20]   ISSCC 1 0 [   21]   W o rk d o n e[   22]   Vid eo - f o r m at   H.26 4   HEVC +   Multi - f o r m at   HEVC  W D4   HEVC   H.26 4   H.26 4   H.26 4   HEVC   On - Ch ip   SRAM   1 0 2 .5   KB   1 5 4 KB   1 2 4 KB   1 0 .2KB   7 9 .9KB   5 9 .6KB   9 .0KB   3 9 6 KB   Log ic   g ates   190k   3 4 5 4 k   715k   446k   1 3 3 8 k   662k   414k   2 8 8 7 k   tech n o lo g y   2 8 n m /   0 .9v   2 8 n m /   0 .9v   4 0 n m /   0 .9v   9 0 n m /   0 1 .0v   6 5 n m /1 .2 v   9 0 n m /   1 .0v   9 0 n m /   1 .09 v   4 0 n m /   1 .0v   Clo ck  r ate   355   MHz   350   MHz   200   MHz   224   MHz   340   MHz   175   MHz   210   MHz   300   MHz   DRAM  co n f ig   DDR3 L   3 2 b LPDD R3   3 2 b DDR3   n /a   6 4 b DDR2   6 4 b DDR1   n /a   6 4 b DDR3       6.   CONCL US I O N   This  pa per   s hows  an  ef fici ent   desig ning  of   a h.2 64   decod er  with  it intra  pr e dicti on   un it   (lu m and  chrom a).  For  this  proc ess,  w ha ve  us e Xi li nx   VC U 1525   devel opm ent  kit  with  on   bo ard   ve rificat io usi ng  ARM  CP U.   B us in r un ti m m e m or al locat ion ,   in div id ual  f unct io im pr ovem ent  and  cr os s   f unct ion  ver ific at io n,   w hav ac hieve com plete   i mp r ovem ent  in  desig ning.  T hi i m pr ov em ent  prov i des  good  area   op ti m iz ation   w it m axi m u m   f reque ncy  of  355  MHz We  h a ve  us ed   di ff e re nt  bl ock  ty pes  for  intra   pre dicti on  un it   to  reduce   the  area  c os of   t he  dec oder By   app ly in var i ou im pr ovem ent,  we  ha ve  achie ve gr eat   thr oughput.       REFERE NCE S   [1]   L.   V.  Agos ti ni ,   A.  Aze vedo ,   W .   Stae hl er,   V.  Ros a,   B.   Za t t ,   A.  C .   Pinto,   R.   E .   C.   P orto,   S.  Bampi,   A.  Sus in,   "D esign   and  FP GA   Protot y p ing  of  H. 264/AVC  Main  Profile   Dec od e for  HD TV",  Journal  of  the   B raz il ian  Computer  Soci e ty ,   vol .   12 ,   pp.   25 - 36 ,   2007 .   [2]   D.  Indoonundon,   T.   P .   Fow dur,   K.  M.  So y jaudah ,   Conceal m ent   Aw are   UEP  Scheme  for  H.264  using  RS   Codes”,   Indon esian  Journal  o E le c tric al   Engi n e ering  and  Comp ute Scienc e( IJEECS)   Vol.   6,   No .   3,   June  2017,   p p.   671  ~ 681  DO I:   10. 11591/ijeecs. v6. i3. pp671 - 681 .   [3]   Chuan - Yung  Tsai ,   Tung - Chi e Chen,   To - W ei   Ch en  and  Li ang - Ge Che n,   "Bandwidt h   opti m iz ed  m oti on   compensat ion  h a rdware   design  fo H.264/ AV HD TV  dec oder , 48th  Midwe st  S y mpos ium  on  Circui ts  and  S yste m s,   2005. ,   Covingt o n,   KY ,   2005 ,   pp .   1199 - 1202  Vol .   2.   doi: 10. 1109 / MW SC AS . 2005 . 1594322   [4]   E.   Kal ali,   Y.  A d ibe lli,  I .   Ham z aogl u,   Rec o nfigura bl HEVC  Sub  Pixel   Int erp olation  Hard ware ,   IEEE  In t .   Confe renc on   C onsum er   El ectronics  -   Be rl in, Sept .   2013 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2502 - 4752   Ind on esi a J  E le c Eng &  Co m Sci,   Vo l.   12 , N o.   3 Dece m ber  2 01 8   :   995     10 02   1002   [5]   E.   Kalali ,   I.   Ham za oglu,   low  ene rg y   HEVC   sub - pixe int erp ola ti on  ha rdware,”   IEEE  Int.   Co nfe renc on  Image  Proce ss ing ,   pp .   1218 - 1222,   Oc t.  2014.   [6]   Mengm eng  Zhang,  Jianf eng  Qu,  Huihui  B ai ,   Fast  Intra   Prediction  Mode  Dec ision  Algori thm  for  HEVC” ,   TEL KOMNIKA   Indone sian  Journal  of  El ectric al   Engi nee ring ,   Vol.   11,   No.  10,   Octobe 2013,   p p.   5703  5710   ISS N:  2302 - 4046 .   [7]   C.   M.  Diniz,  M.  Shafique,  S.  B ampi,   J.  Henke l ,   Rec onfigur abl Hardwar Archi tectur fo r   Frac ti on al   Pixe Inte rpol at ion  in  High  Eff icien c y   Video  Coding,”  IEE Tr ans.  on  Computer - Ai ded   Design  of   Int eg rated  Circuits  and  Syste ms ,   vol .   34 ,   no.   2,   pp.   238 - 2 51,   Feb .   2015 .   [8]   J.  Andrade   et   al . ,   "D esign  Space   Expl ora ti on  of  L DP Dec oder u sing  High - Le vel  Sy n the sis,"  in  I EE A cc ess ,   vol .   PP ,   no.   99 ,   pp .   1 - 1.   doi 10 . 1109/ ACCESS . 2017. 2727221   [9]   S.  Bal dev ,   K.  Shukla,   S.  Gogoi ,   P.  Rat hore   and  R.   Peesa pa ti ,   "D esign  and  Im plem ent at ion  of  Eff ic i ent   Stre aming  Debloc king  and  SA Filt er  for  HEVC  Dec oder , in  IEE Tr ansacti ons  on  Consum er  El ec troni c s ,   vol.   PP ,   no.   99,   pp.   1 - 1.   doi:   10 . 1109/T C E. 2018. 2812518   [10]   Zha Han,   M.R.  Anjum ,   “A  Ne Low - Costing  QC - LDPC  Dec oder   for  FP GA ”,   TEL KO MNIKA  Indone sian  Journal   of  E le c tric al   Engi n ee ring   Vol.   12 ,   No.  11 ,   Novem ber   2014,   pp.   772 7727   DO I:   10. 11591/telkomnika. v12 i11. 651 2.   [11]   P.  Hail es,   L.   X u,   R.   G.  Maund er,   B.   M.  Al - H ashimi  and  L.   Hanz o,   "H ard w are - Eff icient   No de  Proce ss ing  Unit  Archi tectur es  fo Flexi bl LDPC  Dec oder   Im pl ementa t ions,"  in   IEE E   Tr ansacti ons  on  Circui ts   and  Syste ms   II :   Ex press   Briefs ,   v ol.   PP ,   n o.   99,   p p.   1 - 1 .   doi 10 . 1 109/T CS II. 2018. 2807362   [12]   T.   Mallikar ac hc hi,   D.  S.  Ta l a gal a ,   H.  K.  Arac hch and  A.  Ferna ndo,   "D ecoding - Com ple xi t y - A war HEVC  Enc oding  Us ing  Com ple xity - R at e - Distor ti on  Model, in  I EE T rans act ions  on  Consum er  El ec tr onic s ,   vol .   PP ,   no.   99,   pp .   1 - 1 .   doi : 10.1109/ TC E. 20 18. 2810479   [13]   H.  Kim ,   J.  Ko  and  S.  Park,   "A Eff ic i ent   Arch itect ur of  In - Loo Filt ers  for  Multi cor Sca la bl HEVC  Hardware   Dec oder s,"  in  I E EE   Tr ansacti ons   on  Mul ti media ,   vol.   PP ,   no.   99,   pp.   1 - 1   doi: 10. 1 109/T MM . 2017. 275950   [14]   F.  Palumbo  et   al . ,   Runti m ene r g y   ver sus   qual ity   tuni ng  in  m otion  compensat io fil te rs  for  HEVC,”   in  Proc.   of   the   PDe Conf . ,   201 6.   [15]   C.   S au  e al.  < em>” Challengi n the   Best   HE VC  Frac ti ona Pixel   FP GA   Inte rpolators  with  Rec onfigur abl e   and  Multi - fre qu ency   Approxim at Co m puti ng  IEEE E m bedde S y st e m s L et te rs” </em 2017.     [16]   C. - C.   Ju  et   al.,   0. nJ/pixe 4K  60  fps  Main - 10  HEVC  dec o der   with  m ult i - f orm at   ca pab il i ties  for  UH D - TV   appl i ca t ions,” i Proc.   Eur.   So li d - Stat e   Circuits C onf.   ( ESSCIR C) ,   Sep.   2014,   pp.   1 95 198.   [17]   C. - T.   Huang ,   M.  Ti keka r ,   C.   Juveka r,   V.  Sze ,   an A.  Chandra kasa n,   249  Mpixel /s  HEVC  vide o - dec oder   ch ip  for  quad  full   HD   appl ica - ti ons, ”  in  IEE Int .   Soli d - S tat Circuits  Conf.   ( ISSCC )   Dig.   Tech.   Pape rs ,   Feb.   2013,   pp.   16 2 164.   [18]   C. - H.  Tsa i,   H . - T .   W ang,   C . - L .   L i u,   Y. Li, a nd  C . - Y.  Lee,   A 446.6K - gat es  0. 55 1 . 2V H.265/ HEV dec od er  for  n e xt  gene ra ti on  v ide o   appli - cations,”  i Pr oc. I E EE A s ian  Soli d - State  Circui ts Conf.  ( A - SSCC) ,   Nov. 2013,  pp .   305 3 08.   [19]   D.  Zhou,   J.  Zho u,   J.  Zhu,   P.  Li u ,   and  S.  Goto,   A   Gpixel /s H. 264/AVC HP /M V vide dec od er  chi for  Super  Hi - Vision  and  3D TV/FTV  applic at ions, ”  in   IE E Int .   Sol id - Sta te   Cir cui ts  C on f .   ( ISSCC)   Dig.   Tech.   Pape rs ,   S an  Franc isco, CA,   US A,  Feb.   2012,   pp.   224 225.   [20]   D.  Zhou  e a l.,  530  Mpixel s/s  4096  ×  2160@6 fps  H.264/ AV high  profile  v i deo  de code chip,”   in   Proc .   Sym p.   VLSI  Circuits ( VLSI) ,   Honolulu,   HI,  US A,  2010,   pp.   171 172 .   [21]   T. - D.   Chuang  e al.,  59. m W   sca la ble /m ult i - vi ew  vid eo  dec oder   ch ip  fo quad/ 3D  fu ll   HD TV  and  vid eo   strea m ing  app lic at ions, ”  in   IE EE  Int.   So li d - Sta te  Circui ts Conf.  ( I SSCC)   Dig.   Tec h.   Pap ers ,   Feb .   2010,   pp .   330 3 31.   [22]   D.  Zhou   et al . ,   " An 8K H. 265/HEVC  Video  De c oder   Chip   W it New S y s te m   Pipel in Design , in   IE EE   Journal of   Soli d - State  C irc uit s ,   vo l. 52, no.  1,   pp .   113 - 126 ,   J an.   2017 .   do i: 10 . 1109/JS SC . 2016. 2616362.   Evaluation Warning : The document was created with Spire.PDF for Python.