Int ern at i onal  Journ al of Ele ctrical  an d  Co mput er  En gin eeri ng   (IJ E C E)   Vo l.   8 , No .   6 Decem ber   201 8 , p p.   4584 ~ 4592   IS S N:  20 88 - 8708 DOI: 10 .11 591/ ijece . v 8 i 6 . pp 4584 - 45 92           4584       Journ al h om e page http: // ia es core .c om/ journa ls /i ndex. ph p/IJECE   MetOp  Satellit es Data  Processin g for Ai r Pollu tion  Monitori ng  in Mo rocco       Moham ed  Akr am  Z ayt ar,   Chaker El   A mrani   Facul t y   of  Sci en ce   and Technolo g y   in Ta ngi er,  A bdel m al ek   Essaa di   Univer si t y ,   Laborat or y   of   Infor m at ic s   S y s te m s a nd  Te l ec om m unic ations (L IST ) ,  Mo ro cc o       Art ic le  In f o     ABSTR A CT   Art ic le  history:   Re cei ved   J un   9 , 201 8   Re vised  Ju l   1 ,   201 8   Accepte J ul   20 , 2 01 8       Thi pap er  pre s ent a   data  pro ce ss ing  s y st em  base on   an  arc hi te c tur e   comprised  of  m ult ipl st ac ke lay ers  of  co m puta ti onal  pro ce ss es  tha t   tra nsform Raw  Bina r y   Poll uti on  Dat co m ing  dire ctl from   Two  EUMETSAT  MetOp  sat el l it es  t our  serve rs,   i nto  re ad y   to   interpre t   and   visual ise  cont in uous  dat stre a m   in  nea re al   t i m using  te chniques  var y ing   from   ta sk  aut om at ion,   data  pre proc essing  and   dat ana l y sis  to  m ac hine  le arn ing  using  fee dforward  artif ic i al   neur a netw orks.  The   proposed  sy st em   handl es  th ac qu isit ion,  clea n ing,  proc essing,   nor m al iz ing ,   and   pr edi c ti ng  of   Pollut ion  D at a   i our  a rea of int ere st of   Morocc o .   Ke yw or d:   Air p olluti on   Data ag gregati on   Data analy sis   Data p r ocessin g   Deep l ear ning   Copyright   ©   201 8   Instit ut o f Ad vanc ed   Engi n ee r ing  and  S cienc e   Al l   rights re serv ed .   Corres pond in Aut h or :   Moh am ed  A kra m  Zayt ar,   Dep a rtm ent o f Info rm at ic s,   Lab or at ory   of   I nfor m at ic s System s an Tel ec omm un ic at ion s ( L IS T ),   Abdelm al ek  Essaadi  Un i ver sit y, PO. Bo x 4 16, T an gier, M orocc o.   Em a il Me dA kram Zaytar@gm ai l.co m       1.   INTROD U CTION   Ov e the  la st   deca de,   Air  Po ll utio e nv i ronm ental   thre at sign ific a nt ly   increased  [1 ] - [ 4],  a nd   Cl i m a te   chan ge   eff ect beca m m any  and   wide  rangin [ 5].  The re  is  no  do ub t hat  excessive  le vels   of   ai po ll utio a re  c ausin lot  of  dam age  to  hu m an  an anim al   healt as  we ll   as  to  the  wi der   e nvir on m ent.  F or  these  reas ons,  caref ul  sci entif ic   researc a nd  m on it or in of  ai poll utants  i neces sit that  m us be  e xerci se with a  great  d e al  o f  att ention  and preci sio n.   Nowa days,  as   m uch   as  we  wan t quic kl evaluate  an co ncl ud from   existi ng   poll ution  a nd   cl i m at e   data,  m os of   the  prob le m we  fac center  ar ound  prep arin g,   cl eanin g,   proces sing,  an tra nsfo rm ing  the  la rg am ou nts  of   ra en vi ronm ental   data   we  receive  fro m   sat ellit es   in  near   real  tim e.  In   ou case,  th raw  data  ta kes  m ulti ple  pr im it iv form at su ch  as  BUFR  ( Bi nar U niv e r sal   Fo rm   fo t he  Re prese ntati on   of   m et eor ologica data),  GR IB  2,  HRIT/LR IT,   HRPT/LR PT in  this  pa per,  w are  goin to  pr ese nt  syst em   for   proc essi ng  BU FR  base bi na ry  file c om ing   directl f ro m   the  sat el li te ’s  sens or s   an tra ns f or m   it   into  data  set  that is rea dy  f or  data anal ysi s sp eci fic ta sk s li ke s in fer e nce a nd v is ualisa ti on .   The  m ai so urce  of  the  dat we  process  is  EUMETS A T.  EUME TS A is  a inte rgov e r nm ental  op e rati onal   sat el li te   agen cy   w it total   of 3 Eu ropea Me m ber   Stat es.  The  organ iz at io n’ s   m issi on   sta tem ent   is  to  gather   acc ur at an reli a ble  sat el li te   dat on   w eat her,  c lim a te   and   the  env i ronm ent  aro un the  cl oc k,  and   to d el ive t hem   to it s m e m ber  an d co operati ng stat es, i nter na ti on al  partne r s,  a nd to use rs world - wi de [6] .   The  data  we  ar m os interest ed  in   com es  di rectl from   t ype  of  sat el li te nam ed  Me to p.   Me t op  is  a   series  of  thre po la orbiti ng  m et eor ologica sat el li te s,  we  cur ren tl get  da ta   from   two  of  them Me top - a nd   Me top - B they   bo th  a re  in  lowe pola or bit,  at   an  al ti tu de  of  ap prox i m at ely  81 kil om et res,   they   pro vid e   Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       Met Op Satel li t es Data  Pr oces sing f or   Air P ol luti on  M onit ori ng  i M orocc o   ( Mo hame d A kram Z aytar )   4585   detai le obser va ti on of   the  gl ob al   at m os ph e re,  oc eans  a nd  con ti ne nts.  T he   la st  sat el l it e,  Me top - C is   pl ann e to b e  lau nched   in 20 18.   The  syst em   transfo rm the  data  from   i ts  pr im itive  BUF fo rm at wh ic is  bin ary   data  form at  m ai ntained  by  the  w or l m et e orolo gical   orga nizat ion t c om m separ at ed   file (CSV).  T he   BUFR  form at   is   so m ewh at   co ntr ov e rsial   a nd   hard - to - wor k - with  da ta   for m at   becau se  of   the  dif ficult of   m anipu la ti ng  an exp e rim enting wit it s e ncode d values   Our  pro posed   so luti on  is   s of t war syst em   co m po sed  of  m ulti ple  st acked  la ye rs.  The   first  one   deco m pr esses  and   processes t he  BUFR b i nar y data, d eco de s it , s tructur es  and  c om bin es it s d ecoded m es sages  unde the CS V  ( com m a separ at ed  value s)  f orm at , an final ly  n or m al iz es i t. Bec ause d ee le arn i ng m od el s ar us e in  dif fer e nt  cl i m at e   rela te pro blem s   [7 ] - [ 9],  we  trai ned   a nd   m easur e the  pe rf orm ance  of   an  ANN   base arc hitec ture   w he fill in m issi ng   val ue   points  a nd  in te rpolat ing   ne on es T he  sy stem   pr od uces  nea r   con ti nu ous  data stream  o t he  2 - D su rf ace  of  our area  of int erest.   The  s of tw are  so luti on  propo sed  by  this  pa per   is  syst e m   that  c an  be   directl plug ged   i nto   the  endp oin ts  of  th nea real  ti m data  st ream i will   al low  f or  fast  e xperim e ntati on  an vis ualiz at ion   of  al read y   processe r aw  data  points  c om ing   directl f ro m   the  Me top - sat el li te series,  it   will   al so   res ult  in  s pa ce  an tim red uction  and   optim iz at i on   si nce  it   fo c us es  on   inte res areas,  we  l ook  f orward  f or  our  s olu ti on  to   further  i m pr ove a nd a ccel erate t he re search  pr ocess done  on to p o f t he  E UMETC AS data st rea m  p ipeli ne.       2.   PRO CED U R E   2.1.   Data Pr ocessi ng   The follo wing  fig ur dem on st rates the  proce dure ta ken to  pre - process  and  norm al iz e the d at a :           Figure  1. Dec odin B UF Da ta  to  Com m a separ at e m erg e m essages       In  the  first  ste p,   t he  syst em   gets  the   ra ta file t hro ugh  the  FTP  prot oc ol,  a fter  e xtra ct ing   t he  c om pr e sse file we  get  m ulti ple  Bi nar BUFR  file wh ic f ollow   stric na m ing   c onve ntion   in  the  fo ll owin form   (INSTR UME NT _ID - PR O D UCT_T Y PE - P ROCESS ING _L EV EL - S PA C ECR AF T _ID - SEN S I NG_ST ART - SEN S I NG_E N D - P R OCES SING _MO DE - D IS P OSITI O N_M OD E - PR OCESSIN G_ T IM E)   that  co rr e sp on ds   to  m ulti ple  i m portant  va riabl es  su c as  t he  instru m ent  ide ntifie r,  orbit,   a nd  ti m fr a m e,  the  syst em   filters  th data  do wn   t get  poll utio f il es  in  the  ti m the  sat el li t is  scan ning  the  area  of  in te rest  us in re gu la r   expressi on on   the  nam es  of   the  ex tr act ed  fil es  (un der   the  poll ution   c ode  nam of   ”TR G” ).   Wh at   we  fin al ly  get are  m ulti pl e BUFR  poll ution   file s corre s pondin to  the  area  of  i nterest  that are  r ea dy  to b e  d ec oded .   In  the  seco nd  ste p,   t he  syst e m   us es  thir pa rty   softwa r so l ution  na m ed  BUFR E xt ract  [ 10 ]   t decode  t he  B UF file i nto   bul ks   of  e xport ed  m essag es,  each   m ess age  c on ta ini ng  desc riptio of   it s   colum ns   an t he  val ues  in   each  on i a   te xt  file   for m at .   In   the  t hi rd   ste p,   the  s yst e m   per form fast   m erg e/ sel ect ion   te ch niques  t com bin al of   t he  m essages  into  tw c omm separ at ed  f il es  cor res pond ing   to   the  scan ning  ti m efr am e,  on for  the  Me t op - sat el li te   and  the  seco nd  f or   Me top - B Bot CS file c onta in   the foll owin c olu m ns  of  inte r est :         Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  8 , N o.   6 Dece m ber   201 8   :   4584   -   4592   4586   Table  1.  E xtrac te Feat ures   No .   Featu re   Un it   1   Year   Integ er   2   Mon th   Integ er   3   4   5   6   7   8   9   10   11   Day   Ho u r   Minu te   Seco n d   latitu d e   Lon g itu d e   CH4  Dens ity   CO2  Dens ity   N2 O Dens ity   Integ er   Integ er   Integ er   Integ er   DEGRE E   DEGRE E   k m . m - 2   k m . m - 2   k m . m - 2       Af te r   ex portin the   neces sar values  i nto   m ul ti ple  structur e CS file s,  the  syst em   groups  r ow s   by   locat ion  points   an the  e xact d at ( Year - Mo nth - Day -   H our - Mi nu te - Sec ond)   a nd  a pp li es the  m ean  functi on  on   the  poll utant  va lues  to  ta ke  the  ave rag of   po s sible  re dundant  m easur e m ents.  In   the  f ourth  ste p,   the   sy stem  deals  with  cl ea ning  data  point that  are  substanti vely   unreas on a ble  us i ng   l og ic al   co ndit ion on  data  po i nts  of   CH 4 ,   CO a nd  N 2 us i ng  Z - s cor es . Last ly t he  syst em   no r m al iz es  al po ll ution  points   in to  va lues  i [− 1,   1]  to   acce le rate co nver ge nce in t he  t rainin g p hase s,  usi ng the  fol lowing  f or m ula fo al l t hree  num erical  v ariables :      ( )  ( )      ( )   { 1 , 2 , 3 } , { 1 , . . . , }     As  ge ne ral  de scriptio of  t he  pro cess,  ea ch  hal an  hour,  the  syst em   receives  one  c om pr essed  ta file   throu gh   th serv e rs’   e nd   po i nts,  the  syst e m   autom a ti ca ll deco m pr esses  the  file   into  BUFR  BIN,   s el ect s   file cor r esp on ding  to  the  are of   interest a nd   decodes  the m   us ing   thir pa rty   li br ary  (BUF Re xtract)   to  the   corres pondin m essages   an tur ns   them   into  two  CS file con ta ini ng   al of   the v al ues  of  interest   in  ne ar  real   tim e,  this  res ul ts  in  c onsid erab le   re du ct io i the   dim e ns io nalit of  the  data  a nd  th sp ace   it   no r m al l occupies.   The  seco nd  pa rt  of   the  syst e m   fil ls  the  m issi ng   va lues   in  the  2 - s urface  of   inte r est   and   al so   gen e rates new  d at points usi ng   al gorithm ic   search  a nd  a ne ur al  n et w ork  arch it ect ure  to g et   nea c on t inuous  data stream  o ut pu t t hat is r ead y for e xp l or at i on, visuali sat io n,  a nd inte rpret at ion .     2.2.   Int el li gen In t erpola tio n   The  pre dicti on  of   m issi ng   values  is  based  on   th ree  pre - trai ned   Fee d - F orward  F ully   Connect e Neural  net wor m od el fit  to   fill   the  m issi n values  i the   2 - s urface  of  our  i nterest  f or  the  t hr ee  poll utant s   (CO 2,  C H4, a nd  N2O), a nd th e g e ner a l a rc hitec ture of o ur  ANNs  is  as  s how i Fi gure  2.           Figure  2. The   ANN Arc hitec ture  to pre dict  m issi ng  v al ues       As  a a ct ivati on  f unct ion  f or  our  m od el ,   we  c hose  t he  recti fier  functi on.   T he   ge neral   process   i wh ic sel ect ed  m issi ng   po i nts  are pre dicte d   ( or not),  is   s hown   as  Fi gure  3 :   Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       Met Op Satel li t es Data  Pr oces sing f or   Air P ol luti on  M onit ori ng  i M orocc o   ( Mo hame d A kram Z aytar )   4587       Figure  3. The   Fil li ng  m issi ng  points  Proced ur e       The  syst em  p re dicts m issi ng   va lues foll owin this  pro ce dur e :   1.   Ma al l m issi n g values  w it h t he nearest  100  neig hbor  value s.   2.   So rt  points i n f un ct io n o the   nu m ber   of n ei ghbo rin m issi ng   po i nts a nd th e ave rag e  d ist a nce, givi ng a  new sc or f or  e ach m issi ng  po int i the  fo rm   of :    =           3.   If  t he  T op m iss ing   point’s  av e rag e  d ist anc e f ro m  all  n ei ghbor  points is  gre at er th a n 50 km , o if the re is   no to m issi ng   po i nt, brea t he  loop  a nd  fini sh  t he pr ocess.   4.   If  t he  a ver a ge dist ance is less  than 5 0km , p r edict  the m issin g p oin us i ng  the AN Ns  m odel s and m ark  th po i nt as  done  a nd lo op b ac t ste p 2.   The  syst em   autom a ti cal l lo op over  thes ste ps   unti al l   m issi ng   val ues  a re  fill ed  (for   possible  pre dicti on s ),   the syst em  r epeats t his wh ole pro ce dure  f or   the th ree  po ll ut ants  of  i nterest.       3.   RESEA R CH MET HO D   3.1.   Data De scri pti on   The  first  Data set   us ed  in  this  stud was  colle ct ed  in   the  fo rm   of   bu lk of   BUFR  m essage  file s   com ing   directl fr om   two  sat el li te s,  Metop - a nd   Me to p - B,  an preci s el fr om   the  In f rar e at m os ph e ric  so un ding  inte r ferom et er  (I A SI sens or,  w hich  is  c om po sed  of   Fouri er  trans f or m   sp ect r om et er  a nd   a associat ed  in te gr at e Im aging  Subsyst em   (I IS ).   T he  F ourie tran sf or m   sp ect ro m et er  pr ov ides  inf rar e s pectr a   with  high  re so l ution bet wee n 645 a nd  2760c m - (3 . 6m  to  15. 5m ).   The  m ai goa of  I ASI  is  t pro vid at m os phe ric  em is sion  sp e ct ra  t der i ve  te m per at ur e   a nd  hu m idit pr of il es  with  high  ve rtic al   reso luti on   a nd  accu rac y.  Additi on al ly   it   is  us ed  f or   t he  dete rm inatio of  trace  gas es  s uc as   oz one,  nitrous  oxide,   an ca rbo dioxide,  a well   as  l and  an sea  s urface  te m per at ur e   a nd   e m issi vity  an d cl oud pro per ti e s.   IA S m eas ur es   in  the  infr a red  par of   th el ect ro m agn et ic   sp ect r um   a h or iz on ta res olu ti on   of   12   km   ov er  sw at widt of  about  2,  200km W it 14  orbits  in  su n - syn chro nous   m id - m or nin orbit  (9: 30   Local  S olar  Ti m equ at or  cr ossi ng,  de scen di ng   node globa ob se r vations  can  be  pr ov i de twic day  ( ever 12  h our s),   the sate ll it es   ta ke  a rou nd   25  m inu te to  scan  The   area  of   interes t,  we  get  po ll ut ion   data  f ro m   po i nts   appr ox im at ely   20   km   apar fr om   each  oth e r.We  co ns tr ucted  the  sec ond  dataset   from   a lready  prep ro c esse data  points  i t he  go al  o f   trai ni ng ,   te sti ng,  a nd v al idati ng  ou ne ural   net wor m od el an s olv t he  prob le m   of   fill ing  m issi ng   data points  and  inter po la ti ng  ne w po i nts in  th e sele ct ed  a rea  of interest .     3.2.     Int el li gent I n terp ola ti on     We  ge ne rated  new   em pty  po i nts  val ues  in  w hich  al of  the  po i nts  in  the   ar ea  of   i nterest  a re  dista nce from  each  othe r by 5 km , th e s yst e m  then  inte ll igently  interpolat e all  em pty  points.     3.2.1.   D ata Col le ction   We  c ollec te 150  Giga byte of  prep r ocesse data  or  the  e qu ivale nt  of  ar ou nd   800  m i ll ion   data  point   to  bu il an  int el li gen m od el   capab le   of   pre dicti ng   m issi ng   poll utant  val ues.   Af te c ollec ti ng   the  data   set we  ran   gen e ral  sta ti sti on   m i ssing   data  poi nts  an we  present  the  f ollo wing  res ults  ba sed  on  the  sa m pled  dataset   as s ho wn in T able  2 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  8 , N o.   6 Dece m ber   201 8   :   4584   -   4592   4588   Table  2.  Mi ssi ng  Val ues  i th Data Set   No .   Po llu tan t   % o f   m iss in g  valu es   1   N2 O   0 .00 3  %   2   CO2   7 2  %   3   CH4   7 1  %       3.2.2.   Tr ainin g and tes ting  da t a   The  data  wa trans form ed  into  ta ble  w he re  the  featu res   are  the   50  ne arest  points  a nd  the   ta rg et   var ia ble  is  the  data  point  us e to  trai the  art ific ia neu ral  ne twork the  dis ta nce  betwee the  ta rg et   point   and  the  f urt hest  point  set   t a   m axi m u m   and   t he  sam con diti on we   a pp li ed   w hen  sel ect in va li m issi ng   points   wer e   ap plied   w hen  tra nsf or m ing   the   da ta .   Wh e tr ai nin the   m od el   to  predi ct   ne po i nt  val ues   (Inter po la ti on) ,   the  syst e m   add ne points  (m ark ed  m issin g)  so   that  ev ery  po int  ha po int  at   le ast  km   near   t he  ne xt  one,  a fter  creati ng   ne gri ds   of  2 - points,  tr ai nin set we r sel ect ed  base on  a vaila bili ty   of  the n ei ghbori ng  po i nts.     3.2.3.   Tr ainin g   M od el s   co nsi sti ng   of  f ully   connecte hid de la ye r with  10 0,  50,   an 25  neurons   r especti vel y   wer us e d,   the  first  m od el const ru ct e to  pr e dict  m issi ng   an co rru pted  val ues  an the  la st  we re  trai ne to  inter pola te  new  po i nt v al ue s,  the  traini ng  detai ls are  giv e n   as :   a.   All  of  the   ne uron s   pa ram et ers  were  ra ndom l init ia li zed  usi ng   t he  un i for m   distribu ti on   betwee 0.1  a nd   +0.1.   b.   The  Mi ni - Ba tc h gr a dient  Des cent wa s   us ed  to op ti m iz e the p aram et ers.   c.   le ar ning  rate  of ε= 0.001 wa s chose n.   d.   Ba tc hes  of  1024 sam ples and  200  e poch we re traine d.     3.2.4.   V alida tion   Fo r   the  validat ion   t be  ef fici ent,  we  us ed   10 - fo l cr os s   va li dation  te c hn i qu e s plit ti ng   t he  data  set   into  m ulti ple training an te sti ng sets to  v e rif y t he  ef fici enc y of t he  trai ne d m od el s and to   avo i d ov e rf it ti ng.     3.2.5.   I nt er po l at i on   Metho d   The  syst em   us es  three  pr e - tr ai ned   neural  ne twork  m od el s   to  pr e dict  ne wly  gen e rated   po i nts  an interp olate   the   whole  s ur face.   The   pr ocess  is   sim il ar  to  the   proce dure  of  predict in m issin val ues,  ho w ever,   the  syst e m   do esn’ set   thre sh ol on  the  a ver a ge  of  dista nces  in  or der   t o   break  the  l oop  of   pr e dicti ons.  I pr e dicts  an f il ls  al new   da ta   po i nts  at   fixe nei ghbouri ng   dista nc of   5km t he  f ollo wing   gr a ph   dem on strat es t he pr ocess   as s how in  Fig ure  4 .             Figure  4. I nter po la ti on  by Fe ed - Forwa r d Ne ur al   Netw orks   The  syst em   pr edict al po ints  and   up dates  the  sorte li st  of   m issi ng   po i nts  as  it  go es  unt il   filling   al of  t he  m issi ng   values the  on l diff e ren ce  t ha this  m od el   ha ve  wit the  previo us   on is  t hat  it   do es   not  hav a   crit eria f or wh et her  t o pr e dict a m issi ng  poin t or n ot.     3.3.   Be nchma r kin g   To  m easur the  per f orm ance  of   our  A NN - ba sed  inter pola ti on   syst em we  be nc hm ark   it pr e dicti on s   against t wo stat e o f  the a rt alg or it hm ic   m et ho ds   of sp at ia l i nt erpolat ion,  Kernel sm oo thin g and K rigi ng.   Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       Met Op Satel li t es Data  Pr oces sing f or   Air P ol luti on  M onit ori ng  i M orocc o   ( Mo hame d A kram Z aytar )   4589   3.3.1.   Kernel   Smoot hing     kernel  sm oo ther  is  sta ti st ic al   te chn iqu for  est i m at ing   real  valued   f un ct io f (X)   (   R p)   by   us in it no isy   ob s er vations,  wh e no  pa ra m et ric  m od el   fo this  f unct io is  known Th est i m a te functi on   is  sm oo th,  a nd  th le vel  of   sm oo th ness   is   set   by   sin gle  pa ra m et er.  T put  i in  m at he m ati cal   te rm s,  the  idea  of  the  nea rest  nei ghbor  sm oo the is  the  f ollo wing.  F or   eac point  Xi ta ke  N   near est   neig hb or a nd  est im a t the   value  of  F(Xi)  by  aver a ging  the  values  of   th ese  neighb or s .   This  ty pe  of   in te rpolat ion   is  m os t   app r opria te   fo r   low - dim ensions  (p   3)   (the  dim ension al it cur se  [ 11 ]   is  on rea son  f or  tha t).  Actuall y,  the  ker nel  s m oo ther   represe nts  the   set   of  ir regula data  po i nts  a sm oo th   li ne   or  s urface,   i our  case  (2 - s urface thi is  perfect ly   reas on a ble  s olu ti on.   O ne  way  to  fill   these  points  w ou l be   to  us Scip y’s  [ 12 ]   ( pr ec ise ly  sci py.inter po la te .Rbf im ple m entat ion   of  Ra dial  Ba sis  Functi on  inter po la ti on  wh ic is  inte nd e for  t he   sm oo thing /i nte rpolat ion o sc at te red   data.     3.3.2.   Gaussi an Pr ocess Re gr ession  or Kri ging   Kr i ging  or  Ga us sia process  regressio is  m et ho of   inte rpolat ion   i w hich   the  inte rpolat ed  val ue s   are  m od el le by  Ga us sia process  gove r ned   by  pri or  c ov a riances as  oppose to  pi ecewise - poly nom ial  sp li ne  ch os e to  opti m iz s m oo t hn e ss  of  th fitt ed  values.  Under   s uitabl assum ption on   the  pr i or s kr i ging   giv es  t he  be st  li ne ar  un biase pre dicti on   of  the  inte rm ediat values.   In t erpolat ing   m et hods   base on  oth e crit eria  su c as   sm oo thn ess   m ay   no yi el th m os li kely   i nterm ediat values.   T he  m et ho is  wi dely   use i the  dom ai of   sp at ia anal ysi and   c ompu te ex pe rim ents.  T he   te c hn i qu is  al s kn own  as  W ie ne r   Ko lm og or ov   predict io n.   We’ l com par the  r esults  of  K rigi ng   i nter po la ti on  on  the  datase us in the  G a us sia Pr oc ess Re gr es sion i m ple m entat ion  in  t he Py thon’s sci kit - le arn li br a ry.     3.4.   Ha rdw are   Pyt hon  im pl e m entat ion   of   t he  dee ne ur al   networ arch it ect ur with  hidden  la ye rs  of  100,  50,  25   nu m ber   of  ne uro ns   (r es pecti ve ly ),   G oogle’s   Tens orFlo [ 13]   li br ary  was  us e to  buil a nd  trai t he  m od el .   An  N V IDIA  T esl K 80  sin gl GPU   de vice,   with   49 92  C UDA  c ores,   24  GB  of  G D D R5  m e m or y,  and  48 GB/s ag gregat e m e m or y bandw i dth   was  u s ed  to  train  the  neural  netw ork  m od el s.       4.   RESU LT S  AND DI SCUS S ION   The  res ulti ng   s olu ti on  is  sys tem   co m po sed  of   th ree  la ye rs  of   pr ocesses,  t he  first  la ye deco m pr ess,   decode,  a nd  no rm alizes  the  data.  the  s eco nd   l ay er  is  three  ANN  sta ck  t fill   in  the  m issin poll utant  va lues ,   and   la stl the  final  la ye w hi ch  is  com po se of  a no t her   sta ck  of  neural  netw ork  m od el to  inter pola te   ne w   data points  in o ur area  of inte r est .     4.1.   Data Pr ocessi ng   The  deco m pr e ssing dec odin g,   m erg in g,   cl eanin a nd   no rm alizi ng   of  Ra BU FR  dat resu lt   in  a   consi der a ble  r edu ct io in  res ources.  Si nce   our  al gorithm   runs  in  li near   tim e,  and   con si der i ng   the  vol um of  data  the  syst em   pr ocesses  at   each  ste p,   sim ple   co m pu te r   config ur at io (4   Gi ga byte   R AM,  co res  w it no   par al le li sm resu lt  in  t he  f ollo wing  durati ons   as s how in  Fi gure  5.           Figure  5. A verage  durati on  of the  pr e process ing   sta ge       These  te sts  we re  co nducte m ul ti ple  tim es  for  each  vo l um cat ego ry,  to  ens ure  high  pr eci sio n.   We   con cl ud t hat  the  syst em   scales  pr et ty   well   and   ca proces la rg vo l um e of   data  ( up  to  te ra byte per  hour )   in r e la ti vely  s hort  durati on  of  tim e.   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  8 , N o.   6 Dece m ber   201 8   :   4584   -   4592   4590   4.2.   Int el li gent In t erpola tio n   The  res ulti ng   s urface  of  inter est   is  18 87  by   1776  km rectang le t he  sy stem   pr edict m axi m u m   nu m ber   of  12 3,568  points,  t he  fo ll ow i ng   f igures  showca se  exam ples  of   pr e dicti ons  in  fixed   dat e,   us ing  kr i ging,  sm oo t hi ng a nd ou r n eur al   netw ork m od el  as shown  in  Fig ures  6,   7,   8.           Figure  6. I nter po la ti on  visu al isa ti on of N2 O           Figure  7. I nter po la ti on  visu al isa ti on of CH 4           Figure  8. I nter po la ti on  visu al isa ti on of CO 2       In  t he  a bove figures, t he ro un ded m ark ers  re pr ese nt a  know sam ple o f p ol luti on   data poi nts,  a nd the  interp olate surface  re pr ese nt   the  the   res ulti ng  pre dicti on s.   W got  the  f ol lowing  trai ning  r esults  a fter  cro s s   validat in the  m od el s   as  sh own  in  Fig ur es  9   an 10.  As  e xp ect e d,   the  s yst e m   pr oduce bette res ults  wh e fill ing   m issi ng   values a nd  ge ner al ly   w or s e   res ults  w hen  fill ing   in  ne w   data  po i nts.  but  w he com pa rin g   interp olate da ta   us in the  m et ho ds,  we  fi nd   i nteresti ng  resu lt s,  t he  f ollow i ng   grap s h owcases  t he  r esults   of com par iso ns.       Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N:  20 88 - 8708       Met Op Satel li t es Data  Pr oces sing f or   Air P ol luti on  M onit ori ng  i M orocc o   ( Mo hame d A kram Z aytar )   4591         Figure  9. Com par i ng the acc uracy  of  diff e re nt  m od el s u sin g M SE     Figure  10. Acc ur acy   of the  sugg e ste d In te rpolat ion   Me thods       4.3.   Discussio n   As  we  can   se from   the  resu lt s,  the  optim al   interp olati on  te ch nique  is   generall bette tha our   trai ned   ne ur al   netw ork  m odel s,  howe ve r,   in  the  case  of   N2O  a nd  C H4   we  ca sa that  our  m od el   is  com petit ive  with  the  oth e tw cl assic al   2 - D   interp olati on  al gorithm s,  and   since   we  ha 70%  m issi ng  data,   that  op e ns   the  po s sibil it of   be tt er  per f orm a nce  with  gr eat er  volum es  of   data,  if  trai ne on   la r ger   vo l um es  of   data,  our  syst e m   can  m ake  bette pr e dicti ons   an the refor introd uce  an   optim al   so luti on  an c om petito t the krigi ng or s m oo thing  i nter po la ti on al gorithm s.       5.   CONCL US I O N   At  the  prese nt  tim e,  t he  siz e,  var ie ty   an co m plexit of   ra data  is  hu ge   and   c onti nu es   to  increas e   ever day.  T he   us e   of  data  processin syst em to  store,   process,   an a na ly ze  data  strea m has  change ho w   we  disco ver  a nd  vis ualise   bi data  in  ge ne ral.  I n   t his  pa pe r,   we  pr ese nt ed  s oft war e   so luti on  c om po se of  m ul ti ple  sta cked   la ye rs  of  s ubsyst e m that  tr ansfo rm   and   process  c on si derable  volum es  of   ra poll utio dat a   in  near  real  ti m e,  ta king  the  data  from   it s   native  com pr essed  form at  to  structu re d,   cl ea ned,  norm al ized an con ti nu ous  data stream  that is l igh t a nd easy   to expe rim ent  with.   In   the  f uture,  sign ific a nt  cha ll eng es  an pr ob le m con cer ning  Bi En vironm ental   Dat m us be   addresse by  the  industry  a nd   aca dem ia current  work   on   t op ic rangin f ro m   util iz ing   AI   f or   plant   m on it or ing   [14 ] work i ng   on  so ci al   awar e ne ss  co ncernin cl i m at chan ge   [15,   16 ] a nd  the  use   of  bi ologica m et ho ds   [ 17 ]   to  fi gh cl im at change  is   i m po rta nt.  B ut  ne c halle ng e to  ta c kle   are  in   the  fi el of  env i ronm ental  data  sci ence,   fu tu re  w ork   fo c us e on  how  to  bu il new   e nv i ron m ental   data  l earn i ng   par a dig m s,  sci ent ific   com p uting   e nv i ron m ents,  and   a al aro un bette infr as tructu re  f or   poll utio m on it or ing i s a  n ecessi ty  for a ll  o f us.       ACKN OWLE DGE MENTS   The  aut hors  a re  than kful  to   the  Mi nistry  of   Higher  E ducat ion   an Sci entifi Re sear ch,   an the   Nati on al   Ce ntr for   Scie ntific   and  Tech nic al   Re search  (CNRST)  f or   fun ding  this  st ud y unde the  pr oj ect :   PPR/ 2015/7 .       REFERE NCE S   [1]   Le lieve ld,   J. ,   E vans,   J.  S.,   Fnai s,  M.,   Gianna d a ki,   D.,   &   Poz zer,  A The   contributi on  of  outd oor  ai poll u ti o source s to  p rema ture   m ortality   on   g lobal  sca le Nature ,   2015 52 5(7569):   367 - 37 1.   [2]   Agus ci k ,   A.,   Ik ob,   R. ,   Putra ,   S.  A.   The   Le vel   of  Malond ia ld eh y de  in  Pe ople   Exposed  t Air  Pollut ion Inte rnational   Jo urnal  of Publ i c Healt S ci en ce ( IJP HS) ,   2017 ;   6( 1) :   99 - 103.   [3]   Haja t ,   A. ,   Alli so n,   M.,   Diez - Rou x,   A.  V. ,   Jenn y ,   N.  S.,   J orge nsen ,   N.  W . ,   Szpiro ,   A.  A.,   Kaufm an,   J.  D . .   Long - te rm   exposure   to  ai poll uti on  and  m ark ers  of  infl amm at ion,   coa gul at ion ,   and   endot helial   a ct i vat ion:   r epe a t - m ea sures  ana l y s is  in  the   Multi - Et hnic   Stud y   o f   Ather oscl ero sis  (MESA ) Epi demiol ogy  ( Cambr idge ,   Mass . ),   26(3),   310 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  8 , N o.   6 Dece m ber   201 8   :   4584   -   4592   4592   [4]   Bee l en,   R. ,   Raas chou - Niel sen,   O.,   Stafoggi a ,   M.,   Andersen,   Z .   J.,   W ei nm a y r ,   G.,   Hoffm ann,   B. ,   . . .   Vine is,   P.   Eff ec ts  of  long - te rm   exposure   to  ai pol lut ion  on  nat ura l - ca us e   m orta li t y an  a naly s is  of  22  E urope an  cohor ts  withi th m ulti ce ntr e ESCA PE  proje c t The  La nce t 2014 383( 9919) :   785 - 795.   [5]   Pio,  D.  V.,   Engler,   R. ,   L inde r ,   H.  P.,   Monadj em, A . ,   Cott eri l l,   F. P . ,   Tay l or,   P.  J. ,   . . .   Sal amin,   N Cli m at cha ng e   eff ects  on  ani m a and  pla n ph y l ogene t ic   div ersity   in  southern  Af ric a Global  Ch ange  Bi olog y,   2 014;  20(5),   1538 - 1549.   [6]   EUMETSAT,   ht tp: // ww w.e um ets at . in t/ websit e/ h om e/ AboutUs /i ndex. html,   13  05   2017.   [7]   Moham ed  Akram   Zay t ar,   Chak er  El   Am ran i,   Sequenc to  Seq uenc W eathe Forec asti ng  with   Long  Short - Te rm  Mem ory   Re cur r ent   Neur al  Net works . ”  Int ernati onal  Journal  of  Computer  A ppli cations 201 6 Volum 143   -   No.11 .   [8]   J y othi,  M.  N.,   D ina kar ,   V.,   T ej a,  N.  S.  R. ,   Kishore,   K.  N NA RX  Based  Short  Te rm   W ind  Po wer  Forec asti ng   Model Indone s ian  Journal   of   Elec tri cal   Engi n eer ing  and  Compu te r Sc ie nc e 201 5 15(1):   20 - 25.   [9]   Khale l ,   S.  I . ,   R a hm at ,   M.  F. ,   Mus ta fa,  M.  W .   B Sensoring  Le ak age   Cur ren to  Pred ict  Pollut ion  L evels  to   Im prove   Tra nsm ission  Li ne  Model   vi AN N Inte rnationa J ournal  of  Elec tr ic al  and  Compu te Engi n ee ring ,   2017 7(1):   68.   [10]   BUF File   Support  Software ,   h ttp:// ww w.e ln at h . org. uk/, 13  05   2 017.   [11]   Bac h,   F.   Breaking  the   cur se  of  dimensional ity   with  conv ex  neur al   ne tworks Journal  of  M achi ne  Lear nin g   Re search 2014 18(19) :   1 - 53 .   [12]   Jones,  Eric, T r av is Ol ipha n t, a nd  Pear Pet erson.   SciPy op en  so urc sc ie n ti fi t o ols f or  P y thon.”, (2004).   [13]   Abadi,   Martn ,   e al.  Te nsorflo w:  La rge - sc ale  m ac hine   l ea rn in on  het ero g eneous   distri bute s y stems . ”,   arXi pre print a rXiv :1 603. 04467  (201 6).   [14]   Ila m at hi ,   P. ,   Sel l adur ai,  V. ,   &   Ba la m uruga n,   K .   Predic ti v m odelling  and   opti m izati on  of   nit rog en   oxide s e m ission   in  coa pow er  p la nt  using  Artif i ci a Neura Ne t work  and  Sim ula te Anne al ing IAE In te rnati onal  Journal  of  Ar ti ficial Int el l ig enc e 2012 1(1) :   11.   [15]   Sulist y awa ti ,   S.,  Nisa,   I.   Cli m at Change   an Hea lt Te en a ger ’s  Perc eption as  Basis  for  Inte rve n ti ons Inte rnational   Jo urnal  of Publ i c Healt S ci en ce ( IJP HS) ,   2016 ;   5( 3) :   267 - 273.   [16]   Montana ro,   T.,  Corno,   F.,   Migl iore ,   C . ,   Cast rogiova nni ,   P.  Sm art Bike an  I oT  Crowd  Sensing  Plat form   for   Monitori ng  Cit Air  Pollut ion Inte rnational   J ournal  of  El ec tr ic al  and  Computer  Engi ne ering   ( IJE CE) ,   2017 ;   7(6) :   3602 - 3612 .   [17]   Ghane m i,   A. ,   Boubert akh ,   B .   Biol ogical   tool s to  de al   wi th  po llution:   se lecte d   a dvanc es  and  nov el   p erspe ctives Inte rnational   Jo urnal  of Publ i c Healt S ci en ce ( IJP HS) ,   2014 ;   3( 1) :   57 - 62.       BIOGR AP HI ES OF  A UTH ORS           Moham ed  Akram   Zay ta Obt ai n ed  his  Bac h el or  of  Applie Ma th emati cs  and   Co m pute Scie nc degr ee   from   The Fac ulty   of  Scie n ce   and  T ec hnolo g y ,   Ta ngi er  in  2 013.   He  recei ved   his maste r,   in   Com pute S y ste m and  Networki ng  from   the  FS TT ,   in   2016.   Curre ntly ,   a   PhD   student   a th e   FS TT .   His  pri m ar y   rese arc i nte rest  are   in  Data   Sci ence,   Artifi c ia In te l ligence,  Mac h ine   Le arn ing, Cl oud  Com puti ng,   and   Big  Dat a.               Dr.  Chake r   El  Am ran is  Doctor   in  Mathe m atic al  Modell ing   and  Num eri ca Sim u la ti on   from   the  Univer sit y   of  L i ege ,   Bel g ium  (2001).   He  jo ine d   Abdelmale Essaa di   Univer si t y,   Morocc in  2003.   He  is  cur r ent l y   Cha ir  of  th Com pute Eng ine er ing  Depa rt m ent   at   th Fac ulty   of  Scie n ce  and  T ec hnolog y,   T angi er .   He   lectur es  d istri but e s y stems   and  i prom oti ng  High  Perform anc e   Com puti ng  educat ion  in  th Uni ver sit y .   His  rese a rch   int er ests  in cl ude   Cloud  Co m puti ng,   Big   Data   Mining  a nd  Envi ronm ental  Inform at ion  S y stems .   Dr.  E Am ran is  rese arc has  bee supported  b y   n at ion al   and  in ternat ion al   org anis m s.  Dr  El   Am ran h as  serve d   as  an   activ volunt e er  in  I E EE   Morocc o   Se ct ion .   He  is  cur ren tly   Vi ce   Ch a ir  of  IE EE   Com m unic at ion  and   Com pute Societie Morocc C hapt er ,   and  adv isor  of  the   IE E Com pute Societ y   Student   Branc Ch apt er   at  Abdelmal ek   Essaa di   Univer sit y .   He   is  th NA TO  Partne Countr y   Proje ct  Dire ct or  of  real - ti m remote  se nsi ng  ini ti a ti ve  f or  ea rl y   w arn ing   and  m it iga ti on  of  disaste rs  and   epi demics in Mo roc co.       Evaluation Warning : The document was created with Spire.PDF for Python.