I nd o ne s ia n J o urna l o f   E lect rica l En g ineering   a nd   Co m pu t er   Science   Vo l.   25 ,   No .   1 J an u ar y   20 22 ,   p p .   4 8 1 ~ 4 8 7   I SS N:  2 5 0 2 - 4 7 5 2 ,   DOI : 1 0 . 1 1 5 9 1 /ijeecs.v 25 .i 1 . pp 481 - 4 8 7     481       J o ur na l ho m ep a g e h ttp : //ij ee cs.ia esco r e. co m   The  g eneral  desig n of t h e auto ma ti o n f o r multi ple  fi elds usin g   reinforceme nt  l ea rning  alg o rithm       Vij a y a   K um a Reddy   Ra dh a 1 Ana ntha   N .   L a k s hm ipa t hi  2 ,   Ra v i K um a r   T ira nd a s u 3 ,   P a ruchuri R a v i P ra k a s h 4   1 D e p a r t me n t   o f   I T,   La k i r e d d y   B a l i   R e d d y   C o l l e g e   o f   E n g i n e e r i n g   ( A u t o n o mu s) ,   M y l a v a r a m,   I n d i a   2 D e p a r t me n t   o f   C S E ,   M a l l a   R e d d y   E n g i n e e r i n g   C o l l e g e   ( A u t o n o m u s) ,   S e c u n d e r a b a d ,   Te l a n g a n a ,   I n d i a   3 D e p a r t me n t   o f   C S E ,   K o n e r u L a k s h m a i a h   Ed u c a t i o n   F o u n d a t i o n ,   V a d d e sw a r a m,  I n d i a   4 D e p a r t me n t   o f   I T ,   P r a sa d   V .   P o t l u r i   S i d d h a r t h a - I n st i t u t e   o f   Te c h n o l o g y ,   V i j a y a w a d a ,   I n d i a       Art icle  I nfo     AB S T RAC T     A r ticle  his to r y:   R ec eiv ed   Ma y   2 5 2 0 2 1   R ev is ed   Oct   25 2 0 2 1   Acc ep ted   No v   21 2 0 2 1       Re in fo rc e m e n lea rn in g   is  c o n si d e re d   a a   m a c h in e   lea rn in g   tec h n i q u e   th a is   a n x io u with   s o ftwa re   a g e n ts  s h o u ld   b e h a v e   i n   p a rti c u lar  e n v iro n m e n t.   Re in fo rc e m e n lea rn in g   (RL)  is   a   d iv isi o n   o d e e p   lea rn i n g   c o n c e p th a t   a ss ists  y o u   t o   m a k e   b e st  u se   o so m e   p a rt  o t h e   c o ll e c ti v e   re tu r n .   In   th i s   p a p e e v o l v in g   re in f o rc e m e n lea rn in g   a lg o rit h m sh o ws   p o ss i b le  to   lea rn   a   fre sh   a n d   u n d e rsta b le  c o n c e p b y   u sin g   a   g ra p h   re p re se n tatio n   a n d   a p p ly i n g   o p ti m iza ti o n   m e th o d fro m   th e   a u to   m a c h in e   lea rn in g   so c iet y .   In   t h i o b se rv e ,   we   sta n d   f o th e   l o ss   fu n c ti o n ,   i is  u se d   t o   o p ti m ize   a n   a g e n t’s   p a ra m e ter  in   e x c e ss   o it k n o w led g e ,   a an   imp u tati o n a l   g ra p h ,   a n d   u se   trad it io n a e v o lu t io n   to   d e v e l o p   a   p o p u lati o n   o t h e   imp u tatio n a g r a p h o v e r   a   se o u n c o m p li c a ted   g u i d a n c e   e n v iro n m e n ts.  T h e se   o u tco m e in   g ra d u a ll y   b e tt e RL  a l g o ri th m a n d   t h e   e x p o se d   a l g o rit h m sim p li f y   to   m o re   m u lt ifac e ted   e n v ir o n m e n ts,   e v e n   t h o u g h   with   v is u a a n n o tati o n s.   K ey w o r d s :   Au to ML   C o m p u tatio n al  g r a p h s   L o s s   f u n ctio n   R ec u r r en t n eu r al  n etwo r k   R ein f o r ce m en t le ar n i n g   T h is i a n   o p e n   a c c e ss   a rticle   u n d e r th e   CC B Y - SA   li c e n se .     C o r r e s p o nd ing   A uth o r :   Vijay Ku m ar   R ed d y   R ad h a   Dep ar tm en t o f   I T L a k ir ed d y   B ali  R ed d y   C o lleg o f   E n g in e er in g   ( Au to n o m u s )   My lav ar am ,   A.   P,  I n d ia   E - m ail: V ijay ak u m ar r 2 8 5 @ g m ail. co m       1.   I NT RO D UCT I O N   lo n g - s tan d in g   g o al  o f   r ese ar ch   in to   r ein f o r ce m en lear n in g   is   to   b lu ep r in o f   g e n er a p u r p o s lear n in g   alg o r ith m s   th at  ca n   r eso lv an   ex ten s iv ar r a y   o f   i s s u es.  p r o b ab le  r eso lu tio n   wo u ld   b to   d ev is e   a   m eta - lear n in g   tech n iq u e   th at  co u ld   m o d el  n o v el  r ein f o r ce m en lear n in g   alg o r ith m s   th at  s im p lify   t o   an   ex ten s iv m u ltip licity   o f   jo b s   au to m atica lly .   I n   cu r r en t   y e ar s ,   au to m ated   m ac h i n lea r n in g   ( A u to ML )   h as  ex p o s ed   h u g s u cc ess   in   au t o m ate  th m o d el  o f   m ac h i n e   lear n in g   m ec h an is m ,   s u ch   a s   n eu r al  n etwo r k s   ar ch itectu r es a n d   d esig n   b r i n g   u p   to   d ate  r u les [ 1 ] ,   [ 2 ] .   Th ese  p r ev i o u s   p r o ce d u r es  w er in ten d e d   f o r   s u p er v is ed   l ea r n in g   b u i n   r ei n f o r ce m en t   lear n in g ,   th er is   ad d itio n al  m ec h an is m   o f   th alg o r ith m   t h at  co u ld   b p o ten tial  tar g ets  f o r   m o d el  au to m ati o n   an d   it  is   n o f o r   all  tim clea r   with   th b est  m o d el,   u p d ate  p r o ce s s   wo u ld   b e   to   p u to g eth er   th ese  m ec h an is m .   Pre v io u s   h ar d   wo r k s   f o r   th e   co m p u ter i za tio n   r ein f o r ce m e n lear n in g   alg o r ith m   d etec tio n   h av e   co n ce n tr ate  f ir s an d   f o r em o s o n   d esig n   m o d er n ize   r u les.  T h ese   p r o ce d u r es  lear n   th r ei n f o r ce m en lea r n in g   u p d ate   p r o ce s s   its elf   an d   n o r m ally   r e p r esen b r in g   u p   to   d ate  r u le  with   n e u r al  n etwo r k   s u ch   as  an   r ec u r r en n eu r al  n et wo r k   ( R NN )   o r   co n v o lu tio n al  n e u r al  n etwo r k   ( C NN ) ,   wh ich   ca n   b p r o f ess io n ally   o p tim ized   with   g r ad ien t - b ased   tech n iq u es [ 3 ] ,   [ 4 ] .   T h er is   o n l y   s o m p r o f it  o f   s u ch   an   illu s tr atio n .   T h is   d e m o n s tr atio n   is   co m m u n icativ en o u g h   to   d escr ib ex is tin g   alg o r ith m s   b u also   n o v el,   u n d is co v er ed   alg o r ith m s   an d   also   in ter p r etab le.   T h is   g r ap h   Evaluation Warning : The document was created with Spire.PDF for Python.
      I SS N : 2502 - 4 7 5 2   I n d o n esian   J   E lec  E n g &   C o m p   Sci Vo l.  25 ,   No .   1 J an u ar y   20 22 :   481 - 4 8 7   482   illu s tr atio n   ca n   b an aly ze   in   th s im ilar   way   as h u m an   in ten d ed   r ein f o r ce m en t le ar n i n g   al g o r ith m s ,   m ak in g   it  m o r in ter p r etab le  th a n   p r o ce d u r es  th at  u s b lack   b o x   f u n ctio n   eq u al  f o r   th e   en tire   r ein f o r ce m en lear n in g   u p d ate  p r o ce s s .   I f   r esear ch er s   ca n   co m p r e h en d ,   wh y   lear n ed   alg o r ith m   is   im p r o v ed ,   th e n   th ey   ca n   m u tu ally   a d j u s t   t h e   d o m e s t i c   m e c h a n i s m   o f   t h e   a l g o r i t h m   t o   d e v e l o p   i t   a n d   t r a n s m i t   t h e   h e l p f u l   c o m p o n e n t s   t o   o t h e r   i s s u e s .   F i n a l l y ,   t h e   d e m o n s t r a t i o n   s u p p o r t s   g e n e r a l   a l g o r i t h m s   t h a t   c a n   r e s o l v e   a   b r o a d   d i v e r s i t y   o f   i s s u e s   [ 5 ] ,   [ 6 ] .     Fig u r 1   s h o ws th e   h o r ein f o r n m en t lear n i n g   p r o ce s s   o n   th e   r aw  d ata  to   g e n er ate  r e q u r ien m en t o u tp u ts .           Fig u r e   1.   R ein f o r ce m en t le ar n in g   in   m ac h in lear n i n g       R ein f o r ce m en lear n in g   is   p a r o f   lear n in g   tech n i q u i n   m ac h in lear n in g .   T h ey   ar e   s u p er v is ed ,   u n s u p er v is ed   an d   r ein f o r ce m en lear n in g s   [ 7 ] ,   [ 8 ] .   W d is cu s s   r ein f o r ce m en lear n in g   alg o r ith m   f o r   an   au to m atic  p r e d ictio n .   T h e   p ap er   is   p r esen ted   in   th f o llo win g   m an n e r t h n e x s ec tio n   d is cu s s   th b ac k g r o u n d   an al y s is .   Sectio n   3   d escr ib es   r ein f o r ce m en lear n in g   alg o r ith m   m u tatio n   g r a p h .   An   en v ir o n m en tal  r ein f o r ce m e n lear n in g   alg o r ith m   d escr ib es  in   s ec tio n   4 .   Sectio n   5   d escr i b es  en v ir o n m en tal  lear n in g   alg o r ith m s   an d   co n cl u s io n   in   s ec tio n   6       2.   T H E   P RO P O SE M E T H O AND   B ACK G RO UN A NALYS I S   I n   d ee p   n e u r al  n etwo r k ,   m u lti - ag en ty p es  o f   en v ir o n m e n ts   ar ex tr em ely   d y n am ic,   th ey   i m p ac o n   n eig h b o r s   f o r   alter s   r ap id ly .   T h is   o p er atio n   is   to u g h   to   le ar n   th in ter p r etatio n   b etwe en   th elem en ts .   T h e   co n v o l u tio n al  r ein f o r ce m en l ea r n in g   g r a p h   ac co m m o d ates  th d y n am ic s   o f   th g r ap h   o f   t h n u m er o u s   ag en en v ir o n m en ts ,   an d   t h is   d y n a m ic  k n o wled g im p r is o n s   th e   r elativ b etwe en   ag e n ts   b y   t h eir   r ep r esen tatio n .   Do r m an f ea tu r es  g en er ated   b y   co n v o lu tio n al  lay er s   f r o m   a cc ess ib le  f ield s   ar o p p r ess ed   to   lear n   team wo r k f in ally   d escr ib th p r o p o s ed   m eth o d   s u b s tan tially   p er f o r m s   ex is tin g   tech n iq u es  in   d iv er s ity   o f   co o p er ativ e   s ce n ar io s   [ 9 ] ,   [ 10] .   I n   r ec e n y ea r s ,   r ein f o r ce m e n lear n in g   alg o r ith m s   h as  g ain ed   r is in g   atten tio n   a n d   ef f o r ts   to   g et   b etter   it h av e   g r o w n - u p   s ig n if i ca n t ly .   A   s et  o f   m ea s u r em e n ts   th at  q u an titativ ely   co m p u te  d i s s im ilar   asp ec ts   o f   r eliab ilit y   an d   we  s p o tlig h o n   v ar iety   an d   r is k   f ac to r   d u r i n g   tr ain in g   an d   af ter   lear n in g .   T h ese  m etr ics  ar e   d esig n ed   to   b e   g en er al   p u r p o s with   s tatis tica test s   to   allo m eticu l o u s   co m p ar is o n s   o n   th ese  m etr ics.  W ap p ly   o u r   m etr ics  to   s et  o f   co m m o n   r ein f o r ce m e n lear n in g   alg o r ith m s   an d   th ei r   en v ir o n m en ts   f o r   co m p ar is o n   a n d   a n aly ze   th e   o u tp u [ 1 1 ] .   Gen er ally ,   r ei n f o r ce m e n lear n in g   ag e n ts   with   two   cr u cial   o b jectiv es.  Prim ar y   o n e   is   to   b r in g   to g eth er   o b v io u s ,   r ev ea l in g   an d   s ca lab le  is s u es  th at  im p r is o n   k ey   p r o b lem   in ten d   o f   g e n er al  an d   well - o r g an ized   lear n i n g   alg o r ith m s .   T h s ec o n d   o b jectiv to   lea r n   ag en b eh a v io u r   th r o u g h   th eir   t h r o u g h p u t o n   th ese  co m m u n al  b e n ch m a r k s   [ 1 2 ] [ 1 3 ] .   I n   d ee p   r ein f o r ce m en lea r n i n g   alg o r ith m s   h an d le  with   r o b u s v alu f u n ctio n s   f o r   u n p r o ce s s ed   clar if icatio n   an d   r ewa r d s   f o r   m o d el - f r ee   a n d   m o d el - b ased   lear n in g   alg o r ith m s .   I n   th ese  alg o r ith m s ,   s u cc ess o r   r ep r esen tatio n s   ar d ec o m p o s es  th v alu f u n ctio n   in t o   2   m ec h an is m s th ese  m ec h an is m s   ar r ewa r d   p r ed icto r   a n d   s u cc ess o r   m ap .   T h r ewa r d   p r ed icto r   m ap s   d escr ib to   s ca lar   r ewa r d s   an d   th s u cc ess o r   m ap   p r esen ts   th p r ed ictab le  f u tu r e   s itu atio n   ten u r f r o m   an y   g iv en   co n d itio n .   I n   t h is   co n ce p t,  th v alu f u n cti o n   o f   c o n d itio n   ca n   b ca lc u lated   as  th in n er   p r o d u ct  b etwe en   th m a p   a n d   th e   weig h ts   o f   r ewa r d   p o i n ts .   Mo s t   o f   th ese  ty p es  o f   alg o r ith m s   u s ed   d ee p   s u cc ess o r   r ein f o r c em en lear n in g   ( DSR )   th ey   g en er alize   s u cc ess o r   r ep r esen tatio n s   ( SR )   with in   b ac k - to - ba ck   d ee p   r ein f o r ce m en t le ar n in g   f r am ewo r k   [ 1 4 ] [ 15] .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esian   J   E lec  E n g &   C o m p   Sci   I SS N: 2502 - 4 7 5 2       Th g en era l d esig n   o f th a u to ma tio n   fo r   mu ltip le  field s   u s in g   …  ( V ija ya   K u ma r   R ed d y   R a d h a )   483   2 . 1 .    Reinf o rc e m ent   a lg o rit hm   a s   im pu t a t i o n g ra ph   T h m em o r y   an d   co m p u tatio n   r eq u ir e d   f o r   th Q - v alu e   alg o r ith m   wo u ld   b to o   h ig h .   T h u s ,   d ee p   n etwo r k   Q - L ea r n i n g   f u n ctio n   ap p r o x im ato r   is   u s ed   in s tead .   T h is   lear n in g   alg o r ith m   is   ca lled   d ee p   Q - n etwo r ( DQN) .   T h k ey   i d ea   in   th is   d ev elo p m e n was  th u s   to   u s e   d ee p   n e u r al  n etwo r k s   to   r ep r e s en th Q - n etwo r k   an d   tr ain   th is   n etwo r k   to   p r ed ict  to tal  r ewa r d .   DQN  is   Q - lear n in g   o f   n e u r al  n etwo r k s ,   th m o tiv atio n   at  th e   b ac k   is   m er ely   co n n ec ted   to   b ig   s tate  s p ac en v ir o n m en ts   wh er v ital  Q - tab le  wo u ld   b tr em en d o u s ly   co m p lex ,   d if f icu lt  an d   p r o tr ac ted   task .   As  an   alter n ativ o f   Q - tab le  n eu r al  n etwo r k s   esti m ated   Q - v alu es  f o r   ea ch   ex p lo it  b ased   o n   t h co n d itio n .   Gr ap h s   r ep r esen tin g   n eu r al  n etwo r k   ar ch itectu r es  in s p ir ed   b y   o v er   th s p ac e,   in   r ei n f o r ce m e n t   lear n in g   al g o r ith m s   b y   o n   b eh alf   o f   th lo s s   f u n ctio n   o f   r e in f o r ce m e n lear n in g   alg o r ith m   as  ac cu s atio n   as   a   d ir ec ted   ac y clic  g r ap h   f o r   t h lo s s   f u n ctio n ,   with   n o d es   o n   b eh al f   o f   in p u ts ,   o p e r ato r s ,   p ar am eter s   an d   o u tco m e.   Fo r   e x am p le,   i n   th e   p r o ce s s in g   g r a p h   f o r   DQN ,   in p u n o d es  co n tain   d ata  f r o m   th r ep ea b ar r ier ,   o p er ativ n o d es  co m p r is n eu r al  n etwo r k   o p er ato r s   an d   f u n d am en tal  m ath   o p er ato r s ,   an d   th o u tco m n o d e   r ep r esen th lo s s ,   wh ich   will  b m in im ize  with   g r ad ie n d escen t.  Fig u r 2   s h o h o th s q u ar ed   B ellm an   E r r o r   will b u s ed   to   g et  t h r   r e q u ir ed   o u tp u t.           Fig u r e   2 .   E x am p l o f   s q u ar e d   B ellm an   er r o r   ( 1 6 )       W e   c a n   r e c o g n i z e ,   w h y   a   l e a r n e d   a l g o r i t h m   i s   e n h a n c e d ,   a n d   t h e n   t h e y   c a n   t o g e t h e r   a d j u s t   t h e   d o m e s t i c   m e c h a n i s m   o f   t h e   a l g o r i t h m   t o   a d v a n c e   i t   a n d   t r a n s f e r   t h e   h e l p f u l   m e c h a n i s m   t o   a d d i t i o n a l   i s s u e s .   F i n a l l y ,   t h e   i l l u s t r a t i o n   s u p p o r t s   g e n e r a l   a l g o r i t h m s   t h a t   c a n   r e s o l v e   an   e x t e n s i v e   v a r i e t y   o f   i s s u e s   i n   F i g u r e   2   [ 1 6 ] .   W e   d ev elo p e d   th is   r ep r esen tatio n   u s in g   th e   p y th o n   Py Glo v e   li b r ar y ,   wh ich   a p p r o p r iately   t u r n s   th ex ce e d in g   g r ap h   i n to   in v esti g ate  s p ac th at  ca n   b o p tim ized   with   s ta n d ar d ize  d ev elo p m en t in to   ( 1 ) .     L D Q N = ( Q ε ( S t , a t   ( r t γ   * ma x a   Q ε ( S t + 1 , a ))   ( 1 )     Mo d el - b ased   r ein f o r ce m en t   lear n in g   h as  a   ac tu ally   in f lu en ti al  f r o m   co n tr o t h eo r y ,   an d   th in ten tio n   is   to   g r ap h   t h r o u g h   a n   f ( s ,   a)   co n tr o f u n ctio n   to   ch o o s th e   m o s ex ce llen p r o b ab le  ac ti o n s .   I is   s im ilar   as   r ein f o r ce m e n lear n in g   f ield s   wh er th laws  o f   p h y s ics  ar co n tr ib u te d   b y   t h o r ig i n ato r .   T h d if f icu lty   o f   m o d el - b ased   m et h o d s   is   th at  alth o u g h   t h ey   h a v ex tr s u p p o s itio n   an d   esti m ate  o n   p a r t icu lar   jo b ,   b u m ay   b in co m p lete  o n ly   to   th ese  co r r ec ty p es  o f   task s .   T h e r ar two   m ain   ap p r o ac h es:  lea r n in g   th m o d el  o r   lear n   g iv en   th d esig n .     2 . 2 .    E nv iro nm ent   o f   re info r ce m ent   lea rning     W u tili ze   an   ev o l u tio n ar y   b ased   p r o ce d u r e   to   o p tim ize  t h r ein f o r ce m e n lear n in g   alg o r ith m s   o f   atten tio n   [ 1 7 ] ,   [ 1 8 ] .   First,  we  in itialize  p o p u lace   o f   tr ain in g   ag en ts   with   r an d o m ized   g r a p h s .   T h is   p o p u lac e   o f   ag e n ts   is   tr ain ed   in   eq u iv al en o v e r   a   s et  o f   tr ain in g   en v i r o n m en ts .   T h e   ag en t’ s   f ir s tr ain   o n   d if f icu lty   en v ir o n m en p r o jecte d   to   r a p id ly   o u with   p o o r   p er f o r m in g   is s u es.  I f   an   ag en ca n c r ac k   th d if f icu lty   Evaluation Warning : The document was created with Spire.PDF for Python.
      I SS N : 2502 - 4 7 5 2   I n d o n esian   J   E lec  E n g &   C o m p   Sci Vo l.  25 ,   No .   1 J an u ar y   20 22 :   481 - 4 8 7   484   en v ir o n m en t,  th tr ain in g   is   s to p p ed   u p   n ea r   th b eg in n in g   with   s co r o f   ze r o .   Oth e r wis e,   th tr ain in g   p r o ce ed s   to   m o r h ar d   en v ir o n m en ts .   T h alg o r ith m   th r o u g h p u is   ev alu ated   an d   u s ed   to   b r in g   u p   to   d ate  th e   p o p u lace ,   wh er e   m o r talen te d   alg o r ith m s   ar e   f u r th er   m u ta ted .   T o   d ec r ea s th s ea r c h   s p ac e,   th e n   we   u s a   f u n ctio n al   co r r esp o n d e n ce   m a n ag er   w h ich   will  b o u n ce   o v e r   r ec en tly   p r o jecte d   alg o r ith m s .   T h ese  alg o r ith m s   ar s am as  p r ev i o u s ly   p r ac tical  ex am in ed   alg o r ith m s .   T h is   lo o p   co n tin u es  as  n o v el  m u tate  ag en alg o r ith m s   ar tr ain ed   a n d   e v alu ate.   At  t h en d in g   o f   tr ain in g ,   we  c h o o s th m o s ex ce llen alg o r it h m   an d   ap p r aise  its   th r o u g h p u t   o v er   s et  o f   h id d en   test   en v ir o n m en ts .   Fig u r 3   s h o h o th t h m eta - lear n in g   m et o d   will  b e   u s ed   f o r   tr ai n in g   a n d   test in g   it  f o r   m u ltip le  ti m es.           Fig u r 3 .   Ov e r v iew  o f   m eta - le ar n in g   m et h o d       3.   M E T H O DO L O G AND  R E SU L T   W ex p o s two   f in d in g   alg o r ith m s   th at  s h o h ig h - q u ality   g en er aliza tio n   th r o u g h p u t.  T h p r im ar y   d ee p   alg o r ith m   is   DQNReg ,   wh ich   b u ild   o n   DQN  b y   ad d itio n   h ea v i n ess   o n   th Q - v alu e s   b ased   o n   s tan d ar d   s q u ar ed   B ellm an   er r o r   [ 1 9 ] .   T h n ex lear n ed   lo s s   f u n ctio n ,   DQNCli p p ed ,   is   ad d itio n al  m u ltifa ce ted ,   an d   it’s   d o m in ate  ter m   h as  s tr aig h tf o r war d   f o r m - t h m ax im u m   o f   th Q - v alu a n d   th s q u ar ed   B ellm an   er r o r   th at   m ea n s   m o d u lo   co n s tan t.  T wo   alg o r ith m s   ca n   b v iew  as  m an n er   to   n o r m alize   th Q - v alu es.  W h ile   DQNReg   ad d   s o f co n s tr ictio n ,   DQNCli p p ed   ca n   b e   in ter p r etin g   as  ty p o f   c o n s tr ain e d   o p tim izat io n   th at   will  r ed u ce   t h Q - v alu es,  if   t h ey   b ec o m e   to o   h ef t y .   W d em o n s tr ate  th at   th is   lear n ed   c o n s tr ictio n   k ic k s   in   d u r in g   th n ea r   th e   b e g in n in g   p h ase  o f   tr ain in g   wh en   o v er es tim ate  th Q - v alu es  is   p o ten tial  p r o b lem .   On ce   th is   co n s tr ain t is p leased ,   th en   th lo s s   will m in im ize  in s tead   o f   th o r ig in al  s q u a r ed   B ellm an   er r o r   [ 2 0 ] [ 2 1 ] .   T h f o llo win g   alg o r ith m   DQ NR eg   f o r   r ein f o r ce m en lear n in g   in   b etter   way   to   an aly ze   t h ac cu r ate  p r ed ictio n s .   Alo n g   with   th is   alg o r ith m ,   o th er   alg o r ith m s   ar wo r k in g   f o r   b ette r   lea r n in g   f o r   ac cu r ate   esti m atio n   o f   v alu es.  T h ese  r ein f o r ce m e n lear n in g   alg o r ith m s   ev er y   s tep   u p d ates  th d ata  u s in g   b u f f er   s p ac e.   C h ec k   th s am p les f o r   co m p u t th tar g et  v alu es,  f o r   th is   we   p er f o r m   th g r ad ien t d escen t step   an d   u p d ate  th e   tar g et  n etwo r k   p ar a m eter s .   T h is   lear n in g   co n s is ts   o f   m u ltip le  co n ce p ts   f o r   ac cu r ate  lear n in g   f o r   g en er atin g   th ac cu r ate  r esu lts   f o r   en d   u s er s .   T h f o llo win g   alg o r ith m   g iv en   r ein f o r ce m en t le a r n in g   o f   DQNReg .     Alg o r ith m   f o r   DQNReg   Step 1: Initialize the networks with b uffer   Step 2: for each iteration do   Step 3: for each environment step do   Step 4: Observe the state of the element and then select   Step 5: Execute that state and move to next state   Step 6: Store the information in buffer   Step 7: for each update step do   Step 8: Check the samples    Step 9: Compute the target Value   Step 10: Perform Gradient descent step   Step 11: Update the target network parameters   Step 12: end      q u ick er   an aly s is   s h o ws  th at   wh ile  f u n d am en tallin es  lik DQN  f r eq u en tly   o v er esti m ate   R - v alu es,   o u r   lear n e d   alg o r ith m s   d ea with   th is   p r o b lem   in   d is s im ilar   m eth o d s   [ 2 2 ] .   DQNReg   u n d er esti m ate  th R - v alu es,  wh ile  DQN C lip p ed   h as  alik p er f o r m an ce   to d o u b l DQN  in   th at   it  g r ad u ally   s l o ws   p r o ce d u r es  th e   g r o u n d   r ea lity   with o u o v er est im atin g   it.  W e   d em e n cy   d at aset   o f   to p   2 0 0 0   p er f o r m in g   a lg o r ith m s   ex p o s ed   d u r in g   p r o g r ess .   I n q u is itiv r ea d er   co u ld   f u r th er   e x am in t h p r o p e r ty   o f   th ese  lear n e d   lo s s   f u n ctio n s .   Ou r   tech n iq u lear n s   alg o r ith m s   th at  h av estab lis h   way   to   r eg u lar ize  th Q - v alu es  an d   th u s   d ec r ea s e   o v er esti m atio n   [ 2 3 ] [ 2 4 ] .   Fi g u r 4   is   u s ed   to   s h o t h r esu lts   o f   m in i g r id - d o o r k e y   f o r   v alu e   b ased   R L   m eth o d .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esian   J   E lec  E n g &   C o m p   Sci   I SS N: 2502 - 4 7 5 2       Th g en era l d esig n   o f th a u to ma tio n   fo r   mu ltip le  field s   u s in g   …  ( V ija ya   K u ma r   R ed d y   R a d h a )   485       Fig u r 4 .   Ov e r esti m ated   v alu e s   is s u es in   v alu e - b ased   R L       E v e n   o n   g a m e   b a s e d   e n v i r o n m e n t s ,   w e   o b s e r v e   b e t t e r   t h r o u g h p u t ,   e v e n   t h o u g h   t r a i n i n g   w a s   o n i m a g e - b a s e d   e n v i r o n m e n t s .   T h i s   s u g g e s ts   t h at   m e t a - t r a i n i n g   o n   a   s e t o f   s i m p l e   b u d i v e r s t r a i n i n g   en v i r o n m e n t s   w it h   a   g e n e r a l i z e d   a l g o r i t h m   il l u s t r a ti o n   c o u l d   e n a b l e   r a d i c a l   a l g o r i t h m i c   g e n e r a l i za t i o n   [ 2 5 ] ,   [ 2 6 ] .   T h u s ,   it  is   g en er aliza tio n   o f   m u lticlas s   class if icatio n ,   wh er th class es  in v o lv ed   in   t h p r o b lem   ar h ier ar c h ically   s tr u ctu r ed ,   an d   ea c h   ex am p le  m ay   s im u lta n eo u s ly   b elo n g   to   m o r th an   o n class   in   ea ch   h ier ar ch ical  lev el,   e. g . ,   m u lti - lev el  tex class if icatio n .   T ab le1   s h o th tab u lar   f o r m at  o f   th r esu lts   o f   d if f er en p er f o r m a n ce s   o f   DQNReg   ag ain s th g am es  th at  test ed   ag in s th b aselin es.  T h r ein f o r ce m en t   lear n in g   alg o r ith m s   u s in g   in   d if f er en asp ec ts   o f   au to m atio n   ag ai n s m u ltip le  f ield s   o f   m u ltip le  g am es  with   d if f er en en v ir o n m en t.  Mo s tly   r ec en d ay s   u s in g   r ap id   ch an g es  o cc u r r ed   d u r i n g   th g e n er atio n   o f   ac cu r at r esu lts .   T h ey   ca n   m o r h e lp f u to   th f u tu r e   d ev elo p m e n t o f   a u to m atio n   s y s tem .       T ab le  1 .   Per f o r m an ce   o f   DQN R eg ,   ag ain s t b aselin es o n   s ev e r al  g am es    En v i r o n m e n t   DQN   DDQN   PPO   D Q N R e g   S p a c e   g a m e   1 4 6 4 . 5   7 5 4 . 7   2 1 9 7 . 3   2 4 9 0 . 2   Te n p i n   b o w l i n g   5 2 . 4   6 9 . 1   4 2 . 1   8 1 . 5   K i c k   B o x i n g   8 9 . 0   9 2 . 5   9 5 . 6   1 0 1 . 0   R u n n i n g   R a c e   4 0 5 4 4 . 0   4 5 1 2 7 . 0   3 5 4 9 6 . 0   6 5 8 1 6 . 0       4.   CO NCLU SI O N   I n   th is   p ap er ,   we  lear n   n o v el   ac co u n tab le  R ein f o r ce m en l ea r n in g   alg o r ith m s   b y   o n   b eh alf   o f   lo s s   f u n ctio n s   as  c o m p u tatio n   g r ap h s   an d   en h a n ce   o f   ag e n ts   o v er   th is   p r o g r ess io n .   T h co m p u tatio n   g r a p h   f o r m u latio n   o b ey   to   b o th   co n s tr u ct   u p o n   h u m an - d esig n ed   an d   lear n ed   alg o r ith m s   u s in g   th s am e   s tati s tical   to o ls et  o f   ex tan al g o r ith m s .   W an aly ze d   n o m o r e   th an   o f   th lear n ed   alg o r ith m s   an d   ca n   co n s tr u e   t h em   as   f o r m   o f   en tr o p y   r e g u lar izat io n   to   av o i d   v alu o f   o v e r esti m atio n .   T h ese  lea r n ed   al g o r i th m s   ca n   p er f o r m   f u n d am e n tallin es lin es  an d   f ac ilit ate   to   h id d en   en v ir o n m e n ts .   W h o p th at  f u tu r wo r k   w ill  ex ten d   to   m o r e   d iv er s o f   r ein f o r ce m en lear n in g   alg o r ith m s   s ettin g s   s u ch   as a cto r   cr itic a lg o r ith m s .       RE F E R E NC E   [ 1 ]   S .   S h a i k ,   A n a l y s i o f   P h o t o   P l e t h y s mo g r a p h y   S i g n a l w i t h   A r t i f i c i a l   N e u r a l   N e t w o r k U si n g   C u r v e l e t   Tr a n sf o r m,”   J o u r n a l   o f   Ad v a n c e d   Re s e a r c h   i n   D y n a m i c a l   C o n t r o l   S y st e m s ,   v o l .   1 1 ,   n o .   1 ,   p p .   3 6 3 - 3 7 0 ,   2 0 1 9 .     [ 2 ]   S .   S h a i k ,   P a t t e r n   R e c o g n i t i o n   o f   S p e e c h   S i g n a l U s i n g   C u r v e l e t   Tr a n sf o r a n d   A r t i f i c i a l   I n t e l l i g e n c e ,   I n t e rn a t i o n a l   J o u rn a l   o f   C re a t i v e   Re s e a rc h   T h o u g h t s ,   v o l .   6 ,   n o .   2 ,   p p .   7 1 8 - 7 2 3 ,   A p r i l   2 0 1 8 ,   d o i :   1 0 . 6 0 8 4 / m 9 . d o i . o n e . I JC R T1 8 9 2 4 5 0 .   Evaluation Warning : The document was created with Spire.PDF for Python.
      I SS N : 2502 - 4 7 5 2   I n d o n esian   J   E lec  E n g &   C o m p   Sci Vo l.  25 ,   No .   1 J an u ar y   20 22 :   481 - 4 8 7   486   [ 3 ]   C h .   S h r a v y a ,   P r a v a l l i k a ,   a n d   S .   S h a i k ,   P r e d i c t i o n   o f   B r e a s t   C a n c e r   U si n g   S u p e r v i se d   M a c h i n e   Le a r n i n g   T e c h n i q u e s ,   I n t e r n a t i o n a l   J o u r n a l   o f   I n n o v a t i v e   T e c h n o l o g y   a n d   Ex p l o r i n g   En g i n e e ri n g ,   v o l .   8 ,   n o .   6 ,   p p .   1 1 0 6 - 1 1 1 0 ,   A p r i l   2 0 1 9 .     [ 4 ]   J.  S .   K e e r t h a n ,   Y .   N a g a sa i ,   a n d   S .   S h a i k ,   M a c h i n e   L e a r n i n g   A l g o r i t h ms  f o r   O i l   P r i c e   P r e d i c t i o n ,   I n t e r n a t i o n a l   J o u r n a l   o f   I n n o v a t i v e   T e c h n o l o g y   a n d   Ex p l o r i n g   En g i n e e ri n g ,   v o l .   8 ,   n o .   8 ,   p p .   9 5 8 - 9 6 3 ,   J u n e   2 0 1 9 .     [ 5 ]   S .   B u t a d a   a n d   S .   S h a i k ,   I P M a t c h   P r e d i c t i o n   u si n g   M a c h i n e   L e a r n i n g ,   I n t e r n a t i o n a l   J o u r n a l   o f   Ad v a n c e d   S c i e n c e   a n d   T e c h n o l o g y ,   v o l .   2 9 ,   n o .   5 ,   p p .   3 4 3 8 3 4 4 8 ,   A p r i l   2 0 2 0 .     [ 6 ]   M a m a t h a ,   S .   D a t t a ,   a n d   S .   S h a i k ,   F a k e   P r o f i l e   I d e n t i f i c a t i o n   u si n g   M a c h i n e   Le a r n i n g   A l g o r i t h ms , ”  I n t e rn a t i o n a l   J o u r n a l   o f   En g i n e e ri n g   Re s e a rc h   a n d   Ap p l i c a t i o n s ,   v o l .   1 1 ,   n o .   7 ,   p p .   6 0 - 6 5 ,   J u l y - 2 0 2 1 .     [ 7 ]   K P .   S u r y a   Te j a ,   V .   R e d d y ,   a n d   S .   S h a i k ,   F l i g h t   D e l a y   P r e d i c t i o n   U si n g   M a c h i n e   Le a r n i n g   A l g o r i t h X G B o o s t ,   J o u rn a l   o f   Ad v a n c e d   Re s e a r c h   i n   D y n a m i c a l   C o n t r o l   S y st e m s ,   v o l .   1 1 ,   n o .   5 ,   p p .   3 7 9 - 3 8 8 ,   2 0 1 9.   [ 8 ]   W .   Q i a n g   a n d   Z.   Z h o n g l i ,   R e i n f o r c e me n t   l e a r n i n g   m o d e l ,   a l g o r i t h ms  a n d   i t a p p l i c a t i o n ,   2 0 1 1   I n t e r n a t i o n a l   C o n f e r e n c e   o n   Me c h a t r o n i c   S c i e n c e ,   E l e c t ri c   E n g i n e e ri n g   a n d   C o m p u t e r   ( ME C ) ,   2 0 1 1 ,   p p .   1 1 4 3 - 1 1 4 6 ,   d o i :   1 0 . 1 1 0 9 / M EC . 2 0 1 1 . 6 0 2 5 6 6 9 .   [ 9 ]   J.  Ji a n g ,   C .   D u n ,   T.   H u a n g ,   a n d   Z.   L u ,   G r a p h   C o n v o l u t i o n a l   R e i n f o r c e m e n t   Le a r n i n g ,   I n t e r n a t i o n a l   C o n f e r e n c e   o n   L e a r n i n g   Re p r e se n t a t i o n s ,   2 0 2 0 ,   p p .   1 - 1 3 .     [ 1 0 ]   J.  A .   S a l v a d o r ,   R e i n f o r c e m e n t   l e a r n i n g :   a   l i t e r a t u r e   r e v i e w ,   T h e si s,  C o mp u t e r   S c i e n c e   a n d   B u s i n e ss  M a n a g e me n t ,   I sct -   I n st i t u t o   U n i v e r si t á r i o   d e   L i s b o a ,   Li s b o n ,   P o r t u g a l ,   p p .   1 - 3 6 ,   2 0 2 1 .   [ 1 1 ]   S .   C .   Y .   C h a n ,   S .   F i sh m a n ,   J.  C a n n y ,   A .   K o r a t t i k a r a ,   a n d   S .   G u a d a r r a m a ,   M e a s u r i n g   t h e   r e l i a b i l i t y   o f   R e i n f o r c e me n t   L e a r n i n g   A l g o r i t h ms ,   I n t e rn a t i o n a l   C o n f e re n c e   o n   L e a r n i n g   Re p res e n t a t i o n s,  p p .   1 - 3 6 ,   2 0 2 0 .     [ 1 2 ]   I .   O sb a n d   e t   a l . ,   B e h a v i o u r   S u i t e   f o r   R e i n f o r c e me n t   Le a r n i n g ,   I n t e r n a t i o n a l   C o n f e r e n c e   o n   L e a r n i n g   Re p r e s e n t a t i o n s,  2 0 2 0   p p .   1 - 1 9 .     [ 1 3 ]   C .   D 'Er a m o ,   D .   Ta t e o ,   A .   B o n a r i n i ,   M .   R e st e l l i ,   a n d   J.   P e t e r s,   M u sh r o o mRL :   S i mp l i f y i n g   R e i n f o r c e me n t   L e a r n i n g   R e s e a r c h ,   J o u rn a l   o f   M a c h i n e   L e a rn i n g   Re se a r c h ,   p p . 1 - 5 ,   2 0 2 1 .     [ 1 4 ]   T.   D .   K u l k a r n i A .   S a e e d i S .   G a u t a m ,   a n d   S .   J.   G e r sh ma n ,   D e e p   S u c c e ss o r   R e i n f o r c e me n t   Le a r n i n g ,   C o r n e l l   U n i v e rs i t y ,   2 0 1 6 .     [ 1 5 ]   P .   K l i n k ,   H.   A b d u l s a ma d ,   B .   B e l o u s o v ,   C .   D 'Er a m o ,   J .   P e t e r s ,   a n d   J.   P a j a r i n e n ,   A   P r o b a b i l i st i c   I n t e r p r e t a t i o n   o f   S e l f - P a c e d   Le a r n i n g   w i t h   A p p l i c a t i o n t o   R e i n f o r c e me n t   L e a r n i n g ,   J o u r n a l   o f   M a c h i n e   L e a rn i n g   Re s e a r c h ,   p p .   1 - 5 2 ,   2 0 2 1 .     [ 1 6 ]   R .   B e l l ma n ,   O n   t h e   T h e o r y   o f   D y n a mi c   P r o g r a mm i n g ,   Pro c e e d i n g o f   t h e   N a t i o n a l   A c a d e m y   o f   S c i e n c e A m e ri c a .   U .   S .   A . ,   v o l .   3 8 ,   n o .   8 ,   1 9 5 2 ,   p p .   7 1 6 - 7 1 9 ,   d o i :   1 0 . 1 0 7 3 / p n a s. 3 8 . 8 . 7 1 6 .     [ 1 7 ]   R .   S .   S u t t o n   a n d   A .   G .   B a r t o ,   R e i n f o r c e me n t   l e a r n i n g :   a n   i n t r o d u c t i o n ,   2 n d   e d i t i o n .   C a m b r i d g e ,   MA :   MIT   Pre ss ,   2 0 1 7 .     [ 1 8 ]   V .   K r i s h n a mu r t h y   a n d   G .   Y i n ,   L a n g e v i n   D y n a mi c f o r   A d a p t i v e   I n v e r se  R e i n f o r c e m e n t   Le a r n i n g   o f   S t o c h a st i c   G r a d i e n t   A l g o r i t h ms ,   J o u r n a l   o f   M a c h i n e   L e a rn i n g   R e se a rc h ,   p p .   1 - 4 9 ,   2 0 2 1 ,   d o i :   1 0 . 1 1 0 9 / TA C . 2 0 2 1 . 3 0 7 9 2 8 0 .   [ 1 9 ]   D .   S i l v e r ,   D e e p   r e i n f o r c e me n t   l e a r n i n g ,   i n   I n t e r n a t i o n a l   C o n f e r e n c e   o n   Ma c h i n e   L e a r n i n g   ( I C ML) ,   2 0 1 6 .   [ 2 0 ]   R .   E.   B e l l ma n   a n d   S .   E.   D r e y f u s,   A p p l i e d   D y n a mi c   P r o g r a mm i n g ,   A n n a l o f   Ma t h e m a t i c a l   S t a t i s t i c s ,   v o l .   3 3 ,   n o .   2 ,     p p .   7 1 9 - 7 2 6 ,   1 9 6 2 ,   d o i :   1 0 . 1 2 1 4 / a o ms / 1 1 7 7 7 0 4 5 9 3 .   [ 2 1 ]   Y.   N a si r ,   J.   H e ,   C .   H u ,   S .   T a n a k a ,   K .   W a n g ,   a n d   X .   W e n ,   D e e p   R e i n f o r c e m e n t   Le a r n i n g   f o r   C o n st r a i n e d   F i e l d   D e v e l o p me n t   O p t i mi z a t i o n   i n   S u b s u r f a c e   Tw o - p h a s e   F l o w ,   C o r n e l l   U n i v e rs i t y ,   2 0 2 1 ,   d o i :   1 0 . 3 3 8 9 / f a ms . 2 0 2 1 . 6 8 9 9 3 4 .   [ 2 2 ]   D .   S i l v e r   e t   a l . ,   M a st e r i n g   C h e ss   a n d   S h o g i   b y   S e l f - P l a y   w i t h   a   G e n e r a l   R e i n f o r c e me n t   L e a r n i n g   A l g o r i t h m,”   a rX i v   p re p ri n t   a rXi v : 1 7 1 2 . 0 1 8 1 5 L o n d o n ,   2 0 1 7 .     [ 2 3 ]   A .   G o o d f e l l o w ,   Y .   B e n g i o ,   a n d   A .   C o u r v i l l e ,   D e e p   L e a r n i n g ,   1 s t   e d i t i o n .   C a mb r i d g e ,   M A :   M I P r e ss ,   2 0 1 6 .     [ 2 4 ]   S .   S h a i k ,   D M   A l g o r i t h ms   B a se d   C l u st e r i n g   f o r   R o a d   A c c i d e n t   D a t a   A n a l y si s ,   I n t e r n a t i o n a l   J o u r n a l   o f   C o m p u t e S c i e n c e a n d   En g i n e e ri n g ,   v o l .   6 ,   n o .   9 ,   p p .   1 6 0 - 1 6 7 ,   S e p t   2 0 1 8 ,   d o i :   1 0 . 2 6 4 3 8 / i j c se / v 6 i 9 . 1 6 0 1 6 7 .   [ 2 5 ]   I .   H .   S a r k e r ,   M a c h i n e   Le a r n i n g :   A l g o r i t h ms ,   R e a l - W o r l d   A p p l i c a t i o n a n d   R e se a r c h   D i r e c t i o n s,   S p r i n e S N   C o m p u t e S c i e n c e ,   v o l .   2 ,   n o .   3 ,   p p .   1 - 2 1 ,   2 0 2 1 ,   d o i :   1 0 . 1 0 0 7 / s4 2 9 7 9 - 021 - 0 0 5 9 2 - x.   [ 2 6 ]   D .   S i l v e r   e t   a l . ,   M a st e r i n g   t h e   g a me  o f   G o   w i t h   d e e p   n e u r a l   n e t w o r k a n d   t r e e   se a r c h ,   N a t u re ,   v o l .   5 2 9 ,   n o .   7 5 8 7 ,   p p .   4 8 4 - 4 8 9 ,   2 0 1 6 ,   d o i :   1 0 . 1 0 3 8 / n a t u r e 1 6 9 6 1 .       B I O G RAP H I E S O F   AUTH O RS       Vija y a   K u m a r   Re d d y   Ra d h a           As so c iate   P ro fe ss o in   I n fo rm a t io n   Tec h n o l o g y   a Lak ired d y   Ba li   Re d d y   C o ll e g e   o E n g in e e rin g   sta te  o f   An d h ra   P ra d e sh .   S tarte d   is  c a rrier   in   tea c h in g   fr o m   2 0 1 1   a n d   w o rk e d   a As sista n t   P r o fe ss o i n   C o m p u ter  S c ien c e   a n d   En g i n e e rin g   a M o t h e T h e re sa   E d u c a ti o n a S o c iety   G ro u p   o f   In sti tu ti o n s,   Nu n n a   i n   th e   sta te   o An d h ra   P ra d e sh .   An d   late wo rk e d   a As sista n P ro fe ss o i n   El e c tro n ics   a n d   C o m p u te r   En g i n e e rin g   a n d   In f o rm a ti o n   T e c h n o l o g y   a P ra sa d   P o tl u ri   S id d h a rt h a   In stit u te  o f   Tec h n o l o g y   fro m   M a y   2 0 1 2   to   Au g u st  2 0 2 1 .   He   re c iv ied   is  B. S c .   in   2 0 0 5   fro m   Ac h a ry a   Na g a rju n a   U n iv e rsit y ,   M . C. A   i n   2 0 0 9   fro m   JN TU,   Ka k i n a d a   a n d   M . Tec h   I n fo rm a ti o n   Tec h n o l o g y   in   2 0 1 1   fro m   Vig n a n   Un i v e rsity   a n d   S to o d   Un i v e rsity   To p p e a n d   P h D   Co m p u ter   S c ien c e   a n d   En g in e e rin g   in   2 0 1 9   fro m   Ac h a ry a   N a g a rju n a   U n iv e rsit y .   He   p u b li sh e d   6   P a ten ts  a n d   He   h a a u t h o re d   3 4   In tern a ti o n a l   Jo u rn a l   P u b li c a ti o n s   a n d   Co n fe re n c e o f   wh ich   1 2   a re   S c o p u s   In d e x e d   a n d   2 2   UG In d e x e d .   His   p u b li c a ti o n h a v e   a   to tal  o 1 2 0 +   G o o g le  S c h o lar   c it a ti o n wit h   h - i n d e x - 7 ,   i 1 0   i n d e x - 4 .   He   is   a lso   re n d e rin g   h is   se rv ice a a   re v iew e fo two   S CI/S c o p u In d e x e d   J o u r n a ls.  He   is  Li fe   M e m b e in   I S TE ,   IS S E.   He   c a n   b e   c o n tac ted   a e m a il v i jay a k u m a rr2 8 5 @ g m a il . c o m .       Evaluation Warning : The document was created with Spire.PDF for Python.
I n d o n esian   J   E lec  E n g &   C o m p   Sci   I SS N: 2502 - 4 7 5 2       Th g en era l d esig n   o f th a u to ma tio n   fo r   mu ltip le  field s   u s in g   …  ( V ija ya   K u ma r   R ed d y   R a d h a )   487     Ana n th a   N .   La k s h m i p a th i             c u rre n tl y   wo r k in g   a He a d   a n d   P ro fe ss o o f   CS De p a rtme n t,   M a ll a   Re d d y   E n g in e e rin g   C o ll e g e   (Au t o n o m o u s),  c o m p lete d   P h . D.  fro m   Ac h a ry a   Na g a rju n a   Un iv e rsit y .   M y   P h . D.  Wo r k   wa o n   De e p   Lea rn in g   F ra m e wo rk   b a se d   o n   Co n v o lu ti o n   Ne u ra l   Ne two rk   fo r   P ro d u c t   Re c o m m e n d a ti o n .   M y   re se a rc h   i n tere sts  a re   M a c h in e   Lea rn in g ,   De e p   Lea rn in g   in   t h e   field   o Re c o m m e n d e r   S y ste m s.  M y   re c e n wo rk   fo c u se o n   a p p l ica ti o n   o d e e p   lea rn in g /ma c h in e   lea rn i n g   b a s e d   a p p ro a c h e f o r   o b jec d e tec ti o n ,   ima g e   se g m e n tatio n ,   id e n ti fy   p a tt e rn in   se q u e n ti a d a ta,   ra n k i n g   in   re c o m m e n d a ti o n   d a ta.   In   m y   re se a rc h   wo rk ,   we   p r o p o se d   a   m o d e wh ich   u se d   Co n v o l u ti o n   Ne u ra Ne two rk   with   Tran sfe Lea rn in g   to   c las sify   t h e   ima g e a n d   g i v e to n   re c o m m e n d a ti o n to   th e   u se rs.   I EE S e n io r   M e m b e r   (id 9 7 6 3 9 8 5 6 ),   Li fe ti m e   m e m b e o f   IAENG   (In tern a ti o n a As so c iatio n   o E n g in e e rs),   M e m b e o ( S DIWC)  Th e   S o c iet y   o f   Dig it a I n fo rm a ti o n   a n d   Wi re l e ss   Co m m u n ica ti o n s .   He   c a n   b e   c o n tac ted   a t   e m a il a n lak sh m ip a t h i@g m a il . c o m .         Ra v K u m a r   Tir a n d a su          Wo r k in g   a As sista n P r o fe ss o i n   C o m p u ter  S c ien c e   a n d   En g i n e e rin g .   De e m e d   to   b e   Un i v e rsity ,   In d ia.  His  Re se a rc h   a re a a re   S o ftwa re   En g i n e e rin g ,   M a c h in e   Lea rn i n g   a n d   Da tam in i n g .   He   g o Be st  p a p e p u b li c a ti o n   a wa rd in   in tern a ti o n a l   c o n fe re n c e   ICRTC - 20 2 1 .   Two   p a ten a re   p u b li sh e d .   He   c a n   b e   c o n tac ted   a t   e m a il :   trav ik u m a r@k l u n i v e rsity . i n .         Pa r u c h u r Ra v Pra k a sh          is  As sista n P ro fe ss o De p a rtem tn   o In fo rm a ti o n   Tec h n o l o g y   a t   P ra sa d   V   P o t lu ri   S id d h a rth a   In stit u te  o Tec h n o lo g y ,   Ka n u r u   Vija y a wa d a . He   h o l d a   M . Tec h   De g re e   fr o m   A c h a ry a   Na g a rju n a   Un i v e rsity . His   re a se ra c h   a re a a re   Da ta   An a ly ti c s,  Blo c k c h a in   Tec h n o lo g ies .   He   c a n   b e   c o n tac ted   a e m a il :   r a v ip ra k a sh p a ru c h u ri@p v p si d d h a rth a . a c . in   a n d   p rp p v p sit@g m a il . c o m .     Evaluation Warning : The document was created with Spire.PDF for Python.