I AE I nte rna t io na l J o urna l o f   Art if icia l In t ellig ence   ( I J - AI )   Vo l.   6 ,   No .   4 Dec em b er   2 0 1 7 ,   p p .   17 4 ~ 1 8 4   I SS N:  2252 - 8938 ,   DOI : 1 0 . 1 1 5 9 1 /i j ai. v 6 . i4 . p p 1 74 - 1 84          174       J o ur na l ho m ep a g e h ttp : //ia e s jo u r n a l.c o m/o n lin e/in d ex . p h p /I J AI   Identifica tion o Ra re Geneti c Dis o rder f ro m   Sing le  Nucleotid Va ria nts Using  S uperv ised Lea rni ng  Technique       Sa t hy a v ik a s ini   K ,   Vij a y a   M   S   P S G Krish n a m m a Co ll e g e   f o W o m e n ,   Co im b a to re   6 4 1 0 0 4 ,   In d ia       Art icle  I nfo     AB ST RAC T     A r ticle  his to r y:   R ec eiv ed   Au g   29 ,   2 0 1 7   R ev i s ed   Oct   31 ,   2 0 1 7   A cc ep ted   No v   14 ,   2 0 1 7       M u sc u lar  d y stro p h y   is  a   ra re   g e n e ti c   d iso rd e t h a a f fe c ts  th e   m u sc u lar   s y ste m   w h ich   d e terio ra tes   th e   sk e leta m u sc l e a n d   h i n d e rs  l o c o m o ti o n .   I n   th e   f in d in g   o f   g e n e ti c   d iso rd e rs  su c h   a M u sc u lar  d y str o p h y ,   th e   d ise a se   is   id e n ti f ied   b a se d   o n   m u tatio n s in   t h e   g e n e   se q u e n c e .   A   n e w   m o d e is  p ro p o se d   f o c las si fy in g   th e   d ise a se   a c c u ra tel y   u sin g   g e n e   se q u e n c e s,  m u tate d   b y   a d o p t in g   p o siti o n a c l o n i n g   o n   th e   re fe re n c e   c DN A   s e q u e n c e .   T h e   f e a tu re o f   m u tate d   g e n e   se q u e n c e f o m is s e n se ,   n o n se n se   a n d   silen t   m u tatio n a im in   d isti n g u is h in g   th e   ty p e   o f   d ise a se   a n d   th e   c las sif i e rs  a r e   tra in e d   w it h   c o m m o n l y   u se d   su p e rv ise d   p a tt e rn   lea rn in g   tec h n i q u e s.1 0 - f o ld   c ro ss   v a li d a ti o n   re su lt sh o w   th a t h e   d e c isio n   tree   a lg o ri th m   w a f o u n d   t o   a tt a in   th e   b e st  a c c u ra c y   o f   1 0 0 % .   In   su m m a r y ,   th is  stu d y   p ro v id e a n   a u to m a ti c   m o d e to   c las sify   th e   m u sc u lar  d y stro p h y   d ise a se   a n d   sh e d   a   n e w   li g h o n   p re d ictin g   th e   g e n e ti c   d iso rd e f ro m   g e n e   b a se d   fe a tu re th ro u g h   p a tt e rn   re c o g n it io n   m o d e l.   K ey w o r d :   cDN A   C o d o n   C o d o n   Usag B ias   P o s itio n al  C lo n i n g   R S C U     Co p y rig h ©   2 0 1 7   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e   Al rig h ts  re se rv e d .   C o r r e s p o nd ing   A uth o r :   Sath y av ik a s i n i K   P SGR   Kr is h n a m m al  C o lle g f o r   W o m en ,   C o i m b ato r 6 4 1 0 0 4 ,   I n d ia .   E m ail:  Ma il2 s ath y a v ik a s h in i @ g m ai l.c o m       1.   I NT RO D UCT I O N   T h m aj o r ity   o f   h er ed itar y   d i s o r d er s   p lace   s ig n i f ica n b u r d en   o n   t h f a m i lies   i m m o r ta lizin g   t h e   co n d itio n   f o r   th lack   o f   ef f ec tiv tr ea t m e n [ 1 ] .   Mu s cu lar   d y s tr o p h ie s   ar s u ch   tr ait  ca u s e d   b y   m u tatio n s   i n   th g e n s eq u e n ce s .   Mu s cu la r   d y s tr o p h y   ( MD )   is   clu s te r   o f   s u cc ess i v m u s cle  d is o r d er s   s ti m u lated   b y   m u tatio n s   in   g e n e s   th at  en co d f o r   p r o tein s   th at  ar v ital  f o r   r eg u lar   m u s cle  f u n ctio n   [ 2 ,   3 ] .   T h r esu lts   o f   m u s cle  b io p s y ,   elec tr o m y o g r ap h y ,   elec tr o ca r d io g r ap h y   a n d   DNA   a n al y s i s   aid s   i n   d iag n o s in g   m u s cu lar   d y s tr o p h y .   T h d is ea s s h o u l d   b d iag n o s ed   ea r l y   a n d   ef f ec tiv el y   to   u n d er s tan d   a n d   i m p r o v t h li f o f   p atien ts .   So m f o r m s   o f   MD   ar Du ch en n e,   B ec k er ,   E m e r y - Dr ei f u s s ,   L i m b - g ir d le,   Fac io s ca p u lo h u m er al,   M y o to n ic  a n d   C h ar co t M ar ie  T o o th   d is ea s [ 4 ] .   Du c h en n m u s c u lar   d y s tr o p h y   ( DM D)   a n d   B ec k er   m u s c u l ar   d y s tr o p h y   ( B MD )   ar ca u s ed   b y   t h e   m u tatio n s   i n   t h d y s tr o p h i n   g e n e.   D y s tr o p h i n   i s   t h h e f t y   h u m an   g e n th at   is   2 . 5 m b   lo n g   a n d   en co m p a s s e s   o f   79   ex o n s .   W h e n   t h e f f ec o f   m u tat io n s   is   le s s   in   th e   d y s tr o p h i n   g e n i r es u lts   in   B ec k er s   m u s c u lar   d y s tr o p h y   [ 5 ,   6 ] .   E m er y - Dr ei f u s s   m u s c u lar   d y s tr o p h y   ( E M D)   ca n   b af f ec ted   in   p atie n t s ,   t y p icall y   i n   th e ir   ch ild h o o d   an d   i n   th e   ea r l y   a d o lescen y ea r s   w i th   m u s cle  co n tr ac tu r es.  T h g e n etic  c h a n g e s   i n   t h E m er i n   ( E MD )   an d   L a m in   A/C   ( L MN A )   g e n e s   ca u s E m er y -   Dr ei f u s s   m u s cu lar   d y s tr o p h y   [ 7 ] .   L i m b - g ir d le  m u s c u lar   d y s tr o p h y   ( L G MD )   ca n   b s e en   i n   b o th   b o y s   a n d   g ir l s .   Nea r l y   1 8   g e n es  i n v o lv ed   i n   t h m u tatio n   o f   L GM D.   T h d ef ec ts   in   L G MD   s h o w   a   r elate d   d is tr ib u tio n   o f   m u s cle   w ea k n e s s   t h at  h as  a n   e f f ec o n   b o th   u p p er   ar m s   an d   leg s .   C h ar co Ma r ie  to o th   d is ea s ( C MT )   in clu d es   n u m b er   o f   d i s o r d er s   w i th   a n   as s o r t m e n t   o f   s y m p to m s .   T h Sin g le  Nu cleo tid Var ian ts   ( SNV)   ca u s es   d is t in ct   v a r iatio n   i n   t h g e n etic  co d o f   th e   DN s eq u en ce .   T h ese  c h an g es  ar t er m ed   as  m u tatio n s .   M u tatio n s   in   t h g e n s eq u en ce   m a k a   p er m a n en ch a n g Evaluation Warning : The document was created with Spire.PDF for Python.
IJ - AI     IS SN:  2252 - 8938       I d en tifi ca tio n   o R a r Gen etic  Dis o r d er fr o S in g le  N u cleo ti d V a r ia n ts . . .   ( S a th ya vika s in i K )   175   in   th DN A   s eq u en ce   t h at  clea r l y   r o o ts   to   g en etic  d is o r d e r .   T h im p ac o f   th SN o n   th g en s eq u e n c e   m o d i f ie s   th f u n ct io n   o f   t h g en e.   S u b s ti tu t io n   is   a n   ex c h an g o f   o n b ase  to   an o th er ,   s u c h   as  s w ap p in g   a   b ase  f r o m   to   G.   SN V’ s   m a y   b s y n o n y m o u s   o r   n o n - s y n o n y m o u s .   M is s e n s e   an d   n o n   s en s ar th e   n o n   s y n o n y m o u s   s in g le  n u cleo tid v ar ian ts   w h er s in g le  c h an g i n   th g en alter s   t h a m i n o   ac id   in   th s eq u en ce   [ 8 ,   9 ] .   Miss en s m u tatio n s   ar th s u b s ti tu t io n   i n   co d o n   th at  en co d es  d if f er en a m in o   ac id   an d   alter s   th p r o tein   [ 1 0 ] .   No n s en s m u tat io n s   ar th o s w h er e   th p r o tein   attain s   to   s to p   co d o n   w h e n   ch an g e   o cc u r s   in   t h DN A   s eq u en ce .   S y n o n y m o u s   m u tatio n s   ar t h s ile n m u tatio n s   t h at  t h v ar ian w i ll  n o s h o w   a m e n d   i n   t h a m in o   ac id s .   Sil e n m u tatio n s   ar e   a   ch a n g e   i n   co d o n   t h at  e n co d es  f o r   t h s a m a m i n o   ac i d   an d   t h er ef o r t h tr an s lated   p r o tein   i s   n o m o d i f ied   [ 1 1 ] .   I n   d etec ti n g   t h t y p o f   d i s ea s it  i s   n ec es s ar y   to   co n s id er   t h s ile n t   m u tatio n   a s   th c h a n g e s   ca n   a f f ec p r o tein   f o ld i n g   a n d   f u n c tio n .   E v e n   th o u g h   s ev er al  co d o n s   en co d f o r   t h e   s a m a m i n o   ac id   t h eir   f r eq u e n c y   w ill  v ar y   an d   th i s   i s   r e f er r ed   as  co d o n   b ias.  T h in cr ea s in   t h n u m b er   o f   th s a m n u cleo tid es  i n   lo c atio n   is   ter m ed   a s   d u p licatio n s .   Dele tio n s   ar t h m u tatio n s   w h e n   b ase  o r   a n   ex o n   is   d elete d   f r o m   s eq u e n ce   th m u tatio n s .   [ 1 2 ] .   Mu s cle   b io p s y   a n d   DN te s ti n g   ar i n   p r o g r e s s   f o r   d ia g n o s in g   m u s cu lar   d y s tr o p h y   [ 1 3 ] .   An   i n it ial   s tep   in   ex a m i n i n g   m u s c u lar   d y s tr o p h y   i s   t h r o u g h   g e n etic   te s tin g .   T h ad v an ta g o f   p er f o r m i n g   g e n etic   test in g   o v er   m u s c le  b io p s y   is   t h at  i n   g en et ic  te s ti n g ,   th e   b lo o d   s a m p le  is   e n o u g h   to   s p o th e   alter at io n   i n   t h e   g e n e s   w h er ea s   t h p ar o f   th tis s u is   r eq u ir ed   to   p er f o r m   t h m u s cle  b io p s y .   [ 1 4 ] .   Gen th er ap y   h elp s   in   k n o w in g   th ex ac m u tatio n   i n   t h DM g en a n d   d ir ec s eq u en ci n g   aid s   in   id en ti f y i n g   m i s s e n s e,   n o n s en s e,   in s er tio n s ,   d eletio n s   an d   s p lici n g   m u tat io n s   [ 1 5 ,   1 6 ] .   A ll   s o r o f   m u tatio n s   ca n n o b id e n ti f ied   o u t   u s i n g   M u ltip le x   L i g atio n - d ep en d en P r o b Am p li f icatio n   ( ML P A )   an d   i n   s o m ca s es,  t h r es u lts   w o u ld   b n eg ati v [ 1 7 ] .   I n   th ca s o f   DM D,   S NV’ s   ar d etec ted   b y   m ea n s   o f   San g er 's  f u ll  g e n s eq u e n ci n g ,   w h ic h   i s   p er f o r m ed   b y   d ir ec s eq u en ci n g   m et h o d o lo g y .   T h d ir ec s eq u en cin g   an al y s is   is   co n s id er ed   to   b lab o r io u s ,   e x p en s iv e   a n d   ti m e - co n s u m i n g   [ 1 8 ,   1 9 ] .   P C R   is   n o w   co m m o n   a n d   o f te n   in d i s p en s ab le  tech n iq u u s ed   in   m ed ical  a n d   b io lo g ical  r esea r ch   lab s   in   t h d iag n o s is   o f   h er ed it ar y   d i s ea s es [ 2 0 ,   2 1 ] .   T h lab o r ato r y   m et h o d s   ar f ac in g   c h alle n g e s   in   an a l y zi n g   t h g e n s eq u e n ce s   to   d etec th g e n etic   d is o r d er .   T h er ef o r e,   th p r o ce s s   s h o u ld   b au to m ated   t h r o u g h   th e   co m p u tatio n al   m eth o d s   an d   d is ea s e   s h o u ld   b id en tif ied   ef f icie n tl y .   C las s i f icatio n   o f   Facio s ca p u lo h u m er al  m u s cu lar   d y s tr o p h y   ( FS HD)   d is ea s is   d o n b y   m o n ito r in g   o f   ex p r ess io n   le v els.  Us u all y ,   m i cr o ar r ay   g en e   ex p r es s io n   a n al y s i s   i s   m ai n l y   f o cu s ed   to   ca n ce r   d is ea s es.  I n   t h e   p ap er   [ 2 2 ] ,   th e   au th o r s   p r o p o s ed   an   ap p r o ac h   to   class if y in g   t h t y p es  o f   Facio s ca p u l o h u m er al  m u s c u lar   d y s tr o p h y   ( F SHD) .   A   m o d el  i s   cr ea ted   u s i n g   S u p p o r t v ec to r   m ac h i n to   clas s i f y   t h t y p e s   o f   FS HD.   T h au th o r s   C at h er i n T .   Falk ,   J am e s   M.   Gilc h r is t   [ 2 3 ]   d ev elo p ed   m o d el   u s i n g   n e u r al  n et w o r k s   t o   id en ti f y   w h eth er   th p atie n is   af f ec ted   f r o m   L i m b   Gr id d le  m u s c u lar   d y s tr o p h y   ( L GM D) .   T h d ata  b ased   o n   th p atien t s   f a m il y   d etail s   ar co llected .   T h class if icatio n   o f   d is ea s s tat u s   i s   m ad u s in g   th n e u r al  n et w o r k   an d   ac h ie v ed   an   ac cu r ac y   o f   9 8 %.   T h au th o r s   in   [ 2 4 ]   co n s tr u cted   p r o tein     p r o tein   in ter ac tio n   n et w o r k   to   class i f y   t h s u b   ty p es  o f   m u s c u lar   d y s tr o p h y   t h r o u g h   m ac h in lear n in g   tech n iq u e s .   Mic r o ar r ay   g e n ex p r ess io n   d atasets   ar an al y ze d   an d   th p r o tein   d ata  a n d   th e i r   in ter ac tio n   d ata  ar co llected   an d   n et w o r k   is   co n s tr u cted   to   class i f y   th s u b   t y p es.  M u lti  cla s s   s u p p o r v ec to r   m ac h i n is   ap p lie d   f o r   th clas s i f icatio n   o f   s ix   s u b - t y p e s   o f   m u s c u lar   d y s tr o p h y .   So m o f   t h l i m itatio n s   o f   m icr o   ar r a y   d ata   to   clas s i f y   a ll  f o r m s   o f   m u s c u lar   d y s tr o p h y   ar e   th e   cDN A   p r o b es  p lo tted   o n   th e   m icr o ar r a y s   d o   n o co v er   al o f   t h g en e s   e x p r ess ed   i n   s k eleta m u s cle,   th e   p r o p er ties   o f   p r o b cDN A s   h a v n o b ee n   n o w ell - c h ar ac ter ized ,   h o m o lo g o u s   g e n es  o f   ea ch   tar g et  g en m a y   cr o s s - h y b r id ize  w it h   t h p r o b es  an d   b ec au s r elativ e l y   lar g a m o u n ts   o f   R N A   ar r eq u ir ed ,   ea ch   m icr o ar r a y   an al y s is   h as r eq u ir ed   p o o led   R NA   s a m p le s   f r o m   s ev er al  p ati en ts   [ 2 5 ,   2 6 ] .   T h au th o r s   in   [ 2 7 ]   p r o p o s ed   m o d el  to   class i f y   t h t y p e s   o f   Hu m a n   L eu k o c y te  A n t ig en   ( HL A)   g en e   in to   d if f er en t   f u n ctio n a g r o u p s   b y   ch o o s i n g   t h co d o n   u s a g b ias   as i n p u t.  I n   th eir   wo r k ,   th e y   co n v er ted   th g en e   s eq u en ce   in to   5 9   v e cto r   ele m e n ts   b y   ca lc u lati n g   t h R S C v al u es  f o r   t h g en e   s eq u e n ce .   A   m o d el   w a s   cr ea ted   u s i n g   Su p p o r t v ec to r   m a c h i n an d   ac h iev ed   an   a cc u r ac y   r ate  o f   9 9 . 3   p er ce n t.   T h au th o r s   C . M. Nis h a,   B h a s k er   P an t,  an d   K.   R .   P ar d asan i   p r o p o s ed   an   ap p r o ac h   b ased   o n   co d o n   u s a g p atter n   to   cla s s i f y   t h e   t y p o f   Hep atiti s   C   v ir u s   ( HC V)   t h at  ar th e   p r i m ar y   r ea s o n   f o r   th e   li v er   in f ec t io n .   T o   class if y   th s u b class   o f   it s   g e n o t y p m o d el   w as  cr ea ted   u s in g   co d o n   u s a g b ias  as  in p u to   m u lti cla s s   SVM  [ 2 8 ] .   T h class if icat io n   o f   m u s cu lar   d y s tr o p h y   co n ti n u es  to   ev o lv w it h   th ad v a n ce s   i n   u n d er s tan d in g   o f   th eir   m o lecu lar   g e n etics.  Hu g n u m b er   o f   m u s cu lar   d y s tr o p h y   r elate d   f a u lt y   g en e s   a n d   p r o tein s   ar id e n ti f ied ,   b u n o   s u cc es s f u l   tr ea t m e n t s   a r k n o w n   f o r   m an y   o f   its   s u b - t y p es.  T h p r o p o r tio n   o f   m u ta tio n s   i n   d eletio n s ,   d u p licatio n s   an d   p o in m u tati o n s   d i f f er s   i n   ea c h   t y p o f   d i s ea s a n d   t h e   p r ese n m et h o d s   ca n n o h a n d le  t h e   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8938   IJ - AI    Vo l.  6 ,   No .   4 ,     Dec em b er   2 0 1 7   :   1 7 4     1 8 4   176   en tire   m u tatio n al   s p ec tr u m   in   s i n g le  p lat f o r m .   Ho w e v er ,   it  is   e s s e n tial   to   lo o k   i n to   t h e   ac cu r ate  m u tatio n   s ite  an d   to   p r ed ict  th d is ea s e.   I n   t h ab o v e   m e n tio n ed   liter at u r es  t h e   d is ea s e   clas s i f icatio n   is   d o n e   f o r   o n l y   s o m k i n d   o f   m u s c u la r   d y s tr o p h y   d is ea s es.  T h class i f icatio n   w a s   p er f o r m ed   w it h   t h d ata  s u ch   as  m icr o   ar r ay   g e n ex p r ess io n   d ata,   p r o tein   in ter ac tio n   d ata  a n d   w it h   f a m il y   d etails.  T h s y n o n y m o u s   v ar ia n ts   w er ca p t u r ed   w it h   th R S C U   v alu e s   th at   h e lp ed   in   i d en ti f y i n g   t h v ir u s   o r   i n   c lass if ica tio n   o f   g en e   s eq u en ce s .   He n ce ,   i is   m o ti v ated   th a t   th clas s i f icatio n   o f   d is ea s ca n   also   b ca r r ied   o u b y   m o d elin g   b o th   s y n o n y m o u s   a n d   n o n   s y n o n y m o u s   m u tatio n s   u s in g   d is ea s ed   g en e   s eq u en ce s .   As  Mu s c u lar   d y s tr o p h y   is   g en etic  d is o r d er ,   it  is   im p er ati v to   id en tify   f r o m   t h m u tati o n s   in   t h e   g en e   s eq u e n ce s .   S y n o n y m o u s   an d   n o n     s y n o n y m o u s   S NV’ s   m u s b co n s id er ed   to   p r ed ict  th d is ea s e   ef f icien tl y .   Hen ce ,   i n   t h is   p a p er   th d is ea s i s   p r ed icted   f r o m   t h m u tated   g e n s eq u e n ce s   b y   b u ild i n g   a   m o d el  u s i n g   s u p er v is ed   lear n i n g   al g o r ith m s   f o r   all  t y p e s   o f   s in g le  n u cleo tid v ar ia n ts .   I n   th i s   r esear ch   w o r k   d iv er s f ea tu r es  ar d esig n ed   to   p r o p o s n ew   m o d el  an d   an   in teg r ated   ap p r o ac h   is   d e m o n s tr ated   b as ed   o n   co m p u ta tio n al  in te lli g en ce   tech n iq u to   d etec m aj o r   f i v f o r m s   m u s c u lar   d y s tr o p h y   w it h   clo n ed   g e n s eq u en ce s   as  in p u t.  Featu r es  ab o u m is s en s e,   n o n - s e n s m u tatio n s   an d   s ile n t   m u tatio n s   in   g e n s eq u e n ce s   a r id en tif ied   an d   m o d el  is   g e n er ated   u s i n g   s u p er v is ed   lear n in g   tec h n iq u e.       2.   RE S E ARCH   M E T H O D   T h g en s eq u e n ce s   a n d   it s   p atter n   v ar y   i n   e v er y   h u m an .   A l s o   th p atter n   g ets   alt er ed   w h e n   m u tatio n s   o cc u r   in   t h c h r o m o s o m e.   T h p r in cip al  f o c u s   o f   th i s   r esear c h   i s   to   id en ti f y   d is cr i m i n ati v f ea tu r e s   an d   to   p r o v id an   ef f icie n m ac h in lear n in g   s o lu tio n   f o r   p r ed ictin g   t h t y p o f   m u s c u la r   d y s tr o p h y   d is ea s e   w it h   t h s ile n m u ta tio n s .   M u lti - cla s s   cla s s i f icatio n   is   f o r m u lated   th r o u g h   d ata  m o d elin g   o f   g en s eq u e n ce s .   T h s y n t h etic  m u tatio n al  g e n s eq u e n ce s   ar e   g e n er ated   as  t h d is ea s ed   g en e   s eq u e n ce s   ar n o r ea d il y   av ailab le  f o r   th is   co m p licated   d is ea s e.   Fi v t y p es  o f   m u s c u l ar   d y s tr o p h y   n a m el y   DM D,   B MD ,   E MD ,   L GM D   an d   C MT   h av b ee n   co n s id er ed   f o r   b u ild in g   t h d is ea s p r ed ictio n   m o d el.     2 . 1 .     Dis ea s I dentif ica t io n M o del   T h Mu s c u lar   d y s tr o p h y   d is e ase  I d en ti f icatio n   m o d el  co m p r is es  o f   f iv e   p h ase s   s u c h   as  m u tatio n a l   g en s eq u e n ce   g e n er atio n ,   f e atu r ex tr ac tio n ,   b u id i n g   t h m o d el  a n d   clas s i f icatio n .   T h e   f r a m e w o r k   o f   t h e   p r o p o s ed   m o d el  is   ill u s tr ated   in   Fi g u r e   1.           Fig u r e   1.   Dis ea s I d en ti f icatio n   Mo d el       2 .2 .     P o s it io na C lo nin g     P o s itio n al  clo n i n g   i s   a   tr ad iti o n al  ap p r o ac h   to   r ec o g n ize  t h d is ea s b ased   o n   it s   lo ca ti o n   o n   th e   ch r o m o s o m e.   P o s itio n al  clo n i n g   a id s   i n   d is ea s id e n ti f icatio n   ev e n   w h e n   m in u te  i n f o r m ati o n   is   k n o w n   ab o u t   th m o lec u lar   b asi s   o f   t h tr ai t.  T h f ir s g en clo n ed   b y   p o s itio n al  c lo n i n g   m et h o d o lo g y   w a s   th e   d y s tr o p h i n           PO S I T I O N AL   C L ON I N G   c D N A   R e f e r e n c e   g e n e o me   M u t a t i o n a l   I n f o r m at i o n   Dis ea s ed   g e n s eq u en ce s   F e a t u r e   Ex t r a c t i o n   T r a i n i n g   M u s c u l a r   D y st r o p h y   D i se a s e   C l a ssi f i c a t i o n   mo d e l     Dise a se d   S e q u e n c e   D i se a se   Ty p e   Evaluation Warning : The document was created with Spire.PDF for Python.
IJ - AI     IS SN:  2252 - 8938       I d en tifi ca tio n   o R a r Gen etic  Dis o r d er fr o S in g le  N u cleo ti d V a r ia n ts . . .   ( S a th ya vika s in i K )   177   g en to   d iag n o s DM a n d   h en ce   t h s a m ap p r o ac h   is   ap p lied   in   th is   w o r k   to   g e n e r ate  m u tated   g en e   s eq u en ce s ,   en co d in g   all  t h r eq u ir ed   g en es.   Mu tated   g e n s eq u en ce s   ar g en er ated   b y   th i s   ap p r o ac h   b ased   o n   th m u tat io n   a n d   its   lo ca t io n   o n   t h e   ch r o m o s o m e.   T h i n f o r m atio n   o n   t h p o s itio n   o f   m u tatio n s   i n   t h g e n s eq u e n ce s   is   a v ailab le  in   HGM D1   ( Hu m a n   Ge n M u tatio n   Data b ase)   [ 2 8 ]   is   co llectio n   o f   d ata  o n   g er m - l in e   m u tat io n s   in   g en e s   w it h   t h ei r   h u m a n   h er ed itar y   d i s ea s w h i ch   ar g r asp ed   f r o m   v ar io u s   lit er atu r es.  T h o p en   v er s io n   o f   HGM is   a v ailab le   f o r   n o n co m m er cial  p u r p o s f o r   th r eg is ter ed   u s er s   in   E d u c atio n al  in s tit u tio n s / n o n - p r o f it  o r g an izatio n s .     T h p o s i tio n al  ch an g o f   t h e   n u cleo tid is   d o n i n   cDN A   s eq u en ce   a g ai n s t h r ef er en ce   g e n e   s eq u en ce   a n d   t h n e w   m u tate d   g en s eq u en ce s   f o r   m u s c u l ar   d y s tr o p h y   ar g e n er ated   t h r o u g h   R   s cr ip t.  T h cDN A   s eq u en ce   an d   t h r e f er en ce   s eq u en ce   ar f ir s s to r ed   as  te x f il e s .   U s in g   th e   Stri n g r ep lace ( )   f u n ctio n   f r o m   t h s tr i n g i   lib r ar y   t h r e q u ir ed   p o s itio n   i s   to   b alter e d   is   id en t if ied   an d   r ep lace d   w it h   th e   n u cleo tid s p ec if ied   in   t h n u cleo tid ch an g co l u m n   o f   HGM d atab ase. Fiv t y p es  o f   m u ta tio n s   h a v b ee n   co n s id er ed   fo r   g en er ated   f o r   g en er ati n g   m u tated   s eq u e n ce s .   Usi n g   th tr ad itio n al  p o s itio n al  clo n in g   ap p r o ac h   th m u tated   s eq u e n ce s   ar g en er a ted   an d   s to r ed   as  f as ta  f iles . C o n s id er   th m i s s e n s m u tatio n al  i n f o r m atio n   f o r   th E MD   p h en o t y p f r o m   th E m er i n   g e n s u c h   as  n u cl eo tid ch an g is   2   T >C  w h i ch   in d icate s   i n   th e   p o s itio n   2   th n u cleo tid ch a n g es  f r o m   T   to   C   alter s   th p r o tein   f r o m   Me t to   th r .     2 . 3   Dis ea s G ene  Da t a s et s   T h g en e s   a s s o ciate d   w i th   d is ea s es   ar ex a m i n ed .   T h er a r ab o u f if t y   f i v e   g e n es   ev ac u ated   w it h   fi v t y p o f   m u s cu lar   d y s tr o p h y .   T ab le  1   s u m m ar ize s   g e n es  as s o ciate d   w i th   t h d is ea s e.   T h m u tatio n al   in f o r m atio n   is   r etr iev ed   f r o m   th HGM d atab ase  u s in g   t h g e n i n f o r m atio n   f o r   th r eq u ir ed   p h en o t y p e.   T h co r p u s   o f   d ata  h o ld s   all  t y p es  o f   m u tated   s eq u e n c es  s u c h   as  Mi s s e n s e,   No n   s en s e,   s y n o n y m o u s ,   I n s er tio n   an d   d eletio n   m u tatio n s .   A   s et   o f   3 0   m u tated   g e n s eq u en c es  f o r   ea ch   d is ea s i s   g e n er a ted   f o r   all  t y p o f   p h en o t y p e s .   T h d ataset  co m p r i s es  o f   1 5 0   m u tated   g e n s eq u e n ce s   co m b i n i n g   all   f o r m s   o f   m u s c u lar   d y s tr o p h y   i s   d ev elo p ed .       T ab le  1 .   Gen es a s s o ciate d   w it h   d if f er en t t y p o f   m u s cu lar   d y s tr o p h y   M u s c u l a r   d y st r o p h y   d i se a se   G e n e s a sso c i a t e d   w i t h   t h e   d i se a se   D u c h e n n e   m u sc u l a r   d y st r o p h y   D y st r o p h i n   B e c k e r s mu s c u l a r   d y st r o p h y   D y st r o p h i n   Eme r y - d r e i f u ss mu s c u l a r   d y st r o p h y   Eme r i n   L M N A / C   L i mb   g r i d d l e   mu s c u l a r   d y st r o p h y   A N O 5 , C A P N 3 , C A V 3 , D Y S F , F K R P , F K T N ,   L M N A , M Y O T , P O M G N T 1 , P O M T 1 , P O M T 2 ,   S G C A , S G C B , S , G C D , S G C G , T C A P , TR I M 3 2 , T T N   C h a r c o t   m a r i e   t o o t h   d i se a se   A A R S , A I F M 1 , B S C L 2 , D H TK D 1 , D N M 2 ,   D Y N C 1 H 1 , EG R 2 , F G D 4 , F I G 4 , G A R S ,   G D A P 1 , G J B 1 , H S P B 1 , H S P B 8 , I N F 2 , K A R S ,   K I F 1 B , L I TA F , L M N A , L R S A M 1 , M E D 2 5 ,   M F N 2 , M P Z , M T M R 2 , N D R G 1 , N EFL , P M P 2 2 ,   P R P S 1 , P R X , R A B 7 A , S B F 2 , S H 3 T C 2 , T R P V 4 , Y A R S       2 .4   F e a t ure  E x t ra ct io n a nd   T ra ini ng   D a t a s et   C h a n g in   th s tr u ctu r o f   s eq u en ce   i m p lie s   t h ca u s o f   th e   d is ea s e.   T h ese  s t r u ct u r al  ch a n g es c a n   b e   ca p tu r ed   as  f ea t u r es  f o r   m u ta tio n al  s eq u e n ce   to   lear n   th p r ed ictio n   m o d el.   T h co d o n   u s a g p atter n s   ar e   co n s id er ed   as  th co n tr ib u ti n g   f ea tu r es  f o r   r ep r esen tin g   s ile n m u tatio n s   in   t h m u tated   g e n s eq u en ce s .   Sin ce   co d o n   u s ag p att er n s   ar d iv e r s in   d if f er e n g e n f a m ilies ,   th is   f ea t u r in p u is   w e ll - c h o s en   d escr ip to r s   f o r   s p ec if y in g   d if f er en g en f a m ilie s   f o r   all  t y p es  o f   d is ea s es.  E ig h t y   eig h ev o ca ti v f e atu r es  f o r   b o th   th e   s y n o n y m o u s   a n d   n o n   s y n o n y m o u s   m u tatio n s   ar ex tr ac te d   an d   f ea t u r v ec to r s   ar cr ea ted   f o r   lear n in g   d is ea s e   p r ed ictio n   m o d el.     2 .5   F e a t ures o f   M is s ens a nd   No ns en s M uta t i o ns   T h m is s en s a n d   n o n s e n s m u tatio n a f ea tu r e s   ar b ased   o n   a n n o tatio n ,   s tr u ct u r an d   ali g n m e n o f   th d is ea s ed   g e n s eq u e n ce s .   T h ey   ar Gen eI D,   Gen s y m b o l,  C h r o m o s o m n u m b er ,   Alte r atio n   t y p e,   P r o tein   ch an g ed ,   R e f er en ce   allele,   Ob s er v ed   allele,   Mu tat io n   p o s itio n ,   L en g t h   o f   t h s eq u e n ce ,   Mu tat io n   s tar t   p o s itio n ,   Mu ta tio n   e n d   p o s iti o n ,   P o s itio n   o f   m u tatio n   in   g en s eq u en ce ,   a m i n o   ac id   ch an g lead s   to   s to p   co d o n   o r   n o t,  s to p   co d o n ,   Po s itio n   o f   s tar co d o n   in   cD NA   s eq u en ce ,   p o s itio n   o f   s t o p   co d o n   in   DNA  s eq u en ce ,   t h n u c leo tid co m p o s itio n   o f   A ,   G,   C ,   T ,   A T   an d   GC   co m p o n e n co m p o s itio n ,   E d it  d is tan ce   s co r es,  P h r ed Qu alit y   s co r es,  S u b s tit u tio n   s co r es a n d   R S C v alu e s   f r o m   5 9   co d o n s .   T h f e atu r es a r ex tr ac ted   f r o m   s et  o f   1 5 0   m u tated   s eq u en ce s   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8938   IJ - AI    Vo l.  6 ,   No .   4 ,     Dec em b er   2 0 1 7   :   1 7 4     1 8 4   178   T h ese  f ea tu r es  ar ex tr ac ted   f r o m   m u ta ted   g en s eq u en ce s   th r o u g h   R   s cr ip t.  T h er ar e   n u m er o u s   p ac k ag es a v ailab le  i n   R   f o r   b io in f o r m a tics   ap p licatio n s   th a t a r d o w n lo ad ed   f r o m   www . C R A N. o r g .   T h attr ib u tes  o f   g e n s eq u en ce s   lik e   Gen I D,   Gen s y m b o C h r o m o s o m n u m b er   ar i d en tifie d   b y   u s i n g   t h b io m ar p ac k a g i n   R .   T h ese  a n n o tatio n   f ea t u r es  ar ex tr ac ted   u s i n g   g etg e n es(i d ) .   T h Gen I i s   th N C B I   g e n id e n tifie r   f o r   th a f f ec ted   p h e n o t y p e.   So m e x a m p le s   ar Ge n eI 1 7 4 6   is   f o r   D y s tr o p h i n   g en e,   2 0 1 0   f o r   E m er in   g e n e,   4 0 0 0   f o r   L MN g e n etc.   T h s y m b o l   o f   th e   g e n a s s o ciate d   to   th e   cDN s eq u en ce   o f   th d is ea s s u ch   a s   DM D,   L M N A   an d   SM C HT 3 2   etc.   T h alter atio n   t y p s u ch   a s   m is s e n s e,   n o n s e n s e,   s ilen t,  d eletio n   an d   d u p licat io n s   ar en co d ed   to   n u m er ic   v al u es   f r o m   1   to   5 .   T h r ef er en ce   a llele  i s   t h e   ac t u al  p r o tein   t h at  i s   p r ese n in   t h cDN s eq u e n ce   f ile  an d   th o b s er v ed   allele  is   th p r o tein   o b s er v ed   af ter   alter at io n .   T o   id en tify   th r ef er en ce   allele  an d   o b s er v ed   allele,   t h p o s itio n   o f   co d o n   i s   to   b id e n ti f ied   f r o m   th e   m u tated   s eq u en ce   f i l e.   T h f ir s t   s tep   in   f i n d in g   th o b s er v ed   allele  is   t o   r ea d   th f asta  f ile  an d   s p lit  it   in to   co d o n s .   T h r e q u ir ed   co d o n   is   ac q u ir ed   an d   alter ed   b ased   o n   th p o s i tio n   in f o r m atio n   o f   co d o n   ch a n g e.   Seq in r ,   an d   B io s tr i n g s   lib r ar y   ar in q u ir ed   f o r   th is   w o r k .     T h L en g t h   o f   th e   s eq u e n ce   i s   ca p tu r ed   u s i n g   th e   L e n g t h ( )   f u n ct io n   T h f asta  f ile   is   co n v er ted   t o   d ataf r a m an d   t h len g t h   o f   t h s eq u e n ce   is   d eter m i n ed .   T h p o s itio n   o f   m u ta tio n   i n   th g en s eq u e n ce   is   id en ti f ied   b y   b last in g   t h m u t ated   s eq u en ce   a g ai n s t h r ef e r en ce   g e n s eq u en ce .   Nu cleo t id b last   is   u s ed   to   ca p tu r th p o s itio n   o f   g e n s e q u en ce .   T h b ase  co m p o s itio n   A,   C ,   G, T   a r ca lcu lated   to   co u n t   t h n u m b er   o f   o cc u r r en ce s   o f   th f o u r   d if f er e n n u cleo tid es  ( “A” ,   “C”,  G”,   an d   T ”)   in   th s e q u en ce .   T h m o s f u n d a m en tal  p r o p e r ties   o f   g en o m s eq u en ce   i s   its   A T   an d   GC   co n te n t,  GC   co n ten t is t h f r ac tio n   o f   t h s eq u en ce   t h a t c o n s is ts   o f   Gs a n d   C s ,   ie.   T h GC   co n ten ca n   b ca lcu lated   as  th p r o p o r tio n   o f   th b ases   i n   th g en o m t h at  ar Gs  o r   C s .   T h at  is ,   A T   co n ten t =   ( n u m b er   o f   As +   n u m b er   o f   T s ) * 1 0 0 / ( g en o m len g th )   GC   co n te n t =   ( n u m b er   o f   G s   n u m b er   o f   C s ) * 1 0 0 / ( g en o m len g t h )     T h p o s itio n   o f   t h S to p   co d o n   r ev ea l s   t h en d   o f   t h co d in g   p ar i n   t h s eq u e n ce .   T o   f in d   t h e   p o s itio n   o f   s tar co d o n   m a tch p atter n ( )   f u n ctio n   is   u s ed .   Al ig n m e n s co r es  ar co n s id er ed   as  th i m p o r tan t   f ea t u r f o r   d is ea s p r ed ictio n .   T h g lo b al  p air   w is ali g n m en b ased   o n   ed it  d is tan ce   i s   d o n w it h   t h m u tated   s eq u en ce   a g ai n s w i th   t h r ef er en ce   cDN A   s eq u e n ce   an d   th alig n m e n s co r es  ar ca lcu lated   u s in g   ed it   d is tan ce   s co r in g   m et h o d .   T h P h r ed Qu alit y   m ea s u r es   ar e   ca lcu la ted   w it h   t h e   p atter n Qu alit y   a n d   s u b j ec t   Qu alit y   to   ex a m in t h q u alit y - b a s ed   m atch   a n d   m i s m a tch   b it  s co r es  f o r   DNA / R N A .   T h s u b s tit u tio n   s co r es   ar ca lcu lated   b y   s etti n g   th er r o r   p r o b ab ilit y   to   0 . 1 .   T ab le  2   d ep icts   th m i s s e n s a n d   n o n s en s f ea t u r es  f r o m   m u tated   g e n s eq u e n ce s .       T ab le  2 .   F ea tu r es  an d   T h eir   Descr ip tio n   F e a t u r e s   D e scri p t i o n   G e n e   I D   I d e n t i f i e r   o f   t h e   g e n e   t a k e n   f r o m N C B I   G e n e   S y mb o l   N a me   o f   t h e   g e n e   i n v o l v e d   C h r o mo so me   N u mb e r   T h e   c h r o mo so me   i n v o l v e d   i n   m u t a t i o n   A l t e r a t i o n   t y p e   M u t a t i o n   t y p e   su c h   a s m i sse n se ,   n o n   s e n se ,   si l e n t ,   d e l e t i o n   a n d   d u p l i c a t i o n   P r o t e i n   c h a n g e d   W h e t h e r   p r o t e i n   a l t e r e d   t h r o u g h   m u t a t i o n   O b se r v e d   a l l e l e   T h e   a mi n o   a c i d   p r e se n t   i n   n o r mal   g e n e   R e f e r e n c e   a l l e l e   T h e   o b se r v e d   a mi n o   a c i d   a f t e r   mu t a t i o n   M u t a t i o n   P o si t i o n   P o si t i o n   o f   a l t e r a t i o n   i n   c D N A   se q u e n ce   L e n g t h     L e n g t h   o f   t h e   m u t a t e d   g e n e   se q u e n c e   M u t a t i o n   st a r t   p o si t i o n   T h e   st a r t i n g   p o si t i o n   o f   a l t e r a t i o n   i n   c D N A   s e q u e n c e   M u t a t i o n   e n d   p o si t i o n   T h e   p o si t i o n   w h e r e   t h e   mu t a t i o n   e n d i n   c D N A   se q u e n c e   P o si t i o n     M u t a t i o n   P o si t i o n   i n   g e n e   se q u e n c e   i s   i d e n t i f i e d   t h r o u g h   n u c l e o t i d e   b l a s t   a g a i n st   r e f e r e n c e   g e n e   se q u e n c e   N u c l e o t i d e   C o m p o si t i o n   C o mp o si t i o n   o f   A ,   C ,   G ,   T ,   A T ,   G C   i n   m u t a t e d   se q u e n c e .   P o si t i o n   o f   st o p   c o d o n   L a st   p o si t i o n   o f   st o p   c o d o n   A TG   Ed i t   d i s t a n c e   s c o r e s   A l i g n me n t   s c o r e s u si n g   e d i t   d i s t a n c e   me t h o d   P h r e d Q u a l i t y   me a su r e s   C a l c u l a t e d   w i t h   p a t t e r n Q u a l i t y   a n d   s u b j e c t Q u a l i t y   S u b s t i t u t i o n   sco r e s   C a l c u l a t e d   w i t h   t h e   e r r o r   p r o b a b i l i t y   s e t   t o   0   o r   1   C o n se n s u sS t a r t   T h e   st a r t i n g   p o si t i o n   o f   c o n se r v e d   r e g i o n   C o n se n s u sE n d   T h e   e n d   p o s i t i o n   o f   t h e   c o n se r v e d   r e g i o n       2 .6   F e a t ures o f   Sil ent   M uta t io ns   A   co d o n   is   t h tr ip let  o f   n u cl eo tid es  th at   co d f o r   s p ec i f i a m i n o   ac id .   Ma n y   to   o n r e latio n s h ip   o cc u r   b et w ee n   th e   co d o n   a n d   a m i n o   ac id .   Ma n y   a m in o   ac id s   ar co d ed   b y   m o r t h an   o n e   co d o n   b ec au s e   o f   Evaluation Warning : The document was created with Spire.PDF for Python.
IJ - AI     IS SN:  2252 - 8938       I d en tifi ca tio n   o R a r Gen etic  Dis o r d er fr o S in g le  N u cleo ti d V a r ia n ts . . .   ( S a th ya vika s in i K )   179   th d eg e n er ac y   o f   t h g e n eti co d es.A   to tal  n u m b er   o f   c o d o n s   in   D N A   s eq u en ce   c o u n t s   to   6 4 .   Sin c e   m et h io n i n ( A T G)   an d   tr y p to p h an   ( T GG)   h av o n l y   o n co r r esp o n d in g   co d o n ,   th e y   ar n o co u n ted   an d   ar eli m i n ated   f r o m   t h a n al y s i s   a s   t h eir   R SC U   v a lu e s   ar al w a y s   eq u al  to   1 .   T h t h r ee   s to p   c o d o n s   ( T GA ,   T AA ,   T A G)   ar also   n o in clu d ed .   A cc o r d in g l y ,   t h n u m b er   o f   c o d o n s   co n s id er ed   is   5 9 .   T h er e f o r e,   ir r esp ec tiv o f   th s ize,   t h DN A   s eq u en ce   i s   co n v er ted   to   f ea tu r v ec to r   o f   5 9   ele m en ts .   T h d if f er en ce s   in   t h f r eq u e n c y   o f   o cc u r r en ce   o f   s y n o n y m o u s   co d o n s   ar r ef er r ed   as  co d o n   u s ag e   b ias.  T h f o r m u la   f o r   ca lcu la tin g   R S C ca n   b e x p lai n ed   as,  t h n u m b er   o f   t i m e s   a   p ar ticu lar   co d o n   i s   o b s er v ed ,   r elativ to   th n u m b er   o f   ti m e s   th a th co d o n   w o u ld   b o b s er v ed   in   t h ab s en ce   o f   an y   co d o n   u s a g b ias  [ 2 6 ] . T h R SC ca r r ies  th v al u 1 . 0 0   if   th co d o n   u s ag b ias   o f   t h at  p ar ticu la r   co d o n   is   ab s en t.  I f   th co d o n   i s   u s ed   le s s   f r eq u e n t l y   t h a n   e x p ec ted ,   th R S C v alu es   ten d   to   h a v t h n eg a tiv v al u es.  Fo llo w in g   f o r m u la  is   u s ed   to   ca lcu late  R SC U.     R S C Xij   / ( 1 /n * S { Xij ; j= 1 ,   n i } )     w h er Xij   is   t h n u m b er   o f   o c cu r r en ce s   o f   t h j th   co d o n   f o r   th it h   a m i n o   ac id ,   an d   n i   is   t h n u m b er   o f   alter n ati v co d o n s   f o r   th it h   a m in o   ac id .   I f   t h s y n o n y m o u s   co d o n s   o f   a n   a m i n o   ac id   ar u s ed   w it h   eq u al   f r eq u en c ies,  th e n   t h eir   R S C U   v alu e s   ar 1 .   T h R SC v a l u es  ar d er iv ed   f o r   5 9   co d o n s   f r o m   ea ch   m u ta ted   g en s eq u en ce   w h ich   f o r m s   f ea t u r v ec to r   f o r   class if icat io n   task .   T ab le  3   h o ld s   th s a m p le  R SC v alu e s   o f   5 9   co d o n s   f o r   m u tated   g e n s eq u e n ce .       T ab le  3 .   R SC Valu e s   f o r   5 9   co d o n s   f o r   s a m p le  s eq u e n ce   C o d o n   V a l u e   C o d o n   V a l u e   C o d o n   V a l u e   AAA   1 . 0 5   C C C   0 . 9 7   G G C   0 . 9 2   A A C   0 . 8 1 2   CCG   0 . 1 2   GGG   0 . 7 5   AAG   0 . 9 4 8   CCT   1 . 6 4   GGT   0 . 6 4   AAT   1 . 1 8   C G A   0 . 8 7   G TA   0 . 8 1   A C A   1 . 5 2   C G C   0 . 5 4   G T C   0 . 9 3   A C C   0 . 7 6   C G G   0 . 6 6   G TG   1 . 4 0   A C G   0 . 2 4   C G T   0 . 6 3   G TT   0 . 8 5   A C T   1 . 4 8   C T A   0 . 7 3   TA C   0 . 6 1   AGA   1 . 8 4   C T C   0 . 8 7   TA T   1 . 3 8   A G C   0 . 9 9   C T G   1 . 4 1   T C A   1 . 2 3   AGG   1 . 4 2   C T T   1 . 0 3   T C C   0 . 9 1   AGT   1 . 3 6   GAA   1 . 2 2   T C G   0 . 1 4   A TA   0 . 5 2   G A C   0 . 8 1   T C T   1 . 3 3   A T C   1 . 1 0   GAG   0 . 7 7   TG C   1 . 1 6   A TT   1 . 3 6   GAT   1 . 1 8   TG T   0 . 8 3 3   C A A   0 . 8 7   G C A   1 . 2 3   T TA   0 . 7 1   C A C   0 . 8 6   G C C   1 . 1 8   TTC   0 . 6 4   C A G   1 . 1 3   G C G   0 . 1 5   T TG   1 . 2 3   C A T   1 . 1 4   G C T   1 . 4 2   T TT   1 . 6 3   CCA   1 . 2 5   GGA   1 . 6 7           2 .7   B uil din g   t he  M o del   T h co r p u s   h o ld s   1 5 0   s eq u e n ce s   o f   5   t y p es   o f   M u s c u lar   d y s tr o p h y   d is ea s e s   s u c h   as  Du c h en n e   Mu s c u lar   D y s tr o p h y ,   B ec k er s   M u s c u lar   D y s tr o p h y ,   E m e r y   Dr e f i u s   Mu s cu lar   D y s tr o p h y ,   L i m b   Gr id d le  Mu s c u lar   D y s tr o p h y   a n d   C h a r co Ma r ie  T o o th   Dis ea s e.   tr ain in g   s et  w i th   1 5 0   f ea t u r v ec to r s   h as  b ee n   cr ea ted   an d   f o r   ea ch   f ea t u r v ec to r   th class   lab el  i s   a s s i g n e d   f r o m   1   to   5   in d icatin g   th f i v t y p es o f   m u s cu lar   d y s tr o p h y   d is ea s es.  T h f ea t u r es  o b tain ed   f r o m   ea ch   m u tated   g en s eq u e n ce   f o r m s   a   f ea tu r v ec to r   f o r   class i f icatio n   tas k .   T h s tan d ar d   s u p er v is ed   le ar n in g   tec h n iq u es,  n a m el y   Naïv B a y e s   C la s s i f ie r ,   De cisi o n   tr ee   in d u ctio n   an d   ar ti f icial  n eu r al   n et w o r k   h av b ee n   u s ed   to   le ar n   an d   b u ild   t h clas s if ier s .   I n d ep en d en tr ai n ed   m o d el s   h a v b ee n   u s ed   f o r   p r ed ictin g   t h t y p o f   m u s cu lar   d y s tr o p h y   d is ea s e   f o r   s i n g le  n u cleo tid v ar ian t s .   T h p er f o r m an ce   o f   t r ai n ed   m o d el s   is   ev a lu ated   u s i n g   1 0 - f o ld   cr o s s   v alid atio n   an d   m e asu r ed   in   ter m s   o f   class i f icatio n   ac cu r ac y .   T h p r ed ictio n   ac cu r ac y   is   ca lc u lated   w it h   t h n u m b er   o f   co r r ec tly   cla s s i f ied   in s ta n ce s   i n   t h test   d atase t a g ain s t t h to tal  n u m b er   o f   test   c ases .       3.   RE SU L T A ND  AN AL Y SI S   Fiv e   t y p e s   o f   m u s c u lar   d y s t r o p h y   d is ea s ca te g o r ies  -   D u ch e n n m u s c u lar   d y s tr o p h y ,   B ec k er s   m u s c u lar   d y s tr o p h y ,   E m er y - Dr eif u s s ,   L i m b - g ir d le  m u s c u l ar   d y s tr o p h y   a n d   C h ar co m a r ie  to o th   d is ea s ar e   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8938   IJ - AI    Vo l.  6 ,   No .   4 ,     Dec em b er   2 0 1 7   :   1 7 4     1 8 4   180   tak en   i n to   ac co u n to   i m p le m en m u lt clas s   class if ica tio n   m o d el.   Mu tated   g e n s eq u e n ce s   ar g en er ate d   an d   th f ea t u r es  o f   m i s s e n s e,   n o n s en s an d   s ile n m u t atio n s   ar ex tr ac ted   f r o m   th co r p u s   o f   d ata.   An n o tatio n ,   s tr u c tu r an d   ali g n m e n f ea tu r es  co u n to   t wen t y   n i n f o r   m is s e n s an d   n o n s e n s m u tatio n s .   As s ile n m u tatio n s   p la y s   m a j o r   r o le  in   d etec tin g   th s y n o n y m o u s   v ar ian ts   o f   g e n etic  d is o r d er   it is   i m p o r tan t   to   d etec s ilen m u tatio n s   f r o m   g e n s eq u e n ce s .   T h R elat iv s y n o n y m o u s   co d o n   u s a g e   ( R SC U)   v al u es  ar ca lcu lated   f r o m   f i f t y   n i n co d o n s   ar ta k e n   a s   f ea t u r es  f o r   s ilen t   m u tatio n s   an d   f ea t u r v e cto r s   ar d esig n ed .   Stan d ar d   s u p er v is ed   lear n in g   tech n iq u es  in cl u d i n g   d ec i s io n   tr ee ,   ar tif icial  n e u r al  n et w o r k ,   n v b a y e s   ar e   u tili ze d   a n d   m u s cu lar   d y s tr o p h y   d is ea s cla s s i f icatio n   m o d el  is   d ev e lo p ed   u s i n g   R ,   w h ic h   is   an   o p en   s o u r ce   s o f t w ar e n v ir o n m en t   f o r   s tat is tical  co m p u ti n g .   T h av er a g ac c u r ac y   o f   t h e   cla s s i f ier s   is   e v al u ated   u s i n g   10 - f o ld   cr o s s   v alid atio n   a n d   t h p er f o r m a n ce   o f   t h m o d el  is   ev a lu ated .   Fro m   t h r es u lts ,   it  is   o b s er v ed   t h a t   d ec is io n   tr ee   al g o r ith m   attai n s   h i g h   ac c u r ac y   v al u o f   1 0 0 f o r   t h d ev elo p ed   tr ain i n g   d ata  s et.   T h r esu lt s   o f   th e   ex p er i m en t s   ar s u m m ar ized   in   T ab le  4 .   T ab le   5   g iv es  t h co m p ar ati v a n al y s i s   o f   th e   ex i s ti n g   an d   p r o p o s ed   w o r k .       T ab le  4 .   P r ed ictiv e   P er f o r m an ce   of   th e   C la s s i f ier s   Ev a l u a t i o n   c r i t e r i a   C l a ssi f i e r s   NB   A N N   D e c i si o n   T r e e   K a p p a   S t a t i s t i c   0 . 7 8 0 4   0 . 9 1 1 7   1   C o r r e c t l y   c l a ssi f i e d   i n s t a n c e s   1 2 0   1 3 8   1 5 0   I n c o r r e c t l y   c l a ssi f i e d   i n st a n c e s   30   12   1 5 0   P r e d i c t i o n   a c c u r a c y   8 0 %   9 2 %   1 0 0 %       T ab le  5 .   St atis tics   of   C las s if ie r   by   I ts   C las s   C l a ss   C l a ssi f i e r   S e n si t i v i t y   S p e c i f i c i t y   P o s Pr e d   V a l u e   N e g   P r e d   V a l u e   P r e v a l e n c e   D e t e c t i o n   Rate   D e t e c t i o n   P r e v a l e n c e   B a l a n c e d   A c c u r a c y   1   A N N   0 . 3 7   0 . 8 0   0 . 3 7   0 . 8 0   0 . 2 4   0 . 0 9   0 . 2 4   0 . 5 9   NB   0   0 . 9 7   0   0 . 9 8   0 . 0 1 2   0   0 . 0 2 5   0 . 4 9   DT   1   1   1   1   0 . 2 2   0 . 2 2   0 . 2 2   1   2   A N N   0 . 2   0 . 8 5   0 . 2   0 . 8 5   0 . 1 6   0 . 0 3 2   0 . 1 6   0 . 5 2   NB   0 . 1 8   0 . 7 8   0 . 1 8   0 . 7 9   0 . 2 0   0 . 0 4   0 . 2 1   0 . 4 8   DT   1   1   1   1   0 . 2 2   0 . 2 2   0 . 2 2   1   3   A N N   0 . 3   0 . 7 8   0 . 3   0 . 7 8   0 . 2 4   0 . 0 7 1   0 . 2 4   0 . 5 4   NB   0 . 2 4   0 . 6 3   0 . 2 3   0 . 6 4   0 . 3 1   0 . 0 7   0 . 3 3   0 . 4 3   DT   1   1   1   1   0 . 2 2   0 . 2 2   0 . 2 2   1   4   A N N   0 . 2   0 . 8 0   0 . 2   0 . 8 0   0 . 1 9   0 . 0 3 9   0 . 1 9   0 . 5 0   NB   0 . 2 5   0 . 7 6   0 . 2 6   0 . 7 5   0 . 2 5   0 . 0 6   0 . 2 4   0 . 5 1   DT   1   1   1   1   0 . 1 8   0 . 1 8   0 . 1 8   1   5   A N N   0 . 1 4   0 . 8 3   0 . 1 4   0 . 8 3   0 . 1 6 7   0 . 0 2   0 . 1 7   0 . 4 8   NB   0 . 4 7   0 . 8 8   0 . 5 3   0 . 8 6   0 . 2 1   0 . 1 0   0 . 1 8   0 . 6 7   DT   1   1   1   1   0 . 1 5   0 . 1 5   0. 15   1       T a b le   5 .   C o m p a r is i o n   o f   th E x is tin g   an d   th p r o p o s e d   W o r k   C l a ssi f i c a t i o n   D a t a   A p p r o a c h   A l g o r i t h m   ( me t h o d )   A c c u r a c y   ( %)   D M D   &   B M D   G e n e   S e q u e n c e s   M L P A     L a b o r a t o r y     mP C R   75   D M D   G e n e   S e q u e n c e s   M L P A     L a b o r a t o r y     D H P L C   86   L G M D   F a mi l y   D e t a i l s   M a c h i n e   L e a r n i n g   A N N   98   6   t y p e s o f   M D   M i c r o   a r r a y     P r o t e i n   p r o t e i n   I n t e r a c t i o n   M a c h i n e   L e a r n i n g   M S V M   86   F S H D   M i c r o a r r a y   M a c h i n e   L e a r n i n g   S V M   8 4 . 6 5   G e n e   t y p e   C l a ssi f i c a t i o n   H L A   G e n e   M a c h i n e   L e a r n i n g   S V M   9 9 . 3   V i r u t y p e   C l a ssi f i c a t i o n   H C V   V i r u s   M a c h i n e   L e a r n i ng   S V M   1 0 0   5   T y p e s o f   M D   S y n o n y mo u s a n d   N o n     sy n o n y mo u mu t a t e d   g e n e   se q u e n c e s   M a c h i n e   L e a r n i n g   D e c i si o n   T r e e   1 0 0       T h ex is ti n g   ap p r o ac h es  eith er   class i f y   th g e n o r   th d is ea s w i th   t h m icr o   ar r a y ,   p r o tein   o r   f a m il y   d etai ls   d ata.   T h class i f icatio n   w as d o n o n l y   f o r   eith er   s y n o n y m o u s   o r   n o n   s y n o n y m o u s   t y p o f   S NV.   T h p r o p o s ed   ap p r o ac h   ca n   class i f y   f i v t y p e s   o f   m u s c u lar   d y s tr o p h y   f r o m   m u tated   g e n s eq u en ce   a s   in p u f o r   b o th   SNV’ s   w it h   1 0 0 % a cc u r ac y .           Evaluation Warning : The document was created with Spire.PDF for Python.
IJ - AI     IS SN:  2252 - 8938       I d en tifi ca tio n   o R a r Gen etic  Dis o r d er fr o S in g le  N u cleo ti d V a r ia n ts . . .   ( S a th ya vika s in i K )   181   4.   DIS CU SS I O N   T h aim   o f   th is   r esear ch   w o r k   is   to   i d en tify   t h p r o p er   f ea tu r es  f o r   class i f y i n g   an d   b u ild in g   t h e   class i f ier   f o r   ef f ec ti v en e s s .   As  ea ch   d i s ea s h as  its   o w n   ch ar ac ter   th v ici n it y   o f   th i s   w o r k   d ep en d s   o n   ca p tu r in g   t h attr ib u tes  o f   th e   g en s eq u e n ce   t h at  d i f f er e n tia tes  o n t y p o f   m u s c u lar   d y s tr o p h y   d is ea s e   f r o m   an o th er .   B ased   o n   th f ea tu r es  o f   m i s s e n s e,   n o n s e n s an d   s ilen m u tatio n s   an   atte m p is   m ad to   b u ild   m o d el  f o r   p r ed ictin g   t h t y p o f   m u s c u lar   d y s tr o p h y .   T h m is s en s an d   n o n s en s e   m u tatio n a f ea tu r e   co m p r is e s   o f   a n n o tatio n   f ea t u r es,  s tr u c tu r al   f ea tu r es   a n d   al ig n m e n t   f ea t u r es.   R SC U   ( R el ativ s y n o n y m o u s   co d o n   u s ag e)   is   ca lcu lated   in   t h m u tated   g en s eq u en ce s   to   ac co m p a n y   s ilen m u tatio n s .   Fro m   t h T ab le   5   it  is   o b s er v ed   t h at   th e   s ta tis tic s   i s   h ig h   f o r   d ec is io n   tr ee   th a n   o t h er   al g o r ith m s .   T h p o s itiv e   p r ed ictio n   v al u a n d   n eg at iv e   p r ed ictio n   v al u al s o   g i v es   h i g h   s co r v alu e   f o r   d ec is io n   tr ee   lear n i n g .   T h g r ap h   i n   F ig u r e. 3   s h o w s   t h p r ed ictio n   v a lu i s   b alan ce d   f o r   d ec is io n   tr ee   alg o r ith m .   P r ev ale n ce   is   t h p r o p o r tio n   o f   p ar ticu lar   di s ea s at  s p ec if ied   p o in in   ti m e.   T h s en s it iv i t y   m ea s u r o r   r ec all  d ep en d s   o n   p r ev alen ce   an d   w h er th e   s p ec if icit y   i s   i n d ep en d en o f   p r ev alen ce .   I n   d ec is io n   tr ee   b ased   m o d el  th p r ev ale n ce   m ea s u r es  ar s tab ilize d   f o r   all  c lass e s   t h at   is   ex p o s ed   in   Fi g u r 5 .   T h d etec tio n   r ate  an d   d etec t io n   p r ev a len ce   al s o   d ep en d s   o n   t h e   p r ev alen ce   m ea s u r w h ic h   is   also   s tab ilized .   Ov er all,   in   Fig u r 6 ,   i is   m ad k n o w n   t h at  t h b alan ce   ac cu r ac y   m ea s u r is   also   e m i n en in   d ec is io n   tr ee   w h e n   m ea s u r ed   w it h   o th er   alg o r ith m s . .   R O C   cu r v in   Fig u r 7 .   is   an   ev id en ce   w h ic h   s h o w s   t h at  th e   d ec is io n   tr ee   attai n s   e lev ated   s en s iti v it y   a n d   s p ec i f icit y .   T h lin e   th a t b r ea k s   a t   1   s h o w s   m o r s e n s it iv i t y   a n d   s p ec if icit y .   A l s o   th e   ex p er i m e n p r o v es  t h at  t h f ea t u r es  d es ig n ed   f o r   b u ild i n g   th clas s i f ier   ar m o r ap p r o p r iate  an d   s u itab le  f o r   d is ea s id en ti f icatio n .           Fig u r e   3 .   C o m p ar is o n   o f   P r ed ictio n   ac cu r ac y   o n   th t h r ee   cla s s i f icatio n   alg o r it h m s           Fig u r e   4 .   P o s itiv an d   n e g ati v p r ed ictio n   v alu f o r   all  th cl ass es.  Fi g u r e . 4 . th v al u es i n   A N ar d ep icted ,   in   Fi g u r e . 4 . b   th v alu e s   f o r   Na ïv B a y es a n d   in   Fi g u r 4 . th ch ar t is s h o w n   f o r   d ec is io n                Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8938   IJ - AI    Vo l.  6 ,   No .   4 ,     Dec em b er   2 0 1 7   :   1 7 4     1 8 4   182       Fig u r 5 .   P r ev alen ce   m ea s u r f o r   th clas s i f icatio n   al g o r ith m s           Fig u r 6 .   Ov er all  b alan ce   ac cu r ac y   o f   A NN,   NB   an d   DT           Fig u r 7 .   R OC   c u r v a n al y s is   o f   s en s iti v it y   an d   s p ec i f icit y   f o r   d ec is io n   tr ee   alg o r ith m       I n   t h is   ex p er i m en t   t h m u tatio n   s p ec tr u m   ac co m p a n ies   all  t y p e s   o f   m u s c u lar   d y s tr o p h y   d is ea s es   f o r   m o d eli n g   an d   t h er ef o r th t ask   o f   f u ll  s eq u en c in g   is   e li m i n ated .   T h is   ap p r o ac h   g en e r alize s   th d is ea s id en ti f icatio n   tas k   a n   a u to m a ted   p r ac tice  th at  ca n   b ap p l ied   in   id e n ti f y i n g   a n y   k in d   o f   g e n etic   d is ea s e.                D ec i s i o n  t r ee   Evaluation Warning : The document was created with Spire.PDF for Python.
IJ - AI     IS SN:  2252 - 8938       I d en tifi ca tio n   o R a r Gen etic  Dis o r d er fr o S in g le  N u cleo ti d V a r ia n ts . . .   ( S a th ya vika s in i K )   183   A l s o   t h p r ed ictio n   m o d el  i s   m o r e f f ec tiv e   an d   r eliab le  s in ce   it  i s   g e n er ated   b ased   o n   i n telli g e n h i n ts   co llected   f r o m   m u t ated   g e n s eq u en ce s .   5.   CO NCLU SI O N     Mu s c u lar   d y s tr o p h y   d is ea s i d en tific atio n   w o r k   i s   t h p r o b le m   o f   lear n i n g   m u lticla s s   cla s s i f icatio n   s y s te m   th a ca n   s u its   in   b io in f o r m atic s   en v ir o n m e n to   i d en tify   t h d is ea s e f f ec tiv e l y .   C u r r en tl y ,   t h is   p r o b lem   h as  n o b e en   b r o a d ly   s tu d ied   in   th liter at u r e,   an d   ex is t in g   ap p r o ac h es  ar eith er   r estricte d   to   s m all   n u m b er   o f   clas s es   d u to   co m p u tatio n al   is s u e s   o r   i n s u f f icie n d ata.   T h p r o p o s ed   m o d el  r elies  o n   t w o   m ai n   id ea s .   T h f ir s t id ea   is   to   d esi g n   t h d is cr i m in at iv f ea t u r es  f r o m   t h m u tated   g e n s eq u en c es to   b u ild   m o d el   f o r   id en ti f y in g   t h t y p o f   th g en et ic  d is o r d er .   T h s ec o n d   id ea   is   to   ca p tu r e   s y n o n y m o u s   a n d   n o n s y n o n y m o u s   SNV s   f r o m   t h g e n er ated   s eq u e n ce s   an d   to   class i f y   t h t y p o f   d is ea s e.   T h ex p er i m en t s   l ed   o n   th d is ea s ed   g en s eq u en ce s   an d   as s ess ed   w it h   ev al u atio n   m et h o d   o n   th m o d el  b u ilt,  s h o w   t h at  o u r   m et h o d   is   v al u ab le  th a n   e x i s tin g   d i s ea s id e n ti f icatio n   p r o ce d u r es  w i th   r esp ec to   s i g n i f ica n f ea t u r es .   Fu r t h er m o r e,   w h e n   t h s u p er v is ed   lear n in g   al g o r ith m s   ar ap p lied   th d ec is io n   tr ee   cla s s i f ier   o u tp er f o r m s   o th er   alg o r it h m s   i n   p r ed ictio n .   As  t h n atu r o f   t h ap p licat io n   d e m a n d s   i n   m o r ac cu r ate   d is ea s p r ed ictio n   th r o u g h   m u tated   g e n s eq u e n ce s ,   it  i s   f o u n d   t h at  ap p l y i n g   t h e x tr ac ted   f ea t u r es  i n   m ac h in lear n in g   ap p r o ac h   is   s ig n if ican t to   id en tify   th t y p o f   m u s cu lar   d y s tr o p h y   d is ea s e.       RE F E R E NC E S   [1 ]   In u sh a   P a n ig ra h i,   Ba lraj  M i tt a l ,   Ca rrier  De tec ti o n   a n d   P re n a tal  Dia g n o sis  in   Du c h e n n e /Be c k e M u sc u lar  D y stro p h y ,   In d ian   P e d iatrics   2 0 0 1 3 8 6 3 1 - 6 3 9 .   [2 ]   Le ig h   B.   W a d d e ll ,   e t. a l,   " Dia g n o sis  o f   th e   M u sc u lar  Dy stro p h ies " In stit u te  f o Ne u r o sc ien c e   a n d   M u sc le  Re se a rc h ,   Ch il d re n ’s Ho sp i tal  a W e st m e a d   a n d   Disc ip li n e   o f   P a e d iatrics   &   C h il d   He a lt h ,   Un iv e rsit y   o f   s y d n e y ,   A u stra li a .   [3 ]   L e n k a   F a jk u so v a ,   Zd e n e Ik   L u k a sIb ,   M iro sla v a   Tv rd o a k o v a   a ,   V iera   Ku h ro v a   a , Jirio a   Ha a jek b ,   Jirio a   F a jk u sc ,   No v e d y stro p h in   m u tatio n re v e a led   b y   a n a l y sis  o f   d y stro p h in   m RNA : a lt e rn a ti v e   sp li c in g   su p p re ss e th e   p h e n o ty p ic effe c o f   a   n o n se n se   m u tatio n   Ne u ro m u sc u lar Diso rd e rs 1 1   ( 2 0 0 1 ) .   [4 ]   Ke v in   M .   F lan ig a n ,   M . D T h e   M u sc u lar  Dy stro p h ies ,   T h iem e   M e d ica P u b li s h e rs  IS S 0 2 7 1 - 8 2 3 5   S e m in a rs  in   Ne u ro lo g y   V o l.   3 2   No .   3 / 2 0 1 2 .   [5 ]   Zu b rz y c k a - G a a rn   EE ,   Bu lm a n   D E,   Ka rp a ti   G ,   e a l.   T h e   Du c h e n n e   m u sc u lar  d y stro p h y   g e n e   p ro d u c is  lo c a li z e d   i n   sa rc o le m m a   o f   h u m a n   sk e leta m u sc le.  Na tu re   1 9 8 8 ;3 3 3 ( 6 1 7 2 ): 4 6 6 ±4 6 9 .   [6 ]   Ka th a rin e   Bu sh b y ,   e t. a l,   " Dia g n o sis  a n d   m a n a g e m e n o f   Du c h e n n e   m u sc u lar  d y stro p h y ,   p a rt  1 :   d iag n o sis,  a n d   p h a rm a c o lo g ica a n d   p sy c h o so c ial  m a n a g e m e n t"   T h e   Lan c e t ,   No v e m b e 3 0 ,   2 0 0 9   DO I:1 0 . 1 0 1 6 /S 1 4 7 4 - 4 4 2 2 ( 0 9 ) 7 0 2 7 1 - 6 .   [7 ]   A n n e   He lb li n g - L e c lerc ,   G ise Á l e   Bo n n e ,   a n d   Ke tt y   S c h w a rtz,  " Em e r y - Dre i f u ss   m u sc u lar  d y stro p h y "   Eu ro p e a n   J o u rn a o Hu ma n   Ge n e ti c s   ( 2 0 0 2 ) .   [8 ]   M a   W J1 ,   Ha sh ii   M ,   e t. a l,   " No n - s y n o n y m o u sin g le - n u c leo ti d e   v a riatio n o f   th e   h u m a n   o x y to c in   re c e p to g e n e   a n d   a u ti sm   sp e c tru m   d iso rd e rs:  a   c a se - c o n tro stu d y   in   a   Ja p a n e se   p o p u lati o n   a n d   f u n c ti o n a a n a ly sis . "   M o lec u lar  A u ti s m ,   2 0 1 3 .   [9 ]   S h u a Zen g ,   Ji n g   Ya n g ,   e t. a l, "   EF IN:  p re d icti n g   th e   f u n c ti o n a im p a c o f   n o n sy n o n y m o u si n g le  n u c leo ti d e   p o ly m o rp h ism s in   h u m a n   g e n o m e " ,   BM G e n o m i c s,  2 0 1 4   [1 0 ]   h tt p : // ww w . n c b i. n lm . n ih . g o v /b o o k s/NBK 2 1 5 7 8   [1 1 ]   Ka n n ,   M . G . A d v a n c e in   tran sla ti o n a b io in f o rm a ti c s:  c o m p u tatio n a a p p r o a c h e f o th e   h u n ti n g   o f   d ise a se   g e n e s.   Brief in g s in   Bio in f o rm a ti c s 1 1 ,   9 6 1 1 0   (2 0 0 9 ) .   [1 2 ]   T ra n c h e v e n t,   L . - C. ,   e a l. A   g u id e   to   w e b   to o ls  t o   p rio ri ti z e   c a n d id a te  g e n e s.  Brie f in g in   Bio i n f o rm a ti c 1 2 ,   2 2 32  (2 0 1 0 ) .   [1 3 ]   A le k sa n d ra   Na d a j - P a k lez a ,   e t. a l, " T h e   ro le  o sk e leta m u sc le  b io p sy   in   th e   d iag n o sis  o f   n e u ro m u sc u lar  d iso r d e rs"   2 0 1 0   P o li s h   S o c iety   o f   N e u ro lo g y   a n d   t h e   P o li sh   A ss o c iatio n   o f   Ne u ro su rg e o n s,  El se v ier .   [1 4 ]   h tt p : // e v o lu ti o n . b e rk e ley . e d u /ev o l ib ra ry /article m u tatio n s_ 0 1   [1 5 ]   KN   No rth   a n d   KJ   Jo n e s., Dia g n o sin g   c h il d h o o d   m u sc u lar d y stro p h ies .   J o u rn a o f   Pa e d ia trics   a n d   Ch il d   He a lt h .   [1 6 ]   Ro b e rts  e a l.   P o i n m u tatio n in   th e   d y st ro p h i n   g e n e   ,   V o l . 9   M a rc h   1 9 9 2   G e n e ti c s   [1 7 ]   Ch e n   Ch e n ,   Ho n g w e M a ,   " S c re e n in g   o f   Du c h e n n e   M u sc u lar  Dy stro p h y   (DMD)  M u tatio n a n d   I n v e stig a ti n g   Its   M u tatio n a M e c h a n ism   in   Ch in e s e   P a ti e n ts" ,   P L OS  On e   2 0 1 4 .   [1 8 ]   Be n n e tt   RR1 ,   S c h n e id e HE   e t. a l,   " A u to m a t e d   DN A   m u tati o n   d e tec ti o n   u sin g   u n iv e rsa c o n d it i o n s   d irec t   se q u e n c in g a p p li c a ti o n   t o   ten   m u sc u lar d y stro p h y   g e n e s " ,   BM Ge n e ti c s 2 0 0 9 .   [1 9 ]   Ko e n ig   M ,   Ho ffm a n   EP ,   Be rtels o n   CJ,  M o n a c o   A P ,   F e e n e C,   Ku n k e L M .   Co m p lete   c lo n in g   o f   th e   Du c h e n n e   m u sc u lar  d y stro p h y   (DMD)  c DN A   a n d   p re li m in a r y   g e n o m ic  o rg a n iza ti o n   o f   th e   DMD  g e n e   in n o r m a a n d   a ff e c ted   in d iv id u a ls.   Ce ll   1 9 8 7 ;5 0 :5 0 9 ± 5 1 7 .   [2 0 ]   Dr.M o h in i   Jo sh i ,   Dr.D e sh p a n d e   J.D,  P o ly m e r a se   Ch a in   Re a c ti o n :   M e th o d s,   P ri n c ip les   a n d   A p p li c a ti o n In ter n a t io n a J o u rn a o B io me d i c a Res e a rc h 2 0 1 1 .   [2 1 ]   H y e y o u n g   Lee ,   Do n g   W o o k   Je k a rl,   Jo o n h o n g   P a rk ,   H y o ji n   Ch a e ,   M y u n g sh in   Kim , Yo n g g o o   Ki m ,   a n d   Jo n g   in   L e e   Id e n ti f ica ti o n   o f   DMD  M u tati o n   i n   Ko re a n   S ib l in g s Us in g   F u ll   G e n e   S e q u e n c i n g .   [2 2 ]   F e li x   F . G o n z a lez - Na v a rro   e t. a l,   " Eff e c ti v e   Clas si f ica ti o n   a n d   G e n e   Ex p re ss io n   P r o f il in g   f o th e   F a c io sc a p u lo h u m e ra M u sc u lar D y stro p h y "   ,   P L o S   ON 2 0 1 3 .   Evaluation Warning : The document was created with Spire.PDF for Python.