I n d on e s ian   Jou r n al   o f   E lec t r ica l   E n gin e e r in a n d   Com p u t e r   S c ience   Vo l .   3 7 ,   N o .   2 F e b r ua r y   20 2 5 ,   pp.   1 35 2 ~ 1 36 4   I S S N:  2 502 - 4 7 52 ,   DO I 10 . 11591/i j e e cs .v 3 7 . i 2 . pp 1 35 2 - 1 36 4             1352     Jou r n al  h o m e page ht tp: // ij e e cs . iaes c or e . c om   P e r f or m an c e  an al y si s of  10  m ac h in e  l e ar n in m o d e ls  i n   lu n c an c e r  p r e d ic t io n       Jos e l yn   Z ap at a - P au l in i 1 M ichael   Caban il l a s - C ar b on e l l 2   1 G r a dua te  S c h oo l , U ni ve r s id a d C o nt in e nt a l,   L im a P e r u   2 F a c ul t y   of  E ngi n e e r in g , U ni ve r s id a d P r i v a da  d e N o r t e L i ma , P e r u       Ar t ic l e   I n f o     AB S T RA CT   A r ti c le  h is tor y :   R e c e i ve M a r   1 ,   202 4   R e vi s e S e p   25 202 4   A c c e pt e S e p   30 ,   202 4       L u n g   c an ce r   i s   o n o f   t h e   d i s e as e s   w i t h   t h h i g h e s t   i n ci d e n ce  an d   m o rt al i t y   i n   t h e   w o r l d .   Ma ch i n l e ar n i n g   (ML )   m o d e l s   c an   p l a y   an   i m p o rt an t   ro l i n   t h e   e arl y   d e t ec t i o n   o t h i s   d i s e as e.   T h i s   s t u d y   a i m s   t o   i d e n t i f y   t h e   M L   al g o r i t h t h at   h as   t h b e s t   p e rfo r m a n c i n   p red i c t i n g   l u n g   c an ce r.   T h al g o r i t h m s   t h at   w e r e   c o n t ras t e d   w e r l o g i s t i c   r eg r e s s i o n   (L R),   d ec i s i o n   t re (D T ),   k - n e ar e s t   n e i g h b o rs   ( K N N ),   g au s s i an   N a i v Ba y e s   (G N B),   m u l t i n o mi al   N a i v Ba y e s   (M N B),   s u p p o rt   v ec t o r   c l as s i fi e r   (SV C),   ran d o m   fo re s t   (RF),   e x t reme   g rad i e n t   b o o s t i n g   (X G Bo o s t ),   mu l t i l a y e p e r ce p t ro n   (ML P)  an d   g rad i e n t   b o o s t i n g   (G B).   T h e   d at as e t   u s ed   w as   p ro v i d e d   b y   K a g g l e ,   w i t h   t o t al   o f   3 0 9   rec o r d s   an d   1 6   at t ri b u t e s .   T h e   s t u d y   w as   d ev e l o p ed   i n   s e v e ra l   p h as e s ,   s u ch   as   t h e   d e s c r i p t i o n   o f   t h e   M L   m o d e l s   an d   t h e   an a l y s i s   o t h e   d at as e t .   In   ad d i t i o n ,   t h e   co n t ras t   o t h e   mo d el s   w as   p e rfo r me d   u n d e t h me t ri c s   o s p eci fi ci t y ,   s en s i t i v i t y ,   F1   c o u n t ,   a cc u ra cy ,   an d   p rec i s i o n .   T h r e s u l t s   s h o w ed   t h at   t h SV C,   RF,   ML P,   a n d   G m o d e l s   o b t ai n ed   t h e   b e s t   p e rfo r m an ce   me t ri c s ,   a ch i ev i n g   9 8 %   accu racy ,   9 8 %   p re ci s i o n ,   a n d   9 8 %   s e n s i t i v i t y .   K e y w o r d s :   L u n c a nc e r   M a c hi ne   l e a r ni ng   M o de l s   P e r f o r m a n c e     P r e d i c t i n g   Th i s   i s   a n   o p en   a c ces s   a r t i c l u n d e r   t h CC  B Y - SA   l i cen s e.     C or r e s pon din A u th or :   J o s e l y Z a pa t a - P a u l i n i   Gr a dua t e   S c h oo l ,   Uni ve r s i da C o n t i n e n t a l   Alf r e do   M e n d i o l a   5210,   L o s   Ol i v o s   15311,   L i m a ,   P e r ú    E m a i l 70994337 @ c o n t i n e n t a l . e du. pe       1.   I NT RODU C T I ON   L u n c a n c e r   i s   o n e   o f   t h e   d i s e a s e s   w i t h   t h e   high e s t   m o r t a l i t y   a n i n c i de nc e   i n   t h e   wo r l [ 1]   I i s   e s t i m a t e t h a a b o u 1 . 8   m il li o n   n e c a s e s   a n 1. m i ll i o n   de a t h s   o c c ur   e a c h   y e a r   [ 2] L un c a nc e r   i s   c l a s s if i e i n t o   m o l e c u l a r ly   a n hi s t o l o g i c a ll y   h e t e r o ge n e o us   c a t e g or i e s   [ 3] ,   [ 4] T h e   m o s t   c o m mo n   t y p e s   i nc l ude   l a r ge   o r   s m a l l   c e ll   c a r c i n o m a ,   a de n o c a r c i n o m a ,   s qua m o us   c e l l ,   a n c a r c i n o i [ 5] S o m e   o f   t h e s e   c a nc e r s   o r i g i na t e   f r o m   poo r l y   d i f f e r e n t i a t e n e ur o e n do c r i n e   c e l l s ,   r e s u l t i n i n   m o r e   r a pi m e t a s t a s i s ,   c o n s e que n t l y ,   po o r   pr o gn o s i s   [ 6] .   Am o n t h e   m a in   r i s f a c t o r s   f o r   l u n c a n c e r   i s   s m o k i n g,   w hi c h   a c c o un t s   f o r   80%   to   90 %   o f   d i a g n o s e c a s e s   [ 1] ,   [ 7 ] P e op l e   w h o   di e   f r o m   t hi s   d i s e a s e   a r e   us ua ll y   d i a g n o s e l a t e ,   whi c h   m a ke s   i t   d i f f i c u l t   t a dm i n i s t e r   e f f e c t i ve   t r e a t m e n t   a n r e duc e s   t h e   pr o b a bil i t y   o f   s ur vi va l   [ 8] .   G l o b a ll y ,   a ppr o xi m a t e ly   s li g h t l y   m o r e   t h a n   20%   o f   pa t i e n t s   d i a g n o s e w i t h   l u n c a n c e r   l i ve   l o n g e r   t h a n   y e a r s   [ 9] .   I n   c o un t r i e s   s uc h   a s   t h e   Uni t e S t a t e s ,   l u n c a n c e r   r a n ks   s e c o n i n   t e r m s   o f   i nc i de n c e ,   a c c o un t i n f o r   a ppr o xi m a t e l y   25%   o f   a l l   c a n c e r   de a t h s   i n   t h e   c o un t r y   [ 10] .   On   t h e   ot h e r   h a n d,   i n   c o un t r i e s   w i t h   a   m e d i u m - hi g h   de v e l o p m e n t   i n de x ,   a n   i nc r e a s e   i n   t h e   m o r t a l i t y   r a t e   h a s   b e e n   o b s e r v e [ 11] .   L un g   c a nc e r   i s   t h e   l e a d i ng  c a us e   o f   c a n c e r   de a t h   i n   t he   U. S . ,   a c c o un t i n f o r   a ppr o xi m a t e l y   20. 8%   o f   a ll   c a n c e r   de a t h s   i n   2023  [ 12] ,   [ 13] .   I n   2020,   J a pa n   wa s   t h e   s e c o n c o un t r y   i n   t h e   Or ga ni s a t i o n   f o r   E c o n o m i c     Co - o pe r a t i o n   a n De v e l o p m e n t   ( OE C D)   wi t h   t h e   m o s t   l u n c a nc e r   de a t h s   [ 14] A c c o r di n t t h e   m o s t   r e c e n t   W HO   da t a   f r o m   2020,   l u n c a nc e r   de a t h s   i n   s e ve r a l   c o un t r i e s   s h o a l a r mi ng   f i gur e s .   Hun ga r y   to p s   t h e   l i s t   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2 5 0 2 - 4 7 52       P e r f or manc e   analys is   of   10  mac hine  lear ning  mod e ls   in  lung  c anc e r   pr e diction   ( J os e lyn  Z apata - P auli ni )   1353   w i t h   8, 377  de a t h s   ( 7. 29 %   o f   a l l   de a t h s ) ,   f o l l o we by   S e r bi a ,   T ur ke y ,   Nor t h   K o r e a   a n d   C hi na ,   hi g hl i g h t i n t h e   ur ge n c y   o f   pr e ve n t i ve   a n t r e a t m e n t   m e a s ur e s   [ 15] ,   [ 16] .   I n   c o un t r i e s   s uc h   a s   Gr e e nl a n d,   I t a l y ,   a n S l o v e ni a ,   a   de c r e a s e   i l u n c a n c e r   i n c i d e n c e   h a s   b e e n   o b s e r v e d.   O n   t h e   ot h e r   h a n d,   i n   S l o v a k i a ,   P o l a n d,   a n t h e   Ne t h e r l a n d s ,   a n   i n c r e a s e   i n   t h e   i nc i d e n c e   o f   t hi s   d i s e a s e   h a s   b e e n   r e c o r de d   [ 17] .   I n   r e c e n t   de c a de s ,   t h e   f i e l o f   m a c hi ne   l e a r ni n ( ML )   h a s   e x pe r i e n c e gr e a a dv a n c e s   i n   t h e   de v e l o p m e n t   o f   s o phi s t i c a t e a l go r i t hm s   a n da t a   pr e p r o c e s s i ng  [ 18] .   E m p h a s i z i ng  t h e   i m po r t a n c e   o f   r e s e a r c h e r s   t a k i n a d v a n t a ge   o f   M L s   pr e d i c t i ve   c a pa bi li t i e s   to   a ddr e s s   t h e   d i a g n o s i s   a n t r e a tm e n t   o f   d i s e a s e s ,   us i n m a t h e m a t i c a l   m o de l s   t i de n t i f y   pa tt e r n s   i n   t h e   da t a   [ 19 ] - [ 21 ] T h e r e   a r e   4   t y pe s   o f   M L   t e c h ni que s ,   whi c h   a r e   s upe r vi s e l e a r ni ng,   un s up e r vi s e l e a r ni ng,   s e mi - s upe r vi s e l e a r nin g,   a n d   r e i nf o r c e m e n t   l e a r ni ng  [ 22] .   I n   ge n e r a l ,   M L   m o d e l s   pr o vi de   s y s t e m s   w i t h   t he   a bil i t y   t o   l e a r n   a n im pr o v e   t h r o ugh   tr a i ni ng,   w i t h o ut  t h e   n e e to  b e   e x p l i c i t ly  pr o g r a m m e [ 23] ,   [ 24 ] S i m il a r ly ,   M L   a l go r i t hms   s e e to  a uto m a t e   t h e   de v e l o p m e n t   o f   a n a ly t i c a l   m o de l s   to   pe r f o r m   t a s ks   r e l a t e to   t h e   de t e c t i o n   o r   p r e di c t i o n   o f   o bj e c t s ,   a n d i s e a s e s ,   a m o n ot h e r s   [ 25] ,   [ 26] .   H o we v e r ,   to  a c hi e v e   gr e a t e r   a c c ur a c y   i n   pr e d i c t i o ns ,   a   l a r ge   a m o un t   o f   da t a   r e l a t e to  t h e   s ubj e c t   o f   s t ud y   i s   r e qu i r e [ 27] .   T hi s   s t ud y   a i m s   to   i de n t i f y   t h e   M L   a l go r i t hm   w i t h   t h e   b e s t   pe r f o r m a n c e   i n   pr e d i c t i n l u n c a n c e r .   T h e   a l go r i t hm s   t h a t   we r e   c o n tr a s t e we r e   l o g i s t i c   r e gr e s s i o n   ( L R ) ,   de c i s i o n   t r e e   ( DT ) ,   k - n e a r e s t   n e i g hb o r s   ( K NN ) ,   g a us s i a n   Na i ve   B a y e s   ( GN B ) ,   m u l t i n o mi a l   Na i ve   B a y e s   ( M N B ) ,   s uppor t   v e c to r   c l a s s if i e r   ( S VC ) ,   r a n do m   f o r e s ( R F ) ,   e x t r e m e   gr a d i e n t   b oo s t i n g   ( XG B oo s t ) ,   m u l t il a y e r   pe r c e pt r o n   ( M L P )   a n gr a di e n t   b o o s t i n ( GB ) .   I n   a ddi t i o n ,   t h e   a r t i c l e   i s   s t r uc t ur e d   i n   6   s e c t i o ns .   I n   s e c t i o n   i n t r o duc t i o n ,   t h e   pr o bl e m   o f   t h e   c a s e   s t ud y   i s   de t a i l e d.   S e c t i o n   b i b li o gr a p hi c   r e view   de s c r i b e s   t h e   s t udi e s   r e l a t e to   t hi s   r e s e a r c h .   S e c t i o n   3   m e t h o do l o g y   i s   de v o t e d   to   t h e   r e s e a r c h   m e t h o do l o g y ,   whi c h   i s   d i vi de i n t t w o   pa r t s :   3. 1 .   d e s c r i pt i o n   o f   t h e   M L   m o de l s   a n 3. 2.   c a s e   s t udy .   S e c t i o n   r e s u l t s ,   pr e s e n t s   t h e   m o de l   t r a i ni ng  r e s u l t s .   T h e   l a s t   s e c t i o n s   a r e   5   d i s c us s i o ns   a n c o n c l us i o ns ,   wh e r e   t h e   o b t a i n e r e s u l t s   a r e   di s c u s s e a n c o n c l ude d.       2.   B I B L I OG RA P HI RE VI E W   I n   t hi s   s e c t i o n ,   r e l a t e w o r r e l a t e to   t h e   c a s e   s tud y   i s   de s c r i be d.   R a d hi ka   e al.   [ 28 ] e v a l ua t e   t h e   pe r f o r m a n c e   o f   NB ,   s uppor v e c t or   m a c hi ne   ( S VM ) ,   D T ,   a n L R   a l go r i t hm s   f o r   e a r l y   d i a g n o s is   o f   l u n g   c a nc e r .   T w o   da t a s e t s   we r e   us e f o r   t r a i ni ng  t h e   a l go r i t hm s .   T h e   r e s u l t s   o f   t h e   s t ud y   s h o we t h a t ,   w i t h   t h e   f i r s t   da t a s e t,   L R   o b t a i ne t h e   hi g h e s t   a c c ur a c y   w i t h   a   v a l ue   o f   0. 969.   W i t h   t h e   s e c o n da t a   s e t,   S VM   a c hi e ve t h e   hi g he s t   a c c ur a c y   w i t h   a   v a l ue   o f   0. 992,   f o l l o we by   DT   w i t h   0. a n NB   w i t h   0. 8787.   On   t h e   ot h e r   h a n d,   Dr i t s a s   a n T r i gka   [ 29]   c o m p a r e t h e   pe r f o r m a n c e   o f   N B ,   B a y e s i a n   n e t wor ( B a y e s Ne t ) ,   s to c h a s t i c   gr a d i e n t   de s c e n t   ( S GD ) ,   S VM ,   L R ,   a r t i f i c i a l   n e ur a l   n e t wo r ( A NN ) ,   K NN ,   J 48 ,   l o g i s t i c   mo de l   t r e e   ( L M T ) ,   R F ,   r a n do m   t r e e   ( R T ) ,   r e duc e e r r o r   pr uni ng  t r e e   ( R e pT r e e ) ,   r ot a t i o n   f o r e s ( R ot F )   a n a da pt i v e   b o o s t i n ( A da B o o s t M 1)   a l go r i t hm s .   I n   a dd i t i o n ,   t h e i r   m e t h o do l o gy   e m p l o y e t h e   S M OT E   t e c h ni qu e   a n t h e   c r o s s - v a l i d a t i o n   m e t h o f o r   da t a   p r o c e s s i ng.   T h e   s t udy   po s i t i o n e R ot F   a s   t h e   m o s t   e f f i c i e n t   a l go r i t hm ,   a c hi e vi ng  a n   a c c ur a c y   a n pr e c i s i o n   o f   0. 971,   a n a n   a r e a   un de r   o f   c ur v e   ( A UC )   v a l ue   o f   0. 993.   On   th e   ot h e r   h a n d,   L R   a c hi e v e a n   a c c ur a c y   a n pr e c i s i o n   of   0. 963,   whil e   K NN   a n R F   o b t a i n e a n   a c c ur a c y   a nd   pr e c i s i o n   o f   0. 952.   S i m il a r ly ,   S i ng h   a n Gupt a   [ 30]   a n   e f f i c i e n t   a ppr o a c h   f o r   l u n c a nc e r   de t e c t i o n   a n c l a s s if i c a t i o n   b a s e o n   i m a ge s   r e l a t e to   t hi s   d i s e a s e   i s   pr e s e n t e d,   a n K N N,   S VM ,   DT ,   M NB ,   S GD ,   R F ,   a n d   M L P   a l go r i t hm s   we r e   a n a ly z e d.   T h e   r e s u l t s   o f   t h e   s t udy   po s i t i o n e M L P   w i t h   t h e   b e s m e t r i c s ,   a s   i t   s c o r e d   0. 8855  i n   a c c ur a c y   a n 0. 8695  i n   pr e c i s i o n .   I n   c o n t r a s t ,   t h e   R F ,   S GD ,   M NB ,   DT ,   a n S VM   a l go r i t hm s   a c hi e ve 0. 8481,   0. 5771 ,   0. 5140 ,   a n 0. 5724,   r e s pe c t i v e ly .   P a t r a   [ 31] a n a ly z e t h e   r a di a l   ba s i s   f u n c t i o n   n e t wo r ( R B F N) ,   S VC ,   L R ,   R F ,   J 48,   NB ,   a n d   K NN   a l go r i t hm s   f o r   l u n c a n c e r   pr e d i c t i o n .   T h e   s t ud y   c o n c l ude t h a t   R B F o b t a i ne t h e   hi g h e s t   a c c ur a c y   w i t h   0. 8125,   f o l l o we by   N B   a n J 48  w i t h   0. 7 812,   a n K NN   w i t h   0. 75.   I n   c o n t r a s t ,   F a i s a l   e al.   [ 32]   e v a l ua t e M L P ,   NB ,   S VM ,   DT ,   gr a di e n t   b o o s t e t r e e   ( GB T ) ,   A NN ,   a n R F   a l go r i t hm s   f o r   e a r l y - s t a ge   l u n c a nc e r   pr e di c t i o n .   T h e   r e s u l t s   po s i t i o n   GB T   a s   t h e   b e s t   pr e d i c t or   wi t h   0. 9   i n   a c c ur a c y ,   f o l l o w e by   NB   w it h   0. 85 ,   S VM   a n R F   w i t h   0. 7917,   a n M L P   wi t 0. 7833 .   S i m il a r ly ,   X i e   e al.   [ 33]   di f f e r e n t   M L   a l go r i t hm s   a r e   c o m pa r e f o r   t h e   de t e c t i o n   o f   bi o m a r ke r s   t h a t   a i i t h e   e a r l y   de t e c t i o n   o f   l u n c a n c e r ,   S VM ,   R F ,   A NN ,   NB ,   a n A da B o o s t   a l go r i t hm s   we r e   a n a ly z e d.   T h e   s t ud y   po s i t i o n e NB   w i t h   t h e   b e s t   m e t r i c s   w i t h   0. i n   a c c ur a c y .   I n   t ur n ,   M i s h r a   a n Ga n gwa r   [ 34]   e v a l ua t e   K NN ,   NB ,   DT ,   R F ,   a n S VM   a l go r i t hm s   f o r   e a r l y   d e t e c ti o n   o f   l u n c a n c e r .   T h e   s t udy   c o n c l ude t h a t   D T   a c hi e v e d   t h e   b e s t   pe r f o r m a n c e   w i t h   0. i n   pr e c i s i o n   a n a c c ur a c y ,   f o l l o we by   R F   w i t h   0. 98  a n 0 . 984,   K NN   wi t 0. 96  a n 0. 949,   a n NB   a n S VM   w i t h   0. 91  i n   a c c ur a c y .   S i mi l a r ly ,   Gupt a   e al.   [ 35]   c o m pa r e   M L   a l go r i t hm s   f o r   l u n c a n c e r   pr e d i c t i o n ,   K NN ,   R F ,   a n S VM   a l go r i t hm s   we r e   c o n tr a s t e d .   T h e   r e s u l t s   o f   t h e   s t udy   s h o we t h a t   R F   pe r f o r m e t h e   b e s t   w i t h   0. 842  i n   a c c ur a c y   a n 0. 85  i n   pr e c i s i o n ,   f o l l o w e by   S V M   w i t h   0. 821  i a c c ur a c y   a n 0. 828  i n   pr e c i s i o n .   M e a n w hil e ,   I ng l e   e al.   [ 36]   c o m pa r e d i f f e r e n t   M L   a l go r i t hms   f o r   t h e   de t e c t i o n   o f   d i f f e r e n t   t y pe s   o f   l u n c a n c e r .   T h e   r e s u l t s   po s i t i o n   A da B o o s t   a s   t h e   b e s t   a l go r i t hm ,   s i n c e   i t   a c hi e ve 0. 9074  i n   a c c ur a c y ,   0. 8180  i n   s e n s i t i v it y ,   a n 0. 9399  i n   s pe c if i c i t y .   C e li e al.   [ 37 ]   p e r f o r m   a   c o m pa r a t i v e   s t ud y   o f   d i f f e r e n t   M L   a l go r i t hm s   f o r   l u n c a nc e r   pr e d i c t i o n .   T h e   s t ud y   c o n c l ude d   t h a R F   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2 5 0 2 - 4 7 52   In do n e s i a n   J   E l e c   E n g   &   C o m S c i Vo l .   3 7 ,   N o .   2 F e b r ua r y   20 2 5 :   1 35 2 - 1 36 4   1354   o b t a i n e t h e   b e s t   pe r f o r m a n c e   w i t h   0. 9608  i a c c ur a c y .   O n   t h e   o t h e r   h a n d,   M o ko a t l e   e al.   [ 38]   c o n t r a s XG B o o s t,   l i g h t   gr a d i e n t   b o o s t i n ( L i g h t GB M ) ,   R F ,   a n c o nv o l ut i o n a l   n e ur a l   n e t wo r ( C NN )   a l go r i t hm s   f o r   l u n g,   b r e a s t ,   a n pr o s t a t e   c a n c e r   de t e c t i o n .   I n   t h e i r   m e t h o do l o g y ,   t h e y   e m p l o y e t h e   S M OT E   t e c hni que ,   s e n t e n c e - B E R T   ( S B E R T a n s i m p l e   a n e f f i c i e n t   c o n tr a s t i n o f   s e n t e n c e   e m be dd i ngs   ( S i m C S E )   t r a n s f o r m s   f o r   da t a   pr o c e s s i n g.   T h e   r e s u l t s   o f   t h e   s t ud y   s h o we t h a t   XG B oo s t   i s   t h e   m o s t   e f f i c i e n t   a l go r i t hm   w i t h   a a c c ur a c y   o f   0. 73.   G ö l t e pe   [ 39]   c o m pa r e   t h e   pe r f o r m a n c e   o f   R F ,   K NN ,   NB ,   L R ,   DT ,   a n S VM   a l go r i t hm s   f o r   l u n c a n c e r   pr e d i c t i o n .   T h e   s t ud y   c o n c l ude t h a t   K NN ,   NB ,   a n DT   a l go r i t hm s   o b t a i ne th e   b e s t   pe r f o r m a n c e   w i t h   0. 71   a c c ur a c y .   S i mi l a r l y ,   B ha r a t hy   e al.   [ 40]   t r a i n   S VM ,   K NN ,   D T ,   L R ,   NB ,   a n R F   a l go r i t hm s   to  de t e r m i ne   t h e i r   pe r f o r m a nc e   i n   l u n g   c a n c e r   de t e c t i o n .   T h e   r e s u l t s   r e v e a l e t h a R F   o b ta i n e a a c c ur a c y   o f   0. 885,   b e i n t h e   b e s t   a l go r i t hm   i n   t he   l u n c a n c e r   de t e c t i o n   t a s k.   M e a n w hil e ,   Kh a n   e al.   [ 41 ]   t h e y   e v a l ua t e m u l t i p l e   M L   a l go r i t hm s   f o r   l u n c a n c e r   pr e di c t i o n .   I n   t h e i r   m e t h o do l o g y ,   t h e y   e m p lo y e t h e   K r us ka l - W a ll i   t e s t   to   s e l e c t   ge n e   e x pr e s s i o n   da t a .   T h e   r e s u l t s   po s i t i o n   R F   a s   t h e   m o s t   a c c ur a t e ,   a s   i t   r e a c h e d   0. 84375.   F i n a ll y ,   B a n e r j e e   a n Da s   [ 42]   t h e y   a n a ly z e   S VM ,   R F ,   a n A NN   a l go r i t hm s   f o r   l u ng  c a n c e r   pr e d i c t i o n .   T h e   r e s u l t s   o f   t h e   s t udy   s h o t h a A NN   a c hi e v e t h e   hi g he s t   a c c ur a c y   w i t h   0. 96,   f o l lo we by   S VM   w i t h   0. 80  a n R F   w i t h   0. 70.       3.   M E T HO D   In   t hi s   s e c t i o n ,   t h e   c a s e   s t udy   i n   whi c h   d i f f e r e n t   M L   m o de l s   we r e   de v e l o pe a n tr a i n e i s   pr e s e n t e d.   I n   t h e   f i r s t   pa r t ,   t h e   m o de l s   ( L R ,   DT ,   K NN ,   GN B ,   M NB ,   S VC ,   R F ,   XG B oo s t,   M L P ,   a n GB )   a r e   de s c r i be d.   I n   t h e   s e c o n pa r t ,   t h e   c a s e   s t ud y   i s   de s c r i b e d .     3. 1.     De s c r ip t ion   of   t h e   M L s   m od e l s   3. 1 . 1.   L ogis t ic  r e g r e s s ion   T h e   L R   m o de l   i s   o ne   o f   t h e   m o s t   w i de ly   u s e a lgo r i t hm s   i n   m e d i c i ne   b e c a u s e   o f   i t s   u s e f u l ne s s   i m u l t i va r i a bl e   m o de li ng   [ 43] ,   [ 44] .   On e   o f   t h e   m o s o b vi o u s   a dv a n t a ge s   i s   i t s   a bil i t y   to  c o n v e r c o e f f i c i e n t s   i n t o   pr o p o r t i o n a l   o dds   [ 45] I n   a dd i t i o n ,   L R   pr o v i de s   us   w i t h   a   t e c hni que   t h a t   gua r a n t e e s   t h a t   t h e   t r a i ni ng  r e s u l t   i s   e x pr e s s e i bi na r y   f o r m ,   w i t h   va l u e s   o f   0   a n 1   [ 46] T h e   m a t he m a t i c a l   e qua t i o n   o f   t h e   L R   m o de l   i s   e x pr e s s e d   in   ( 1) .     ( ) = 1 1 + ( 0 + 1 1 + 2 2 + + ) ,                                       ( 1)     3. 1 . 2 De c is ion   t r e e   T h e   DT   m o de l   i s   a   s im p l e   too l   t h a t   c a n   s e pa r a t e   da t a   i n t o   c a t e g o r i e s   w i t h   t h e   u s e   o f   c l a s s if i c a t i o r u l e s   [ 47] DT   i s   b a s e o n   t h e   d i vi de - a n d - c o n que r   s t r a t e gy   a n i s   c o m po s e o f   l e a f   n o de s   t h a t   a r e   c onn e c t e d,   f o r m i ng  a   hi e r a r c hi c a l   s t r uc t ur e   [ 48 ] .   S i n c e   i t   i s   a   c l a s s i f i c a t i o n   m o de l ,   i t   c a n   b e   a pp l i e i n   v a r i o us   f i e l d s ,   i nc l ud i ng  da t a   m i n i ng  a n c l a s s i f i c a t i o n   [ 49] ,   [ 5 0] DT   c a n   b e   r e pr e s e n t e i n   ( 2) .   W h e r e   E   de n ot e s   t h e   e n t r o py ,   s   i s   t h e   s a m p l e ,   Py   i s   t he   pr o b a bil i t y   o f   o c c ur r e n c e   o f   t h e   S I   e v e n t   a n Pn   i s   t h e   pr o b a bil i t y   o f   o c c ur r e n c e   o f   t h e   NO   e v e n t .     ( ) = ( ) = 0  log 2  ,   ( 2 )     3. 1 . 3 K - n e ar e s t   n e igh b or   T h e   K NN   m o de l   i s   w i d e l y   r e c o gni z e f o r   i t s   e f f e c t i ve n e s s   i da t a   s e pa r a t i o n   a n c a n   b e   us e f u l   w h e s t udy   da t a   pr e s e n t   a m bi gu i t i e s   [ 51] .   F ur t h e r m o r e ,   K NN   gr o ups   da t a   i n t o   c o h e r e n t   s ubs e t s   a n l a b e l s   n e da t a   a c c o r di n t o   t h e i r   s i mi l a r i t y   t t h e   t r a i ni ng  r e s u l t s   [ 52] T h e   m o de l   i s   a   n o n pa r a m e t r i c   a l go r i t hm ,   i . e . ,   t h e r e   i s   n o   f i xe n u m be r   o f   pa r a m e t e r s   i n de pe n de n t   o f   t h e   da t a   s i z e   [ 53] .   T h e   E uc l i de a n   e qua t i o n   i n   t hi s   m o de l   i s   s h o i n   ( 3) .     ( , ) = (   ) 2 = 1 ,   ( 3 )     3. 1 . 4 Gau s s ian   Naive   B aye s   T h e   GN B   m o de l   i s   a   pr o b a bi li s t i c   c l a s s if i c a t i o n   a l go r i t hm   t h a t   h a s   m u l t i p l e   a pp l i c a t i o n s ,   s uc h   a s   v e hi c l e   c o n t r o l   a n m e d i c a l   d i a g n o s i s   [ 54] GN B   us e s   B a y e s   r u l e s   a n i s   b a s e o n   a s s u mi ng  i nde p e n de nc e   b e t we e n   f e a t ur e s   pr o vi de by   t h e   c l a s s ,   t h e   m o de l   a l l o w s   us   to  pe r f o r m   c l a s s if i c a t i o ns   e f f i c i e n t l y   [ 5 5] I n   ( 4)   de s c r i be s   t h e   de n s i t y   f u nc t i o n   us e i n   t h e   m o de l ,   wh e r e   P ( X|Y )   i s   e v a l ua t e d,   X   r e pr e s e n t s   a   c l a s s ,   a n Y   r e pr e s e n t s   a   pa r t i c u l a r   o bj e c t   [ 56] .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2 5 0 2 - 4 7 52       P e r f or manc e   analys is   of   10  mac hine  lear ning  mod e ls   in  lung  c anc e r   pr e diction   ( J os e lyn  Z apata - P auli ni )   1355   ( | = ) = 1 2 2 ( ) 2 2 2 ,   ( 4 )     3. 1 . 5 M u l t in om ial   Naive   B aye s   T h e   M NB   m o de l   i s   a n   a da pt a t i o n   o f   t h e   Na i ve   B a y e s   a l go r i t hm ,   w hi c h   i s   m a i n ly   f o c u s e o n   t e x t   pr o c e s s i n g   [ 57] M NB   c o un t s   t h e   f r e que n c y   w i t h   whi c h   wo r ds   a ppe a r ,   c o m p l e t e l y   i g n o r i n bi na r y   o c c ur r e n c e   [ 58] T h e r e f o r e ,   t h e   m o de l   i s   s u i t a bl e   f o r   c a t e g o r i z i ng  do c um e n t s   [ 59] T h e   m a t h e m a t i c a l   e qua t i o n   o f   t h e   L R   m o de l   i s   e x pr e s s e d   in   ( 5 ).   W h e r e   | V |   c o r r e s po n ds   to   t h e   v o c a b u l a r y   s i z e   a n ( C i)   i n d i c a t e s   t h e   tot a l   n u m be r   o f   wo r ds .     ( | ) = ( | ) | | = 1 ,   ( 5)     3. 1. 6.   S u p p or t   ve c t or   c l a s s i f ie r   Th e   S VC   m o de l   i s   b a s e o n   s o un pr i n c i p l e s   de r i ve f r o m   s t a t i s t i c a l   l e a r ni ng  t h e o r y ,   t h e s e   f u n da m e n t a l s   a r e   us e to   de v e l o m o de l s   t h a t   c a n   o p t i m a ll y   a pp ly   c l a s s if i c a t i o n   o r   r e g r e s s i o n   [ 60] S VC   i s   a   ge n e r i c   c l a s s if i e r   t h a t   c a n   be   a pp li e i n   m u l t i p l e   f i e l ds   s i nc e   i t   c a n   pr o c e s s   n u m e r i c a l   da t a   a n t e x t   [ 61]   T h e   c o r e   o f   t h e   m o de l   f o c us e s   o n   o p t i mi z a t i o n ,   a s   i t   m i nim i z e s   t h e   c o m m o n   pr o bl e m s   o f   M L   a l go r i t hm s   T h e   o bj e c t i v e   f u n c t i o n   c a n   b e   de f i ne i n   ( 6 )   a n ( 7 ).   W he r e   W   i s   t h e   v e c t or   o f   we i g h t s ,   b   i s   t h e   bi a s   ter m ,   x   i s   t h e   f e a t ur e   v e c to r ,      i s   t h e   s a m p l e   c l a s s   l a b e l ,   a n n   i s   t h e   n u m be r   o f   s a m p l e s .     m in 1 / 2 2 ,                                 ( 6 )     w hi c h   i s   s u bj e c t   to:     (  + ) 1 0 , = 1 . ,   ( 7 )     3. 1. 7.   Rand om   f or e s t   Th e   R F   m o de l   i s   r e c o gni z e f o r   o b t a i ni ng  e x c e l l e n t   r e s u l t s   i n   M L   [ 62] ,   [ 63] R F   i s   m a i n ly   us e f o r   c l a s s if i c a t i o n   a n r e gr e s s i o n   b ut   c a n   b e   a pp li e t ot h e r   t a s ks   [ 64] L i ke w i s e ,   i t   i s   us e i m u l t i p l e   s c i e n t i f i c   f i e l ds ,   s i nc e   i t   c a n   r e duc e   m u l t i - s o ur c e   a n m u l t i - d im e n s i o na l   da t a   [ 65] .     3. 1. 8.   Ex t r e m e   g r ad ient   b oos t in g   Th e   XG B   m o de l   i s   a n   M L   a l go r i t hm   t h a t   e m p l o y s   m u l t i p l e   we a l e a r n e r s   t o   a c hi e v e   a   gr e a t e r   e f f e c t ,   i t   i s   us e i n   m u l t i p l e   s e c t o r s ,   s uc h   a s   m e d i c i ne   [ 66] .   T h e   f u n d a m e n t a l   b a s i s   o f   XG B   i s   t h e   i nj e c t i o n   o f   n u m e r o us   DT   i n   e a c h   i n t e r a c t i o n   t i m pr o v e   i t s   pe r f o r m a n c e ,   s i n c e   t h e s e   t r e e s   f o c us   o n   t h e   m o s di f f i c u l t   po i n t s   to   p r e d i c t   [ 67] .   Al s o ,   to   a v o i o v e r - fi t t i n t h e   da t a ,   t h e   m o de l   u s e s   a   c o m bi na t i o n   o f   t h e   GB   a l go r i t hm  a n r e gu l a r i z a t i o n   t e c hni que s   [ 68] ,   [ 69] .   T h e   ( 8)   us e to   c a l c u l a t e   t h e   pr e d i c t i o n s   o f   a n   XG B   t r e e   i s   de t a i l e d   b e l o w.   W he r e   y   i s   t h e   f i na l   pr e d i c t i o n   o f   t h e   m o de l   a n f ( x )   i s   t h e   pr e d i c t i o n   o f   t h e   i - t h   DT .       ̂ = ( ) = 1 ,   ( 8)     3. 1. 9.   M u l t i - l aye r   p e r c e p t r on   c l a s s i f ie r   M L P   m o de l   i s   a   p o we r f u l   t oo l   f o r   s upe r vi s e t r a i ni ng  us i n m u l t i p l e   da t a   o u t pu e x a m p l e s   kn o wn   to  t h e   a l go r i t hm   [ 70] M L P   i s   a   ki n o f   ANN   t h a g e n e r a ll y   c o ns i s t s   o f   t h r e e   l a y e r s ,   whi c h   a r e   i n put ,   hi dde n ,   a n o ut pu [ 71] S i m il a r ly ,   t h e   m o de l   i s   f e e d f o r wa r t y pe ,   s i nc e   i t   us e s   a   b a c kpr o pa ga t i o n   t e c h ni que   to  l e a r [ 72] E a c h   n o de   o f   t h e   m o de l   i s   go v e r n e by   ( 9) .   W h e r e   1   i s   t h e   o u t pu o f   n o de   j    r e pr e s e n t s   t h e   i n p ut  ga t e   o f   n o de   j   i n   t h e   hi dde n   l a y e r   1   i s   t h e   i n put   c o r r e s po n d i n to   n o de   j   a n   i s   t h e   bi a s   a s s o c i a t e to  n o de   j .       1 = (  + = 0 ) ,   ( 9)     3. 1. 10.   Gr ad ient   b oos t in g   T h e   GB   m o de l   be l o n g s   t o n e   o f   t h e   m o s t   p o we r f u l   c l a s s e s   o f   M L   a l go r i t hm s ,   due   t i t s   pr o v e e f f i c i e nc y   i n   v a r i o us   a pp li c a t i o ns   a n a r e a s   o f   s t ud y   [ 73] .   M or e o v e r ,   GB   i s   o n e   o f   t h e   a l go r i t hm s   t ha t   m a i n ly   f o c us e s   o n   a c c ur a c y   a n s p e e f o r   da t a   pr o c e s s i ng  [ 74] .   T h e   m o de l   i s   b a s e o n   t h e   s t a t i s t i c a l   c o n c e pt  de v e l o pe by   F r i e d m a n ,   whe r e   t h e   a l go r i t hm   i s   o p t i m i z e by   us i ng  t h e   gr a d i e n t   i n   t h e   f u n c t i o n   s pa c e .     T h e   a l go r i t hm   c a n   b e   e x pr e s s e a s   ( 10) .   W h e r e   ̂   i s   t h e   f i na l   m o de l   a c c ur a c y ,   f ( x )   i s   t h e   pr e d i c t i o n   f u nc t i o n ,   γ  i s   t h e   l e a r ni ng  c o e f f i c i e n t   a n h( x )   i s   t h e   pr e d i c t i o o f   t h e   i - t h   we a ke s t   m o de l .         ̂ = ( ) = ( ) ,   ( 10)   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2 5 0 2 - 4 7 52   In do n e s i a n   J   E l e c   E n g   &   C o m S c i Vo l .   3 7 ,   N o .   2 F e b r ua r y   20 2 5 :   1 35 2 - 1 36 4   1356   3. 2   Cas e   s t u d y   3. 2 . 1.   Und e r s t an d in t h e   d at as e t   T h e   da t a   us e f o r   t hi s   s t udy   we r e   o b t a i n e f r o m   th e   K a gg l e   p l a t f o r m .   T h e   da t a s e h a s   a   tot a l   o f   309  pa t i e n t   r e c o r ds   c o l l e c t e f r o m   t h e   o nl i ne   l u n c a n c e r   pr e d i c t i o n   s y s t e m   we bs i t e ,   w i t h   pa t i e n t s   a ge 21 - 87   y e a r s ,   ba l a n c i ng  t h e   r e c o r ds   b e t we e n   m a l e s   a n f e m a l e s .   T h e   da t a   c o n t a i n s   14  a tt r i b ut e s ,   s uc h   a s   ge n de r   ( M = m a l e ,   F = e m a l e ) ,   pa t i e n t   a ge ,   s m o k i n ( y e s = 2,   n o = 1) ,   y e ll o f i nge r s   ( y e s = 2,   n o = 1) ,   a n xi e t y   ( y e s = 2,   n o = 1) ,   p r e s s ur e   ( y e s = 2,   n o = 1) ,   c h r o ni c   d i s e a s e   ( y e s = 2,   n o = 1) ,   f a t i gue   ( y e s = 2,   n o = 1) ,   a l l e r g y   ( y e s = 2,   n o = 1) ,   f r o s t bi t e   ( y e s = 2,   n o = 1) ,   a l c o h o l   c o n s u m pt i o n   ( ye s = 2,   n o = 1) ,   c o ugh   ( y e s = 2,   n o = 1) ,   s h o r t n e s s   of   b r e a t ( y e s = 2,   n o = 1) ,   di f f i c u l t y   s w a l l o w i ng  ( y e s = 2,   n o = 1) ,   c h e s t   pa i n   ( y e s = 2,   n o = 1) ,   l un pa i n   ( y e s = 2,   n o = 1) ,   l ung   c a nc e r   ( y e s = po s i t i ve ,   n o = n e ga t i v e ) .   T h e   de ve l o p m e n t   pr o c e s s   o f   t hi s   i nve s t i ga t i o n   i s   de t a i l e i n   F i gur e   1.           F i gur e   1 .   C a s e   s t udy   de v e l o p m e n t   pr o c e s s       3. 2 . 2 P r e p a r at ion   of   t h e   d at as e t   I n   t hi s   p h a s e ,   a   t h o r o ugh   a na ly s i s   o f   t h e   da t a   i n   e a c h   c o l u m wa s   pe r f o r m e a s   a   s t a r t i n po i n t   f o r   pr o c e s s i n g.   F i r s t ,   t h e   n e c e s s a r y   li b r a r i e s   we r e   i m p o r t e d   to   pe r f o r m   a   ge n e r a l   e x p l o r a t i o n   o f   t h e   da t a .   Dur i n g   t h e   a n a ly s i s ,   t h e   t y pe s   o f   v a r i a bl e s   f o un i n   e a c h   c o l u m n   we r e   e x a mi ne d,   a s   s h o wn   i n   s upp l e m e n t a r y     T a bl e   1.   I n   a dd i t i o n ,   i t   wa s   v e r if i e t h a t   t h e r e   we r e   n o   n u ll   da t a ,   a f t e r   whi c h   t h e   e xi s t e nc e   o f   dup li c a t e   da t a   wa s   ve r i f i e d,   a n o n c e   i de n t i f i e d,   t h e   pr e s e nc e   of   dup li c a t e   da t a   wa s   e l im i na t e d.   I s h o u l b e   n o ted  t h a a   c o l u m n   c a ll e s e x   wa s   i de n t i f i e d,   whi c h   s to r e a   c h a r a c t e r   r e pr e s e n t a t i v e   o f   t h e   pa t i e n t s   s e x .   I n   t hi s   r e ga r d,   i t   wa s   c h a n ge t o   bi n a r y   v a l u e s ,   whe r e   1   wa s   m a l e   a n 0   f e m a l e .   S i mi l a r ly ,   t h e   c o l u mn    l u n c a n c e r   wa s   c h a n ge f r o m   s t r i n to  n u m b e r ,   wh e r e   1   wa s   po s i t i v e   a n 0   n e ga t i v e .   I n   a dd i t i o n ,   t h e   r e s t   o f   t h e   v a r i a bl e s   whe r e   y e s   wa s   2   a n no   wa s   1   we r e   t r a n s f o r m e to   bi n a r y ,   w h e r e   1   wa s   y e s   a n 0   wa s   n o .   F i n a ll y ,   t h e   t y pe   o f   v a r i a bl e   s t or i n t h e   c o l u m n   s e x   a n l u n c a n c e r   wa s   c h a n g e d,   s i n c e   i t   wa s   o r i g i na ll y   i de n t i f i e a s   a n   o bj e c t   a n wh e n   tr a n s f o r m i ng  t h e   da t a   i t   wa s   c h a n ge to  i n t e ge r .   T h e   r e s u l t s   o f   t h e   da t a   p r o c e s s i n a r e   s h o wn   s upp l e m e n t a r y   T a bl e   2.       T a bl e   1.   I nf o r m a t i o n   a b o ut  t h e   da t a s e t   #   C o lu mn   N o n - n ul l   D t y p e   0   ge nd e r   309 no n - nul l   in t6   1   a ge     309 no n - nul l   in t6   2   s mo ki ng   309 no n - nul l   in t6 4   3   y e ll o w _ f in g e r s   309 no n - nul l   in t6 4   4   a nx i e t y   309 no n - nul l   in t6 4   5   pe e r _pr e s s ur e   309 no n - nul l   in t6 4   6   c hr o ni c  di s e a s e   309 no n - nul l   in t6 4   7   f a ti gu e   309 no n - nul l   in t6 4   8   a ll e r g y   309 no n - nul l   in t6 4   9   w he e z in g   309 no n - nul l   in t6 4   10   a lc o h o c o ns umi ng   309 no n - nul l   in t6 4   11   c o ughi ng   309 no n - nul l   in t6 4   12   s ho r tn e s s  of  b r e a th   309 no n - nul l   in t6 4   13   s w a ll o w in g di f f i c ul t y   309 no n - nul l   in t6 4   14   c h e s pa in   309 no n - nul l   in t6 4   15   lu ng_c a nc e r   309 no n - nul l   in t6 4   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2 5 0 2 - 4 7 52       P e r f or manc e   analys is   of   10  mac hine  lear ning  mod e ls   in  lung  c anc e r   pr e diction   ( J os e lyn  Z apata - P auli ni )   1357   T a bl e   2 A na ly s i s   o d a t a s e t   v a r i a bl e s     0   1   2   3   4   ...   279   280   281   282   283   G e nde r   1   1   0   1   0   ...   0   0   1   1   1   A ge   69   74   59   63   63   ...   59   59   55   46   60   S mo ki ng   0   1   0   1   0   ...   0   1   1   0   0   Y e ll o w _ f in g e r s   1   0   0   1   1   ...   1   0   0   1   1   A nx i e t y   1   0   0   1   0   ...   1   0   0   1   1   P e e r _pr e s s ur e   0   0   1   0   0   ...   1   0   0   0   0   C hr o ni c  di s e a s e   0   1   0   0   0   ...   0   1   0   0   0   F a ti gue   1   1   1   0   0   ...   0   1   1   0   1   A ll e r g y   0   1   0   0   0   ...   1   1   1   0   0   W he e z in g   1   0   1   0   1   ...   1   0   0   0   1   A lc o h o c o ns umi ng   1   0   0   1   0   ...   0   0   0   0   1   C o ughi ng   1   0   1   0   1   ...   1   0   0   0   1   S hor tn e s s   of  br e a th   1   1   1   0   1   ...   0   1   1   0   1   S w a ll o w in g di f f i c ul t y   1   1   0   1   0   ...   1   0   0   1   1   C he s pa in   1   1   1   1   0   ...   0   0   1   1   1   df a   1   1   0   0   0   ...   1   0   0   0   1       3. 2. 3.   E x p l o r at o r an al y s is   of   t h e   d at a   I n   t h e   a n a ly s i s   o f   t h e   l u n c a n c e r   c o l u m n,   a n   im ba l a n c e   wa s   o b s e r v e i n   t he   d i a g n o s e c a s e s ,   a s   t h e r e   i s   a   hi g h e r   n u m be r   o f   r e c o r ds   wi t h   po s i t i v e   d i a g n o s e s ,   a s   s h o wn   i n   F i gur e   2.   T h e r e f o r e ,   t hi s   im ba l a n c e   s h o u l b e   t a ke n   i n t o   a c c o un f o r   t h e   de v e l o p m e n t   o f   t h e   m o de l s F i gur e   s h o ws   t h e   vi s u a l i z a t i o n   o f   t h e   v a r i a bl e s   a c c o r d i n to   t h e i r   d i s t r i b ut i o n   by   r i s f a c t o r s .   A c c o r di n to   F i gur e s   3( a )   a n 3( b )   pe op l e   w h o   c o n s u m e   a l c o h o l   a n s m o ke   h a v e   a   hi g h e r   pr o b a bil i t y   o f   de v e l o p i ng  l u n c a n c e r   ( 76  v s .   3) .   S i m il a r ly,   pe o pl e   wh o   s m o ke   h a v e   a   hi g h   pr o b a bi li t y   o f   de v e l o p i ng  l u n c a nc e r   ( 55   v s .   16) u ,   a s   d t h o s e   wh o   c o n s u m e   a l c o h o l   ( 69  v s .   4) .   On   t h e   ot h e r   h a n d,   pe o pl e   w h o   d o   n ot   c o n s u m e   a l c o h o l   a n do   n o s m o ke   c a n   a l s o   de v e l o l u n g   c a nc e r   ( 38  c a s e s ) .           F i gur e   2 .   A n a ly s i s   o f   l u n c a nc e r   d i a g n o s e s         ( a )     ( b )     F i gur e   3.   Vi s ua l i z a t i o n   o f   v a r i a bl e s ,   ( a )   r i s f a c t o r s   pr e s e n t   i n   t h e   po s i t i ve   d i a g n o s i s   o f   c a n c e r   a n d     ( b )   r i s f a c t o r s   p r e s e n t   i n   t h e   n e ga t i v e   d i a g n o s i s   o f   c a n c e r     Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2 5 0 2 - 4 7 52   In do n e s i a n   J   E l e c   E n g   &   C o m S c i Vo l .   3 7 ,   N o .   2 F e b r ua r y   20 2 5 :   1 35 2 - 1 36 4   1358   F i gur e   pr e s e n t s   t h e   s t a t i s t i c a l   gr a p hs   t h a a n a l y z e   t h e   s y m pt o m s   o f   l u n c a n c e r .   I i s   o b s e r v e t h a t   c o ugh   a n c h e s t   pa i n   a r e   m o r e   f r e que n t   i n   pa t i e nt s   di a g n o s e w i t h   t hi s   d i s e a s e   a n l e s s   c o m m o n   i n   t h o s e   w i t h o ut  i t .   T h e r e f o r e ,   i de n t i f yi ng  t h e s e   s y m pt o m s   c a n   b e   vi t a l   f o r   t h e   d i a g n o s i s   o f   l u n c a nc e r ,   a c c or d i n to   Fi g ur e s   4( a )   a n 4( b ) .   On   t h e   ot h e r   h a n d,   F i g ur e s   4( c )   a n 4( d)   s h o t h a f a t i gue   a n s h o r t n e s s   o f   br e a t h   a r e   m a nif e s t e i n   pa t i e n t s   w i t h   a n w i t h o u t   l u n c a nc e r ,   b ut   i t   c a n   b e   e vi de n c e t h a t   t h e i r   pr e s e n c e   i s   t wi c e   a s   hi g h   i n   p a t i e n t s   d i a g n o s e w i t h   c a nc e r .   C o n s e que nt l y ,   t h e s e   s ym pt o m s   c a n   b e   c o ns i de r e a s   i nd i c a t o r s   f o r   t h e   d i a g n o s i s   o f   l u n c a nc e r .         ( a )     ( b )       ( c )     ( d)     F i gur e   4 .   S y m pt o m s   o f   l u n c a nc e r ;   ( a )   a n a ly s i s   o f   c o ugh   a n d i a g n o s i s   o f   l u n c a n c e r ,     ( b )   a n a ly s i s   o f   c h e s t   pa i n   a n d i a g n o s i s   o f   l u n c a nc e r ,   ( c )   a n a l y s i s   o f   f a t i gu e   a n t h e   d i a g n o s i s   o f   l u ng  c a nc e r ,   a n d   ( d)   a n a l y s i s   o f   s h o r t n e s s   o f   b r e a t h   a n d i a g n o s i s   o f   l u n c a nc e r       F i gur e   pr e s e n t s   t h e   s t a t i s t i c a l   gr a phs   t h a t   a n a l y z e   t h e   s e c o n d a r y   s ym pt o m s   o f   l u n c a nc e r .     F i gur e   5( a )   s h o ws   t h a t   a n xi e t y   a ppe a r s   to  h a v e   a   s l i g h t   r e l a t i o ns hi w i t h   t hi s   c o n d i t i o n .   S i mi l a r ly ,   c h r o ni c   d i s e a s e   h a s   a   s u b t l e   c o r r e l a t i o n   w i t h   l u n c a n c e r ,   a c c o r di n t F i gur e   5( b ) .   T h e r e f o r e ,   s i n c e   c h r o ni c   d i s e a s e   is   a   phy s i o l o g i c a l   c o m o r bi d i t y ,   i t   c o ul b e   t a ke n   a s   a   s e c o n da r y   s ym pto m   t pr e di c t   l u n c a n c e r .     3. 2 . 4 Dat a   p r oc e s s in an d   m od e l in g   B e f o r e   t h e   m o de l i ng  a n t r a i ni ng  o f   t h e   a l go r i t hm s ,   t h e   R a n do m O v e r S a m p l e r   t e c h ni que   o f   t h e   I m bl e a r n   li b r a r y   w a s   us e to   b a l a n c e   t h e   da t a   of   t h e   l u n c a n c e r   c o l u m n ,   w hi c h   s h o we a   s i gnif i c a n t   im ba l a n c e   i n   t h e   n u m be r   o f   po s i t i ve   a n n e g a t i ve   di a g n o s e s .   S ub s e que n t l y ,   t h e   da t a s e wa s   s pl i t   i n t o   t w pa r t s ,   o n e   pa r t   f o r   tr a i ni ng  a n o n e   pa r f o r   t e s t i n g.   I n   a dd i t i o n ,   s c a li ng  wa s   a pp l i e to  b ot h   pa r t s   a n t h e n   t h e   m o de l s   we r e   t r a i n e d.     Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2 5 0 2 - 4 7 52       P e r f or manc e   analys is   of   10  mac hine  lear ning  mod e ls   in  lung  c anc e r   pr e diction   ( J os e lyn  Z apata - P auli ni )   1359     ( a )     ( b )     F i gur e   5 .   S e c o n da r y   s ym pt o m s ,   ( a )   a n a l y s i s   o f   a nxi e t y   a n t h e   d i a g n o s i s   o f   l u n c a n c e r   a n d     ( b )   a n a ly s i s   o f   c h r o ni c   d i s e a s e   a n l u n c a nc e r   d i a gn o s i s       4.   RE S UL T S   F o r   t hi s   s t udy ,   L R ,   DT ,   K NN ,   GN B ,   M NB ,   S V C ,   R F ,   XG B o o s t,   M L P ,   a n GB   a l go r i t hm s   we r e   t r a i n e to  f i nd  t h e   b e s t - pe r f o r m i n m o de l   f o r   l u ng  c a n c e r   pr e d i c t i o n .   T h e   da t a s e wa s   pr o vi de by  K a gg l e ,   t h e s e   da t a   we r e   p r o c e s s e a n c l e a ne f o r   a l go r i t h m   t r a i ni ng.   T h e   t r a i ni ng  r e s u l t s   a r e   de t a i l e i n   T a ble  3 .       T a bl e   3 T r a i ni n r e s u l t s     P r e c is i o n ( % )   R e c a ll  ( % )   F1 - s c o r e  ( % )   S uppor t     P r e c is i o n ( % )   R e c a ll  ( % )   F1 - s c o r e  ( % )   S uppor t   L o g is ti c   r e gr e s s io n     D e c is io t r e e   0   0.96   1   0.98   64     0.93   0.97   0.95   64   1   1   0.95   0.97   56     0.96   0.91   0.94   56   A c c u r a c y   -   -   0.97   120     -   -   0.94   120   M a c r o  a v g   0.98   0.97   0.97   120     0.94   0.94   0.94   120   W e ig ht e d a v g   0.98   0.97   0.97   120     0.94   0.94   0.94   120   K N N   G a us s ia n N a iv e   B a y e s   0   0.93   1   0.96   64     0.95   0.89   0.92   64   1   1   0.91   0.95   56     0.88   0.95   0.91   56   A c c u r a c y   -   -   0.96   120     -   -   0.92   120   M a c r o  a v g   0.96   0.96   0.96   120     0.92   0.92   0.92   120   W e ig ht e d a v g   0.96   0.96   0.96   120     0.92   0.92   0.92   120   M ul ti no mi a N a i ve  B a y e s   S V M   0   0.89   0.73   0.8   64     0.98   0.98   0.98   64   1   0.75   0.89   0.81   56     0.98   0.98   0.98   56   A c c u r a c y   -   -   0.81   120     -   -   0.98   120   M a c r o  a v g   0.82   0.81   0.81   120     0.98   0.98   0.98   120   W e ig ht e d a v g   0.82   0.81   0.81   120     0.98   0.98   0.98   120   R a ndo f o r e s t   X G B oo s t   0   0.98   0.98   0.98   64     0.98   0.97   0.98   64   1   0.98   0.98   0.98   56     0.96   0.98   0.97   56   A c c u r a c y   -   -   0.98   120     -   -   0.97   120   M a c r o  a v g   0.98   0.98   0.98   120     0.97   0.98   0.97   120   W e ig ht e d a v g   0.98   0.98   0.98   120     0.98   0.97   0.98   120   M L P   c la s s if ie r   G r a di e nt   b oo s ti ng   0   0.98   0.98   0.98   64     0.98   0.98   0.98   64   1   0.98   0.98   0.98   56     0.98   0.98   0.98   56   A c c u r a c y   -   -   0.98   120     -   -   0.98   120   M a c r o  a v g   0.98   0.98   0.98   120     0.98   0.98   0.98   120   W e ig ht e d a v g   0.98   0.98   0.98   120     0.98   0.98   0.98   120       Af t e r   t r a i ni ng,   t h e   L R ,   DT ,   K NN ,   GN B ,   M NB ,   S VC ,   R F ,   XG B o o s t,   M L P ,   a n GB   a l go r i t hms   a c hi e ve 97% ,   94% ,   96 % ,   92% ,   81% ,   98 % ,   98% ,   97% ,   98% ,   a n 98%   a c c ur a c y ,   r e s pe c t i v e ly .   T h e   c o m p l e t e   i n f o r m a t i o n   i s   s h o wn   i T a bl e   3.   I n   a dd i t i o n ,   F igur e   s h o ws   t h e   p r e c i s i o n   pe r c e n t a ge   o f   t h e   a l go r i t hm s   vi s u a l ly ,   whi c h   h e l p s   to  e a s i ly   c o m pa r e   t h e   pe r f o r m a n c e   o f   e a c h   m o de l .   A c c o r d i n t t h e   r e s u l t s   i n   T a bl e   3 ,   t h e   S VC ,   R F ,   M L P ,   a n GB   m o de l s   o b t a i n e t h e   b e s t   pe r f o r m a n c e   m e t r i c s ,   s i n c e   t h e y   a c hi e v e 98%   i n   a c c ur a c y ,   98%   i n   pr e c i s i o n ,   a n 98%   i n   s e n s i t i v i t y .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2 5 0 2 - 4 7 52   In do n e s i a n   J   E l e c   E n g   &   C o m S c i Vo l .   3 7 ,   N o .   2 F e b r ua r y   20 2 5 :   1 35 2 - 1 36 4   1360   I n   t h e   s e c o n p l a c e ,   t h e   L R   a n XG B o o s m o de l s   a c hi e ve 97%   a c c ur a c y ,   98%   p r e c i s i o n ,   a n 97%   s e n s i t i v i t y .   I n   t hi r p l a c e   i s   t h e   K NN   m o de l   t h a t   a c hi e v e 96%   a c c ur a c y ,   pr e c i s i o n   a n s e n s i t i v i t y .   I n   t h e   l a s t   p l a c e s   a r e   t h e   DT ,   GN B ,   a n M NB   m o de l s ,   whi c h   a c hi e v e t h e   l o we s t   m e t r i c s ,   94% ,   92% ,   a n 81%   a c c ur a c y .           F i gur e   6 P r e c i s i o n   o f   a l go r i t hm s   f o r   pr e d i c t i n l u ng  c a n c e r       5.   DI S CU S S I ON   L u n c a n c e r   r e m a i ns   o n e   o f   t h e   c a n c e r s   w i t h   t h e   hi g h e s t   i n c i de n c e   a n m o r t a l i t y   wo r l dw i de ,   c l a im i ng  t h o us a n ds   o f   li ve s   e a c h   y e a r .   E a r l y   de t e c t i o n   i s   c r uc i a l   t o   i m pr o vi ng  s ur vi va l   r a t e s ,   a s   i t   a l lo ws   f o r   t i m e ly   t r e a t m e n t   i n t e r v e n t i o n s .   T hi s   s t ud y   i nv e s t i ga t e t h e   e f f e c t s   o f   M L   m o de l s   o n   l u n c a n c e r   pr e d i c t i o n .   W hil e   pr e vi o us   s t udi e s   h a v e   e x p l o r e t h e   i m pa c t   o f   v a r i o us   M L   a l go r i t hm s   o n   d i s e a s e   pr e d i c ti o n ,   t h e   li t e r a t ur e   l a c ks   c o m pr e h e n s i ve   c o m pa r i s o n s   b e t we e n   a   w i de   r a n g e   o f   M L   m o de l s   ( s uc h   a s   L R ,   DT ,   K NN ,   GN B ,   M NB ,   S VC ,   R F ,   XG B oo s t,   M L P ,   a n GB ) .   T hi s   s t udy   a im s   to  f il l   t hi s   ga by   i de n t i f yi ng  t h e   m o de l   w i t h   t h e   b e s t   pe r f o r m a n c e   i n   pr e d i c t i n l u n c a n c e r .   Af t e r   tr a i ni n g,   i t   wa s   f o un t h a t   t h e   S VC ,   R F ,   M L P ,   a n GB   m o de l s   e xhi b i t e t h e   hi g h e s t   pe r f o r m a n c e   m e t r i c s ,   e a c h   a c hi e vi ng  98%   a c c ur a c y ,   pr e c i s i o n ,   a n s e n s i t i v i t y   i pr e d i c t i n l u n g   c a n c e r .   T h e s e   r e s u l t s   a r e   s i mi l a r   to  t h o s e   o b t a i n e i n   [ 34] ,   wh e r e   t h e   R F   m o de l   a c hi e ve a   pe r f o r m a n c e   o f   98% .   S i m il a r ly ,   X i e   e al.   [ 33]   R F ,   i t   a c hi e v e 96. 68%   a c c ur a c y .   I n   c o n t r a s t ,   i n   s t udi e s   [ 35] ,   [ 40] ,   [ 41] ,   [ 42 ]   t h e   R F   m o de l   a c hi e ve pe r f o r m a n c e   m e t r i c s   by   84. 2% ,   88. 3% ,   84 . 37% ,   a n 70% ,   r e s pe c t i v e ly ,   w hi c h   a r e   l o we r   t h a t h o s e   o b t a i ne i n   t hi s   s t ud y .   S i m il a r ly ,   t h e   M L P   m o de l   i o ur   s t udy   a c hi e v e 98%   a c c ur a c y ,   o u t pe r f o r m i ng   s t udi e s   [ 30] ,   [ 32] ,   whi c h   r e por t e 88 . 55%   a n 78. 33% ,   r e s pe c t i v e ly .   On   t h e   ot h e r   h a n d,   i n   t hi s   s t udy ,   t h e   L R   a n XG B o o s m o de l s   a c hi e ve 97%   a c c ur a c y ,   98%   a c c ur a c y ,   a n 97%   s e n s i t i v i t y ,   r e s u l t s   s im il a r   to  t h o s e   pr e s e n t e i n   [ 28] ,   [ 29]   a s   t h e s e   s t udi e s   a c hi e ve a   pe r f o r m a n c e   o f   96. 9%   a n 96. 3 %   i n   t h e   L R   a n XG B o o s m o de l s .   I n   t h e   o pp o s i t e   p o s i t i o n ,   [ 38]   i t   de t e r m i ne t h a t   t h e   XG B oo s m o de l   a c hi e v e a n   a c c ur a c y   o f     73% ,   whi c h   i s   a   l o we r   r e s ul t   t h a n   t h o s e   o b t a i n e i n   t hi s   s t ud y .   F ur t h e r m o r e ,   i n   [ 29] ,   [ 31] ,   [ 34] ,   [ 39 ]   t h e     K NN   m o de l   s c o r e 95. 2 % ,   75% ,   96% ,   a n 71 % ,   r e s pe c t i v e ly .   T h e s e   r e s u l t s   a r e   m o s t l y   s im il a r   to   t h o s e   o b t a i n e i n   t hi s   s t ud y ,   a s   t h e   KN m o de l   a c hi e v e 96%   i n   pr e c i s i o n ,   a c c ur a c y ,   a n s e n s i t i v it y .   T hi s     i nd i c a t e s   t h a t   o ur   da t a s e t   a n pr e pr o c e s s i n m e t h o ds   m a y   h a v e   c o n t r i b ut e s i g ni f i c a n t l y   t t h e   hi g h e r   t h r o ugh pu t .   I n   t h e   pr e s e n t   s t udy ,   a   c o m pr e h e n s i ve   da t a s e t   wa s   us e to   e v a l ua t e   t h e   pe r f o r m a n c e   o f   va r i o us   ML   m o de l s   i pr e d i c t i n l u n c a nc e r .   Ho we v e r ,   t h e   qua l i t y   o f   t h e   da t a s e t ,   i n c l ud i ng  i t s   s i z e ,   d i ve r s i t y ,   a nd  f e a t ur e   r e pr e s e n t a t i o n ,   c a n   s i g ni f i c a n t l y   a f f e c t   t h e   e f f e c t i v e n e s s   o f   m o de l s .   W hil e   o ur   s t udy   a c hi e v e hi g h - t h r o ugh pu t   m e t r i c s ,   m o r e   r e s e a r c h   i s   n e e de t v a l i da t e   t h e s e   f i nd i ngs   i n   d if f e r e n t   po pul a t i o n s   a n d   c l i ni c a l   s e tt i n g s .   I n   a dd i t i o n ,   t h e   ge n e r a li z a bil i t y   o f   t h e   r e s u l t s   m a y   b e   li m i t e by   t h e   s pe c if i c   c h a r a c t e r i s t i c s   a n d   pr e pr o c e s s i ng  t e c h ni qu e s   us e i n   o ur   s t udy .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2 5 0 2 - 4 7 52       P e r f or manc e   analys is   of   10  mac hine  lear ning  mod e ls   in  lung  c anc e r   pr e diction   ( J os e lyn  Z apata - P auli ni )   1361   F ut ur e   s t udi e s   s h o u l c o n s i de r   d i v e r s e   da t a s e t s   a n a l t e r n a t i v e   f e a t ur e   s e t s   to  e n s ur e   b r o a de r   a pp l i c a b il i t y .   I n   a dd i t i o n ,   i t   i s   e s s e n t i a l   to   c o n t i n u e   r e f i n i ng  t h e s e   m o de l s   a n e x p l o r i ng  t h e i r   i n t e gr a t i o n   i n t c l i n i c a l   pr a c t i c e   to  m a xim i z e   t h e i r   i m pa c t   o n   p a t i e n t   c a r e .   T h e   i nc o r p o r a t i o n   o f   r e a l - t i m e   da t a   a n t h e   de v e l o p m e n t   o f   hy br i m o de l s   c o u l pr o vi de   s i g nif i c a n t   i m pr o v e m e n t s   i n   t h e   a c c ur a c y   a n c li n i c a l   u t i li t y   o f   M L   m o de l s   i n   l u n c a n c e r   pr e d i c t i o n .   Our   f i nd i ngs   pr o vi d e   c o n c l us i ve   e vi de n c e   o f   t h e   pot e n t i a l   o f   M L   i n   m e d i c a l   d i a g n o s t i c s   a n t h e   n e e d   f o r   c o n t i n uo us   i m pr o v e m e n t   a n v a li da t i o n   o f   t h e s e   m o de l s   w i t h   d i ve r s e   da t a s e t s .   E f f e c t i v e   i m p l e men t a t i o o f   M L   m o de l s   i n   c l i n i c a l   s e t t i n gs   h a s   t h e   pot e n t i a l   to   r e v o l ut i o ni z e   t h e   e a r l y   d i a g n o s i s   o f   l u n c a nc e r ,   t h e r e b y   im pr o vi n pa t i e n t   o u t c o m e s   a n o p t i mi z i ng  he a l t hc a r e   r e s o ur c e s .       6.   CONC L USI ON   Af t e r   pr e s e n t i n g   t h e   t r a i ni n r e s u l t s   o f   t h e   L R ,   D T ,   K NN ,   GN B ,   M NB ,   S VC ,   R F ,   XG B oo s t,   M L P ,   a n GB   m o de l s   f o r   t h e   pr e di c t i o n   o f   l u n c a n c e r ,   t h e   f o l l o w i ng  c o n c l u s i o n s   we r e   r e a c he d .   T h e   m o de l s   o b t a i n e o u t s t a n d i n r e s u l t s ,   m a i n ly   S VC ,   R F ,   M L P ,   a n GB   whi c h   a c hi e v e t h e   b e s t   m e t r i c s   i n   p r e c i s i o n ,   a c c ur a c y ,   a n s e ns i t i vi t y   f o r   l u n c a n c e r   pr e d i c t i o n   a n m a y   b e   vi t a l   f o r   e a r l y   de t e c t i o n   to  h e l im pr o v e   pa t i e n t   pr o gn o s i s .   S i mi l a r ly ,   t h e   L R ,   XG B o o s t,   K NN ,   DT ,   a n GN B   m o de l s   a c hi e v e e xc e pt i o n a l   m e t r i c s   f o r   c a nc e r   pr e d i c t i o n .   E x c e pt   f o r   M NB ,   whi c h   a c hi e v e l e s s   t h a n   90%   pe r f o r m a n c e .   A dd i t i o n a ll y ,   b a h a bi t s   r e l a t e to   a l c o h o l   c o n s u m pt i o n   a n s m o k i n a r e   f a c t o r s   t h a t   h a v e   a   hi g h e r   pr e s e nc e   i pa t i e n t s   d i a gn o s e d   w i t h   l u n c a n c e r .   On   t h e   ot h e r   h a n d,   s y m pt o m s   s uc h   a s   c o ugh ,   c h e s t   pa i n ,   a n c h r o ni c   d i s e a s e   a r e   i nd i c a t o r s   t h a t,   a l t h o ugh   pr e s e n t   i n   pa t i e n t s   w i t h o ut   c a n c e r ,   s h o u l a l s o   b e   c o n s i de r e f o r   a n   e a r l y   d i a g n o s i s   o f   l u n c a nc e r .   F i n a ll y ,   a l l   o f   t h e   a l go r i t hm s   t r a i n e a n a n a ly z e i n   t hi s   s t ud y   pr o v e to  b e   us e f u l   too l s   f o r   l u n g   can c e r   pr e di c t i o n .   Al t h o ugh   t h e   m o de l s   a c hi e ve o u t s t a n d i n m e t r i c s ,   i t   i s   r e c o m m e n de f o r   f ut ur e   r e s e a r c to  e x p l o r e   m o de l s   s uc h   a s   C NN s   or   r e c ur r e n n e ur a l   n e t wo r ks   ( R NN s )   to  s e e   i f   t h e y   o f f e r   i m pr o v e m e n t s   i pr e d i c t i o n   a c c ur a c y .   I n   a dd i t i o n ,   i t   w o ul b e   be n e f i c i a l   t o   e v a l ua t e   a dd i t i o na l ,   l a r ge r ,   m o r e   di v e r s e ,   o r   c o l l e c t e da t a s e t s   f r o m   d i f f e r e n t   ge o g r a phi c   r e g i o n s ,   to  de t e r m i ne   t h e   ge n e r a l i z a bil i t y   a n pe r f o r m a n c e   o f   m o de l s   i n   d if f e r e n t   c o n t e x t s ,   a l l o w i ng  t h e m   to   b e   tes t e f o r   e f f e c t i v e n e s s .       RE F E R E NC E S   [ 1]   W o r ld   H e a lt O r ga ni z a ti o n,  L ung  c a n c e r ,”   W H O 20 23.  ht tp s :/ /ww w .w ho .i nt /n e w s - r oo m/ f a c t - s he e ts /d e ta il /l ung - c a nc e r     ( a c c e s s e d D e c . 03, 2023) .   [ 2]   L A T o r r e F B r a y R L S i e ge l,   J F e r la y J L o r t e t‐ T i e ul e nt a nd  A J e ma l,   G lo ba c a n c e r   s ta ti s ti c s 2012,”   C A :   A   C a nc e r   J our nal  f o r  C li ni c ia ns , v o l.  65, n o . 2, pp. 87 108, M a r . 2015, do i:  10.3322/ c a a c .21262.   [ 3]   N . H o w la d e r   e a l. , “ T h e   e f f e c of  a d v a nc e s  i n l ung - c a nc e r   tr e a t me nt   o n  p o pul a ti o n m o r ta li t y ,”   N e w   E ngl and J our nal  of  M e di c in e vo l.  383, n o . 7, pp. 640 649, Aug. 2020, d o i:  10.1056/n e jm o a 1 916623.   [ 4]   W D T r a v is E B r a mbi ll a ,   A P .   B u r k e A M a r x ,   a nd  A G .   N ic h o ls o n,  I n tr o du c ti o t o   th e   2015   W o r ld   H e a lt h   O r ga ni z a ti o n   c la s s if i c a ti o of  t um o r s   of  t h e  l ung, pl e u r a , t h y mus , a nd he a r t,   J our nal  of  T hor a c ic  O nc ol ogy , v o l.  10, n o . 9, pp. 1240 1242,  S e p.  2015, do i:  10.1097/J T O .0000000000000663.   [ 5]   W D T r a v is   e al . T h e   2015  W o r ld   H e a lt O r g a ni z a ti o c la s s if i c a ti o of   lu ng  tu m or s im pa c of   g e n e ti c c li ni c a a nd  r a di o l o gi c   a dv a nc e s   s in c e   th e   2004  c la s s if i c a ti o n,”   J our nal   of   T hor ac ic   O nc ol ogy vo l.   10,   n o 9,  pp.   1243 1260,  S e p.  20 15,    do i:  10.1097/J T O .0000000000000630.   [ 6]   K C T ha ndr a A B a r s o uk,  K S a gi na la J S A lu r u,  a nd  A B a r s o uk,  E pi de mi o l o g y   of   lu ng  c a n c e r ,”   W s pol c z e s na  O nk ol ogi a vo l.  25, n o . 1, pp. 45 52, 2021, d o i:  10.5114/w o .2021.103829.   [ 7]   M B S c ha ba th   a nd  M L C o t e C a nc e r   pr o gr e s s   a nd  pr io r it i e s l ung  c a nc e r ,”   C anc e r   E pi de m io lo gy   B io m ar k e r s   and  P r e v e nt io n vo l.  28, n o . 10, pp. 1563 1579, O c t.  2019, d o i:  10.1158/1055 - 9 965.E P I - 19 - 0221.   [ 8]   R N oo r e ld e e a nd  H B a c h,  C ur r e nt   a nd  f ut ur e   d e ve l o pm e nt   in   lu ng  c a nc e r   di a gn o s is ,”   I nt e r nat io nal   J our nal   of   M ol e c ul ar   Sc ie nc e s , v o l . 22, n o . 16, p. 8661, Aug. 2 021, d o i:  10.3390/i jm s 22168661.   [ 9]   A H K r is e al . S c r e e ni ng  f or   lu ng  c a nc e r U S   pr e ve nt i ve   s e r v i c e s   ta s f o r c e   r e c o mm e nda ti o s ta te m e nt ,”   J A M A   -   J our nal   of   th e  A m e r ic an M e di c al  A s s oc ia ti on , v o l.  325, n o . 10, pp. 962 97 0,   M a r . 2021, do i:  10.1001/j a ma .2021.1117.   [ 10]   D Y a ng,  Y .   L iu C B a i,   X W a ng,  a nd   C . A P o w e ll E pi d e mi o l o g y   of   lu ng  c a nc e r   a nd  lu ng  c a nc e r   s c r e e ni ng  pr o gr a ms   in   C hi na   a nd t he  U ni te S ta te s ,”   C anc e r  L e tt e r s , v o l.  468, pp. 82 87, J a n. 2020, do i:  10.1016/ j. c a nl e t. 2019.10.009.   [ 11]   W o r ld   H e a lt h   O r ga ni z a ti o n,   T h e   t o p   10  c a us e s   of   de a th ,”   W or ld   H e al th   O r gani z at io n vol 12,  2020,   [ O nl in e ] .   A v a il a bl e :   ht tp s :/ /ww w .w ho .i nt /n e w s - r oo m/ f a c t - s h e e ts /d e ta il /t h e - t o p - 10 - c a us e s - of - de a th   ( a c c e s s e d D e c . 03, 2023) .   [ 12]   N a ti o na C a nc e r   I ns ti tu t e C a nc e r   s ta f a c ts lu ng  a nd  br o nc h us   c a nc e r s e c o nda r y   c a n c e r   s ta f a c ts lu ng  a nd  br o n c hus   c a nc e r ,”   Sur v e il la nc e E pi de m io lo gy and  E nd  R e s ul ts   P r ogr am 2021,  [ O nl in e ] A v a il a bl e ht tp s :/ /s e e r .c a n c e r .g ov /s ta t f a c ts /h tm l /l ungb.ht ml   ( a c c e s s e d D e c .  03, 2023) .   [ 13]   A me r i c a C a nc e r   S oc i e t y ,”   L ung  c a nc e r   s ta ti s ti c s   ho w   c omm o is   lu ng  c a n c e r ,”   F ac ts   and  F ig ur e s   2020 2020,   [ O nl in e ] A v a il a bl e ht tp s :/ /ww w .c a n c e r . o r g/ c a nc e r /t y pe s /l ung - c a n c e r /a b o ut /k e y - s ta ti s ti c s .ht ml   ( a c c e s s e d D e c . 0 3, 2023) .   [ 14]   C á nc e r   d e   pul món,  tr a qu e a   y   br o nqui o s f a ll e c im i e nt o s   p o r   pa ís   O C D E ,”   St at is ta 2023,  [ O nl in e ] A v a il a bl e ht tp s :/ /e s .s ta ti s ta .c o m /e s ta di s ti c a s /5 88401/num e r o - de - mue r t e s - po r - ne o p la s ia - en - d e t e r mi na d o s - pa is e s - de - la - oc d e /   ( a c c e s s e d   D e c .   03, 202 3) .   [ 15]   W o r ld   H e a lt O r ga ni z a ti o n,  W o r ld   H e a lt O r ga ni z a ti o n.   w o r ld   he a lt h   r a nki ngs   li ve   l o ng e r   l i v e   be t te r   2016,”   W or ld   H e al th   O r gani z at io n , 2016, [ O nl in e ] . A v a il a bl e w w w .w o r ld li f e e x pe c t a nc y .c o m/ w or ld - h e a lt h - r a nki ngs   ( a c c e s s e d D e c . 03, 2023) .   [ 16]   B Z h o e al . ,   W o r ld w id e   bu r de n   a nd  e pi d e mi o l o gi c a t r e nds   of   tr a c h e a l,   br o n c hus a nd  lu ng  c a nc e r :   a   po pul a ti o n - ba s e s tu d y ,”   e B io M e di c in e , vo l.  78, p. 103951, Apr . 2022, d oi 10.1016/j . e bi o m.2022.103951.     Evaluation Warning : The document was created with Spire.PDF for Python.