I n d on e s ian   Jou r n al   o f   E lec t r ica l   E n gin e e r in a n d   Com p u t e r   S c ience   Vo l .   3 9 ,   N o .   1 Ju ly   2025 ,   pp.   455 ~ 465   I S S N:  2502 - 4752,   DO I 10 . 11591/i j e e c s . v 3 9 .i 1 . pp 455 - 465             455     Jou r n al  h o m e page ht tp: // ij e e c s . iaes c or e . c om   C or e  m e t h od ol ogi c al  c la sse s of  t e x t  e xt r ac t io n  an d  l oc al i z at i on - sn ap s h ot  of  ap p r oac h e s       Dayanan d K od al Jayar am ,   P u t t e gowda  De ve gowda   D e pa r tm e nt   of  C o mput e r  S c i e n c e  a nd  E ngi n e e r in g, A T M E  C o ll e g e   of  E ngi n e e r in g,  V is ve s v a r a y a   T e c hn o l o gi c a U ni v e r s it y   M y s ur u,  I ndi a       Ar t ic l e   I n f o     AB S T RA CT   A r ti c le  h is tor y :   R e c e i ve S e p   6 2024   R e vi s e M a r   18 2025   A c c e pt e M a r   26 2025       T h e   mo t i v at i o n   t o   w o rk   o n   t e x t   e x t rac t i o n   a n d   l o cal i zat i o n   i s   q u i t e   s u b s t an t i al   t h at   p o t e n t i al l y   i n f l u en ce s   l ar g e r   ar e o f   a p p l i c at i o n   r i g h t   fro m   b u s i n e s s   i n t el l i g en ce   t o   a d v a n c ed   d at an al y t i c s .   A t   p re s en t ,   t h e r e   ar e   m as s i v e   ar ch i v e s   o l i t e rat u r e s   ad d r e s s i n g   v ar y i n g   ran g e s   o p ro b l em s   as s o c i at ed   w i t h   t e x t   e x t rac t i o n   a n d   l o c al i zat i o n   w i t h   a n   e ff ec t i v r e al i zat i o n   o r e s p e c t i v e   co n t ri b u t i o n   as   w el l   as   o n - g o i n g   i s s u e s .   H o w ev e r,   p ro b l em  s t a t e men t   i s   t h at   al l   t h e s e   m as s i v e   i m p l emen t at i o n   s t u d i e s   are   f u rt h e re q u i r ed   t o   co n v e rg d o w n   i n   o rd e r   t o   r e al i z e   t h co r e   cl as s e s   o me t h o d o l o g i e s   i n v o l v e d   i n   t e x t   e x t rac t i o n .   H e n ce ,   t h i s   m an u s c r i p t   u s e s   d e s k   re s e ar ch   me t h o d o l o g y   t o   a d d r e s s   t h i s   i s s u e   b y   p r e s en t i n g   c o m p a c t   i n s i g h t   o co r e   me t h o d o l o g i c a l   c l as s e s   w h e r e   al l   t h e   r ece n t   i m p l eme n t at i o n   w o rk   ar c o n v e r g e d   d o w n   t o   u n d e rs t an d   i t s   s t ren g t h   an d   w ea k n e s s .   T h r e s e ar ch   o u t co me   co n t ri b u t e s   t o w ard s   fa ci l i t at i n g   i n f o r m at i o n   o cu rren t   r e s e ar ch   t re n d   a n d   i d en t i fi ed   re s e ar c h   g ap .   T h e   p ro p o s e d   r e v i ew   s t u d y   as s i s t s   i n   u n d e rt ak i n g   d eci s i o n   o s u i t ab l ap p ro ach   o t e x t   e x t rac t i o n ,   l o c al i zat i o n ,   d e t ec t i o n ,   r eco g n i t i o n ,   an d   cl as s i fi c at i o n .   K e y w o r d s :   Da t a   a n a l y t i c s   M e t h o do l o gi e s   T e x t   de t e c t i o n   T e x t   e x t r a c t i o n   T e x t   l o c a l i z a t i o n   Th i s   i s   a n   o p en   a c ces s   a r t i c l u n d e r   t h CC  B Y - SA   l i cen s e.     C or r e s pon din A u th or :   Da y a na n da   K o da l a   J a y a r a m   De pa r t m e n t   o f   C o m put e r   S c i e n c e   a n E n g i ne e r i n g ,   A T M E   C o l l e g e   o f   E n g i ne e r i ng   V i s ve s v a r a y a   T e c hn o l o g i c a l   U ni ve r s i t y   B a nn ur   R d,   M y s ur u,   K a r n a t a ka ,   570028 ,   I n d i a     E m a i l da y a n a n d a . ke m @ g m a il . c o m       1.   I NT RODU C T I ON   T h e   us a ge   o f   t e x t   e x t r a c t i o n   a n l o c a li z a t i o n   a r e   wi de ly   n o t i c e i n   t h e   a pp l i c a t i o n   a r e a   o f   t r a n s l a t i o s e r vi c e s ,   c o n t e n t   m a n a g e m e n t ,   a n s o f t wa r e   de v e l o p m e n t .   I n   t e x t   e x tr a c t i o n ,   t h e   pa r t i c u l a r   p i e c e s   o f   i n f o r m a t i o n   a r e   i de n t i f i e f o l l o we by   r e t r i e v a l   f r o m   l a r ge   c o r pus   o f   t e x t h a t   c a n   b e   s ubj e c t e to   b ot h   un s t r uc t ur e d   a n s tr uc t u r e da t a   us i n o p t i c a l   c h a r a c t e r   r e c o gni t i o n   ( OC R ) ,   n a t u r a l   l a n gua ge   pr o c e s s i n g   ( NL P ) ,   a n r e gu l a r   e x pr e s s i o n   [ 1] .   T h e   pr o c e s s   of   t e x t   e x t r a c t i o n   i s   w i de ly   a do pt e i n   s e a r c h   e n g in e s ,   we s c r a p i n g,   do c u m e n t   pa r s i n g,   a n da t a   m i n i ng.   I n   t e x t   l o c a l i z a t i o n ,   t h e   po s i t i o n   o f   t h e   t e x t   i s   i de n t i f i e d   i n   o r de r   to  m e e t   t h e   c o n t e x t ua l   de m a n d s   a n l i ngu i s t i c   r e qu i r e m e n t s   wh e r e   t h e   t e x t   c o n t e n t s   a r e   tr a n s lat e a n d   c us t o m i z e to   m e e t   t h e   de m a n ds   o f   l o c a l   us e r s .   T h e   pr o c e s s   o f   t e x t   l o c a l i z a t i o n   i s   c a r r i e o ut  us i n m a c hi n e   t r a n s l a t i o n ,   tr a n s l a t i o n   m e m o r y ,   a n l o c a li z a t i o m a n a g e m e n t   s y s t e m   [ 2] .   T h e r e   a r e   v a r i o us   c h a l l e n ge s   a s s o c i a t e w i t h   t e x t   e x t r a c t i o n   a n l o c a t i o n   whe r e   t h e   pr i m a r y   o n e   i s   r e l a t e to  s ub - o p t i m a l   t e x t   qu a l i t y   a n v a r i e f o r m a t s .   Va r i a bil i t y   o f   s t r uc t ur e   a l s o   po s e s   a   s i g nif i c a n t   c ha l l e n g e   i n   e x t r a c t i o n   o f   s u i t a bl e   t e x t   wh e r e   i t   i s   qu i t e   c h a ll e n g i ng  t o   un de r s t a n t h e   c o n t e x t .   F ur t h e r ,   m o r e   c o m p l e xi t i e s   a r e   a dde dur i n e x t r a c t i o n   o f   t e x wi t h   m u l t i p l e   l a n gu a ge s   a s   we ll   a s   do m a i n - s pe c i f i c   t e r m i n o l o g i e s .   W hi l e   pe r f o r m i ng  e x t r a c t i o n   f r o m   s c e n e   t e x t   o r   f r o m   c o m p l e x   b a c kgr o un d,   t h e r e   a r e   a l s o   hi g h e r   po s s i bil i t i e s   o f   m i s s e t e x t   e l e m e n t s   o r   i na ppr o pr i a t e l y   i de n t i f i e t e x t   e v e n t ua l l y   l e a d i n to  e r r or s .   T h e r e   i s   a n   i mm e ns e   f ut ur e   s c o pe   o f   t e x Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i Vo l .   3 9 ,   N o .   1 ,   Ju ly   20 25 :   455 - 465   456   e x t r a c t i o n   t h a t   a r e   m o r e   l i ke ly   t b e   f o r m e by  t h e   pa c e   o f   e v o l vi ng  t e c hn o l o g i e s .   T e x t   de t e c t i o n   wh e c o m bi ne w i t h   a r t i f i c i a l   i n t e ll i ge n c e   ( A I )   c a n   o f f e r   m o r e   c a pa bi li t y   t o wa r ds   c a t e g o r i z i ng  c o m p l e x   c l a s s e s   o f   i n f o r m a t i o n   [ 3] .   A n o t h e r   pot e n t i a l   f ut ur e   s c o pe   o f   t e x e x t r a c t i o n   i s   r e l a t e to   p r o l if e r a t e de m a n ds   o f   r e a l - t i m e   da t a   a n a l y s i s   f r o m   va r i o us   c o n s i s t e n t   upda t i ng  s o u r c e s ,   f e e ds   o f   s o c i a l   m e d i a ,   a n l i ve   s t r e a m s .   e s s e n t i a f o r   a n a ly z i ng   a n m o ni t o r i n tr e n ds   a n e v e n t s   of   r e a l - t i m e   [ 4] .   C o n t e n ge n e r a t i o n   a n k n o w l e dg e   gr a ph s   a r e   a n ot h e r   e v o l vi ng  f ut ur e   s c o pe   o f   t e x e x t r a c t i o n   wh e r e   v a r i o us   f o r m s   o f   r e po r t s   a n s u m m a r i e s   c a n   be   a uto m a t i c a ll y   b e   ge n e r a t e d,   t h e r e by ,   s a vi ng  m a n u a l   e f f o r t ,   t i m e ,   e nh a n c e s   pr o duc t i vi t y .   E nh a n c e h a n d li ng  o f   d i a l e c t s   a n v a r i e l a n gu a ge s   a r e   a n o t h e r   e s s e n t i a l   s c o pe   o f   t e x e x t r a c t i o n   t o f f e r   e f f i c i e n t   m u lt i li ngua l   c a pa bi li t i e s   a n l a n gua ge - pa r t i c u l a r   f r a m e wo r ks .   A   d i s t i n c t   f o r m   o f   li ngu i s t i c   f e a t ur e   a n c u l t ur a l   c o n t e x t   c a b e   e f f e c t i v e ly   h a n d l e by   l a ngua ge - pa r t i c u l a r   f r a m e wo r ks   whi l e   m u l t i li ngua l   c a pa bil i t i e s   c a n   a s s i s t   i h a n d li ng  m u l t i p l e   l a n gu a ge s .   T h e r e   i s   a l s o   a n   i mm e ns e   n e e o f   t e x t   e x t r a c t i o n   too l   s pe c if i c a ll y   f o r   v a r i o us   do m a i ns   o f   s e r vi c e s   e . g. ,   f i na n c i a l   r e po r t s ,   m e d i c a l   r e c o r ds ,   a n l e ga l   do c u m e n t s .   I n   s uc h   a s pe c t ,   t h e   t e x e x t r a c t i o n   s y s t e m   c a n   f ur ni s h   m o r e   c us t o m i z e i n f o r m a t i o n   o n   t h e   b a s i s   o f   ut i li t y ,   e nh a n c e r e l e v a n c e ,   b e h a vi o r ,   a n us e r   pr e f e r e n c e .   F i n a ll y ,   t h e   m o r e   f r e que n t   us a ge   o f   t e x t   e x t r a c t i o n   i s   w i t n e s s e f r o m   v a r i o us   s c e n e s   w he r e   m u l t i - m o d a l i t i e s   a r e   a do p t e d.   S uc h   pe r s pe c t i v e   o f   t e x t   e x t r a c t i o n   c a l l s   f o r   i n t e gr a t i n t e x e x t r a c t i o n   s c h e m e s   w i t h   v a r yi ng  da t a t y pe s   e . g. ,   vi de o ,   a udi o ,   a n i m a ge s .   w i ll   o f f e r   e x t e ns i ve   c o m pr e h e ns i ve   i ns i g h t s   o f   kn o w l e dge   f r o m   t h e   a c qu i r e t e x t .   F ur t h e r ,   t h e   t e x t ua l   c o n t e n t s   c a n   b e   c o r r e l a t e to  A I   w i t v a r i o us   f o r m s   o f   da t a   i n   o r de r   to   p r o vi de   m o r e   e x t r a c t i o n   o f   da t a   a l o n w i t h   h o l i s t i c   un d e r s t a n d i ng.   Al t h o ugh ,   t h e   c o n ve n t i o na l   m e a ni ng  o f   t e x t   l o c a l i z a t i o n   i s   m o r e   f o c us e d   to wa r ds   tr a n s l a t i o n - ba s e pr o c e s s e s ,   b u t   t h e   im po r t a n c e   o f   i de n t i f yi ng  a n c o nv e r g i n t h e   t e x t ua l   a r e a   f r o m   t h e   s c e n e   t e x t   c a n   b e   hi g hly   c o m p l e m e n t a r y   to wa r ds   t e x e x t r a c t i o n   pr o c e s s .   H o we v e r ,   t h e   c o r e   c h a ll e n ge s   t h a a l m o s t   a l l   t h e   r e s e a r c h   c o m m u ni t i e s   a r e   e n c o un t e r i n c ur r e n t l y   i s   to  i n t r o duc e   s c a l a bl e   pe r f o r m a nc e   o f   t e x e x t r a c t i o n .   T hi s   i s   r e a l ly   a   bi gge r   i s s ue   a s   a c qu i r i ng  t e x t ua l   c o n t e n t s   f r o m   m a s s i ve   v o l u m e s   o f   da t a   de m a n ds   a   pr e c i s e   t oo l   w i t h   hi g h e r   r o b us t n e s s   a s   we l l   a s   e f f i c i e n t   i nf r a s t r uc t ur e s .   T h e   bi gge s t   c h a ll e n ge   s t i ll   r e s i de s   f o r   pr o vi d i ng  a c c ur a t e   a nd  f a s t e r   e x t r a c t i o n   o f   t e x t   f r o m   l a r ge r   da t a   v o l u m e s   i n   c ur r e n t   e r a .   T h e r e   a r e   v a r i o us   e xi s t i n r e vi e wo r ks   to wa r ds   t e x t   e x tr a c t i o n   pr o c e s s   whi c h   a r e   r e qu i r e to  b e   d i s c us s e i n   s t udy   ba c kgr o un to   h a v e   m o r e   f a i r   i de a   o f   e xi s t i n c o n t r i b ut i o n .   A   uni que   wo r k   i s   de s i g n e b I b r a him   [ 5]   whi c h   c a n   pe r f o r m   de t e c t i o n   o f   p l a g i a r i s m   t e x t   us i n A I .   C a o   e t   al .   [ 6]   h a v e   pr e s e n ted  vi vid   d i s c us s i o n   o f   t e x t   de t e c t i o n   a ppr o a c h e s   f r o m   n a t ur a l   s c e n e   a l o n w i t h   c o m pr e h e n s i ve   d i s c us s i o n   o f   p r oto c o l s   us e f o r   e v a l ua t i o n   a n da t a s e t   t r e n ds .   Di s c u s s i o n   o f   d if f e r e n t   v a r i a n t s   o f   a l go r i t hm s   t o wa r ds   t e x c l a s s if i c a t i o n   h a v e   b e e n   pr e s e n t e by   Ga s pa r e tt o   e al.   [ 7 ]   wi t h   a   s pe c i a l   e m p h a s i s   o n   de e l e a r ni n g - b a s e d   s c h e m e s .   A do pt i o n   o f   de e l e a r ni ng  a ppr o a c h e s   i n   r e s e a r c h   wo r to wa r ds   s i mi l a r   d i r e c t i o n   o f   e x t r a c t i o n   o f   i n f o r m a t i o n   i s   pr e s e n t e by   Ya n e al.   [ 8]   c o n s i d e r i n e x t r a c t i o n   o f   m u l t i - m o da l   i n f o r m a t i o n ,   e ve nt - r e l a t e i n f o r m a t i o n ,   a n r e l a t i o ns hi a m o n e n t i t i e s   b a s e i nf o r m a t i o n .   T h e   pa pe r   h a s   a l s o   pr e s e n t e d i s c us s i o n   o f   m u l t i l e ve l   d a t a s e t   s ui t a bl e   f o r   s uc h   a l go r i t hm s .   T h e   wo r c a r r i e o u t   by   Al ke n d i   e al.   [ 9 ]   h a v e   p r e s e n t e r e vi e o f   m u l t i p l e   h a n dwr i t t e n   t e x i de n t i f i c a t i o n   a ppr o a c h e s   i n   c o n t e x o f   b o t h   r e s e a r c h - ba s e wo r k s   a s   we ll   a s   c e r t a i n   c o m m e r c i a l   s y s t e m .   A   r e vi e o n   uni que   to pi c   a s s o c i a t e wi t h   m a t c hi ng  o f   t e x t ua l   e n t i t i e s   h a s   b e e pr e s e n t e by   J i a n a n C a i   [ 10]   wh e r e   t h e   a ut ho r s   hi g hl i g h t s   o n go i n c h a ll e n g e s   a s s o c i a t e w i t h   n e w ly   e v o l vi ng  a ppr o a c h e s   o f   A I .   M a l a s hi n   e al.   [ 11 ]   h a ve   pr e s e n t e d i s c u s s i o n   o f   a n   a da pt i v e   m o de l   w h e r e   s e a r c h - ba s e o pt i m i z a t i o n   i s   us e f o r   t e x e x t r a c t i o n .   T h e   i de n t i f i e pr o bl e m s   a r r i ve a f t e r   r e vi e w i n t h e   a b o v e - m e n t i o n e s t ud i e s   a r e   a s   f o l l o w s i )   t h e r e   a r e   hi g hly   s c a t t e r e f o r m   o f   t h e   r e vi e wo r a t   p r e s e n t   whi c h   o f f e r s   de s c r i pt i v e   i n f o r m a t i o n   a b o ut   a ll   i nd i v i dua l   a ppr o a c he s ;   h o we v e r ,   f a il s   t s t a t e   a   pr o pe r   t a x o n o m i e s   o f   t h e   f r e que n t l y   e v o l v e a ppr o a c h e s ;     ii )   t h e r e   a r e   f e r e s e a r c h   wo r k   whi c h   r e po r t s   o f   l im i t a t i o n s   o f   c o r e   c l a s s e s   o f   m e t h o do l o gi e s   i nv o l v e i n   t e x e x t r a c t i o n   a n l o c a li z a t i o n ;   i ii )   t h e r e   a r e   v a r i o us   r e s e a r c h   pa pe r s   w i t h   s im il a r   c o r e   t e c h n o l o g i e s   but   us i n g   d i f f e r e n t   r e s e a r c h   m e t h o do l o g i e s   t h a t   h a s   n ot   b e e n   y e t   i de n t i f i e i n   t h e   a r e a   o f   t e x t   e x t r a c ti o n ;   a nd     i v)   s im p li f i c a t i o n   o f   r e s e a r c h   ga a n c ur r e n t   t r e n ds   o f   m e t h o do l o g i c a l   c l a s s e s   a r e   f e t o   b e   i de nt i f i e i e xi s t i n r e vi e wo r k.   He n c e ,   t h e   a i m   o f   pr o p o s e d   s t udy   i s   to  c a r r y   o u a   i ns i g h t   de s c r i pt i o n   o f   t h e   c or e   m e t h o do l o g i c a l   c l a s s e s   f o r   t e x t   e x tr a c t i o n   a n l o c a l i z a t i o n   a ppr o a c h e s   f r o m   r e c e n t   s t udi e s .   T h e   v a l u e - a dde i nf o r m a t i o s t a t e i n   t hi s   m a n u s c r i pt   a s   a   pa r o f   c o n tr i b ut i o n   a r e   a s   f o l l o w s i )   to  hi g hl i g h t s   t h e   c o r e   c l a s s e s   o f   f r e que n t l a do p t e m e t h o ds   t o wa r ds   t e x t   e x t r a c t i o n   a n l o c a l i z a t i o n   t h a t   h a s   n o y e t   b e e n   r e po r t e i n   pr i o r   s t udi e s ;     ii )   t o   hi g hl i g h t   t h e   s t r e n gt h   a n we a k n e s s   o f   a s s o c i a t e m e t h o do l o g i c a l   c l a s s e s   o f   t e x t   e x t r a c t i o n   i n   or de r   to   i n f e r   i t s   de gr e e   o f   e f f e c t i v e n e s s ;   ii i )   to   hi g hli g h t   t h e   c ur r e n t   r e s e a r c h   t r e n ds   f o r   i d e n t i f yi ng  t h e   f r e que n t l a do p t e m e t h o ds   a s   we l l   a s   t h e i r   i n d i v i dua l   m e t ho ds   a l o n w i t h   i de n t i f i c a t i o n   o f   e v o l vi ng  a ppr o a c h e s ;   a n d   i v)   to  hi g hl i g h t   t h e   r e s e a r c h   ga i n   f o r m   o f   un s o l ve pr o bl e m s   t h a t   a r e   y e t   a wa i t i n f o r   a n   e f f e c t i v e   s o l ut i o n .   T h e   n e x t   s e c t i o n   pr e s e n t s   d i s c us s i o n   o f   r e s e a r c h   m e t h o ds   a d o p t e to  c o n s t r uc t   t hi s   r e vi e s t ud y .       Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       C or e   me thodol ogical  c las s e s   of   tex e x tr ac ti on  and   localiz ati on -   ( Day ananda  K odala  J ay ar am )   457   2.   M E T HO DS   T h e   pr o p o s e m e t h o t a r ge t s   to   c o n s t r uc a   pr o p e r   t a x o n o m y   o f   m e t h o do l o g i e s   by   r e vi e w i ng  t h e   e xi s t i n a ppr o a c h e s   o f   t e x t   e x t r a c t i o n   a n l o c a li z a t i o n .   F i g ur e   s h o wc a s e s   t h e   r e s e a r c h   m e t h o a dopt e f o r   t hi s   pur po s e .   T h e   f i r s t   s t e p   i s   to wa r ds   pe r f o r m i n g   da t a b a s e   e x p l o r a t i o n   a s s o c i a t e wi t h   t e x t   e x t r a c t i o n ,   t e x de t e c t i o n ,   l o c a l i z a t i o n ,   a n c l a s s if i c a t i o n .   T h e   i nit i a l   s c r e e ni ng  i s   pe r f o r m e by   r e vi e w i ng  t h e   a b s t r a c a n d   t i t l e   f o l l o we by   e li mi na t i n t h e   dup l i c a t e s .   T h e   s t udy   c o ns i de r s   t wo   di f f e r e n t   pa pe r s   w i t h   e x a c t l s i mi l a r   m e t h o ds   to   b e   dup l i c a t e s   a pa r t   f r o m   t wo   s i mi l a r   m a n u s c r i pt s .   T h e   i nc l us i o n   c r i t e r i a   a r e :   i )   o nly   j o ur na l   pa pe r s   publi s h e b e t we e n   2019 - 2024  a r e   i nc l ude d,   a nd   ii )   j o ur na l s   f r o m   r e put e d   publ i s he s   e . g. ,   M DPI ,   S pr i n g e r ,   A r X i V,   I J E C E ,   E UR A S I P   a r e   us e d.   T h e   e x c l us i o c r i t e r i a   a r e a ny   t he o r e t i c a l   o r   di s c us s i o n   o r   r e vi e pa pe r s   a n d   c o nf e r e n c e   o r   p r o c e e d i n gs   pa pe r s .           F i gur e   1.   A do p t e m e t h o do l o g y       Af t e r   d upl i c a t e s   r e m o v a l ,   t h e   f i n a l   s c r e e ni n i s   c a r r i e ou b y   s c r e e ni n g   t h e   c o m pl e t e   r e s e a r c h   m e t h o r e p or ted   wi t hi n   t h e   m a n us c r i p a s   w e l l   a s   i m p l e m e n t a t i o n   a n d   r e s ul s e c t i o n s   too.   F u r t h e r ,   a   r e s e a r c h   tr e n a n a l y s i s   i s   p e r f or m e d   to  un de r s tan d   t h e   f r e q u e n c i e s   o f   p ubl i c a t i o n s   a s s oc i a t e d   wi t h   e a c h   i n d i vi dua l   a pp r oa c h e s   un de r   c or e   m e t h od o l og i c a l   c l a s s e s   o f   tex e x tr a c t i o n   a n d   l o c a l i z a t i o n .   T h e   f i n a l   s tep   i s   to  r e vi e w   t h e   p r o b l e m s   th a h a v e   n ot  r e p or te d l y   b e i n m i t i ga tes   o v e r   a   c on s e c u t i v e   p e r i od   o f   t i m e   i n   or de r   to  a c qui r e   r e s e a r c h   ga p .     T h e   n e x s e c t i o n   di s c us s e s   a b ou t h e   ou tc o m e   o f   p r o p os e d   r e vi e w   w or k .       3.   RE S UL T S   AN DI S CU S S I ON   T hi s   s e c t i o n   pr e s e n t s   v a r i o us   t y pe s   o f   t e x t   de t e c t i o n   a s   we l l   a s   l o c a l i z a t i o n   s c he m e s   f r o m   t h e   vi de o   i de n t i f i e f r o m   t h e   e xi s t i ng  l i t e r a t ur e s .   I h a s   b e e n   n o t e d   t h a t   us a ge   o f   s uc h   s c h e m e   h a s   b e e n   w i t n e s s e d   to wa r ds   de v e l o p i ng  a n i nv e s t i ga t i n a uto m a t i c   s ub t i t l e s ,   c o n t e n a n a l y s i s ,   vi d e o   i n de xi ng,   a n m a ny   m o r e   a pp l i c a t i o ns .   Va r i o us   d i s t i n c t   m e t h o do l o g i e s   h a v e   b e e n   a do pt e to wa r ds   de t e c t i o n   o f   t e x t ua l   c o n t e n t s   f r o m   m u l t i m e d i a   a ddr e s s i n d if f e r e n t   v a r i a n t s   o f   r e s e a r c h   pr o bl e m .   T he   hi g hli g h t s   o f   t h e   i d e n t i f i e m e t h o ds   o f   t e x t   de t e c t i o n   a n l o c a li z a t i o n   a r e   c a t e g o r i z e a n d i s c us s e a s   f o l l o w s :     3. 1.     Re view e d   ap p r oac h e s   3. 1. 1.   Convent ion al   c om p u t e r   vis ion   m e t h od s   T a bl e   hi g hl i g h t s   t h e   s u m m a r y   o f   e f f e c t i v e ne s s   o f   c o n ve n t i o n a l   c o m put e r   vi s i o n   m e t h o ds .   T h e r e   a r e   t h r e e   e s s e n t i a l   a ppr o a c h e s   to wa r ds   t e x t   de t e c t i o n   a n l o c a l i z a t i o n   us i ng  c o m put e r   vi s i o n   m e t ho ds   vi z .   e dge   de t e c t i o n ,   c o n n e c t e c o m po n e n t   a n a l y s i s ,   a n r e gi o n - b a s e m e t h o ds .   E dge   de t e c t i o n   a s s i s t s   i i de n t i f y i ng  t h e   s t r uc t u r e   a n b o un da r i e s   o f   t e x t   r e gi o ns   us i ng  m u l t i p l e   a ppr o a c h e s   vi z .   n o i s e   r e duc t i o n ,   gr a d i e n t   c a l c u l a t i o n   n o n - m a xi m u m   s uppr e s s i o n ,   d o ubl e   t h r e s h o l d i ng,   a n e dge   t r a c ki n by   hy s t e r i s .   C o n ve n t i o na l   m e t h o ds   e . g. ,   c a n ny   e dge ,   S o b e l   o pe r a tor ,   P r e wi t t   o pe r a to r ,   L a pl a c i a n   o f   Ga us s i a n ,   a nd  Ho ugh   t r a n s f o r m   a r e   u s e f o r   e dge   de t e c t i o n .   C o n ne c t e c o m po n e n t   a n a ly s i s   i s   c a pa bl e   o f   de t e r m i n i ng  a n d   a n a ly z i ng  r e g i o n s   w i t h   c o nn e c t e p i x e l s   e i t h e r   i n   gr a y s c a l e   o f   bi na r y   a n c a n   s i g ni f i c a n t l y   a s s i s t s   in  e x t r a c t i n a n i s o l a t i n t e x t   a r e a .   R e gi o n - b a s e m e t h o pe r f o r m s   s e g m e n t a t i o n   o f   a n   im a ge   t o   m o r e   l o gi c a l   r e g i o n   f o l l o we by   t e x t   e x t r a c t i o n   a n a pp lyi ng  OC R .   I t   a l s o   pe r f o r m s   m e r g i ng  r e g i o n s   a n b o und i n b o r e f i ne m e n t   a s   po s pr o c e s s i n pr i o r   to  t e x t   e x t r a c t i o n .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i Vo l .   3 9 ,   N o .   1 ,   Ju ly   20 25 :   455 - 465   458   T a bl e   1 .   S um m a r y   o f   e f f e c t i v e n e s s   o f   c o m put e r   vi s i o n   m e t h o ds   A ppr o a c h es   P a pe r s   A dv a nt a ge     L im it a ti o ns   E dge   d e t e c ti o n   [ 12]   A bi li t y  t o  d e t e c e dge s  w it h hi gh a c c ur a c y   unde r  di f f e r e nt  t e x o r i e nt a ti o n   C o mput a ti o na ll y  m o r e  i nt e ns i v e   C o nne c t e c o mp o n e nt   a na l y s is   [ 13]   H ig hl y   f le x ib le  a nd  e f f e c ti ve   f or  s im pl e   te x t.   I nvo l ve s   c o mput a ti o na c o mp le x i ti e s s e ns it iv e  t o  n o is e   R e gi o n - ba s e d m e th o ds   [ 14] [ 15]   B e tt e r  s c a la bi li t y  a nd  c a n ha ndl e  di ve r s e   f o nt s  a nd l a y out s  of  t e xt   H ig hl y  s e ns it i ve  t o  n o is e , i n vo l ve s   c o mpl e x it y  du e  t o  mul ti pl e  s t e ps       3. 1. 2.   L e ar n in g - b as e d   ap p r oac h e s   I n   c o n t r a s to   c o n v e n t i o n a l   a ppr o a c h e s   o f   t e x t   e x tr a c t i o n   a n l o c a li z a t i o n ,   m a c hi ne   l e a r ni ng  a n de e p   a ppr o a c h e s   a r e   s l o w l y   e v o l vi n t pr o v e   i t s   c a pa bil i t y   t o wa r ds   i m pr o vi ng  a c c ur a c y   a n a da pt a bi li t y .   T a bl e   s u m m a r i z e s   t h e   e f f e c t i v e n e s s   o f   r e vi e w e l e a r n in g - b a s e a ppr o a c h e s .   T h e s e   l e a r ni ng  a ppr o a c h e s   i nv o l v e s   us i n a   s t a n da r da t a s e f o l l o we by   pe r f o r m i ng  t r a i ni ng  o pe r a t i o n   to  e x t r a c t   a n r e c o gni z e   t e x r e g i o n   a s   we l l   a s   t e x t ua l   c ha r a c t e r s .   F o l l o w i n i s   m o r e   i nf o r m a t i o n   a b o u t   a ppr o a c h e s :     F r o m   pe r s pe c t i v e   m a c hi ne   l e a r ni ng  a ppr o a c h ,   s li d i ng  w i ndo a n f e a t ur e - b a s e m e t h o ds   a r e   f r e qu e n t ly   a do p t e d   to wa r ds   t e x de t e c t i o n .   T h e   s l i d i ng  w i n do a s s i s t s   i n   de t e c t i n a n i s o l a t i n t h e   t e x by   m o vi ng  a   w i n do o f   f i xe s i z e   o v e r   a n   i m a ge   f o r   de t e r m i n in t h e   r e g i o n   o f   i n t e r e s t .   P r i o r   to  t e x t   e x tr a c t i o n ,   i a l s o   pe r f o r m s   f il t e r i ng  a n b o un d i ng  b o x   r e f i ne m e n t .   T hi s   a ppr o a c h e s   a l s o   c a l l s   f o r   a ppl yi ng  va r i o us   c l a s s if i e r s   e . g. ,   s uppor t   v e c to r   m a c hi ne   ( S VM )   o r   r a n do m   f o r e s t .   F e a t ur e - b a s e m e t h o ds   a r e   a not h e r   f r e qu e n t l y   a do pt e a ppr o a c h e s   i n   m a c hi ne   l e a r nin w h e r e   de t e c t i o n   o f   t e x t   i s   c a r r i e o u t   us i n va r i e vi s u a l   c h a r a c t e r i s t i c s   e . g. ,   c o l o r   a n i n t e ns i t y ,   t e x t ur e ,   s h a pe ,   a n m o r ph o l o g y .     F r o m   t h e   pe r s pe c t i v e   o f   de e l e a r ni n a ppr o a c h ,   t h e r e   a r e   v a r i o us   f r e que n t l y   us e a ppr o a c h e s   b a s e o n   pot e n t i a l   n e ur a l   n e t wor a r c hi t e c t u r e .   T hi s   a ppr o a c h   o f f e r s   a   c a pa bi li t y   t o   l e a r ni n s o phi s t i c a t e f e a t ur e s   a n c o m p l e x   pa t t e r n s .   T h e   pr e pr o c e s s i n o pe r a t i o n   i n   de e l e a r ni ng  o f f e r s   a n   e nh a n c e m o de l   pe r f o r m a n c e   us i ng  n o i s e   r e duc t i o n ,   n o r m a li z a t i o n,   a n da t a   a ug m e n t a t i o n .   De e l e a r ni ng  m e t h o ds   a l s o   i nv o l ve s   e f f i c i e n t   pr e - t r a i n e m o de l s   t h a a r e   hi g hly   s pe c if i c   to  d o m a i n   i o r de r   to  e nh a n c e   t h e   r o b us t n e s s   a n a c c ur a c y   pe r f o r m a n c e .   P y T o r c h   a n T e n s o r F lo a r e   m o r e   f r e que n t l y   a do pt e f r a m e wo r r e p o r ted  i e xi s t i n li t e r a t ur e s .   C o n v o l ut i o n al   n e ur a l   ne t wor ( C NN )   i s   o n e   o f   t h e   pr o m i ne n t   de e l e a r ni ng  m e t h o ds   kn o wn   f o r   i t s   s upe r i o r   c a pa bi li t y   o f   a c qu i r i ng  hi e r a r c hi c a l   f e a t ur e s   f o r   a s s i s t i n i n   e f f i c i e n t   t e x t   de t e c t i o a s   we l l   a s   r e c o gni t i o n .   C NN   i s   m a i n ly   u s e f o r   c h a r a c t e r   r e c o gni t i o n   a n t e x t - r e gi o n   de t e c t i o n .   R e g i o n - b a s e C NN   ( R - C N N)   pe r f o r m s   c l a s s i f i c a t i o n   o f   i de n t i f i e r e g i o n   o f   i n t e r e s t   us i n pr e - t r a i ne m o de l s   m a i n ly .   Yo o nl y   l o o o n c e   ( YO L O)   c a n   pe r f o r m   r e a l - t i m e   de t e c t i o n   o f   t e x t   by   pr e d i c t i n c l a s s   l a b e ls   a n b o un d i ng  b o x   us i ng  n e ur a l   n e t wo r k .   S i n g l e   s h o m u l t i b o x   de t e c tor   ( S S D)   us i n s i mi l a r   a ppr o a c h   o f   YO L m e t h o to wa r ds   t e x e x t r a c t i o n .         T a bl e   2 .   S um m a r y   o f   e f f e c t i v e n e s s   o f   l e a r ni ng  m e t h o ds   A ppr o a c he s   P a pe r s   A dv a nt a ge     L im it a ti o ns   S li di ng W in do w   [ 16]   A da pt a bl e  t o   v a r ie f or of   te x t,  s im pl i c it y   F ix e d w in d o w  s iz e ove r la ppi ng i s s ue c o mput a ti o na ll y  i nt e ns i v e   F e a tu r e - ba s e d m e th o ds   [ 17] [ 18]   I nt e r pr e ta bl e , a da pt a bl e   N e e ds  ma nua tu ni ng  of  t h r e s h o ld  a nd  pa r a me t e r s , s e ns it i v e   t o  n o is e  a nd  f lu c tu a ti ng t e x s t y l e s   C N N   [ 19] - [ 21 ]   H ig h e s a c c ur a c y , a ut o n om o us   f e a tu r e  l e a r ni ng   D e ma nds  ma s s iv e  t r a in e d a nd a nn o ta te da ta , hi ghl y   c o mput a ti o na ll y  i nt e ns iv e   R - C N N   [ 22] [ 23]   F le x ib l e , a nd highl y   a c c u r a te   de t e c t i o n   C o mput a ti o na ll y  i nt e ns i v e , i ndu c e s  hi ghe r   c o mpl e x it i e s  t o w a r ds  i mpl e m e nt a ti o n   Y O L O   [ 24] [ 25]   P e r f or ms  e nd - to - e nd d e t e c t i o n,  r e a l - ti me  p e r f or ma n c e   C o mpl e x  t e x l oc a li z a ti o n, hi gh e r   tr a in in c o mpl e x it y   S in gl e   s h o mul ti b ox   de t e c t or   [ 26] [ 27]   C a n e x t r a c t e x a mul t ip le   s c a le s , r e a l - ti m e   e x tr a c ti o n   D e ma nds  ma x im um  f in e   tu ni ng, de ma nds   hi ghe r  numb e r   of  a nnot a te d da ta , hi gh e r   r e s o ur c e   c o ns umpt i o n   R N N  a nd L S T M   [ 28] [ 29]   E f f e c ti ve  i n unde r s ta ndi ng  c o nt e x t,  c a pa bl e   of  ha ndl in v a r y in g t e x t   l e ngt h   R N N  s uf f e r s   f r o v a ni s hi ng gr a di e nt   pr o bl e m   T r a ns f or m e r   [ 30] [ 31]   S ta te - of - th e  A r p e r f or ma nc e   D e ma nds  l a r ge  t r a in e d da ta , de ma nds   s ubs ta nt ia me mo r y  a nd r e s o ur c e       A pa r t   f r o m   a b o ve - m e n t i o n e l e a r ni ng  a ppr o a c h e s ,   a tt e n t i o n   m e c h a ni s m   i s   a l s o   r e po r t e dl y   u s e f o r   m a n a g i ng  s e qu e n c e s   o f   i n put   wi t h   v a r y i ng  l e n gt h .   I i s   n o t e t h a t   wh e n   t r a n s f o r m e r   o r   R NN   i s   i n t e gr a t e wi t a tt e n t i o n   l a y e r ,   i t   i m pr o vi s e s   t h e   pe r f o r m a n c e   o f   t e x r e c o gni t i o n .   Ho we v e r ,   s uc h   m o de l s   i s   w i t ne s s e w i t Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       C or e   me thodol ogical  c las s e s   of   tex e x tr ac ti on  and   localiz ati on -   ( Day ananda  K odala  J ay ar am )   459   l o o ph o l s   o f   hi g h e r   c o m pu t a t i o n a l   r e s o ur c e   de pe n de nc i e s   f o r   i nf e r e n c e   a n t r a i ni ng  w i t h   in c r e a s e d   c o m p l e xi t i e s   a l t h o ugh ,   t h e s e   m o de l s   a r e   r e po r t e dl y   c h a r a c t e r i z e w i t h   be tt e r   c o n t e x t   h a n d li ng  a n e nh a n c e d   f o c us   o n   f e a t ur e s .   T h e r e   a r e   a l s o   e n d - to - e n m o de l s   t h a c o m bi ne s   b o t h   e x t r a c t i o n   a n i d e n t i f i c a t i o n   i n   o n e   m o de l   us e s pe c if i c a ll y   f o r   r e c o gni t i o n   o f   s c e n e   t e x t .   S uc h   m o de l s   c a n   b e   de v e l o p e by   i n t e gr a t i n g   c o n v o l ut i o n   R NN   a n t e x t   b o un d i ng  b o xe s   w h e r e   t e x t   a r e   o b t a i ne f r o m   i m a g e s .   T h e s e   a ppr o a c he s   o f f e r   r e duc e c o m put a t i o n a l   e f f o r t   to wa r ds   e x t r a c t i o n   a n r e c o gni t i o n   w i t h   hi g h e r   s t r e a m li ne wo r kf l o w ;   h o we v e r ,   t h e y   a l s o   s u f f e r   f r o m   e x t e ns i ve   t r a i ni ng  da t a   de m a n d s   a n m o de l   c o m p l e xi t y .   O bj e c t   de t e c t i o n   m e t h o ds   a r e   a l s o   r e p o r t e dl y   a do p t e i n   de e l e a r ni ng  a ppr o a c h e d   w hi c h   i s   m e a n t   f o r   l o c a l i z i ng  a n c l a s s i f yi n o bj e c t s   w i t hi n   im a ge s .   Va r i o us   f r a m e wo r ks   l i ke   YO L O,   S S D,   a n f a s t e r   R - C NN   a r e   us e f o r   t hi s   pur po s e .   T h e s e   m o de l s   a r e   kn o wn   f o r   o f f e r i n r e a l - t i m e   de t e c t i o n   us i ng  YO L a l o n w i t h   de t e c t i o n   c a pa bil i t y   o f   m u l t i p le   o bj e c t s   a s a m e   t i m e ;   h o we v e r ,   t h e y   s u f f e r   f r o m   o v e r l a pp i ng  r e g i o n   o f   t e x p r o bl e m   a n de m a n d s   hi g he r   n u m be r   o f   l a be l l e da t a   f o r   tr a i ni ng.     3. 1. 3.   T e x t   r e c ogn it ion   an d   l oc al i z at ion   ap p r oac h e s   T a bl e   s h o wc a s e s   e s s e n t i a l   pr o pe r t i e s   o f   t hi s   m e t h o f r o m   e xi s t i n r e vi e we s t ud i e s .   T hi s   m e t h o i s   kn o w n   f o r   i t s   r o b us t   e x tr a c t i o n   pr o c e s s   o f   t e x t   a s   we l l   a s   i n t e r pr e t a t i n t h e m   o b t a i ne f r o m   i m a g e   s o u r c e .   T hi s   m o de l   pe r f o r m s   j o i n t   o pe r a t i o n   o f   e x t r a c t i o o f   t e x t ,   l o c a l i z a t i o n   o f   t e x t ua l   c o n t e n t ,   a n r e c o gni t i o n   o f   t e x t.   Va r i o us   a ppr o a c h e s   us e un de r   t hi s   m e t h o a r e   e f f i c i e n t   a n a c c ur a t e   s c e ne   t e x t   de t e c to r   ( E A S T ) ,   c h a r a c t e r   r e g i o n   a wa r e n e s s   f o r   t e x t   de t e c t i o n   ( C R AF T ) ,   T e x t B o x e s + + ,   t e s s e r a c t   OC R ,   c o n v o l ut i o n   R NN ,   a n d   a tt e n t i o n - b a s e s e que n c e - to - s e que n c e   t e x t   r e c o gn i t i o n   ( A S T E R ) .       T a bl e   3 .   S um m a r y   o f   e f f e c t i v e n e s s   o f   t e x r e c o gn i t i o n   a n l o c a l i z a t i o n   m o de l   A ppr o a c he s   P a pe r s   A dv a nt a ge   L im it a ti o ns   E A S T   [ 32]   R o bus t,  be tt e r  a c c ur a c y , s pe e d a nd a c c ur a c y   D o  n o p e r f or m t e x r e c o gni ti o n, p o s pr oc e s s in g i s  qui te  c ompl e x   C R A F T   [ 33]   V e r s a ti li t y , pr e c is e   c ha r a c te r - l e ve de te c ti o n   - do -   T e x t B oxe s + +   [ 34]   E nha nc e d l oc a li z a ti o n, mu lt i - s c a l e  d e t e c t i o n   I mpl e m e nt a ti o c o mpl e x it y , t r a in in c o mpl e x it y   T e s s e r a c O C R   [ 35]   S im pl e r  us a ge , s uppor ts  mul ti pl e  l a ngua ge o p e s o ur c e   L im it e d t o  t e x r e c o gni ti o n, i n c o ns is te nt   pe r f or ma nc e   C R N N   [ 36]   C o nt e x tu a in f o r ma ti o e x t r a c ti o n,  c a n ha ndl e   v a r y in g t e x s ha pe  a nd l e ngt h   C o mpl e x  t r a in in g a nd i mpl e m e nt a ti o n,  de ma nds  e x t e ns iv e  a nn o ta t e d t r a in in g da ta   A S T E R   [ 37]   A tt e nt i o n m e th o ds  i n c r e a s e  a c c ur a c y c a n   ha ndl e   v a r y in g t e x s ha pe  a nd l e ngt h   D e ma nds  a pr io r kn o w le dg e   f or  t uni ng,  r e s o ur c e   in te ns i ve       3. 1. 4.   E n d - to - e n d   ap p r oac h e s   T a bl e   s h o wc a s e s   pr o pe r t i e s   s t ud i e a f t e r   r e vi e w i n e xi s t i n i m p l e m e n t a t i o n   s c h e m e s   to wa r ds   t h e s e   e n d - to - e n a ppr o a c h e s .   T hi s   a ppr o a c h   c o n s is t s   o f   m a i n ly   t wo   c o r e   m e t h o T e x t Ne a n c o n ne c t i o ni s t   t e x pr o p o s a l   n e t wo r k   ( C T P N)   whi c h   i s   m e a n t   f o r   pe r f o r m   e x t r a c t i o n ,   de t e c t i o n ,   a n r e c o gni t i o n   o f   t h e   t e x t .   T e x t Ne e m p h a s i z e s   to wa r ds   b ot h   i de n t i f i c a t i o n   of   t e x t   f o l l o we by   r e c o gni t i o n   o f   t e x t   wi t h   l e s s e r   t r a i ni ng   o pe r a t i o n s   i nv o l v e i n   i t .   C T P N   i s   r e s po n s i b l e   f o r   y i e l d i ng  t e x pr o p o s a l s   a n t h e y   a r e   hi g hly   idea l   f o r   c o m p l e x   b a c kgr o un ds   w i t h   t e x t ua l   c o n t e n t s .   T e x tNe t ,   us i n C NN   a ppr o a c h ,   i s   s pe c i a l ly   u s e f o r   de t e c t i o n   o f   r e a l - t i m e   t e x t   a n do c u m e n t   a n a ly s i s   w hil e   C T P N,   us i n R NN ,   i s   us e f o r   di g i t i z a t i o n   o f   do c u m e n t   w i t c o m p l e x   f o r m   o f   l a y o ut s   a n de t e c t i o n   o f   s c e n e   t e x t .       T a bl e   4.   S um m a r y   o f   e f f e c t i v e n e s s   o f   e n d - to - e n a ppr o a c h e s   A ppr o a c he s   P a pe r s     A dv a nt a ge     L im it a ti o ns   T e x tN e t   [ 38]   A da pt a bl e , hi ghe r  a c c ur a c y uni f ie d a ppr o a c h   D e ma nds  hi ghe r   c o mput a ti o na r e s o ur c e s , de ma nds  e x t e ns i v e la be ll e d da ta   C T P N   [ 39]   E nd - to - e nd s o lu ti o n,  e f f e c ti ve   f or  mul ti pl e  t e x li n e s   T e di us  p o s pr oc e s s in g i s  r e qui r e d t o  e li mi na t e  n o n - t e x r e gi o a nd e x tr a c te xt , c o mpu ta ti o na ll y   in te ns i ve   f or  c o mp le x  s c e n e s         3. 1. 5.   T e m p or a l   c on s is t e n c ap p r oac h e s   T a bl e   hi g hli g h t s   t h e   c h a r a c t e r i s t i c   o f   t e m po r a l   c o n s i s t e n c y   a ppr o a c he s   n o t e f r o m   e xi s t i n s t ud i e s .   T hi s   a ppr o a c h   i s   s pe c i f i c a ll y   m e a n t   f o r   e x tr a c t i n tex t   f r o m   vi de o s   a s   we l l   a s   f r o m   i m a ge   s e que n c e s   tar ge t i n to  r e t a i n   e f f i c i e n t   l o c a l i z a t i o n   a n r e c o gni t i o n   o f   t e x t.   T hi s   a ppr o a c h   i s   m a i n ly   us e f o r   de t e c t i n li ve   t e x t   f r o m   vi de o   s t r e a m s   a n s c a nni ng  do c u m e n t   w i t h   c o n s i s t e n t   i n put .   T y p i c a l   m e t h o ds   us e f o r   t hi s   pur po s e   a r e   m o vi ng  a v e r a ge   f il t e r i n g,   K a lm a n   f il t e r i ng,   f r a me - by - f r a m e   m a t c hi ng,   s i m p l e   o nl i ne   a n r e a l t i m e   t r a c k i n g   ( S OR T ) ,   t e x t - r e i de n t i f i c a t i o n ,   a n m u l t i - f r a m e   f u s i o n .   T h e   pr a c t i c a l   c o ns i de r a t i o n   to wa r ds   t hi s   a ppr o a c h   i s   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i Vo l .   3 9 ,   N o .   1 ,   Ju ly   20 25 :   455 - 465   460   f r a m e r a t e ,   t e x t   m o v e m e n t ,   a n c o m put a t i o n a l   r e s o ur c e s .   Out   o f   va r i o us   v a r i a n t s   o f   t hi s   a ppr o a c h e s ,   t h e y   h a ve   b e e n   c a t e go r i z e m a i n ly   ba s e o n   t r a c ki n g - b a s e m e t h o a n o p t i c a l   f l o m e t h o ds   f o r   s i m p li f ica t i o n   in  t a x o n o m i e s   o f   l i t e r a t ur e s .   T h e   t r a c ki n g - b a s e m e t h o m a i n ly   u s e s   S OR T   m e t h o do l o g y   f o r   e m p ha s iz i n o m o v e m e n t   o f   e x t r a c t e r e gi o n   o f   t e x t   whi l e   o p t i c a l   f l o m e t h o i s   m e a n t   f o r   e v a l u a t i n m o t i o n   ve c to r   o f   t e x t ua l   o bj e c t   b e t we e n   s e que nc e s   o f   f r a m e s .   F a r n e b a c a l go r i t hm   a n L uc a s - K a n a de   a l go r i t hm   a r e   f r e que n t l a do p t e a ppr o a c h e s   f o r   o p t i c a l   f l o w - b a s e t e x t   e x tr a c t i o n .         T a bl e   5.   S um m a r y   o f   e f f e c t i v e n e s s   o f   t e m po r a l   c on s i s t e n c y   a ppr o a c h e s   A ppr o a c he s   P a pe r s   A dv a nt a ge     L im it a ti o ns   T r a c ki ng - ba s e me th o d   [ 40]   C a n ha ndl e  oc c lu s io n,  c o ns is te n c y  a c r o s s  f r a me s e nha nc e d a c c u r a c y   G r a dua d e v ia ti o of  t r a c k e d p o s it i o n,  de ma nds  o n p r e v i o us   d e t e c t i o n   O pt ic a F l o w   [ 41]   S uppor ts  mo t i o n e s ti ma ti o of  t e xt e x t r a c ts  l o w - le ve in f o r ma ti o n, d o e s n d e ma nd pr e v i o us   de t e c t i o n, s im pl i f i e d d e pl oy m e nt   H ig hl y  s e ns it i ve  t o  n o is e , l im it e d t o  s m oo th   mo ti o n, hi gh  r e s o lu ti o vi de o s  gi ve   in c r e a s e c o mput a ti o na c o mpl e x it y       3. 2.     E s s e n t ial   f in d in gs   of   s t u d y   F r o m   t h e   pr i o r   s e c t i o n ,   i t   h a s   b e e n   n o t e d   t h a t h e r e   a r e   5   di f f e r e n t   c l a s s e s   o f   m e t h o ds   us e f o r   t e x de t e c t i o n   a n l o c a l i z a t i o n .   I h a s   b e e n   a l s o   n ot e d   t h a e a c h   c l a s s   o f   m e t h o ds   h a v e   r e por t e o f   i t s   be n e f i c i a f e a t ur e s   a n li mi t a t i o n s   t oo.   H o we v e r ,   i t   i s   r e qu i r e to   a c qui r e   a n   o v e r a ll   p i c t ur e   o f   c ur r e n t   t r e n ds   o f   e xi s t i n g   m e t h o do l o g i e s   t h a t   c a n   o f f e r   a   pot e n t i a l   i ns i g h t   towa r ds   f r e qu e n t l y   a do pt e d   m e t h o ds .   I t   i s   a l s o   n e c e s s a r y   t c o n v e r ge   to   a   s pe c i f i c   po i n t   o f   o n - g o i n r e s e a r c h   i s s ue   e x t r a c t e a f t e r   r e vi e o f   e xi s t i n c l a s s e s   o f   t e x de t e c t i o n   a n l o c a l i z a t i o n   m e t h o ds .   T hi s   s e c t i o n   o f f e r s   hi g hli g h t   o f   e s s e n t i a l   f i nd i ngs   o f   s t ud y   w i t h   r e s pe c t   to  r e s e a r c h   t r e n vi s ua li z a t i o n   a n i de n t i f i c a t i o n   o f   r e s e a r c h   ga p.     3. 2. 1.   Re s e ar c h   t r e n d   I h a s   b e e n   n o t e t h a t h e r e   a r e   a ppr o x i m a t e l y   16 2, 301  publ i c a t i o n s   to wa r ds   t h e   a b o v e - m e n t i o n e d   f i ve   d i s c r e t e   c l a s s e s   o f   m e t h o do l o g i e s   o f   t e x t   e x tr a c t i o n   a n l o c a l i z a t i o n .   Only   t h e   pa pe r s   publi s he d   b e t we e 2019 - 2024  a v a i l a bl e   i n   I E E E   Xpl o r e ,   S pr i n ge r ,   a n M DPI   h a s   b e e n   o b s e r v e a n r e c o r de d .   Va r i o us   ot h e r   j o ur n a l s   a l s o   h a v e   b e e n   r e f e r r e to  wi t n e s s e ne a r l y   t h e   s im il a r   t r e n ds   o f   publi c a t i o n s .   F i g ur e s   2   to   s h o wc a s e s   t h e   gr a phi c a l   o ut c o m e s   o f   t h e s e   c l a s s e s   o f   m e t h o do l o g i e s .   I t   i s   n ot e t h a t   m a xim u m   pu bli c a t i o n   i s   n o t e f o r   f e a t ur e - b a s e m e t h o ds   ( n = 63, 862)   f o l lo we by   C N a ppr o a c h   ( n = 20, 567) ,   a n C T P m e t h o d   ( n = 20 , 571) .   T h e   l o we s t   c o un i s   o b s e r v e f o r   S l i d i ng  w i ndo m e t h o ds   ( n = 1)   whi l e   o t h e r   m e t h o ds   a r e   qu i t e   s c a t t e r e f r o m   c a r d i na li t y   o f   publi c a t i o n   vi e wpo i nt.   T h e r e   a r e   n o   publ i c a t i o n s   t o wa r ds   c o n n e c t e c om po n e n t   a n a ly s i s ,   T e x t Ne t,   a n A S T E R   m e t h o ds   wi t h   r e s pe c t   to  i m p l e m e n t a t i o n   pa pe r s .   S o m e   o f   t h e   e s s e n t i a l   f i nd i ngs   f r o m   t h e   r e s e a r c h   t r e n e xhi b i t s   w i t n e s s e f r o m   F i gur e s   2   to   6   a r e   a s   f o l l o ws i )   a do pt i o n   o f   de e l e a r ni ng  a ppr o a c h e s   [ C NN   ( n = 20 567) ,   R - C NN   ( n = 16544) ,   YO L ( n = 2513) ,   S S ( n = 396) ,   R NN   ( n = 6023) ,   L S T M   ( n = 9974) ,   a n tr a n s f o r m e r   ( n = 7173) ]   h a s   b e e n   o n   c o n s i s t e n t   r i s e ,     ii )   Al t h o ugh ,   t h e r e   a r e   l e s s   n u m be r   o f   r e c o r de w o r ks   f o r   t e m po r a l   c o n s i s t e n c y - b a s e a ppr o a c h e s ,   b ut   t h e y   a r e   n e x t   o n   r i s e   o f   a do pt i o n   a f t e r   de e l e a r ni ng - b a s e a ppr o a c h e s ,   i ii )   T h e   o v e r a ll   pu bli c a t i o n s   t r e n d s   to wa r ds   t e x t   r e c o gni t i o n   a n l o c a li z a t i o n   m e t h o ds   a r e   qui t e   l e s s   i n   c o n t r a s t   to  ot h e r   m e t h o ds   e v e n   b e a r in s o m e   pot e n t i a l   a d v a n t a ge o us   f e a t ur e s   to wa r ds   t e x e x t r a c t i o n.           F i gur e   2.   T r e n ds   o f   c o m put e r   vi s i o n   m e t h o ds   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       C or e   me thodol ogical  c las s e s   of   tex e x tr ac ti on  and   localiz ati on -   ( Day ananda  K odala  J ay ar am )   461       F i gur e   3.   T r e n ds   o f   l e a r ni ng - b a s e m e t h o ds           F i gur e   4.   T r e n ds   o f   t e x t   r e c o gni t i o n   a n l o c a li z a t i o n   m e t h o ds           F i gur e   5.   T r e n ds   o f   e n d - to - e n m e t h o ds     Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i Vo l .   3 9 ,   N o .   1 ,   Ju ly   20 25 :   455 - 465   462       F i gur e   6.   T r e n ds   o f   t e m po r a l   c o n s i s t e n c y   m e t h o ds       3. 2. 2.   Re s e ar c h   gap   T h e   i de n t i f i e r e s e a r c h   ga o b t a i n e a f t e r   r e vi e w i n t h e   e xi s t i n c l a s s e s   o f   m e t h o do l o g i e s   to wa r ds   t e x e x t r a c t i o n   a n l o c a l i z a t i o n   a r e   a s   f o l l o w s i )   e xi s t i n r e s e a r c h   m o de l s   e nc o un t e r s   s i g nif i c a n t   c h a ll e n ge s   whil e   e x t r a c t i n g   t e x t ua l   c o n t e n t s   f r o m   do c u m e n t s   c h a r a c t e r i z e by   c o m p l e x   ba c kgr o un a n l a yo u t s .   i i )   T h e r e   a r e   l e s s e r   r e p o r t i n o f   s t ud y   m o de l   c o n s i d e r i n c o m p l e x   f o r m   o f   do c um e n t   ( i n   f o r m   o f   d i s t o r t i o n   or   l o w - r e s o l ut i o n )   f o r   t e x e x tr a c t i o n   l e a d i ng  to  s ub - opt i m a l   a c c ur a c y   p e r f o r m a n c e .   i i i )   T h e r e   a r e   f e a l go r i t hm   whi c h   c l a im s   o f   f a s t e r   a n li g h t we i g h t   o pe r a t i o n   c o n s i de r i ng  pr a c t i c a l   e nvi r o nm e n t   e i t he r   to wa r ds   l o c a li z a t i o n   o r   to wa r ds   e x tr a c t i o n   o f   t e x t .   i v )   E xi s t i ng  s y s t e m   h a s   n o wi t n e s s e w i t h   a ny   s o l ut i o n   wh e r e   t e x ex t r a c t i o n   pr o c e s s   i s   i n t e gr a t e d   wi t h   s e m a n t i c s   f o r   b e tt e r   l o c a l i z a t i o n   a c c ur a c y .   v )   A l t h o ugh   th e r e   a r e   a l go r i t hm   r e po r t e to   o v e r c o m e   t e x t   e x t r a c t i o n   i s s ue s   f r o m   n a t ur a l   s c e n e s ,   b ut   t h e y   a r e   a s s o c i a t e w i t i nc r e a s e c o m put a t i o n a l   b ur de n .   vi )   E xi s t i n s y s t e m   h a v e   l e s s   n u m be r   o f   b e n c hm a r ke m o de l s   c o n s i d e r i n g   v a r yi ng  t e s e n vi r o nm e n t   to   p r o v e   i t s   a pp l i c a bil i t y   o n   n e a r   r e a l   wo r l a pp li c a t i o n s .       3. 3.     Dis c u s s ion   T h e   o u t c o m e s   o f   t hi s   s t ud y   pr o vi d e   c r i t i c a l   i ns i g h t s   i n t t h e   v a r i o us   a ppr o a c h e s   us e f o r   t e x i de n t i f i c a t i o n   a n l o c a li z a t i o n   a c r o s s   m u l t im e d i a   s o ur c e s .   T h e   da t a   s h o ws   a   c l e a r   t r e n o f   r i s i ng  us a ge   o f   de e l e a r ni ng - b a s e s y s t e m s ,   s uc h   a s   C NN s   a n r e g i o n - b a s e C NN s   ( R - C NN s ) ,   due   to   t h e i r   i m pr o v e t e x t   r e c o gni t i o n   a c c ur a c y .   A   c r uc i a l   p i e c e   o f   s uppo r t i n e vi de n c e   i s   t he   o b s e r v e i nc r e a s e   i pu bli c a t i o n s   a b o ut  C NN - b a s e m o de l s ,   wi t h   o v e r   20 , 000   s t udi e s   publi s he b e t we e n   2019  a n 2024.   T h e s e   de e l e a r ni ng  m o de l s   e x c e l   a t   h a n d li ng  c o m p li c a t e t e x t   r e c o gni t i o n   pr obl e m s ,   o v e r c o m i ng  m a ny   o f   t h e   l im i t s   f a c e by   t r a d i t i o n a l   m e t h o ds   l i ke   e dge   de t e c t i o n   a n c o nn e c t e c o m p o n e n t   a n a ly s i s ,   w hi c h   a r e   c o m put a t i o n a ll y   m o r e   c o s t l y   a n d   l e s s   r e s i s t a n t   i n   n o i s y   s i t ua t i o ns .   W h e n   c o m pa r e to   pa s t   s t udi e s ,   t h e   f i nd i ngs   o f   t hi s   s t ud y   a r e   c o n s i s t e n t   w i t h   t h e   pa tt e r n s   hi g hli g h t e i n   o t h e r   wor ks   t h a t   e m p h a s i z e   t h e   do mi na n c e   o f   m a c hi ne   l e a r ni ng  a n de e l e a r ni ng  m o de l s   i n   t e x t   e x t r a c t i o n   t a s ks .   Ho we v e r ,   i t   a l s o   n o t e s   s o m e   ga ps   i n   t h e   c ur r e n t   l i t e r a t ur e ,   pa r t i c u l a r ly   i m e t ho ds   s uc a s   t e m po r a l   c o n s i s t e n c y   a ppr o a c he s ,   whi c h   h a v e   r e c e i v e l i t t l e   r e s e a r c h   a t t e n t i o n   de s p i t e   t h e i r   e x pa n d i ng   im po r t a n c e   i n   vi de o   a n s e que n c e - ba s e t e x t   de t e c t i o n .   T h e   s t ud y s   m e r i t s   i n c l ude   i t s   e x t e n s i ve   a na l y s i s   o f   v a r i o us   a ppr o a c h e s   a n de t a i l e c a t e g o r i z a t i o n   o f   pr o c e dur e s .   H o we v e r ,   o n e   r e s t r i c t i o n   i s   t h e   l i t t l e   e m p h a s i s   o n   t h e   i n t e gr a t i o n   o f   s e m a n t i c   un de r s t a n d i ng  i n t tex t   l o c a l i z a t i o n ,   whi c h   m i g h t   p ot e n t i a ll y   im pr o v e   a c c ur a c y   e v e n   m o r e .   F ur t h e r m o r e ,   whi l e   t h e   s t udy   hi g hli gh t s   s i g nif i c a n t   a dv a n c e m e n t s   i n   t e x t   de t e c t i o n ,   i t   a l s o   un c o v e r s   t h e   s ur pr i s i ng  f i n d i n t h a t   t h e   n u m b e r   of   pu bli c a t i o n s   i n   t e x r e c o gni t i o n   a n l o c a li z a t i o n   i s   l o we r   c o m pa r e t ot h e r   m e t h o ds ,   s ugge s t i n a   pot e n t i a l   un de r r e pr e s e n t a t i o n   o f   t hi s   a r e a   i n   o n go i n r e s e a r c h .   I n   c o n c l us i o n ,   t h e   pur p o s e   o f   t hi s   s t udy   wa s   to  pr o vi de   a n   i n - de pt h   a s s e s s m e n t   o f   c ur r e n tr e n ds   i t e x i de n t i f i c a t i o n   a n l o c a l i z a t i o n   t e c h n o l o g i e s ,   a s   we l l   a s   i m po r t a n t   i n s i g h t s   i n t t h e i r   e f f e c t i v e n e s s   a n d   li mi t a t i o ns .   T h e   s t ud y s   s i g nif i c a n c e   s t e m s   f r o m   i t s   c a pa c i t y   t o   c o m bi ne   d i ve r s e   m e t h o do l o g i e s   a n i de n t i f y   to pi c s   f o r   f ur t h e r   r e s e a r c h ,   pa r t i c u l a r ly   i n   r e s o l vi n t h e   c o n s t r a i n t s   o f   c o m p l e x   b a c kgr o un ds ,   l o w - r e s o l ut i o t e x t,   a n r e a l - t i m e   a pp li c a t i o n   c o n t e x t s .   Un a ns we r e que s t i o n s   i n c l ude   h o to  f ur t h e r   m i n i mi z e   pr o c e s s i n g   o v e r h e a w hil e   b o o s t i n a c c ur a c y ,   a s   we ll   a s   h o to   i nc l ude   c o n t e x t ua l   a n s e m a n t i c   un d e r s t a n d i ng  i n t o   t e x i de n t i f i c a t i o n   s y s t e m s .   F ut ur e   s t udy   s h o u l l o o k   i n t l i g h t we i g h t   m o de l s   f o r   pr a c t i c a l   a pp li c a t i o n s ,   m o r e   r o b us m e t h o ds   f o r   a   v a r i e t y   o f   r e a l - wo r l s e tt i ngs ,   a n t h e   us e   o f   m u l t im o da l   da t a   to  i m pr o v e   t e x l o c a li z a t i o n   a c r o s s   s e v e r a l   m e d i a   t y pe s .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2502 - 4752       C or e   me thodol ogical  c las s e s   of   tex e x tr ac ti on  and   localiz ati on -   ( Day ananda  K odala  J ay ar am )   463   4.   CONC L USI ON   T hi s   s t ud y   l o o ke d   a t   t h e   v a r i o us   a ppr o a c h e s   f o r   t e x de t e c t i o n   a n l o c a l i z a t i o n   i n   m u l t im e d i a ,   e m p h a s i z i ng  t h e i r   i m po r t a n c e   i n   a pp l i c a t i o ns   l i ke   a u to m a t i c   s u b t i t l e s ,   vi d e o   i n d e xi ng,   a n c o n t e n t   a n a ly s i s .   T h e   s t ud y   s t r e s s e s   t h e   gr o wi n i m po r t a n c e   o f   de e l e a r ni ng - ba s e m e t h o ds   s uc h   a s   C NN s   a n R - C NN s ,   whi c h   pr o vi d e   m o r e   a c c ur a c y   a n a d a pt a bi li t y   i a   v a r i e t y   o f   t e x t   r e c o gni t i o n   t a s ks .   W hi l e   s o m e   m a y   a r gue   t h a t   c l a s s i c a l   m e t h o ds   r e m a i r e l e v a n t   b e c a us e   t o   t h e i r   l o we r   c o m put a t i o n a l   r e qu i r e m e n t s ,   de e l e a r ni ng   m e t h o do l o g i e s   i m pr o v e pe r f o r m a n c e   a n s c a l a bil i t y   m a ke   a   c o m p e l li ng  c a s e   f o r   wi de r   a do p t i o n .   T h e   pa pe r   c o n t r i b ut e s   to wa r ds   t h e   f o l l o w i ng  n o v e l t i e s   vi z .   T h e   m a n us c r i pt   pr e s e n t s   c a t e gor i e s   o f   m e t h o d o l o g i c a c l a s s e s   o f   t e x t   e x t r a c t i o n   ( c o m put e r   vi s i o n   m e t h o ds ,   l e a r ni ng - b a s e a ppr o a c h e s ,   t e x t   r e c o gni t i o n   a n l o c a li z a t i o n   a ppr o a c he s ,   e n d - to - e n a ppr o a c h e s ,   t e m po r a l   c o n s i s t e n c y   a ppr o a c h e s )   t h a t   h a s   n o t   b e e n   r e por t e b e f o r e   i n   a ny   pr i o r   r e vi e wo r k s ;   t h e r e by   o f f e r i ng  a   c o m pa c t   s n a p s h o o f   m e t h o ds .   T h e   r e vi e h a s   s t ud i e 22   i nd i v i dua l   m e t h o do l o g i e s   b e l o n g i ng  to  e a c h   o f   t h e   a b o v e - m e n t i o n e f i ve   m e t h o do l o g i c a l   c l a s s e s   i o r de r   to  un de r s t a n i t s   pot e n t i a l   s t r e n gt h   a n we a kne s s .   T h e   r e vi e wo r c o n tr i b ut e s   to wa r ds   a   s i m p li f i e a n n o v e t r e n a n a l y s i s   o f   e xi s t i n s y s t e m   to  f i n i n c r e a s i n n u m b e r   o f   s o phi s t i c a t e a ppr o a c h e s   ( e . g. ,   l e a r nin b a s e a ppr o a c h e s   a n t e m po r a l   c o n s i s t e n c y   a ppr o a c he s )   whi l e   l e s s   i nn o v a t i o n   h a s   b e e n   y e t   w i t n e s s e f o r   m o r e   s i m p li f i e d   s c h e m e s   to wa r ds   t e x e x t r a c t i o n .   T h e   pa pe r   f i n a ll y   c o n t r i b ut e s   to wa r ds   e x p l i c i t ly   iden t i f i e d   upda t e r e s e a r c h   ga b a s e o n   l a s t   y e a r s   s t ud y   m o de l s .   T h e   f ut ur e   w o r wi l l   b e   o r i e n t e to wa r ds   pr e s e n t i n g   a   s i m p li f i e c o m put a t i o n a l   m o de l   t o wa r ds   a ddr e s s i ng  t h e   i d e n t i f i e r e s e a r c h   ga f o r   e v o l vi n mo r e   c o s t - e f f e c t i v e   t e x t   e x t r a c t i o n   a n l o c a li z a t i o n   a ppr o a c h e s .       F UN DI NG  I N F ORM AT I ON   A ut h o r s   s t a t e   n f u n d i ng  i nv o l v e d.       AU T HO CONT RI B UT I ONS   S T AT E M E NT     Nam e   of   Aut h or   C   M   So   Va   Fo   I   R   D   O   E   Vi   Su   P   Fu   Da y a na n K o da l a   J a y a r a m                               P utt e g o wda   De v e go wda                                   CONF L I CT   OF   I NT E RE S T   S T AT E M E NT   A ut h o r s   s t a t e   n c o nf li c t   o f   i n t e r e s t .       DA T AV AI L AB I L I T Y   Da t a   a v a i l a bil i t y   i s   n o a ppl i c a bl e   to   t hi s   pa pe r   a s   n o   n e da t a   we r e   c r e a t e or   a n a l y z e i n   t hi s   s t udy .       RE F E R E NC E S   [ 1]   B H a s h e mz a d e a nd  M A bdo lr a z z a gh - N e z ha d,  I mpr ovi ng  ke y w o r e x tr a c ti o in   mul ti li ngua t e x ts ,”   I nt e r nat io nal     J our nal   of   E le c tr ic al   and  C om put e r   E ngi ne e r in g   ( I J E C E ) vo l.   10,  n o 6,   pp.  5909 5916,  D e c 2020,  do i:   10.11591/i je c e . v 10i 6.pp5909 - 5916.   [ 2]   R M J a y a nt a nd  M K a pa na ia h,  D o m in a ti ng  s e ba s e a r bi tr a r y   o r ie nt e bi li ngua s c e ne   te xt   l oc a li z a ti o n,”   I nt e r nat io nal   J our nal   o f   E le c tr ic al   and  C om put e r   E ngi ne e r in g   ( I J E C E ) vo l.   12,  n o 4,  pp.  3730 3738,  A ug.  2022,  do i:   10.11591/i je c e . v 12i 4.pp3730 - 3738.   [ 3]   S V M a ha de v ka r S .   P a ti l,   K K o t e c ha L W S oo ng,  a nd  T .   C ho udhu r y E x pl o r in A I - dr i ve a ppr o a c he s   f or   uns tr u c t ur e doc um e nt  a na l y s is  a nd  f ut ur e  h o r i z o ns ,”   J our nal  of  B ig  D at a , v o l.  11, n o . 1, p. 92, J ul . 2024, d o i:  10.1186/s 40537 - 024 - 00948 - z.   [ 4]   G L ia o Z . Z hu, Y.  B a i,   T L iu , a nd  Z . X ie ,  “ P S E N e t - ba s e e f f i c i e nt  s c e n e  t e x d e te c ti o n,”   E ur as ip  J our nal  on A dv anc e s  i n Si g nal   P r oc e s s in g , vo l.  2021, n o . 1, p. 97, D e c . 2021, d o i:  10.1186 /s 13634 - 021 - 00808 - 5.   [ 5]   K I b r a hi m,  U s in A I - ba s e de t e c t o r s   t o   c o nt r o A I - a s s is te pl a gi a r is in   E S L   w r it in g:   T he   T e r mi na t o r   V e r s us   th e   M a c hi ne s , ”  L anguage  T e s ti ng i n A s ia , vo l.  13, n o . 1, p. 46, O c t.  2023, d o i:   10.1186/s 40468 - 023 - 00260 - 2.   [ 6]   D C a o Y Z ho ng,  L W a ng,  Y H e a nd  J D a ng,   S c e ne   t e x de t e c t i o in   na tu r a im a ge s a   r e v i e w ,”   Sy m m e tr y ,   v o l.   12,  no 12,   pp. 1 26, Nov . 2020, d o i:  10.3390/s y m12121956.   [ 7]   A G a s pa r e tt o M M a r c uz z o A Z a nga r i,   a nd  A A lb a r e ll i,   S ur ve y   o n   te x c la s s if i c a ti o a lg o r it hms f r o t e x t o   pr e d ic t i ons ,   I nf or m at io n ( Sw it z e r la n d) , vo l.  13, n o . 2, p. 83, F e b. 2022, d o i:   10.3390/i n f o 13020083.   [ 8]   Y Y a ng,  Z W u,  Y Y a ng,  S L ia n,  F .   G u o ,   a nd  Z W a ng,  A   s ur ve y   of   in f or ma ti o e x t r a c ti o ba s e d   o d e e le a r n in g,”   A pp li e d   Sc ie nc e s  ( Sw it z e r la nd) , v o l.  12, n o . 19, 2022, d o i 10.3390/a pp 12199691.   [ 9]   W A l k e ndi F G e c h te r L H e y b e r g e r a nd  C G u y e u x A dv a nc e m e nt s   a nd   c ha ll e ng e s   in   ha ndw r it te t e x r e c o gni ti o n:   a   c o mpr e h e ns iv e  s ur ve y ,”   J our nal  of  I m agi ng , v ol . 10, n o . 1, p. 1 8, J a n. 2024, do i:  10.3390/j im a gi ng10010018.     Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2502 - 4752   I n do n e s i a n   J   E l e c   E n &   C o m S c i Vo l .   3 9 ,   N o .   1 ,   Ju ly   20 25 :   455 - 465   464   [ 10]   P J ia ng  a nd   X C a i,   A   s ur v e y   of   t e x t - ma t c hi ng  t e c hni que s ,”   I nf or m at io ( Sw it z e r la nd) v ol 15,  no 6,  p.  332,  J un.  2024,  do i:   10.3390/i n f o 15060332.   [ 11]   I M a la s hi n,  I M a s ic h,  V T y n c h e nk o A G a nt im ur ov V N e l yub,  a nd  A B o r o dul in I ma g e   t e x e x tr a c ti o a nd  na tu r a la ngu a ge   pr oc e s s in of   uns tr uc tu r e da ta   f r o m e di c a r e p or ts ,”   M ac hi ne   L e ar ni ng  and  K now le dge   E x tr ac ti on v o l.   6,  no.  2,     pp. 1361 1377, J un. 2024, do i:  10.3390/m a k e 6020064.   [ 12]   N . A . R e hma n a nd F H a r oo n, “ A da pt iv e   ga us s ia n a nd do ubl e  t hr e s h o ld i ng  f or   c o nt o ur  d e t e c ti o n a nd c ha r a c t e r   r e c o gni ti o n   of  t w o - di me ns i o na a r e a  us in c o mput e r   v is i o n   †,”   E ngi ne e r in P r oc e e di ngs , v ol . 32, n o . 1, 2023, d o i:  10.3390/ e ngpr oc 2023032023.   [ 13]   M U ma ir   e t   al . A   mul ti - la y e r   ho li s ti c   a ppr o a c f o r   c u r s iv e   te x r e c o gni ti o n,”   A ppl ie Sc ie nc e s   ( Sw it z e r la nd) v o l.   12,  no .   24,     p. 12652, De c . 2022, d oi 10.3390/a pp122412652.   [ 14]   A M ir z a O Z e s ha n,  M A ti f a nd  I S id di qi D e t e c ti o a nd  r e c o gni ti o of   c ur s i ve   te x f r o v id e o   f r a me s ,”   E ur as ip   J our na on  I m age  and V id e o   P r oc e s s in g , v o l.  2020, n o . 1, p. 34, D e c . 2020 , do i:  10.1186/s 13640 - 020 - 00523 - 5.   [ 15]   J D ia z - E s c o ba r   a nd  V K o be r N a tu r a s c e n e   te x d e t e c ti o a nd  s e gme nt a ti o us in pha s e - ba s e r e gi o ns   a nd  c ha r a c te r   r e tr i e va l,   M at he m at ic al   P r obl e m s  i n E ngi ne e r in g v o l.  2020, pp. 1 17, J u n. 2020, do i:  10.1155/2020/ 7067251.   [ 16]   A D r o b y ,   B K .   B a r a ka t,   R A la a s a m,  B M a di I R a ba e v a nd  J E l - S a na T e x t   li n e   e x tr a c ti o in   hi s t o r i c a d oc um e nt s   u s in g   m a s k R - C N N ,”   Si gnal s , v ol . 3, n o . 3, pp. 535 549, Aug. 2022, do i:  1 0.3390/s ig na ls 3030032.   [ 17]   M I br a y im Y L i,   a nd  A H a mdul la S c e n e   t e x d e t e c t i o ba s e o tw o - br a n c f e a tu r e   e xt r a c t i o n,”   Se ns or s ,   v ol 22,  no 16,    p. 6262, Aug. 2022,  do i:  10.3390/s 22166262.   [ 18]   T C P ha n,  A C .   P ha n,  H P C a o a nd   T N T r ie u,  C o n te n t - ba s e v id e o   bi da ta   r e tr i e v a w it e xt e ns i ve   f e a tu r e s   a nd  de e le a r ni ng,”   A ppl ie d Sc ie nc e s  ( Sw it z e r la nd) , vol . 12, n o . 13, p. 67 53, J ul . 2022, do i:  10.3390/app121367 53.   [ 19]   B K i m,  Y Y a ng,  J S P a r k,  a nd  H J J a ng,  A   c o n vo lu ti on  ne ur a ne tw or k - ba s e r e pr e s e nt a ti ve   s pa ti o - t e mp o r a d oc um e nt s   c la s s if i c a ti o f or  bi g t e x da ta ,”   A ppl ie d Sc ie nc e s  ( Sw it z e r la nd) , vo l.  12, n o . 8, p. 3843, Apr . 2022, d o i 10.3390/a pp12083843.   [ 20]   A R a w a t,   M A W a ni M E lAf f e ndi ,   A S I mr a n,  Z .   K a s tr a ti a nd  S M D a udpota D r ug  a d v e r s e   e ve nt   d e t e c ti o us in t e x t - ba s e c o n vo lu ti o na n e ur a ne twor ks   ( T e x tC N N )   t e c hni qu e ,”   E le c tr oni c s   ( Sw it z e r la nd) vo l.   11,  no 20,  p.  3336,  O c t.   2022,   do i:   10.3390/e l e c tr o ni c s 11203336.   [ 21]   A . S a y e e d, J S hi n, M . A .  M . H a s a n, A . Y .  S r i z o n,  a nd M . M H a s a n, “ B e nga li N e t:   a   l o w - c o s n ove l  c o n vol ut i o na n e ur a l  ne t w o r k   f or   be nga li   ha ndw r it te c ha r a c t e r s   r e c o gni t i o n,”   A ppl ie Sc ie nc e s   ( Sw it z e r la nd) v ol 11,  no 15,  p.  6845,  J ul 2021,  do i:   10.3390/a pp11156845.   [ 22]   P P r e e th a nd  H R M a ma th a R e gi o n - ba s e c o n vo lu ti o n a ne ur a n e tw o r f or   s e gm e nt in t e x in   e pi g r a phi c a i ma g e s ,”   A r ti f ic ia I nt e ll ig e nc e  and A ppl ic at io ns , v ol . 1, n o . 2, pp. 119 1 27, S e p. 2022, d o i:  10.47852/b o n v i e w a ia 2202293.   [ 23]   Y .   W u ,   Y .   H u ,   a n d   S .   M i a o,   O b j e c t   d e t e c t i on   b a s e d   h a n d w r i t i n g   l o c a l i z a t i on ,   i n   L e c t u r e   N o t e s   i n   C o m p u t e r   S c i e n c e   ( i n c l u d i n g   s u b s e r i e s   L e c t u r e   N o t e s   i n   A r t i f i c i a l   I n t e l l i g e n c e   a n d   L e c t u r e   N o t e s   i n   B i o i n f o r m a t i c s ) ,   v ol .   1 2 9 1 7   L N C S ,   2021, pp. 225 239.   [ 24]   X W a ng,  S Z he ng,  C Z ha ng,  R L i,   a nd  L G ui R - y ol o a   r e a l - ti me   t e x d e t e c t o r   f or   na tu r a s c e n e s   w it a r bi tr a r y   r o ta ti on,”   Se ns or s  ( Sw it z e r la nd) , vo l.  21, n o . 3, pp. 1 21, J a n. 2021, doi:   10.3390/s 21030888.   [ 25]   H S un,  C T a n,  S P a ng,  H W a ng,  a nd  B H ua ng,  R A - Y O L O v 8:   a im pr o ve Y O L O v s e a t e x de t e c ti o m e th o d,”   E le c tr oni c s   ( Sw it z e r la nd) vo l.  13, n o . 15, p. 3001, J ul . 2024, do i 10.3390/ e l e c t r o ni c s 13153001.   [ 26]   J R y a nd  S K im C hi ne s e   c ha r a c t e r   b oxe s s in gl e   s ho de t e c t o r   ne tw or f o r   C hi ne s e   c ha r a c te r   de t e c ti o n,”   A ppl ie Sc ie nc e s   ( Sw it z e r la nd) vo l.  9, n o . 2, p. 315, J a n. 2019, do i:  10.3390/app 9020315.   [ 27]   S Q u,  K H ua ng,  A H us s a in a nd  Y G o ul e r ma s A   mul ti pa th   f us i o s tr a t e g y   ba s e s in gl e   s h o de te c t or ,”   Se ns or s   ( Sw it z e r la nd) vo l.  21, n o . 4, pp. 1 16, F e b. 2021, d o i:  10.339 0/ s 21041360.   [ 28]   D O la ni y a n,  R O O gundo kun,  O P B e r na r d,  J O la ni y a n,  R M a s ke li ūna s a nd  H B A ka nde U ti li z in a n   a tt e nt i o n - b a s e L S T M   m o d e f or   d e t e c ti ng  s a r c a s a nd  ir o n y   in   s o c ia me di a ,”   C om put e r s vo l.   12,  n o 11,   p.  231,  N ov 2023,   do i:   10. 3390/c o mput e r s 12110231.   [ 29]   A A ma na e al . D e e p   l e a r ni ng  f or   d e pr e s s io d e t e c ti o f r om  te x tu a da ta ,”   E le c tr oni c s   ( Sw it z e r la nd) vol 11,  n o 5,  p.  676,  F e b. 2022, d o i:  10.3390/ e l e c tr o ni c s 11050676.   [ 30]   J L im I S a H S A hn,  N G a s te ig e r S J L e e a nd  B M a c d ona ld S ubs e nt e nc e   e x tr a c ti o f r o t e x us in c ove r a ge - ba s e de e le a r ni ng l a ngua ge   m o de ls ,”   Se ns or s , v o l.  21, n o . 8, p. 2712, Ap r . 2021, do i 10.3390/s 21082712.   [ 31]   Y M a   e al . S T E F a   s w i tr a ns f o r m e r - ba s e e nha n c e f e a tu r e   p y r a mi f us io m o de l   f o r   d o ngba   c ha r a c te r   d e te c ti o n,”   H e r it age   Sc ie nc e , v o l.  12, n o . 1, p. 206, J un. 2024, d o i:  10.1186/s 40494 - 024 - 01321 - 2.   [ 32]   M L u,  Y M o u,  C L C he n,  a nd  Q T a ng,  A e f f i c ie n te x de t e c t i o mo d e l   f or   s tr e e s ig ns ,”   A ppl ie Sc ie nc e s   ( Sw it z e r la nd)   vo l.  11, n o . 13, p. 5962, J un. 2021, d o i:  10.3390/app111359 62.   [ 33]   Y B a e k,  B L e e D H a n,  S Y un,  a nd  H L e e C ha r a c te r   r e gi on  a w a r e ne s s   f o r   t e x d e te c ti o n,”   in   2019  I E E E /C V F   C onf e r e nc e   on   C om put e r  V is io n and P at te r n R e c ogni ti on ( C V P R ) , J un. 2019,  vo l.  2019 - J un e , pp. 9357 9366, d o i:  10.1109/C V P R .2019.0095 9.   [ 34]   M L ia o B S hi a nd  X B a i,   T e xt B oxe s + + a   s in gl e - s ho or ie nt e s c e n e   t e x d e te c t or ,”   I E E E   T r ans ac ti ons   on  I m age   P r oc e s s in g vo l.  27, n o . 8 , pp. 3676 3690, Aug. 2018, d o i:  10.1109/ T I P .201 8.2825107.   [ 35]   D S po r i c i,   E C ni r a nd  C . - A B o ia ngi u,  I mpr ovi ng  th e   a c c ur a c y   of   t e s s e r a c 4.0  O C R   e ngi ne   us in c o n vol ut i o n - b a s e pr e pr oc e s s i ng,”   Sy m m e tr y , v o l.  12, n o . 5, p. 715, M a y  2020, d o i 10.3390/ s y m12050715.   [ 36]   Y L iu Y W a ng,  a nd  H .   S hi A   c o n vo lu ti o na l   r e c ur r e nt   n e ur a l - n e tw o r k - ba s e ma c hi n e   l e a r ni ng  f or   s c e n e   te xt   r e c o gni ti o n   a ppl i c a ti o n,”   Sy m m e tr y , v o l.  15, n o . 4, p. 849, Ap r . 2023, d o i:  1 0.3390/s y m15040849.   [ 37]   Y L i,   M D u,  a nd  S H e A tt e nt i o n - ba s e s e que n c e - to - s e qu e n c e   m o d e f or   ti m e   s e r i e s   im put a ti o n,”   E nt r opy vo l.   24,  n o .   12,     p. 1798, De c . 2022, d oi 10.3390/e 24121798.   [ 38]   Y S un,  C Z ha ng,  Z H ua ng,  J L iu J H a n,  a nd  E D in g,  T e x tN e t:   ir r e gu la r   te x r e a di ng  f r o im a ge s   w it a n   e nd - to - e nd  tr a in a bl e  n e t w o r k,”  i L e c tu r e  N ot e s  i n C om put e r  S c ie nc e  ( in c l udi ng s ubs e r i e s  L e c tu r e  N ot e s  i n A r ti f ic ia I nt e ll ig e nc e  and L e c tu r e   N ot e s  i n B io in f or m at ic s ) , v o l.  11363  L N C S , 2019, pp. 83 99.   [ 39]   H X u,  Y H e X L i,   X H u,  C H a o a nd  B J ia ng J o in s ubt it le   e x tr a c ti o a nd  f r a m e   in pa in ti ng  f o r   v id e o s   w it bur ne d - in   s ub ti tl e s ,”   I nf or m at io n , v o l.  12, n o . 6, p. 233, M a y  2021, d o i:  1 0.3390/i n f o 12060233.   [ 40]   H L iu V id e o   t e x tr a c k in f o r   d e ns e   a nd  s ma ll   te x ba s e o n   pp - y o l oe - r   a nd  s o r a lg o r i th m,”   ar X iv   pr e pr in ar X iv : 2304.00 018 2023, [ O nl in e ] . A v a il a bl e ht tp s :/ /a r x i v . or g/ a bs /2 304.00018% 0 A ht tp s :/ /a r x i v . or g/ pd f /2 304.00018.   [ 41]   Y Z ha o W W u,  Z .   L i,   J L i,   a nd  W W a ng,  F lo w T e x t:   s y nt he s iz in r e a li s ti c   s c e n e   t e x v id e o   w it o pt ic a f l o w   e s ti ma ti o n ,”   in   2023  I E E E   I nt e r nat io nal   C onf e r e nc e   on  M ul ti m e di and  E x po  ( I C M E ) J ul 2023,  vo l.   2023 - J ul y pp.  1517 1522,   do i:   10.1109/I C M E 55011.2023.00262.       Evaluation Warning : The document was created with Spire.PDF for Python.