I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   40 ,   N o .   2 N o v e m b e r   2025 ,   pp.   9 53 ~ 9 67   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 40 .i 2 . pp 9 53 - 9 67             953     Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   Im a g e   r e c o g n i t i o n   u si n g   d e e p   l e a r n i n g :   a   r e v i e w       O s am M .   H as s an A s h r af   A .   G o u d a ,   M o h am m e d   A b d e l   R az e k   D e p a rt m e n t   o M a t h e m a t i c s   a n d   C o m p u t e S c i e n c e ,   F a c u l t y   o f   S c i e n c e ,   A l - A z h a U n i v e r s i t y ,   N a s Ci t y ,   E g y p t       A r ti c l e   I n fo     A B S TR A C T   Ar t i c l e   h i s t or y :   R e c e i v e d   S e p   5 20 24   R e v i s e A ug   9 2025   A c c e pt e O c t   14 2 025       T hi s   pa pe r   p r e s e n t s   a   c o m pr e he ns i v e   r e v i e w   o f   r e c e nt   a dv a nc e m e nt s   i n   i m a g e   r e c o g ni t i o n,   w i t h   a   f o c us   o de e p   l e a r n i ng   ( D L )   t e c hni que s .   C o nvo l ut i o na l   ne ur a l   ne t w o r ks   ( C N N s ) ,   i p a r t i c ul a r ,   ha v e   s i g ni f i c a nt l y   t r a ns f o r m e t h i s   do m a i n,   e n a bl i ng   s u bs t a n t i a l   i m p r o v e m e nt s   i bo t h   a c c ur a c y   a nd  e f f i c i e nc y   a c r o s s   di v e r s e   a p pl i c a t i o ns .   T he   r e v i e w   e xp l o r e s   s t a t e - of - t he - a r t   m e t ho ds ,   h i g hl i g ht i ng   t h e i r   p r a c t i c a l   i m pl e m e n t a t i o ns   a nd  t he   pr o g r e s s   a c hi e v e d .   I t   a l s o   a d dr e s s e s   ke y   c ha l l e ng e s   s uc a s   d a t a   s c a r c i t y   a nd   m o de l   i nt e r p r e t a b i l i t y ,   o f f e r i ng   pe r s p e c t i v e s   o e m e r g i ng   o ppo r t u ni t i e s   a nd   f ut ur e   d i r e c t i o ns .   B y   s y nt he s i z i ng   c ur r e n t   t r e nd s   w i t h   f o r w a r d - l o o ki ng  i ns i g ht s ,   t he   p a pe r   a i m s   t o   s e r v e   a s   a   v a l ua b l e   r e s o ur c e   f o r   r e s e a r c he r s   a nd   pr a c t i t i o ne r s   s e e k i ng   t o   na v i g a t e   a nd  c o nt r i bu t e   t o   t h e   e v o l v i ng   l a n ds c a pe   o f   i m a g e   r e c o g ni t i o n.   M o r e o v e r ,   t h e   p a pe r   e xa m i ne s   c r i t i c a l   c ha l l e ng e s   t ha t   pe r s i s t   i n   t he   f i e l d ,   s uc a s   t r a ns f e r   l e a r n i ng ,   d a t a   a ug m e nt a t i o n,   a nd   e xpl a i na b l e   a r t i f i c i a l   i n t e l l i g e nc e   ( AI )   a ppr o a c he s .   B y   s y nt he s i z i n g   c ur r e nt   t r e nds   w i t e m e r g i ng   i n no v a t i o ns ,   t he   r e v i e w   no t   o nl y   m a ps   t he   t r a j e c t o r y   o f   pr o g r e s s   but   a l s o   h i g hl i g ht s   f ut ur e   d i r e c t i o ns   a nd   r e s e a r c o pp o r t uni t i e s .   T hi s   s y nt he s i s   a i m s   t o   pr o v i de   r e s e a r c he r s ,   de v e l o pe r s ,   a nd   i n dus t r pr a c t i t i o ne r s   w i t a   s o l i d   und e r s t a nd i ng   o f   t he   dy na m i c   a nd   r a pi dl y   e v o l v i ng  e nv i r o nm e nt   s ur r o undi ng   i m a g e   r e c o g ni t i o t e c hno l o g i e s .   Ke y w or d s :   AI   CN N   D e e l e a rni n g   Im a ge   r e c o gni t i o n   M a c hi n e   l e a rni n g   T hi s   i s   an   ope n   ac c e s s   ar t i c l e   u nde r   t he   C C   B Y - SA   l i c e ns e .     Cor r e s pon di n g   Au t h or :   O s a m a   M .   H a s s a n   D e pa rt m e n t   o f   M a t h e m a t i c s   a n d   Co m put e S c i e n c e ,   F a c ul t y   of   S c i e n c e ,   A l - A z ha U n i v e r s i t y   N a s C i t y   11884,   Ca i r o ,   E gy pt   E m a i l :   o s a m a . a l d h e f e e r y @ gm a i l . c o m .       1.   I N TR O D U C TI O N   Im a ge   r e c o gn i t i o n,   s o m e t i m e s   r e f e r r e t o   a s   c o m pu t e r   v i s i o n   o r   i m a ge   c l a s s i f i c a t i o n ,   i s   a n   e s s e n t i a l   c o m po n e n t   o f   a rt i f i c i a l   i n t e l l i ge n c e   (A I) ,   a s   i t   i n v o l v e s   t h e   a ut o m a t i c   r e c o gni t i o a n d   c l a s s i fy i n o f   o bj e c t s ,   s c e n e s ,   o r   p a t t e rn s   w i t h i d i gi t a l   i m a ge s .   I t   i s   i nt e g r a l   t o   a   v a ri e t y   of   a ppl i c a t i o n s ,   s uc h   a s   a ut o n o m o us   v e h i c l e s ,   r o bo t i c s ,   m e di c a l   i m a gi n g ,   s u r v e i l l a n c e ,   e - c o m m e r c e ,   a n d   m ul t i m e di a   p r o c e s s i n g   [1] .   F o r   a   l o ng  t i m e ,   a c c ura t e l y   a n d   e f f i c i e n t l y   r e c o gn i z i n g   a nd   i nt e r p r e t i n g   i m a ge s   ha s   po s e a   s i g ni f i c a nt   c ha l l e nge   i c o m put e s c i e n c e .   T ra di t i o n a l   i m a ge   r e c o gn i t i o m e t h o ds   d e pe n de o m a n u a l l y   c ra f t e f e a t u r e s   a n d   r u l e - b a s e a l go ri t hm s ,   w hi c de m a n de d   a   g r e a t   de a l   o f   m a n ua l   l a b o ur   t o   e xt r a c t   m e a n i ngf ul   i n f o r m a t i o f r o m   i m a ge s .   T h e   e m e rge n c e   o f   m a c hi n e   l e a rni n g   (M L )   a n d   de e l e a rni n g   (D L )   t e c hni que s   h a s   r e v o l ut i o n i z e i m a ge   r e c o gn i t i o n,   e n a b l i n g   c o m put e r s   t o   l e a rn  d i r e c t l y   f r om   r a w   i m a ge   d a t a   a nd  e l i m i na t i ng   t h e   n e e f o r   e xpl i c i t   f e a t u r e   e n gi n e e r i n g   [ 2] .   T h i s   d a t a - d r i v e a pp r o a c ha s   t r a n s f o r m e d   i m a ge   r e c o gn i t i o by   a l l o w i n g   c o m put e r s   t o   l e a rn  r e p r e s e n t a t i o n s   di r e c t l y   f r o m   t h e   r a w   p i x e l   v a l ue s   o f   i m a ge s   [3] .   T h e   a v a i l a b i l i t y   of   v a s t   da t a s e t s ,   i m p r o v e m e n t s   i a l go r i t hm   de v e l o pm e n t ,   a nd  i n c r e a s e s   i p r o c e s s i n g   c a pa c i t y   h a v e   a l l   c o n t ri b ut e t o   t h e   c o n s i de ra b l e   e vo l ut i o o f   AI   o ve r   t i m e .   T h e   de v e l o p m e nt   o f   i n t e l l i ge nt   s y s t e m s   ha s   b e e n   s i g n i f i c a n t l y   a i de b y   ML ,   w h i c h   ha s   a l l o w e c o m put e r s   t o   l e a rn   a n d   e nha n c e   t h e i r   pe r f o r m a n c e   o n   p a r t i c ul a r   t a s ks   t hr o ugh  e xpe r i e n c e .   M L   a l go ri t hm s ,   p a r t i c ul a rl y   s upe r v i s e l e a rn i ng  m e t h o ds ,   h a v e   b e e n   w i de l y   us e f o r   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i V o l .   40 ,   N o .   2 ,   N o v e m be r   20 25 :   9 53 - 9 67   954   i m a ge   r e c o gn i t i o t a s ks .   T h e s e   a l go ri t hm s   l e a rn  f r o m   a   l a b e l l e d   d a t a s e t ,   w h e r e   i m a ge s   a r e   a s s o c i a t e d   w i t h   pr e de f i n e c l a s s   l a b e l s .   T hr o ug h   t h e   t ra i ni n g   p r o c e s s ,   t h e y   l e a rn   t o   i de n t i fy   pa t t e rn s   a n d   c o rr e l a t i o n s   b e t w e e n   pi xe l   v a l ue s   a n d   c o rr e s po n di ng   l a b e l s ,   a l l o w i n g   t h e m   t o   m a ke   a c c u r a t e   p r e di c t i o n s   o u n s e e i m a ge s .     K - n e a r e s t   n e i g h b o ur s   (K N N ) ,   ra n do m   f o r e s t s ,   a n s u ppo rt   v e c t o r   m a c h i n e s   (S V M a r e   w i de l y   us e ML   a l go ri t hm s   us e f o r   i m a ge   i de nt i f i c a t i o n.   b ut   t h e i r   e f f e c t i v e n e s s   i s   o f t e n   l i m i t e by   t h e   n e e f o r   ha n dc r a f t e f e a t ur e s   a n c o m pl e f e a t u r e   e n gi n e e ri n g   [4] ,   [5] .   W i t h i t h e   do m a i o f   ML D L   h a s   a ri s e a s   a   po t e nt   s ub s e t   t h a t   h a s   s p a r ke a   s i g ni f i c a nt   s c i e nt i f i c   r e v i v a l   i n   i m a ge   p r o c e s s i n t a s ks ,   a l l o w i n c o m put e r s   t o   di r e c t l y   l e a rn   i nt r i c a t e   pa t t e rn s   a nd  r e p r e s e n t a t i o n s   f r o m   ra w   i m a ge   da t a   [6] .   DL   h a s   d r a m a t i c a l l y   t r a n s f o r m e t h e   f i e l o f   i m a ge   r e c o gn i t i o b y   e n a b l i n g   r e m a r k a b l e   a dv a n c e s   i c o m put e v i s i o t a s ks .   Im a ge   r e c o gn i t i o n   i n v o l ve s   t h e   a u t o m a t i c   i de n t i f i c a t i o a n d   c a t e go r i z a t i o n   o f   ob j e c t s ,   s c e n e s ,   o r   p a t t e rn s   w i t h i n   di g i t a l   i m a ge s .   DL   t e c hn i que s ,   pa rt i c ul a r l y   de e n e u ra l   n e t w o r ks   (D N N s ) ,   ha v e   de m o n s t ra t e d   e xc e pt i o n a l   l e a rn i ng  c a pa b i l i t i e s   a n d   e xt r a c t i n g   i nt r i c a t e   f e a t u r e s   di r e c t l y   f ro m   r a w   i m a ge   da t a ,   r e s ul t i ng  i s i g ni f i c a nt   a dv a n c e m e n t s   i i m a ge   r e c o gn i t i o a c c u r a c y   a n d   pe r f o r m a n c e   [7] DL   ha s   b e c o m e   a   po t e nt   m e t h o f o r   i m a ge   r e c o gn i t i o n.   DNN s   m o de l e a f t e t h e   s t r uc t u r e   a n d   f u n c t i o o f   t h e   hum a b r a i n,   h a v e   s h o w n   o ut s t a n di ng  a b i l i t i e s   i n   l e a rni n a n e x t r a c t i n c o m pl e f e a t u r e s   di r e c t l y   f r o m   ra w   i m a ge   da t a .   M o de l s   l i ke   c o n vo l ut i o n a l   n e u ra l   n e t w o r ks   (CN N s i n   DL   u t i l i z e   i n t e r c o nn e c t e l a y e r s   of   n o de s   t o   gr a du a l l y   l e a rn   hi e ra r c h i c a l   r e p r e s e n t a t i o n s   o f   i m a ge s   [8] - [10] .   T h i s   e n a b l e s   DNN s   t o   c a pt ur e   a n c o m p r e h e nd  i nt r i c a t e   pa t t e rn s ,   t e xt u r e s ,   a n d   s pa t i a l   r e l a t i o n s h i ps   w i t hi n   i m a ge s ,   r e s ul t i n i n   s ub s t a n t i a l   e nh a n c e m e n t s   i i m a ge   r e c o gn i t i o n   a c c ura c y   [11] .   T h e   q ua l i t y   of   i m a ge s   i s   e s s e n t i a l   i n   DL   i m a ge   r e c o gn i t i o n ,   a s   i t   s i g ni f i c a nt l y   i m p a c t s   t h e   m o de l s   a b i l i t y   t o   ge n e r a l i z e .   B e f o r e   t r a i n i ng  t h e   m o de l ,   i m a ge   p r e p r o c e s s i n i s   c o n duc t e t o   r e m o v e   i rr e l e v a nt   i n f o r m a t i o n,   i m p r o v e   t h e   v i s i b i l i t y   of   us e f ul   da t a ,   a n d   s i m pl i f y   t h e   da t a .   T h e   pu r po s e   of  t h i s   s t e i s   t o   e nh a n c e   t h e   m o de l s   f e a t u r e   e xt ra c t i o n   a n d   re c o gn i t i o r e l i a b i l i t y   [12] .   S e v e r a l   f a c t o r s   ha v e   c o n t ri b ut e t o   t h e   s uc c e s s   of   DL   i n   i m a ge   r e c o gn i t i o n.   O n e   ke y   f a c t o r   i s   t h e   p r e s e n c e   of   e xt e n s i v e   l a b e l l e d   da t a s e t s ,   l i ke   Im a ge N e t ,   w hi c h   ha v e   a l l o w e DNN s   t o   b e   t ra i n e o a   w i de   v a ri e t y   of   i m a ge s .   T h e s e   da t a s e t s   pr o v i de   a m pl e   t ra i ni n g   da t a   f o r   m o de l s   t o   l e a rn  f r o m   a n d   pe r f o r m   w e l l   o n e w   i m a ge s   [13 ] .   F u r t h e rm o r e ,   i m p r o v e m e n t s   i c o m put a t i o na l   r e s o ur c e s ,   e s pe c i a l l y   G P U s ,   h a v e   s pe up  t h e   t ra i ni n g   a nd  i n f e r e n c e   pr o c e s s e s   of   DL   m o de l s ,   m a k i n g   l a r ge - s c a l e   i m a ge   r e c o gni t i o n   po s s i b l e   [14] ,   [ 15] .   T h e   i m p a c t   o f   i m a ge   r e c o gn i t i o e xt e n ds   f a b e y o n a c a de m i c   r e s e a r c a nd   ha s   t r a n s f o r m e d   i ndus t ri e s   a nd   a p pl i c a t i o n s .     In   a u t o n o m o us   v e h i c l e s ,   i m a ge   r e c o gn i t i o n   p l a y s   a   c r uc i a l   ro l e   i n   o b j e c t   de t e c t i o n ,   l a n e   de t e c t i o n ,   a n t r a f f i c   s i g r e c o gn i t i o n .   I h e a l t h c a r e ,   i t   a i ds   i m e di c a l   i m a ge   a na l y s i s ,   d i s e a s e   di a g n o s i s ,   a nd   t r e a t m e n t     pl a nni n g   [16]   In  s e c uri t y   a n d   s u r v e i l l a n c e ,   i t   a s s i s t s   i f a c e   r e c o gn i t i o n,   ob j e c t   t r a c ki ng,   a nd   a n o m a l y   de t e c t i o n .   F urt h e rm o r e ,   i m a ge   r e c o gn i t i o n   ha s   e n a b l e n e w   po s s i b i l i t i e s   i e - c o m m e r c e ,   s uc a s   v i s ua l   s e a r c a nd  r e c o m m e n d a t i o s y s t e m s ,   a n d   ha s   f a c i l i t a t e i nn o v a t i v e   m ul t i m e d i a   p r o c e s s i n t e c hni que s   [1 7] .   T h e   p r o c e s s   of   r e c o gn i z i n g   i m a ge s   us i n g   DL   i n v o l v e s   s e ve r a l   m a i s t e ps .   F i r s t l y ,   a   l a r ge   d a t a s e t   o f   de s i r e i m a ge s   i s   c o l l e c t e d,   w hi c i s   o b t a i n e d   f r o m   v a r i o us   s o ur c e s .   T h e n ,   t h e   c o l l e c t e da t a s e t   i s   us e f o t ra i ni n g   t h e   D L   m o de l ,   us ua l l y   e m pl oy i n g   CN N s   o r e c urr e n t   n e u ra l   n e t w o r ks - (R N N s )   [18] .   T h e   m o de l   i s   t a u g h t   t o   i de n t i fy   s i g n i f i c a n t   f e a t u r e s   a nd  p a t t e rn s   i n   t h e   i m a ge s ,   a l l o w i n i t   t o   c a t e go r i z e   a n d   i de n t i fy   v a ri o us   ob j e c t s   o r   s pe c i f i c   i m po r t a n t   de t a i l s .   D u ri n g   t h e   t r a i n i ng   p r o c e s s ,   t h e   m o de l s   pa ra m e t e r s   a r e   c o n t i n u a l l y   a dj us t e d   t o   r e duc e   t h e   di s p a r i t y   be t w e e n   e xpe c t e a nd  a c t ua l   l a b e l s ,   i m p r o v i n g   i t s   c a p a c i t y   t o   p r e c i s e l y   r e c o gn i z e   a n d   c l a s s i fy   i m a ge s .   T h e   DL   m o de l   c a n   b e   us e t o   i de n t i fy   a nd  e xa m i n e   b r a nd - n e w ,   i n v i s i b l e   i m a ge s   a f t e i t   h a s   b e e n   t ra i n e d   [19] .   T h e r e   a r e   s t i l l   s o m e   p r o b l e m s   t ha t   ha v e   n o t   b e e n   s o l v e d.   C urr e nt   m o de l s   a r e   i n e f fe c t i ve   o n   l o w e r - qua l i t y   i m a ge s ,   a n d   i nt e rp r e t a b i l i t y   i s   a   s i g ni f i c a n t   b a rri e t o   t h e i r   a do pt i o n .   F u rt h e r m o r e ,   t h e s e   m o de l s   n e e t o   b e   de ve l o pe i nt o   f r a m e w o r ks   t ha t   w o ul a l l o w   fo r   a   s m oo t a m a l ga m a t i o o f   DL   w i t i m a ge   p r o c e s s i n t e c hn i q ue s   fo r   i m p r o v i n g   o v e r a l l   pe r f o r m a n c e .   T hi s   p a pe r   i nt e n ds   t o   f i l l   s uc h   g a ps ,   by   pr o v i di n g   a   t h o r o ug a n de t a i l e o ve r v i e w   of   t h e   s t a t e - of - t h e - a r t   i m a ge   r e c o gn i t i o n   m e t h o do l o gi e s   de v e l o pe t hr o ug h   DL .   W e   w i l l   p r e s e n t   di f f e r e n t   m e t h o ds ,   t h e i a dv a nt a ge s   a n d   di s a dv a nt a ge s ,   a n d   po s s i b l e   d i r e c t i o n s   f o r   f ut u r e   r e s e a r c fo r   b ui l d i n s t r o n ge r   a n m o r e   e f f i c i e n t   s y s t e m s   w i t h o s t   pe r f o r m a n c e s .   I t   i s   e n v i s i o n e t o   s y n t h e s i z e   t h e   e xi s t i n g   l i t e r a t u r e   i n t o   t h e   i m p r o v e a r e a s   a n d,   t h us ,   c o nt r i b ut e   t o   t h e   e v o l v i n di s c us s i o i t h e   a r e a   a s   w e l l   a s   p a v e   t h e   w a y   fo r   f ut u r e   r e v o l ut i o n s   i i m a ge   r e c o gn i t i o t e c h n o l o g y .       2.   I M A G E   R EC O G N I TI O N   T h e   p r o c e s s   of   i m a ge   p r o c e s s i n e n c o m pa s s e s   a   s e ri e s   of   a c t i o n s   de s i g n e t o   m a n i pul a t e   a n d   i m p r o v e   di gi t a l   i m a ge s   i o r de r   t o   e xt r a c t   i m po r t a n t   i n f o r m a t i o n   o e nha n c e   t h e i v i s ua l   qu a l i t y .   T h e   b a s i c   c o n c e pt   o f   i m a ge   r e c o gn i t i o i s   t o   i de n t i f y   s pe c i f i c   f e a t ur e s   w i t hi t h e   i m a ge .   T h i s   r e c o gn i t i o p r o c e s s   i n v o l ve s   t hr e e   p ri m a r y   s t a ge s :   i m a ge   p r o c e s s i n g,   e xt ra c t i o o f   i m a ge   f e a t u r e s ,   a n d   i m a ge   c l a s s i f i c a t i o n   [ 5] .     (a s   de pi c t e i F i gu r e   1).   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Im age   r e c o gni t i on   us i ng  d e e l e ar n i ng:   a   r e v i e w   ( O s am M.   H as s an )   955       F i gu r e   1 .   P r o c e s s   of   i m a ge   r e c o gn i t i o n       T h e   p r o c e s s   of   ut i l i z i n c o m put e r s   t o   m o di fy   i m a ge s   to   m e e t   s pe c i f i c   c r i t e r i a   f o r   s ub s e que n t   r e c o gn i t i o i s   r e f e rr e t o   a s   i m a ge   p r o c e s s i n g.   T hi s   p r o c e d ur e   i s   m a i nl y   b i f ur c a t e d   i nt o   t w o   s t a ge s :   i m a ge   pr e p r o c e s s i n g   a nd  i m a ge   s e gm e n t a t i o n .   Im a ge   p r e p r o c e s s i ng  e n c o m pa s s e s   a c t i v i t i e s   l i ke   i m a ge   r e s t o r a t i o a n t r a n s f o r m a t i o n ,   p r i m a ri l y   a i m e a t   e l i m i n a t i n g   di s t u r b a n c e s   a n n o i s e ,   e nh a n c i ng  v a l u a b l e   i n f o r m a t i o n,   a n r e f i n i n g   o b j e c t   de t e c t a b i l i t y .   M o r e ove r ,   r e a l - t i m e   i m a ge   p r o c e s s i n i n v o l v e s   r e - e n c o di n a n d   c o m pr e s s i n g   t h e   i m a ge   t o   de c r e a s e   a l go ri t hm i c   c o m pl e xi t y   a nd   e nha n c e   c o m put a t i o n a l   e ff i c i e n c y .   Co n v e r s e l y ,   i m a ge   s e gm e nt a t i o n   e nt a i l s   p a r t i t i o n i ng  t h e   i d e n t i f i e i m a ge   i n t o   m ul t i p l e   s ub - r e gi o n s ,   e a c e xh i b i t i n g   u n i que   a t t ri b ut e s   a n d   s h a ri n g   c e rt a i s i m i l a ri t i e s   i n   t h e i r   i n t e rna l   c ha ra c t e ri s t i c s .   T h e   c urr e nt   m e t h o ds   fo r   i m a ge   s e gm e nt a t i o p r i m a ri l y   i n c l ude   t hr e s h o l d - b a s e s e gm e n t a t i o n ,   e dge - b a s e s e gm e n t a t i o n,   a n r e g i o n - b a s e s e gm e n t a t i o n   [ 20] [2 1] .       3.   D EEP   LEA R N I N G   Im a ge   p r o c e s s i n ha s   u n de r go n e   a   r e v o l ut i o t ha n ks   t o   a   ML   s ub f i e l d.   D L   m o de l s   t h a t   i s ,   DNN s   a r e   de s i gn e d   t o   m i m i c   t h e   c o m po s i t i o n   a n d   f un c t i o n a l i t y   of   t h e   h u m a b r a i n.   T h e y   a r e   m a de   up   o f   s e v e r a l   l i nke l a y e r s   o f   n o de s   ( n e u r o n s )   t ha t   p r o c e s s   a nd   m o di fy   i n pu t   da t a ,   g r a dua l l y   ga i ni n g   k n o w l e dge   of   a n d   e xt ra c t i n g   da t a s   h i e r a r c hi c a l   r e p r e s e n t a t i o n s   [22] .   By   a u t o m a t i c a l l y   l e a rni n g   a n d   i de nt i fy i n g   pe r t i n e n t   f e a t u r e s   f r o m   unp r o c e s s e i m a ge   d a t a ,   DNN s   e l i m i na t e   t h e   r e qui r e m e n t   f o r   e xpl i c i t   f e a t u r e   e n gi n e e r i n g .   I m a ge   p r o c e s s i n t a s ks   s uc h   a s   i m a ge   r e c o gn i t i o n,   o b j e c t   de t e c t i o n ,   i m a ge   s e gm e n t a t i o n ,   a n i m a ge   ge n e r a t i o ha v e   be e n   s i g n i f i c a n t l y   i n f l ue n c e by   D L   [23] .   CN N s ,   a   po pul a r   DL   s t r uc t u r e ,   h a v e   s h o w n   r e m a rka b l e   pe r f o r m a n c e   i n   i m a ge   r e c o gn i t i o n   by   e xt r a c t i ng  l o c a l   s p a t i a l   pa t t e rn s   a nd  f e a t u r e s   f r o m   i m a ge s .   CN N s   ha v e   be e n   us e i n   m a n y   di f fe r e n t   do m a i n s ,   s uc h   a s   m e di c a l   i m a gi n g ,   a ut o n o m o us   c a r s ,   f a c i a l   r e c o gn i t i o n,   a nd  s a t e l l i t e   i m a ge r y   a n a l y s i s   [24] - [26] .   S e v e r a l   f a c t o r s   ha v e   f a c i l i t a t e d   t h e   de v e l o pm e n t   o f   D L   m o de l s   f o i m a ge   p r o c e s s i n g.     T h e   e xi s t e n c e   o f   l a rge - s c a l e   l a b e l l e d   d a t a s e t s ,   l i ke   I m a ge N e t ,   ha s   pe r m i t t e r e s e a r c h e r s   t o   t r a i DNN s   o n   di v e r s e   i m a ge   e xa m pl e s ,   e n a b l i ng   t h e   m o de l s   t o   l e a rn  ri c re pr e s e n t a t i o n s   a nd   ge n e ra l i z e   e f f e c t i v e l y   t o   n e w   da t a .   A dd i t i o n a l l y ,   p r o g r e s s   i c o m put a t i o n a l   r e s o ur c e s ,   e s pe c i a l l y   g r a p hi c a l   p r o c e s s i n g   u ni t s   (G P U s ),     ha s   e xpe di t e d   t h e   t ra i ni n g   a nd  i n f e r e n c e   p r o c e s s e s   of   D L   m o de l s ,   m a ki ng  l a r ge - s c a l e   i m a ge   p r o c e s s i n g   v i a b l e .   T h e   i n t e g ra t i o n   o f   A I,   M L ,   a n d   D L   h a s   t ra n s f o r m e t h e   i m a ge - p r o c e s s i n g   f i e l d   [ 7] .     3. 1 .     CNNs   CN N s   a r e   a   t y pe   of   D L   m o de l   s pe c i f i c a l l y   de s i gn e f o r   i m a ge   r e c o gn i t i o n   a n d   c o m put e v i s i o t a s ks .   T h e y   h a v e   pr o v e n   t o   b e   h i g h l y   e f fe c t i ve   i n   v a r i o us   a ppl i c a t i o n s ,   s uc h   a s   i m a ge   c l a s s i f i c a t i o n,   o b j e c t   de t e c t i o n ,   a n d   i m a ge   s e gm e nt a t i o n.   CN N s   a r e   i n s p i r e by   t he   v i s ua l   p r o c e s s i n i t h e   hum a n   b r a i n   a n d   e xc e l   i c a pt u ri n g   s p a t i a l   pa t t e rn s   a nd   h i e r a r c hi c a l   f e a t u r e s   i i m a g e s   [27] ,   [28] .   A   CN N   m o de l   t y pi c a l l y   c o m pr i s e s   c o n vo l ut i o n a l   l a y e r s ,   po o l i n l a y e r s ,   a n f ul l y   c o nn e c t e l a y e r s .   Co n v o l ut i o n a l   l a y e r s   ut i l i z e   a   s e t   o f   f i l t e r s   o ke rn e l s   t o   e xt ra c t   l o c a l   s pa t i a l   pa t t e rn s   a n f e a t u r e s   f r o m   t h e   i n p ut   da t a .   P o o l i n g   l a y e r s   do w n s a m p l e   t h e   s pa t i a l   di m e n s i o n s   t o   r e duc e   c o m put a t i o na l   c o m pl e xi t y   a n d   p r o v i de   t ra n s l a t i o i n v a r i a n c e .   F u l l y   c o nn e c t e l a y e r s   l i n k   e v e r y   n e u r o n   i n   t h e   p r e c e di n l a y e r   t o   t h e   f o l l o w i n l a y e r ,   a l l o w i n g   t h e   m o de l   t o   a c qui r e   m o r e   c o m pr e h e n s i v e   a n d   a b s t r a c t   r e p r e s e n t a t i o n s   [ 29] ,   [3 0] .     3. 1 . 1.   S tr u c tu r e   o C N N :   T y pi c a l l y ,   a   CN N   ha s   m ul t i pl e   l a y e r s   [31] :       Co n v o l ut i o n a l   l a y e r s :   t h e s e   l a y e r s   pe r f o r m   f e a t u r e   e xt ra c t i o n   b y   a ppl y i n g   m ul t i pl e   f i l t e r s   (a l s o   c a l l e d   ke rn e l s )   t o   t h e   i n p ut   i m a ge .   E a c f i l t e r   w i t hi t h e   c o n v o l ut i o n a l   l a y e r   i de nt i f i e s   di s t i n c t   pa t t e rn s   i t h e   i m a ge ,   l i ke   c o rn e r s ,   e dge s ,   o t e xt u r e s .   T h e   r e s ul t i ng   c o n vo l ut i o n s   ge n e ra t e   f e a t u r e   m a ps   t h a t   de pi c t   v a r i o us   a t t ri b ut e s   o f   t h e   i m a ge .     A c t i v a t i o l a y e r s :   f o l l ow i n g   t h e   c o n v o l ut i o n   p r o c e s s ,   a a c t i v a t i o f un c t i o (t y pi c a l l y   R e L U     R e c t i f i e d - L i n e a U n i t i s   a pp l i e t o   e a c h   e l e m e n t   o f   t h e   f e a t ur e   m a ps .   T h i s   g i v e s   n o n - l i n e a ri t y   t o   t h e   m o de l   a n a i ds   i n   l e a rn i ng  c o m pl e pa t t e rn s .       P oo l i n g   l a y e r s :   t h e   pu r po s e   o f   t h e   po o l i n g   l a y e r s   i s   t o   r e duc e   t h e   s p a t i a l   d i m e n s i o n s   o f   t h e   f e a t u r e   m a ps   by   dow n - s a m p l i n g   t h e m .   A   po pul a a p p r o a c h   c a l l e m a x   po o l i n g   s e l e c t s   t h e   l a r ge s t   v a l ue   i n s i de   a   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i V o l .   40 ,   N o .   2 ,   N o v e m be r   20 25 :   9 53 - 9 67   956   l i m i t e d   r e gi o n ,   ge n e r a l l y   2x2 T hi s   o pe ra t i o r e duc e s   c o m put a t i o na l   c o m pl e xi t y   w h i l e   p r e s e r v i ng   c r uc i a l   i n f o r m a t i o n.       F ul l y   c o n n e c t e l a y e r s :   t h e s e   l a y e r s   us e   t h e   c h a ra c t e ri s t i c s   t ha t   w e r e   r e t r i e v e f r o m   e a r l i e l e v e l s   t pe r f o r m   c a t e go r i z a t i o n.   S i m i l a t o   c o n v e n t i o n a l   n e u ra l   n e t w o r ks ,   t h e   f e a t u r e   m a ps   a r e   c o n v e r t e d   i nt o   a   o n e - di m e n s i o na l   v e c t o r   a n d   t h e i n pu t   i nt o   f ul l y   c o nn e c t e l a y e r s .   U s ua l l y ,   a   S o f t M a x   a c t i v a t i o f u n c t i o i s   us e i t h e   l a s t   l a y e r   t o   p r o v i de   c l a s s   p r o b a b i l i t i e s   f o r   pi c t ur e   c l a s s i f i c a t i o n .   F i gu r e   2   [31]   i l l us t ra t e s   a   t y pi c a l   CN N   s t r uc t u r e .           F i gu r e   2 .   CN N s   s t r uc t u r e       CN N s   m a t h e m a t i c a l   m o de l   c a b e   s um m a r i z e a s   f o l l ow s   [31] :     = 1  +   (1)     In  (1)   e xpl a i n s   h o w   t h e   CN N   pe r f o r m s   c o n v o l ut i o n.   T h e      f e a t u r e   m a p   o f   l a y e r   m   i s   r e p r e s e n t e by     i t h i s   e qua t i o n,   w h e r e a s     s t a n ds   f o r   t h e   i m a ge   i nput   t o   t h e   CN N ,   1   f o r   t h e   j t o ut pu t   o f   l a y e r   1    f o r   t h e   c o n v o l ut i o ke rn e l ,   a nd     f o r   t h e   o ff s e t   of   t h e      o ut put   o f   l a y e r     T h e   a c t i v a t i o n   f u n c t i o i s   t h e n   a pp l i e t o   t h e   r e s ul t   o f   (1).   T h e   CN N   c a n   e xt ra c t   d i f f e r e n t   c h a ra c t e ri s t i c s   f r o m   t h e   v i s ua l   i n p ut   w hi l e   p r e s e r v i ng   s c a l e   i n v a r i a n c e   t ha n ks   t o   t h i s   t e c hni que .   T h e   po o l i n g   l a y e r   r e duc e s   n o i s e ,   m i ni m i s e s   o ve r f i t t i ng,   a t t a i n s   d i m e n s i o r e duc t i o n ,   m i ni m i s e s   t h e   n u m b e r   o f   t r a i n i ng  pa ra m e t e r s ,   a nd  dow n s a m p l e s   t h e   da t a .   I t   m a y   us e   m a xi m um   o a v e ra ge   po o l i n g .      ( 1 )   (2)     In   (2)  de s c ri b e s   t h e   do w n s a m p l i ng  f un c t i o n,   w h i c h   i s   r e f e r re t o   a s    .   B a s e o n   t h e   p r e de f i n e d   n u m b e o f   n e t w o r l a y e r s ,   t h e   CN N   c o nt i n u a l l y   c o n duc t s   po o l i n a n d   c o n v o l ut i o p r o c e s s e s .   T h e   f e a t ur e   v e c t o r s   t ha t   ha v e   b e e n   p r o c e s s e a r e   t h e c o m b i n e a nd  c a t e go r i s e d   us i n g   t h e   f ul l y   c o n n e c t e l a y e r .     T h e      a n d   S V M   c l a s s i f i e r   f u n c t i o n s   a r e   c o m m o n l y   us e f o r   c l a s s i f i c a t i o n.     ( , ) = ( ̂ = ) l o g = 1 = 1   (3)     A s   s h o w n   by   (3),   t h e   o b j e c t i v e   of   CN N   t ra i ni n g   i s   t o   m i ni m i z e   t h e   l o s s   f un c t i o n.   T h e   v a ri a b l e s   b g ,   a n d   j   i t hi s   e qua t i o n   s t a n d   f o r   w e i ght ,   b i a s ,   i ndi c a t o r   f un c t i o n,   a n d   t ra i ni n g   s a m pl e   c a t e go r y ,   r e s pe c t i v e l y .   I = 1   If   ̂ = ;   o t h e r w i s e ,   I = 0   i f   ̂ .   w h e r e   N   i s   t h e   n u m b e r   o f   t ra i ni n g   s a m pl e s ,   i s   t h e   pr e di c t i o n   p r o b a b i l i t y   of   c a t e go r y   j   fo r   t r a i n i ng  s a m pl e   i .   T he   r e s i dua l   di f f e r e n c e ,   o r   v a r i a t i o n   b e t w e e n   t h e   CN N s   o ut put   a n d   t h e   t ra i ni n g   s e t ,   i s   m e a s u r e d   us i ng   t h e   l o s s   f un c t i o a nd   i t s   p r e di c t e v a l ue s .   T h e   g ra di e n t   de s c e n t   a p p r o a c m a y   be   us e t o   o pt i m i s e   a n d   m o di fy   t h e   s e t t i n gs   o f   e a c h   l a y e r   o f   n e u r o n s   i a   CN N .     3. 1 . 2.   CNN  a r c h i te c tu r e s   W e   c a n o w   e xpl o r e   di f f e r e n t   a r c hi t e c t u r e s   f o r   CN N s   a n d   t h e   r e s e a r c h.   D u r i ng   t hi s   t i m e   f ra m e ,   CN N s   w e r e   e n ha n c e t o   e nha n c e   t h e i r   o v e r a l l   pe r f o r m a nc e .   T h e   n um b e r   o f   l a y e r s   us e d,   t h e   n u m b e r   o c o n vo l ut i o n a l   c h a nn e l s   us e d,   a n t h e   t o t a l   c o m pl e xi t y   of   e a c h   de s i g v a r y .   I n   t hi s   c o n t e xt ,   w e   c a e v a l ua t e   e a c a r c h i t e c t u r e   b a s e o i t s   s uc c e s s f ul   pe r f o r m a n c e   i t h e   v i s ua l   r e c o gn i t i o c ha l l e n ge :   i m a ge n e t   l a r ge   s c a l e   (IL S V R C).   F urt h e rm o r e ,   a   c o m pa r i s o w a s   m a de   o f   di f f e r e n t   CN N   a r c hi t e c t u r e s   t o   s h o w c a s e   t h e i ke y   ch a ra c t e ri s t i c s   a n d   pe r f o r m a n c e ,   a s   s h o w n   i T a b l e   1 .   T h e   s t udy   r e v e a l e t ha t   w hi l e   s o m e   CN N   a r c h i t e c t u r e s   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Im age   r e c o gni t i on   us i ng  d e e l e ar n i ng:   a   r e v i e w   ( O s am M.   H as s an )   957   e xc e l l e i a c c ura c y ,   o t h e r s   de m o n s t r a t e s upe r i o s pe e a n e f f i c i e n c y .   U n de r s t a ndi n g   t h e s e   ke y   c h a ra c t e ri s t i c s   c a h e l p   i s e l e c t i n g   t h e   m o s t   s ui t a b l e   a r c hi t e c t ur e   f o r   s pe c i f i c   t a s ks   a n d   a ppl i c a t i o n s .       T a b l e 1.   Co m pa ri s o n   o f   CN N   a r c hi t e c t u r e s   (L e N e t - 5,   A l e xN e t ,   Z F N e t ,   O v e r F e a t ,   G o o gl e N e t ,   V G G N e t ,   R e s N e t ,   I n c e pt i o n   a nd   D e n s e N e t )   N o .   A r c h i t e c t u r e   M a i n   fe a t u re s   P e r fo r m a n c e   1   L e N e t - 5   [3 2 ]   A   CN N   a rc h i t e c t u r e   w i t h   T h r e e   f u l l y   c o n n e c t e d   l a y e r s   a n d   t w o   c o n v o l u t i o n a l   l a y e r s   i s   re l a t i v e l y   s i m p l e .   Cu t t i n g - e d g e   t e c h n o l o g y   fo r e c o g n i z i n g   h a n d w ri t t e n   d i g i t s   d u ri n g   t h a t   p e ri o d .   2   A l e x N e t   [3 3 ]   T h i s   CN N   i s   s i g n i fi c a n t l y   d e e p e r   a n d   l a rg e r   t h a n   i t s   p r e d e c e s s o r s ,   fe a t u ri n g   T h r e e   f u l l y   c o n n e c t e d   l a y e r s   a n d   f i v e   c o n v o l u t i o n a l   l a y e r s .   W o n   t h e   2 0 1 2   IL S V RC  h e l d   b y   I m a g e N e t .   3   Z F N e t   a n d   O v e rF e a t   [3 2 ]   S i m i l a t o   A l e x N e t ,   b u t   w i t h   s o m e   a rc h i t e c t u ra l   i m p ro v e m e n t s   a n d   l a rg e r   m o d e l s .   A c h i e v e d   t o p   r e s u l t s   i n   t h e   I L S V RC  2 0 1 3   a n d   2 0 1 4   c o m p e t i t i o n s ,   r e s p e c t i v e l y .   4   G o o g l e N e t   (In c e p t i o n )   [3 4 ]     In t r o d u c e d   t h e   i n c e p t i o n   m o d u l e ,   w h i c h   a l l o w s   fo m o r e   e f fi c i e n t   u s e   o p a ra m e t e r s   a n d   c o m p u t a t i o n .   W o n   t h e   IL S V RC   2 0 1 4   c o m p e t i t i o n   w i t h   a   r e c o r d   a c c u r a c y   o 9 3 . 3 % .   5   V G G N e t   [3 5 ] [3 6 ]   V e r y   d e e p   CN N   a r c h i t e c t u re s   w i t h   u p   t o   1 6   c o n v o l u t i o n a l   l a y e r s .   A t t a i n e d   c u t t i n g - e d g e   o u t c o m e s   i n   s e v e ra l   c o m p u t e r   v i s i o n   a s s i g n m e n t s ,   s u c h   a s   o b j e c t   i d e n t i f i c a t i o n ,   p i c t u r e   c a t e g o ri z a t i o n ,   a n d   s e g m e n t a t i o n .   6   Re s N e t   [3 7 ] [3 8 ]   In t r o d u c e d   t h e   r e s i d u a l   b l o c k ,   w h i c h   a l l o w s   fo r   d e e p e a n d   m o re   a c c u ra t e   CN N s   w i t h o u t   o v e r fi t t i n g .   W o n   t h e   IL S V RC   2 0 1 5   a n d   2 0 1 6   c o m p e t i t i o n s   w i t h   re c o r d   a c c u ra c i e s   o 9 5 . 6 %   a n d   9 7 . 6 % ,   r e s p e c t i v e l y .   7   In c e p t i o n   v 2 ,   v 3 ,   a n d   v 4   [3 9 ] [4 0 ]   F u rt h e r   i m p r o v e m e n t s   t o   t h e   i n c e p t i o n   m o d u l e ,   re s u l t i n g   i n   e v e n   m o r e   e f f i c i e n t   a n d   a c c u ra t e   CN N s .   A c h i e v e d   s t a t e - of - t he - a r t   re s u l t s   i n   a   ra n g e   o f   c o m p u t e r   v i s i o n   t a s k s ,   i n c l u d i n g   i m a g e   c a t e g o r i z a t i o n ,   o b j e c t   re c o g n i t i o n ,   a n d   c a p t i o n   g e n e ra t i o n .   8   D e n s e N e t   [4 1 ]   In t r o d u c e d   t h e   d e n s e   b l o c k ,   w h i c h   a l l o w s   fo r   m o re   e f f i c i e n t   u s e   o f   p a ra m e t e r s   a n d   c o m p u t a t i o n .   A c h i e v e d   s t a t e - of - t h e - a r t   r e s u l t s   i n   s e v e ra l   c o m p u t e r   v i s i o n   t a s k s ,   i n c l u d i n g   s e g m e n t a t i o n ,   o b j e c t   d e t e c t i o n ,   a n d   i m a g e   c l a s s i fi c a t i o n .       B a s e o n   ov e r a l l   pe r f o r m a n c e   R e s N e t ,   I n c e pt i o n,   a nd  D e n s e N e t   a r e   ge n e ra l l y   c o n s i de r e t o   b e   t h e   m o s t   po w e r f ul   CN N   a r c hi t e c t u r e s   a v a i l a b l e   t o da y .   T h e y   c a a l l   a c hi e v e   c ut t i n g - e dge   r e s ul t s   o n   a   r a nge   o c o m put e v i s i o t a s ks .   H ow e v e r ,   R e s N e t s   a r e   t y pi c a l l y   m o re   e ff i c i e n t   t ha I n c e pt i o a n d   D e n s e N e t   m o de l s ,   E a c h   o f   t h e s e   a r c hi t e c t u r e s   h a s   i t s   s t r e n g t h s   m a k i n g   t h e m   a   b e t t e r   c h o i c e   fo r   a ppl i c a t i o n s   w h e r e   s pe e i s   a   c o n c e r n.   T h e   s i z e   a n d   c o m pl e xi t y   of   t h e   da t a s e t ,   t h e   r e qui r e d   de g r e e   o f   a c c ur a c y ,   a n d   t h e   a v a i l a b l pr o c e s s i n r e s o ur c e s   a r e   s o m e   o f   t h e   v a ri a b l e s   t ha t   m us t   b e   t a ke n   i n t o   c o n s i de r a t i o n   w hi l e   s e l e c t i n g   t h e   b e s t   CN N   a r c hi t e c t u r e   f o r   a   gi v e t a s k .   If   y o w a n t   a a c c ur a t e   a n d   e f f i c i e n t   m o de l ,   R e s N e t   i s   a   go o c h o i c e .     If   y o n e e a   m o de l   t ha t   c a a c h i e v e   t h e   hi g h e s t   po s s i b l e   a c c ur a c y ,   e ve n   i f   i t   i s   c o m put a t i o na l l y   e xpe n s i v e ,   In c e pt i o n   i s   a   go o c h o i c e .   D e n s e N e t   i s   a   s ui t a b l e   o pt i o n   i f   y o pr e fe r   a   m o de l   t h a t   i s   s i m p l e   t o   t ra i a nd  de pl oy .       4.   LI TER A TU R E   R EV I EW   T h i s   s t udy   of   t h e   l i t e ra t u r e   l o o ks   a t   m a n y   r e s e a r c h   t h a t   c o m pa r e s   di f f e r e n t   D L   m e t h o ds   f o r   pi c t u r e   r e c o gn i t i o n.   R e c e n t   r e s e a r c ha s   e x a m i n e t h e   us e   o f   DL   a l go r i t h m s   f o r   v a ri o us   pi c t u r e   i de nt i f i c a t i o n   a ppl i c a t i o n s .   T i a [1 ] a   n o v e l   CN N   a r c h i t e c t ur e   w a s   i n t r o duc e d,   c o m b i ni n g   a   R N N   i pa ra l l e l   t o   e nha n c e   c o n v e r ge n c e   s pe e a n d   r e c o gni t i o a c c u r a c y .   T h e   m o de l   a l s o   i n c l ude d   a   n e w   r e s i dua l   u ni t   c a l l e d   S h o r t C ut 3 - R e s N e t   a nd  a   du a l   o pt i m i z a t i o n   f ra m e w o r i nt e g r a t i ng  c o n v o l ut i o n a l   a nd  f ul l y   c o nn e c t e l a y e r s .   E xpe r i m e nt a l   r e s ul t s   c o n f i r m e i m p r o v e f e a t ur e   l e a rn i ng  a nd  c l a s s i f i c a t i o pe r f o r m a n c e .   H ui xi a n   [ 5] ,   i m a ge   a na l y s i s   t e c hn i q ue s   w e r e   e m pl oy e t o   i de n t i fy   pl a n t   s pe c i e s   by   e xt ra c t i n g   s h a pe   a n t e xt u r e   f e a t u r e s   f r o m   s e gm e nt e l e a f   i m a ge s .   V a r i o us   s e gm e n t a t i o m e t h o ds   w e r e   a pp l i e d ,   a n f e a t u r e   e xt ra c t i o a l go r i t hm s   e na b l e a c c u r a t e   c ha ra c t e ri z a t i o o f   t h e   l e a v e s .   U s i n g   c l a s s i f i e r s   s uc h   a s   S V M ,   K N N ,   a n K o h o n e n   n e t w o r ks ,   t h e   s t udy   a na l y z e f i f t y   pl a nt   l e a f   da t a s e t s .   R e s ul t s   s h o w e hi g r e c o gn i t i o n   a c c ur a c y ,   pa r t i c ul a rl y   fo r   G i n k go   l e a v e s ,   e v e n   u n de r   c o m pl e b a c kgr o u n ds .   T a n g   a nd  S h a b a z   [12] ,   a   f a c i a l   r e c o gn i t i o m e t h o i n s p i r e by   c e r e b e l l um   a n d   b a s a l   g a n g l i a   m e c h a ni s m s   w a s   i nt r o duc e d.   T h e   s y s t e m   r e c ov e r s   f a c i a l   i m a ge s   a n f o rm s   b e h a v i o r a l   i de nt i f i c a t i o n   pa t t e rn s   b a s e o n   t hi s   b i o l o gi c a l   m o de l .   E xpe r i m e nt s   o n   100   A R   f a c i a l   i m a ge s   a c hi e v e a   96 . 9%   r e c o gn i t i o ra t e   us i n t h e   p r o po s e CB G M   a l go r i t hm ,   o ut pe r f o r m i n t r a d i t i o na l   a pp r o a c h e s   s uc h   a s   K - m e a n s - b a s e w e i gh t e m o dul a F R   a n d   N S CT - ba s e F R   w i t h   b i o ni c   pa t t e rn s .   T h e   C B G M   a l go r i t hm   a l s o   de m o n s t r a t e e f fe c t i ve n e s s   o n   t h e   U S P S   h a ndw r i t t e n   d i gi t   da t a s e t ,   e v e n   u n de o c c l us i o n .   S ha r a d a   e t   a l .   [17]   di s c us s e f ut ur e   di r e c t i o n s   f o r   e nha n c i n g   CN N s   t o w a r de v e l o pi n i n t e l l i ge n t   s y s t e m s   c a pa b l e   o f   pe r c e i v i n a n d   i nt e ra c t i n g   w i t v i s ua l   e n v i r o n m e n t s .   It   a l s o   r e v i e w e o bj e c t   de t e c t i o n   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i V o l .   40 ,   N o .   2 ,   N o v e m be r   20 25 :   9 53 - 9 67   958   i m p r o v e m e n t s   t hr o ug a n c h o r - b a s e m e t h o d s   a n r e gi o p r o po s a l   n e t w o r k s   (R P N s ),   l e a d i n t o   m o r e   a c c ur a t e   a nd  r e a l - t i m e   de t e c t i o n   m o de l s .   J i a n e t   a l .   [42] ,   r e s e a r c h e r s   a p pl i e t h e   m e a n   s hi f t   s e gm e nt a t i o n   m e t h o t o   i s o l a t e   ri c e   l e a f   l e s i o n s ,   i n c l udi ng   r i c e   b l a s t ,   r e d   b l i g ht ,   s t r i pe   b l i g ht ,   a n d   s h e a t b l i g h t .   T h e y   us e CN N s   a nd   A I   t o   e xt r a c t   l e s i o n   f e a t ur e s   a n d   i de nt i fy   o pt i m a l   c o m b i n a t i o n s ,   t h e n   a ppl i e S V M   w i t di f f e r e n t   a n v a l ue s .   T h e   hi g h e s t   r e c o gn i t i o n   ra t e   o f   96. 8%  w a s   a c h i e v e a t   C = a n g = 50,   hi g h l i g ht i n g   t h e   m e t h o d s   e ffe c t i ve n e s s   i n   a g r i c ul t u ra l   di s e a s e   de t e c t i o n.   J e   e t   al .   [ 43]   p r o po s e t h e   a t t e nt i o n - d r i v e dy n a m i c   g ra p c o n v o l ut i o n a l   n e t w o r (A D D - G CN ),   w h i c h   dy n a m i c a l l y   c o n s t r uc t s   g ra p h s   f o r   e a c h   i m a ge   us i n g   c o n t e nt - a w a r e   r e p r e s e nt a t i o n s   f r o m   a   s e m a n t i c   a t t e n t i o m o dul e   (S A M ).   E x t e n s i v e   e v a l ua t i o n s   o m ul t i - l a b e l   da t a s e t s MS - CO CO ,   V O C2007 ,   a n d   V O C2012 de m o n s t ra t e s upe r i o r   pe r f o r m a n c e   w i t m A P s   of   85. 2% ,   96. 0%,   a n 95. 5%,   r e s pe c t i v e l y .   L i u   [44]   p r e s e n t e t h e   s w i t ra n s f o r m e r ,   a   v i s i o T ra n s f o r m e t ha t   c o m pu t e s   hi e ra r c h i c a l   r e p r e s e n t a t i o n s   v i a   s h i f t e w i n do w s ,   e na b l i n l o c a l   a t t e n t i o w i t h   c r o s s - w i n do w   c o nn e c t i v i t y .   It   m a i nt a i n s   l i n e a c o m pl e xi t y   r e l a t i v e   t o   i n pu t   s i z e   a n d   s uppo r t s   m ul t i - s c a l e   m o de l l i ng.   S w i T ra n s f o r m e a c h i e v e s t a t e - of - t h e - a rt   r e s ul t s   i n   CO CO   o b j e c t   de t e c t i o n   a nd  A D E 20K   s e m a nt i c   s e gm e n t a t i o n.   M uj a hi d   e t   al .   [45]   a   l o w - c o s t   ge s t u r e   r e c o gn i t i o s y s t e m   w a s   p r o po s e us i n g   Y O L O v a n d   D a r kN e t - 53 .   T h e   m o de l   de t e c t s   ha n ge s t u r e s   f r o m   l o w - r e s o l ut i o n   i m a ge s   w i t h o ut   a dd i t i o n a l   p r e p r o c e s s i n a n d   pe r f o r m s   w e l l   i c o m pl e x   e n v i r o nm e n t s .   I t   a c h i e v e h i g pe r f o r m a n c e   w i t h   a   p r e c i s i o o f   98. 6 6% ,   r e c a l l   of   96. 7 0%,   F 1 - s c o r e   o f   96. 78 %,   a n d   o v e r a l l   a c c ura c y   o f   94. 88% ,   s u r p a s s i n g   S S D   a nd   V G G 16   m o de l s .   It   s uppo r t s   b o t s t a t i c   a n dy n a m i c   ge s t u r e   r e c o gn i t i o n   i r e a l   t i m e .   T h i s   s t udy   by   J a c ob   a n D a rn e y   [46]   pr o po s e a i m a ge - b a s e i de nt i f i c a t i o f r a m e w o r f o r   Io T   a ppl i c a t i o n s ,   c o m b i ni n g   P CA   w i t a   CN N .   P CA   e ffe c t i ve l y   e xt r a c t e ke y   fe a t ur e s ,   i m p r o v i n i m a ge   s e pa r a b i l i t y   a f t e r   pr o j e c t i o n .   E xpe ri m e nt a l   r e s ul t s   s h o w e t h e   p r o po s e m e t h o s u r pa s s e t r a d i t i o n a l   a pp r o a c h e s   i r e c o gn i t i o n   a c c ura c y .   Z h a ng  e t   a l .   [ 47] ,   a   DL   m o de l   fo r   i nt e l l i ge nt   w a s t e   c l a s s i f i c a t i o n   w a s   i nt r o duc e a n t e s t e o t h e   T r a s h N e t   d a t a s e t .   T h e   s y s t e m   a c h i e v e 95 . 87%   c l a s s i f i c a t i o n   a c c ura c y ,   de m o n s t ra t i n g   po t e n t i a l   f o us e   i m o b i l e   a n d   c o m put e r - b a s e s o r t i n s y s t e m s .   W a n g   e t   a l .   [48 ]   p r e s e n t e a   h y b r i a t t e nt i o m o de l   (B A - CN N fo r   a i r c r a f t   r e c o gn i t i o n ,   ut i l i z i ng  a   dua l - c ha nn e l   R e s N e t - 3 w i t h   e m b e dde c ha nn e l   a n d   s pa t i a l   a t t e n t i o m o dul e s .   T hi s   de s i g e nha n c e f i n e - gra i n e d   f e a t ur e   e xt ra c t i o n   a nd  r e duc e r e du n da n c y .   T h e   m o de l   a c hi e v e d   a n   8 9. 2 %   r e c o gn i t i o n   a c c ur a c y   o n   t h e   F G V C - a i r c ra f t   da t a s e t .   D e t   a l .   [ 49] ,   a a ug m e nt e d   g r a p c o n v o l ut i o n a l   n e t w o r k   ( A G CN w a s   p r o po s e f o r   l i f e l o n g   m u l t i - l a b e l   i m a ge   r e c o gn i t i o n.   B y   i n c o r po ra t i n a n   a ug m e n t e c o rr e l a t i o m a t ri x   (A CM )   a n r e l a t i o n s hi p - pr e s e r v i n g   l o s s ,   t h e   m o de l   m i t i g a t e s   c a t a s t r o phi c   f o r ge t t i n g   a n d   p r e s e r v e s   l a b e l   a s s o c i a t i o n s   a c r o s s   s e que nt i a l   t a s ks .   R e s ul t s   o n   t w o   m ul t i - l a b e l   b e n c h m a r ks   c o n f i r m e t he   m e t h o d s   e f fe c t i ve n e s s .   C h e n e t   a l .   [50] ,   a n   i m a ge   r e c o gn i t i o s y s t e m   n a m e c l a s s   a t t e nt i o n e t w o r k   ( CA N e t w a s   i nt r o duc e d.   I t   us e s   a   c l a s s - s pe c i f i c   a t t e n t i o e n c o di ng   (CA E )   m o dul e   t o   l e a rn  a   u ni que   di c t i o n a r y   f o r   e a c c a t e go r y ,   r e f i ni n g   f e a t u r e s   a c c o r di n gl y .   T h i s   a d a pt i v e   m e c h a n i s m   i m p r o v e pe r f o r m a n c e   i n   f i n e - g ra i n e a n m ul t i - l a b e l   i m a ge   c l a s s i f i c a t i o n   t a s ks .   V i s u a l i z a t i o n   r e s ul t s   c o n f i rm e CN N s   a b i l i t y   t o   l e a rn   di s t i n c t   f e a t u r e   r e p r e s e n t a t i o n s     pe r   c l a s s .     Cha i   e t   al .   [51] ,   a   CN N - b a s e m o de l   e nh a n c e w i t a   c us t o m   f e a t u r e   f us i o l a y e r   a n d   a   p r e - t ra i n e d   G oo gL e N e t   I n c e pt i o V 3   n e t w o r w a s   p r o po s e d.   T e s t e o t h e   L U N A 16  l u ng  n o du l e   d a t a s e t ,   t h e   o pt i m i z e m o de l   a c hi e v e 87. 18%  s e n s i t i v i t y   a n d   88 . 78%   a c c ura c y i m p r o v i n upo n   t h e   b a s e   In c e pt i o n   V 3   m o de l   by   2. 7%   a n d   2. 22% ,   r e s pe c t i v e l y .   F ur t h e r   t e s t i n g   w i t h   d i f fe r e n t   da t a s e t   ra t i o s   c o n f i r m e i t s   ge n e ra l i z a t i o a b i l i t y .   W o r k   [52]   p r o po s e a   w a v e l e t - b a s e m ul t i - s c a l e   m o t i o e s t i m a t i o a pp r o a c h.   It   us e s   a a ut o e n c o de r   w i t s pa r s i t y   c o n s t ra i nt s   f o r   c o m p r e s s i o n ,   f o l l ow e by   f e a t u r e   e xt ra c t i o a n d   o b j e c t   r e c o gn i t i o us i ng   a e nh a n c e d   CN N .   T h e   m o de l   r e a c h e d   u p   t o   9 9. 36 %   r e c o gn i t i o a c c ura c y   e ve w i t h o ut   l a rge - s c a l e   t r a i n i ng  da t a ,   o ut pe r f o r m i n g   t ra di t i o n a l   t e c hn i q ue s .   K ha s i m   e t   a l .   [53] ,   a   da t a s e t   o f   e i ght   m i c r o o r ga n i s m   t y p e s   w a s   us e t o   c o m pa r e   ML   an DL   a pp r o a c h e s   f o m i c r o o r ga ni s m   c l a s s i f i c a t i o n.   CN N s   o ut pe r f o r m e d   o t h e m o de l s   s uc a s   S V M ,   R a n do m   F o r e s t ,   a n K N N ,   a c h i e v i n g   t h e   h i g h e s t   a c c u r a c y .   W a ng  e t   al .   [54]   a na l y z e pe de s t r i a a c t i v i t y   r e c o gn i t i o n   us i n g   s ke l e t a l   d a t a   c a pt u r e b y   M i c r o s of t   K i n e c t .   E v a l ua t e d   o t h e   M S R 3D   d a t a s e t ,   t h e   p r o po s e a l go r i t h m   s i g n i f i c a n t l y   i m p r o ve de t e c t i o n   a c c ur a c y   w i t h i n   v i de o   s e que n c e s .   F urt h e rm o r e ,   w e   c o n duc t e a   s t udy   i n   t h i s   s e c t i o o r e c e n t   r e s e a r c d i s c us s i n g   t h e   us e   o f   DL   a l go ri t hm s   f o r   i m a ge   r e c o gn i t i o a p pl i c a t i o n s .   A s   de p i c t e i n   T a b l e   2   (i A P P E N D IX ) .   T h e   s t udy   r e ve a l e t h a t   DL   a l go ri t h m s   ha v e   s h o w n   p r o m i s i n r e s u l t s   i n   i m p rov i n g   i m a ge   r e c o gn i t i o n   a c c ur a c y ,   e s pe c i a l l y   i n   c o m pl e a n l a rge - s c a l e   da t a s e t s .   R e s e a r c h e r s   ha v e   a l s o   hi g h l i g h t e d   t h e   po t e n t i a l   o f   t h e s e   a l go ri t hm s   i n   v a r i o us   f i e l ds   s uc a s   h e a l t h c a r e ,   a ut o n o m o us   v e h i c l e s ,   a n d   s e c u r i t y   s y s t e m s .   A ddi t i o n a l l y ,   t h e   s t udy   i de nt i f i e t h e   n e e f o r   f ur t h e r e s e a r c h   t o   a dd r e s s   c h a l l e n ge s   s uc a s   i nt e rp r e t a b i l i t y ,   r o b us t n e s s ,   a n d   s c a l a b i l i t y   of   DL   m o de l s   i i m a ge   r e c o gn i t i o n   a pp l i c a t i o n s .     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Im age   r e c o gni t i on   us i ng  d e e l e ar n i ng:   a   r e v i e w   ( O s am M.   H as s an )   959   5.   M ET H O D   T h i s   r e v i e w   pa pe di s c us s e s   a   v a r i e t y   o f   DL   t e c hn i que s   a p pl i e d   i t h e   f i e l d   o f   i m a ge   r e c o gn i t i o n.   T h e   f o l l ow i n g   s e c t i o n s   de s c ri b e   t h e   m a i m e t h o ds   c o ve r e i t h e   l i t e r a t u r e ,   g r o upe by   t h e i r e s pe c t i ve   a r c hi t e c t u r a l   m o de l s   a nd  t e c hn i q ue s .     5. 1 .     Li t e r atu r e   s e ar c h   s t r ate g y   W e   c o n duc t e a n   e xt e n s i v e   s e a r c h   f o r   r e l e v a nt   pub l i c a t i o n s   us i ng  m ul t i pl e   a c a de m i c   d a t a b a s e s ,   i n c l udi ng:   I E E E   X p l o r e , S p ri n ge r L i n k , G o o gl e   S c h o l a r ,   a n i pm ugo . c o m   (a s   s ugge s t e f o r   t h e   l a t e s t   r e s e a r c h ) S e a r c h   t e rm s   i n c l ude i m a ge   r e c o gn i t i o n,   de e l e a rn i ng,   CN N ,   R e s N e t ,   VGG N e t ,   a nd  In c e pt i o n,   a m o n o t h e r s .   T hi s   a p p r o a c h   e n s u r e a   b r o a c a pt u r e   o f   s t udi e s   s pa nni n g   v a r i o us   m e t h o do l o gi e s   a n a pp l i c a t i o n s .     5. 2 .     I n c l u s i o n   an d   e x c l u s i o n   c r i t e r i a   F o r   t h e   pu rpo s e   of   r e f i n e m e nt   f o s e l e c t i o n ,   c r i t e ri a   f o r   i n c l us i o a nd  e xc l us i o n   w e r e   s t a t e a s   fo l l ow s :       In c l us i o c ri t e r i a P e e r - r e v i e w e a r t i c l e s   pub l i s h e w i t hi t h e   l a s t   f i v e   y e a r s ,   s t ud i e s   t a r ge t i ng  DL   m e t h o do l o gi e s   a ppl i e f o i m a ge   r e c o gni t i o n ,   a n d   s t ud i e s   t h a t   p r o v i de   e i t h e r   e m pi ri c a l   r e s ul t s   o r   t h e o r e t i c a l   i n s i g h t s .       E xc l us i o c r i t e ri a A n y   a r t i c l e s   t h a t   a r e   n o t   pe e r - r e v i e w e i nc l udi n g   o pi n i o p i e c e s   o r   e di t o ri a l s ,   s t udi e s   o t h e t ha t h o s e   t ha t   a r e   pe rt a i n i n g   t o   DL   o r   i m a ge   r e c o gn i t i o n ,   a n d   a n y   dupl i c a t e s   o a rt i c l e s   w i t i n s uf f i c i e n t   d a t a   f o r   a n a l y s i s .     5. 3 .     D ata   e x t r a c ti o n   an d   s yn th e s i s   F o r   e v e r y   r e s e a r c a rt i c l e   s e l e c t e by   t h e   r e v i e w e r s ,   s y s t e m a t i c   a n d   t h o r o ug i n f o r m a t i o s uc a s   t h e   f o l l ow i n w a s   e xt ra c t e d:     -   A ut h o r s   a n d   y e a o f   pub l i c a t i o n:   t o   put   t h e   s t udy   i nt o   pe r s pe c t i v e   i n   t e rm s   o f   t i m e   w i t h   t h e   a dv a n c e s .     -   Me t h o do l o gi e s :   a   b ri e f   s um m a r y   of   t h e   a r c hi t e c t u r e   w h i c i n c l ude s   DL   i n v e s t i ga t e (e . g. ,   CN N ,   R e s N e t ,   V G G N e t ).     -   D a t a s e t s   a nd  e v a l u a t i o m e a s u r e s :   i de n t i f i c a t i o n   o f   da t a s e t s   us e f o r   t r a i ni n g   a nd  t e s t i n g ,   a s   w e l l   a s   t h e   pe r f o r m a n c e   m e t r i c s   r e po rt e d.     -   R e s ul t s :   m a i c o n t r i b ut i o n s   a n d   r e s ul t s   f o r   e a c s t udy .     T h i s   s t r uc t u r e d   e xt r a c t i o a l s o   p r o v i de a   f o un da t i o f o r   c om pa ra t i v e   m e t h o do l o gi c a l   a n d   o ut c o m e   a n a l y s i s .     5. 4 .     M e th o d o l o gi c al   f r am e w o r k s   1.   L i t e ra t u r e   r e v i e w   pr o c e s s :   i t   w a s   do n e   w i t c a r e   t o   r e v i e w   s i g n i f i c a n t   w r i t i ngs   t hr o ug d a t a b a s e s   s uc h   a s   S pri n ge r L i n k,   G o o gl e   S c h o l a r,   a n d   I E E E   X pl o r e .   W e   s e l e c t e w o r t ha t   a s s i s t s   i i m a ge   r e c o gn i t i o w i t h   DL . I   c o n s i de r e t h e i a p p r o a c h,   f i n d i n gs ,   a nd  n e w   c o n c e pt s .   2.   A na l y s i s   of   r e s ul t s :   t h e   s t u di e s   t ha t   w e r e   e xa m i n e p r e s e nt e n u m b e r s   a n d   de s c r i pt i o n s .   T hi s   c o m p r i s e t h e i a c c ura c y   l e v e l ,   l e v e l   o f   pe r f o r m a n c e ,   a nd   s t r e n gt o f   t h e   m o de l s .   R e s ul t s   w e r e   p r e s e n t e d   i t a b ul a r   fo r m   t o   c o n t ra s t   t h e   pe r f o r m a n c e   m e a s u r e s   i d i f fe r e nt   a r c h i t e c t ur e s   a n d   a pp r o a c h e s .   3.   S y n t h e s i s   o f   f i n di ngs :   c o m b i n e   t h e   f i n d i n gs   i o r de r   t o   g r a s p   t h e   n e w   a dv a n c e m e nt s   i DL   i r e c o gn i z i n g   i m a ge s .   T h e   p a pe r   h a s   c e r t a i n   w ri t i n i s s ue s   a nd  i de n t i f i e s   a r e a s   t o   b e   w o r ke upo n   i n   t h e   f ut u r e   r e ga rdi n g   m o de l s   a n d   a t t a c ks .   T h i s   s t udy   ha s   a o v e r a l l   de s c ri pt i o o f   da t a   o a r c hi t e c t ur e s   o f   DL   a n d   pe r f o r m a n c e   a c r o s s   di f fe r e nt   a ppl i c a t i o n s .   T h e   r e s e a r c h   l o o ks   a t   c ha l l e n ge s   a n l i m i t a t i o n s   o f   DL ,   a s   w e l l   a s   g a ps   i t h e   r e s e a r c h   a ge nda .   T h e   s t u dy   c a l l s   f o r   i m p r o v e i n t e r p r e t a b i l i t y   of   m o de l s ,   r o b us t n e s s   a ga i n s t   a dv e r s a ri e s ,   a n d   e t h i c s   f r a m e w o r f o r   us i n g   s uc m o de l s .   T hi s   c a s e r v e   a s   a   g ui de   f o r   f ut u r e   r e s e a r c o DL   i i m a ge   r e c o gn i t i o n,   w h i c s h o ul b e   e m p ha s i z e i i m p r o v e i n t e r p r e t a b i l i t y   o f   t h e   m o de l ,   r o b us t n e s s   a g a i n s t   a dv e r s a r y   a t t a c ks ,   a n e t hi c a l   f ra m e w o r f o r   de pl o y m e n t .   If   y o r e w r i t e   t h e   a r t i c l e   i s uc h   a   m a nn e r ,   t h e t hi s   w i l l   c o n v e r t   t h e   i m a ge   t o   h u m a t e xt ,   a s   e xpe c t e d .       6.   R ES U LTS   A ND   DISCUSSIO N   T h e   l a t e s t   i n v e s t i g a t i o n s   ha v e   p r o v i de us   w i t s uc h   da t a ,   s ugge s t i ng  m a n y   i m po rt a nt   t r e n ds   a nd  o ut c o m e s   i n   i m a ge   r e c o gn i t i o n:     CN N s   c o n t i n ue   t o   c a ke w a l ov e r   a n y t h i ng  e l s e .   T h e y   h a v e   a l w a y s   b e e n   a nd  s t i l l   r e m a i t h e   v e r y   be s t   po pul a r   a r c hi t e c t u r e   f o r   m o s t   i m a ge   r e c o gn i t i o n   t a s ks .   T h e y   h a v e   c o n s t a n t l y   be e n   s h o w n   t o   o ut pe r f o r m   a n y t h i n g   e l s e   o a n y   c o n c e i v a b l e   be n c hm a rk.   M o r e   r e c e nt   w o r ks   h a v e   s h o w n   t ha t   de e n e t w o r ks   l i ke   R e s N e t   a nd  V G G N e t   w e r e   a b l e   t o   ge t   h i g h e r   a c c ura c y   be c a us e   c r ude   c o n s t r uc t s   c o ul b e   b ui l t   f u r t h e r   a pa rt   f o r   f e a t u r e   e xt ra c t i o n .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i V o l .   40 ,   N o .   2 ,   N o v e m be r   20 25 :   9 53 - 9 67   960     T r a i n i ng  d a t a   d i v e r s i t y   v s .   M o de l   pe r f o r m a n c e :   m o de l   e ffi c a c y   i i m a ge   r e c o gn i t i o n   w o r i s   c l o s e l y   a s s o c i a t e w i t t h e   di v e r s i t y   of   t ra i ni n g   da t a s e t s .   R e s e a r c s h o w s   t h a t   o n   d a t a s e t s   c o n s i s t i n g   o f   l a r ge   a m o u n t s   o f   v a r i a b i l i t y ,   s uc a s   I m a ge N e t ,   t h e r e   i s   go o ge ne r a l i z a t i o n,   a s   o ppo s e t o   s l i g h t   o r e s t r i c t e da t a s e t s .     A n o t h e t h e m e   t ha t   e m e r ge s   i n   t h e   l i t e ra t u r e   i s   i n t e r p r e t a b i l i t y :   i t   i s   a   c o n s t a n t   p r o b l e m   a nd  a a r e a   o c o n c e r f o r   DL   m o de l s .   T h e   b l a c k - box - l i ke   b e h a v i o r   e x h i b i t e by   t h e s e   m o de l s   gi v e s   c a us e   f o r   c o n c e rn   i n   s o m e   di s c i p l i n e s   l i ke   h e a l t w h e r e   i nt e r p r e t a b i l i t y   i s   i m pe ra t i v e .       T h e r e   a r e   n e w   de v e l o pm e n t s :   n e w e r   t r e n ds   s uc a s   a t t e nt i o n   m e c ha n i s m   i nt e g r a t i o n   a nd  h y b r i m o de l s   m i x i n c l a s s i c a l   a nd  de e p - l e a rni n t e c hni que s   h a v e   pe r f o r m e w e l l   i m a i nt a i n i ng  i n t e r p r e t a b i l i t y   w h i l e   i m p r o v i n g   pe r f o r m a n c e .     O o n e   ha n d ,   t h e   r e s ul t s   s pe a v o l um e s   o h o w   DL   h a s   t ra n s f o r m e i m a ge   r e c o gn i t i o n ;   h o w e ve r ,   t h e y   a l s o   s h o w   c h a l l e n ge s   t h a t   r e m a i u n s o l v e a n n e e d   re s e a r c h e r s   c o n s i de ra t i o F r a nkl y   s t a t e d,   o t h e r s ,   h o w e ve r ,   pe r s i s t   a s   c ha l l e n ge s   W a rra nt i ng  t h e   c o n s i de r a t i o of   r e s e a r c h e r s :       Ro b us t n e s s   i s   pa r a m o unt :   a s   r e a l - w o r l de pl oy m e n t   o f   i m a ge   r e c o gn i t i o n   s y s t e m s   be gi n s ,   r o b us t n e s s   a ga i n s t   a dv e r s a ri a l   a t t a c ks   a n d   v a r i a t i o n s   i n   i n pu t   q ua l i t y   b e c o m e s   e xt r e m e l y   i m po rt a nt .   T h e   l i t e r a t u r e   i n di c a t e s   t ha t   m o de l   r e s i l i e n c e   s h o ul d   b e   of   pr i m a r y   c o n c e rn   i n   f ut u r e   r e s e a r c h .       E xpl a i na b i l i t y   i s   a   n e c e s s i t y :   t h e   de m a nd   f o r   e xpl a i na b l e   A I   (X A I)   i s   b e c o m i n g   e v e r   m o r e   c ri t i c a l .   B ui l di n p r o c e dur e s   t o   e l uc i da t e   m o de l   de c i s i o n - m a ki ng  w i l l   n o t   o n l y   e nh a n c e   us e r   t r us t   b ut   a l s o   r e n de r   r e gul a t o r y   c o m pl i a n c e   f e a s i b l e   i n   s e n s i t i v e   a ppl i c a t i o n s .       E t hi c s :   t h e   i m pl i c a t i o n s   o f   t h e   de pl o y m e n t   o f   i m a ge   r e c o gni t i o t e c hn o l o gy   a r e   f a r - r e a c h i ng.   F a i rn e s s ,   a c c o un t a b i l i t y ,   a n d   t ra n s p a r e n c y   m us t   b e   e n s u r e s o   a s   t o   s t a v e   off   b i a s e s   a n d   t o   p r o t e c t   i ndi v i dua l   r i g ht s .   F ut u r e   r e s e a r c p r o gra m s   w i l l   h a v e   t o   c o n s i de r   e t hi c a l   i s s ue s   a t   l e a s t   a t   p a r   w i t t e c hni c a l   c o n s i de r a t i o n s .   DL   h a s   ra pi dl y   e n t e r e t h e   f i e l o f   i m a ge   r e c o gn i t i o n ,   e ff e c t i n a   s i g n i f i c a nt   c ha n ge   w i t h   i n c r e di b l e   upg r a de s   i n   a c c ur a c y   a n d   e f f i c i e n c y .   T hi s   r e v i e w   a t t e m pt s   t o   c o n s o l i da t e   f i n d i n gs   f r o m   v a ri o us   o r ga ni z a t i o n s ,   s h o w i n g   i m po rt a nt   a pp r o a c h e s   a n d   a dv a n c e m e nt s   i t h e   f i e l d.   O u a na l y s i s   r e v e a l s   t ha t   CN N s   r e m a i t h e   m a i n s t a y   m e t h o f o r   i m a ge   r e c o gn i t i o t a s ks   w h e r e   a u t o m a t i c   e xt ra c t i o o f   h i e r a r c hi c a l   f e a t u r e s   f r o m   i m a ge s   i s   c o n c e rn e d.   M o de l s   l i ke   R e s N e t   a n d   V G G N e t   a r e   p r o v e n   t o   pe r f o rm   e xc e e di n g l y   w e l l   o n   t h e   b e n c hm a rk  da t a s e t s ,   t h e r e by   de m o n s t r a t i n g   t h e   e ff i c a c y   of   de e pe r   n e t w o r ks   w i t a a dv a n c e d   s t r uc t u ra l   de s i g n.   T h e s e   m o de l s ,   h o w e v e r ,   a r e   s t i l l   g r e a t l y   c h a l l e nge i r e a l - l i f e   s i t ua t i o n s ,   w h e r e   t h e y   a r e   k n o w n   t o   b e   n o i s y   a n d   v a r y   i n   t e rm s   o f   i m a ge   qua l i t y .   A pa rt   f r o m   t ha t ,   t h e   a na l y s i s   a l s o   s h e ds   l i g ht   o n   a   c r i t i c a l   m a t t e r:   i n t e r p r e t a b i l i t y ,   a l t h o ug m o de l   a c c ura c y   ha s   i m p r o v e dr a m a t i c a l l y .   M o s t   DL   m o de l s   a r e   t r e a t e d   a s   b l a c bo xe s ,   s o   t h e   p r a c t i t i o n e r   i s   u n a b l e   t o   f i n d   o ut   h o w   a   de c i s i o n   w a s   m a de .   T h e   o ut c o m e - t r a n s pa r e n c y - n o t   b e i n t h e r e   i n v a r i a b l y   r e s ul t s   i n   l a c o f   t r us t   i n   a ut o m a t e s y s t e m s ,   e s pe c i a l l y   i n   hi g h - s t a ke   a r e a s   l i ke   h e a l t h c a r e   a nd   a ut o n o m o us   d ri v i n g.   T h e s e   r e s ul t s   a g r e e   w i t w ha t   o t h e pe o pl e   a r e   de s c r i b i n g   i t h e   l i t e r a t u r e ;   t ha t   i s ,   m o de l   r o b us t n e s s   a n d   ge n e ra l i z a t i o n   a r e   i m po r t a nt .   S e t t i n g   m o de l s   up   f o r   go o pe r f o r m a n c e   a c r o s s   v a r i e s c e na r i o s   h a v e   b e e n   s h o w n   t o   w o r w h e t r a i n e o n   l a rge ,   di v e r s e   d a t a s e t s .   H e n c e ,   t h e   n e c e s s i t y   f o r   t ra i ni n g   s e t s   t ha t   a r e   c o m p r e h e n s i v e   a nd   r e f l e c t i v e   of   r e a l - w o r l v a ri a b i l i t y .   B e s i de s ,   a ugm e nt i n g   s t a n d a r ds   s uc a s   d a t a   a u gm e n t a t i o a nd  t ra n s f e r   l e a rni n g ,   w hi c h   ha v e   b e e n   s h o w n   t o   e nha n c e   pe r f o r m a n c e ,   s h o ul b e c o m e   t h e   n o rm   t o   a pp l y   i upc o m i n g   s t ud i e s .   T h e   i m p l i c a t i o n s   o f   o ur   f i n d i n gs   a r e   m a ni f o l d.   O n   t h e   f o r e f r o n t   i s   a n   u r ge n t   n e e fo r   r e s e a r c h   o n   m o de l   i n t e r p r e t a b i l i t y .   M e t h o ds   t ha t   w o ul l o o k   i n t o   t h e   r a t i o n a l e   b e h i n t h e   de c i s i o n - m a k i n o f   DL   m ode l s   m a y   pa v e   t h e   w a y   fo r   g r e a t e r   t rus t   a n d   c o n s e que n t l y   w i de r   a do pt i o i f i e l ds   o f   s e r i o us   i m po rt a n c e . T h e y   s h o ul n o w   l o o a t   t h e   w e a kn e s s e s   hi g h l i g ht e i t h e   e xi s t i n g   a r c hi t e c t u r e s   a n d   p r i m a ri l y   t h e   c urr e nt   a dv e r s a ri a l   v ul n e r a b i l i t i e s .   H y b r i m o de l s   w h i c m e r ge   t h e   s t r o n g h o l ds   o f   t r a d i t i o n a l   i m a ge   p r o c e s s i n g   m o de l s   w i t t h e   a dv a n t a ge s   o f   DL   m a y   pr o v i d e   a   g r e a t   b oo s t   i t h o s e   a r e a s .   A s   t h e   f i e l d   m a t u r e s ,   a t t e ndi n g   t o   t h i ngs   l i ke   e t h i c a l   a s pe c t s   c o n c e rni n g   de pl oy m e n t   o f   i m a ge   r e c o gn i t i o n   t e c hn o l o gi e s   w i l l   b e   i m po r t a n t .   In  s um m a r y ,   a c c o un t a b i l i t y ,   a n t r a n s p a r e n c y   w i l l   m a t t e qui t e   a   l o t   w h e n   s uc t e c hn o l o gi e s   a r e   us e i c o n t e xt s   t ha t   i n f l ue n c e   a   pe r s o n s   f r e e do m s   a n d   r i ght s .   DL   ha s   p r o b a b l y   r a i s e t h e   b a o f   i m a ge   r e c o gn i t i o b e y o n d   p r a c t i c a l   l e v e l s   b ut   p r o m i s e s   t o   b e   a i nt e n s e   a r e n a   f o r   m uc a c t i v e   r e s e a r c b e c a us e   of  i n t e r p r e t a b i l i t y ,   r o b us t n e s s ,   a n t h e   e t h i c a l   i s s ue s   r e l a t e t o   t h e i r   a ppl i c a t i o n .   T hi s   w a y ,   t h e   v e r y   b e s t   c a n   b e   go t t e n   f r o m   t h e   t e c hn o l o gi e s   a nd  g ua ra n t e e a c r o s s   s e v e r a l   f i e l ds   f o r   go o d.       7.   C O N C LU S I O N   A N D   F U T U R W O R K   R e c e n t   a dv a n c e m e n t s   i DL   h a v e   t ra n s f o r m e t h e   f i e l d   o f   i m a ge   r e c o gn i t i o n ,   r e s ul t i n g   i s i g ni f i c a nt   pr o g r e s s   a c r o s s   v a ri o us   do m a i n s .   H ow e v e r ,   t h e   w i de s pr e a d   a do pt i o o f   DL   m o de l s   f o r   i m a ge   r e c o gn i t i o t a s ks   p r e s e nt s   c h a l l e n ge s   r e l a t e t o   c o m put a t i o na l   r e s o ur c e s   a n e f f i c i e n c y .   T h i s   p a pe r   p r o v i de s   a   c o n c i s e   s um m a r y   of   r e c e n t   r e s e a r c h   e f fo r t s   f o c us e o n   DL   - b a s e i m a ge   r e c o gn i t i o n   t e c hn i que s   a n d   t h e i a p pl i c a t i o n s   i n   d i v e r s e   f i e l ds .   T h e   go a l   i s   t o   e nha n c e   t h e   e ff e c t i v e n e s s   of   DL   m o de l s   f o r   i m a ge   r e c o gn i t i o t a s ks .   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Im age   r e c o gni t i on   us i ng  d e e l e ar n i ng:   a   r e v i e w   ( O s am M.   H as s an )   961   W e   a i m   t o   e nha n c e   DL   m o de l s   by   de ve l o pi n de e pe a n m o r e   c o m pl e n e u ra l   n e t w o r ks .   A ddi t i o n a l l y ,   w e   w i l l   e xpl o r e   n e w   t e c hn i q ue s   t o   o pt i m i s e   s e l f - l e a rni n a n r e i n f o r c e m e nt   l e a rni n g .   W e   pl a n   t o   e xpa n d   o u da t a s e t s   by   c o l l e c t i ng   m o r e   di v e r s e   a n d   c o m pr e h e n s i v e   da t a   t o   f ur t h e i m p r o v e   o ur  m o de l s .   T h i s   w i l l   e n a b l e   us   t o   t r a i n   o n   a   w i de v a ri e t y   of   i m a ge s   a n d   a ppl i c a t i o n s .   W e   l o o fo r w a r t o   e xpl o r i ng  t h e s e   o ppo r t u n i t i e s   i o ur  f ut u r e   w o r k.       A P P EN D I X     T a b l e   2 .   L i t e ra t u r e   r e v i e w   s um m a r y   Re f .   a n d   A u t h o r   Re s e a rc h   t i t l e   S u m m a r y   G a p   o f   r e s e a rc h   T i a n   [1 ] .   A rt i fi c i a l   In t e l l i g e n c e   I m a g e   Re c o g n i t i o n   M e t h o d   Ba s e d   o n   Co n v o l u t i o n a l   N e u ra l   N e t w o rk   A l g o ri t h m   T h i s   p a p e p re s e n t s   a   n o v e l   CN N   a l g o ri t h m   t h a t   l e a r n s   d e e p   i m a g e   fe a t u r e s   i n   p a ra l l e l   b y   i n c o r p o ra t i n g   a   re c u rr e n t   n e u ra l   n e t w o rk .   F u rt h e r m o r e ,   S h o r t Cu t 3 - R e s N e t ,   a   n e w   r e s i d u a l   m o d u l e ,   i s   b u i l t   u s i n g   R e s N e t s   s k i p   c o n v o l u t i o n   l a y e c o n c e p t .   B y   l e a rn i n g   a   v a ri e t y   o i m a g e   fe a t u re s ,   t h e   p r o p o s e d   a rc h i t e c t u r e   s e e k s   t o   i m p r o v e   t h e   c o n v o l u t i o n a l   n e u ra l   n e t w o rk a c c u ra c y   i n   fe a t u r e   e x t ra c t i o n   a n d   i m a g e   re c o g n i t i o n .   T h e   a rc h i t e c t u r e   u s e s   a   c h a n n e l   a t t e n t i o n   m o d u l e   a n d   a   m u l t i - s c a l e   fe a t u re   e x t ra c t i o n   m o d u l e   t o   p r i o r i t i z e   a n d   e x t ra c t   k e y   i m a g e   fe a t u re s   to   a c c o m p l i s h   t h i s .   F u rt h e r m o r e ,   a   n e w   l o s s   f u n c t i o n   t a i l o r e d   t o   t h e   p ro p o s e d   a rc h i t e c t u re   i s   p r e s e n t e d ,   w h i c h   i m p r o v e s   t h e   c o n v o l u t i o n a l   n e u ra l   n e t w o rk s   a c c u ra c y   a n d   n o i s e   t o l e ra n c e .   T h e   p r o p o s e d   a r c h i t e c t u re   i s   e v a l u a t e d   o n   v a ri o u s   b e n c h m a rk   d a t a s e t s   a n d   o u t p e r fo r m s   o t h e s t a t e - of - t h e - a rt   a l g o r i t h m s   o n   a l l   d a t a s e t s ,   a c h i e v i n g   h i g h   a c c u ra c y   o n   i m a g e   re c o g n i t i o n   t a s k s .   T h e   p a p e d o e s   n o t   a d d r e s s   t h e   c o m p u t a t i o n a l   c o m p l e x i t y   o t h e   p ro p o s e d   a rc h i t e c t u r e ,   w h i c h   i s   a n   i m p o rt a n t   f a c t o t o   t a k e   i n t o   a c c o u n t   f o r   re a l - t i m e   a p p l i c a t i o n s .   F u rt h e r m o r e ,   t h e   p a p e f a i l s   t o   e x a m i n e   h o w   v a ri o u s   h y p e r p a ra m e t e r s   a ffe c t   t h e   a r c h i t e c t u re p e r f o r m a n c e ,   w h i c h   w o u l d   b e   i m p o r t a n t   k n o w l e d g e   f o r   p ra c t i t i o n e r s   w i s h i n g   t o   u s e   t h e   a rc h i t e c t u r e   i n   t h e i r   o w n   a p p l i c a t i o n s .   H u i x i a n   [5 ] .   T h e   A n a l y s i s   o f   P l a n t s   I m a g e   Re c o g n i t i o n   Ba s e d   o n   DL   a n d   A rt i f i c i a l   N e u ra l   N e t w o rk   P l a n t   l e a r e c o g n i t i o n   t e c h n i q u e   b a s e d   o n   i n t e l l i g e n t   a n a l y s i s   a n d   i m a g e s   i s   p re s e n t e d   i n   t h i s   a rt i c l e .   It   i s   d i s c u s s e d   h o w   t o   e x t ra c t   r e l a t i v e   s h a p e   a n d   l e a t e x t u re   i n fo r m a t i o n   u s i n g   t h r e s h o l d ,   e d g e ,   a n d   a r e a   s e g m e n t a t i o n .   In   re s p o n s e   t o   t h e   l o w   i d e n t i f i c a t i o n   ra t e   o e x i s t i n g   c l a s s i f i e r s ,   t h e   a rt i c l e   s u g g e s t s   a n   a rt i fi c i a l   n e u ra l   n e t w o rk   c l a s s i fi c a t i o n   a p p r o a c h   b a s e d   o n   t h e   b a c k p ro p a g a t i o n   e rr o a l g o ri t h m -   (B P   a l g o ri t h m )   t h a t   c a n   i d e n t i fy   p l a n t   l e a v e s ,   a n d   i t   h a s   s h o w n   p ro m i s i n g   re s u l t s .   T h e   e x p e ri m e n t a l   f i n d i n g s   d e m o n s t ra t e   t h e   e ffe c t i v e n e s s   o t h e   a rt i f i c i a l   n e u ra l   n e t w o rk   (B P )   t e c h n i q u e   a n d   o ffe a   p o t e n t i a l   a v e n u e   fo r   f u t u re   r e s e a rc h   fo i m a g e - b a s e d   p l a n t   l e a r e c o g n i t i o n   t e c h n o l o g y .   T h i s   m e t h o d   m i g h t   b e   u s e f u l   i n   t h e   f o l l o w i n g   d i s c i p l i n e s :   p l a n t   i d e n t i f i c a t i o n ,   e n h a n c e d   v a ri e t y   i d e n t i f i c a t i o n ,   p l a n t   e c o l o g i c a l   m o n i t o ri n g ,   a n d   o t h e r   r e l a t e d   f i e l d s .   T h i s   a rt i c l e   p r e s e n t s   p l a n t   l e a re c o g n i t i o n   t e c h n o l o g y - c e n t r e d   i n t e l l i g e n t   a n a l y s i s   a n d   p h o t o s .   T h e   u s e   o f   t h re s h o l d ,   e d g e ,   a n d   r e g i o n   s e g m e n t a t i o n   t o   e x t ra c t   re l a t i v e   s h a p e   a n d   l e a f   t e x t u r e   i n fo r m a t i o n   i s   c o v e r e d .   T h e   p a p e s u g g e s t s   a n   a rt i fi c i a l   n e u ra l   n e t w o rk   c l a s s i fi c a t i o n   a p p r o a c h   b a s e d   o n   t h e   b a c k p r o p a g a t i o n   e rr o r   a l g o ri t h m   (BP   a l g o r i t h m t o   r e c o g n i z e   p l a n t   l e a v e s   i n   re s p o n s e   t o   t h e   p o o i d e n t i f i c a t i o n   ra t e   o c u rre n t   c l a s s i f i e r s ,   a n d   i t   h a s   d e m o n s t ra t e d   p r o m i s i n g   r e s u l t s .   T h e   re s u l t s   o t h e   e x p e ri m e n t   s h o w   h o w   s u c c e s s f u l   t h e   a rt i f i c i a l   n e u ra l   n e t w o rk   (BP )   m e t h o d   i s ,   a n d   t h e y   a l s o   p r e s e n t   a   p o s s i b l e   d i r e c t i o n   fo r   f u rt h e r   s t u d y   i n   t h e   f i e l d   o i m a g e - b a s e d   p l a n t   l e a re c o g n i t i o n   t e c h n o l o g y .   P l a n t   i d e n t i f i c a t i o n ,   e n h a n c e d   v a r i e t y   i d e n t i f i c a t i o n ,   p l a n t   e c o l o g i c a l   m o n i t o ri n g ,   a n d   o t h e r e l e v a n t   d i s c i p l i n e s   m i g h t   a l l   b e n e f i t   f ro m   t h i s   t e c h n i q u e .   T a n g   a n d   S h a b a z . [1 2 ] .   A   N e w   F a c e   I m a g e   Re c o g n i t i o n   A l g o ri t h m   Ba s e d   o n   Ce r e b e l l u m - Ba s a l   G a n g l i a   M e c h a n i s m   It   i s   s u g g e s t e d   t o   u s e   a   n o v e l   f a c e   re c o g n i t i o n   a l g o r i t h m   t h a t   i s   b a s e d   o n   t h e   c e r e b e l l u m - b a s a l   g a n g l i a   p r o c e s s .   T h i s   a l g o ri t h m   d e m o n s t ra t e s   h i g h   r e c o g n i t i o n   a c c u ra c y   e v e n   i n   t h e   p r e s e n c e   o i l l u m i n a t i o n   v a ri a t i o n s   a n d   o c c l u s i o n .   T h e   CBG M   a l g o ri t h m   i s   m o r e   e ff i c i e n t   a t   l e a r n i n g   a n d   a d a p t i n g   t o   n e w   d a t a   c o m p a r e d   t o   t ra d i t i o n a l   a l g o r i t h m s .   I n   a   c o m p a ri s o n   w i t h   o t h e s t a t e - of - t h e - a rt   a l g o ri t h m s ,   s u c h   a s   t h e   F R   a l g o ri t h m   b a s e d   o n   N S CT   a n d   b i o n i c   p a t t e r n ,   a n d   t h e   w e i g h t e d   m o d u l a F R   a l g o ri t h m   b a s e d   o n   t h e   K - m e a n s   c l u s t e ri n g   m e t h o d ,   t h e   p r o p o s e d   a l g o ri t h m   o u t p e r fo r m s   t h e m   i n   t e r m s   o f   re c o g n i t i o n   a c c u ra c y .   T h e   CB G M   a l g o ri t h m   i s   s o l e l y   a s s e s s e d   o n   t w o   b e n c h m a rk   d a t a s e t s ,   a n d   i t   w o u l d   b e   i n t r i g u i n g   t o   o b s e rv e   i t s   p e r f o r m a n c e   o n   o t h e d a t a s e t s .   F u rt h e rm o r e ,   t h e   a u t h o r s   o m i t   a n y   d e t a i l s   r e g a r d i n g   t h e   c o m p u t a t i o n a l   c o m p l e x i t y   o f   t h e   C BG M   a l g o r i t h m ,   w h i c h   i s   c ru c i a l   fo r   r e a l - t i m e   a p p l i c a t i o n s .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i V o l .   40 ,   N o .   2 ,   N o v e m be r   20 25 :   9 53 - 9 67   962   T a b l e   2 .   L i t e ra t u r e   r e v i e w   s um m a r y   ( c ont i nu e d)   Re f .   a n d   A u t h o r   Re s e a rc h   t i t l e   S u m m a r y   G a p   o f   r e s e a rc h   W a j d i   e t   a l .   [1 7 ] .   D e e p   L e a rn i n g   T e c h n i q u e s   fo Im a g e   R e c o g n i t i o n   a n d   O b j e c t   D e t e c t i o n   T h e   p a p e r   o ffe r s   a   t h o ro u g h   re v i e w   o r e c e n t   a d v a n c e m e n t s   i n   DL   fo r   i m a g e   r e c o g n i t i o n   a n d   o b j e c t   d e t e c t i o n .   I t   a d d re s s e s   t h e   c o n s t ra i n t s   o DL   t e c h n i q u e s   a n d   p ro p o s e s   p o t e n t i a l   r e m e d i e s .   F u rt h e r m o r e ,   t h e   p a p e e x t e n s i v e l y   c o v e r s   r e c e n t   d e v e l o p m e n t s   i n   DL   fo i m a g e   r e c o g n i t i o n   a n d   o b j e c t   d e t e c t i o n .   It   a n a l y z e s   t h e   l i m i t a t i o n s   o DL   t e c h n i q u e s   a n d   o ffe r s   p o t e n t i a l   s o l u t i o n s .   CN N s   h a v e   b e e n   s h o w n   t o   b e   i n c r e d i b l y   e ffe c t i v e   i n   p r o b l e m s   i n v o l v i n g   i m a g e   r e c o g n i t i o n .   T h e s e   a l g o r i t h m s   a r e   a b l e   t o   r e c o g n i z e   c o m p l e x   p a t t e rn s   a n d   p r o v i d e   a c c u ra t e   p re d i c t i o n s   b y   d i r e c t l y   l e a r n i n g   h i e ra r c h i c a l   r e p r e s e n t a t i o n s   o f   v i s u a l   c h a ra c t e ri s t i c s   f r o m   ra w   p i x e l   i n p u t .   D e v e l o p m e n t s   i n   l a r g e - s c a l e   a n n o t a t e d   d a t a s e t s   a n d   D L   a rc h i t e c t u r e s   h a v e   a c c e l e ra t e d   t h e   p a t h   t o w a r d s   e x t re m e l y   a c c u ra t e   a n d   e ff i c i e n t   s y s t e m s .   A   c o m p r e h e n s i v e   c o m p a ri s o n   o f   s e v e ra l   D L   m e t h o d s   fo o b j e c t   i d e n t i fi c a t i o n   a n d   p i c t u r e   r e c o g n i t i o n   i s   l a c k i n g   f r o m   t h e   s t u d y .   A d d i t i o n a l l y ,   i t   d o e s   n o t   d e l v e   i n t o   t h e   c o m p u t a t i o n a l   c o m p l e x i t y   o f   d i ffe r e n t   DL   m e t h o d s ,   n o r   d o e s   i t   ad d r e s s   t h e   s e c u ri t y   a n d   p r i v a c y   i m p l i c a t i o n s   a s s o c i a t e d   w i t h   t h e s e   t e c h n i q u e s .   J i a n g   e t   a l .   [4 2 ] .   Im a g e   r e c o g n i t i o n   o f   fo u ri c e   l e a d i s e a s e s   b a s e d   o n   DL   a n d   s u p p o rt   v e c t o r   m a c h i n e   A   n e w   a p p ro a c h   t o   i d e n t i fy i n g   ri c e   d i s e a s e s   u s i n g   a   c o m b i n a t i o n   o DL   a n d   S V M   i s   p r o p o s e d .   T h i s   m e t h o d   o u t p e r fo r m s   t ra d i t i o n a l   m e t h o d s   l i k e   b a c k p ro p a g a t i o n   n e u ra l   n e t w o rk s ,   a c h i e v i n g   a n   a v e ra g e   a c c u ra c y   o 9 6 . 8 % .   T h e   s i g n i fi c a n c e   o ri c e   d i s e a s e   re c o g n i t i o n   a n d   t h e   c h a l l e n g e s   i t   p r e s e n t s   a r e   a l s o   d i s c u s s e d .   T h e   p r o p o s e d   m e t h o d   i s   ro b u s t   a n d   c a n   a c c u ra t e l y   i d e n t i fy   v a ri o u s   t y p e s   o f   ri c e   d i s e a s e s ,   i n c l u d i n g   ri c e   b l a s t ,   s h e a t h   b l i g h t ,   a n d   b a c t e ri a l   l e a f   b l i g h t .   A d d i t i o n a l l y ,   i t   i s   e ff i c i e n t   a n d   c a p a b l e   o p r o c e s s i n g   a   l a rg e   n u m b e r   o i m a g e s   q u i c k l y ,   p o t e n t i a l l y   i m p a c t i n g   c r o p   y i e l d s   a n d   fo o d   s e c u ri t y .   T h e   s u g g e s t e d   a p p ro a c h   r e l i e s   o n   a   DL   m o d e l   t h a t   n e c e s s i t a t e s   a   s u b s t a n t i a l   q u a n t i t y   o t ra i n i n g   d a t a .   H o w e v e r,   i t s   e ffe c t i v e n e s s   o n   o t h e d a t a s e t s   b e s i d e s   t h e   o n e   i t   w a s   t e s t e d   o n   r e m a i n s   u n c e rt a i n .   A d d i t i o n a l l y ,   t h e   p a p e f a i l s   t o   a d d r e s s   t h e   c o m p u t a t i o n a l   e x p e n s e   a s s o c i a t e d   w i t h   t h e   p ro p o s e d   m e t h o d .   Y e   e t   a l .   [4 3 ] .   A t t e n t i o n - D ri v e n   D y n a m i c   G ra p h   Co n v o l u t i o n a l   N e t w o rk   fo M u l t i - L a b e l   I m a g e   Re c o g n i t i o n   T h i s   p a p e r   p r o p o s e s   a   n o v e l   m e t h o d   f o m u l t i - l a b e l   i m a g e   re c o g n i t i o n   b y   e m p l o y i n g   a t t e n t i o n - b a s e d   d y n a m i c   g ra p h   c o n v o l u t i o n a l   n e t w o rk s   (A D D - G CN ).   W i t h   t h e   h e l p   o f   t h e   s e m a n t i c   a t t e n t i o n   m o d u l e   (S A M ) ,   A D D - G CN   e x t ra c t s   c a t e g o r y - s p e c i fi c   r e p r e s e n t a t i o n s   f r o m   t h e   i n p u t   fe a t u re   m a p .   S u b s e q u e n t l y ,   t h e s e   re p r e s e n t a t i o n s   u n d e r g o   a n a l y s i s   b y   a   n o v e l   d y n a m i c   G CN ,   w h i c h   i m p r o v e s   re c o g n i t i o n   a c c u ra c y   b y   t a k i n g   i n t o   a c c o u n t   c o n t e n t - a w a r e   c a t e g o r y   r e l a t i o n s   fo r   e v e r y   i m a g e .   O n   s e v e ra l   p u b l i c l y   a v a i l a b l e   m u l t i - l a b e l - i m a g e   r e c o g n i t i o n   b e n c h m a rk s ,   s u c h   a s   MS - C O CO ,   P a s c a l   V O 2 0 0 7 ,   a n d   P a s c a l   V O C   2 0 1 2 ,   A D D - G CN   p e r fo r m s   b e t t e t h a n   c u rre n t   m o d e l s .   B y   c o n c e n t ra t i n g   o n   d i s t i n c t   a r e a s ,   t h e   c o m b i n a t i o n   o S A M   a n d   D - G CN   i m p ro v e s   t h e   m o d e l s   p e r fo r m a n c e .   T h e   a c c u ra c y   o f   t h e   m o d e l   i s   f u rt h e r   e n h a n c e d   b y   t h e   d y n a m i c   G CN   i n   A D D - G CN ,   w h i c h   r e c o rd s   c o n t e n t - a w a r e - c a t e g o r y   r e l a t i o n s   fo e v e ry   i m a g e .   A D D - G CN   i s   a   s o p h i s t i c a t e d   m o d e l   w i t h   n u m e ro u s   h y p e r p a ra m e t e r s m a k i n g   i t   c h a l l e n g i n g   t o   o p t i m i z e   i t s   p e r f o r m a n c e   f o s p e c i fi c   d a t a s e t s .   A d d i t i o n a l l y ,   i t s   c o m p u t a t i o n a l   d e m a n d s   re s t ri c t   i t s   a p p l i c a b i l i t y   i n   r e a l - t i m e   a n d   m o b i l e   s e t t i n g s .   F u rt h e r m o r e ,   t h e   p a p e r   l a c k s   a n   e v a l u a t i o n   o f   A D D - G CN   o n   a   b ro a d e a rra y   o f   m u l t i - l a b e l   i m a g e   re c o g n i t i o n   d a t a s e t s ,   w h i c h   w o u l d   p ro v i d e   v a l u a b l e   i n s i g h t   i n t o   i t s   g e n e ra l i z a t i o n   c a p a b i l i t i e s .   Z .   L i u   e t   a l .   [4 4 ] .   S w i n   T ra n s f o r m e r:   H i e ra r c h i c a l   V i s i o n   T ra n s fo r m e u s i n g   S h i ft e d   W i n d o w s   T h e   p a p e p r e s e n t s   t h e   S w i n   T ra n s f E n s u ri n g   n o v e l   a rc h i t e c t u r e   t a i l o r e d   fo c o m p u t e r   v i s i o n   t a s k s .   I t s   h i e ra rc h i c a l   s t ru c t u r e   a n d   s h i ft e d   w i n d o w i n g   s c h e m e   a d d r e s s   t h e   c h a l l e n g e s   o a p p l y i n g   T ra n s fo r m e r s   t o   v i s i o n ,   m a k i n g   i t   m o r e   e ff i c i e n t   a n d   e n a b l i n g   m o d e l l i n g   a t   d i ffe r e n t   s c a l e s .   A d d i t i o n a l l y ,   S w i n   T ra n s fo r m e r   h a s   a c h i e v e d   t o p - n o t c h   p e r fo r m a n c e   i n   i m a g e   c l a s s i f i c a t i o n ,   o b j e c t   d e t e c t i o n ,   a n d   s e m a n t i c   s e g m e n t a t i o n ,   s h o w c a s i n g   i t s   e ffe c t i v e n e s s   a n d   v e r s a t i l i t y .   T h e   S w i n   T ra n s f o r m e i s   a   m o d e l   w i t h   h i g h   c o m p u t a t i o n a l   c o m p l e x i t y ,   w h i c h   m a y   r e s t ri c t   i t s   p ra c t i c a l   a p p l i c a t i o n   f o r   l a rg e   d a t a s e t s   i n   c e rt a i n   s c e n a ri o s .   M o r e   a b l a t i o n   r e s e a rc h   t o   e x a m i n e   t h e   i m p a c t s   o f   v a ri o u s   S w i n   T ra n s fo r m e r   c o m p o n e n t s   w o u l d   h a v e   i m p ro v e d   t h e   p a p e r s   k n o w l e d g e   o t h e   a d v a n t a g e s   a n d   d i s a d v a n t a g e s .   M u j a h i d   e t   a l .   [4 5 ] .   Re a l - T i m e   H a n d   G e s t u r e   R e c o g n i t i o n   Ba s e d   o n   D e e p   L e a r n i n g   Y O L O v 3   M o d e l   T h e   p a p e i n t ro d u c e s   a   n o v e l   m e t h o d   fo h a n d   g e s t u re   r e c o g n i t i o n   u s i n g   Y O L O   v 3   a n d   D a rk N e t - 5 3   c o n v o l u t i o n a l   n e u ra l   n e t w o rk s .   T h i s   m o d e l   d o e s   n o t   r e q u i r e   a n y   a d d i t i o n a l   p r e p r o c e s s i n g ,   i m a g e   f i l t e r i n g ,   o i m a g e   e n h a n c e m e n t ,   a n d   h a s   s h o w n   h i g h   a c c u ra c y   i n   c o m p l e x   e n v i r o n m e n t s   a n d   l o w - r e s o l u t i o n   i m a g e s .   T h e   p a p e a l s o   e x p l o r e s   p o t e n t i a l   a p p l i c a t i o n s   o f   h a n d   g e s t u r e   r e c o g n i t i o n ,   s u c h   a s     T h e   s y s t e m   w a s   t e s t e d   o n   a   d a t a s e t   c o n t a i n i n g   a   l i m i t e d   n u m b e r   o h a n d   g e s t u re s ,   s u g g e s t i n g   t h a t   i t   m a y   s t ru g g l e   w i t h   a   l a r g e r   a n d   m o r e   d i v e r s e   d a t a s e t .   A d d i t i o n a l l y ,   t h e   s y s t e m   i s   u n a b l e   t o   re c o g n i z e   g e s t u re s   i n   r e a l - t i m e ,   w i t h   t h e   a u t h o r s   n o t i n g   t h a t   i t   t a k e s   a p p r o x i m a t e l y   1   s e c o n d   t o   p r o c e s s   a   s i n g l e   f ra m e .   T h i s   s l o w   p r o c e s s i n g     Evaluation Warning : The document was created with Spire.PDF for Python.