I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   40 ,   N o .   1 O c t o be r   2 025 ,   pp .   397 ~ 410   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 40 .i 1 . pp 397 - 410             397     Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   S e n t i m e n t   a n a l y si o f   Y o u T u b e   v i d e o s c o m m e n t s f o r   c h i l d r e n   u si n g   m a c h i n e   l e a r n i n g   a n d   d e e p   l e a r n i n g       A m al   A l r e h ai l i ,   A b d u l l ah   A l s a e e d i ,   Wa e l   M . S .   Y afo o z   D e p a rt m e n t   o C o m p u t e S c i e n c e ,   C o l l e g e   o C o m p u t e S c i e n c e   a n d   E n g i n e e ri n g ,   T a i b a h   U n i v e r s i t y ,   M e d i n a ,   S a u d i   A ra b i a       A r ti c l e   I n fo     A B S TR A C T   Ar t i c l e   h i s t or y :   R e c e i v e d   O c t   19 2024   R e v i s e J un   15 2025   A c c e pt e J ul   3 2025       N o w a da y s ,   o nl i n e   c o nne c t i v i t y   i s   i nc r e a s i ng   w i t h   t he   r a p i d   g r o w t h   o f   t he   w o r l w i de   w e b .   C o ns e q ue n t l y ,   c o nt e nt   s h a r e a c r o s s   n um e r o us   pl a t f o r m s   v a r i e s   i a pp r o pr i a t e ne s s .   i t   i s   ne c e s s a r y   t o   e n s ur e   t he   s ui t a b i l i t y   of   t he   c o nt e nt   s i nc e   c h i l d r e a r e   a m o ng   t he   c o ns um e r s   o f   o nl i ne   c o nt e n t .   A   l o t   o f   c hi l d r e n   w a t c v i de o s   o Y o uT ub e   t he s e   da y s ,   a nd  s uc p l a t f o r m s   c a n   c o nt a i u s e f ul   c o nt e nt .   H o w e v e r ,   s uc v i de o s   c a n   a l s o   ha v e   a   ne g a t i v e   i m pa c t   o c hi l d r e n .   T he   s u i t a b i l i t y   o f   t he s e   v i de o s   c a be   d e t e r m i n e d   t hr o ug s e n t i m e n t   a n a l y s i s   t o   r e f i ne   t h e   c o nt e nt   f o r   c hi l dr e n   o Y o uT ube ,   by   c l a s s i f y i ng   t he   po s t e d   c o m m e nt s   a s   e i t he r   po s i t i v e   o r   ne g a t i v e .   T he r e f o r e ,   t hi s   s t udy   ut i l i z e s   n a t ur a l   l a ng ua g e   pr o c e s s i ng   m e t ho ds ,   m a c hi n e   l e a r n i ng   c l a s s i f i e r s   ( M L C s )   a nd   de e p   l e a r n i ng   m o de l s   ( D L M s )   t o   de t e c t   a n c a l s s i f y   ne g a t i v e   us e r   c o m m e nt s   us i ng   t he   po po s e da t a s e t .   D i f f e r e nt   M L C s   s uc h   a s   r a ndo m   f o r e s t   ( R F ) ,   l o g i s t i c   r e g r e s s i o ( L R ) ,   m u l t i no m i a l   N a ï v e   B a y e s   ( M N B ) ,   d e c i s i o t r e e   ( D T ) ,   K - n e a r e s t   n e i g hbo ur   ( K N N ) ,   A da B o o s t ,   a n d   s uppo r t   v e c t o r   m a c hi ne   ( S V M )   h a v e   b e e n   us e d .   A ddi t i o na l l y ,   D L M s   w e r e   a l s o   us e d   s uc a s   a r t i f i c i a l   n e ur a l   ne t w o r k   ( A N N ) ,   c o nv ul t i o n a l   n e ur a l   ne t w o r k   ( C N N )   a nd   l o ng   s ho r t - t e r m   m e m o r y   ( L S T M ) .   O v e r a l l ,   t h e   e xpe r i m e nt a l   r e s ul t s   s ho w e d   t h a t   t h e   L R ,   R F ,   A da B o o s t ,   A N N   a nd  L S T M   c l a s s i f i e r s   o ut pe r f o r m e a l l   t h e   o t h e r   c l a s s i f i e r s   i n   t e r m s   o f   a c c ur a c y .   Ke y w or d s :   D e e l e a rni n g     M a c hi n e   l e a rni n g     S e n t i m e n t   a na l y s i   U s e r   c o m m e nt s   Y o uT ub e     T hi s   i s   an   ope n   ac c e s s   ar t i c l e   u nde r   t he   C C   B Y - SA   l i c e ns e .     Cor r e s pon di n g   Au t h or :   A m a l   A l r e ha i l i     D e pa rt m e n t   o f   Co m put e S c i e n c e ,   Co l l e ge   o f   Co m put e r   S c i e n c e   a nd  E n g i n e e r i ng,   T a i b a U n i v e r s i t y   M e di na ,   S a u di   A r a b i a .   E m a i l :   a m a l . a l r e h i l y @ gm a i l . c o m       1.   I N TR O D U C TI O N     In  t hi s   d a y   a n d   a ge ,   w e   a r e   l i v i n i n   a e ra   w h e r e   s o c i a l   m e di a   i s   a n   e s s e nt i a l   p a rt   o f   o ur   da y - to - da y   l i f e .   T h i s   e ra   o f   s o c i a l   m e di a   c o n t a i n s   s e v e r a l   p r o m i n e n t   s o c i a l   m e di a   n e t w o r ks ,   o n   w hi c us e r s   a r e   a b l e   t o   e xpr e s s   t h e i o pi ni o n s   a nd   e m o t i o n s   c o n s t a nt l y   i t h e   f o r m   of   m i c r o b l o ggi n g.   A e xa m p l e   o f   t h e s e   v a ri o us   s oc i a l   m e d i a   n e t w o r ks   w o ul b e   p l a t f o r m s   s uc a s   F a c e book,   Y o uT ub e ,   T w i t t e r   a n d   I n s t a g ra m .   S uc po s t s   a n i n t e ra c t i o n s   w i t h   o t h e r   po s t s   c a b e   ut i l i s e d   t o   m a ke   r e l e v a n t   r e c o m m e n da t i o n s   t o   us e r s ,   t h e r e fo r e   b e i n g   us e f ul   t o   t h e   us e o n   a   d a i l y   b a s i s .   D ue   t o   t hi s ,   r e s e a r c b a s e o us e r s   f e e l i n gs   g a i n e d   w i de   a t t e n t i o l a t e l y   us i n g   S e nt i m e nt   A na l y s i s .   A dd i t i o n a l l y ,   t h e   p r o c e s s   of   de t e c t i n g   a   us e f e e l i n g   ha s   b e e p r o po s e i t h e   N L P   a r e a   i o rde t o   s t udy   t h e   a t t i t ude   o f   t h e   us e a nd   t h e   o ve r a l l   f e e l i n gs   o f   t h e   us e r ,   t h i s   i s   c o m m o nl y   r e f e r r e d   t o   a s   o pi n i o n   m i ni n g / s e nt i m e nt   a n a l y s i s ,   t h i s   a r e a   f i r s t   pi c ke up  t ra c t i o n   i t h e   2 000s .   H ow e ve r ,   i t   de pe nds   o na t u r a l   l a ngua ge   pr o c e s s i n (N L P w h i c h   w a s   f i r s t   de v e l o pe s t a rt e i n   t h e   1 950s   [1] .   S e nt i m e n t   a n a l y s i s   h a s   b e c o m e   a   m a i r e s e a r c f i e l d   i t h e   N L P   c o m m u ni t y ;   t he r e fo r e ,   i t   s po rt s   a   w i de   s pe c t r u m   o f   pra c t i c a l   a ppl i c a t i o n s   t h a t   i n c l ude   o pi ni o m i n i ng  a n d   e m o t i o e xt r a c t i o n   i s o c i a l   m e di a   t r e n d   p r e di c t i o n s   [2 ],   [3] .     S e n t i m e n t   a na l y s i s   i s   de f i n e d   a s   a   f i e l o f   s t ud y   w h i c de t e c t s   a n a n a l y z e s   pe o pl e s ’  po s i t i v e   a n d   n e ga t i v e   s e nt i m e n t s   o o pi ni o n s   a b o ut   a   pa rt i c u l a e n t i t y .   T h i s   p r o c e s s   us e s   t e xt u a l   d a t a   f r o m   d i f fe r e nt   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i V o l .   40 ,   N o .   1 ,   O c t o b e r   20 25 :   397 - 4 10   398   s o ur c e s   t o   be   us e a ut o m a t i c a l l y   fo r   a n a l y z a t i o t hr o ug a l g o r i t hm s .   T hi s   c o n c e pt   i s   a ppl i e i n   v a r i o us   a f f a i r s   s uc h   a s   Y o uT ub e   v i de os   [1] S e nt i m e nt   c l a s s i f i c a t i o n   t e c hn i que s   c a n   b e   di v i de i n t o   t hr e e   m a j o r   c a t e go r i e s :   m a c h i n e   l e a rni n g   (M L ) e n s e m b l e   l e a rn i ng,   a n d   de e l e a rni n g   (D L ) ,   a s   s h o w n   i F i g u r e   1.   I m po rt a nt l y ,   s e n t i m e n t   a na l y s i s   i s   m a i n l y   ut i l i z e t o   i de n t i f y   a n d   c a t e go r i z e   pe o pl e s '   o pi n i o n s   o a   s pe c i f i c   t o pi c   t o   e xpr e s s   t h e i f e e l i ngs ,   pe r c e pt i o n s ,   a n d   o pi n i o n s   a s   w e l l   a s   t o   di s c ov e r   e xpe ri e n c e s   a nd  o pi ni o n s   f r o m   o t h e r s   [4].   T h e   u t i l i z a t i o n   o f   a   s e nt i m e nt   m o de l   i s   i m po rt a nt   i n   a n a l y z i n us e c o m m e nt s ,   o pi ni o n s ,   a nd  o t h e f o r m s   of   r a t i n g   s uc a s   m o v i e   o r   s t o r e   r e v i e w s   fo r   e xa m p l e .   A l l   fo r m s   o f   r a t i n gs   a l s o   i n c l ude   f e a t u r e   e xt ra c t i o f r o m   us e r s '   o pi n i o n,   a n d   i t   pl a y s   a i m po r t a n t   r o l e   i o ur  d a i l y   d e c i s i o n - m a k i n g   a b o ut   a   p r o duc t   o a     m o v i e   [5] - [7].           F i gu r e   1 .   S e n t i m e n t   c l a s s i f i c a t i o t e c hni que s       Y o uT ub e   i s   a   pl a t f o r m   f o r   s h a ri n v i de o s   a n a l l o w s   us e r s   t o   upl o a d,   v i e w ,   c o m m e n t   a n d   s h a r e   v i de o s   [8].   I a dd i t i o n ,   Y o uT ub e   i n c l ude s   m o v i e s ,   a n i m a t i o a n d   e duc a t i o n a l   v i de o s .   Y o uT ub e   ra n ks   t h e s e   t y p e s   of   c o n t e nt   b a s e o t h e   n um b e o f   l i ke s ,   d i s l i ke s   a n d   c o m m e n t s   [ 9] - [11] .   A l s o ,   us e r   c o m m e n t s   t e nd  t pr o v i de   f e e d b a c a b o ut   t h e   qu a l i t y   of   t h e   Y o uT ub e   v i de o s .   A l l   t h e s e   po i n t s   m a ke   Y o ut ub e   a e xc e pt i o n a l   pl a t f o r m   f o r   S A .   Y o uT ub e   i s   o n e   o f   t h e   p l a t f o r m s   t a r ge t e d   by   c h i l d r e due   t o   i t s   po pul a ri t y .   C h i l d r e n   a r e   a m o ng  o nl i n e   c o n t e n t   c o n s um e r s ,   a n d   i t   i s   n e c e s s a r y   t o   e n s ur e   t h a t   t h e y   a c c e s s   s ui t a b l e   c o n t e nt   [ 12] ,   [ 13].   N o t a b l y ,   Y o uT ube   i n t r o duc e t h e   Y o uT ub e   K i ds   a pp l i c a t i o n ,   w h i c h   e n a b l e s   pa r e n t s   w i t h   t h e   a b i l i t y   t c o n t r o l   w ha t   t h e i c hi l d r e s h o ul a nd  c a w a t c o n   Y o uT ub e .   In   s p i t e   o f   Y o uT ub e ' s   e ffo r t s   t o   r e duc e   t h e   s pr e a d i n o f   v i de o s   un s ui t a b l e   t o   c hi l d r e n,   t h e   di s t u r b i ng  v i de o s   s t i l l   a ppe a t o   t h e m   [14] - [16] ,   a nd  i t   i s   e s s e n t i a l   t o   e n s u r e   t ha t   t h e y   a c c e s s   s ui t a b l e   c o nt e nt   [17] .   T h e r e   a r e   s t udi e s   t ha t   ha v e   gi v e a t t e nt i o t o   t h i s   i s s ue   t o   f i n d   o ut   w h e t h e o n o t   t h e   v i de o   i s   a pp r o p r i a t e   o Y o uT ub e ,   b ut   t h e   i s s ue   c o nt i n ue s   t o   e xi s t   a nd  r e qui r e s   a   m o r e   p r e c i s e   s o l ut i o n   a n d   i m p r o v e f r a m e w o r k.   Cu rr e nt l y ,   t h e   s t udy   of   S A   o n   E n g l i s Y o uT ub e   v i de o s   fo r   c hi l d r e n   i s   l i m i t e d .   Co n s e que n t l y ,   t h e r e   i s   a   n e e d   f o r   n e w   m e t h o ds   o f   i n a p p r o pri a t e   v i de o   c o n t e nt   de t e c t i n g   f o r   c h i l d r e us i ng  S A   t e c hni que s .   R e c e n t l y ,   s e ve r a l   l i t e ra r y   s t udi e s   i t h e   f i e l d   o f   s e n t i m e n t   a na l y s i s   f o r   s o c i a l   m e di a   n e t w o r ks   w e r e   pr e s e nt e u t i l i s i ng   s upe r v i s e M L   a nd   D L   a pp r o a c h e s :   S upe r v i s e M L ,   D L ,   e n s e m b l e ,   a n d   o t h e r   a pp r o a c h e s .   V a r i o us   M L   a n d   D L   a l go r i t hm s ,   s uc a s   S V M ,   D T ,   R F ,   L R ,   a n CN N   w h i c a r e   a v a i l a b l e   ha v e   b e e n   us e fo r   s o c i a l   m e di a   s e nt i m e nt   a n a l y s i s .   S e n t i m e n t   a na l y s i s   i s   s t i l l   a e v o l v i n g   f i e l a nd  n e e ds   t o   b e   r e s e a r c h e de e pl y .   T h o ug h   r e s e a r c h e r s   h a v e   c o m e   up  w i t h   w a y s   of   s e nt i m e nt   a na l y s i s   w i t h   a l go r i t h m s ,   t h e   n u m b e r   o t h e s e   s t udi e s   i s   l i t t l e   i t h e   a r e a   o f   s oc i a l   m e di a   a n e s pe c i a l l y   o n   Y o uT ub e .   T o   s um   up,   m o s t   o f   t h e   l i t e ra t u r e   r e v i e w s   h a v e   c o m pa r e t h e   pe r f o r m a n c e   o f   D L   a l go r i t hm s   a n d   M L   t e c hni que s .   I t   c o n s i s t s   o f   da t a   c o l l e c t i o n,   pr e - p r o c e s s i n g   da t a ,   f e a t u r e   e xt r a c t i o n,   a n d   c l a s s i f i c a t i o n.   S o m e   r e s e a r c h e r s ,   f o r   e xa m pl e :   ha v e   c o n duc t e e xpe r i m e nt s   o f   S A   a bo ut   c o m m e n t s   o Y o uT ub e   us i n t h e   S V M   m e t h o [2].   M o r e o ve r ,   c o m pa r e d i f fe r e nt   a l g o ri t h m s   o p e rf o rm a nc e   o f   M L   f o Y o u T ub e   d a t a   c l a s s i f i c a t i o b u t   N B   ha s   a c hi e v e d   t he   hi g he s t   a c c u ra c y   [ 1 8 ] .   T o o pa r t   i i n t r o duc t i o o f   M L   b a s e dua l   l a ngua ge   S A   m o de l   f o r   Y o uT ub e   v i de o s   r a n k i n g   i A s i a ,   b ut   L c l a s s i f i e h a s   a c hi e v e 87%   a c c u r a c y   [19].   E n s e m b l e   a p pr o a c h e s   a r e   us e d   t o   o b t a i m o r e   p r e c i s e   a nd  a c c ur a t e   p r e di c t i o n s   by   c o m b i n i ng  m ul t i p l e   c l a s s i f i e r s .   A c c or d i n t o   X i a   e t   a l .   [20]   t h e y   s t udi e t h e   i m p a c t   o ut i l i z i n g   e n s e m b l e   l e a rn e r s   f o r   s e nt i m e nt   c l a s s i f i c a t i o n   pu rpo s e s .   W hi l e   D a   S i l v a   e t   a l .   [21]   p r o po s e a n   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752         Se n t i m e nt   ana l y s i s   o f   Y ouT ub e   v i de os   c om m e nt s   f or   c h i l dr e us i ng   …  ( A m al   A l r e hai l i )   399   e n s e m b l e   c l a s s i f i e t ha t   r e l i e upo f o ur   b a s e   c l a s s i f i e r s ,   S V M   h a v e   a c h i e v e t h e   hi g h e s t   a c c u r a c y .   O t h e   o t h e ha n d   [ 22]   i nt r o duc e a e n s e m b l e   s y s t e m   t o   c a t e go r i z e   t w e e t s   b a s e o t h e   m a j o r i t y   vo t i n g   o f   t hr e e   c l a s s i f i e r s   a nd  s h o w e v a r i o us   e xpe r i m e n t s   t ha t   w e r e   c o n duc t e t o   e xa m i n e   t h e   e f f e c t   of   i n f o r m a t i o g a i o t h e   a c c ura c y   of   t h e   c l a s s i f i e r   a n t h e   c o l l e c t e r e s ul t s   s h o w e c l e a r   i m p r o v e m e n t s   i n   c l a s s i f i c a t i o n   a c c ura c y   a f t e r   ut i l i z i ng  i n f o r m a t i o ga i f o r   r e duc i n g   f e a t u r e   v e c t or  d i m e n s i o na l i t y .   A l a m   e t   al .   [23 ]   p r o po s e a   m o b i l e   a pps   t ha t   c a n   h e l p a r a e n t   i m o n i t o r i ng  t h e i r   c h i l d r e n.   F u rt h e r m o r e ,   D L   i s   us e i c l a s s i f i c a t i o n   t a s ks   t o   b r i n g   b e t t e r   r e s ul t s   us e t o   pe r f o r m   S A   o f   da t a .   A c c o r di n t o   R a m a d ha ni   a nd  G o o   [24]  t h e i r e s e a r c a ppl i e t h e   de e n e u r a l   n e t w o r (D N N t o   a na l y z e   t h e   t w e e t s   b a s e o S A ,   c l a s s i f i e s   S A   us i n g   D L   m e t h o a n d   i t   i s   c o m b i n e d   w i t CN N _L S T M   ha v e   a c h i e v e a   hi g h e o f   89. 2 %   a c c u r a c y   [25],   w hi l e   p r o po s e a n   a c c e s s   m o de l   us i n g   D L   f o r   t h e   de v e l o pm e n t   o f   K i d - F r i e n dl y   Y o uT ub e .   T h i s   s t udy   e v a l ua t e s   t h e   pe r f o r m a n c e   o f   v a r i o us   M L Cs   a n d   D L Ms  f o r   de t e c t i n a n d   c l a s s i fy i n g   Y o uT ub e   v i de o   c o m m e n t s   i nt o   po s i t i v e   a n n e g a t i v e   c a t e go r i e s .   S e v e r a l   e xpe r i m e n t s   ha v e   b e e n   c o n duc t e b a s e o n   a   n o v e l   pr o po s e A r a b i c   da t a s e t   us i n t w o   s t e m m e r s :   S n o w b a l l   a n P o rt e r.   I t h e s e   e xpe r i m e n t s   t h e   n u m b e r   o f   f e a t ur e s   ( 2500 ,   5 000 ,   a n d   10 , 000)   a l o n gs i de   t h e   n - g ra m   ( u n i g ra m ,   b i g r a m ,   a n d   t ri g r a m )   m e t h o ds   w e r e   u t i l i z e d .   P a rt i c ul a r l y ,   T h e   M L   e xpe r i m e n t ’s   r e s ul t s   de m o n s t ra t e d   t ha t   L R ,   R F ,   a n d   A d a B oo s t   a c h i e v e d   t h e   h i g h e s t   a c c ura c i e s   of   90%  t hr o ug h   u ni g ra m s   w h e n   b e i n g   t e s t e d   w i t h   500 f e a t u r e s   a l o ngs i de   b o t h   t h e   s t e m m e r s .   M o r e o v e r ,   i n   t h e   D L   e xpe r i m e nt s ,   t hr e e   m o de l s   w e r e   put   t o   t h e   t e s t :   A N N ,   CN N   a nd  L S T M .   CN N   a n L S T M   w e r e   t e s t e t hr o ug h   w o r e m b e ddi n gs ,   w hi l e   A N N   w a s   t e s t e t hr o ug n - g ra m   m e t h o ds .   T h e   e xpe r i m e nt   po r t ra y e t ha t   t h e   h i g h e s t   a c c ura c i e s   w e r e   r e a c he by   t h e   A N N   m o de l   t hr o ug u ni g r a m s   a n d   t h e   L S T M   m o de l   i w o r e m b e ddi n gs   w hi c h   w a s   90% ,   s pe c i f i c a l l y   be i n a c hi e v e t hr o ug h   5 , 0 00  f e a t u r e s   a l o n gs i de   t h e   s n o w b a l l   s t e m m e r .   T h e   r e s e a r c c o n t ri b ut e s   t o   de t e c t i n t h e   s ui t a b i l i t y   o f   Y o uT ub e   v i de o s   t c h i l d r e n   b a s e o n   v i de o   c o m m e n t s ,   t i t l e ,   a n d   t h e   n u m b e r   o l i ke s   t hr o ug h   S A   t o   pr o v i de   s a f e t y   t o   c h i l d r e n .   T h e   m a i c o n t ri b ut i o n s   o f   t hi s   r e s e a r c c a b e   s um m a r i z e a s   f o l l ow s :   -   Int r o duc e a   n o v e l   da t a s e t   c o l l e c t e f r o m   Y o uT ub e   v i de os   t a r ge t e f o c hi l d r e n.   -   A ppl i e d   t h e   m o s t   po pul a c l a s s i c a l   m a c hi n e   l e a rni n g   c l a s s i f i e r s   a nd  de e l e a rni n g   m o de l s   t o   i n v e s t i ga t e   t h e   b e s t   pe r f o r m a n c e .       -   Co m pa r e t h e   pe r f o r m a n c e   o f   m a c h i n e   l e a rni ng  c l a s s i f i e rs   w i t de e l e a rni n g   m o de l s   b a s e o t h e   pr o po s e da t a s e t .   -   E xa m i n e d   m o de l s ’  pe r f o r m a n c e   us i n g   po r t e r s   a n d   s n o w b a l l   s t e m m e us i n g   d i f fe r e nt   f e a t u r e s   s i z e   of  e xt ra c t e f e a t i r e s   f r o m   t h e   p r o po s e da t a s e t .   T h e r e f o r e ,   t h i s   p a pe p r o v i de s   a   s t u dy   t o   t h e   s e n t i m e n t   a na l y s i s   of   c h i l d r e r e ga r d i n g   Y o uT ub e   v i de o s   b a s e o n   us e c o m m e nt s .   T h i s   i s   do n e   t o   h e l p   pa r e n t s   de t e rm i n e   w ha t   i s   a nd   w h a t   i s   n o t   c o n s i de r e d   a   s ui t a b l e   v i de o   f o r   t h e i c hi l d r e n.   T h e r e f o r e ,   t h e r e   a r e   t w o   m a i e xpe ri m e nt s   w hi c w e r e   i m pl e m e n t e d   b a s e d   o n   M L   c l a s s i f i e r s   a n d   D L   m o de l s .   It   i s   w o r t h y   t o   m e nt i o t ha t   i b o t e xpe ri m e nt s   t h e   s a m e   p r o po s e d   da t a s e t s   w e r e   us e d.   T h e   r e s t   o f   t h e   pa pe r   i s   o r g a ni z e a s   f o l l ow s .   S e c t i o n   e xp l a i n s   t h e   r e s e a r c h   m e t h o do l o g y   t h a t   ha s   b e e n   f o l l ow e t o   i n v e s t i ga t e   t h e   e xi s t i n r e l e v a n t   a n i rr e l e v a n t   Y o uT ub e   v i de o s   fo r   c h i l d r e n   t hr o ug S A   b a s e o us e c o m m e n t s   by   us i n g   t w o   t e c hn i que s :   M L   a n d   D L   t e c hni que s .   S e c t i o 3   o f fe r s   t h e   e xpe r i m e n t a l   r e s ul t s   o f   v a r i o us   M L   c l a s s i f i e r s   a n d   D L   m o de l s .   T h e   r e s ul t s   d i s c us s i o n   e xpl a i n s   i s e c t i o n   4 .   F i n a l l y ,     a   c o n c l us i o n   w i l l   b e   c ov e r e i n   s e c t i o 5 .       2.   M ET H O D S   A N D   M O D E A R C H I T EC TU R   T h i s   s e c t i o n   e xp l a i n s   t h e   m e t h o ds   t h a t   w e r e   us e t o   c a rr i e o ut   t hi s   r e s e a r c h.   It   r e p r e s e n t s   t h e   da t a s e t   p r e - p r o c e s s i n g,   s p l i t t i ng,   a n d   f e a t u r e s   e xt r a c t i o n   a ppr o a c h e s   t ha t   w i l l   b e   us e i t h e   c o n duc t e e xpe r i m e nt s   a s   s h o w n   i F i gu r e   2.     2 . 1 .     D ata   c o l l e c t i o n   B ui l di n g   t h e   da t a s e t   c o n s i s t s   o f   s e ve r a l   s t e ps   w h i c ha v e   b e e n   e xe c ut e d,   t h e y   a r e   t h e   d a t a s e t   c o l l e c t i o n ,   da t a   c l e a ni n g ,   a nd  da t a   a nn o t a t i o n   a c t i v i t i e s ,   r e s p e c t i v e l y .   In i t i a l l y ,   t h e   u t i l i z a t i o n   o f   c o m m e nt s   of  v a r i o us   Y o uT ub e   v i de o s   h a v e   b e e n   e xt r a c t e d   us i n g   Y o uT ub e ’s   A P v 3.   U s i n g   t h e   u n i que   i de n t i f i e (ID )   t ha t   a ppe a r s   a t   t h e   e n d   o f   e a c h   Y o uT ub e   v i de o ’s   U RL ,   a s   s u m m a r i z e i T a b l e   1.   T h e   p r o po s e c r i t e ri a   h e l ps   i s e l e c t i n g   v i de o s ,   de t e c t i n g   s e nt i m e n t   b a s e o n   c o m m e n t s   i n t o   po s i t i v e   a n n e g a t i v e ,   e xt r a c t i n g   m o r e   kn o w l e dge   r e g a r di ng   t h e   s ui t a b i l i t y   o f   v i de o s   fo c hi l d r e n,   a n d   t o   c a t e go ri z e   v i de o s   i n t o   t hr e e   t y pe s :   f ul l   m o v i e s ,   a n i m a t i o t ra i l e r s ,   a n d   i na pp r o p r i a t e   v i de o s   fo r   c h i l d r e n .   -   T h e   s e l e c t i o n   o f   Y o uT ube   v i de o s   de pe n ds   o n   t h e   n u m b e r   o v i e w e r s ,   t h e   num b e o f   c o m m e n t s ,   n u m b e r s   of   l i ke s ,   a n d   t i t l e   o f   v i de o   (r e l e v a n t / i rr e l e v a n t ) .     -   T h e   m o s t   po pul a v i de o   a ppe a r i n g   o Y o uT ub e   t r e nds   p a ge   f o r   c h i l d r e n.   T h e   c o l l e c t e da t a s e t   c o v e r e fo ur   y e a r s   o f   upl o a d i n g   Y o uT ub e   v i de o s   (f r o m   2017   t o   2 021) .   T h i s   a pp r o a c r e s ul t e d   i t h e   a c qui s i t i o o f   m o r e   t ha 14 , 000   s e e c o m m e n t s .   F o c us i n g   t o   o b t a i a   s e t   o f   t h e   m o s t   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i V o l .   40 ,   N o .   1 ,   O c t o b e r   20 25 :   397 - 4 10   400   po pul a r   v i de o s ,   t h e   v i de o s   w e r e   di v i de i n t o   t hr e e   c a t e go r i e s   ( a n i m a t i o n   t ra i l e r s ,   f ul l   m o v i e s ,   a n d   in a pp r o p r i a t e   v i de o s   fo r   c h i l d r e n ) .   T h e   da t a s e t s   c o n t a i a l l   t he   m e t a d a t a   r e l a t e t o   e a c c o m m e n t   l i ke   t h e   us e ID ,   d a t e ,   t i m e ,   a n t h e   n u m b e r   o f   l i ke s .   T h e r e f o r e ,   t h e   da t a   w a s   c l e a n e m a n u a l l y   by   r e m o v i n t h e   dupl i c a t e d   c o m m e n t s   a n d   b y   r e m ov i n a n y   n o n - E n g l i s h   c o m m e n t s .   H e n c e ,   10, 272  c o m m e n t s   ha v e   b e e n   de l e t e f r o m   t h e   ni n e   v i de o s   t h a t   w e r e   s e l e c t e of   t hr e e   di f f e r e n t   c a t e go ri e s .   A f t e t h a t ,   t h e s e   c o m m e n t s   w e r e   m a n u a l l y   l a b e l l e i nt o   t hr e e   c l a s s e s ;   po s i t i v e ,   n e ga t i v e ,   a n d   n a t u ra l ,   a l l   w i t h   t h e   s upe r v i s i o o f   t hr e e   e xpe r t   a nn o na t o r s .   H ow e ve r ,   i t   i s   t o   b e   m e n t i o n e t h a t   t h e r e   h a s   b e e n   a e x c e pt i o n   o f   t h i s   i t h e   n e u t r a l   c l a s s   b e c a us e   t h e   n u m b e r   o f   c o m m e n t s   i t hi s   c l a s s   o ve r w h e l m   t h e   o t h e r   c l a s s e s .   F i na l l y ,   t h e   b i n a r y   da t a s e t   w h i c c o n t a i n s   4, 456   c o m m e nt s ,   h a s   b e e n   c a t e go ri z e t o   h a v e   3, 0 12  po s i t i v e   a n d   1 , 445   n e ga t i v e s   a s   s h o w n   i F i g u r e   3 .           F i gu r e   2 .   P r o ps e m o de l       T a b l e   1 .   Y o uT ub e   v i de o s   us e i da t a s e t   a na l y s i s   #   D a t e   Id   Ca t e g o ri e s   V i e w s   Co m m e n t s   ( d u p l i c a t e )   Co m m e n t s   b e fo r e   f i l t e ri n g   Co m m e n t s   ( b i n a ry )   P o s i t i v e   N e g a t i v e   1   J a n   1 1 , 2 0 2 1   l h x U G k 9 M b 1 A   In a p p r o p r i a t e   1 7 , 3 6 8 , 2 1   43   567   129   35   95   2   J a n 1 6 , 2 0 2 1   6 U 8 H W w T J e C M   In a p p r o p r i a t e   3 3 , 8 0 7 . 2 3 0   1574   2 , 2 1 3   570   183   387   3   F e b 3 , 2 0 2 1   U W w 6 t 1 K 3 J d 4   In a p p r o p r i a t e   5 , 3 8 3 , 6 9 3   2773   711   294   197   97   4   J u l   5 , 2 0 2 0   Q O 0 p - 7 l 1 D J 0   F u l l   M o v i e   1 , 4 7 2 , 4 8 9   24   407   201   148   53   5   A u g 6 , 2 0 2 0   e M o S q I5 O 9 k Q   T a i l e a n i m a t i o n   2 , 6 0 5 , 8 9 4   3099   777   301   154   147   6   O c t 7 , 2 0 1 9   t a E 3 P w u rh Y M   T a i l e a n i m a t i o n   4 , 0 9 1 , 7 6 2   38   3 , 9 6 3   2367   1973   394   7   O c t 1 7 , 2 0 1 9   T IZ U N q s 9 h n g   F u l l   M o v i e   1 , 4 1 4 , 0 5 6   3611   291   167   82   85   8   S e p 1 2 , 2 0 1 8   6 U i N n W _ 2 S T I   T a i l e a n i m a t i o n   2 , 4 5 6 , 5 4 2   2847   1152   326   147   179   9   M a 1 , 2 0 1 7   c T a 7 8 n Ri O 2 4   F u l l   M o v i e   1 , 0 5 1 , 3 5 8   8   191   101   93   8           F i gu r e   3 .   S e n t i m e n t   a na l y s i s   of   t h e   da t a s e t       2. 2 .     D ata   P r e - p r o c e s s i n g   In  t h i s   s e c t i o n,   t h e   p r e - p r o c e s s i n g   a c t i v i t y   i s   pe r f o r m e d   o t h e   d a t a s e t s   a n d   t h i s   s t a ge   i n c l ude s   c l e a ni n g   t h e   d a t a   b e fo r e   t r a i n i ng   o a   m o de l .   T h e   c o m m e nt s '   p r e - p r o c e s s i n g   i n v o l v e s   ge t t i ng   r i d   o f   a l l   t h e   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752         Se n t i m e nt   ana l y s i s   o f   Y ouT ub e   v i de os   c om m e nt s   f or   c h i l dr e us i ng   …  ( A m al   A l r e hai l i )   401   unde s i r e d   a nd   u nn e c e s s a r y   w o r ds   s uc a s   t h e   e m o j i   s y m bo l   a nd  s t o w o r ds ,   i t   a l s o   i n c l u de s t e m m i n g.   T o   a n a l y s e   s e n t i m e n t ,   m a n y   c o m m e n t s   a r e   c o m po s e of   s y m bo l s   t ha t   n e e t o   b e   r e pl a c e by   s pe c i a l   t a gs .   T h e   pr o c e s s e s   a r e   de s c r i b e a s   f o l l ow s :   -   R e m o v i n s pa c e s   a nd  q uo t e s   a t   t h e   e n d   o f   t h e   c o m m e n t s .     -   R e m o v i n s pe c i a l   c h a ra c t e r s   s uc a s :     /     $   %   ^   &   *   |   [   ; :   { }   -   +   )   <   >   ?   !   % .   -   R e m o v i n e m o t i c o n s   a n d   e m o j i   s y m bo l s .   -   R e m o v i n   s t o w o r ds   s uc a s :   o n,   i n,   a t ,   a b o ut ,   a m ,   i s ,   a r e ,   w a s ,   e t c .   -   R e m o v i n t h e   r e pe t i t i o n s   o f   w o r ds   a n d   l e t t e r s   s uc a s :   T h i s   i s   a w s o m m m m m e e e   w o ul b e c o m e   T h i s   i s   a w e s o m e .   -   Co n v e r t i ng  t h e   c o m m e nt s   i n t o   l o w e r c a s e .   -   S t e m m i ng   h a s   b e e n   na m e s t e m   pa c ka ge s   a nd  i s   a v a i l a b l e   i N L T K .   M o r e ov e r ,   t h e r e   a r e   v a ri o us   t y pe s   o s t e m m i ng.   T h i s   i s   us e t o   r e t u rn  w o r f o r m   t o   i t s   r o o t   na m e l y   r e m o v i n g   s uf f i s uc a s   - IN G ,   E D ,   IO N - IO N S   t o   r e duc e   t h e   w o r ds   s i z e   i d a t a s e t   a n d   a c h i e v e   be t t e pe r f o r m a n c e   i S A .   F o E xa m pl e ,   t h e   s t e m m i ng  o f   t h e   w o r ds   ("I n t e r e s t i ng" w hi c m e a n s   ("I nt e r e s t " ).     2. 3 .     F e atu r e   e x tr ac ti o n   T h e   f e a t u r e   e xt r a c t i o s t e p   i s   n e c e s s a r y   s i n c e   i t   i s   t h e   i nput   t o   t r a i M L / D L   c l a s s i f i e r s .   T h e   f e a t ur e s   a r e   e xt r a c t e f r o m   t h e   c o m m e n t s   us i n g   T F - ID F   a n d   w o r e m b e ddi n g   r e p r e s e n t a t i o n s .   U n i g ra m ,   b i gra m ,   a n d   t r i g ra m   f e a t u r e s   a r e   us e d.   F o u ni g ra m   ( 1 - g r a m )   f e a t u r e s ,   t h e   w o r a ppe a r s   i nde pe n de n t   a n d   do e s   n o t   t a ke   i n t o   c o n s i de ra t i o o t h e w o r ds   i t h e   do c um e n t   t h e r e fo r e   u s i ng   n - g ra m   m o de l s   w i t n = [ 1, 1 ].   W h i l e   b i g ra m   (2 - g r a m t h e   a ppe a ra n c e   o f   t h e   t w o   w o r ds   j o i n t   a s   o n e   f e a t u r e   by   us i n n - g ra m   m o de l s   w i t h   n= [1, 2].   F o r   t r i g ra m   (3 - g ra m f e a t u r e s   w h i c i n c l u de   b o t h   b i g r a m   a nd  u ni g r a m   m o de l s   w i t h   n= [1 , 3] .   I e a c h   o f   n - g r a m s ,   s pe c i f i c   m a x_f e a t u r e s   2 , 50 0 ;   5, 0 00  a n d   10 , 000   w e r e   us e d.       2 . 3 . 1.   TF - I D F     TF - ID F   i s   de f i n e a s   a   s t a t i s t i c a l   m e a s u r e   ut i l i z e t o   k n o w   t he   i m po r t a n c e   o f   w o r t h a t   a ppe a r s   i a   do c um e n t   [ 26].   TF - ID F   c a l l e ( t e rm   f r e que n c y i n v e r s e   do c u m e nt   f r e que n c y i s   c a l c ul a t e a s :       =    ( , ) l o g (  )             (1)     T F   i s   t h e   ra t e   o f   w o r f r e que n c y   i a   t e xt / t o t a l   w o r f r e que n c y   i n   t e xt .   M o r e o ve r ,   ID F   i s   l o ( t o t a l   n u m b e r s   o f   t e xt / n u m b e r   o f   t e xt s   t ha t   a ppe a r s   t h e   w o r us e i T F ) .     2 . 3 . 2.   Wo r d   e m b e d d i n g   T h e   w o r d   e m b e ddi n g   i s   a   t e c hn i q ue   f o r   de t e rm i ni n g   t h e   s y n t a c t i c   a n d   s e m a n t i c   c o n t e xt   o f   a   w o r by   us i n g   i n f o r m a t i o f r o m   a   t e xt   c o r p us .   F o N L P   t a s ks ,   t h i s   a ppr o a c h a s   b e e n   c o m m o nl y   us e d.   A dd i t i o n a l l y ,   i t ’s   a l s o   k n o w n   a s   w o r r e p r e s e n t a t i o n s   due   t o   a l l   w o r ds   i a   t e xt   c o r pus   w hi c h   a r e   r e p r e s e nt e a s   v e c t o r s   i di f fe r e nt   d i m e n s i o n s   [27 ].     2. 4 .     M o d e l   i m p l e m e n tat i o n     In  t hi s   p h a s e ,   t h e   d a t a s e t   w a s   di v i de i n t o   t e s t i n g   a nd  t ra i ni n g   by   k - fo l w h e r e   t h e   num b e r   o f   fo l ds   w a s   k= 5,   us e f o ur   f o r   t ra i ni n a n o n e   of   t h e m   f o r   t e s t i n a s   s h o w n   i n   F i gu r e   4.   T h e n ,   M L   a n D L   t e c hn i q ue s   w e r e   a pp l i e t o   c l a s s i fy   v i de o s   a n c o m m e nt s   t o   c o m pa r e   b o t h   t e c hn i que s   i n   t e rm s   o pe r f o r m a n c e .   W h i l e   a l go r i t hm s   t ha t   us e o M L   a r e   s e v e n   c l a s s i f i e r s :   R F ,   L R ,   D T ,   M N B ,   K N N ,   A da b o os t ,   a n S V M .   F o t h e   D L   m o de l s ,   t hr e e   m o de l s   w e r e   s e l e c t e i nc l udi n g   A N N ,   CN N   a n d   L S T M .           F i gu r e   4 .   K - f o l m e t h o [ 28]       2. 5   M o d e l   e v al u ati o n   T h e   a i m   o f   t h i s   p h a s e   i s   t o   e v a l ua t e   t h e   e f f i c i e n c y   a n d   p e r f o r m a n c e   o f   a l l   c l a s s i f i c a t i o m o de l s   b a s e o n   c o m put i n a   c o n f us i o n   m a t r i w h i c us e f o ur   b i n a r y   c l a s s i f i c a t i o m e t ri c s :   t r ue   po s i t i v e   (T P ),   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i V o l .   40 ,   N o .   1 ,   O c t o b e r   20 25 :   397 - 4 10   402   f a l s e   po s i t i v e   (F P ),   f a l s e   n e ga t i v e   (F N ),   t rue   n e ga t i v e   (T N a l l   c o n s i de r i ng  t h e   c o n f us i o n   m a t r i x   a s   s h o w n   i T a b l e   2 ,   t h e s e   w e r e   i n d i c a t e d   a s :     -   T r ue   po s i t i v e   ( TP ) ,   r e f e r s   t h e   po s i t i v e   c o m m e nt s   c o rr e c t l y   c l a s s i f i e a s   po s i t i v e .     -   F a l s e   po s i t i ve   ( FP ) ,   r e f e r s   t h e   po s i t i v e   c o m m e n t s   i n c o rr e c t l y   c l a s s i f i e a s   po s i t i v e .   -   F a l s e   n e ga t i v e   ( FN ) ,   r e f e r s   t h e   n e ga t i v e   c o m m e n t s   i n c o rr e c t l y   c l a s s i f i e a s   n e ga t i v e .   -   T r ue   n e ga t i v)   ( TN ) ,   r e f e r s   t h e   n e g a t i v e   c o m m e n t s   c o rr e c t l y   c l a s s i f i e a s   n e ga t i v e .       T a b l e   2 T h e   Co n f us i o m a t ri x     P re d i c t i o n   c l a s s   P o s i t i v e   N e g a t i v e   A c t u a l   C l a s s   P o s i t i v e   TP   FN     N e g a t i v e   FP   TN       T hr o ug h   t h e   c o n f us i o n   m a t r i x,   t h e   e v a l ua t i o r e s ul t s   a r e   c a l c ul a t e i t e r m s   o f   a c c ur a c y ,   a c c ur a c y ,   r e c a l l ,   a nd  f - s c o r e   a s   i l l us t r a t e i t h e   f o l l ow i n pa rt :   A c c ur a c y   i s   a   m e a s u r e   o f   h o w   a c c ur a t e   t h e   c l a s s i f i e r   i s .   I t ' s   d e f i n e by   t h e   f o l l ow i n g   f o r m ul a :      =    +       +  +  +      ( 2 )     P r e c i s i o i s   a   m e a s u r e   o f   po s i t i v e   c o m m e n t s   c o r r e c t l y   c l a s s i f i e ov e r   t h e   t o t a l   num b e o f   po s i t i v e   c o m m e n t s   c o r r e c t l y   c l a s s i f i e a nd  i n c o rr e c t l y   c l a s s i f i e a nd  i t   c a l c ul a t e a s :          =     +        ( 3 )     W hi l e   re c a l l   i s   a   m e a s u r e   o f   m o de l   pe r f o rm a nc e   t o   de t e c t   t h e   c o rre c t   c l a s s i f i e i t he   da t a s e t   a nd   i t   c o m p u t e d   a s :       =     +          ( 4 )     F - m e a s u r e   (F i s   a   m e a s u r e   t o   o b t a i t h e   v a l ue   b e t w e e n   p r e c i s i o n   a n d   r e c a l l ,   a n d   i t   i s   c a l c ul a t e d   a s :      =             2              +          ( 5 )       3.   EX P ER I M EN TA R ES U L TS     T h i s   s e c t i o p r e s e n t s   t h e   e xpe ri m e n t a l   r e s ul t s   t h a t   w e r e   c o n duc t e us i n g   t h e   m o s t   c o m m o n   M L   c l a s s i f i e r s   a n d   D L   m o de l s . T h e r e   a r e   s i x   t o t a l   e xpe r i m e nt s ,   a l l   o f   w h i c i n c l ude   t h e   ut i l i z a t i o o f   t w s t e m m e r s   a nd  di f f i e r e n t   f e a t u r e   e xt ra c t i o s i z e   i b o t h   a pp r o c h e s   M L   a nd  D L   w i h   N - g ra m   m e t h o ds .     3 . 1 .     An  e x p e r i m e n o n   M c l as s i fi e r s   T h i s   s e c t i o de s c ri b e s   a n d   e v a l ua t e s   t h e   r e s ul t s   o f   t h e   M L   c l a s s i f i e r s   o t h e   p r o po s e da t a s e t .   T h e r e f o r e ,   t h e r e   a r e   s e v e n   M L   c l a s s i f i e r s   w hi c h a v e   b e e n   s e l e c t e b a s e o n   p r e v i o us   s t udi e s   i n c l udi ng  R F ,   L R ,   M N B ,   D T ,   K N N ,   A da B o o s t ,   a n d   S V M .     It   i s   i m po r t a n t   t o   hi g h l i g h t   t h a t   t h e   n - g ra m   f e a t u r e s   w e r e   e xt ra c t e us i n g   T F - ID F .   T h e   u ni g r a m ,   b i g ra m ,   a n t r i g ra m   f e a t ur e s   w e r e   e xt r a c t e a n c o l l e c t e b a s e o n   a   m a x   f e a t ur e   p a r a m e t e r .   T hi s   w a s   s e t   t o   2, 500 ;   5 , 000   a n d   10 , 0 00.   A c c ura c y ,   pr e c i s i o n ,   r e c a l l ,   a nd  f - s c o r e   w e r e   a l l   us e a s   e v a l ua t i o m e t r i c s   o f   t h e   m o de l ’s   pe r f o r m a n c e s .   T w o   s t e m m i n g   t e c hn i q ue s   w e r e   ut i l i z e d   i t h e   c o n duc t e e xpe r i m e nt s   a s   f o l l o w s :   s n o w b a l l   s t e m m e a n d   po r t e r   s t e m m e r .   T h e   f o l l ow i n r e s ul t s   r e f e r   t o   a v e r a ge   a n d   m e di a n   v a l ue s   t ha t   w e r e   c a l c ul a t e t o   i n v e s t i ga t e   t h e   pe r f o r m a n c e   of   a l l   t h e   c l a s s i f i e r s   f o r   c o m m e n t   de t e c t i n a s   i l l us t r a t e i t a b l e s ,   i ndi c a t e   t ha t   a c c ur a c y ,   pr e c i s i o n,   r e c a l l ,   a n f - s c o r e   r e g a r di ng  uni g ra m ,   b i g ra m ,   a n d   t ri g r a m   i t e rm s   o f   a v e r a ge   a n d   m e di a v a l ue s .       3 . 1 . 1.   Ex p e r i m e n o n e M L   c l as s i fi e r s   w i th   m ax i mu m   o 2, 500  fe atu r e s     I t he   f i rs t   e x pe ri m e nt ,   M L   c l a s s i f i e r s   w e r e   us e d   b a s e d   o n   d i f f e r e nt   e v a l ua t i o m e t ri c s   w h e r e   t he   m a xi m u m   nu m b e o f   f e a t u re s   w a s   2 , 50 0   a nd   t he   s n o w b a l l   s t e m m e w a s   u t i l i z e d   a s   s h o w i n   T a b l e   3 .   T he   r e s u l t s   a r e   p r e s e nt e d   f o u ni g ra m s ,   b i g ra m s ,   a nd   t ri g ra m s .   I t   i s   o b v i o us   f r o m   t he   e x pe ri m e nt s   c o nd uc t e d   t ha t   t h e   L R   c l a s s i f i e o b t a i n e d   t h e   hi g h e s t   s c o r e s   c o m p a r e t o   t h e   R F ,   M N B ,   D T ,   K N N ,   A d a B o o s t ,   a nd   S V M .   T he   l o w e s t   s c o r e s   w e r e   o b t a i ne d   us i ng  t he   S V M   a nd   K N N   c l a s s i f i e rs   i t e rm s   o f   a c c u ra c y ,   p re c i s i o n,   re c a l l ,   a nd   f - s c o r e .   I t e rm s   o f   u ni g ra m s ,   t he   L R   c l a s s i f i e re a c he d   a a c c u ra c y   o f   0 . 90   c o m p a r e d   t o   a c c u ra c i e s   o f   0 . 8 9 ,   0 . 8 5 ,   0 . 8 5 ,   0 . 7 4 ,   0 . 89 ,   a n d   0 . 74   o b t a i n e d   us i ng   R F ,   M N B ,   D T ,   K N N ,   A d a B o o s t ,   a nd   S V M ,   r e s pe c t i v e l y .     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752         Se n t i m e nt   ana l y s i s   o f   Y ouT ub e   v i de os   c om m e nt s   f or   c h i l dr e us i ng   …  ( A m al   A l r e hai l i )   403   T a b l e   3 A l l   v i de o s   2, 50 f e a t u r e s   s n o w b a l l   s t e m m e r       In  t e rm s   o f   po r t e s t e m m e r,   T a b l e   4   i l l us t ra t e s   t h e   e v a l u a t i o s c o r e s   c o m put e f o r   v a r i o us   c l a s s i f i e r s   a s   t h e   n u m b e r   o f   fe a t ur e s   w a s   2, 50 0.   It   i s   c l e a r   f r o m   t h e   e xpe r i m e n t a l   r e s ul t s   t ha t   t h e   L R   c l a s s i f i e r   o b t a i n e d   t h e   h i g h e s t   a c c ura c y ,   p r e c i s i o n,   r e c a l l ,   a n d   f - m e a s u r e   c o m pa r e t o   R F ,   M N B ,   D T ,   K N N ,   A da B o os t ,   a n d   S V M .   I n   t e rm s   o f   un i g ra m ,   t h e   L R   a n d   R F   c l a s s i f i e r s   r e a c he a n   a c c u r a c y   of   0. 90  w h i l e   M N B ,   D T ,   K N N ,   A da B oo s t ,   a n d   S V M   a t t a i n e a c c u r a c i e s   o f   0. 85 ,   0 . 85 ,   0. 7 4,   0. 89 ,   a n d   0. 74  i o r de r .       T a b l e   4 .   A l l   v i de o s   2, 50 f e a t u r e s   po rt e s t e m m e r       A v e ra g e   M e d i a n   Cl a s s i fi e r   F e a t u r e   E x t ra c t i o n   A c c   P re c i s i o n   Re c a l l   F s c o r e   A c c   P re c i s i o n   Re c a l l   F s c o r e   RF           U n i g ra m s   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   M N B   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   RF           Bi g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 9 0   0 . 8 9   0 . 9 0   0 . 8 9   LR   0 . 8 9   0 . 9 0   0 . 8 9   0 . 8 9   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   M N B   0 . 8 6   0 . 8 7   0 . 8 6   0 . 8 6   0 . 8 6   0 . 8 7   0 . 8 6   0 . 8 6   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   0 . 8 8   0 . 8 8   0 . 8 8   S V M   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   RF           T ri g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 8 9   0 . 9 0   0 . 8 9   0 . 8 9   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   M N B   0 . 8 7   0 . 8 8   0 . 8 7   0 . 8 6   0 . 8 7   0 . 8 8   0 . 8 7   0 . 8 6   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   K N N   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 8   0 . 8 8   0 . 8 8   0 . 8 8   0 . 8 8   S V M   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9       3 . 1 . 2.   Ex p e r i m e n tw o M c l as s i f i e r s   w i th   5 , 000   m ax i mu m   fe atu r e s   I t h e   s e c o n d   e xpe ri m e nt ,   t he   pe r f o rm a nc e s   o f   v a ri o us   M L   c l a s s i f i e rs   de pe nd  o d i f f e r e nt   e v a l u a t i o n   m e t ri c s   w h e re   t h e   m a x i m u m   nu m b e o f   f e a t u r e s   w a s   5 , 0 0 0   a nd   t h e   s n o w b a l l   s t e m m e w a s   ut i l i z e d   a s   s h o w i n   T a b l e   5 .   T h e   re s u l t s   a r e   p r e s e nt e d   f o t he   u ni g ra m s ,   b i g ra m s ,   a nd   t ri g ra m s .   I t   i s   o b v i o us   f r o m   t he   e x pe ri m e nt s     A v e r a g e   M e d i a n   Cl a s s i fi e r   F e a t u r e   E x t ra c t i o n   A c c   P re c i s i o n   Re c a l l   F s c o r e   A c c   P re c i s i o n   Re c a l l   F s c o r e   RF         U n i g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   M N B   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   RF         Bi g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   LR   0 . 8 9   0 . 9 0   0 . 8 9   0 . 8 9   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   M N B   0 . 8 6   0 . 8 7   0 . 8 6   0 . 8 6   0 . 8 6   0 . 8 7   0 . 8 6   0 . 8 6   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 0   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 8 8   0 . 8 8   0 . 8 8   0 . 8 8   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   S V M   0 . 7 4   0 . 8 0   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   RF         T ri g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   M N B   0 . 8 7   0 . 8 8   0 . 8 7   0 . 8 6   0 . 8 6   0 . 8 7   0 . 8 6   0 . 8 5   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 8   0 . 8 8   0 . 8 8   0 . 8 8   0 . 8 8   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i V o l .   40 ,   N o .   1 ,   O c t o b e r   20 25 :   397 - 4 10   404   c o nduc t e d   t ha t   t he   L R   c l a s s i f i e re a c he d   t he   hi g h e s t   s c o r e s   c o m p a re d   t o   R F ,   M N B ,   D T ,   K N N ,   A da B o o s t ,   a nd   S V M .   O o t h e ha nd ,   t h e   l o w e s t   s c o r e s   w e r e   o b t a i ne d   us i ng   t h e   S V M   a nd   K N N   c l a s s i f i e rs   i t e r m s   o f   a c c u ra c y ,   p r e c i s i o n,   r e c a l l ,   a nd   f - s c o r e .   I t e rm s   o f   u ni g ra m ,   t he   R F ,   L R   a nd   A d a B o o s t   c l a s s i f i e r s   a l l   r e a c he d   a a c c u ra c y   o f   0 . 9 0   c o m p a r e d   t o   a c c u ra c i e s   o f   0 . 8 5 ,   0 . 8 4 ,   0 . 7 4 ,   a nd   0 . 74   o b t a i ne d   us i ng   M N B ,   D T ,   a nd   K N N   r e s pe c t i v e l y .         T a b l e   5 .   A l l   V i de o s   5, 000   f e a t u r e s   s n o w b a l l   s t e m m e r         A v e ra g e         M e d i a n       Cl a s s i fi e r   F e a t u r e   e x t ra c t i o n   A c c   p r e c i s i o n   Re c a l l   F s c o r e   A c c   p r e c i s i o n   Re c a l l   F s c o r e   RF           U n i g ra m s   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   M N B   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   0 . 8 4   0 . 8 7   0 . 8 4   0 . 8 3   DT   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   RF           Bi g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   LR   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   M N B   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   DT   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 8   A d a Bo o s t   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 8   RF           T ri g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   M N B   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 8   A d a Bo o s t   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 8       In  t e rm s   o f   po r t e s t e m m e r ,   T a b l e   i l l us t ra t e s   t h e   e v a l ua t i o s c o r e s   c o m put e f o r   v a ri o us   c l a s s i f i e r s   a s   t h e   m a xi m u m   num b e o f   fe a t u r e s   w a s   5, 0 00.   I t   i s   c l e a f ro m   t h e   e xpe r i m e nt a l   r e s ul t s   t h a t   t h e   L R   c l a s s i f i e ob t a i n e t h e   h i g h e s t   s c o r e s   i n   a c c ura c y ,   p r e c i s i o n ,   r e c a l l ,   a nd  f - m e a s u r e ,   c o m pa r e t o   R F ,   M N B ,   D T ,   K N N ,   A da B oo s t ,   a n S V M .   I n   t e rm s   o f   un i g r a m ,   t h e   R F ,   L R ,   a n d   A da B oo s t   c l a s s i f i e r s   a l l   r e a c h e a n   a c c ur a c y   of  0. 90   w h i l e   M N B ,   D T ,   K N N ,   a n d   S V M   e a c a t t a i n e a c c ura c i e s   o f   0. 85,   0. 8 5,   0. 74,   a nd  0. 7 r e s pe c t i v e l y .       T a b l e   6 .   A l l   v i de o s   5, 00 f e a t u r e s   po rt e s t e m m e r     A v e ra g e   M e d i a n   Cl a s s i fi e r   F e a t u r e   e x t ra c t i o n   A c c   P re c i s i o n   Re c a l l   F s c o r e   A c c   P re c i s i o n   Re c a l l   F s c o r e   RF           U n i g ra m s   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   M N B   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 3   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   RF           Bi g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   M N B   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 8   A d a Bo o s t   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 8   RF       T ri g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   M N B   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   0 . 8 6   0 . 8 7   0 . 8 6   0 . 8 5   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 8   A d a Bo o s t   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 8       3 . 1 . 3.   Ex p e r i m e n th r e e :   M L   c l as s i fi e r s   w i th   10 , 000  m ax i mu m   fe atu r e s   In   t h e   t hi r e xpe r i m e nt ,   t h e   pe r f o r m a n c e   of   v a r i o us   M L   c l a s s i f i e r s   w a s   b a s e o n   di f f e r e n t   e v a l u a t i o n   m e t r i c s   w h e r e   t h e   m a xi m u m   num b e o f   f e a t ur e s   w e r e   10, 0 00   a nd   s n o w b a l l   s t e m m e w a s   ut i l i z e d   a s   s h o w n   i T a b l e   7.   T h e   r e s ul t s   a r e   p r e s e n t e f o r   t h e   u n i g ra m s ,   b i g ra m s ,   a n d   t ri g r a m s .   It   i s   o b v i o us   f r o m   t h e   e xpe r i m e n t s   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752         Se n t i m e nt   ana l y s i s   o f   Y ouT ub e   v i de os   c om m e nt s   f or   c h i l dr e us i ng   …  ( A m al   A l r e hai l i )   405   c o n duc t e t ha t   t h e   R F ,   L R   a n d   A da B o os t   c l a s s i f i e r s   a l l   o b t a i n e d   t h e   h i g h e s t   s c o r e s   c o m pa r e d   t o   t h e   M N B ,   D T ,   K N N ,   a n d   S V M   c l a s s i f i e r s .   S pe c i f i c a l l y ,   t h e   l o w e s t   s c o r e s   w e r e   o b t a i n e d   us i n g   S V M   a nd   K N N   c l a s s i f i e r s   i t e r m s   o f   a c c ur a c y ,   pr e c i s i o n,   r e c a l l ,   a nd  f - s c o r e .   I n   t e rm s   o f   un i g ra m s ,   t h e   R F ,   L R ,   a n d   A da B oo s t   c l a s s i f i e r s   r e a c h e a a c c u r a c y   of   0. 90   c o m pa re t o   a c c ura c i e s   o f   0. 85 ,   0 . 85,   0. 7 4,   a n d   0 . 74   ob t a i n e by   M N B ,   D T ,   K N N ,   a nd  S V M   r e s pe c t i v e l y .       T a b l e   7 .   A l l   v i de o s   10, 0 00  f e a t u r e s   s n o w b a l l   s t e m m e r     A v e ra g e   M e d i a n   Cl a s s i fi e r   F e a t u r e   E x t ra c t i o n   A c c   P re c i s i o n   Re c a l l   F s c o r e   A c c   P re c i s i o n   Re c a l l   F s c o r e   RF         U n i g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 1   0 . 9 0   0 . 9 1   0 . 9 0   M N B   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   0 . 8 6   0 . 8 7   0 . 8 6   0 . 8 4   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   RF         Bi g ra m s   0 . 8 9   0 . 9 0   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   M N B   0 . 8 3   0 . 8 6   0 . 8 3   0 . 8 1   0 . 8 4   0 . 8 7   0 . 8 4   0 . 8 2   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   RF         T ri g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   LR   0 . 8 8   0 . 8 9   0 . 8 8   0 . 8 8   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   M N B   0 . 8 3   0 . 8 6   0 . 8 3   0 . 8 2   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 3   DT   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   0 . 8 4   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9       In  t e rm s   o f   po r t e s t e m m e r,   T a b l e   r e po rt s   t h e   e v a l u a t i o n   s c o r e s   w h i c h   w e r e   c o m put e d   f o r   di f f e r e n t   c l a s s i f i e r s   a s   t h e   m a x i m u m   n u m b e o f   f e a t ur e s   w a s   10 , 000 .   It   i s   c l e a f r o m   t h e   e xpe r i m e nt a l   r e s ul t s   t ha t   t h e   R F ,   L R   a n d   A d a B o os t   c l a s s i f i e r s   a l l   r e a c h e d   t h e   hi g h e s t   s c o r e s   i t e rm s   o f   a c c ur a c y ,   p r e c i s i o n,   r e c a l l ,   a nd   f - m e a s u r e   c o m pa r e t o   M N B ,   K N N ,   D T ,   a n d   S V M .   I n   t e r m s   o f   un i g ra m s ,   t h e   R F ,   L R   a n A d a B oo s t   c l a s s i f i e r s   r e a c h e d   a a c c ura c y   of   0. 89 ,   0 . 90   a nd  0. 9 c o m pa r e t o   t h e   a c c u r a c i e s   o f   0. 85 ,   0 . 85 ,   0. 7 4,   a nd  0. 74   o b t a i n e by   M N B ,   D T ,   K N N ,   a n d   S V M   r e s pe c t i v e l y .       T a b l e   8 .   A l l   v i de o s   10, 0 00  f e a t u r e s   p o rt e r   s t e m m e r     A v e ra g e   M e d i a n   Cl a s s i fi e r   F e a t u r e   e x t ra c t i o n   A c c   P re c i s i o n   Re c a l l   F s c o r e   A c c   P re c i s i o n   Re c a l l   F s c o r e   RF           U n i g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   M N B   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 4   0 . 8 6   0 . 8 7   0 . 8 6   0 . 8 5   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   RF           Bi g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   LR   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   M N B   0 . 8 3   0 . 8 6   0 . 8 3   0 . 8 1   0 . 8 4   0 . 8 7   0 . 8 4   0 . 8 3   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 8   0 . 7 5   0 . 8 0   0 . 7 5   0 . 6 9   RF         T ri g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   LR   0 . 8 8   0 . 8 9   0 . 8 8   0 . 8 8   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   M N B   0 . 8 4   0 . 8 7   0 . 8 4   0 . 8 2   0 . 8 5   0 . 8 7   0 . 8 5   0 . 8 3   DT   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 5   0 . 8 6   0 . 8 6   0 . 8 6   0 . 8 6   K N N   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9   A d a Bo o s t   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   S V M   0 . 7 4   0 . 8 1   0 . 7 4   0 . 6 9   0 . 7 5   0 . 8 1   0 . 7 5   0 . 6 9       Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i V o l .   40 ,   N o .   1 ,   O c t o b e r   20 25 :   397 - 4 10   406   3 . 2 .     An  e x p e r i m e n o n   D L   m o d e l s   T h i s   s e c t i o n   p r e s e nt s   t h e   e xpe r i m e nt   r e s ul t s   b a s e o n   D L   m o de l s .   T hi s   i s   i o r de r   t o   e v a l ua t e   t h e   pe r f o r m a n c e   o f   t h e   e xpe ri m e nt .   T h e r e   a r e   t hr e e   c l a s s i f i e rs   w h i c ha v e   b e e n   s e l e c t e b a s e o p r e v i o us   s t udi e s   i n c l udi n g   CN N ,   L S T M ,   a n d   A N N .   T o   m e a s u r e   t h e   p e r f o r m a n c e   o f   t h e s e   c l a s s i f i e r s ,   i t   w i l l   de pe n d   o TF - ID F   a n d   w o r e m b e ddi n g   t o   e xt ra c t   t h e   w o r ds .   T h e   f o l l ow i n r e s ul t s   r e f e t o   a v e ra ge   a n d   m e di a v a l ue s   t h a t   w e r e   c a l c ul a t e d   t o   i n v e s t i g a t e   t h e   pe r f o r m a n c e   o f   a l l   c l a s s i f i e r s   f o c o m m e nt   de t e c t i n g   a s   i l l us t r a t e i T a b l e s ,   i ndi c a t e   t ha t   a c c ura c y ,   p r e c i s i o n   a nd  r e c a l l ,   a nd  f - s c o r e   r e ga r d i n w o r e m b e ddi n i n   t e rm s   o a v e r a ge   a n m e di a n   v a l ue s .   T h e   c o m m e nt s   i n   t h e   c o l l e c t e da t a s e t s   w e r e   c o l l e c t e f r o m   ni n e   d i f fe r e nt   v i de o s .   T h e   f e a t ur e s   w e r e   e xt r a c t e d   us i n g   T F - ID F   f o r   A N N   m o de l s   us i n g   w o r e m b e ddi n gs   f o r   CN N   a n d   L S T M   m o de l s .   T w o   s t e m m i n g   t e c hni que s   w e r e   ut i l i z e i t h e   c o n duc t e d   e xpe r i m e n t s   a s   f o l l ow s :   s n o w b a l l   s t e m m e r   a n d   po r t e s t e m m e r.     3 . 2 . 1.   Ex p e r i m e n f o u r D mod e l s   w i th   2, 50 m ax i mu m   fe atu r e s   an d   w o r d   e m b e d d i n g   In  t h e   f o ur t e xpe r i m e nt ,   t h e   pe r f o r m a n c e   o f   v a r i o us   D L   c l a s s i f i e r s   b a s e o d i f fe r e nt   e v a l ua t i o n   m e t r i c s   a r e   s h o w n .   T h e   m a xi m u m   num b e o f   f e a t ur e s   w a s   2, 5 00   a n d   s n o w b a l l   s t e m m e w a s   ut i l i z e d   a s   po r t ra y e i T a b l e   9.   It   i s   c l e a r   f r o m   t h e   e xpe r i m e nt a l   r e s u l t s   t h e   A N N   a nd  L S T M   c l a s s i f i e r s   o b t a i n e d   t h e   hi g h e s t   s c o r e s   i t e rm s   o f   a c c ur a c y ,   pr e c i s i o n,   r e c a l l ,   a n d   f - s c o r e .   S pe c i f i c a l l y ,   t h e   A N N   a n d   L S T M   c l a s s i f i e r s   b o t r e a c h e d   a a c c u r a c y   of   0. 89  w hi l e   CN N   a t t a i n e a a c c u r a c y   o f   0. 70.   In  t e rm s   o f   po r t e r   s t e m m e r,   T a b l e   10   i l l us t r a t e s   t h e   e va l u a t i o s c o r e s   c o m put e f o r   v a ri o us   c l a s s i f i e r s   a s   t h e   m a xi m um   n u m b e o f   fe a t u r e s   w a s   2 , 500 .   It   i s   c l e a f r o m   t h e   e xpe r i m e nt a l   r e s ul t s   t ha t   t h e   A N N   a nd  L S T M   c l a s s i f i e r s   b o t o b t a i n e d   t h e   hi g h e s t   s c o r e s   i t e r m s   o f   a c c ura c y ,   p r e c i s i o a nd   r e c a l l ,   a nd   f - s c o r e .   S pe c i f i c a l l y ,   t h e   A N N   a nd  L S T M   c l a s s i f i e r s   r e a c h e a n   a c c ur a c y   o f   0. 89  w h i l e   CN N   a t t a i n e a n   a c c ur a c y   of   0. 73.       T a b l e   9 .   A l l   V i de o s   2, 500   f e a t u r e s   s n o w b a l l   s t e m m e r     A v e ra g e   M e d i a n   Cl a s s i fi e r   F e a t u r e   e x t ra c t i o n   A c c   P re c i s i o n   Re c a l l   F s c o r e   A c c   P re c i s i o n   Re c a l l   F s c o r e   A N N     U n i g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   Bi g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   T ri g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   CN N   W o r d   E m b e d d i n g   0 . 7 0   0 . 6 8   0 . 7 0   0 . 6 6   0 . 7 0   0 . 6 9   0 . 7 0   0 . 6 6   L S T M   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 8   0 . 8 8   0 . 8 8   0 . 8 8   0 . 8 8       T a b l e   10 .   A l l   v i de o s   2, 500  f e a t u r e s   po rt e r s   s t e m m e r     A v e ra g e   M e d i a n   Cl a s s i fi e r   F e a t u r e   e x t ra c t i o n   A c c   P re c i s i o n   Re c a l l   F s c o r e   A c c   P re c i s i o n   Re c a l l   F s c o r e     A N N     U n i g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   Bi g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   T ri g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   CN N   W o r d   E m b e d d i n g   0 . 7 3   0 . 7 1   0 . 7 3   0 . 7 0   0 . 7 3   0 . 7 2   0 . 7 3   0 . 7 2   L S T M   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9       3 . 2 . 2.   Ex p e r i m e n F i v e D L   m o d e l s   w i th   5 , 0 00  m ax i mu m   fe atu r e s   an d   w o r d   e m b e d d i n g   In  t h e   f i f t e xpe r i m e nt ,   t h e   pe r f o r m a n c e   o f   v a ri o us   D L   c l a s s i f i e r s   w h e n   t h e   m a xi m um   num b e o f e a t ur e s   w a s   5 , 00 0   a n d   s n o w b a l l   s t e m m e w a s   ut i l i z e d   a r e   s h o w n   i T a b l e   11.   It   i s   o b v i o us   f r o m   t h e   e xpe r i m e nt s   c o n duc t e t ha t   t h e   A N N   a n L S T M   c l a s s i f i e r s   ob t a i n e t h e   h i g h e s t   s c o r e s   c o m pa r e t o   CN N   i n   t e rm s   o f   a c c ur a c y ,   pr e c i s i o n,   r e c a l l ,   a n d   f - s c o r e .   I n   t e rm s   A N N   a n L S T M   c l a s s i f i e r s ,   t h e y   bo t h   r e a c h e a c c ur a c i e s   o f   0. 90 ,   w hi l e   CN N   a t t a i n e d   a a c c u r a c y   of   0. 70.       T a b l e   11 .   A l l   v i de o s   5, 000  f e a t u r e s   s n o w b a l l   s t e m m e r     A v e ra g e   M e d i a n   Cl a s s i fi e r   F e a t u r e   e x t ra c t i o n   A c c   P re c i s i o n   Re c a l l   F s c o r e   A c c   P re c i s i o n   Re c a l l   F sc o r e     A N N     U n i g ra m s   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   0 . 9 0   0 . 8 9   Bi g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 8   0 . 8 9   0 . 8 8   T ri g ra m s   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   CN N   W o r d   E m b e d d i n g   0 . 7 0   0 . 6 9   0 . 7 0   0 . 6 6   0 . 7 0   0 . 6 9   0 . 7 0   0 . 6 5   L S T M   0 . 9 0   0 . 9 0   0 . 9 0   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   0 . 8 9   Evaluation Warning : The document was created with Spire.PDF for Python.