I n d on e s ian   Jou r n al   o f   E lec t r ica l   E n gin e e r in a n d   Com p u t e r   S c ience   Vo l .   3 8 ,   N o .   2 M a y   20 2 5 ,   pp.   1 256 ~ 1 264   I S S N:  2 502 - 4 7 52 ,   DO I 10 . 11591/i j e e cs .v 3 8 . i 2 . pp 1 256 - 1 264             1256     Jou r n al  h o m e page ht tp: // ij e e cs . iaes c or e . c om   E n h a n c e   b ig  d at a se c u r ity   b as e d  on  HDFS  u s in g t h e  h y b r id   ap p r oac h       F ayç a l   Z in e - Din e 1 ,   S ar Al c ab n an i 1 ,   A h m e d   Az ou aou i 2 ,   Jam al   E l   K af i 1   1 D e pa r tm e nt   of  C o mpu te r  S c ie n c e , F a c u l t y   of   S c i e n c e s , C ho ua i b D o ukka li  U ni ve r s it y , E J a di da , M o r oc c o   2 H ig h S c h oo of   T e c hn o l o g y  E S T , U ni ve r s it y  I bn  T of a il K e ni tr a , M o r o c c o       Ar t ic l e   I n f o     AB S T RA CT   A r ti c le  h is tor y :   R e c e i ve M a r   28 ,   202 4   R e vi s e Oc t   8 ,   202 4   A c c e pt e Oc t   30 ,   202 4       H ad o o p   h as   eme r g e d   as   p ro m i n e n t   o p en - s o u r ce  fra mew o rk   fo r   t h e   s t o rag e ,   m an a g eme n t ,   an d   p ro ce s s i n g   o f   e x t e n s i v e   b i g   d at t h r o u g h   i t s   d i s t ri b u t e d   fi l s y s t em ,   k n o w n   as   H ad o o p   d i s t ri b u t e d   fi l s y s t em   ( H D FS ) .   T h i s   w i d e s p re a d   ad o p t i o n   c an   b e   at t ri b u t e d   t o   i t s   c ap ac i t y   t o   p ro v i d rel i ab l e ,   s c al ab l e ,   an d   c o s t - e ff ec t i v s o l u t i o n s   fo r   m an a g i n g   l arg d at as e t s   a cro s s   d i v e rs s ec t o rs ,   i n c l u d i n g   fi n an ce ,   h e a l t h c ar e ,   an d   s o ci al   me d i a.   N e v e rt h el e s s ,   as   t h s i g n i fi c an ce  an d   s c al o b i g   d at ap p l i c at i o n s   c o n t i n u e   t o   e x p an d ,   t h c h a l l en g o f   e n s u r i n g   t h s ecu ri t y   an d   s afe g u ard i n g   o s e n s i t i v d at w i t h i n   H ad o o p   h as   b e co me   i n c r e as i n g l y   c r i t i c al .   I n   t h i s   s t u d y ,   t h au t h o rs   i n t ro d u ce  n o v e l   s t rat e g y   a i me d   at   b o l s t e r i n g   d at s ec u r i t y   w i t h i n   t h e   H ad o o p   s t o rag framew o rk .   T h i s   ap p ro a c h   s p eci fi c a l l y   em p l o y s   a   h y b ri d   e n c r y p t i o n   t e ch n i q u e   t h at   l e v e ra g e s   t h ad v an t ag e s   o b o t h   a d v an ced   en c r y p t i o n   s t an d ard   ( A E S )   a n d   d at en c r y p t i o n   s t an d ar d   ( DES )   al g o r i t h m s ,   w h e r e b y   fi l e s   ar e   e n c r y p t e d   i n   H D FS  a n d   s u b s e q u e n t l y   d ec r y p t e d   d u ri n g   t h e   m ap   t as k .   T o   as s e s s   t h e   e ffi c a cy   o f   t h i s   me t h o d ,   t h au t h o rs   p e rfo r me d   e x p e ri men t s   w i t h   v ar i o u s   fi l s i z e s ,   b en c h m ar k i n g   t h e   o u t c o me s   a g ai n s t   o t h e r   e s t ab l i s h ed   s ecu ri t y   me as u r e s .   K e y w o r d s :   B i da t a   Da t a   s e c ur i t y   De c r y pt i o n   E n c r y pt i o n   Ha doo p   HD F S   Th i s   i s   a n   o p en   a c ces s   a r t i c l u n d e r   t h CC  B Y - SA   l i cen s e.     C or r e s pon din A u th or :   F a y ç a l   Z i ne - D i ne     De pa r t m e n t   o f   C o m p ut e r   S c i e n c e ,   F a c u l t y   o f   S c i e nc e s ,   C h o ua i b   Do ukka l i   U ni ve r s i t y   E l   J a d i d a ,   M o r o c c o     E m a i l z d f a y c a l @g m a il . c o m       1.   I NT RODU C T I ON   T h e   pr o c e s s i ng  o f   bi da t a   h a s   b e c o m e   e s s e n t i a l   a c r o s s   v a r i o us   f i e l ds ,   w i t h   a pa c h e   Ha do o e m e r g i ng  a s   a   l e a d i ng  p l a t f o r m   f o r   di s t r i b ut e s to r a ge   a n pr o c e s s i n [ 1] ,   [ 2] .   I t s   Ha doo p   di s t r i but e f i l e   s y s t e m   ( HD F S )   f a c il i t a t e s   t h e   e f f e c t i v e   m a n a ge m e n t   o f   e x t e ns i ve   da t a s e t s   [ 3] ,   [ 4] .   N o n e t h e l e s s ,   e n s u r i n t h e   s e c ur i t y   o f   da t a   w i t hi HD F S   pr e s e n t s   a   c o n s ider a bl e   c h a ll e n g e ,   a s   t h e   e xi s t i n s e c ur i t y   f e a t ur e s   a r e   i ns u f f i c i e n t   to  s a f e gua r s e n s i t i ve   i nf o r m a t i o n   a ga i ns t   un a ut h o r i z e a c c e s s   o r   c y be r   t h r e a t s   [ 5] .   A dd i t i o n a ll y ,   bi da t a   i s   c h a r a c t e r i z e by   s e v e r a l   i nhe r e n t   c h a ll e n ge s ,   c o m m o nly   r e f e r r e to   a s   t h e   V' s v o l u m e ,   v e l o c i t y ,   v a r i e t y ,   v a l ue ,   a n v e r a c i t y   [ 6] ,   [ 7] .   Ha doo [ 8]   i s   w i de ly   a c k n o w l e dge a s   a   p o we r f u l   f r a m e wo r f o r   e x e c ut i n a pp l i c a t i o n s   o n   l a r ge   c l u s t e r s   c o n s t r uc t e f r o m   s t a n d a r h a r dwa r e .   As   a n   o pe n - s o ur c e   f r a m e wo r f o r   d i s t r i b u t e c om put i n g,   de v e l o pe i J a v a ,   Ha doo c o m pr i s e s   t wo  f u n da m e n t a l   c o m po n e n t s .   T h e   f i r s t   i s   HD F S ,   a   d i s t r i but e f i le   s y s t e m   t h a gua r a n t e e s   r e l i a bl e ,   s c a l a bl e ,   a n f a u l t - to l e r a n t   da t a   s to r a ge   a c r o s s   c o m m o d i t y   h a r dwa r e ,   c a pa bl e   o f   a c c o m m o da t i n d i v e r s e   da t a   f o r m a t s ,   i n c l ud in t e x t ,   i m a ge s ,   a n vi de o s .   T h e   s e c o n c o m p o n e n t   i s   M a pR e duc e ,   a   pr o gr a m m i ng  m o de l   d e s i g n e t e f f i c i e n t l y   pr o c e s s   a n a na l y z e   l a r ge   da t a s e t s   i pa r a l l e a c r o s s   m u l t i p l e   n o de s   w i t hi n   a   c o m put i n c l u s t e r .   T hi s   m o de l   c o n s i s t s   o f   t w di s t i n c t   t a s ks t h e   " M a p"   t a s k,   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2 5 0 2 - 4 7 52       E nhanc e   big  data   s e c ur it y   bas e on  HD F us ing  the  hy br id  appr oac h   ( F ay ç al  Z ine - Dine )   1257   whi c h   pr o c e s s e s   a n c o nv e r t s   i n put   da t a   i n t i n t e r m e d i a t e   ke y - v a l ue   pa i r s ,   a n t h e   " R e duc e "   t a s k,   whi c c o n s o l i d a t e s   a n s u mm a r i z e s   t h e s e   i n t e r m e d i a t e   r e s u l t s   [ 9] ,   [ 10] .   Nu m e r o us   r e s e a r c h   i ni t i a t i v e s   h a v e   c o n c e n t r a t e o n   e nh a n c i ng  da t a   s e c ur i t y   w i t hi t h e   HD F S .   F o r   e x a m p l e ,   O’ M a ll e y   e al.   [ 5]   p r o p o s e a   s e c ur i t y   f r a m e wo r f o r   Ha doo p   t h a t   i n t e gr a t e s   K e r b e r o s   a n S S L ,   t h e r e by   im pr o vi n a ut h e n t i c a t i o n   a n a c c e s s   c o n t r o l   m e c h a ni s m s .   I n   a n o t h e r   s t udy ,   P a r a n L e e   [ 11]   p r e s e n t e a   m e t h o t h a t   e m p l o y s   a d v a n c e e n c r y pt i o n   s t a n da r ( A E S )   f o r   e n c r y pt i n H DF S   da t a ,   whi c e f f e c t i v e ly   l o we r s   c o m put a t i o n a l   o v e r h e a d.   A dd i t io n a l ly ,   M a hm o ud   in   [ 12]   e xa m i ne a   s t r a t e gy   f o r   bi da t a   s e c ur i t y   ut i li z i ng  HD F S ,   whi c h   c o m bi ne s   A E S   w i t h   s t r e a m   c i p h e r s   s uc h   a s   o n e - t i m e   pa ( O T P )   to  b o l s t e r   b o t h   s e c ur i t y   a n e n c r y pt i o n   e f f i c i e n c y .   Ne v e r t h e l e s s ,   t h e s e   e xi s t i n m e t h o do l o g i e s   e n c o un t e r   s e v e r a l   c h a ll e n ge s .   C e r t a i n   s o l ut i o n s   m a de m a n s i g ni f i c a n t   c o m put a t i o n a l   r e s o ur c e s ,   p ot e n t i a ll y   hi nde r i n s y s t e m   pe r f o r m a n c e ,   whil e   ot h e r s   m i g h t   n o a c hi e ve   t h e   de s i r e l e ve l   o f   s e c ur i t y .   F ur t h e r m o r e ,   t h e   l a r ge r   s i z e   o f   e n c r y pt e f i l e s   c a n   i m po s e   a dd i t i o n a l   b ur de n s   o n   s t o r a ge   a n b a n dw i dt h ,   a dv e r s e ly   a f f e c t i n t h e   o v e r a l l   e f f i c i e nc y   o f   t h e   Ha do o e c o s y s t e m .   T h e   pur s u i t   o f   a   hi g h - pe r f o r m a n c e ,   e f f i c i e n t ,   a n r e s il i e n t   e n c r y pt i o n   s o l ut i o n   f o r   HD F S   da t a   c o n t i n ue s   to  b e   a   s i g nif i c a n t   c h a ll e n ge .   C ur r e n t   m e t h o do l o g i e s   f r e que n t l y   gr a pp l e   w i t h   t h e   t r a de - o f f s   b e t we e n   pe r f o r m a n c e ,   s e c ur i t y ,   a n t h e   s i z e   o f   e n c r y pt e f il e s .   S o m e   e n c r y pt i o n   a l go r i t hm s   a r e   n o t a bl y   r e s o ur c e - i n t e n s i ve ,   r e s u l t i n g   i n   s l o w e r   r e a d   a n wr i t e   o pe r a t i o ns   w i t hi n   HD F S .   A c hi e vi ng  o p t i m a l   s e c ur i t y   n e c e s s i t a t e s   r o b us de f e ns e s   a ga i ns t   kn o wn   t h r e a t s   a n s tr i n ge n t   ke y   m a n a g e m e n t   pr a c t i c e s   [ 13] .   T h e   i n c r e a s e s i z e   o f   e n c r y pt e d   f il e s   c a e x a c e r ba t e   s to r a ge   a n b a n dw i dt h   c o n s t r a i n t s ,   f u r t h e r   di mi n i s hi ng  t h e   o v e r a ll   pe r f o r m a n c e   o f   t h e   Ha doo p   s y s t e m .   T hi s   s t ud y   i n t r o duc e s   a   hy b r i e n c r y pt i o n   s t r a t e g y   t h a t   i n t e gr a t e s   t h e   A E S   a n t h e   da t a   e n c r y pt i o s t a n da r ( DE S )   f o r   s e c ur i n da t a   w i t hi t h e   HD F S .   T h e   pr i m a r y   o bj e c t i v e   o f   t hi s   a ppr o a c h   i s   to   b ol s t e r   da t a   s e c ur i t y   whil e   e nh a n c i ng  e n c r y pt i o n   e f f i c i e nc a n m i n im i z i ng  t h e   s i z e   o f   t h e   e n c r y pt e f i l e s .   T h e   im p l e m e n t a t i o n   o f   A E S   i n   c i p he r   bl o c c ha i ni ng  ( C B C )   m o de   f a c il i t a t e s   e f f e c t i v e   da t a   e n c r y pt i o n ,   wh e r e a s   DE S   i s   ut i li z e to  e n c r y pt   t h e   A E S   ke y ,   t h e r e by   a dd i n a n   e x t r a   l a y e r   o f   s e c ur i t y .   T h e   a dv a n t a ge s   o f   t hi s   m e t h o i n c l ude i m pr o v e pe r f o r m a n c e   due   to  th e   r a p i e n c r y pt i o n   c a pa bil i t i e s   o f   A E S   i n   C B C   m o de ,   e nh a nc e s e c ur i t y   t h r o ugh   a   dua l - l a y e r   e nc r y pt i o n   m e c h a ni s m ,   a n a   r e duc t i o n   i f i l e   s i z e   a c hi e v e by  e m p l o yi ng  DE S   f o r   ke y   e n c r y pt i o n ,   whi c h   a l l e vi a t e s   s t or a ge   a n b a n dw i dt h   de m a n ds .   T hi s   pa pe r   e l a b o r a t e s   o n   o ur   hy b r i e n c r y pt i o n   met h o d o l o g y   f o r   HD F S .   I n   s e c t i o n   2,   we   pr o vi de   a   t h o r o ugh   r e vi e o f   e xi s t i n l i t e r a t ur e ,   a n a l y z i ng  v a r i o us   s t r a t e gi e s   t h a h a v e   be e n   de v e l o pe to  s e c ur e   da t a   w i t hi HD F S .   S e c t i o n   o ut l i ne s   t h e   a r c hi t e c t ur e   of   o ur   pr o p o s e s o l ut i o n ,   e m p h a s i z i ng  t h e   s y ne r g y   b e t we e n   t h e   A E S   a n DE S   a l go r i t hm s .   S e c t i o n   de t a i l s   t h e   e x pe r i m e n t a l   r e s u l t s   o b t a i ne to   a s s e s s   t h e   pe r f o r m a n c e   o f   o ur   m e t h o d,   f o c us i ng  o n   e n c r y pt i o n   dur a t i o n ,   f il e   s i z e ,   a n t h r o ugh put ,   a n c o m pa r e s   t h e s e   m e t r i c s   w i t t h o s e   o f   c ur r e n t   m e t h o do l o g i e s .   F i na l ly ,   s e c t i o n   s u m m a r i z e s   t h e   f i nd i ngs   o f   o ur   r e s e a r c h .       2.   RE L AT E WORK   T h e   Ha do o f r a m e wo r l a c ks   b u il t - i n   s e c ur i t y   m e a s ur e s   f o r   t h e   d i v e r s e   t y pe s   o f   da t a   i t   s tor e s ,   pr o m pt i n v a r i o us   r e s e a r c h e r s   t o   p r o p o s e   m u l t i p l e   s t r a t e gi e s   f o r   s e c ur i n f i l e s   w i t hi t h e   HD F S .   Am o n g   t h e s e   s t r a t e gi e s ,   e n c r y pt i o n   e m e r ge s   a s   a   pr o m i ne n t   s o l ut i o n   f o r   s a f e gu a r d i n da t a   s to r e d   i n   Da t a No de s   a n e ns ur i n s e c ur e   da t a   tr a n s mi s s i o n   dur i n M a p R e duc e   o pe r a t i o ns .   I n   o n e   s t udy   [ 5] ,   a   s e c ur e   HD F S   a r c hi t e c t ur e   i s   pr e s e n t e t h a e m p l o y s   K e r b e r o s   o v e r   S S L   to  f a c il i t a t e   r o b us m ut ua l   a ut h e n t i c a t i o n   a n d   a c c e s s   c o n t r o l ,   t h e r e by   e nh a n c i ng  t h e   o v e r a ll   s e c ur i t y   o f   HD F S .   An o t h e r   r e s e a r c h   e f f o r t   [ 14 ]   i n t r o duc e s   a   de pe n d a bl e   f il e   s y s t e m   a r c hi t e c t ur e   t h a i n t e gr a t e s   a ut h e n t i c a t i o n   a ge n t   t e c h n o l o g y   w i t h   f u l ly   h o m o m o r p hi c   e n c r y pt i o n ,   o f f e r i ng  e nh a n c e r e l i a bil i t y   a n s e c ur i t y   a ga i ns t   t h r e a t s   f r o m   da t a ,   h a r dwa r e ,   us e r s ,   a n o pe r a t i o n a l   pr o c e s s e s .   Z h o a n W e n   [ 15]   a ppl y   c i p h e r   t e x t   p o l i c y   a n a tt r i b ut e - b a s e e n c r y pt i o n   ( C P _AB E )   to  e s t a bl i s a c c e s s   c o n t r o l   c r e de n t i a l s   f o r   a ut h or i z e c l o ud  us e r s ,   ut i l i z i ng  a n   e n c r y pt e da t a   a c c e s s   c o n t r o l   f r a m e wo r r a t h e r   t h a n   r e l yi ng  o n   i nd i v i dua l   us e r   i de n t i t i e s .   A dd i t i o n a ll y ,   P a r a n L e e   [ 11]   pr o p o s e   a   m e t h o f o r   s e c ur i n Ha do o t h r o ugh   e n c r y pt e HD F S   by   i nc o r p or a t i n e nc r y pt i o n /dec r y pt i o n   f u n c t i o ns   b a s e o n   t h e   A E S   a l go r i t hm .   T h e i r   e x pe r im e n t s   i n d i c a t e   t h a t h e   c o m put a t i o n a l   o ve r h e a i s   r e duc e by   l e s s   th a n   7%   dur i n r e pr e s e n t a t i v e   M a p R e duc e   j o b s .   F ur t h e r m o r e ,   t h e   r e s e a r c h e r s   i n   [ 16]   pr e s e n t   a   hy br i e n c r y pt i o n   a ppr o a c h   f o r   HD F S   t h a t   c o m bi ne s   HD F S - R S A   a n HD F S - pa i r i ng.   Ho we v e r ,   i t   i s   n o t e d   t h a b ot h   t h e   r e a d   a n wr i t e   pe r f o r m a nc e   o f   t h e   e n c r y pt e HD F S   i s   i nf e r i o r   to  t h a o f   t h e   s t a n da r d   HD F S .   I n   t h e   r e s e a r c h   c o n duc t e d   by   Ya n e a l.   [ 17] ,   a   n o v e l   t r i p l e   e n c r y pt i o n   s c h e m e   ha s   b e e n   pr o p o s e d,   whi c h   i s   i n t e gr a t e d   i n t Ha d oo f o r   c l o ud  da t a   s tor a ge T hi s   s c h e m e   i n c o r por a t e s   hy b r i e n c r y pt i o n   t e c hni que s ,   s pe c i f i c a ll y   ut i l i z i ng  R S A   a n DE S   a l go r i t hm s   a l o n g s i d e   I DE A   to  s e c ur e   t h e   us e r ' s   R S A   pr i va t e   ke y .   T hi s   m e t h o e n s ur e s   t h a t   f i l e s   s to r e d   i n   HD F S   a r e   e n c r y pt e whil e   t h e y   a r e   t e m po r a r i ly   h e l i n   a   b u f f e r   f o l l o w i ng  t h e i r   up l o a to  HD F S .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2 5 0 2 - 4 7 52   In do n e s i a n   J   E l e c   E n g   &   C o m S c i Vo l .   3 8 ,   N o .   2 M a y   20 2 5 :   1 256 - 1 264   1258   T h e   s t udy   r e f e r e nc e i n   [ 18]   di s c us s e s   va r i o us   s tr a t e gi e s   a i m e a t   e n h a n c i ng  i nf o r m a t i o n   s e c ur i t y   a n a ddr e s s i ng  s a f e t y   c o n c e r n s   t h r o ugh   m e t h o dol o g i e s   s uc h   a s   s e c ur i t y   h a r de ni ng  a n a tt r i b ut e   s e l e c t i o n .   Not a bl y ,   t h e   r e s e a r c h e r   h a s   put   f o r t h   a   s e c ur i t y - o r i e n t e a ppr o a c h   to   da t a   c o l l e c t i o n   a n t h r e a t   a n a ly t i c s ,   whi c h   a i m s   t m i t i ga t e   r i s k s   pr i o r   to  t h e   o c c ur r e n c e   o f   s e c ur i t y   b r e a c h e s .   I n   t h e   wo r k   o f   M a h e s wa r i   [ 19]   pr e s e n t e d,   a   s t r a t e gy   to  b o l s t e r   s e c ur i t y   w i t hi n   Ha d oo i s   o u t l i ne d.   T hi s   a ppr o a c h   e m p l o y s   A E S   i n   c o nj u n c t i o n   w i t h   m e s s a g e   d i ge s t   ( M D5)   a n DE S   a l go r i t hm s   f o r   da t a   e n c r y pt i o n .   A dd i t i o na l ly ,   th e   d i g i t a l   s i g na t ur e   a l go r i t hm   ( DSA )   i s   ut i li z e f o r   da t a   a u th e n t i c a t i o n   pur po s e s .   I n   t h i s   f r a m e wo r k,   a u t h o r i z e us e r s   up l o a t h e i r   da t a   to  c l o ud  s to r a ge ,   wh e r e   i t   i s   e n c r y pt e b e f o r e   b e i ng  s t or e i n   HD F S ,   a l l o w i n f o r   s ubs e que n t   s h a r i ng  a m o n m u l t i p l e   r e c i p i e n t s .   C o n ve r s e ly ,   M a hm o ud   [ 12]   h a v e   i n t r o duc e a   m e t h o do l o g y   ut i l i z i ng  H DF S   a im e a t   de c r e a s i n b o t h   t h e   c o m put a t i o n   t i m e   a n s i z e   o f   e nc r y pt e f i l e s   t h r o ugh   t h e   i m p l e m e n t a t i o n   o f   A E S   a n OT P   a l go r i t hm s .   A dd i t i o n a ll y ,   t h e y   e m p l o y e t h e   A E S   a l go r i t hm   i n   c o nj u n c t i o n   w i t h   t h e   c i p h e r   bl o c c h a i n i n g   m o de ,   s pe c i f i c a l ly   t h e   e l e c t r o ni c   c o de b o o k   ( E C B )   m o de ,   whi c h   i s   pa r t i c u l a r ly   s u i t a bl e   f o r   m a na g i ng  HD F S   bl o c k s ,   whi l e   t h e   OT P   a l go r i t hm   f u n c t i o ns   a s   a   s t r e a m   c i p h e r .       3.   S E CU RE   HA DOOP   USI NG  ON  AE S   AN DE S   3. 1.     Over view   T h e   DE S   i s   a   w i de ly   r e c o gni z e bl o c c i p he r   a l g o r i t hm ,   pr i m a r i ly   due   to  i t s   r o l e   a s   a   s t a n da r f o r   s y mm e t r i c   ke y   e nc r y pt i o n   [ 20] ,   [ 21] .   O r i g i na ll y   d e v e l o pe by   I B M   i t h e   1970s ,   i t   wa s   o f f i c i a ll y   a d o p t e by   t h e   Uni t e S t a t e s   g o v e r nm e n t   i n   1976  a s   a   F e de r a I nf o r m a t i o n   P r o c e s s i n s t a n d a r ( F I P S ) .   D E S   o pe r a t e s   o n   64 - bi t   bl o c k s   o f   da t a   a n e m p l o y s   a   56 - bi t   ke y   f o r   e n c r y pt i o n ,   e x e c ut i n a   t ot a l   o f   16  i t e r a t i o ns   to   t r a ns f o r m   64 - bi t   p l a i n t e x t   i n t o   64 - bi t   c i p h e r t e x t .   T h e   A E S   i s   a n o t h e r   pr o m i ne n t   bl o c c i p h e r   e nc r y pt i o n   a l go r i t hm ,   i n t r o duc e by   t h e   Na t i o n a l   I n s t i t ut e   o f   S t a n da r ds   a n T e c hn o l o g y   ( NI S T )   i n   2000.   A s   n o t e i n   va r i o us   s o ur c e s   [ 5] ,   [ 22] ,   A E S   i s   a   s y mm e t r i c   bl o c c i p h e r   t h a u t i li z e s   t h e   s a m e   k e y   f o r   b ot h   e n c r y pt i o n   a n de c r y pt i o n   pr o c e s s e s .   I t   wa s   de v e l o pe by   B e l g i a n   c r y pt o gr a ph e r s   Da e m e n   a n R ij m e n   [ 23]   a n i s   n o t a bl e   f o r   i t s   f l e xi bil i t y   i n   ke l e n gt h s ,   s uppo r t i n 128 - bi t ,   192 - bi t ,   a n 256 - bi t   ke y s .   F ur t h e r m o r e ,   A E S   i s   r e c o gni z e a s   a   hi g hly   e f f e c t i v e   bl o c c i p h e r ,   pa r t i c u l a r ly   we ll - s u i t e f o r   m a n a g i ng   HD F S   bl o c ks .     3. 2.     AE S   an d   DE S   al gor it h m s   f o r   d at s e c u r it y   Our   pr o p o s e e n c r y pt i o n   a l go r i t hm   i s   de s i g n e to   e n c r y pt   a n de c r y pt   f il e s   s t o r e d   i n   t h e   HD F S   t h r o ugh   a   hy b r i m e t h o do l o g y   t h a t   i n t e gr a t e s   t w o   di s t i n c t   a l g o r i t hm s A E S   a n DE S .   T h e   A E S   a l go r i t hm  o pe r a t e s   i n   c i p he r   bl o c c ha i ni ng  m o de ,   s pe c i f i c a l ly   t h e   E C B   m o de ,   w hi c h   i s   w i de ly   r e c o gni z e a s   o n e   o f   t h e   m o s t   e f f e c t i v e   bl o c c i p h e r   a l go r i t hm s   f o r   m a na g i n HD F S   bl o c ks .   C o n ve r s e ly ,   t h e   DE S   a l go r i t hm   i s   e m p l o y e t e n c r y pt   t h e   A E S   ke y   a f t e r   t h e   f il e   ha s   b e e n   e nc r y pt e w i t hi n   H DF S .   T hi s   ke y   i s   s u b s e que n t ly  de c r y pt e us i n DE S   wh e n   t h e   us e r   i n t e n ds   to  de c r y pt   t h e   f il e   f o r   e x e c ut i n a   M a pR e duc e   j o b.   I n   t hi s   f r a m e wo r k,   t h e   e n c r y pt i o n   i s   pe r f o r m e us i ng  a   128 - bi t   ke y .   T e n h a nc e   t h e   s e c ur i t y   o f   t h e   Ha do o p   e nvi r o nm e n t ,   t h e   us e r   wi ll   f ur t h e r   e nc r y pt   t h i s   ke y   ut i li z i ng   t h e   DE S   a l go r i t hm .   W h e n   t h e   u s e r   i ni t i a t e s   a   M a pR e duc e   j o b ,   t h e   f i r s t   s t e i nv o l v e s   de c r y pt i n g   t h e   ke y   t h r o ugh   a   DE S   f u n c t i o n .   T h e   de t a i l e pr o c e s s   o f   e n c r y p t i o n   a n de c r y pt i o n   f o r   t h e   pr o p o s e a ppr o a c h   i s   o u t l i ne i n   t h e   P s e udo c o de   1 .     P s e udo c o de   1 .   P r o c e s s   f o r   e n c r y pt i n a n de c r y pt i n f il e s   i n   HD F S   ENCRYPTION   Initialization   DES key    random (64 - bit)   AES key    random (128 - bit)   Block size    64MB   Encrypted key    null   Ciphertext    create empty file ( )   Encrypt HDFS (input file)   start    While (! end of file)   start    Block    input file.read (block size)   if (length (block) =0)   break   else if (length (block) mod 16 ≠ 0)   block    block + '  ' *(16  -   length (block) mod16)   end if    Ciphertext    ciphertext.write (AES encrypt (block, AES key))   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2 5 0 2 - 4 7 52       E nhanc e   big  data   s e c ur it y   bas e on  HD F us ing  the  hy br id  appr oac h   ( F ay ç al  Z ine - Dine )   12 59   end while    HDFS    upload (ciphertext)   Encrypted key.    ES encrypt (AES key, DES key)     DECRYPTION   Decrypt HDFS (ciphertext)   start   Decrypted key    DES decrypt   (encrypted key, DES key)   While (! end of file)   start    Block    ciphertext .read (block size)   if (length (block) =0)   break   end if   Plaintext    plaintext.write (AES decrypt (block, decrypted key))   end while     3. 3.     E n c r yp t in f il e s   in   HDF S   I ni t i a l ly ,   we   a s s u m e   t h a t h e   us e r   e n c r y pt s   t h e   f il e   pr i o r   to  i t s   s tor a ge   i n   HD F S .   W h e n   t h e   HD F S   c l i e n t   i ni t i a t e s   a   r e que s t   to  wr i t e   a   f i l e   t HD F S   [ 24] ,   i t   i nv o ke s   t h e   c r e a t e   ( )   m e t h o o n   t h e   DF S ,   whi c h   i t ur n   c o m m u ni c a t e s   w i t h   t h e   Na m e No de   to   e s t a b li s h   a   ne f i l e   w i t hi n   t h e   f il e s y s t e m 's   n a m e s pa c e .   I n   t h e   e v e n t   o f   a n   e r r o r ,   t h e   c l i e n t   e n c o un t e r s   a n   I OE xc e pt i o n;   i f   s uc c e s s f u l ,   t h e   Na m e No de   pr o c e e ds   to  c r e a t e   t h e   f i l e .   S u b s e que n t l y ,   t h e   DF S   pr o vi de s   a n   F S Da t a Out pu t S tr e a m .   T h e   c li e n t   t h e n   be g i ns   t h e   e n c r y pt i o n   pr o c e s s   us i n t h e   pr o po s e m e t h o a n wr i t e s   t h e   e n c r y pt e f i l e   i n t o   t h e   F S Da t a Out pu tS t r e a m ,   whi c h   d i v i d e s   i t   i n t pa c ke t s .   T h e s e   pa c ke t s   a r e   d i r e c t e to  a n   i n t e r n a que ue   kn o wn   a s   t h e   da t a   que ue ,   whi c h   i s   ut i li z e by   t h e   da t a   s t r e a m e r .   T h e   da t a   s tr e a m e r 's   r o l e   i s   t r e que s t   t h e   Na m e No de   to  a l l o c a t e   n e bl o c k s   w hi l e   s e lec t i n a   s e t   o f   Da t a No de s   f o r   s to r i n t h e   r e pl i c a s .   T h e   da t a   s t r e a m e r   t r a n s m i t s   t h e   pa c ke t s   to   t h e   f i r s t   D a t a N o de ,   whi c h   r e t a i ns   t h e   pa c ke a n f o r wa r ds   i t   to  th e   s u b s e qu e n t   Da t a N o de ,   c o n t i n u i ng  t hi s   pr o c e s s   un t il   c o m p l e t i o n .   Upo n   s uc c e s s f u l   c o m p l e t i o n   o f   t h e   wr i t e   o pe r a t i o n ,   t h e   Da t a No de   s e n ds   a n   a c k n o w l e dg m e n t   b a c t o   t h e   HD F S   c li e n t   vi a   D F S .   F i na ll y ,   t h e   HD F S   c li e n t   c o n c l ude s   t h e   pr o c e s s .   T h e   s t a ge s   o f   t his   o pe r a t i o n   a r e   i ll us t r a t e d   i n   F i gur e   1.           F i gur e   1.   W r i t i n a   f il e   w i t h   e nc r y pt i o n   i n   HD F S       3. 4.     De c r yp t in f il e s   in   m ap   t as k   T h e   de c r y pt i o n   pr o c e s s   i s   i ni t i a t e wh e n   t h e   c l i e n t   o p t s   to  e x e c ut e   a   M a pR e duc e   j o b ,   whi c h   i s   s e t   up   o n   t h e   c l i e n t   n o de   [ 25]   a n r un s   w i t hi n   a   J a v a   vir t ua l   m a c hi ne   ( J VM ) .   T h e   J o b C l i e n t   tr a n s mi t s   a   n e j o r e que s t   to  t h e   J o b T r a c ke r ,   whi c h   s ubs e que n t l y   r e t ur n s   a   uni que   j o b   i de n t i f i c a t i o n   n u m be r .   F o l l o w i ng  t hi s ,   t h e   n e c e s s a r y   e x e c ut i o n   f il e s   a n d i s t r i b ut e c a c h e   i nf o r m a t i o n   a r e   tr a n s f e r r e to   t h e   r e l e v a n t   n o de s .   T h e   j o b   i s   t h e n   s u bmi t t e d,   a n t h e   J o b T r a c ke r   ut i li z e s   t h e   j o b   I to   c o m m e n c e   t h e   j o b   a n v e r i f i e s   t h e   i n put   da t a   r e qu i r e f o r   e x e c ut i o n .   T h e   J o b T r a c ke r   a s s i g ns   t h e   j o b   to  a   t a s tr a c ke r   t h a t   h a s   t h e   c a pa c i t y   to  e x e c ut e   t h e   m a t a s k.   T h e   t a s k   tr a c ke r   t h e n   a c qu i r e s   t h e   n e c e s s a r y   r e s o ur c e s   to   pe r f o r m   t h e   t a s k.   U l t i m a t e l y ,   t h e   t a s Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2 5 0 2 - 4 7 52   In do n e s i a n   J   E l e c   E n g   &   C o m S c i Vo l .   3 8 ,   N o .   2 M a y   20 2 5 :   1 256 - 1 264   1260   t r a c ke r   i ni t i a t e s   a   n e J VM   a n b e g i ns   t h e   de c r y pt i o n   o f   t h e   e nc r y pt e da t a   us i n t h e   pr o p o s e m e t h o d,   f o l l o we by   t h e   e x e c ut i o n   o f   t h e   m a t a s k.   T h e   e x e c ut i o n   f l o o f   t h e   M a pR e duc e   j o b   a n t h e   de c r y pt i o pr o c e s s   i s   i ll us t r a t e i n   F i gur e   2.           F i gur e   2.   De c r y pt i o n   pr o c e s s   a t   M a pR e duc e   j o b       4.   E XP E R I M E NT AL   AN A L YSI S   4. 1.     E x p e r im e n t a l   e n vir on m e n t   T a s s e s s   t h e   e f f i c a c y   o f   o ur   pr o p o s e m e t h o do l o gy ,   we   ut i li z e C l o ude r a   Qu i c kS t a r t   5. 13 . [ 26] ,   a n   o pe n   di s t r i b ut i o n   o f   Ha doo p,   whi c h   wa s   i n s t a ll e a n c o nf i gur e w i t hi n   a n   o r a c l e   VM   V i r t ua l B o x   6. 0   vi r t ua l   m a c hi ne .   T h e   Ha do o c l us t e r   e s t a bl i s he i s   a   s i n g l e   n o de   c o nf i gur a t i o n ,   o pe r a t i n o n   v e r s i o n   2. 6.   T hi s   c l u s t e r   c o m pr i s e s   a   s i n g l e   h o s t ,   whi c h   i s   e x e c u t e o n   a   l a pt o e qui ppe w i t h   a n   I n t e l   C o r e   i 5 - 5200U   pr o c e s s o r ,   f e a t ur i n c o r e s ,   a   c l o c s pe e o f   2. 20  GH z ,   a n GB   o f   R AM .     4. 2.     Re s u l t s   of   t h e   e x p e r im e n t   I n   t hi s   s e c t i o n ,   we   pr o vi de   a   c o m pr e h e ns i ve   a na l y s i s   a n r e s u l t s   o f   o ur   p r o p o s e t e c hni qu e   i c o m pa r i s o n   t ot h e r   e s t a bl i s h e m e t h o ds .   S pe c i f ica l ly ,   to  e v a l ua t e   t h e   e f f e c t i v e n e s s   o f   o ur   a l go r i t hm ,   we   c o n duc t e a   c o m pa r i s o n   w i t h   t h e   A E S   a l go r i t hm   [ 11]   a n A E S   c o m bi ne w i t h   OT P   a s   r e f e r e n c e i n   [ 12] .   A dd i t i o n a ll y ,   w e   ut i li z e f il e s   o f   v a r yi ng  s i z e s   r a n g i ng  f r o m   m e ga by t e s   t o   gi ga by t e s   ( 64  M B ,   128  M B ,     256  M B ,   512  M B ,   a n GB ) .   T h e   pe r f o r m a n c e   m e t r i c s   o f   o ur   t e c h ni que   we r e   a s s e s s e i n   t e r m s   o f   e n c r y pt i o n   t i m e ,   de c r y pt i o t i m e ,   f il e   s i z e ,   a n t h r o ugh put,   whi c h   i s   de f i ne a s   t h e   s i z e   o f   t h e   p l a i n t e x t   di vi de by   t h e   tot a l   t i m e   take n   f o r   e n c r y pt i o n   a n de c r y pt i o n .   F o r   t h e   i m p l e m e nt a t i o n   o f   t h e   f u n c t i o n s ,   we   e m p l o y e P y t h o a s   t h e   pr o g r a m mi ng  l a n gua ge .   As   de t a i l e i n   T a bl e   1,   th e   t i m e   t a ke n   to   w r i t e   a   GB   ge n e r i c   f i l e   t o   H DF S   wa s   7 . 9913  m i nut e s ,   whi l e   t h e   e n c r y pt e f il e   us i ng  t h e   A E S   a l go r i t hm   r e qu i r e 12. 9751  m i nut e s .   I n   c o n tr a s t ,   o ur   pr o p o s e t e c h ni que   a c hi e v e e n c r y pt i o n   o f   a   GB   f il e   i n   HD F S   i n   j us t   3. 3483   m i nut e s .   F ur t h e r m o r e ,   t h e   de c r y pt i o n   r e s u l t s   pr e s e n t e i n   T a bl e   i n d i c a t e   t h a t   o u r   m e t h o a l s o   de m o n s t r a t e s   a   s i g ni f i c a n t   a dv a n t a ge .   T h e   de c r y pt i o n   t i m e   f o r   a   1   GB   f i l e   us i ng  o u r   t e c hni qu e   wa s   r e c o r de d   a 12. 1925  mi nut e s ,   c o m pa r e to   12 . 2115  m i n ut e s   f o r   A E S   wi t h   OT P   a n 14. 0841  m i n ut e s   f o r   t h e   A E S   a l go r i t hm .   Al t h o ugh   t h e   d i f f e r e n c e s   i n   de c r y pt i o n   t i m e s   a r e   l e s s   pr o n o un c e d,   o ur   a ppr o a c h   s t i ll   pr o vi de s   s upe r i o r   pe r f o r m a n c e ,   a c hi e vi ng  a n   o pt i m a l   b a l a nc e   b e t we e n   s e c ur i t y   a n s p e e d.   T hi s   e nh a n c e e f f i c i e n c i n   b o t h   e n c r y pt i o n   a n de c r y pt i o n   un d e r s c o r e s   t h e   r o b us t n e s s   o f   o ur   m e t h o f o r   bi da t a   s y s t e m s   ut i li z i ng  HD F S .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2 5 0 2 - 4 7 52       E nhanc e   big  data   s e c ur it y   bas e on  HD F us ing  the  hy br id  appr oac h   ( F ay ç al  Z ine - Dine )   1261   T a bl e   1.   F i l e   e n c r y pt i o n   pe r f o r m a n c e   c o m pa r i s o n   a m o n g e n e r i c   HD F S ,   A E S ,   A E S   wi t h   OT P   a n t h e   pr o p o s e a ppr o a c h       T a bl e   2.   F i l e   de c r y pt i o n   pe r f o r m a n c e   c o m pa r i s o n   a m o n g e n e r i c   HD F S ,   A E S ,   A E S   wi t h   OT P   a l go r i t hm s   a n t h e   pr o p o s e a ppr o a c h   F il e  s i z e   ( M B )   G e ne r i c  H D F S     ( mi nut e s )   A E S  a lg or it hm   ( mi nut e s )   A E S  a nd O T P     ( mi nut e s )   P r o p o s e d a ppr o a c h   ( mi nut e s )   64   0.4242   1.3056   1.0950   0.6155   128   1.1137   2.1859   1.6560   1.3627   256   1.8642   2.8641   2.6554   2.2278   512   4.2917   8.9494   6.5361   5.0441   1024   11.2232   14.0841   12.2115   12.1925   T ot a de c r y pt i o ti m e   ( mi nut e s )   18.9170   29.3891   24.1540   21.4426   T h r o ughput ( M B /m in ut e s )   104.8792   67.5080   82.1396   92.5260       As   i n d i c a t e i n   T a bl e   3,   t h e   ge ne r i c   f il e   s i z e   o f   1   GB   i n c r e a s e s   to   1. 5   GB   wh e n   e n c r y pt e w i t h   A E S ,   whil e   i t   de c r e a s e s   t 1. 2   GB   wh e n   b o t h   A E S   a n OT P   a r e   a ppl i e d.   I n   c o n t r a s t ,   o u r   m e t h o m a i n t a i n s   t h e   e n c r y pt e f i l e   s i z e   a t   t h e   o r i g i na l   ge n e r i c   f il e   s ize .   I n   o r de r   to   e f f e c t i v e ly   il l us t r a t e   t hi s   c o m pa r is o n ,   we   c r e a t e gr a phi c a l   r e pr e s e n t a t i o n s   f o r   e a c h   c r i t e r i o n .   F i gur e   de p i c t s   t h e   e s t i m a t e t i m e   r e qu i r e d   f o r   t h e   e n c r y pt i o n   pr o c e s s   a c r o s s   v a r i o us   a l go r i t hm s ,   in c l ud i ng  t h e   pr o po s e m e t h o d.   A dd i t i o na l ly ,   F i gur e   il l us t r a t e s   t h e   t i m e   r e qu i r e f o r   t h e   de c r y pt i o n   p r o c e s s   wh e n   e m p l o yi ng  v a r i o us   a l go r i t hm s   a l o n g s i d e   t h e   pr o p o s e m e t h o d.       T a bl e   3.   F i l e   s i z e   c o m pa r i s o n   a m o n g e ne r i c   HD F S ,   A E S ,   A E S   wi t h   OT P   a l go r i t hm s   a n t h e   pr o p o s e a ppr o a c h   F il e  s i z e   ( M B )   G e ne r i c  H D F S     ( M B )   A E S  a lg or it hm   ( M B )   A E S  a nd O T P     ( M B )   P r o p o s e d a ppr o a c h   ( M B )   64   64   96.0   74.7   64   128   128   192.0   149.3   128   256   256   384.0   298.7   256   512   512   768.0   597.3   512   1024   1024   1536   1228.8   1024           F i gur e   3.   E n c r y pt i o n   t i m e   ( mi nut e s )   o f   g e n e r i c   HD F S ,   A E S ,   A E S   wi t h   OT P   a n p r o p o s e a ppr o a c h   F il e  s i z e   ( M B )   G e ne r i c  H D F S   ( mi nut e s )   A E S  a lg or it hm   ( mi nut e s )   A E S  a nd O T P   ( mi nut e s )   P r o p o s e d a ppr o a c h   ( mi nut e s )   64   0.4242   0.8704   0.7311   0.5762   128   0.8087   1.8216   1.3820   0.6136   256   1.6089   2.7396   2.5484   1.3447   512   3.0866   6.6682   4.8780   3.1175   1024   7.9913   12.9751   11.2511   3.3483   T ot a e n c r y pt i o ti m e   ( mi nut e s )   13 . 9197   25.0749   20.7906   9.0003   T h r o ughput  ( M B /m in ut e s )   142.5318   79.1229   95.4277   220.4370   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2 5 0 2 - 4 7 52   In do n e s i a n   J   E l e c   E n g   &   C o m S c i Vo l .   3 8 ,   N o .   2 M a y   20 2 5 :   1 256 - 1 264   1262       F i gur e   4.   De c r y pt i o n   a n j o b   e x e c ut i o n   t i m e   ( m i nu t e s )   o f   g e n e r i c   HD F S ,   A E S ,   A E S   a n OT P   a n p r opo s e a ppr o a c h       4. 3.     Dis c u s s ion   I n   t hi s   r e s e a r c h ,   we   a s s e s s e t h e   e f f i c a c y   o f   a   hy b r i e n c r y pt i o n   s t r a t e gy   t h a t   i n t e gr a t e s   t h e   A E S   a n DE S   a l go r i t hm s   f o r   t h e   pr ot e c t i o n   o f   HD F S   f i l e s .   Our   f i nd i ngs   i n d i c a t e   a   n ot a bl e   de c r e a s e   i n   e nc r y pt i o n   dur a t i o n   whe n   c o m p a r e to   c o n v e n t i o n a l   t e c hni qu e s ,   w i t h   o ur   m e t h o r e qui r i ng  3. 3483  m i n ut e s   t e n c r y pt   a   GB   f i l e ,   i n   c o n t r a s to  12. 9751   m i n ut e s   f o r   A E S   a l o n e .   T hi s   e nh a n c e e f f i c i e n c y   c a n   b e   a tt r i b ut e to  t h e   s y ne r g i s t i c   b e ne f i t s   o f   b o t h   a l go r i t hm s ,   whi c h   n o o nl y   b o l s t e r   pe r f o r m a n c e   b ut   a l s o   e n s ur e   r o b u s t   s e c ur i t y .   W h e n   j u x t a po s i n o ur   f i nd i ngs   w i t h   t h o s e   f r o m   o th e r   i nve s t i ga t i o n s ,   s uc h   a s   [ 22] ,   whi c h   f o c us e o A E S   i n   i s o l a t i o n   a n A E S   c o m bi ne w i t h   OT P ,   i t   b e c o m e s   e vi de n t   t h a o ur   m e t h o pr o vi de s   s upe r i o r   e n c r y pt i o n   s pe e ds   a n mi n i mi z e s   f i l e   s i z e .   F ur t h e r m o r e ,   o ur   a pp r o a c h   pr e s e r v e s   t h e   e nc r y pt e f il e   s ize   to   b e   e qu i v a l e n t   to   t h a o f   t h e   o r i g i na l ,   unli ke   t h e   A E S   a n OT P   c o m bi na t i o n ,   whi c h   t e n ds   to  i nf l a t e   t h e   e n c r y pt e f i l e   s i z e .   T h e   pr o p o s e s c h e m e   de m o ns t r a t e s   a   hi g h e r   t h r o ugh put  r e l a t i v e   t b ot h   t h e   A E S   a n A E S   w i t h   OT P   m e t h o do l o g i e s .   I i s   we l l - e s t a bl i s he t h a t   i n c r e a s e t h r o ugh put  c or r e l a t e s   w i t h   r e duc e e n e r g y   c o n s u m pt i o n ,   i nd i c a t i n t h a t h e   e n e r g y   us a ge   o f   t h e   A E S   a n DE S   c o m bi na t i o n   i s   l o we r   t h a n   t h a o f   t h e   A E S   a n A E S   w i t h   OT P   c o n f i gur a t i o n s .   No n e t h e l e s s ,   a   l im i t a t i o n   o f   o u r   s t udy   i s   t h e   r e l i a n c e   o n   a   s i n g l e - n o de   Ha doo p   c l us t e r ,   whi c h   m a y   n o t   a c c ur a t e l y   r e f l e c t   pe r f o r m a n c e   i a   m o r e   e xt e n s i ve   a n d i s t r i b ut e s e t t i n g.   I n t e r e s t i n g ly ,   we   n o t e a   c o n s i s t e n t   e nh a n c e m e n t   i n   t h r o ugh put   a c r o s s   v a r i o us   f il e   s i z e s ,   hi n t i ng  a t   pot e n t i a l   s c a l a bil i t y   be n e f i t s .   T h e   pr i m a r y   a im   o f   t hi s   r e s e a r c h   wa s   to   i m pr o v e   da t a   s e c ur i t y   w i t hi n   H a do o p' s   HD F S   t h r o ugh   t h e   im p l e m e n t a t i o n   o f   a   hy b r i e nc r y pt i o n   s t r a t e g y .   T h e   f i nd i ngs   u n de r s c o r e   t h e   n e c e s s i t y   o f   r e f i n i ng  e nc r y pt i o n   m e t h o do l o g i e s   to   a de qua t e l y   pr o t e c e x t e n s i ve   da tas e t s .   T hi s   i nv e s t i ga t i o n   l a y s   t h e   gr o un dwor f o r   a dd i t i o n a l   s t udi e s   o n   hy br i e n c r y pt i o n   t e c hni que s ,   i n d i c a t i n t h a t   f ut ur e   i n qu i r i e s   s h o u l f o c us   o n   a s s e s s i ng   pe r f o r m a n c e   i n   m u l t i - n o de   c l us t e r s   a n pr a c t i c a a pp l i c a t i o n s .   T a c k l i ng  t h e s e   a s pe c t s   w i ll   b e   e s s e n t i a l   f o r   f o r m u l a t i n m o r e   r o b us t   s o l ut i o ns   f o r   bi da t a   s e c ur i t y .       5.   CONC L USI ON   I n   t h i s   r e s e a r c h ,   t h e   a u t h o r s   f o c us e o n   e n h a n c i n da t a   s e c ur i t y   w i t hi n   t h e   HD F S .   T a ddr e s s   t h e   s e c ur i t y   c h a ll e n ge s   a s s o c i a t e w i t h   bi da t a ,   a   hy b r i m e t h o do l o g y   wa s   pr o p o s e t h a i n t e gr a t e s   b ot h   A E S   a n DE S   e n c r y pt i o n   t e c hni que s .   E a c h   f il e   i s   e n c r ypt e p r i o r   to  b e i n s to r e i n   HD F S ,   ut i l i z i ng  t h e   A E S   a n d   DE S   a l go r i t hm s ,   a n i s   s u bs e que n t l y   de c r y pt e dur i n t h e   m a t a s k.   T a s s e s s   t h e   e f f e c t i v e n e s s   o f   t h e   pr o p o s e d   m e t h o d,   f i l e s   o f   v a r yi ng  s i z e s   we r e   u t i li z e i n   t h e   e v a l ua t i o n .   T h e   e x pe r i m e n t a l   r e s u l t s   i n d i c a t e t h a t   t hi s   a ppr o a c h   i s   m o r e   t i m e - e f f i c i e n t   c o m pa r e d   to   ot h e r   m e t h o ds   i m p l e m e n t e d.   A dd i t i o n a ll y ,   t h e   pr o p o s e d   te c h ni que   d e m o ns t r a t e s upe r i o r   t h r o ugh put   whi le  m a i n t a i n i ng  l o we r   po we r   c o n s u m pt i o n .   I m po r t a n t l y ,   t hi s   m e t h o d o e s   n o r e s ul t   i n   a n   i nc r e a s e   i n   f il e   s i z e .       RE F E R E NC E S   [ 1]   B S a r a la d e v i,   N .   P a z ha ni r a ja P V .   P a ul M .S S .   B a s ha   a nd  P D ha v a c h e l v a n,  " B ig   d a ta   a nd  H a d oo p - s tu d y   in   s e c u r it y   pe r s pe c ti ve , "   P r oc e di a C om put e r  Sc ie n c e , v o l.  50, pp. 596 - 601,  2015, do i:  10.1016/j .p r oc s .2015.04.091.    [ 2]   T . W hi t e " H a d oo p:   th e  d e f in i ti v e  gu id e " . S e ba s to p o l,  C A , U S A O ' R e il l y  M e di a , 2015.     [ 3]   J D e a n a nd  S G h e ma w a t ,   M a pR e duc e :   s im pl i f i e d da ta  pr oc e s s in g o n l a r g e   c lu s t e r , ”  C om m uni c at io ns  of  t he  A C M , vo l.  51, n o. 1,  pp. 107 - 113, 2008, do i 10.1145/1327452.13 27492.   [ 4]   S G h e ma w a t,   H G o bi of f a nd  S T - L e ung ,   T h e   G oo gl e   f il e   s y s te m ,”   A C M   SI G O P O pe r at in Sy s te m s ,   v o l.   37,  n o 5,  pp.29 - 43 2003 , do i:  10.1145/1165389.9 45450 .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n do n e s i a n   J   E l e c   E n &   C o m S c i     I S S N:   2 5 0 2 - 4 7 52       E nhanc e   big  data   s e c ur it y   bas e on  HD F us ing  the  hy br id  appr oac h   ( F ay ç al  Z ine - Dine )   1263   [ 5]   I O M a ll e y K Z ha ng,  S R a di a R .   M a r ti a nd  C .   H a r r e l l,   H a doo s e c u r it y   de s ig n,”   Y a hoo!   T e c hni c a R e p o r t,   2009.  [ O nl i ne ] A v a il a bl e ht tp s :/ /i s s ue s .a pa c he . or g/ ji r a /s e c u r e /a tt a c hm e nt /1 242 8744/H a d oo pS e c ur it y D e s ig n.pd f . ( A c c e s s e d:  J a n. 29, 2024)   [ 6]   I s hw a r a ppa   a nd  J A nur a dha " A   br ie f   in tr o du c ti o o bi da t a   5V s   c ha r a c t e r is ti c s   an H a d oo t e c hn ol o g y , "   P r oc e di C om put e r   Sc ie nc e , v o l.  48, pp. 319 - 324, 2015, d o i:  10.1016/j .pr oc s .2015. 04.188.   [ 7]   H J H a di A H S hna in S H a di s ha he e d   a nd  A H A hma d,  " B ig   D a ta   a nd  f i ve   V S   c ha r a c t e r is ti c s ,"   I nt e r nat io nal   J our nal   of   A dv anc e s  i n E l e c tr oni c s  and  C om put e r  S c ie nc e ,   v o l.  2, n o . 1, 2 015.   [ 8]   A . M ur th y , V .  K .  V a v i la pa ll i,  D . E a dl in e , J . N i e mi e c , a nd J . M a r kha m,  " A pa c h e   H a d oo p Y A R N m ov in g b e y ond  M a pR e du c e  a nd  ba tc h pr oc e s s in g w it h   A pa c h e   H a d oo p 2, "   B o s to n, M A , U S A A ddi s o n - W e s l e y , 2014.   [ 9 ]   M .   R .   G ha z i,   a nd  D .   G a ng o dka r   H a doo p,  M a pR e du c e   a nd  H D F S a   d e ve l o pe r s   pe r s p e c ti ve P r oc e di C om put e r   Sc i e nc e   vo l.  48,  pp 4 5 - 50 , 2015 , d oi 10.1016/j .pr oc s .2015.04.108 .   [ 10 ]   R .   P .   P a dh y   B ig   da ta   pr o c e s s in w it H a doo p - M a pR e duc e   i c l o ud  s y s t e ms , ”  I nt e r nat io nal   J our nal   of   C lo ud  C om put in and  Se r v ic e s  Sc ie nc e v ol .2,  n o .1, 201 2,   d o i :   10.11591/ c l o s e r . v 2i 1.1 508   [1 1 ]   S P a r a nd  Y L e e S e c ur e   H a d oo w it e n c r y pt e H D F S ,”   in   I nt e r nat io nal   C onf e r e n c e   on  G r id   and  P e r v as iv e   C om put i ng 2013, pp. 134 141, do i:  10.1007/978 - 3 - 642 - 38027 - 3_14.   [1 2 ]   H M a hmo ud,  A H e ga z y a nd  M H K ha f a g y A a ppr o a c f or   bi da ta   s e c u r it y   ba s e o H a d oo di s tr ib ut e f il e   s y s t e m,   in   2018 I nt e r nat io na C onf e r e n c e  on I nnov at iv e  T r e nds  i n C om pu te r  E ngi ne e r in g ( I T C E ) F e b.  2018,  vo l.  2018 - M a r c h, pp. 109 114,  do i:  10.1109/ I T C E .2018.8316608.   [1 3 ]   M A gr a w a a nd  P M is hr a A   c o mpa r a ti ve   s ur ve y   o s y mm e t r ic   k e y   e n c r y pt i o t e c hni que s ,”   I nt e r nat io nal   jo ur nal   o c om p ut e r   s c ie nc e  and  e ngi ne e r in g , v o l.  4, n o . 5, pp. 877 882, 2012.   [1 4 ]   M R J a m,  L M K ha nl i,   M S J a v a a nd  M K A kba r i,   A   s ur ve y   o s e c ur it y   of   H a doo p,”   2014   4t I nt e r nat io nal   C onf e r e nc e   on C om put e r  and K now le dge  E ngi ne e r in g ( I C C K E ) , M a s hha d,  I r a n, 2014, pp. 716 - 721, d o i:  10.1109/I C C K E .2014.6993455 .   [1 5 ]   H .   Z ho u   a nd   Q .   W e n ,   D a t a   s e c ur i t y   a c c e s s i ng   f o r   H D F S   ba s e d   o n   a tt r ib ut e - gr o up   in   c lo u d   c o mpu ti ng ,”   P r o c e e di n g s   o t h e   I nt e r n at io nal   C o n fe r e n c e   on  L o gi s ti c s ,  E n gi ne e r i ng M a na ge m e nt  a nd   C o m p ut e r   S c i e n c e ,  2 01 4,  do i 10 .2 99 1/ le mc s - 14 .2 01 4. 25 5.   [1 6 ]   H - Y L in S - T S he n,  W - G T z e ng  a nd  B - S P L in T o w a r da ta   c o n f id e nt ia li t y   v ia   in t e gr a ti ng  h y br id   e n c r y pt i o s c he me s   a nd  H a doo di s tr ib ut e f il e   s y s te m,”   2012  I E E E   26t I nt e r nat io nal   C onf e r e n c e   on   A dv anc e I n f or m at io n   N e tw or k in and   A ppl ic at io ns , F ukuo ka , J a pa n, 2012, pp. 740 - 747, d o i:  10.1109/ A I N A .2012.28 .   [1 7 ]   C Y a n g,  W . L in a n M .  L iu A  no v e tr i pl e  e nc r y pt io s c he me  f o r  H a do o p - b a s e d c lo u d d a t a   s e c ur it y ,”  i 2 01 3 F ou r t h I nt e r n at i on al   Co n fe r e n c e   on  E m e r g in I nt e ll i g e nt   D at an d W e T e c hn ol ogi e s S e p 20 13 pp 43 7 44 2,  do i:  1 0. 11 09 /E I D W T .2 01 3. 80 .   [1 8 ]   Y T ia n,  T o w a r ds   th e   d e ve l o pm e nt   of   b e s da ta   s e c ur it y   f or   bi da ta ,”   C om m uni c at io ns   and  N e tw or k vo l.   09,   n o 04,    pp. 291 301, 2017,  do i:  10.4236/ c n.2017.94020.   [1 9 ]   M I M a he s w a r i,   S R e v a th y R T a mi la r a s i ,   S e c u r e   da ta   tr a n s mi s s io f or   mul ti   s ha r in in   bi da ta   s to r a ge ,   I ndi an  J our nal   of   Sc ie nc e  and T e c hnol ogy , v o l.   9,   n o . 21, pp. 1 - 9,   2016. d o i:   10.1 7485/i js t/ 2016/v 9i 21/ 95164 .   [2 0 ]   I S uma r t o n o   a nd   A P U S ia ha a n,  E nc r y pt i o of   D E S   a lg or i th in   in f o r ma ti o s e c u r it y , ”  I n te r nat io nal   J our nal   f or   I nnov a ti v e   R e s e ar c h i n M ul ti di s c ip li nar y  F ie ld ,   v ol ,   4 n o .   10, 2018 .   [2 1 ]   K ir a ma t C ompa r is o of   v a r i o us  e n c r y pt i o n a lg or it hms   f o r  s e c ur in g d a ta , ”  do i : 10.31224/ o s f .i o / xz v 56 .   [ 22]   A M .   A bdul la h,  A dv a nc e e n c r y pt i o s ta nda r ( A E S )   a lg o r i th to   e nc r y pt   a nd  de c r y pt   da ta ,”   2017.  [ O nl in e ] A v a il a bl e :   ht tp s :/ /ww w .e x a mpl e . c o m/ a d v a n c e d - e n c r y p ti o n - s ta nda r d. ( A c c e s s e d:  A pr . 12, 2023)   [ 23]   J D a e me a nd  V R ij m e n,   *T h e   D e s ig of   R ij nda e l:   A E S th e   a d v a nc e e n c r y pt i o n   s ta nda r d* B e r li n,   G e r ma n y S pr i nge r - V e r la g, 2002.   [ 24]   H .   K hi z o u,  B ig   da ta   f r o m B  t o  A t h e   H a d oo di s tr ib ut e f i le s y s te m - H D F S T o w ar ds  D at a Sc ie nc e , 2019 .   [2 5 ]   M B a r r e t o S.   N e s ma c hn o w A.   T c h e r n y kh,“ H y br id   a lg o r it hms   f o r   3 - S A T   o pt im is a ti o us in M a pR e duc e   o c l o u ds .   I nt e r nat io nal  J our nal  of  I nnov at iv e  C om put in g and A ppl ic at io ns ,   2017, do i:   10.1504/I J I C A .2018.10011774 .   [2 6 ]   C lo ud e r a I n c .,  " C l o ude r a   C D H   5.13.0  d o w nl o a ds , "   [ O nl in e ] .   A v a il a bl e ht tp s :/ /ww w . c l o ude r a .c o m/ d o w nl o a ds / c dh/ 5 - 13 - 0.ht ml A c c e s s e d:  D e c . 29, 2023.       B I OG RA P HI E S   OF   AU T HO RS       F a y ça l   Zi n e - D i n e           i s   Ph . D .   c an d i d at e   r e s e ar c h e r   at   t h e   Fa c u l t y   o f   S c i en c e s ,   Ch o u ai b   D o u k k a l i   U n i v e rs i t y .   H h o l d s   m as t e r’s   d e g r ee   i n   i n f o r m at i o n   s y s t em s   e n g i n ee ri n g   fro t h s ame  fa c u l t y ,   o b t ai n ed   i n   2 0 1 7 .   H r ece i v e d   h i s   b a c h el o r’s   d e g r ee  i n   s o ft w are  e n g i n ee ri n g   fro t h Fa c u l t y   o S ci e n ce s ,   Mo u l a y   I s m a i l   U n i v e rs i t y   i n   M e k n e s   i n   2 0 1 4 .   H e   i s   c u rr en t l y   p u rs u i n g   h i s   re s e arch   at   t h e   E L I T E l ab o rat o r y   o t h e   Fa c u l t y   o S c i en ce s ,   Ch o u ai b   D o u k k a l i   U n i v e rs i t y .   H i s   re s e ar c h   i n t e r e s t s   e n c o m p as s   b i g   d at a,   i n fo r m at i o n   s y s t em s   s ecu ri t y ,   art i f i ci al   i n t el l i g en ce ,   a n d   b u s i n e s s   i n t el l i g en ce .   H e   c a n   b e   co n t a c t ed   at   em ai l :   zd fa y c al @ g m a i l . c o m .         Sa ra   A l ca bn a n i           w as   b o rn   i n   1 9 9 2   i n   Safi ,   Mo ro cc o .   Sh e   o b t ai n ed   m as t e r' s   d eg r ee   i n   i n f o r m at i o n   s y s t em s   en g i n ee r i n g   fro t h e   Fa c u l t y   o S c i en ce   at   Ch o u ai b   D o u k k al i   U n i v e rs i t y   i n   2 0 1 8 .   Sh e   o b t ai n e d   b ach e l o r's   d e g r ee  i n   c o m p u t e d ev el o p me n t   fro m   t h Po l y d i s ci p l i n ar y   Fa c u l t y   o f   Safi ,   Cad i   A y y ad   U n i v e rs i t y   i n   2 0 1 5 .   Recen t l y ,   s h e   o b t ai n e d   h e r   d o c t o rat e   i n   co m p u t e s c i en ce   an d   c o n t i n u e s   h e r e s e a rc h   i n   t h e   E L I T E S   L ab o rat o r y   at   t h Fac u l t y   o S c i en ce ,   C h o u ai b   D o u k k a l i   U n i v e rs i t y .   H e r   cu rr e n t   r e s e ar ch   fo cu s e s   o n   m a ch i n e   l e ar n i n g ,   s e n t i men t   an al y s i s ,   s o ci al   n e t w o r k s ,   s o ci al   me d i m i n i n g ,   e - r e p u t at i o n ,   b u s i n e s s   i n t el l i g en ce   an d   d eci s i o n - m ak i n g   s y s t em s .   Sh e   cu rren t l y   w o rk s   as   s e n i o I T   e x ecu t i v e   at   Mo ro cc o 's   Cai s s e   N at i o n a l e   d e   cu ri t é  So ci al e   (C N SS).   Sh e   c an   b e   c o n t ac t e d   at   em ai l :   s . al c ab n a n i @ u cd . a c . m a   or   s araal c ab n a n i @ g m ai l . co m .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2 5 0 2 - 4 7 52   In do n e s i a n   J   E l e c   E n g   &   C o m S c i Vo l .   3 8 ,   N o .   2 M a y   20 2 5 :   1 256 - 1 264   1264     P ro f .   A hm ed  A z o u a o u i           recei v ed   h i s   l i ce n s e   i n   J u n e   2 0 0 1   i n   c o m p u t e s c i en c e   an d   en g i n ee r i n g   a n d   a   m as t e r’s   d eg r ee   fro U n i v e rs i t y   o M o h a mmed   V ,   Rab at ,   Mo r o cc o   i n   c o m p u t e s c i en c an d   t el ec o mmu n i c at i o n   i n   2 0 0 3 .   H e   o b t ai n e d   h i s   Ph . D .   i n   2 0 1 4   a t   t h e   D e p art men t   o f   Co m p u t e S ci e n ce   o t h N at i o n a l   S c h o o l   o C o m p u t e r   S c i en ce   an d   S y s t em s   A n al y s i s ,   Rab at ,   M o ro cco ,   i n   c o m p u t e s c i en ce   a n d   e n g i n ee r i n g .   Cu rr en t l y ,   h e   i s   p ro f e s s o at   H i g h e r   S c h o o l   o f   T ech n o l o g y ,   I b n   T o fa i l   U n i v e rs i t y ,   Mo ro cc o .   H i s   d o m ai n s   o f   i n t e r e s t   are  art i fi ci al   i n t el l i g en ce ,   co d i n g   t h e o r y ,   a n d   i n fo r m at i o n   s y s t em s .   H e   c a n   b c o n t ac t e d   at   em a i l :   a. azo u a o u i @ u i t . a c . m a .         P ro f .   J a m a l   El   Ka fi           i s   s e as o n ed   a c a d em i c   w i t h   Ph . D .   i n   r o b o t i c s   an d   ce rt i fi c at i o n s   i n   q u a l i t y   a u d i t i n g   an d   co a c h i n g .   A s   a   fu l l   p ro f e s s o at   Ch o u ai b   D o u k k a l i   U n i v e rs i t y ,   h e   h as   e s t ab l i s h ed   h i m s e l f   as   l e a d i n g   e x p e rt   i n   art i fi ci al   i n t el l i g e n ce ,   I CT ,   a n d   e d u c at i o n al   t ec h n o l o g i e s .   He   h e ad s   t h e   D I r e s e ar c h   t e a m ,   f o cu s i n g   o n   d ec i s i o n   s u p p o rt   s y s t em s ,   a n d   i s   a n   as s o ci at mem b e r   o f   t h e   E L I T E S   L ab o rat o r y .   H e   i s   t h fo u n d e a n d   p re s i d e n t   o T E N O RS,   an   as s o ci at i o n   d ed i c at e d   t o   p ro mo t i n g   n ew   t ec h n o l o g i e s   an d   s c i en t i fi re s e ar ch .   W i t h   e x t en s i v e x p e ri en ce  i n   A I ,   I S,   q u a l i t y   man ag eme n t   an d   i n t e rn at i o n a l   ed u c at i o n   s y s t em s ,   he   h as   au t h o r e d   n u me ro u s   s c i en t i fi c   art i cl e s ,   ev al u at e d   r e s e ar c h   p ap e rs ,   an d   s u p e rv i s e d   m u l t i p l e   Ph . D .   t h e s e s .   H e   c an   b e   co n t a c t ed   at   em a i l :   j el k af i @ g m ai l . co m .     Evaluation Warning : The document was created with Spire.PDF for Python.