I AE S In t er na t io na l J o urna l o f   Art if icia l In t ellig ence   ( I J - AI )   Vo l.  1 5 ,   No .   1 ,   Feb r u ar y   2 0 2 6 ,   p p .   454 ~ 468   I SS N:  2 2 5 2 - 8 9 3 8 ,   DOI : 1 0 . 1 1 5 9 1 /ijai.v 15 .i 1 . p p 4 5 4 - 4 6 8          454     J o ur na l ho m ep a g e h ttp : //ij a i . ia esco r e. co m   Dev elo pment of  genera lized  princi pa l com po nent  a n a ly sis  using   multiple  imputa ti o n genetic alg o rit hm       F a hrez a l Zu bedi 1, 2 I   M a de  Su m er t a j a y a 1 K ha iril A nwa No t o dip utr o 1 ,   Ut a m i   Dy a Sy a f it ri 1   1 S t a t i st i c s   a n d   D a t a   S c i e n c e   S t u d y   P r o g r a m S c h o o l   o f   D a t a   S c i e n c e ,   M a t h e mat i c a n d   I n f o r m a t i c s I P B   U n i v e r s i t y ,   B o g o r ,   I n d o n e s i a   2 S t a t i st i c s   S t u d y   P r o g r a m F a c u l t y   o f   M a t h e ma t i c s a n d   N a t u r a l   S c i e n c e S t a t e   U n i v e r s i t y   o f   G o r o n t a l o G o r o n t a l o ,   I n d o n e si a       Art icle  I nfo     AB S T RAC T   A r ticle  his to r y:   R ec eiv ed   Ma r   2 7 ,   2 0 2 5   R ev is ed   Oct  1 7 ,   2 0 2 5   Acc ep ted   No v   8 ,   2 0 2 5       In   th is  st u d y ,   we   p ro p o se   a n   i n n o v a ti v e   m e th o d   c a ll e d   th e   i n teg ra t e d   G P CA - M IG A wh ich   in te g ra tes   th e   m u lt ip le  imp u tatio n   g e n e ti c   a lg o rit h m   (M IG A)   a n d   g e n e ra li z e d   p ri n c ip a l   c o m p o n e n a n a l y sis  (G P CA)   to   p e rfo r m   m issin g   v a lu e   imp u tati o n   a n d   d a ta  d im e n sio n a li t y   re d u c ti o n   sim u lt a n e o u sly .   Th e   a p p ro x ima ted   o rig in a l   d a ta   p r o d u c e d   b y   G P CA  se rv e a s th e   b a sis fo M IG A   to   u p d a te  m issin g   v a lu e in   th e   n e x i tera ti o n .   At   th e   sa m e   ti m e ,   G P CA   re fin e th e   lo w - d ime n sio n a re p re se n tatio n   u sin g   t h e   late st  imp u tati o n   re su l ts  fro m   M IG A,  th e re b y   b a lan c i n g   th e   a c c u ra c y   o f   m issin g   v a lu e   i m p u tatio n   a n d   th e   sta b il it y   o d ime n sio n a li t y   re d u c ti o n .   T h e   o b jec ti v e   o th is  stu d y   is t o   e v a lu a te  th e   p e rf o rm a n c e   o t h e   i n teg ra ted   G P CA - M IG a n d   a n a ly z e   tren d s   in   h u m a n   d e v e lo p m e n a t h e   d ist rict/city   lev e in   I n d o n e sia .   T h e   fi n d i n g o f   th is  stu d y   sh o th a th e   i n teg ra ted   G P CA - M I G e ff e c ti v e ly   re d u c e th e   d ime n sio n a l it y   o d a ta  c o n tai n in g   m issin g   v a lu e c o m p a re d   to   o t h e m e th o d s.  T h e   in teg ra ted   G P CA - M IG m e th o d   wa a p p li e d   to   h u m a n   d e v e lo p m e n d a ta.  Th e   re su lt we re   th e n   v isu a li z e d   u si n g   a   b i p lo t ,   wh ich   re v e a led   th a h u m a n   d e v e l o p m e n tren d i n   Ja y a wijay a   fro m   2 0 1 9   to   2 0 2 2   in d ica te p r o g re ss   i n   sc h o o e n ro ll m e n ra tes   fo a g e s 1 6 1 8   y e a rs.   K ey w o r d s :   B ip lo t   C o r r elatio n   Dim en s io n ality   r ed u ctio n   Miss in g   v alu es   T r en d s   in   h u m an   d ev elo p m en t   T h is i a n   o p e n   a c c e ss   a rticle   u n d e r th e   CC B Y - SA   li c e n se .     C o r r e s p o nd ing   A uth o r :   I   Ma d Su m er tajay a   Statis t ics an d   Data   Scien ce   St u d y   Pro g r am ,   Sch o o l o f   Data   Scien ce ,   Ma th em atics a n d   I n f o r m atics   I PB   Un iv er s ity   Me r an ti R d ,   Dr am ag Dis tr ict,   B o g o r ,   1 6 6 8 0   W est J av a,   I n d o n esia   E m ail: im s jay a@ ap p s . ip b . ac . id       1.   I NT RO D UCT I O N   On o f   th m o s u s ed   m eth o d s   f o r   d im en s io n ality   r ed u ctio n   is   p r in cip al   co m p o n e n an aly s is   ( PC A) .   T h is   m eth o d   s u m m a r izes  m an y   v ar ia b les  in to   f ew  p r in cip al  co m p o n en ts   with o u s ig n if ican lo s s   o f   in f o r m atio n .   Ho wev er ,   PC h as  lim itatio n s   wh en   d ea lin g   with   d ata  th at  ex h ib its   co r r elatio n s   ac r o s s   o b s er v atio n s   ( r o ws)   [ 1 ] ,   [ 2 ] .   T o   ad d r ess   th is   lim itatio n ,   g en er alize d   p r in cip al  c o m p o n en an aly s is   ( GP C A) ,   also   k n o wn   as  g e n er alize d   lo r an k   ap p r o x im atio n   o f   m atr ices   ( GL R AM ) ,   was  d ev elo p ed .   GPC is   ca p ab le  o f   s im u ltan eo u s ly   r ed u cin g   t h d im en s io n s   o f   b o th   co r r e lated   v ar iab les  a n d   c o r r elate d   o b s er v atio n s .   I n   ad d itio n ,   GPC ca n   r ed u ce   t h d ata   d im en s io n   o f   c o llectio n   o f   m atr ices  s im u ltan eo u s ly   [ 3 ] .   T h is   m eth o d   was  f ir s in tr o d u ce d   in   [ 4 ]   to   en h an ce   th e   ef f icien cy   o f   im a g co m p r ess io n   an d   h as  b ee n   s h o wn   to   p r o d u ce   h ig h er   v is u al  q u ality   an d   m o r e   ef f icien t c o m p u tatio n   tim c o m p ar ed   to   PC A.   R esear ch   o n   GPC h as  b ee n   ap p lied   ac r o s s   v ar io u s   f ie ld s ,   ac co m p an ied   b y   d ev elo p m en ts   in   m eth o d o l o g ical  asp ec ts .   Fo r   ex am p le,   GPC h as  b ee n   u s ed   to   i d en tify   g en es  with   o v er lap p in g   p atter n s ,   en ab lin g   th r ec o g n itio n   o f   g en in ter ac tio n s   an d   f u n ctio n s .   I n   th is   co n tex t,  GPC h as  p r o v e n   ef f ec tiv in   co m p r ess in g   im a g es  o f   g en e   ex p r ess io n   p atter n s   [ 5 ] .   T h is   ad v an tag e   was  f u r t h er   e x am i n ed   in   co m p ar ativ s tu d ies,  wh ich   d em o n s tr ated   t h at  GPC o u tp er f o r m s   o th e r   d im en s io n ality   r e d u ctio n   m et h o d s   s u ch   as  PC Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J Ar tif   I n tell     I SS N:   2252 - 8 9 3 8       Dev elo p men t o f g e n era liz ed   p r in cip a l c o mp o n e n t a n a lysi s   u s in g   mu ltip le  imp u ta tio n   …  ( F a h r eza l Zu b ed i)   455   an d   m u ltil in ea r   PC A,   p ar ticu lar ly   in   p atter n   r ec o g n iti o n   task s   lik im ag class if icatio n   an d   o b ject  id en tific atio n   [ 6 ] .   I n   o th er   wo r d s ,   GPC is   n o o n ly   ef f ec tiv in   p r ac tice  b u also   s u p p o r ted   b y   a   s tr o n g   an d   m ath em atica lly   p r o v en   t h eo r etica f o u n d atio n .   T o   ad d r ess   n ew  ch allen g es  in   th e   ap p licatio n   o f   GPC A,   s ev er al  f u r t h er   d ev elo p m en ts   h av b ee n   ca r r ied   o u t.   On o f   th em   is   th e   co m b in atio n   o f   G PC with   m eth o d s   s u ch   as  to p - p u s h   co n s tr ain e d   f ea tu r e   lear n in g   ( T FL)   to   i m p r o v e   th e   ac cu r ac y   o f   f ac e   im ag r ec o g n itio n   th r o u g h   d im en s io n ality   r ed u ct io n   [ 7 ] .   An o t h er   d ev elo p m en t   is   r an d o m ized   GPC A,   wh ich   aim s   to   r ed u ce   th e   co m p u tatio n al   co m p lex ity   o f   GPC A   [ 8 ] Ho wev er ,   m o s d e v elo p m en ts   o f   GPC h av e   co n tin u ed   to   f o cu s   o n   im p r o v in g   ac cu r ac y   an d   co m p u tatio n al  ef f icien c y ,   with o u t   ex p licitly   ad d r ess in g   o r   in teg r atin g   th h a n d lin g   o f   m is s in g   v alu p r o b le m s   co m m o n ly   f o u n d   in   e m p ir ical  d a ta.   T h m ain   p r o b lem   in   th is   s tu d y   is   h o t o   ef f ec tiv el y   ap p ly   GPC to   d ata  co n tain in g   m is s in g   v alu es.   T h p r esen ce   o f   m is s in g   v al u es  ca n   r ed u ce   an aly s is   q u ality ,   b o t h   in   ter m s   o f   ac cu r ac y   an d   in ter p r etab ilit y     [ 9 ] ,   [ 1 0 ] C o n v en tio n al  im p u tatio n   m eth o d s ,   s u ch   as  m ea n   o r   m ed ian   im p u tatio n ,   ar o f ten   u s ed   f o r   p r ac ticality   b u h a v f u n d am en tal  lim itatio n s .   Su ch   m eth o d s   ten d   to   u n d er esti m ate  v a r ian ce   an d   alter   th e   co r r elatio n   s tr u ct u r am o n g   v a r iab les   [ 1 1 ] .   As  r esu lt,   s u b s eq u en a n aly s es,  s u ch   as  d im e n s io n ality   r ed u ctio n   with   GPC A,   m ay   y ield   r ep r e s en tatio n s   th at  d o   n o ad e q u a tely   r ef lect  th s tr u ctu r o f   th o r ig in al  d ata.   T o   ad d r ess   th is   is s u e,   v ar io u s   im p u tatio n   m eth o d s   h av b ee n   d ev elo p ed ,   o n o f   wh ich   is   th m u ltip le  im p u tatio n   g en etic  alg o r ith m   ( MI GA) .   I n tr o d u ce d   in   [ 1 2 ] ,   MI GA  co m b in es  m u ltip le  im p u tatio n   p r i n cip les  with   g en etic   alg o r ith m s   ( GA)   to   o p tim ally   esti m ate  th m is s in g   v alu es.   T h is   m eth o d   is   d esig n ed   to   p r es er v th s tatis tica l   s tr u ctu r o f   d ata,   s u ch   as m ea n ,   s k ewn ess ,   an d   co v ar ian c m atr ices,  wh ich   ar o f ten   d is t o r ted   b y   c o n v e n tio n al   im p u tatio n   m et h o d s .   M I GA  h as  b ee n   s h o wn   t o   o u tp er f o r m   o th er   alg o r ith m s   s u ch   as  ex p ec tatio n   m ax im izatio n   ( E M) ,   a u x iliar y   r eg r ess io n s ,   an d   k - n ea r est  n eig h b o r s   im p u tatio n   (K - NN I ) Ho wev e r ,   wh e n   GPC A   is   ap p lied   af ter   MI GA  ( n o n - i n teg r ated ) ,   th d im en s io n ality   r ed u ctio n   p r o ce s s   f o llo ws th im p u ted   d ata  th at  r em ain   f ix ed ,   r at h er   t h an   d ata  th at  a d ap d y n a m ically   to   th r ed u ctio n   m o d el.   T h is   co n d itio n   m ay   lea d   to   lar g er   n u m b er   o f   r etain e d   d im en s io n s   an d   a   d ec r ea s i n   th to tal  ex p lain ed   v ar ia n ce .   T h er ef o r e,   th is   s tu d y   p r o p o s es  n ew  m eth o d   ca lle d   th in teg r ated   GPC A - MI GA,   wh ich   is   d esig n ed   to   p er f o r m   d im en s io n ality   r ed u ctio n   o n   d ata  c o n tain in g   m is s in g   v alu es  ef f icien tly .   I n   t h is   m eth o d ,   th c o v ar ia n ce   s tr u ctu r g en er ated   b y   GPC i s   d ir ec tly   u tili ze d   to   u p d ate  th M I GA  im p u tati o n   p r o ce s s   in   th s u b s eq u en iter atio n ,   th er eb y   ac h iev in g   b alan ce   b etwe en   im p u tatio n   ac c u r ac y   a n d   r e d u c tio n   s tab ilit y .   T h em p i r ical  is s u ad d r ess ed   in   th is   s tu d y   is   h o t o   an a ly ze   an d   v is u alize   th e   tr en d s   o f   h u m an   d ev elo p m e n at  th d is tr ict/city   lev el  in   I n d o n esia  d u r in g   t h 2 0 1 9   to   2 0 2 2   p er io d .   D u r i n g   th is   p er io d ,   th g r o wth   r ate  o f   I n d o n esia’ s   h u m an   d e v elo p m e n in d ex   ( HDI )   ten d e d   to   s lo d o w n .   Ad d itio n ally ,   d is p ar ities   in   h u m an   d e v elo p m e n ac h iev e m en ts   am o n g   d is tr ict/city   in   I n d o n esia  p er s is t   [ 1 3 ] [ 1 6 ] .   T h is   s i tu atio n   in d icate s   th n ee d   f o r   m o r in - d e p th   an d   co m p r e h en s iv an aly s is   o f   th d y n am ics  o f   h u m an   d ev elo p m e n at  th d is tr ict/city   lev el.   Ho wev er ,   h u m an   d e v elo p m e n in d icato r   d ata  is   ch ar ac ter ized   b y   h i g h   d im en s io n ality ,   with   co r r elatio n s   b o th   am o n g   in d i ca to r s   an d   am o n g   d is tr ict/city ,   an d   co n tain   m is s in g   v alu es,   wh ich   c o m p licate  d ir ec an aly s is   an d   v is u aliza tio n .   T o   ad d r ess   is s u es  in   em p i r ical  d ata,   th in teg r ated   GPC A - MI GA  is   ap p lied   to   s im u ltan eo u s ly   r ed u ce   th d im en s io n s   o f   d is tr ict/city   an d   v ar iab les,  ev en   wh en   th d a ta  co n tain s   m is s in g   v alu es.  T h e   r ed u ce d   d ata  a r e   th en   v is u alize d   u s in g   th e   b i p lo t   ap p r o ac h ,   wh ic h   en a b les  y ea r ly   m ap p in g   o f   d is tr ict/city   p o s itio n s   an d   th ei r   ass o ciate d   in d icato r s   th r o u g h   v ar iety   o f   in f o r m ativ v is u al  d is p lay s .   B ased   o n   th e   d escr ip tio n   ab o v e,   th is   s tu d y   h as  two   m ain   o b jectiv es:  i )   to   e v alu ate  th e   p er f o r m a n c o f   t h in teg r ated   GPC A - MI GA  an d   ii )   to   an al y ze   tr en d s   in   h u m an   d ev el o p m en at  th d is tr ict/city   lev el  in   I n d o n esia  f r o m   2019   t o   2 0 2 2 .       2.   M E T H O D   2 . 1 .     Da t a   T h is   s tu d y   u tili ze d   b o th   s im u lated   an d   em p ir ical  d ata.   T h e   s im u lated   d ata  c o n s is ts   o f   f o u r   m atr ices   ( 500 × 100 , = 1 , 2 , 3 , 4 ) ,   ea ch   o r g an ized   in to   2 5   o b s er v atio n   clu s ter s   an d   5   v ar iab le   clu s ter s .   Ob s er v atio n s   an d   v ar iab les   with in   th s am clu s ter   a r co r r elate d ,   wh ile  th o s ac r o s s   clu s ter s   ar u n co r r elate d .   T h f o u r   s im u l ated   m atr ices  ar e   co n s tr u cte d   to   b m u tu ally   c o r r elate d .   T h p r o ce s s   o f   d ata  g en er atio n   is   d escr ib e d   as f o ll o ws :   i)   Gen er ate  s y m m etr ic  an d   p o s itiv d ef in ite  co v ar ian ce   m at r ix   20 × 20   wh er all  d iag o n al  elem e n ts   ar 1   an d   all  o f f - d iag o n al  ele m en ts   ar 0 . 8 .   ii)   Ap p ly   c h o lesk y   d ec o m p o s itio n   to   m atr ix     to   d er iv m at r ix     an d   its   tr an s p o s m atr ix     [ 1 7 ] .   iii)   Gen er ate  m atr ix   500 × 20   u s in g   p ar titi o n   ap p r o ac h .   E v e r y   d iv is io n   m atr ix   is   p r o d u ce d   f r o m   m u ltiv ar iate  n o r m al  ( MV N )   d is tr ib u tio n ,   d is tin ct  m ea n   v ec to r   f o r   ea ch   co lu m n ,   a n d   th co v ar ian c e   m atr ix   ( d iag o n al) .   iv )   T r an s f o r m   ev e r y   d iv is io n   m atr ix   f r o m   m atr ix     500 × 20   to   m atr i x   500 × 20   em p lo y in g   th e   o u tco m o f   C h o lesk y   d ec o m p o s itio n   v ia:     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 9 3 8   I n t J Ar tif   I n tell Vo l.  1 5 ,   No .   1 ,   Feb r u ar y   2 0 2 6 454 - 4 6 8   456   Su b m atr ix   1       = 20 × 20   ×   20 × 20 × 20 × 20       Su b m atr ix   2 5   = 20 × 20   ×   20 × 20 × 20 × 20   v)   R ep ea s tep s   3 - 4   f o u r   tim es,  th en   co n ca te n atin g   th r esu lts   h o r izo n tally ,   f o r m in g   f i v clu s ter s   o f   v ar iab les.  Var iab les  with in   th e   s am clu s ter   ar c o r r elate d ,   b u th o s b etwe en   clu s ter s   ar n o co r r elate d .   T h m atr ix   1 500 × 100   will b f o r m e d .   v i)   R ep ea s tep s   3 - 5   th r ee   tim es  to   g en er ate  1 2 ,   an d   3 .   Un d er   th co n d itio n   o f   co r r elate d   m atr ices     1 , 2 3   an d   4 ,   as  d etailed   b el o w,   ea ch   s u b s eq u en m atr ix   + 1   is   o b tain ed   b y   ad d in g     to   th e   p r ec ed in g   m atr ix   ,   f o r   =1 ,   2 ,   3 .   T h s im u lated   d ata  wer r an d o m ly   r em o v ed   u n d er   th m is s in g   co m p letely   at  r an d o m   ( MCA R )   m ec h an is m   with   m is s in g   v alu p er ce n tag es  o f   5 ,   1 0 ,   1 5 ,   an d   2 0 in   ea ch   s im u lated   d ata,   wh ile  en s u r in g   th at   n o   r o o r   co lu m n   h ad   all  its   en tr ies m is s in g .   T h is   s im u latio n   an aly s is   aim s   to   ev alu ate  th e   p er f o r m a n ce   o f   th in teg r ated   GPC A - MI GA  in   r ed u cin g   th d im en s io n ality   o f   d ata  co n tain in g   m is s in g   v alu e s .   T h p er f o r m an ce   o f   th is   m eth o d   was  co m p ar e d   with   th at  o f   MI GA+ GPC ( n o n - in teg r ate d ) ,   m ea n   im p u tatio n +G PC A,   an d   m ed ian   im p u tatio n +G PC A.   Fu r th er m o r e,   th e   r esu lts   o f   th e s f o u r   a p p r o ac h es  wer co m p ar ed   with   GPC ap p lied   to   co m p lete  d ata,   wh ich   s er v es  as  th e   b aselin r ep r esen tin g   th e   id ea c o n d itio n   with o u an y   in f o r m atio n   lo s s .   T h o v er a ll  wo r k f lo o f   th s im u lati o n   an aly tical  p r o ce d u r is   s y s tem atica lly   an d   s tr u ctu r ally   d esig n ed ,   as illu s tr ated   in   Fig u r 1 .           Fig u r 1 .   Flo wch ar o f   th e   s im u latio n   d ata   an al y s is       T h is   s tu d y   em p lo y ed   em p ir ic al  d ata  co n s is tin g   o f   in d icato r s   r elate d   to   th d im en s io n s   o f   h u m an   d ev elo p m e n at  th d is tr ict/cit y   lev el  in   I n d o n esia  f o r   t h p e r io d   2 0 1 9   to   2 0 2 2 .   T h ese  d ata   wer s o u r ce d   f r o m   Statis t ics  I n d o n esia  ( B PS )   p u b licatio n s ,   wh ich   ar av ailab le  o n   th o f f icial  web s ites   o f   ea ch   d is tr ict/city .   T h e   d ata  co n s is ts   o f   2 0   in d icat o r s   co v e r in g   t o tal  o f   5 1 4   d is tr ict /city   in   I n d o n esia .   T h ese  in d icato r s   co m p r eh e n s iv ely   r ep r esen th th r ee   d im en s io n s   o f   h u m a n   d ev elo p m e n t,  n am ely   l o n g   li f an d   h ea lth y   life ,   k n o wled g e ,   a n d   a   d ec en s tan d ar d   o f   liv in g .   T h l o n g   l if an d   h ea lth   l if d im en s io n   in clu d es  in d icato r s   s u ch   as  th p e r ce n tag e   o f   h o u s eh o l d s   with   clea n   d r i n k in g   wate r   s o u r ce s   (X 1 ) ,   th e   p er ce n tag o f   h o u s eh o l d s   with   ac ce s s   to   ad eq u ate  d r in k in g   wate r   (X 2 ),   th e   p er ce n tag o f   h o u s eh o ld s   th at  d o   n o h av e   d ef ec atio n   f ac ilit ies  (X 3 ) ,   an d   m o r b id ity   (X 4 ) .   T h e   k n o wled g d im e n s io n   in clu d es  in d icato r s   s u ch   as  s ch o o en r o llm en r ates  f o r   th ag g r o u p s   7 - 1 2   y ea r s   (X 5 ),   13 - 1 5   y ea r s   (X 6 ),   16 - 1 8   y ea r s   (X 7 ),   g r o s s   p ar ticip atio n   r at es  at  th elem en tar y   (X 8 ),   ju n io r   h ig h   (X 9 ) ,   an d   s en io r   h ig h   s ch o o lev els  ( X 10 )   an d   n et  p a r ticip atio n   r ates  at  elem en tar y   (X 11 ),   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J Ar tif   I n tell     I SS N:   2252 - 8 9 3 8       Dev elo p men t o f g e n era liz ed   p r in cip a l c o mp o n e n t a n a lysi s   u s in g   mu ltip le  imp u ta tio n   …  ( F a h r eza l Zu b ed i)   457   ju n io r   h ig h   (X 12 ),   an d   s en io r   h ig h   s ch o o lev els  (X 13 ) .   T h d ec en t   s tan d ar d   o f   l iv in g   d im en s io n   in clu d es  in d icato r s   s u ch   as  th p er ce n tag o f   f o r m al  wo r k er s   (X 14 ),   th p er ce n tag e   o f   p o o r   p eo p le  (X 15 ),   t h o p e n   u n em p lo y m en r ate  (X 16 ) ,   th e   av er ag wa g es  o f   wo r k er s   an d   em p lo y ee s   p er   m o n th   (X 17 ),   th g r o s s   r eg io n al   d o m esti p r o d u ct  p er   ca p ita  b ased   o n   cu r r en p r ices  (X 18 ),   th p er ce n tag o f   in f o r m al  wo r k er s   (X 19 ),   an d   th e   Gin i r atio   (X 20 )   [ 1 3 ] [ 1 6 ] T h f lo wch ar t o f   th em p ir ical  d ata  an aly s is   is   p r esen ted   in   Fig u r 2 .           Fig u r 2 .   Flo wch ar o f   th e   em p ir ical  d ata  an aly s is       2 . 2 .     G ener a lized  princip a l c o m po nent  a na ly s is   GPC is   d im en s io n ality   r ed u ctio n   m et h o d   th at  s im u ltan eo u s ly   m in im izes  th n u m b er   o f   d im en s io n s   o f   b o th   o b s er v ati o n s   an d   v ar iab les.  T o   ac h iev th is ,   GPC is   ap p lied   to   s et  o f   d ata  m atr ices   { } = 1       ,   with   th aim   o f   o b tain in g   lo w - d im en s io n al  r ep r esen ta tio n   { } = 1     ,   wh ich   is   ex p r ess ed   as   ( 1 )   [ 1 8 ] .     =   ( 1 )     W h er         r ep r esen ts   th f in al   r ed u ce d   f o r m   f o r   th e   o b s e r v atio n s   d im en s io n ,   wh ile          r ep r esen ts   th f in al  r ed u ce d   f o r m   f o r   th v ar iab le  d im en s io n .   C o n v er s ely ,   to   ap p r o x i m ate  s et  o f   d ata   m atr ices ,   th ( 2 )   is   u s ed .     ̂       ( 2 )     T h e   o p t i m a l     a n d     m a t r i c e s   a r e   o b t a i n e d   t h r o u g h   a n   i t e r a t i v e   p r o c e d u r e   u n t i l   a   c o n v e r g e n c e   c r i t e r i o n   b a s e d   o n   r o o t   m e a n   s q u a r e   e r r o r   ( R M S E )   i s   m e t .   O n c e   c o n v e r g e n c e   i s   r e a c h e d ,   t h e   l o w - d i m e n s i o n a l   r e p r e s e n t a t i o n   a n d   t h e   a p p r o x i m a t e d   o r i g i n a l   d a t a   m a t r i c e s   a r e   c o m p u t e d   u s i n g   t h e   f i n a l     a n d     m a t r i c e s   [ 1 9 ] T h e   d e t a i l e d   s t e p s   o f   t h e   G P C A   a r e   p r e s e n t e d   i n   A l g o r i t h m   1 ,   s p e c i f i c a l l y   i n   s t e p s   1 1   t o   2 3   o f   t h e   i n t e g r a t e d   G P C A M I G A   a l g o r i t h m   [ 2 0 ] .   GPC also   f ac ilit ates  an aly s is   o f   th e   p o s itio n s   o f   o b s er v atio n s   an d   v a r iab les  u s in g   th b ip lo t   co n ce p t,  a   two - d im e n s io n al  v is u aliza tio n   th at  s im p lifie s   th in ter p r etatio n   o f   m u ltiv ar iate  r elatio n s h ip s .   R eg io n s   ( d is tr ict/city )   alig n e d   with   in d icato r   v ec to r s   a r in t er p r eted   as  h av i n g   ab o v e - av er ag v alu es,   th o s e   in   th o p p o s ite  d ir ec tio n   as  b elo w - av er ag e,   an d   th o s n ea r   th ce n ter   as  clo s t o   th e   av er a g e   [ 2 1 ] [ 2 3 ] .   Af te r   p er f o r m in g   th GPC A,   th p r in cip al  co m p o n e n s co r es  f o r   o b s er v atio n s   an d   v ar iab les   ar ca lcu lated   as  f o llo ws:   ̂ =     .   T h p o s itio n s   o f   o b s er v atio n s   an d   v ar ia b les  ar p lo tted   u s in g   p r in cip al  co m p o n e n s co r es   as  s h o wn   in   ( 3 )   an d   ( 4 ) .     =     ( 3 )     = ( ) = ( )   ( 4 )     W h er = 0 . 5 ,     co n tain s   o b s er v atio n   co o r d in ates ,   a n d     co n tain s   v ar i ab le  co o r d in ates  [ 1 ] .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 9 3 8   I n t J Ar tif   I n tell Vo l.  1 5 ,   No .   1 ,   Feb r u ar y   2 0 2 6 454 - 4 6 8   458   2 . 3 .    M ultiple  im pu t a t io n g e net ic  a lg o rit hm   T h MI GA   was  d ev elo p ed   t o   ad d r ess   th p r o b lem   o f   m is s in g   v alu es  in   m u ltiv ar ia te  d ata  b y   in teg r atin g   im p u tatio n   tech n iq u es  with   GA  as  an   o p tim izati o n   m eth o d   [ 2 4 ] ,   [ 2 5 ] .   T h b asic  id ea   is   to   im p u te   m is s in g   v alu es  b y   g en er atin g   ca n d id ate  im p u tatio n s   th at  n o o n ly   a p p r o x im ate   th o r i g in al  d ata  b u also   p r eser v th e   ess en tial  s tatis t ic al  p r o p e r ties   o f   m u ltiv ar iate  d ata,   s u ch   as  m ea n s ,   co v ar ian ce s ,   an d   s k ewn ess .   T h co r in s ig h o f   MI GA  is   th at  GA ,   with   th eir   ev o lu tio n ar y   n atu r e,   ca n   b em p l o y e d   to   ex p lo r wid e   s o lu tio n   s p ac f o r   im p u tatio n s ,   en s u r in g   th at  m is s in g   d ata  im p u tatio n   is   n o m er ely   th ac o f   f illi n g   em p t y   en tr ies  b u p r o ce s s   o f   m ain tain in g   th d is tr ib u tio n al  ch ar ac ter is tics   an d   in ter - v a r iab le  r elatio n s h ip s   n ec ess ar y   f o r   v alid   an d   r eliab l s tatis tical  an aly s is .   T h m ai n   co n tr ib u tio n   o f   MI GA  lies   i n   th e   f o r m u latio n   o f   m u ltio b jectiv f itn ess   f u n cti o n   b ased   o n   th Min k o wsk d is tan ce ,   wh ich   s im u ltan eo u s ly   p r eser v es  m ea n s ,   co v ar ian ce s ,   an d   s k ewn ess .   T h f itn ess   f u n ctio n     is   d ef in ed   as   ( 5 ) .     = ( ( ( ̃ , ̃ ) +   ( ̃ , ) +   ( , ) )   ( 5 )     W h er e   ( ̃ , ̃ )   r ep r esen ts   th d is tan c b etwe en   th r elativ m ea n s   o f   th co m p lete  d ata  an d   th im p u ted   d ata,   wh ile  ( ̃ , )   r ep r esen ts   th d is tan ce   b etwe en   th e   r elativ co v ar ian ce   m atr ix   ( ̃ )   an d   th i d en t ity   m atr ix   ( ) ,   th u s   en s u r in g   th at  th co v ar ian ce   an d   co r r elatio n   s tr u ctu r es  ar p r eser v e d .   Similar ly ,   ( , )   r ep r esen ts   th d is tan ce   b etwe e n   th s k ewn ess   v ec to r s   o f   t h co m p lete  d ata  an d   th im p u ted   d ata   [ 1 2 ] ,   [ 2 6 ] .     2 . 4 .   T he  inte g ra t ed  G P CA - M I G a lg o rit hm   T h i n teg r ated   GPC A - MI GA   alg o r ith m   im p u tes  m is s in g   v alu es  an d   r e d u ce s   d ata  d im en s io n ality   with in   u n if ied   iter ativ f r a m ewo r k .   I n   ea ch   iter atio n ,   M I GA  im p u tes  m is s in g   v alu es  t h r o u g h   e v o lu tio n ar y   o p er atio n s   in clu d i n g   s elec tio n ,   cr o s s o v er ,   an d   m u tatio n ,   f o llo wed   b y   GPC A,   wh ich   p er f o r m s   d ata   d im en s io n ality   r e d u ctio n .   T h e   ap p r o x im ate  o r ig in al  d ata  o b tain ed   f r o m   GPC co n tain s   elem en ts   in   th e   p o s itio n s   o f   p r ev i o u s ly   m is s in g   v al u es.  T h ese  elem e n ts   s er v as  th e   b asis   f o r   MI GA  to   u p d ate   th i m p u ted   m is s in g   v alu es  in   th n ex ite r atio n .   GPC th en   r ef in es  th e   lo w - d im en s io n al  r ep r esen tati o n   u s in g   th latest   im p u tatio n   r esu lts   f r o m   M I GA.   T h iter ativ e   p r o ce s s   ter m in ates  wh en   th e   r elativ ch an g o f   all  im p u te d   m is s in g   en tr ies  b etwe en   two   co n s ec u tiv iter atio n s   is   les s   th an   o r   eq u al  to   0 . 0 0 1 T h d etailed   s tep s   o f   th in teg r ated   GPC A - MI GA  alg o r ith m   ar p r esen ted   in   Alg o r ith m   1 .     Alg o r ith m   1 .   T he   in te g r ated   G PC A - MI GA   I n p u t   1 ,   2 ,   3 ,   4 , 1 =   2 = 5 , 3 = 10 , = 100   Ou tp u t   1 , 2 , 3 , 4 , ̂ 1 , ̂ 2 , ̂ 3 , ̂ 4 , , ,   R MSE ,   f itn ess   v alu es   1.   C r ea te  m atr ices  1 , 2 , 3   an d   4   wh ich   co n s is o f   co m p lete  o b s er v a tio n s   ( r o ws)  f r o m   m atr ices  1 , 2 , 3 , 4 .     2.   C o m p u t e   t h e   c o l u m n - w i s e   m e a n ,   s k e w n e s s ,   a n d   t h e   c o v a r i a n c e   m a t r i x   f o r   e a c h   o f     1 , 2 , 3 ,   a n d   4 .   3.   C r ea te  m atr ices   1 , 2 , 3   an d   4   co n s is ti n g   o f   o b s er v atio n s   ( r o ws)  f r o m   1 , 2 , 3 , 4   with   at  least   o n m is s in g   elem en t.   4.   C r ea te  v ec to r   in d ices    o f   1 , 2 , 3   an d   4   with in   m atr ices  1 , 2 , 3 , 4 .   5.   G e n e r a t e   a n   i n i t i a l   p o p u l a t i o n   c o n t a i n i n g     i n d i v i d u a l s   b a s e d   o n   t h e   d i s t r i b u t i o n   o f   v a r i a b l e s   f o r   e a c h   m a t r i x .   6.   C o m p u te  f itn ess   v alu es f o r   all  in d iv id u als in   th p o p u latio n .   7.   Select    in d iv id u als f r o m   t h p o p u latio n   with   th s m allest f itn ess   v alu es.   8.   Per f o r m   m u tatio n   o n   th s elec ted   1   in d iv id u als an d   th e n   r ep ea t it  3   tim es p er   in d iv id u al .   9.   Per f o r m   cr o s s o v er   o n   th e   s elec ted   1   in d iv i d u als  an d   th en   r ep ea it  f o r   th e   2 1   r em ain in g   in d iv id u als.   10.   R ec alcu late  th f itn ess   v alu es  o f   in d i v id u als  af ter   cr o s s o v er   an d   m u tatio n .   T h e   in d iv i d u al   with   th s m allest f itn es s   v alu is   u s ed   as th im p u tatio n   f o r   m is s in g   v alu es.   11.   Stan d ar d ize  d ata  m atr ices   1 , 2 , 3 , 4   to   f o r m   1 , 2 , , .   12.   I n itialize  m atr ix     as a n   id en tity   m atr ix   0 = ( , 0 ) .   13.   = 0 , R M SE ( ) =   14.   C o m p u te  m atr ix     u s in g   th f o r m u la:   = = 1 .   15.   Dete r m in th   eig en v ec to r s   { } = 1 f r o m     th at  co r r esp o n d   to   a   cu m u lativ e   v ar ian ce   p r o p o r tio n   ( 9 0 %),   r esu ltin g   i n   = [ 1 , , ] .   16.   C o m p u te  m atr ix     u s in g   th f o r m u la  = = 1 .   17.   Dete r m in th   eig en v ec to r s   { β j } j = 1 v   f r o m   th at  co r r esp o n d   to   cu m u lativ v ar ian c e   p r o p o r tio n   ( 9 0 %),   r esu ltin g   i n   = [ 1 , , ] .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J Ar tif   I n tell     I SS N:   2252 - 8 9 3 8       Dev elo p men t o f g e n era liz ed   p r in cip a l c o mp o n e n t a n a lysi s   u s in g   mu ltip le  imp u ta tio n   …  ( F a h r eza l Zu b ed i)   459   18.   C o m p u te  R MSE   as    ( ) = 1 | | = 1 | |  2 .   19.   R ep ea t step s   1 3 - 1 7   u n til    ( 1 )   ( ) 0 , 001 .   20.   Der iv th m atr ices    an d     f r o m   co n clu d i n g   iter atio n .   21.   C r ea te  th r ed u ce d - d im en s io n al  d ata  m atr ix   u s in g   =   ,   f o r   ea ch     f r o m     to   .   22.   Ap p r o x im ate  t h o r i g in al  d ata  m atr ix   as  ̂ = ,   f o r   ea ch     f r o m     to   .   23.   C o n v er t th s ca le  o f   t h d ata  m atr ix   ̂   to   th o r ig in al  s ca le  ̂ .   24.   Sav th im p u ted   d ata  v alu es f r o m   th f ir s t iter atio n   o f   t h in teg r ated   GPC A - MI GA.   25.   C alcu late  th r elativ ch an g f o r   ea ch   m is s in g   v al u p o i n t.   26.   R ep ea s tep s   6   to   2 5   u s in g   th u p d ated   in d i v id u als.   I f   th d i f f er en ce   in   r elativ ch a n g b et wee n   th e   cu r r en a n d   p r ev io u s   iter atio n s   o f   all  im p u te d   m is s in g   v alu es   is   1 . 10 3 ,   th en   th iter ativ p r o ce s s   s to p s .   27.   Ob tain   th d i m en s io n ally   r ed u ce d   d ata   f r o m   th e   in teg r ate d   GPC A MI GA  an d   th e   ap p r o x im ate d   o r ig in al  d ata .     T h ex p lan atio n   o f   th in teg r a ted   GPC A - MI GA   alg o r ith m   is   f o llo wed   b y   p er f o r m an ce   ev alu atio n   th at  co m p ar es  it  with   s ev er al  alter n ativ ap p r o ac h es  to   ass e s s   it s   ef f ec tiv en ess   in   h an d lin g   m is s in g   v alu an d   p er f o r m in g   d im e n s io n ality   r e d u ctio n .   T o   clar if y   th d is tin c ch ar ac ter is tics   o f   ea ch   ap p r o ac h ,   co m p ar ativ e   an aly s is   was  co n d u cted   am o n g   th m eth o d s   ap p lied   in   th is   s tu d y .   T h is   co m p a r is o n   h ig h lig h ts   th s tr en g th s   an d   lim itatio n s   o f   ea ch   tech n i q u e,   aim in g   to   d eter m in h o w   th in teg r atio n   b etwe en   im p u t atio n   s tr ateg ies  an d   d im en s io n ality   r e d u ctio n   m eth o d s   co n tr ib u tes  to   ac h iev in g   ac cu r ate,   s tab le,   an d   co m p u tatio n ally   ef f icien t   d ata  r ep r esen tatio n s .   T h r esu lts   o f   th co m p ar ativ an al y s is   f o r   th f o u r   m ain   ap p r o ac h es  ex am in ed   ar s u m m ar ized   in   T a b le  1   [ 2 7 ] ,   [ 2 8 ] .       T ab le  1 C o m p a r ativ an aly s is   o f   v ar i o u s   im p u tatio n   m eth o d s   u s in g   th GPC f r am ewo r k   M e t h o d s   S t r e n g t h s   Li mi t a t i o n s   I n t e g r a t e d   G P C A - M I G A     C o n v e r g e n c e   a c c e l e r a t e s   a s   G P C A   p r o v i d e a   s t r u c t u r e d   sea r c h   d i r e c t i o n   f o r   t h e   GA .     M i ss i n g   v a l u e   i mp u t a t i o n   a l i g n w i t h   t h e   s t r u c t u r a l   p a t t e r n s   o f   t h e   d a t a ,   e n su r i n g   t h a t   d i m e n s i o n a l i t y   r e d u c t i o n   r e s u l t s   r e t a i n   t h e   o r i g i n a l   r e l a t i o n s h i p a mo n g   v a r i a b l e a n d   o b s e r v a t i o n s.     Th e   p r o c e ss  c o n v e r g e b a se d   o n   t h e   r e l a t i v e   c h a n g e   o f   i mp u t e d   v a l u e s ,   e n s u r i n g   t h e   s t a b i l i t y   a n d   c o n si s t e n c y   o f   t h e   r e su l t s.     Th e   m e t h o d   i s   n o t   r o b u s t   t o   o u t l i e r s .   M I G A + G P C A     M I G A   a d a p t i v e l y   i m p u t e mi s si n g   v a l u e s   t h r o u g h   e v o l u t i o n a r y   o p e r a t i o n s ,   p r o d u c i n g   c o mp l e t e   d a t a   t h a t   b e t t e r   r e f l e c t   t h e   o r i g i n a l   d i st r i b u t i o n   b e f o r e   d i me n si o n a l i t y   r e d u c t i o n .     A l t h o u g h   t h e   p r o c e sses   a r e   i n d e p e n d e n t ,   t h i s e q u e n t i a l   f r a mew o r k   y i e l d s   m o r e   a c c u r a t e   a n d   s t a b l e   l o w - r a n k   r e p r e s e n t a t i o n s   t h a n   m e a n   a n d   m e d i a n   i m p u t a t i o n .     Th e   m e t h o d   i s   n o t   r o b u s t   t o   o u t l i e r s .     I mp u t i n g   mi ss i n g   v a l u e w i t h o u t   c o n si d e r i n g   s t r u c t u r a l   p a t t e r n mak e d i m e n si o n a l i t y   r e d u c t i o n   i n c o n si s t e n t   w i t h   t h e   o r i g i n a l   d a t a   st r u c t u r e .   M e a n   i mp u t a t i o n + G P C A     M e a n   i mp u t a t i o n   r e q u i r e s   n o   i t e r a t i o n ,   a l l o w i n g   t h e   G P C A   d i m e n s i o n a l i t y   r e d u c t i o n   p r o c e ss t o   r e mai n   f a s t   a n d   s t a b l e .     M e a n   i mp u t a t i o n   ma i n t a i n t h e   st a b i l i t y   o f   t h e   d i s t r i b u t i o n s   c e n t r a l   t e n d e n c y ,   t h e r e b y   p r e v e n t i n g   G P C A   f r o b e i n g   b i a se d   t o w a r d   v a r i a b l e s   w i t h   a   h i g h   p r o p o r t i o n   o f   mi s si n g   v a l u e s.      Th e   m e t h o d   i s   n o t   r o b u s t   t o   o u t l i e r s .     M e a n   i mp u t a t i o n   d i sr e g a r d t h e   c o r r e l a t i o n a m o n g   v a r i a b l e s ,   p o t e n t i a l l y   d i s t o r t i n g   t h e   o r i g i n a l   mu l t i v a r i a t e   s t r u c t u r e .   M e d i a n   i mp u t a t i o n + G P C A     M e d i a n   i m p u t a t i o n   r e q u i r e n o   i t e r a t i o n ,   a l l o w i n g   t h e   G P C A   d i m e n s i o n a l i t y   r e d u c t i o n   p r o c e ss t o   r e mai n   f a s t   a n d   s t a b l e .     Th e   me d i a n   i m p u t a t i o n   b e t t e r   r e p r e se n t s   t h e   c e n t r a l   v a l u e   i n   a   sk e w e d   d i s t r i b u t i o n ,   ma k i n g   t h e   l o w - d i m e n s i o n a l   r e p r e s e n t a t i o n   o b t a i n e d   f r o m G P C A   mo r e   s t a b l e .     Th e   m e t h o d   i s   n o t   r o b u s t   t o   o u t l i e r s .     M e d i a n   i m p u t a t i o n   d i sr e g a r d t h e   c o r r e l a t i o n a m o n g   v a r i a b l e s ,   p o t e n t i a l l y   d i s t o r t i n g   t h e   o r i g i n a l   mu l t i v a r i a t e   s t r u c t u r e .       As  an   ad d itio n al  e v alu atio n   m eth o d ,   Pro cr u s tes  an aly s is   was  co n d u cted   o n   th o r ig in al  d a ta  an d   th e   ap p r o x im ated   o r ig in al  d ata.   T h f u n d a m en tal  co n ce p o f   th is   an aly s is   is   th at  th o r ig in al  d ata  ( )   is   k ep f ix ed ,   wh ile  th ap p r o x im ate d   o r ig in al  d ata  ( ̂ )   is   tr an s f o r m ed   to   ac h iev th h i g h est  p o s s ib le  alig n m en b etwe en   th two   d atasets ,   m ak in g   th e m   as  s im ilar   as  p o s s ib le .   T h is   tr an s f o r m atio n   in clu d es  tr an s latio n ,   r o tatio n ,   an d   s ca lin g   ( d ilatio n )   p r o ce s s es   [ 2 9 ] .   T h e   s im ilar ity   b etwe en   th two   d ata  i s   in d icate d   b y   th e     2   v alu e.   An   2   v alu e   clo s to   1   in d icate s   h ig h er   d eg r ee   o f   s im ilar ity   b etwe en   t h two   d atasets .   T h e   f o r m u la  u s ed   to   co m p u te   2   is   p r esen ted   as  ( 6 ) .       Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 9 3 8   I n t J Ar tif   I n tell Vo l.  1 5 ,   No .   1 ,   Feb r u ar y   2 0 2 6 454 - 4 6 8   460   2 = 1    ( , ̂ )   ( )   ( 6 )     W h er  ( , ̂ )   r ep r esen ts   th P r o cr u s tes   d is tan ce   u s ed   to   m ea s u r e   th d if f er en ce   b etwe en   th o r ig in al  d ata   an d   th e   ap p r o x im ated   o r i g in al  d ata   [ 3 0 ] ,   [ 3 1 ] .       3.   RE SU L T S AN D I SCU SS I O N   3 . 1 .     Sim ula t i o r esu lt s   T h iter ativ p r o ce s s   o f   th in teg r ated   GPC A - MI GA  wa s   te r m in ated   wh en   th r elativ ch an g o f   all  im p u ted   elem e n ts   b etwe en   tw o   co n s ec u tiv e   iter atio n s   was  l ess   th an   o r   eq u al  t o   0 . 0 0 1 .   T h is   cr iter io n   in d icate s   th at  th p r o ce s s   h ad   r ea c h ed   a   s tab le  o r   co n v e r g en s tate,   wh er v ar iatio n s   in   th im p u ted   elem en ts   b etwe en   s u cc ess iv iter atio n s   b ec am n eg lig ib le.   Acc o r d in g   to   th s im u latio n   r esu lts ,   c o n v er g en ce   was a ch iev ed   at  th 423 rd   iter atio n   at  5 lev el  o f   m is s in g   d ata,   at  th 4 5 8 t h   iter atio n   at  1 0 lev el,   at  th 4 8 6 th   iter atio n   at  a   1 5 % lev el,   an d   at  th 5 2 7 th   iter atio n   at  2 0 % lev el.   Du r in g   ea ch   iter atio n ,   th MI GA  g en er ated   s ev er al  im p u tatio n   ca n d id ates  an d   ev alu ated   t h em   u s in g   th f itn ess   f u n ctio n .   T h ca n d id ate  with   th e   s m allest  f itn ess   v alu was  s elec ted   as  th o p tim al  im p u tatio n   r esu lt  an d   in te g r ated   in t o   th e   GPC p r o ce s s   f o r   d im en s io n ality   r ed u ctio n .   T h e   co n s is ten d ec r ea s in   f itn ess   v alu es  with   in cr ea s in g   iter atio n s ,   as  illu s tr ated   in   Fig u r 3 ,   in d icate s   g r ad u al  im p r o v em e n in   th e   d im en s io n ality   r e d u ctio n   p r o c ess .   Fig u r 3 ( a )   p r esen ts   th r esu lts   f o r   m is s in g   v alu p er ce n tag es  o f   5 % ,   a n d   1 0 as p r esen ted   in   Fig u r 3 ( b )   o n ly ,   as th eir   co n v e r g en ce   p atter n s   r ef lect  s im ilar   ten d en cies a t o th er   m is s in g   v alu e   lev els.           ( a)   ( b )     Fig u r 3 .   Fit n ess   v alu es a t d if f er en t p er ce n tag es o f   m is s in g   v alu es   of   ( a)   5 % a n d   ( b )   1 0 %       T h s im u lated   d ata  u s ed   in   th is   s tu d y   h ad   an   u n d e r ly in g   s tr u ctu r o f   2 5 × 5 ,   co m p r is in g   2 5   clu s ter s   o f   o b s er v atio n s   an d   5   clu s ter s   o f   v ar iab les.  T h is   co n f ig u r atio n   was  u s ed   as  r ef er en ce   to   as s ess   h o ef f ec tiv ea ch   ap p r o ac h   was  in   p er f o r m in g   d im e n s io n ality   r ed u ctio n   o n   d atasets   co n tain in g   m is s in g   v alu es.  T h e   in teg r ated   GPC A - MI GA  d em o n s tr ated   th m o s co n s is ten p er f o r m an ce   co m p ar ed   t o   th e   o th er   m eth o d s .   At  m is s in g   v alu p e r ce n tag es  o f   5   an d   1 0 % ,   th i n teg r ated   GPC A - MI GA  p r eser v ed   th o r ig in al  s tr u ctu r b y   p r o d u cin g   d im en s io n s   o f   2 5 × 5   ac r o s s   all  r ep licatio n s ,   i n d i ca tin g   its   ab ilit y   t o   r e d u ce   d i m en s io n ality   s tab ly   ev en   in   th p r esen ce   o f   m is s in g   v alu es.  As  th p er ce n tag o f   m is s in g   v alu es  in cr ea s ed ,   th in teg r ate d     GPC A - MI GA  p r o d u ce d   lar g er   r ed u ce d   d im e n s io n s ,   y et  it  r em ain ed   m o r ef f icien th an   th o th er   m eth o d s .   I n   co n tr ast,  th o th er   m eth o d s   ten d ed   to   g en er ate  lar g er   d i m en s io n s   ev en   at  r elativ ely   lo p er ce n tag es  o f   m is s in g   v alu es.   As  s h o wn   in   T ab le   2 ,   th e   2   v al u es  f r o m   th e   P r o c r u s tes  an aly s is   b etwe en   th o r ig in al   d ata   an d   th ap p r o x im ated   o r i g in al  d ata  o b tain ed   f r o m   GPC r an g f r o m   0 . 9 9 1   to   0 . 9 9 3 ,   in d icatin g   th at  GPC ca n   ap p r o x im ate   th e   o r ig i n al  d ata   f r o m   its   lo w - d im e n s io n al  r e p r esen tatio n   with   a   v e r y   s m al er r o r   lev el.   I n   th e   d ata  co n tain in g   m is s in g   v alu e s ,   th in teg r ated   GPC A - MI GA  p r o d u ce d   th h ig h est  an d   m o s s tab le  2   v alu es  ac r o s s   all  lev els  o f   m is s in g n ess   co m p ar ed   to   o t h er   m eth o d s .   T h is   in d icate s   th ab ilit y   o f   th m eth o d   to   ap p r o x im ate   th o r i g in al  d at f r o m   its   lo w - d im en s io n al  r ep r esen tatio n   with   v er y   s m all  er r o r   lev el.   I n   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J Ar tif   I n tell     I SS N:   2252 - 8 9 3 8       Dev elo p men t o f g e n era liz ed   p r in cip a l c o mp o n e n t a n a lysi s   u s in g   mu ltip le  imp u ta tio n   …  ( F a h r eza l Zu b ed i)   461   ad d itio n ,   th 2   v alu es  o f   th in teg r ated   GPC A - MI GA  wer e   clo s er   to   th o s o f   GPC A   o n   co m p lete  d ata   co m p ar ed   to   o th er   m eth o d s .   I n   o th e r   wo r d s ,   th e   d im en s io n a lity   r ed u ctio n   r esu lts   o b tain ed   f r o m   t h in teg r ate d   GPC A - MI GA  f o r   d ata  co n tain in g   m is s in g   v alu es  s till   r ef le ct  th s am s tr u ctu r an d   r elatio n s h ip   p atter n s   as  th d ata  b ef o r th m is s in g   v alu es o cc u r r e d .       T ab le  2 T h e   2   v alu e s   f r o m   th e   P r o cr u s tes an aly s is   o f   d if f er e n t m eth o d s   at  v ar i o u s   lev els o f   m is s in g   v alu e   D a t a   p a i r s   P e r c e n t a g e   o f   mi ssi n g   v a l u e s   ( %)   G P C A   I n t e g r a t e d   G P C A - M I G A   M e a n   i mp u t a t i o n + G P C A   M e d i a n   i mp u t a t i o n + G P C A   M I G A + G P C A   1   a n d   ̂ 1   0   0 . 9 9 1   -   -   -   -   5   -   0 . 9 7 4   0 . 6 5 5   0 . 6 3 3   0 . 7 2 4   10   -   0 . 9 6 2   0 . 6 2 8   0 . 6 1 2   0 . 7 0 6   15   -   0 . 9 6 0   0 . 6 0 3   0 . 5 8 3   0 . 6 7 1   20   -   0 . 9 4 4   0 . 5 6 2   0 . 5 3 2   0 . 6 4 6   2   a n d   ̂ 2   0   0 . 9 9 3   -   -   -   -   5   -   0 . 9 7 6   0 . 6 5 1   0 . 6 3 0   0 . 7 2 1   10   -   0 . 9 6 1   0 . 6 2 5   0 . 6 1 0   0 . 7 0 3   15   -   0 . 9 5 4   0 . 6 0 5   0 . 5 8 7   0 . 6 7 4   20   -   0 . 9 4 1   0 . 5 6 5   0 . 5 3 1   0 . 6 4 1   3   a n d   ̂ 3   0   0 . 9 9 2   -   -   -   -   5   -   0 . 9 7 3   0 . 6 4 7   0 . 6 2 7   0 . 7 2 5   10   -   0 . 9 5 9   0 . 6 2 1   0 . 6 0 7   0 . 6 9 8   15   -   0 . 9 5 7   0 . 6 0 9   0 . 5 8 1   0 . 6 6 9   20   -   0 . 9 4 6   0 . 5 5 7   0 . 5 3 6   0 . 6 4 1   4   a n d   ̂ 4   0   0 . 9 9 1   -   -   -   -   5   -   0 . 9 7 1   0 . 6 4 9   0 . 6 2 6   0 . 7 2 2   10   -   0 . 9 6 3   0 . 6 2 3   0 . 6 0 9   0 . 6 9 6   15   -   0 . 9 5 8   0 . 6 0 2   0 . 5 8 8   0 . 6 6 6   20   -   0 . 9 4 0   0 . 5 5 5   0 . 5 3 5   0 . 6 4 3       B ased   o n   T ab le  3 ,   GPC ap p lied   co m p lete  d ata  an d   y ield e d   an   a v er ag e   R MSE   o f   1 . 9 0 8 ,   in d icatin g   v er y   lo esti m atio n   er r o r .   All  ap p r o ac h es  ex h ib ited   an   in cr ea s in   R MSE   as  th p er ce n tag o f   m is s in g   v alu es  in cr ea s ed .   I n   th 5 m is s in g   v alu s ce n ar io ,   th in teg r ated   GPC A - MI GA  ac h iev ed   th lo west  av er ag R MSE   o f   2 . 0 8 ,   f o llo wed   b y   MI GA+ GPC with   2 . 2 7 ,   wh i le  m ea n   im p u tatio n +G PC with   2 . 4 2   an d   m e d ian   im p u tatio n +G PC with   2 . 5 4   r esu lted   in   lar g er   esti m atio n   er r o r s .   T h is   p atter n   was  co n s is ten at  th 1 0 ,   1 5 ,   an d   2 0 m is s in g   v alu lev els,  with   th in teg r ated   GP C A - MI GA  co n s is ten tly   o u tp er f o r m in g   th o th er   ap p r o ac h es,  an d   its   av er a g R MSE   r em ain in g   clo s to   t h at  o f   GPC in   ev er y   s ce n ar io .   GPC y i el d e d   a   v er y   s m al l   s ta n d a r d   d ev iati o n   o f   0 . 0 6   i n   t h e   co m p let e   d at a,   d em o n s t r ati n g   s tab ilit y   i n   p r ese r v i n g   th e   o r ig in al   d a ta   s t r u ct u r e   t h r o u g h   d im en s io n alit y   r e d u cti o n .   I n   t h e   d ata   w it h   5 %   m is s i n g   v al u es ,   th e   i n t eg r a te d   GPC A - MI GA   r ec o r d ed   a   s ta n d a r d   d e v i ati o n   o f   0 . 1 7 ,   w h ic h   was   m o r s ta b le   t h a n   MI GA +G PC A ,   m e a n   i m p u ta ti o n +G PC A ,   a n d   m e d ia n   i m p u t ati o n +G PC A .   T h is   p att er n   r e m ai n e d   c o n s is t en at   h ig h e r   p e r ce n ta g o f   m is s i n g   v a lu es.  T h s ta n d a r d   d ev iat io n   v al u es   f o r   e ac h   m et h o d   a r p r es en te d   i n   T a b le  3 Ov e r a ll ,   t h es f in d i n g s   c o n f i r m   t h at   t h i n t e g r ate d   G PC A - MI GA   is   m o r e   ac c u r ate  a n d   m o r r o b u s t in   r e d u c in g   th e   d i m e n s i o n al it y   o f   d at co n ta in in g   m is s i n g   v al u es .   T o   co m p le m e n t   t h e   d es cr ip ti v e   i n te r p r et ati o n   o f   t h e   av er ag R MS E   an d   its   s ta n d a r d   d e v i ati o n ,   s ta tis ti ca l   a n a ly s is   ( a n al y s is   o f   v ar ian ce   ( ANOV A)   an d   T u c k e y   t est )   was  ca r r ie d   o u t .       T ab le  3 .   Av e r ag R MSE   ( s tan d ar d   d e v iatio n )   o f   d i f f er en m eth o d s   at  v ar io u s   lev els o f   m is s in g   v alu es   M e t h o d s   P e r c e n t a g e   o f   mi ss i n g   v a l u e s   0%   5%   1 0 %   1 5 %   2 0 %   G P C A   1 . 9 1   ( 0 . 0 6 )   -   -   -   -   I n t e g r a t e d   G P C A - M I G A   -   2 . 0 8   ( 0 . 1 7 )   2 . 5 7   ( 0 . 2 7 )   3 . 0 1   ( 0 . 2 1 )   4 . 2 8   ( 0 . 2 9 )   M e a n   i m p u t a t i o n + G P C A   -   2 . 4 2   ( 0 . 2 4 )   2 . 6 9   ( 0 . 3 1 )   3 . 3 2   ( 0 . 3 3 )   4 . 4 7   ( 0 . 3 9 )   M e d i a n   i m p u t a t i o n + G P C A   -   2 . 5 4   ( 0 . 2 6 )   2 . 7 2   ( 0 . 3 2 )   3 . 4 6   ( 0 . 3 3 )   4 . 6 1   ( 0 . 4 0 )   M I G A + G P C A   -   2 . 2 7   ( 0 . 2 6 )   2 . 6 6   ( 0 . 3 2 )   3 . 2 0   ( 0 . 3 2 )   4 . 4 2   ( 0 . 3 4 )       ANOV wa s   u s ed   to   s ta tis tic ally   ev alu ate  th m eth o d s .   T h is   test   aim ed   to   d eter m in th ef f ec ts   o f   th m eth o d ,   t h p er ce n tag e   o f   m is s in g   v alu es,   an d   th eir   in te r ac tio n   o n   t h R MSE   v alu es.   B ased   o n   T a b le  4 all  f ac to r s   h av e   p - v al u es  <0 . 0 5 ,   in d icatin g   s ig n if ican d if f er en ce s   in   R MSE   v al u es  am o n g   m eth o d s ,   a m o n g   lev els  o f   m is s in g   v alu es  p e r c en tag es,  an d   in   th eir   i n ter ac tio n .   Sin ce   th ANOV r esu lts   s h o wed   s ig n i f ican t   d if f er en ce s ,   T u k ey   test   was c o n d u cte d   to   id e n tify   wh ich   g r o u p s   d if f e r ed   s ig n if ica n tly   f r o m   ea ch   o th e r .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 9 3 8   I n t J Ar tif   I n tell Vo l.  1 5 ,   No .   1 ,   Feb r u ar y   2 0 2 6 454 - 4 6 8   462   B ased   o n   th r esu lts   o f   t h T u k ey   test ,   th in teg r ated   GPC A - MI GA  o u tp er f o r m e d   th o th e r   m eth o d s   in   r ed u cin g   th d im en s io n ali ty   o f   d ata  co n tain in g   m is s in g   v alu es  ac r o s s   v ar io u s   lev els  o f   m is s in g n ess .   Alth o u g h   th T u k ey   test   co m p u tes  all  p o s s ib le  p air wi s co m p ar is o n s   am o n g   th m eth o d   g r o u p s .   T h is   s tu d y   f o cu s es  o n ly   o n   co m p a r is o n s   in v o lv in g   th GPC m eth o d   as  th b aselin e.   B ased   o n   T ab le  5 ,   th e   in teg r ated   GPC A - MI GA   h as  th s m alle s m ea n   d if f er en ce   co m p ar e d   to   GP C an d   is   r ejec ted   at  t h 5 s ig n if ican ce   lev el,   in d icatin g   th at   its   p er f o r m an ce   is   th e   clo s est  to   GPC A.   I n   co n t r ast,  th o th er   m eth o d s   s h o m u ch   lar g er   m ea n   d if f e r en ce s ,   in d icatin g   a   s ig n if ican t in cr ea s in   R MSE   v alu es c o m p ar e d   to   GPC A.       T ab le  4 R esu lts   o f   ANOV o n   th ef f ec ts   o f   m eth o d s   an d   p er ce n tag es o f   m is s in g   v al u es o n   R MSE   S o u r c e   o f   v a r i a t i o n   Df   S u s q u a r e   M e a n   s q u a r e   F - v a l u e   p - v a l u e s   M e t h o d   4   1 7 6 . 2   4 4 . 1   1 7 8 2 . 5 2   2 × 1 0 - 16   P e r c e n t a g e   o f   mi ss i n g   v a l u e s   3   1 0 4 2 . 5   3 4 7 . 5   7 3 4 6 . 6 4   2 × 1 0 - 16   M e t h o d   x   P e r c e n t a g e   o f   mi ss i n g   v a l u e s   9   3 . 8   0 . 4   1 1 . 6 6   2 . 5 9 × 1 0 - 16       T ab le  5 R esu lts   o f   th T u k ey   test   co m p ar in g   a v er ag R MSE   d if f er en ce s   am o n g   m eth o d s   C o m p a r i so n   M e a n   d i f f e r e n c e   A d j u st e d   p - v a l u e   G P C A   w i t h   I n t e g r a t e d   G P C A - M I G A   1 . 0 7 7 6   0 . 0 0 0 1   G P C A   w i t h   M I G A + G P C A   1 . 2 3 0 9   0 . 0 0 0 1   G P C A   w i t h   m e a n   i m p u t a t i o n + G P C A   1 . 3 1 8 3   0 . 0 0 0 1   G P C A   w i t h   m e d i a n   i m p u t a t i o n + G P C A   1 . 4 2 6 3   0 . 0 0 0 1       3 . 2 .     Appl ica t io n t o   re a l da t a   T h p er ce n tag o f   m is s in g   v alu es  in   ea ch   d ata  is   5 %.  B ased   o n   th s im u latio n   r esu lts ,   th i n teg r ated   GPC A - MI GA  o u tp er f o r m ed   t h o th er   m et h o d s   in   r e d u cin g   th d im en s io n ality   o f   d ata  co n tain in g   m is s in g   v alu es.  T h er ef o r e,   th in teg r at ed   GPC A - MI GA  wa s   s u b s eq u en tly   ap p lied   to   th em p ir ica d ata.   I n   th is   ca s e,   th in teg r ated   GPC A - MI GA  s to p p ed   at  t h 4 0 1 st   iter atio n   af t er   m ee tin g   th c r iter ia.     B ased   o n   th r esu lts   o b tain ed ,   an   in cr ea s in g   n u m b er   o f   th i n teg r ated   GPC A - MI GA  iter at io n s   lead s   to   d ec r ea s in   f itn ess   v alu e s .   T h is   in d icate s   th at  th in teg r ated   GPC A - MI GA  s u cc ess f u lly   o p tim izes  th s o lu tio n s   p r o g r ess iv ely   f o r   ea ch   d ataset.   T h e   R MSE   v alu o f   th e   in teg r ated   GPC A - MI GA,   wh ich   is   4 . 1 2 8   an d   clo s to   th e   R MSE   v alu o f   GPC A,   wh ich   is   3 . 3 9 2 ,   in d icate s   th at  b o th   m eth o d s   ca n   p r o d u c e     lo w - d im en s io n al  d ata  with   n e ar ly   eq u iv ale n t e r r o r   lev els.    T h is   s u g g ests   th at  th e   in teg r ated   GPC A - MI GA  d o es  n o p r o v id a   s ig n if ican t   d if f e r en ce   in   esti m atin g   th o r i g in al  d ata   f r o m   th e   r ed u ce d   d ata  co m p ar ed   to   GPC A.   T h d im en s io n   r ed u ctio n   p r o ce s s   u s in g   m atr ices    an d     s u cc ess f u lly   r etain s   m o s o f   th v ar iat io n   in   th o r i g in al  d ata.   I n   th i s   p r o ce s s ,   d ata  f r o m   5 1 4   d is tr ict /city   wer r ed u ce d   to   3 2   p r in cip al  co m p o n en ts   th r o u g h   m atr ix   ,   with   cu m u lativ v ar ian ce   p r o p o r tio n   o f   8 8 . 1 1 %.  Me an wh ile,   d ata  f r o m   2 0   in d icato r s   wer r ed u ce d   t o   6   p r i n cip al  c o m p o n en ts   th r o u g h   m atr ix   ,   with   cu m u lativ v a r ian ce   p r o p o r tio n   o f   8 8 . 3 1 %.    Fig u r 4   illu s tr ated   t h v is u al  o f   th m atr ix   s tr u ctu r b ef o r ( Fig u r 4 ( a) )   an d   af ter   ( Fig u r 4 ( b ) )   d im en s io n ality   r ed u ctio n .   T h is   m eth o d   ef f ec tiv ely   s u m m ar izes  th d ata  in to   lo wer   d im en s io n s   with o u t   s ig n if ican lo s s   o f   th to tal  ex p lain ed   v ar ia n ce .   T h e   R 2   v alu es  f r o m   th Pr o cr u s tes  an aly s is   f o r   th in teg r ated   GPC A - MI GA  ar 0 . 8 8 9   f o r   ( 1   an d   ̂ 1 ) ,   0 . 8 8 2   f o r   ( 2   an d   ̂ 2 ) ,   0 . 8 7 4   f o r   ( 3   an d   ̂ 3 ) ,   an d   0 . 8 7 1   f o r     ( 4   an d   ̂ 4 ) ,   d em o n s tr atin g   th at  th ap p r o x im ated   o r ig in al  d ata  f r o m   th in teg r ated   GPC A - MI G clo s ely   th o r ig in al  d ata.   T h e   R 2   v alu es  r an g e   f r o m   0 . 8 7 7   to   0 . 8 9 6   f o r   GPC A.   T h s m all  d if f er e n ce s   in   2   v alu es   b etwe en   th in teg r ated   GPC A - MI GA  an d   GPC f o r   ea ch   d ata  p air   in d icate   th at  b o th   m eth o d s   ex h ib it  s im ilar   p er f o r m an ce   in   ex p lain in g   t h e   v ar iab ilit y   o f   th o r ig in al  d at a.   T h in teg r ated   GPC A - MI GA  r esu lts   ar th en   v is u alize d   u s in g   th b ip lo t   ap p r o ac h .   As  s h o wn   in   Fig u r 5 ,   th d is tr ict /city   ar d is tr ib u ted   in to   f o u r   q u a d r an ts ,   ea ch   d e f in ed   b y   d is tin ct  s ets  o f   in d icato r s .   T h e   d is tr ict /city   lo ca ted   in   q u ad r a n 1   ar e   ass o ciate d   with   in d icato r s   X 5 ,   X 6 ,   X 7 ,   X 10 ,   X 14 X 16 ,   X 17 ,   an d   X 19 T h o s i n   q u ad r an t   2   a r ass o ciate d   with   in d icato r s   X 12 ,   X 15 ,   a n d   X 20 ,   wh ile  q u ad r an 3   ar e   ass o ciate d   with   in d icato r s   X 3 ,   X 4 ,   an d   X 11 .   Me an wh ile,   d is tr ict /city   in   q u ad r an 4   ar ass o ciate d   wit h   in d icato r s   X 1 ,   X 2 ,   X 8 ,   X 9 ,   X 10 ,   X 13 ,   an d   X 18 .   T h to tal  c u m u l ativ v ar ian ce   ex p lain ed   b y   th b ip lo am o u n ts   to   5 2 . 0 5 %,  in d icatin g   th at  m o r th an   h alf   o f   th d ata’ s   in f o r m atio n   is   r ep r esen ted   b y   th ex tr ac ted   co m p o n en ts .   T h d is tr ict /city   p o s itio n ed   clo s to   o n e   an o t h er   o n   th e   b i p lo ex h i b it  s im ilar   ch ar ac ter i s tics   b ased   o n   th e   p r in cip al  c o m p o n en ts   d er i v ed   f r o m   t h in teg r ated   GPC A - MI GA.   Fo r   ex am p le,   B an g k a,   B a n g k T en g a h ,   an d   B an g k T im u r   e x h ib it si m ilar   ch ar ac ter is tics   ac r o s s   th d im en s io n s   o f   h u m an   d ev elo p m en t.       Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J Ar tif   I n tell     I SS N:   2252 - 8 9 3 8       Dev elo p men t o f g e n era liz ed   p r in cip a l c o mp o n e n t a n a lysi s   u s in g   mu ltip le  imp u ta tio n   …  ( F a h r eza l Zu b ed i)   463     ( a)       ( b )     Fig u r 4 .   T h m atr ix   s tr u ct u r o f   ( a)   b ef o r d im en s io n ality   r e d u ctio n   a n d   ( b )   af ter   d im en s io n ality   r ed u ctio n           Fig u r 5 T h in teg r ate d   GPC A - MI GA  r esu lts   ar illu s tr ate d   in   b i p lo t   d er iv e d   f r o m   th 2 0 1 9   d at a       As  s h o wn   in   Fig u r 6 ,   th d is tr ict /city   ar d is tr ib u ted   in to   f o u r   q u a d r an ts ,   ea ch   d e f in ed   b y   d is tin ct  s ets  o f   in d icato r s .   T h d is tr ict /city   lo ca ted   in   q u ad r an 1   ar ass o ciate d   wi th   in d icato r s   X 5 ,   X 6 ,   X 8 ,   X 9 ,   X 13 X 14 ,   X 16 ,   X 18 ,   a n d   X 19 .   T h o s in   q u ad r an 2   a r ass o ciate d   with   i n d icato r s   X 4 ,   X 11 ,   X 15 ,   an d   X 20 wh ile   q u ad r a n 3   ar ass o ciate d   with   in d icato r s   X 2 ,   X 3 ,   an d   X 10 .   Me an wh ile,   d is tr ict /city   in   q u ad r a n 4   ar e   ass o ciate d   with   in d icato r s   X 1 ,   X 7 ,   an d   X 17 .   T h e   to tal  c u m u l ativ v ar ian ce   ex p lain ed   b y   th b ip lo t   am o u n ts   t o   5 0 . 9 4 %.   T h e   d is tr ict /city   s u ch   as  Ma r o s ,   J en ep o n t o ,   a n d   T ak alar   ex h ib it  s im ilar   ch a r a cter is tics   ac r o s s   th d im en s io n s   o f   h u m an   d ev elo p m en t.       I   I I   I II   I V   Evaluation Warning : The document was created with Spire.PDF for Python.