I AE S In t er na t io na l J o urna l o f   Art if icia l In t ellig ence   ( I J - AI )   Vo l.   14 ,   No .   2 A p r il 2 0 2 5 ,   p p .   1 6 1 6 ~ 1 6 2 4   I SS N:  2 2 5 2 - 8 9 3 8 ,   DOI : 1 0 . 1 1 5 9 1 /ijai.v 14 .i 2 . p p 1 6 1 6 - 1 6 2 4          1616       J o ur na l ho m ep a g e h ttp : //ij a i . ia esco r e. co m   A propo sed a ppr o a ch f o r plag ia rism  det e ction in  M y a nma U nico de t ex t       Su n T hu ra in  M o e 1 ,   K hin   M a So e 1 ,   T ha n T ha n Nw e 2   1 F a c u l t y   o f   C o mp u t e r   S c i e n c e ,   U n i v e r si t y   o f   C o m p u t e r   S t u d i e s,   Y a n g o n ,   M y a n mar   2 F a c u l t y   o f   I n f o r m a t i o n   S c i e n c e ,   U n i v e r si t y   o f   I n f o r ma t i o n   T e c h n o l o g y ,   Y a n g o n ,   M y a n mar       Art icle  I nfo     AB S T RAC T   A r ticle  his to r y:   R ec eiv ed   Ma y   2 ,   2 0 2 4   R ev is ed   Oct  2 7 ,   2 0 2 4   Acc ep ted   No v   1 4 ,   2 0 2 4       Aro u n d   t h e   wo rld ,   with   tec h n o lo g y   t h a imp r o v e o v e ti m e ,   a lmo st  e v e ry o n e   c a n   a c c e ss   th e   in tern e e a sily   a n d   q u ic k ly .   Wi t h   t h e   in c r e a se   in   th e   u se   o th e   i n tern e t ,   t h e   p la g iarism   o i n fo rm a ti o n   th a is  e a sily   a v a il a b le  o n   th e   in tern e h a a lso   in c re a se d .   S u c h   p lag iarism   se rio u sly   u n d e rm in e s   o rig i n a li t y   a n d   e th ica p ri n c ip les .   In   o rd e to   p re v e n t h e se   in c id e n t s,  th e re   is  p lag iarism   d e tec ti o n   so ftwa re   fo r   m a n y   c o u n tri e a n d   lan g u a g e s,   b u t h e re   is   n o   p lag iarism   d e tec ti o n   s o ftwa r e   fo t h e   M y a n m a lan g u a g e   y e t.   In   a n   a tt e m p to   fil l   th a g a p ,   t h is  stu d y   p ro p o se d   a   d e e p   lea rn in g   m o d e wit h   Ra b in - Ka rp   h a sh   c o d e   a n d   Wo r d 2 v e c   m o d e a n d   b u i lt   a   p lag iarism   d e tec ti o n   sy ste m .   Ou d e e p   lea rn in g   m o d e wa train e d   b y   ra n d o m ly   o b tai n in g   in fo rm a ti o n   fro m   M y a n m a Wi k ip e d ia.  Ac c o rd i n g   t o   th e   e x p e ri m e n ts,  o u r   p ro p o se d   m o d e c a n   e ffe c ti v e ly   d e tec p lag iarism   o e d u c a ti o n a c o n ten a n d   in fo rm a ti o n   f ro m   M y a n m a Wi k i p e d ia.  M o re o v e r,   it   is  p o ss ib le  t o   d isti n g u is h   p lag iariz e d   tex ts b y   re a rra n g in g   wo r d o su b stit u ti n g   w o rd wit h   so m e   sy n o n y m s.  Th is  st u d y   c o n tri b u tes   to   a   b r o a d e u n d e rsta n d i n g   o t h e   c o m p lex it ies   o p lag iarism   i n   th e   M y a n m a a c a d e m ic  a re a   a n d   h ig h li g h ts   th e   imp o rtan c e   o m e a su re to   e ffe c ti v e ly   p re v e n p lag iarism .   It  m a i n tain t h e   c re d ib il it y   o e d u c a ti o n   a n d   p ro m o tes   a   c u lt u re   th a v a l u e o rig i n a li ty   a n d   in tellec tu a i n teg rit y .   K ey w o r d s :   Dee p   lear n in g   My an m ar   Un ico d e   Natu r al  lan g u ag e   p r o ce s s in g   Plag iar is m   d etec tio n   Sy llab les s eg m en tatio n   T h is i a n   o p e n   a c c e ss   a rticle   u n d e r th e   CC B Y - SA   li c e n se .     C o r r e s p o nd ing   A uth o r :   Su n   T h u r ai n   Mo e   Facu lty   o f   C o m p u ter   Scien ce ,   Un iv er s ity   o f   C o m p u ter   Stu d i es   D2 ,   R o o m   ( 6 0 8 ) ,   Min d am Py in   Ny ar   Yeik   T h ar ,   Yan g o n ,   My an m ar   E m ail:  s u n th u r ain m o e@ u csy . ed u . m m       1.   I NT RO D UCT I O N   I n   th e   f ield s   o f   liter atu r e   an d   jo u r n alis m ,   in cl u d in g   v a r i o u s   ac ad em ic   ar ea s ,   th s u b m is s io n   o r   co p y in g   o f   in tellectu al  p r o p er ty ,   wh ich   is   s o m eo n else' s   e f f o r ts ,   with o u t   p r o v id in g   r e f er en ce   o r   cr e d it  t o   th o r i g in al  o wn er   is   g r a d u all y   in cr ea s in g ,   a n d   it  is   b ec o m i n g   a   ch allen g f o r   v ar i o u s   f ie ld s .   T h e   r ap id   an d   ea s y   ac ce s s   to   v ast  am o u n ts   o f   in f o r m atio n   o n   th in ter n et  m ak es  p lag iar is m   attr ac ti v e ,   an d   p lag iar is m   d etec tio n   m eth o d s   s tr u g g le  to   k ee p   u p   with   th g r o wth   o f   t ec h n o lo g ies  s u ch   as  ar tific ial  in tellig en ce   u s ed   i n   p lag iar is m .   T h m o s ad v an ce d   p lag iar is m   d etec tio n   s y s tem s   av ailab le  to d ay   u s co m p le x   m ac h in l ea r n in g   an d   n atu r al  l an g u ag p r o ce s s in g   tech n iq u es   to   f in d   s y n tactic  an d   s em an tic  p atter n s   in   tex t.  Ho wev er ,   th er is   g ap   th at   n ee d s   t o   b e   f illed ,   an d   th at   is   th e   lack   o f   p r o p er   ap p licatio n   o f   th ese  d ev elo p m en ts   to   M y an m ar   Un ico d tex t.   Plag iar is m   d etec tio n   is   an   ev er - ev o lv i n g   f ield   with in   n atu r al  l an g u ag e   p r o ce s s in g ,   d r iv en   b y   t h e   in cr ea s in g   co m p lex ity   o f   tex t   an d   th e   s o p h is ticated   m eth o d s   em p lo y ed   b y   th o s attem p tin g   to   p lag iar ize.   R esear ch er s   h av co n tin u o u s l y   ex p lo r ed   v ar io u s   alg o r ith m s   an d   tech n iq u es  to   im p r o v e   th ac cu r ac y   an d   ef f ec tiv en ess   o f   p lag iar is m   d e tectio n   s y s tem s .   T h er ar m a n y   d if f e r en ap p r o ac h es  in   th i s   s ec to r ,   f r o m   r u le - Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J Ar tif   I n tell     I SS N:   2252 - 8 9 3 8         A   p r o p o s ed   a p p r o a ch   fo r   p l a g ia r is d etec tio n   in   Mya n ma r   U n ico d text   ( S u n   Th u r a in   Mo e )   1617   b ased   alg o r ith m s   to   a d v an ce d   d ee p   lear n in g   m o d els,  ea c h   co n tr i b u tin g   u n i q u ely   to   i m p r o v i n g   d etec tio n   ac cu r ac y   an d   ef f icie n cy .   Mo an d   Nwe   [ 1 ]   d e v elo p ed   h ig h ly   ac cu r ate   r u le - b ased   My an m ar   s y llab le   s eg m en tati o n   ( MSS)   alg o r ith m   th at  ac h iev es  p er f e ct  s eg m en tatio n   ac cu r ac y   o n   lar g d ataset  o f   My an m ar   Un ico d tex t.  T h is   alg o r ith m ' s   s u cc ess   u n d er s co r es  th p o ten tial  o f   r u le - b ased   s y s tem s   f o r   h an d lin g   s p ec if ic  lin g u is tic   ch allen g es.  I n   th e   ar ea   o f   d ee p   lear n i n g ,   E Mo s taf a   an d   B en ab b o u   [ 2 ]   p r o v id ed   an   ex te n s iv o v e r v iew  o f   v ar io u s   p r o p o s itio n s   f o r   p lag i ar is m   d etec tio n ,   h ig h lig h tin g   t h lim itatio n s   o f   wo r d   g r an u la r ity   an d   W o r d 2 v ec   m eth o d s   in   ca p tu r in g   th s em an tic  n u an ce s   o f   s en ten ce s .   T h e ir   s tu d y   s u g g ests   th n ee d   f o r   m o r s o p h is ticated   m o d els  to   ac c u r ately   d etec s em an tic  p lag iar is m .   Ali  a n d   T aq [ 3 ]   r e v iewe d   b o th   tr a d itio n al  an d   m o d e r n   p lag iar is m   d etec tio n   tech n iq u es,  co n clu d i n g   th at   in tellig en an d   d ee p   lea r n in g   alg o r ith m s ,   wh ich   co n s id er   lex ical,   s y n tactic,   an d   s em an tic  p r o p er ties ,   o u tp e r f o r m   tr ad it io n al  m eth o d s ,   esp ec ially   f o r   l ar g co r p o r a.   T h is   in s ig h is   p iv o tal  f o r   d ev elo p in g   m o r e   ef f ec tiv e   p lag ia r is m   d etec tio n   s y s tem s .   X i o n g   e t   a l [ 4 ]   i n t r o d u c e d   a   n o v e l   a p p r o a c h   t h a t   i n t e g r a t e s   b i d i r e c t i o n a l   e n c o d e r   r e p r e s e n t a t i o n s   f r o m   t r a n s f o r m e r s   ( B E R T ) ,   a n   e n h a n c ed   a r t i f i c ia l   b ee  c o l o n y   ( A B C )   o p t i m i z a ti o n   a l g o r i t h m ,   a n d   r e i n f o r c e m e n t   l e a r n i n g   ( R L ) .   T h i s   m o d e l   a d d r e s s es   i m b a l a n c e d   c l as s i f i c a ti o n   a n d   h a s   s h o w n   s u p e r i o r   p e r f o r m a n c e   c o m p a r e d   t o   e x i s t i n g   m o d e l s .   F o c u s e d   o n   d e t e c t i n g   p l a g ia r i s m   i n   s o ci a l   m e d i a   c o n t e n t   t h r o u g h   a   f o u r - p h a s e   m e t h o d o l o g y   i n v o l v i n g   d a t a   p r e p r o c e s s i n g ,   n - g r a m   e v a l u a t i o n ,   s i m i l a r it y   a n a l y s is ,   a n d   d e t e c ti o n   [ 5 ] .   T h e ir   e n s e m b l s u p p o r t   v ec t o r   m ac h i n e   b a s e d   A f r i ca n   v u l t u r e   o p t i m i z a t i o n   ( E SV M - A V O )   a p p r o a c h   h a s   d e m o n s t r a t e d   h i g h   a c c u r a c y   a n d   e f f i c i e n c y .   J a m b i   e t   a l [ 6 ]   ev alu ated   ac ad em ic  p la g iar is m   d etec tio n   m eth o d s   u s in g   f u zz y   m u lti - c r iter ia  d ec is io n - m ak in g   ( MCDM) ,   p r o v id i n g   v al u ab le  r ec o m m e n d atio n s   f o r   f u tu r s y s tem s .   E p p an d   Mu r ali  [ 7 ]   p r o p o s ed   m u lti - s o u r ce   p lag iar is m   d etec tio n   m eth o d   f o r   C   p r o g r am m in g   ass ig n m en t s ,   u tili zin g   an   atten tio n - b ased   m o d el  a n d   d en s ity - b ased   s p atial  clu s ter in g   o f   ap p licatio n   ( DB SC AN )   clu s ter i n g   alg o r it h m .   Saee d   an d   T aq [ 8 ]   d e v elo p e d   an   ap p licatio n   c o m b in i n g   te r m   f r eq u en cy in v e r s d o c u m e n f r e q u en c y   ( TF - I DF )   tex t   en co d in g ,   n atu r al  l an g u ag p r o ce s s in g ,   k - m ea n s   clu s ter in g ,   an d   c o s in s im ilar ity   alg o r ith m s ,   wh ile  [ 9 ]   e n h an ce d   p lag iar is m   d etec tio n   u s in g   n atu r al  l an g u ag p r o ce s s in g   an d   m ac h in l ea r n in g   tech n i q u es,  ac h iev in g   im p r ess iv r esu lts   o n   b en ch m ar k   d atasets .   I n   c r o s s - l an g u ag p la g iar is m   d etec tio n   ( C L - PD) ,   B o u ain et  a l.  [ 1 0 ]   u tili ze d   Do c2 v ec   e m b ed d in g   tech n iq u es  an d   a   Siam ese  lo n g   s h o r t - ter m   m e m o r y   m o d el,   ac h iev in g   o u ts tan d in g   ac cu r ac y   an d   p e r f o r m an ce   m etr ics.  F u r th er   ad v a n ce d   t h is   f ield   with   t r an s f o r m er   m o d els   an d   cr o s s - lin g u al   s en ten ce   ali g n m en t   tech n iq u es   [ 1 1 ] [ 1 2 ] AlZ ah r an an d   Al - Yah y [ 1 3 ]   e x p lo r e d   Ar ab ic   p r etr ain ed   tr a n s f o r m er - b ased   m o d els  f o r   au th o r s h ip   attr ib u tio n   in   I s lam ic  law,   f i n e - tu n in g   m o d els  lik AR B E R T   an d   Ar aE L E C T R to   ac h iev s ig n if ican t   r esu lts .   Ar ab an d   Ak b ar [ 1 4 ]   p r o p o s ed   m eth o d s   f o r   d etec ti n g   ex tr in s ic  p lag iar is m   u s in g   p r etr ain ed   n etwo r k s   an d   W o r d Net  o n to l o g ies,  d e m o n s tr atin g   h ig h   p r ec is io n .   Z o u ao u i   an d   R ez eg   [ 1 5 ]   p r e s en ted   m u lti - ag en t   in d ex in g   s y s tem   f o r   Ar ab ic  p lag iar is m   d etec tio n ,   w h ile  El - R ash id y   et  a l.  [ 1 6 ]   d ev elo p ed   s y s tem   u s in g   h y p er p lan eq u atio n s   f o r   h ig h   ac cu r ac y ,   o u tp e r f o r m in g   p r ev io u s   s y s tem s   o n   s tan d ar d   d atasets .     E lali  an d   R ac h id   [ 1 7 ]   ex am i n ed   ar tific ial  in tellig e n ce - b ase d   ch atb o ts   f o r   d etec tin g   f ab r i ca ted   r esear ch ,   an d   An il  et  a l.   [ 1 8 ]   co m p ar ed   t h ef f ec tiv en ess   o f   v ar io u s   p lag i ar is m   d etec tio n   s o f twar o n   a r tific ial  in tellig en ce   g en er ated   a r ticles.  E lk h atat  et  a l [ 1 9 ]   ev alu ated   ar tific ial  in tellig en ce   co n ten d etec tio n   to o ls '   ab ilit y   to   d is tin g u is h   b etwe en   h u m an   a n d   a r tific ial  in tellig en ce   a u th o r ed   co n ten t,   h ig h lig h tin g   o n g o in g   ch allen g es   in   th is   ar ea .   Fo ltý n ek   et  a l [ 2 0 ]   t ested   web - b ased   tex t - m atch in g   s y s tem s ,   r ev ea lin g   th at  s o m e   s y s tem s   ca n   d etec ce r tain   p lag iar ized   co n ten b u t   o f ten   m is id en tify   n o n - p lag iar ized   m ater ial.   Mu an g p r ath u b   et  a l [ 2 1 ]   p r o p o s ed   f o r m al  co n ce p t a n aly s is - b ased   alg o r ith m   f o r   d o c u m en t p la g iar is m   d etec tio n ,   p ar ticu lar ly   ef f ec tiv with   T h ai   tex co llectio n s .   T ian   et  a l [ 2 2 ]   in tr o d u ce d   FP B ir th   f o r   m u lti - th r ea d ed   p r o g r am   p l ag iar is m   d etec tio n ,   d em o n s tr atin g   s ig n i f ican p er f o r m an ce   im p r o v em en ts .   T lit o v et  a l [ 2 3 ]   r ev iewe d   m et h o d s   f o r   id en tif y in g   cr o s s - lan g u ag e   b o r r o win g s   i n   s cien tific   ar ticles,  f o cu s in g   o n   R u s s ian - E n g lis h   p air s   an d   t h n ee d   f o r   s p ec ialized   to o ls   in   th is   ar ea .   An s o r g et  a l [ 2 4 ]   p r esen ted   ca s s tu d y   h ig h lig h tin g   co m m o n   er r o r s   in   p ar ap h r ased   p lag iar ized   tex ts ,   wh ile  Pal  et  a l.  [ 2 5 ]   d e m o n s t r ated   im p r o v ed   ac cu r ac y   in   p l ag iar is m   d etec tio n   u s in g   n atu r al  l a n g u a g p r o ce s s in g   tech n iq u es,  f u r th er   ad v a n cin g   th f ield ' s   ca p ab ilit ies.   T h ese  d iv er s s tu d ies  co llecti v ely   en h an ce   o u r   u n d er s tan d in g   an d   ca p ab ilit y   in   p lag iar is m   d etec tio n ,   ad d r ess in g   v ar io u s   lan g u a g es,  co n tex ts ,   an d   m eth o d o lo g ies  to   en s u r th i n teg r ity   o f   ac a d em ic  an d   c r ea tiv e   wo r k s .   T h e   p r im a r y   ch allen g e   ad d r ess ed   i n   th is   s tu d y   is   th e   lack   o f   p lag iar is m   d etec tio n   t o o ls   f o r   My an m ar   Un ico d tex t.  W ith o u r eliab l p lag iar is m   d etec tio n   m ec h a n is m s ,   ac ad em ic  in s titu tio n s   an d   co n te n cr ea to r s   in   My an m ar   f ac d if f icu lties   in   m ain tain in g   th in teg r ity   an d   o r ig i n ality   o f   th eir   wo r k .   T h er e f o r e,   a n   in n o v ativ e   m eth o d   t h at  m a k e s   u s o f   th e   m o s r ec e n d e v elo p m en ts   i n   n at u r al  l a n g u a g p r o ce s s in g   an d   m ac h in l ea r n in g   is   u r g e n tly   n ee d ed   in   o r d er   to   ac cu r atel y   d etec t p lag iar is m   in   My an m a r   Un ico d tex t.   Sin ce   th My an m ar   lan g u ag e   d o es  n o h a v s p ec if ic  wo r d   cu to f f ,   s u ch   as  s p ac ch a r ac ter ,   we   h av wo r k ed   s tep   b y   s tep   th r o u g h   co m p lex   p r ep r o ce s s in g   s u ch   as  s y llab le  s eg m en tatio n ,   wo r d   to k en izatio n ,   s to p   wo r d   r em o v al,   an d   wo r d   em b ed d in g .   Fin ally ,   we  s u cc ess f u lly   b u ilt  v e r y   ac c u r ate  an d   ef f ec tiv d ee p   lear n in g   m o d el  t h at  ca n   au t o m atica lly   id en tify   tex p lag i ar is m   ca s es  ac r o s s   v ar io u s   t o p ics  o n   My an m a r   W ik ip ed ia.   T o   e n s u r th e   r elia b ilit y   an d   r o b u s tn ess   o f   th e   m o d el,   we  u s co m p r e h en s iv e   ev alu atio n   p r o ce s s   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 9 3 8   I n t J Ar tif   I n tell Vo l.  1 4 ,   No .   2 ,   Ap r il 2 0 2 5 1 6 1 6 - 1 6 2 4   1618   co m p ar in g   its   p er f o r m an ce   with   estab lis h ed   p lag iar is m   d ete ctio n   tech n iq u es a n d   m an u ally   an n o tated   d atasets .   I n   th s ec tio n s   o n   th f o llo win g ,   we  will  ex p lo r th c o n s tr u ctio n   an d   p r ep r o ce s s in g   o f   th d ataset,   d etails  o f   th d ee p   lear n in g   m o d el  ar c h itectu r e,   an d   ev alu atio n   m ea s u r es o f   th is   ap p r o a ch .       2.   M E T H O D   I n   o r d er   to   d etec My a n m ar   Un ico d p lag iar is m ,   in p u te x t ,   o r   d o cu m en ts   a r f ir s p r o ce s s ed   to   s ep ar ate  s y llab les  b y   th MS alg o r ith m .   T h en ,   u s in g   th e   p r e - co llected   M y an m ar   wo r d   lis an d   th lo n g est   m atch in g   al g o r ith m ,   it  is   c o n v er ted   i n to   wo r d s .   Af ter   th at,   s to p   wo r d s   ar e   r em o v ed   f r o m   th ese  wo r d s ,   an d   s en ten ce s   ar s eg m en ted .   Plag iar is m   d etec tio n   will  tak a   lo n g   tim if   th in p u s en ten ce s   ar co m p a r ed   with   all  th tex ts   o n   My an m ar   W ik ip ed ia.   T h er ef o r e,   k ey wo r d s   a r ex tr ac te d   f r o m   th e   in p u s e n ten ce s   with   th e   y et   an o th er   k ey w o r d   ex tr ac t o r   ( YAKE )   k ey wo r d   ex tr ac tio n   alg o r ith m ,   an d   W ik ip ed ia  p a g es  r elate d   to   th ese   s en ten ce s   ar s elec ted   u s in g   th W ik ip ed ia  s ea r ch   ap p licati o n   p r o g r am m in g   in ter f ac e   ( A PI ) .   On ly   t h tex t   co n ten is   p u lled   f r o m   th e   s elec ted   W ik ip ed ia  p ag es,  f o llo wed   b y   s y llab le  s eg m en tatio n   an d   wo r d   to k en izatio n .   T h en   s to p   wo r d s   ar r em o v ed   an d   s eg m en te d   in to   s en ten ce s .   Ou r   p r o p o s ed   s y s tem   d esig n   is   s h o wn   in   Fig u r 1 .       I n p u t   T e x t / D o c T e x t   P r o c e s s i n g S yl l a b l e   S e g m e n t a t i o n W o r d   T o ke n i z a t i o n S t o p w o r d   R e m o va l Se n t e n c e   Se g m e n t a t i o n W i ki p e d i a   S e a r c h   A P I K e yw o r d   E x t r a c t i o n T e x t   C o n t e n t   E x t r a c t i o n S e n t e n c e   S e g m e n t a t i o n T e x t   P r o c e s s i n g S yl l a b l e   S e g m e n t a t i o n W o r d   T o ke n i z a t i o n St o p w o r d   R e m o v a l P a r a p h r a s e   C o u n t i n g   a n d   S i m i l a r i t C a l c u l a t i o n P l a g i a r i s m   R e s u l t P l a g i a r i s m   D e t e c t i o n D e e p   L e a r n i n g F u z z C o s i n e F u z z T o ke n   S o r t F u z z J a r o - W i n k l e r F u z z L e ve n s h t e i n     Fig u r 1 .   My a n m ar   U n ico d p lag iar is m   d etec tio n   s y s tem       2 . 1 .     M y a n m a s y lla ble  s eg menta t io n   T h e   MSS   alg o r ith m   ex tr ac ts   t h My an m ar   s y llab les  f r o m   t h in p u t   s en ten ce   b ased   o n   th e   f o llo win g   f o u r   r u les   [ 1 ] i)   I f   th i th   s y ll ab ic  elem en o f   in p u s en ten c is   n o m em b er   o f   v o wel_ m ed ial_ g r o u p ii)  I f   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J Ar tif   I n tell     I SS N:   2252 - 8 9 3 8         A   p r o p o s ed   a p p r o a ch   fo r   p l a g ia r is d etec tio n   in   Mya n ma r   U n ico d text   ( S u n   Th u r a in   Mo e )   1619   th i - 1 th   o r   i th   o r   i+1 th   s y llab ic   elem en o f   in p u s en te n ce   is   n o a   co n s o n a n p ai r s   s y m b o l   ္  iii)  I f   th i+1 th   s y llab ic  elem en o f   in p u s en ten ce   is   n o co n s o n an p air s   s y m b o       an d   iv )   I f   th i+1 th   s y llab ic  elem en o f   in p u t sen ten ce   is   n o t a   Asat’  s y m b o ္     .     v o wel_ m ed ial_ g r o u p   [ ေ္ ,   ္     ,         ,   ္     ,   ္     ,   ္     ,   ္     ,   ္  ,   ္  ,   ္  ္     ,   ္     ,   ္     ,   ္     ,    ္    ,   ္  ]     I f   all  th r u les  ar co r r ec t,  it  h as  r ea ch ed   th s tar o f   th n ex t   My an m ar   s y llab le T h e   ex am p le  s h o wn   b elo is   My an m ar   s en ten ce   s eg m en ted   in to   ea ch   My an m ar   s y llab le  u s in g   s y llab le  s eg m en tatio n   alg o r ith m .     I n p u t M y a n m ar   s en te n ce   က             က                                                                                                                                                                                     Ou tp u t M y an m a r   s y llab les:   က                   _             _ က                   _ ခ င               _            _            _ _             _                 _             _ ခ င               _             _              _ ည        _     2 . 2   Wo rd  t o k eniza t i o n   W co llected   4 6 , 8 3 7   My an m ar   wo r d s   an d   u s ed   g r ee d y   l o n g est - m atch - f ir s tech n iq u t o   to k en iz e   My an m ar   wo r d s .   T h alg o r ith m   p ick s   th lo n g est  n - p r ef ix   o f   th r em ain in g   s y llab les  th at  m atch es  wo r d   in   th p r e - co llected   My a n m ar   w o r d   lis t.  Sy llab les  th at   ar n o t   in clu d e d   in   th p r e - c o llected   My an m ar   w o r d   lis t   ar tr ea ted   as  u n k n o wn   an d   d r o p p e d   as  s to p   wo r d s .   B elo is   an   ex am p le  o f   co n v er tin g   My an m ar   s y llab les  in to   My an m a r   wo r d s .     I n p u t M y a n m ar   s y llab les:   က                   _             _ က                   _ ခ င               _            _            _ _             _                 _             _ ခ င               _             _              _ ည        _     Ou tp u t M y an m a r   wo r d s :   က            က         ခ     ၊                                            ၊                                                   ခ      ၊                                         ည                    2 . 3   St o w o rds   r em o v a l   T h er ar n o   b e n ch m a r k   s to p   wo r d s   th at  h av b ee n   ag r ee d   u p o n   in   ac a d em ia  an d   s p ec if ically   d ef in ed   in   My a n m ar   n a t u r a l   l a n g u a g e   p r o c e s s i n g .   I n   o r d er   t o   cr ea te  a   f in al   s to p   wo r d   lis t ,   we  co m b in ed   o u r   id ea s   with   th s to p   wo r d s   p r e v io u s ly   d is co v er ed   in   M y an m ar   n a t u r a l   l a n g u a g e   p r o c e s s i n g   r esear ch   b y   o th e r   r esear ch er s .   So m e   o f   th s t o p   wo r d s   u s ed   in   t h p r o p o s ed   m o d el   ar ,   ,               ,   ,   က   ေ                က     ေတ                    , ‘ က   , ‘   ခင              , ‘                 , ‘   က                     , ‘ က ည   က              an d   all  My an m ar   d ig its   [ - ] .     2 . 4   Sente nce  s eg m ent a t io n   On o f   th f u n d a m en tal  p r o c ess es  in   n atu r al  l an g u ag p r o ce s s in g   is   s en ten ce   s eg m en tat io n .   Af ter   p r ep r o ce s s in g   th e   s o u r ce   an d   t ar g et  co r p o r u s in g   th e   p r ev io u s ly   m en tio n ed   tech n iq u es,  it  s ep ar ates  co r p u s   in to   d is cr ete  s en ten ce s .   Sen ten ce   b o u n d ar ies  in   th M y a n m ar   co r p u s   ca n   b ea s ily   id en tifie d   s in ce   th e   My an m ar   s cr ip t u s es a   s p ec ial  ch ar ac ter   k n o wn   as th "Po u   m a"   s ig n   ( ) ,   s im ilar   to   th f u ll   s to p   ( . )   in   E n g lis h ,   to   d en o te  t h en d   o f   s en te n c e .     2 . 5   Wo rd2 v ec  m o del   Go o g le  in tr o d u ce d   W o r d 2 v e in   2 0 1 3 ,   wh ich   ca p tu r es  s em an tic  an d   co n tex tu al  s im ilar ities   b y   r ep r esen tin g   c o n tin u o u s   d en s v ec to r   o f   wo r d s .   w o r d   e m b ed d in g   m o d el   ca n   tak e   m ass iv tex tu al  c o r p o r a,   cr ea te  v o ca b u lar y   d ictio n a r y ,   an d   g e n er ate  d en s wo r d   e m b ed d in g   m o d el  th at  h as  lo wer   d im en s io n ality   th an   b a g - of - wo r d s   m o d els.  T h er ar two   d if f e r en m o d el  a r ch itectu r es,  s u ch   as  th c o n tin u o u s   b a g - of - wo r d s   ( C B O W )   an d   s k ip - g r am   m o d els.   I n   th is   wo r k ,   we  u s th C B O W   m o d el  an d   tr ain   with   4 5 , 3 9 9   s en ten ce s   o f   My an m ar   Un ic o d te x f r o m   1 , 0 0 0   r an d o m   My an m a r   W ik ip ed ia  p a g es.  T h en   th v ec to r   is   u s ed   to   r ep r esen t   ea ch   wo r d .   I n   th is   p h ase,   th e n tire   tex co n ten o f   th My a n m ar   W ik ip ed ia  p ag is   tr an s f o r m ed   in to   m at r ix   o f   v ec to r s ,   with   ea ch   r o r ep r esen tin g   wo r d .   Fig u r e   2   s h o ws  th v is u aliza tio n   o f   o u r   W o r d 2 v ec   m o d el  in   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 9 3 8   I n t J Ar tif   I n tell Vo l.  1 4 ,   No .   2 ,   Ap r il 2 0 2 5 1 6 1 6 - 1 6 2 4   1620   th two - d im en s io n al  s p ac o f   t - d is tr ib u ted   s to ch asti n eig h b o r   em b ed d in g   ( t - SNE )   with   p r in cip al  co m p o n en ts   an aly s is   ( PC A) ,   an d   ea ch   p o i n t r ep r esen ts   wo r d .           Fig u r 2 .   W o r d 2 v ec   m o d el       2 . 6   Ra bin - K a rp  h a s f un ct io n   T h R ab in - Kar p   al g o r ith m   was  o r ig in ally   ch ec k er   th at  d eter m in es  wh eth er   two   s tr in g s   ( o r   p atter n s )   m atch .   I n   th is   r esear ch ,   h o we v er ,   we   em p lo y ed   th R ab in - Kar p   h ash in g   a p p r o a ch   to   g en er ate  th e   h ash   co d es  f o r   My a n m ar   wo r d s   an d   co n v er t h em   t o   v ec to r s .   Un lik t h R ab in - Kar p   tec h n iq u e,   we  d id   n o t   co m p ar h ash es  ac co r d in g   to   lin ea r   tim e,   b u in s tead   b u ilt   d ee p   lear n in g   m o d el  a n d   c o m p ar ed   it.   I n   t h is   wo r k ,   we  u s ed   th p o ly n o m ia r o llin g   h ash   an d   m o d u lar   ar ith m etic  m eth o d s   d ef in e d   in   ( 1 )   to   p r o d u ce   h ash   co d es f o r   M y an m ar   wo r d s ,   e n s u r in g   th at  ea ch   My an m a r   wo r d   r ec eiv ed   a   u n iq u h ash   c o d e.     =   ( 1   1 +   2   2 + +     0 )          ( 1 )     W h er is   th h ash   co d e,   is   th in teg er   Am e r ican   s tan d ar d   co d f o r   i n f o r m atio n   in ter c h an g ( ASC I I )   co d e   o f   th ch ar ac ter   in   th wo r d ,   b   is   th n u m b er   o f   all  My an m a r   ch ar ac ter s ,   m   is   th n u m b er   o f   ch ar ac ter s   in   th wo r d ,   an d   is   lar g p r im n u m b er .     2 . 7   Dee l ea rning   m o del   Af ter   th e   p r ep r o ce s s in g   s tep s ,   we  p e r f o r m ed   p lag iar is m   d etec tio n   o n   th em   u s in g   a   d ee p   lear n i n g   m o d el.   T h e   d ee p   lea r n in g   m o d el  was  tr ain ed   u s in g   two   d if f er en s en ten ce   v ec t o r izatio n   t ec h n iq u es,  s u ch   as   th R ab in - Kar p   r o llin g   h as h   f u n ctio n   an d   W o r d 2 v ec .   T h t r ain in g   d ata  in clu d es  1 , 5 0 6   s en ten ce s   r an d o m ly   tak en   f r o m   My a n m ar   W ik ip ed ia  p ag es.  T h tr ain in g   v ec to r s   ar o b tain ed   af ter   all  th wo r d s   f r o m   th tr ain in g   s en ten ce s   h av b ee n   co n v er t ed   in to   h ash   co d e   n u m b er s ,   o r   W o r d 2 v ec   weig h ts .   T h e   p r o p o s ed   m o d el  is   illu s tr ated   in   Fig u r 3 .   Ho wev er ,   th e   len g th   o f   th e   tr a in in g   v ec t o r s   v ar ies  d ep en d in g   o n   h o lo n g   th e   s en ten ce   is .   W th en   s ea r ch ed   f o r   th s en ten ce   wi th   th e   m o s wo r d s   an d   c o u n ted   th em ,   d is co v e r in g   th at  it   co n tain e d   alm o s   5 0   wo r d s .   E ac h   tr ai n in g   v ec to r   was  g iv en   len g th   o f   5 0 ,   an d   th b la n k   s p ac es  wer f illed   with   1   s .   C o n ca ten atin g   th e   r esu ltin g   5 0 - len g th   v ec to r s   in to   1 0 0 - len g th   v ec to r s   also   in cl u d es  ad d in g   th e   class   lab el ,   as   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J Ar tif   I n tell     I SS N:   2252 - 8 9 3 8         A   p r o p o s ed   a p p r o a ch   fo r   p l a g ia r is d etec tio n   in   Mya n ma r   U n ico d text   ( S u n   Th u r a in   Mo e )   1621   s h o wn   in   T ab les  1   an d   2 .   W h en   ad d in g   class   lab els,  th class   lab el  is   s et  to   1   if   v ec to r   r ep ea ts   its elf   twice   an d   to   0   if   it  is   ad jace n to   an o th er   r a n d o m ly   c h o s en   v ec to r .   I n   th is   m an n er ,   we  o b tain     3011 × 101 - d im en s io n al  tr ai n in g   d ataset.   I is   im p o r ta n to   clar if y   wh y   ea ch   tr ain in g   v e cto r ' s   em p ty   s p ac es  m u s t b f illed   with   1 s   in   th is   c o n tex t.       T e x t   D o c u m e n t   D a t a s e t T e x t   P r o c e s s i n g S yl l a b l e   S e g m e n t a t i o n W o r d   T o ke n i z a t i o n S t o p w o r d   R e m o va l S e n t e n c e   Se g m e n t a t i o n W o r d   S e g m e n t a t i o n T r a i n i n g   D a t a s e t D a t a s e t   C r e a t i o n V e c t o r i z a t i o n ( W o r d 2 V e c / R a b i n - K a r p ) C r e a t e   D a t a s e t St a n d a r d i z a t i o n D e e p   L e a r n i n g   T r a i n e d   M o d e l D e e p   L e a r n i n g   M o d e l D e n s e   L a ye r ( 5 0 ,   I n p u t   D i m = 1 0 0 , A c t i va t i o n = Re L u ) Ba t c h N o r m a l i z a t i o n   L a ye r ( ) D r o p o u t   L a ye r ( 0 . 6 ) D e n s e   L a y e r ( 2 0 ,   A c t i v a t i o n = R e L u ) Ba t c h N o r m a l i z a t i o n   L a ye r ( ) D r o p o u t   L a ye r ( 0 . 5 ) D e n s e   L a ye r ( 1 0 ,   A c t i v a t i o n = S o f t m a x ) Ba t c h N o r m a l i z a t i o n   L a ye r ( ) D r o p o u t   L a ye r ( 0 . 6 ) D e n s e   L a ye r ( 4 ,   A c t i va t i o n = S i g m o i d ) D e n s e   L a ye r ( 2 ,   A c t i va t i o n = S i g m o i d ) T r a i n i n g   D a t a s e t D e e p   L e a r n i n g   T r a i n i n g   P h a s e T r a i n i n g   D a t a   P r o c e s s i n g   P h a s e     Fig u r 3 Pro p o s ed   d ee p   lear n i n g   m o d el       T ab le  1 .   T r ai n in g   d ata  ( R ab in - Kar p   r o llin g   h ash )   S r c   W 0 1   S r c   W 0 2     S r c   W 4 9   S r c   W 5 0   Tg t   W 0 1   Tg t   W 0 2     Tg t   W 4 9   Tg t   W 5 0   C l a s s   1 2 0 7   2 2 2 3     1   1   1 2 0 7   2 2 2 3     1   1   1   8 3 0   1 1 4 6     1   1   8 3 0   1 1 4 6     1   1   1                         8 3 0   1 1 4 6     1   1   2 3 6   4 6 7     1   1   0   4 5 5   9 2 0     1   1   5 1 5   1 2 0 7     1   1   0     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 9 3 8   I n t J Ar tif   I n tell Vo l.  1 4 ,   No .   2 ,   Ap r il 2 0 2 5 1 6 1 6 - 1 6 2 4   1622   T ab le  2 .   T r ai n in g   d ata  ( W o r d 2 v ec)   S r c   W 0 1   S r c   W 0 2     S r c   W 4 9   S r c   W 5 0   Tg t   W 0 1   Tg t   W 0 2     Tg t   W 4 9   Tg t   W 5 0   C l a s s   - 0 . 0 1 7 0 6 4 8 6   - 0 . 0 1 3 2 3 6 0 7     1   1   - 0 . 0 1 7 0 6 4 8 6   - 0 . 0 1 3 2 3 6 0 7     1   1   1   - 0 . 0 1 7 0 6 4 8 6   - 0 . 0 1 3 3 4 8 7 7     1   1   - 0 . 0 1 7 0 6 4 8 6   - 0 . 0 1 3 3 4 8 7 7     1   1   1                         - 0 . 0 1 7 0 6 4 8 6   - 0 . 0 1 3 3 4 8 7 7     1   1   - 0 . 0 3 0 6 9 3 3 1   - 0 . 0 1 7 0 6 4 8 6     1   1   0   - 0 . 0 1 6 2 0 9 1 3   - 0 . 0 0 3 4 2 1 2 5     1   1   - 0 . 0 1 5 8 3 7 0 2   - 0 . 0 1 5 7 2 6 0 7     1   1   0       C h ec k in g   f o r   i d en tity   b etwe en   th s o u r ce   s tr in g   an d   th tar g et  s tr in g   is   th p r im ar y   g o al   o f   p lag iar is m   d etec tio n .   W aim   to   d etec t a n y   in s tan ce s   o f   p lag iar is m   in   My an m ar   W ik ip ed ia   ar ticles.  T h en tire   co llectio n   o f   ar ticles  o n   M y an m ar   W ik ip ed ia  will  n ee d   to   b u s ed   as   tr ain in g   d ata   if   we   c h o o s to   u s a   d ee p   lear n in g   m o d el,   wh ich   is   wh at  we  ty p ically   d o   f o r   th is   k in d   o f   r e q u ir em e n t.  T h e r ar m an y   ch allen g es  in v o lv ed   in   d o in g   th is ,   in clu d in g   tr ain in g   d ata  ex tr ac tio n ,   m o d el  tr ain in g   tim e,   an d   h ar d war r eso u r ce s .   Du e   to   th ex is ten ce   o f   th ese  ch allen g es,  o u r   d ee p   lear n in g   m o d el   was sep ar ated   f r o m   tr ad itio n a l o p er atio n   m o d els   an d   p u r p o s ef u lly   b u ilt  as  p r o b ab ilis tic  m o d el  b ased   o n   weig h ts   s im ilar   to   lo g is tics   r eg r ess io n .   T o   m ain tain   th weig h ts   o f   o u r   tr ain ed   m o d el,   we  f illed   all  em p ty   s p ac es  in   th tr ain in g   v ec to r s   with   1   s .   Ou r   d ee p   lear n in g   m o d el  d o es  n o u s c o n v o lu tio n a lay er s   b ec au s o u r   tr ain in g   d ataset  h as  1 s tr u ctu r e.   I h as  o n ly   5   d e n s e,   f u lly   co n n ec ted   la y er s ,   an d   r ec tifie d   lin ea r   u n it  ( R eL U) s o f tm ax ,   an d   s ig m o id   ar u s ed   as  ac tiv atio n   f u n ctio n s .   Usi n g   th h o ld o u m et h o d ,   2 0 o f   th 3 , 0 1 1   tr ai n in g   d at asets   wer d iv id ed ,   an d   6 0 2   wer u s ed   as  test in g   d ata  f o r   t h m o d el  ev alu atio n .   Ou r   p r o p o s ed   m o d el  h as  9 8 ac cu r ac y   r ate  f o r   d etec tin g   p lag iar is m ,   as  s h o w n   in   T ab le  3 .       T ab le  3 .   R esu lts   o f   p r o p o s ed   m o d el     P r e c i s i o n   R e c a l l   F1 - sc o r e   S u p p o r t   U n ma t c h e d   1   0 . 9 6   0 . 9 8   3 0 2   M a t c h e d   0 . 9 6   1   0 . 9 8   3 0 0             A c c u r a c y       0 . 9 8   6 0 2   M a c r o   a v g   0 . 9 8   0 . 9 8   0 . 9 8   6 0 2   W e i g h t e d   a v g   0 . 9 8   0 . 9 8   0 . 9 8   6 0 2       3.   RE SU L T S AN D I SCU SS I O N   As  m en tio n ed   in   s u b s ec tio n   2 . 7 ,   we  test ed   o u r   p r o p o s ed   d ee p   lear n in g   m o d el  u s in g   t wo   d if f er en t   v ec to r izatio n   tech n iq u es.  T h r esu lts   in d icate d   th at  th e   d ee p   lear n in g   m o d el   tr ain ed   with   s en ten ce   v ec to r izatio n   u s in g   th R ab in - Kar p   r o llin g   h ash   f u n ctio n   p r o v id ed   m o r ac c u r ate  p lag iar is m   d etec tio n   r esu lts   th an   th m o d el  t r ain ed   with   W o r d 2 v ec   s en ten ce   v ec to r izatio n .   Ou r   ex p e r im en is   th f ir s in   th f ield   o f   My an m ar   U n ico d p lag iar is m   d etec tio n ,   with   n o   ex is tin g   m eth o d s   av ailab le  f o r   co m p ar is o n .   Plag iar is m   d etec tio n   tech n iq u es u s ed   in   o th er   lan g u a g es,  in clu d i n g   E n g l is h ,   ar n o t a p p licab le  to   My a n m ar   Un ico d e.   T o   ev al u ate  th e   p er f o r m a n ce   o f   o u r   p r o p o s ed   m o d el,   we   c o m p ar ed   th e   r esu lts   with   th o s o b tain e d   u s in g   well - k n o wn   f u zz y   s tr in g   m atch in g   m eth o d s .   T h ex p er im en in v o lv ed   5 0 0   r an d o m ly   s elec ted   s en ten ce s   f r o m   My an m a r   W ik ip ed ia,   c o n tain in g   n ea r l y   3 , 0 0 0   p ar ap h r ases .   T h ese  s en ten ce s   wer test ed   f o r   d ir ec t   co p y in g   an d   p ar a p h r asin g   p la g iar is m ,   wh er wo r d   s y n tax   w as  r ev er s ed .   T h e   r esu lts   o f   th i s   test   ar p r esen ted   in   T ab le  4 .   T h ex p er im e n r ev ea led   t h at  o u r   p r o p o s ed   m eth o d ,   wh ich   co m b in es  d ee p   lear n in g   m o d el  with   R ab in - Kar p   s en ten ce   v ec to r i za tio n ,   p r o d u ce d   t h b est  r esu lts .   Ho wev er ,   o u r   m eth o d   s till   h as  s o m e   wea k n ess es.  As  th f ir s r esear ch   f o r   M y an m ar   Un ico d e   p la g iar is m   d etec tio n ,   f o c u s in g   o n   d ir ec c o p y in g   a n d   p asti n g ,   th r esu lts   s h o wn   in   T ab le  4   ar p r o m is in g .   Nev er th eless ,   th m eth o d   h as  lim itatio n s   in   d etec tin g   o th er   ty p es  o f   p lag iar is m ,   s u ch   as  o u tlin in g   an d   s u m m ar i zin g ,   wh er o n ly   th c o n ce p o r   id ea   is   tak en .   Fu r th er   r esear ch   is   n ee d ed   to   d ev elo p   a d ap tiv m et h o d s   f o r   d etec tin g   th ese  ty p es o f   p lag ia r is m .       T ab le  4 .   E x p er im en tal  r esu lt   M e t h o d   S i mi l a r i t y   s c o r e   ( %)   C o m p l e t e   p l a g i a r i sm   P a r a p h r a s i n g   p l a g i a r i sm   D L( R a b i n - K a r p )   9 5 . 6   9 5 . 6   D L( W o r d 2 V e c )   9 4 . 1   9 4 . 1   F u z z y   J a r o - W i n k l e r   9 1 . 5   8 8 . 6   F u z z y   Le v e n s h t e i n   9 2 . 4   5 9 . 4   F u z z y   To k e n   S o r t   9 1 . 9   9 1 . 5   F u z z y   C o si n e   9 0 . 8   9 1 . 2   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J Ar tif   I n tell     I SS N:   2252 - 8 9 3 8         A   p r o p o s ed   a p p r o a ch   fo r   p l a g ia r is d etec tio n   in   Mya n ma r   U n ico d text   ( S u n   Th u r a in   Mo e )   1623   4.   CO NCLU SI O N   O u r   s tu d y   m ar k s   s ig n if ica n s tep   f o r war d   in   th e   f ield   o f   My an m ar   Un ic o d p lag iar is m   d etec tio n .   B y   test in g   d ee p   lear n in g   m o d el  tr ain ed   with   two   d if f e r en v ec to r izatio n   tech n iq u es,  we  f o u n d   t h at  s en ten ce   v ec to r izatio n   with   th R ab i n - Kar p   r o llin g   h ash   f u n ctio n   p r o v id e d   s u p e r io r   ac c u r ac y   co m p ar ed   to   t h e   W o r d 2 v ec - b ased   ap p r o a ch .   T h is   ex p er im en t,  th f ir s o f   its   k in d   f o r   My an m ar   Un ic o d e,   h ig h li g h ts   th lim itatio n s   o f   ap p ly in g   p lag i ar is m   d etec tio n   m et h o d s   d ev elo p ed   f o r   o th er   lan g u ag es.  W h ile  o u r   m eth o d   s h o wed   p r o m is in g   r esu lts   in   d etec tin g   d ir ec t   co p y in g   an d   p a r ap h r asin g ,   it  s till   f ac es  c h alle n g es  in   id en tify i n g   m o r co m p lex   f o r m s   o f   p lag iar is m ,   s u ch   as  o u tlin in g   an d   s u m m ar izin g .   Fu tu r r esear c h   s h o u ld   f o cu s   o n   d ev elo p in g   ad a p tiv m eth o d s   to   ad d r ess   th ese  ch allen g es,  en h an cin g   th r o b u s tn ess   an d   ac cu r ac y   o f   p lag iar is m   d etec tio n   in   My an m ar   Un ico d e.   I n   t h f u tu r e,   s u ch   p r o g r ess   ca n   b ex te n d e d   an d   s ig n if ican tly   co n tr ib u te   to   m ain tain in g   ac a d em ic  an d   p r o f ess io n al   in teg r i ty   wh ile  e n co u r ag in g   o r ig in ali ty   an d   cr ea tiv ity   in   wr itten   wo r k s .       ACK NO WL E DG E M E NT S   W wo u ld   lik to   ex p r ess   o u r   h ea r tf elt  g r atitu d t o   all  th o s wh o   co n tr ib u ted   to   th e   s u cc ess f u l   co m p letio n   o f   o u r   p u b licatio n   p ap er .   A d d itio n ally ,   we  wo u l d   lik to   e x p r ess   o u r   g r atitu d f o r   th e   s u p p o r an d   r eso u r ce s   p r o v i d ed   b y   th Un iv er s ity   o f   C o m p u ter   Stu d ie s ,   Yan g o n ,   My an m ar .   T h eir   co n tr ib u tio n s   wer e   ess en tial to   th co m p letio n   o f   th is   wo r k .       RE F E R E NC E S   [ 1 ]   S .   T .   M o e   a n d   T .   T.   N w e ,   A n   a l g o r i t h f o r   M y a n mar   s y l l a b l e   s e g m e n t a t i o n   b a se d   o n   t h e   o f f i c i a l   s t a n d a r d   M y a n mar   U n i c o d e   t e x t ,   i n   2 0 2 3   I E EE   C o n f e ren c e   o n   C o m p u t e Ap p l i c a t i o n s   ( I C C A) ,   F e b .   2 0 2 3 ,   p p .   6 1 0 ,   d o i :   1 0 . 1 1 0 9 / I C C A 5 1 7 2 3 . 2 0 2 3 . 1 0 1 8 1 3 9 1 .   [ 2 ]   H .   El   M o s t a f a   a n d   F .   B e n a b b o u ,   A   d e e p   l e a r n i n g   b a s e d   t e c h n i q u e   f o r   p l a g i a r i sm  d e t e c t i o n :   a   c o m p a r a t i v e   st u d y ,   I AE S   I n t e r n a t i o n a l   J o u r n a l   o f   Ar t i f i c i a l   I n t e l l i g e n c e   ( I J - AI ) ,   v o l .   9 ,   n o .   1 ,   p .   8 1 ,   M a r .   2 0 2 0 ,   d o i :   1 0 . 1 1 5 9 1 / i j a i . v 9 . i 1 . p p 8 1 - 9 0 .   [ 3 ]   A .   A l i   a n d   A .   T a q a ,   A n a l y t i c a l   st u d y   o f   t r a d i t i o n a l   a n d   i n t e l l i g e n t   t e x t u a l   p l a g i a r i sm  d e t e c t i o n   a p p r o a c h e s,”   J o u r n a l   o f   E d u c a t i o n   a n d   S c i e n c e ,   v o l .   3 1 ,   n o .   1 ,   p p .   8 2 5 ,   M a r .   2 0 2 2 ,   d o i :   1 0 . 3 3 8 9 9 / e d u sj . 2 0 2 1 . 1 3 1 8 9 5 . 1 1 9 2 .   [ 4 ]   J.  X i o n g   e t   a l . ,   Ef f i c i e n t   r e i n f o r c e m e n t   l e a r n i n g - b a s e d   met h o d   f o r   p l a g i a r i sm  d e t e c t i o n   b o o st e d   b y   a   p o p u l a t i o n - b a se d   a l g o r i t h m   f o r   p r e t r a i n i n g   w e i g h t s,   E x p e rt   S y st e m s w i t h   A p p l i c a t i o n s ,   v o l .   2 3 8 ,   p .   1 2 2 0 8 8 ,   M a r .   2 0 2 4 ,   d o i :   1 0 . 1 0 1 6 / j . e sw a . 2 0 2 3 . 1 2 2 0 8 8 .   [ 5 ]   S .   V .   V a d i v u ,   P .   N a g a r a j ,   a n d   B .   A .   S .   M u r u g a n ,   En s e m b l e   mac h i n e   l e a r n i n g   t e c h n i q u e - b a se d   p l a g i a r i s m d e t e c t i o n   o v e r   o p i n i o n s   i n   so c i a l   m e d i a ,   Au t o m a t i k a ,   v o l .   6 5 ,   n o .   3 ,   p p .   9 8 3 9 9 1 ,   J u l .   2 0 2 4 ,   d o i :   1 0 . 1 0 8 0 / 0 0 0 5 1 1 4 4 . 2 0 2 4 . 2 3 2 6 3 8 3 .   [ 6 ]   K .   M .   Jam b i ,   I .   H .   K h a n ,   a n d   M .   A .   S i d d i q u i ,   E v a l u a t i o n   o f   d i f f e r e n t   p l a g i a r i sm   d e t e c t i o n   me t h o d s:   A   f u z z y   M C D M   p e r s p e c t i v e ,   Ap p l i e d   S c i e n c e s ,   v o l .   1 2 ,   n o .   9 ,   p .   4 5 8 0 ,   A p r .   2 0 2 2 ,   d o i :   1 0 . 3 3 9 0 / a p p 1 2 0 9 4 5 8 0 .   [ 7 ]   A .   Ep p a   a n d   A .   H .   M u r a l i ,   M a c h i n e   l e a r n i n g   t e c h n i q u e f o r   m u l t i so u r c e   p l a g i a r i sm   d e t e c t i o n ,   i n   2 0 2 1   I E EE  I n t e r n a t i o n a l   C o n f e re n c e   o n   C o m p u t a t i o n   S y s t e m   a n d   I n f o rm a t i o n   T e c h n o l o g y   f o r   S u st a i n a b l e   S o l u t i o n s   ( C S I T S S ) ,   D e c .   2 0 2 1 ,   p p .   1 5 ,   d o i :   1 0 . 1 1 0 9 / C S I TSS 5 4 2 3 8 . 2 0 2 1 . 9 6 8 3 7 5 2 .   [ 8 ]   A .   A .   M .   S a e e d   a n d   A .   Y .   T a q a ,   A   p r o p o se d   a p p r o a c h   f o r   p l a g i a r i sm  d e t e c t i o n   i n   a r t i c l e   d o c u me n t s,   S i n k rO n ,   v o l .   7 ,   n o .   2 ,   p p .   5 6 8 5 7 8 ,   A p r .   2 0 2 2 ,   d o i :   1 0 . 3 3 3 9 5 / si n k r o n . v 7 i 2 . 1 1 3 8 1 .   [ 9 ]   F .   K .   A L - Ji b o r y   a n d   o t h e r s,  H y b r i d   sy s t e m   f o r   p l a g i a r i sm   d e t e c t i o n   o n   a   sc i e n t i f i c   p a p e r ,   T u rk i s h   J o u r n a l   o f   C o m p u t e r   a n d   Ma t h e m a t i c s E d u c a t i o n   ( T U R C O MA T ) ,   v o l .   1 2 ,   n o .   1 3 ,   p p .   5 7 0 7 5 7 1 9 ,   2 0 2 1 .   [ 1 0 ]   C .   B o u a i n e ,   F .   B e n a b b o u ,   a n d   I .   S a d g a l i ,   W o r d   e m b e d d i n g   f o r   h i g h   p e r f o r m a n c e   c r o ss - l a n g u a g e   p l a g i a r i sm  d e t e c t i o n   t e c h n i q u e s,   I n t e r n a t i o n a l   J o u rn a l   o f   I n t e r a c t i v e   M o b i l e   T e c h n o l o g i e ( i J I M) ,   v o l .   1 7 ,   n o .   1 0 ,   p p .   6 9 9 1 ,   M a y   2 0 2 3 ,   d o i :   1 0 . 3 9 9 1 / i j i m . v 1 7 i 1 0 . 3 8 8 9 1 .   [ 1 1 ]   R .   S .   R .   R a j   a n d   G .   R .   R a m y a ,   D e t e c t i o n   o f   p l a g i a r i sm i n   c o n t e x t u a l   m e a n i n g   u s i n g   t r a n sf o r m e r   mo d e l   a n d   c o m mu n i t y   d e t e c t i o n   a l g o r i t h m,   S m a r t   T re n d s i n   C o m p u t i n g   a n d   C o m m u n i c a t i o n s 2 0 2 3 ,   p p .   7 7 7 7 9 5 ,   d o i :   1 0 . 1 0 0 7 / 9 7 8 - 9 8 1 - 99 - 0 8 3 8 - 7 _ 6 7 .   [ 1 2 ]   T.   Te r - H o v h a n n i s y a n   a n d   K .   A v e t i s y a n ,   Tr a n sf o r mer - b a se d   m u l t i l i n g u a l   l a n g u a g e   m o d e l s i n   c r o ss - l i n g u a l   p l a g i a r i sm d e t e c t i o n ,   i n   2 0 2 2   I v a n n i k o v   M e m o r i a l   Wo rks h o p   ( I VM EM ) ,   S e p .   2 0 2 2 ,   p p .   7 2 8 0 ,   d o i :   1 0 . 1 1 0 9 / I V M EM 5 7 0 6 7 . 2 0 2 2 . 9 9 8 3 9 6 8 .   [ 1 3 ]   F .   M .   A l Z a h r a n i   a n d   M .   A l - Y a h y a ,   A   t r a n sf o r mer - b a se d   a p p r o a c h   t o   a u t h o r sh i p   a t t r i b u t i o n   i n   c l a ss i c a l   A r a b i c   t e x t s ,   A p p l i e d   S c i e n c e s ,   v o l .   1 3 ,   n o .   1 2 ,   Ju n .   2 0 2 3 ,   d o i :   1 0 . 3 3 9 0 / a p p 1 3 1 2 7 2 5 5 .   [ 1 4 ]   H .   A r a b i   a n d   M .   A k b a r i ,   I mp r o v i n g   p l a g i a r i sm   d e t e c t i o n   i n   t e x t   d o c u m e n t   u si n g   h y b r i d   w e i g h t e d   s i mi l a r i t y ,   Ex p e rt   S y st e m s   w i t h   Ap p l i c a t i o n s ,   v o l .   2 0 7 ,   N o v .   2 0 2 2 ,   d o i :   1 0 . 1 0 1 6 / j . e sw a . 2 0 2 2 . 1 1 8 0 3 4 .   [ 1 5 ]   S .   Zo u a o u i   a n d   K .   R e z e g ,   M u l t i - a g e n t i n d e x i n g   s y st e ( M A I S )   f o r   p l a g i a r i sm  d e t e c t i o n ,   J o u r n a l   o f   K i n g   S a u d   U n i v e r si t y   -   C o m p u t e r   a n d   I n f o rm a t i o n   S c i e n c e s ,   v o l .   3 4 ,   n o .   5 ,   p p .   2 1 3 1 2 1 4 0 ,   M a y   2 0 2 2 ,   d o i :   1 0 . 1 0 1 6 / j . j k s u c i . 2 0 2 0 . 0 6 . 0 0 9 .   [ 1 6 ]   M .   A .   El - R a s h i d y ,   R .   G .   M o h a me d ,   N .   A .   E l - F i sh a w y ,   a n d   M .   A .   S h o u m a n ,   A n   e f f e c t i v e   t e x t   p l a g i a r i sm   d e t e c t i o n   s y st e b a se d   o n   f e a t u r e   se l e c t i o n   a n d   S V M   t e c h n i q u e s,   Mu l t i m e d i a   T o o l s   a n d   A p p l i c a t i o n s ,   v o l .   8 3 ,   n o .   1 ,   p p .   2 6 0 9 2 6 4 6 ,   Ja n .   2 0 2 4 ,   d o i :   1 0 . 1 0 0 7 / s 1 1 0 4 2 - 0 2 3 - 1 5 7 0 3 - 4.   [ 1 7 ]   F .   R .   El a l i   a n d   L.   N .   R a c h i d ,   A I - g e n e r a t e d   r e s e a r c h   p a p e r   f a b r i c a t i o n   a n d   p l a g i a r i s i n   t h e   s c i e n t i f i c   c o mm u n i t y ,   P a t t e r n s ,   v o l .   4 ,   n o .   3 ,   M a r .   2 0 2 3 ,   d o i :   1 0 . 1 0 1 6 / j . p a t t e r . 2 0 2 3 . 1 0 0 7 0 6 .   [ 1 8 ]   A .   A n i l   e t   a l . ,   A r e   p a i d   t o o l w o r t h   t h e   c o st ?   a   p r o s p e c t i v e   c r o ss - o v e r   st u d y   t o   f i n d   t h e   r i g h t   t o o l   f o r   p l a g i a r i sm  d e t e c t i o n ,   H e l i y o n ,   v o l .   9 ,   n o .   9 ,   S e p .   2 0 2 3 ,   d o i :   1 0 . 1 0 1 6 / j . h e l i y o n . 2 0 2 3 . e 1 9 1 9 4 .   [ 1 9 ]   A .   M .   E l k h a t a t ,   K .   El s a i d ,   a n d   S .   A l m e e r ,   Ev a l u a t i n g   t h e   e f f i c a c y   o f   A I   c o n t e n t   d e t e c t i o n   t o o l i n   d i f f e r e n t i a t i n g   b e t w e e n   h u m a n   a n d   A I - g e n e r a t e d   t e x t ,   I n t e r n a t i o n a l   J o u r n a l   f o Ed u c a t i o n a l   I n t e g r i t y ,   v o l .   1 9 ,   n o .   1 ,   S e p .   2 0 2 3 ,   d o i :   1 0 . 1 0 0 7 / s4 0 9 7 9 - 023 - 0 0 1 4 0 - 5.   [ 2 0 ]   T.   F o l t ý n e k   e t   a l . ,   Te st i n g   o f   s u p p o r t   t o o l s   f o r   p l a g i a r i s d e t e c t i o n ,   I n t e r n a t i o n a l   J o u rn a l   o f   E d u c a t i o n a l   T e c h n o l o g y   i n   H i g h e r   Ed u c a t i o n ,   v o l .   1 7 ,   n o .   1 ,   D e c .   2 0 2 0 ,   d o i :   1 0 . 1 1 8 6 / s 4 1 2 3 9 - 020 - 0 0 1 9 2 - 4.   [ 2 1 ]   J.  M u a n g p r a t h u b ,   S .   K a j o r n k a si r a t ,   a n d   A .   W a n i c h s o m b a t ,   D o c u m e n t   p l a g i a r i sm   d e t e c t i o n   u si n g   a   n e w   c o n c e p t   si m i l a r i t y   i n   f o r mal   c o n c e p t   a n a l y s i s,   J o u rn a l   o f   Ap p l i e d   M a t h e m a t i c s ,   v o l .   2 0 2 1 ,   p p .   1 1 0 ,   M a r .   2 0 2 1 ,   d o i :   1 0 . 1 1 5 5 / 2 0 2 1 / 6 6 6 2 9 8 4 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 2 5 2 - 8 9 3 8   I n t J Ar tif   I n tell Vo l.  1 4 ,   No .   2 ,   Ap r il 2 0 2 5 1 6 1 6 - 1 6 2 4   1624   [ 2 2 ]   Z.   T i a n ,   Q .   W a n g ,   C .   G a o ,   L.   C h e n ,   a n d   D .   W u ,   P l a g i a r i sm   d e t e c t i o n   o f   mu l t i - t h r e a d e d   p r o g r a ms  u s i n g   f r e q u e n t   b e h a v i o r a l   p a t t e r n   m i n i n g ,   I n t e r n a t i o n a l   J o u rn a l   o f   S o f t w a r e   E n g i n e e r i n g   a n d   K n o w l e d g e   E n g i n e e ri n g ,   v o l .   3 0 ,   n o .   1 1 - 1 2 ,   p p .   1 6 6 7 1 6 8 8 ,   N o v .   2 0 2 0 ,   d o i :   1 0 . 1 1 4 2 / S 0 2 1 8 1 9 4 0 2 0 4 0 0 2 5 2 .   [ 2 3 ]   A .   Tl i t o v a ,   A .   T o sc h e v ,   M .   Ta l a n o v ,   a n d   V .   K u r n o so v ,   M e t a - a n a l y s i o f   c r o ss - l a n g u a g e   p l a g i a r i sm a n d   se l f - p l a g i a r i sm d e t e c t i o n   met h o d s f o r   R u ss i a n - E n g l i s h   l a n g u a g e   p a i r ,   Fr o n t i e rs   i n   C o m p u t e r   S c i e n c e ,   v o l .   2 ,   O c t .   2 0 2 0 ,   d o i :   1 0 . 3 3 8 9 / f c o mp . 2 0 2 0 . 5 2 3 0 5 3 .   [ 2 4 ]   L.   A n s o r g e ,   K .   A n s o r g e o v á ,   a n d   M .   S i x sm i t h ,   P l a g i a r i sm   t h r o u g h   p a r a p h r a si n g   t o o l s t h e   st o r y   o f   o n e   p l a g i a r i z e d   t e x t ,   Pu b l i c a t i o n s ,   v o l .   9 ,   n o .   4 ,   O c t .   2 0 2 1 ,   d o i :   1 0 . 3 3 9 0 / p u b l i c a t i o n s9 0 4 0 0 4 8 .   [ 2 5 ]   S .   K .   P a l ,   O .   J .   R a f f i k ,   R .   R o y ,   V .   B .   La l ma n ,   S .   S r i v a st a v a ,   a n d   B .   S h a r ma,   A u t o m a t i c   p l a g i a r i sm  d e t e c t i o n   u si n g   n a t u r a l   l a n g u a g e   p r o c e ssi n g ,   i n   2 0 2 3   1 0 t h   I n t e rn a t i o n a l   C o n f e r e n c e   o n   C o m p u t i n g   f o S u s t a i n a b l e   G l o b a l   D e v e l o p m e n t   ( I N D I AC o m ) 2 0 2 3 ,   p p .   2 1 8 2 2 2 .       B I O G RAP H I E S O F   AUTH O RS       S u n   Th u r a in   Mo e           is  c u rre n tl y   p u rsu in g   a   P h . D.  d e g re e   a t   th e   Un iv e rsity   o f   Co m p u ter  S t u d ies ,   Ya n g o n ,   M y a n m a r.   He   re c e iv e d   a   M a ste r ' d e g re e   (M . I. S c . in   i n fo rm a ti o n   sc ien c e   fro m   th e   Un iv e rsity   o C o m p u ter  S t u d ies ,   Ya n g o n .   He   h a c o n tri b u ted   si g n ifi c a n t ly   t o   th e   field   o M y a n m a sy ll a b le   se g m e n tatio n ,   M y a n m a p lag i a rism   a n d   c re d it   sc o ri n g p u b li sh i n g   t h re e   p a p e rs  in   IEE E .   His  re se a r c h   in tere sts  in c lu d e   M y a n m a n a t u r a l   l a n g u a g e   p r o c e s s i n g ,   m a c h in e   lea rn in g ,   a n d   a c ti o n   re c o g n i ti o n .   He   c a n   b e   c o n tac ted   a e m a il :   su n th u ra in m o e @u c sy . e d u . m m .         Dr .   K h in   Ma r   S o e           re c e iv e d   a   P h . D.  ( i n fo rm a ti o n   tec h n o l o g y )   d e g re e   fro m   th e   Un iv e rsity   o Co m p u ter  S t u d ies ,   Ya n g o n ,   M y a n m a r.   S h e   is  a   p r o fe ss o a th e   Un i v e rsity   o f   Co m p u ter  S t u d ies ,   Ya n g o n .   He re se a rc h   in tere sts  a re   in   th e   a re a o n a tu ra lan g u a g e   p ro c e ss in g ,   p a rt - of - sp e e c h   tag g in g ,   m a c h in e   tra n sla ti o n ,   a n d   M y a n m a n a m e   e n ti t y   re c o g n it i o n .   S h e   c a n   b e   c o n tac ted   a e m a il k h i n m a rso e @u c sy . e d u . m m .         Dr .   Th a n   Th a n   Nw e           re c e iv e d   a   P h . D.  ( i n fo rm a ti o n   tec h n o lo g y d e g re e   fr o m   th e   Un iv e rsity   o Co m p u ter  S t u d ies ,   Ya n g o n ,   M y a n m a r.   S h e   is  a   p r o fe ss o a th e   Un i v e rsity   o f   In fo rm a ti o n   Tec h n o lo g y ,   Ya n g o n .   He re se a rc h   in tere sts  a re   i n   th e   a re a o i n fo rm a ti o n   re tri e v a l,   d a ta  m in i n g ,   b i g   d a ta ,   a n d   p a tt e rn   re c o g n it i o n .   S h e   c a n   b e   c o n tac ted   a e m a il :   th a n t h a n n we . c u @ u it . e d u . m m .     Evaluation Warning : The document was created with Spire.PDF for Python.