°æºÏ´ë ´ëÇпø ÄÄÇ»ÅÍÇкÎ, CVPR 2025¿¡ ³í¹® 2Æí äÅÃ
´ë±¸/ÀÌ¿µÁØ ±âÀÚÀÔ·Â : 2025. 03. 10(¿ù) 17:32
[´ë±¸/ÀÌ¿µÁØ ±âÀÚ] °æºÏ´ëÇб³ ´ëÇпø ÄÄÇ»ÅÍÇкΠ4´Ü°è BK21 »ç¾÷ÀÇ ¡®Áö´ÉÀ¶ÇÕ ¼ÒÇÁÆ®¿þ¾î ±³À°¿¬±¸´Ü(´ÜÀå Źº´Ã¶)¡¯ ¼Ò¼Ó ¿¬±¸ÆÀÀÌ ¼¼°è ÃÖ°í ±ÇÀ§ÀÇ ÀΰøÁö´É(AI) ¹× ÄÄÇ»ÅÍ ºñÀü ÇÐȸÀÎ ¡®CVPR(Conference on Computer Vision and Pattern Recognition) 2025¡¯¿¡ ³í¹® 2ÆíÀÌ Ã¤ÅõǴ ¼º°ú¸¦ °Åµ×´Ù.
¹Ú»ç°úÁ¤ »þÇã¾ß¸£ ¹«Çϸ¶µå(Muhammad Shaheryar) Çлý(Á¤¼ø±â, ÀÌÁ¾Åà ±³¼ö °øµ¿Áöµµ)ÀÇ ¿¬±¸ ³í¹® ¡®È®»ê ¸ðµ¨¿¡¼ÀÇ ½Å¿ø Á¤º¸ Á¦°Å¸¦ À§ÇÑ ºí·¢È¦ ¸ÞÄ¿´ÏÁò(Black Hole-Driven Identity Absorption in Diffusion Models)¡¯Àº »ý¼ºÇü AI ¸ðµ¨¿¡¼ ƯÁ¤ °³ÀÎ Á¤º¸¸¦ È¿°úÀûÀ¸·Î Á¦°ÅÇÏ´Â »õ·Î¿î ±â¹ýÀ» Á¦¾ÈÇØ °³ÀÎÁ¤º¸ º¸È£ ¹× ¾ó±¼ ºñ½Äº°È ±â¼úÀ» ȹ±âÀûÀ¸·Î Áøº¸Çß´Ù´Â Æò°¡¸¦ ¹Þ¾Ò´Ù.
¶Ç ´Ù¸¥ ¿¬±¸·Î, ¹Ú»ç°úÁ¤ ÇãÂù Çлý(Áöµµ±³¼ö ¹ÚÇý¿µ)°ú ¼®»ç°úÁ¤ È«Á¤ÈÆ Çлý(Áöµµ±³¼ö ¹Ú»óÈ¿)ÀÇ ¿¬±¸ ³í¹® ¡®ºñµð¿À ¼¼ú: ÇÁ·¹ÀÓ ¼öÁØ Ä¸¼ÇÀÇ Á¾ÇÕÀû È°¿ëÀ» ÅëÇÑ ÅؽºÆ®-ºñµð¿À °Ë»ö Çâ»ó(Narrating the Video: Boosting Text-Video Retrieval via Comprehensive Utilization of Frame-Level Captions)¡¯Àº ÅؽºÆ®-ºñµð¿À °Ë»ö(TVR) ºÐ¾ß¿¡¼ »õ·Î¿î Á¤º¸ÀÎ ³»·¹À̼ÇÀ» µµÀÔÇØ SOTA(State-of-the-Art¡¤ÇöÁ¸ ÃÖ°í ¼öÁØÀÇ ¸ðµ¨)º¸´Ù ÇöÀúÇÏ°Ô ³ôÀº ¼º´É Çâ»óÀ» ´Þ¼ºÇß´Ù.
À̹ø ¿¬±¸´Â ´ëÇпø ÄÄÇ»ÅÍÇкΠ4´Ü°è BK21 »ç¾÷ÀÇ ¡®Áö´ÉÀ¶ÇÕ ¼ÒÇÁÆ®¿þ¾î ±³À°¿¬±¸´Ü¡¯ÀÇ Áö¿øÀ» ¹Þ¾Æ ¼öÇàµÆ´Ù. Á¤¼ø±â ±³¼ö´Â ¡°BK21 ±³À°¿¬±¸´ÜÀÇ Áö¼ÓÀûÀÎ ¿¬±¸ Áö¿ø°ú Çù·ÂÀ» ¹ÙÅÁÀ¸·Î ÀÌ·ç¾îÁø ¼º°úÀÌ´Ù. ¿¬±¸ÆÀÀº ¿À´Â CVPR 2025¿¡¼ ¿¬±¸ °á°ú ¹ßÇ¥¸¦ ÁøÇàÇÒ ¿¹Á¤ÀÌ´Ù. À̹ø ¿¬±¸°¡ AI ¹× ÄÄÇ»ÅÍ ºñÀü ºÐ¾ß¿¡¼ Çй®Àû¡¤»ê¾÷ÀûÀ¸·Î Áß¿äÇÑ ±â¿©¸¦ ÇÒ °ÍÀ¸·Î ±â´ëµÈ´Ù.¡±¶ó°í ¹àÇû´Ù.
Àü±âÀüÀÚ±â¼úÀÚÇùȸ(IEEE)¿Í ±¹Á¦ÄÄÇ»ÅͺñÀüÀç´Ü(CVF)ÀÌ 1983³âºÎÅÍ °øµ¿À¸·Î ÁÖÃÖÇÏ´Â CVPRÀº AI ¹× ÄÄÇ»ÅÍ ºñÀü ºÐ¾ß¿¡¼ °¡Àå ¿µÇâ·ÂÀÌ Å« ±¹Á¦Çмú´ëȸ·Î ²ÅÈù´Ù. ±¸±Û, ¾ÖÇÃ, ¾Æ¸¶Á¸, ¸ÞŸ, ¾îµµºñ, ¼Ò´Ï µî ¼¼°èÀûÀÎ IT±â¾÷µéÀÌ ÈÄ¿øÇÏ°í ÀÖ´Ù. À̹ø CVPR 2025´Â ¿À´Â 6¿ù 11ÀϺÎÅÍ 15ÀϱîÁö ¹Ì±¹ ³»½´ºô¿¡¼ °³ÃÖµÉ ¿¹Á¤ÀÌ´Ù.
¹Ú»ç°úÁ¤ »þÇã¾ß¸£ ¹«Çϸ¶µå(Muhammad Shaheryar) Çлý(Á¤¼ø±â, ÀÌÁ¾Åà ±³¼ö °øµ¿Áöµµ)ÀÇ ¿¬±¸ ³í¹® ¡®È®»ê ¸ðµ¨¿¡¼ÀÇ ½Å¿ø Á¤º¸ Á¦°Å¸¦ À§ÇÑ ºí·¢È¦ ¸ÞÄ¿´ÏÁò(Black Hole-Driven Identity Absorption in Diffusion Models)¡¯Àº »ý¼ºÇü AI ¸ðµ¨¿¡¼ ƯÁ¤ °³ÀÎ Á¤º¸¸¦ È¿°úÀûÀ¸·Î Á¦°ÅÇÏ´Â »õ·Î¿î ±â¹ýÀ» Á¦¾ÈÇØ °³ÀÎÁ¤º¸ º¸È£ ¹× ¾ó±¼ ºñ½Äº°È ±â¼úÀ» ȹ±âÀûÀ¸·Î Áøº¸Çß´Ù´Â Æò°¡¸¦ ¹Þ¾Ò´Ù.
¶Ç ´Ù¸¥ ¿¬±¸·Î, ¹Ú»ç°úÁ¤ ÇãÂù Çлý(Áöµµ±³¼ö ¹ÚÇý¿µ)°ú ¼®»ç°úÁ¤ È«Á¤ÈÆ Çлý(Áöµµ±³¼ö ¹Ú»óÈ¿)ÀÇ ¿¬±¸ ³í¹® ¡®ºñµð¿À ¼¼ú: ÇÁ·¹ÀÓ ¼öÁØ Ä¸¼ÇÀÇ Á¾ÇÕÀû È°¿ëÀ» ÅëÇÑ ÅؽºÆ®-ºñµð¿À °Ë»ö Çâ»ó(Narrating the Video: Boosting Text-Video Retrieval via Comprehensive Utilization of Frame-Level Captions)¡¯Àº ÅؽºÆ®-ºñµð¿À °Ë»ö(TVR) ºÐ¾ß¿¡¼ »õ·Î¿î Á¤º¸ÀÎ ³»·¹À̼ÇÀ» µµÀÔÇØ SOTA(State-of-the-Art¡¤ÇöÁ¸ ÃÖ°í ¼öÁØÀÇ ¸ðµ¨)º¸´Ù ÇöÀúÇÏ°Ô ³ôÀº ¼º´É Çâ»óÀ» ´Þ¼ºÇß´Ù.
À̹ø ¿¬±¸´Â ´ëÇпø ÄÄÇ»ÅÍÇкΠ4´Ü°è BK21 »ç¾÷ÀÇ ¡®Áö´ÉÀ¶ÇÕ ¼ÒÇÁÆ®¿þ¾î ±³À°¿¬±¸´Ü¡¯ÀÇ Áö¿øÀ» ¹Þ¾Æ ¼öÇàµÆ´Ù. Á¤¼ø±â ±³¼ö´Â ¡°BK21 ±³À°¿¬±¸´ÜÀÇ Áö¼ÓÀûÀÎ ¿¬±¸ Áö¿ø°ú Çù·ÂÀ» ¹ÙÅÁÀ¸·Î ÀÌ·ç¾îÁø ¼º°úÀÌ´Ù. ¿¬±¸ÆÀÀº ¿À´Â CVPR 2025¿¡¼ ¿¬±¸ °á°ú ¹ßÇ¥¸¦ ÁøÇàÇÒ ¿¹Á¤ÀÌ´Ù. À̹ø ¿¬±¸°¡ AI ¹× ÄÄÇ»ÅÍ ºñÀü ºÐ¾ß¿¡¼ Çй®Àû¡¤»ê¾÷ÀûÀ¸·Î Áß¿äÇÑ ±â¿©¸¦ ÇÒ °ÍÀ¸·Î ±â´ëµÈ´Ù.¡±¶ó°í ¹àÇû´Ù.
Àü±âÀüÀÚ±â¼úÀÚÇùȸ(IEEE)¿Í ±¹Á¦ÄÄÇ»ÅͺñÀüÀç´Ü(CVF)ÀÌ 1983³âºÎÅÍ °øµ¿À¸·Î ÁÖÃÖÇÏ´Â CVPRÀº AI ¹× ÄÄÇ»ÅÍ ºñÀü ºÐ¾ß¿¡¼ °¡Àå ¿µÇâ·ÂÀÌ Å« ±¹Á¦Çмú´ëȸ·Î ²ÅÈù´Ù. ±¸±Û, ¾ÖÇÃ, ¾Æ¸¶Á¸, ¸ÞŸ, ¾îµµºñ, ¼Ò´Ï µî ¼¼°èÀûÀÎ IT±â¾÷µéÀÌ ÈÄ¿øÇÏ°í ÀÖ´Ù. À̹ø CVPR 2025´Â ¿À´Â 6¿ù 11ÀϺÎÅÍ 15ÀϱîÁö ¹Ì±¹ ³»½´ºô¿¡¼ °³ÃÖµÉ ¿¹Á¤ÀÌ´Ù.
´ë±¸/ÀÌ¿µÁØ ±âÀÚ newsyjun@naver.com