Æ佺Ÿ´º½º

[´Üµ¶] »çÇÇ¿Â ÇÕº´ ¸®º§¸®¿Â, 'ÆÄÀÌÅäÄ¡ 2.0' °ú ÇÔ²² ±Û·Î¹ú °­ÀÚµÉ °Í

ÀԷ½ð£ | 2024.08.11 17:26 | ±èÇö¾Æ ±âÀÚ chaos@edaily.co.kr
¸®º§¸®¿Â ±èÈ«¼® ÃÖ°í¼ÒÇÁÆ®¿þ¾î¾ÆÅ°ÅØÆ®(CSA)ÀÎÅͺä
MS, ¸ÞŸ, ±¸±Û Ãâ½Å AI¼ÒÇÁÆ®¿þ¾î Àü¹®°¡
MS ´ÙÀÌ·ºÆ®¿¢½º°¡ Å°¿î ¿£ºñµð¾Æ GPU
"ÆÄÀÌÅäÄ¡ »ýÅ°è¿Í ¿Ïº®È÷ °áÇÕÇÒ °Í"
AI ÀÎÇÁ¶ó Çõ½ÅÀ» À̲ô´Â vLLM¡¦¾÷½ºÅ×ÀÌÁö¿Í PoC
[À̵¥Àϸ® ±èÇö¾Æ ITÀü¹®±âÀÚ] ¡°¸®º§¸®¿Â ĨÀÌ ¡®ÆÄÀÌÅäÄ¡(PyTorch) 2.0¡¯À» Áö¿øÇÏ°Ô µÇ¸é, ¸¶Ä¡ ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®(MS)ÀÇ ´ÙÀÌ·ºÆ®¿¢½º(DirectX)°¡ PC ±×·¡ÇÈ ¼º´ÉÀ» ºñ¾àÀûÀ¸·Î Çâ»ó½ÃÄ×´ø °Íó·³, ¸®º§¸®¿ÂÀÇ AI ¹ÝµµÃ¼ »ýÅÂ°è ±¸Ãà¿¡ Å« µµ¿òÀÌ µÉ °ÍÀÔ´Ï´Ù.¡±

¡°MS ´ÙÀÌ·ºÆ®¿¢½º°¡ Å°¿î ¿£ºñµð¾Æ...ÆÄÀÌÅäÄ¡ 2.0°ú ¼ºÀåÇÒ ¸®º§¸®¿Â¡±

±èÈ«¼® ¸®º§¸®¿Â ÃÖ°í ¼ÒÇÁÆ®¿þ¾î ¾ÆÅ°ÅØÆ®(CSA¡¤Chief Software Architect)´Â Áö³­ 7ÀÏ À̵¥Àϸ®¿ÍÀÇ ´Üµ¶ ÀÎÅͺ信¼­ ÅäÁ¾ ½Å°æ¸Áó¸®ÀåÄ¡(NPU) °­Àڷμ­ ¸®º§¸®¿ÂÀÇ ¹Ì·¡¿¡ ¡®ÆÄÀÌÅäÄ¡ 2.0¡¯ÀÌ °¡Áö´Â Àǹ̸¦ ÀÌ·¸°Ô ¼³¸íÇß´Ù.

¡®ÆÄÀÌÅäÄ¡¡¯´Â µö·¯´×À» ±¸ÇöÇϱâ À§ÇÑ ÆÄÀ̽㠱â¹Ý ¿ÀǼҽº ¸Ó½Å·¯´× ¶óÀ̺귯¸®·Î, Áö³­ÇØ 3¿ù AI ÈÆ·Ã ¹× Ãß·Ð ¼º´ÉÀ» Å©°Ô Çâ»ó½ÃŲ 2.0 ¹öÀüÀÌ °ø°³µÆ´Ù.

ÀÌ ¶óÀ̺귯¸®¸¦ ÅëÇØ ÆÄÀÌÅäÄ¡ Ä¿¹Â´ÏƼÀÇ °³¹ßÀÚµéÀº ÀÚ¿¬½º·´°Ô ¸®º§¸®¿Â AI ¹ÝµµÃ¼¸¦ È°¿ëÇØ AI¸¦ °³¹ßÇÒ ¼ö ÀÖ°Ô µÈ´Ù.

ÀÌ´Â MS°¡ ±×·¡ÇȽº ÀÀ¿ëÇÁ·Î±×·¥ÀÎÅÍÆäÀ̽º(API)ÀÎ ´ÙÀÌ·ºÆ®¿¢½º¸¦ ³»³õ¾ÒÀ» ¶§, ¿£ºñµð¾Æ°¡ ÀÌ¿¡ ¸ÂÃç ±×·¡ÇÈó¸®ÀåÄ¡(GPU)¸¦ ¹ßÀü½ÃŲ °Í°ú À¯»çÇÑ °³³äÀÌ´Ù.

±è CSA´Â ¡°¾îÂî º¸¸é ¿£ºñµð¾ÆÀÇ GPU´Â MS°¡ À̲ô´Â ¹æÇâ¿¡ ¸ÂÃç ÇÔ²² ¼ºÀåÇÑ Ãø¸éÀÌ ÀÖ´Ù. ¸®º§¸®¿ÂÀÌ AI Ĩ¿¡ ¡®ÆÄÀÌÅäÄ¡ 2.0¡¯À» µµÀÔÇÏ·Á´Â °Íµµ °°Àº ÀÌÀ¯¡±¶ó°í ¼³¸íÇß´Ù.

[À̵¥Àϸ® ±èÅÂÇü ±âÀÚ] ±èÈ«¼® ¸®º§¸®¿Â ÃÖ°í ¼ÒÇÁÆ®¿þ¾î ¾ÆÅ°ÅØÆ®(CSA)


¸®º§¸®¿ÂÀº ±¹³» ½Å°æ¸Áó¸®ÀåÄ¡(NPU) ¾÷ü Áß¿¡¼­ °¡Àå ºü¸£°Ô Á¦Ç°À» Ãâ½ÃÇÏ°í »ó¿ëÈ­¿¡ ¼º°øÇßÀ¸¸ç, ±â¾÷°¡Ä¡ 9000¾ï ¿øÀ» ÀÎÁ¤¹Þ´Â µî ³ôÀº Æò°¡¸¦ ¹Þ°í ÀÖ´Ù. ±×·¯³ª ±×µ¿¾È ÃÖÁ¾ °í°´ÀÎ ¡®AI ¿£Áö´Ï¾î¡¯ÀÇ °³¹ß ÆíÀǼºÀ» ³ôÀÌ´Â ³ë·ÂÀº »ó´ëÀûÀ¸·Î ´ú ¾Ë·ÁÁ® ÀÖ¾ú´Ù.

¸®º§¸®¿ÂÀº À̹ø ÁÖ SK±×·ìÀÇ »çÇÇ¿ÂÄÚ¸®¾Æ¿ÍÀÇ ÇÕº´À» °ø½Ä ¹ßÇ¥ÇÒ ¿¹Á¤À̸ç, ÇÕº´¹ýÀÎÀÇ ´ëÇ¥´Â ¹Ú¼ºÇö ¸®º§¸®¿Â ´ëÇ¥°¡ ¸Ã°Ô µÈ´Ù. ¶ÇÇÑ, °³¹ß Á¶Á÷Àº ¿ÀÁø¿í CTO¿Í ±èÈ«¼® CSA°¡ ÁÖµµÇÒ ¿¹Á¤ÀÌ´Ù. ÀÌ·Î ÀÎÇØ ¸®º§¸®¿ÂÀÇ AI ¹ÝµµÃ¼ ¼ÒÇÁÆ®¿þ¾î »ýÅ°è Àü·«¿¡ ´ëÇÑ °ü½ÉÀÌ ´õ¿í ÁýÁߵǰí ÀÖ´Ù.

¡°½ºÅ¸Æ®¾÷ ÇÕ·ù ÀÌÀ¯ Áß Çϳªµµ ÆÄÀÌÅäÄ¡ 2.0 ´öºÐ¡±

AI ¹ÝµµÃ¼¿¡¼­ ¼ÒÇÁÆ®¿þ¾î »ýÅ°谡 Áß¿äÇÑ ÀÌÀ¯´Â ³×À̹ö, ÀÎÅÚ, KAIST°¡ Çù·ÂÇØ ¡®AI °øµ¿¿¬±¸¼¾ÅÍ¡¯¸¦ ¼³¸³ÇÏ°í AI ¹ÝµµÃ¼ÀÇ ÃÖÀû ±¸µ¿À» À§ÇÑ ¿ÀǼҽº ÷´Ü ¼ÒÇÁÆ®¿þ¾î¸¦ °³¹ß ÁßÀÎ »ç·Ê¸¸ ºÁµµ Àß ¾Ë ¼ö ÀÖ´Ù. ¾Æ¹«¸® ¶Ù¾î³­ AI ĨÀÌ¶óµµ °³¹ßÀÚµéÀÌ »ç¿ëÇϱ⠺ÒÆíÇÏ´Ù¸é ´ëÁßÈ­µÇ±â ¾î·Æ±â ¶§¹®ÀÌ´Ù.

¸®º§¸®¿ÂÀÌ ¡®ÆÄÀÌÅäÄ¡ 2.0¡¯ »ýÅ°è¿Í ÇÔ²²Çϸé, ¸®º§¸®¿Â AI ¹ÝµµÃ¼¸¦ »ç¿ëÇÏ´Â °³¹ßÀÚµéÀº Çϵå¿þ¾îÀÇ ¼¼ºÎ»çÇ×À» ¸ô¶óµµ ÆÄÀÌÅäÄ¡ 2.0ÀÇ ÀÎÅÍÆäÀ̽º¸¸ ÀÌÇØÇÏ¸é µÇ±â ¶§¹®¿¡ ÈξÀ ´õ Æí¸®ÇØÁø´Ù. ÀÌ´Â ¼º´É ÁÁÀº AI ¼­ºñ½º¸¦ ´õ¿í ½±°í È¿À²ÀûÀ¸·Î °³¹ßÇÒ ¼ö ÀÖ°Ô ÇÑ´Ù´Â Àǹ̴Ù.

±èÈ«¼® ¸®º§¸®¿Â CSA´Â ¡°ÆÄÀÌÅäÄ¡´Â ¸ÞŸ(¿¾ ÆäÀ̽ººÏ)°¡ °³¹ßÇÑ ¶óÀ̺귯¸®Àε¥, 2.0 ¹öÀüÀÌ µÇ¸é¼­ ÆÄÀÌÅäÄ¡·Î ÀÛ¼ºµÈ ¸Ó½Å·¯´× ¸ðµ¨À» ½ÇÁ¦ ¹ÝµµÃ¼¿¡¼­ ÃÖÀûÈ­µÈ ¼º´ÉÀ¸·Î ±¸µ¿ÇÒ ¼ö ÀÖ°Ô µÆ´Ù¡±¸é¼­ ¡°¿£ºñµð¾Æ, AMD µî ºòÅ×Å© ±â¾÷µéµµ ÀÚ»ç Ĩ¿¡ À̸¦ Áö¿øÇÏ·Á ÇÑ´Ù¡±°í ¸»Çß´Ù.

±èÈ«¼® CSA°¡ ½ºÅ¸Æ®¾÷ ¸®º§¸®¿Â¿¡ ÇÕ·ùÇÑ °Íµµ ¡®ÆÄÀÌÅäÄ¡ 2.0¡¯ ´öºÐÀ̾ú´Ù°í ÇÑ´Ù. ±×´Â ¡°ÆÄÀÌÅäÄ¡ 2.0ÀÌ ³ª¿À¸é¼­, ÀÌÁ¦ ½ºÅ¸Æ®¾÷¿¡¼­ ´Ù½Ã ½ÃÀÛÇصµ µÇ°Ú´Ù´Â »ý°¢ÀÌ µé¾ú´Ù¡±°í ¹àÇû´Ù.

¹Ì±¹ ÃâÀå ÁßÀÎ ¹Ú¼ºÇö ¸®º§¸®¿Â ´ëÇ¥µµ ¡°¹Ì±¹¿¡¼­´Â ÀÌÁ¦ ÆÄÀÌÅäÄ¡ 2.0ÀÌ ÁÖ¿ä È­µÎÀε¥, Çѱ¹Àº ¿©ÀüÈ÷ Äí´Ù(CUDA) À̾߱⸸ ÇÏ°í À־ ¾Æ½±´Ù¡±°í ÀüÇß´Ù.

[À̵¥Àϸ® ¹®½Â¿ë ±âÀÚ]


ÀÌ´Þ Áß¼ø ù °á°ú¹°¡¦¡°ÆÄÀÌÅäÄ¡ »ýÅ°è¿Í ¿Ïº® ÅëÇÕµÉ °Í¡±

±èÈ«¼® CSA´Â ¡°ÆÄÀÌÅäÄ¡ 2.0À» Àû¿ëÇÑ Ã¹ °á°ú¹°ÀÌ 8¿ù Áß¼ø ¹ßÇ¥µÉ ¿¹Á¤¡±À̶ó¸ç, ¼¼ °¡Áö ´Ü°è·Î ¼³¸íÇß´Ù.

ù¹ø ° ´Ü°è´Â ¸®º§¸®¿Â ¹ÝµµÃ¼¿¡¼­ ÃÖÀûÈ­µÈ ¸ðµ¨À» ¡®ÅäÄ¡ÄÄÆÄÀÏ(torch compile)¡¯À̶ó´Â API·Î ÀüȯÇØ ¹èÆ÷ÇÏ´Â °ÍÀÌ´Ù. µÎ¹ø °´Â ÆÄÀÌÅäÄ¡ 2.0 À§¿¡ °Å´ë¾ð¾î¸ðµ¨(LLM) Ãß·Ð ÃÖÀûÈ­ ¼Ö·ç¼ÇÀ» ¸¸µé¾î Á¦°øÇÏ´Â °ÍÀ̸ç, ¼Â¹ø °´Â Àü ¼¼°è ¸ðµç »ç¿ëÀÚ°¡ ÆÄÀÌÅäÄ¡ 2.0À» ¼³Ä¡ÇÏ¸é ¸®º§¸®¿ÂÀÇ AI ¹ÝµµÃ¼°¡ ±âº»ÀûÀ¸·Î Áö¿øµÇµµ·Ï ÇÏ´Â °ÍÀ̶ó°í Çß´Ù. ±è CSA´Â ¡°ÀÌ ¸ñÇ¥µéÀÌ ´Þ¼ºµÇ¸é ¸®º§¸®¿ÂÀº ÆÄÀÌÅäÄ¡ »ýÅ°迡 ¿Ïº®È÷ ÅëÇÕµÉ °Í¡±À̶ó°í ¾ð±ÞÇß´Ù.

À̸® µÇ¸é ¸®º§¸®¿ÂÀº ¿£ºñµð¾Æ°¡ MS ¡®´ÙÀÌ·ºÆ®¿¢½º¡¯¿Í ÇÔ²² ±Û·Î¹ú ±×·¡ÇÈó¸®ÀåÄ¡(GPU)ÀÇ °­ÀÚ°¡ µÆµíÀÌ, ÆÄÀÌÅäÄ¡¿Í ÇÔ²² Ãß·Ð¿ë ½Å°æ¸Áó¸®ÀåÄ¡(NPU)ÀÇ ±Û·Î¹ú °­ÀÚ°¡ µÉ ¼ö ÀÖ´Ù´Â ±â´ë´Ù.

[À̵¥Àϸ® ±èÅÂÇü ±âÀÚ] ±èÈ«¼® ¸®º§¸®¿Â ÃÖ°í ¼ÒÇÁÆ®¿þ¾î ¾ÆÅ°ÅØÆ®(CSA)


AI ÀÎÇÁ¶ó Çõ½ÅÀ» À̲ô´Â vLLM¡¦¾÷½ºÅ×ÀÌÁö¿Í ¼º°ø

±èÈ«¼® ¸®º§¸®¿Â ÃÖ°í ¼ÒÇÁÆ®¿þ¾î ¾ÆÅ°ÅØÆ®(CSA)°¡ ÁÖ¸ñÇÏ´Â ¶Ç ´Ù¸¥ ±â¼úÀº ¡®´ÙÀç´Ù´ÉÇÑ °Å´ë¾ð¾î¸ðµ¨(vLLM, Versatile Large Language Models)¡¯ÀÌ´Ù. ÇöÀç ±Û·Î¹ú AI »ýÅ°è´Â AI ÀÎÇÁ¶ó ºñ¿ë(Ĩ, Ŭ¶ó¿ìµå, µ¥ÀÌÅͼ¾ÅÍ µî)À¸·Î ÀÎÇØ Å« ºÎ´ãÀ» °Þ°í ÀÖ´Ù.

ÀÌ·¯ÇÑ »óȲ¿¡¼­ vLLMÀº È¿À²ÀûÀÎ Ã߷аú ¼­ºñ½º¸¦ À§ÇØ ¼³°èµÈ ¶óÀ̺귯¸®·Î, ¸®º§¸®¿ÂÀÌ °³¹ß ÁßÀÎ Ã߷пë AI Ĩ¿¡ »õ·Î¿î °¡´É¼ºÀ» Á¦½ÃÇÏ°í ÀÖ´Ù.

vLLMÀÇ ÀÛµ¿ ¿ø¸®¸¦ »ìÆ캸¸é, »ý¼ºÇü AI´Â ¸í·É¾î ÀÔ·Â ½Ã ÃÖÁ¾ ´äº¯À» »ý¼ºÇϱâ À§ÇØ ¸ðµ¨À» ¹Ýº¹ÀûÀ¸·Î Æ÷¿öµù(ÇнÀ)ÇÏ´Â °úÁ¤¿¡¼­ KV(Key-Value) ij½Ã¸¦ »ý¼ºÇÑ´Ù. ±×·¯³ª vLLMÀ» »ç¿ëÇÏ¸é ¸Å¹ø »õ·Î¿î KV ij½Ã¸¦ ¸¸µéÁö ¾Ê¾Æµµ µÈ´Ù.

±×´Â¡°¸ðµç µ¥ÀÌÅ͸¦ óÀ½ºÎÅÍ º¹±ÍÇÏ°í ¹Ýº¹ÇÏ´Â °ÍÀº ¸¹Àº ºñ¿ë°ú ½Ã°£ÀÌ ¼Ò¸ðµÈ´Ù. ÇÏÁö¸¸ KV °ªÀ» °è»êÇØ À̸¦ ÀçÈ°¿ëÇÏ¸é ¼Óµµ°¡ Å©°Ô Çâ»óµÈ´Ù. À̸¦ ÅëÇØ »õ·Î¿î ÅäÅ«À» »ý¼ºÇÒ ¶§¸¶´Ù ¸Þ¸ð¸®¿¡¼­ µ¥ÀÌÅ͸¦ ´Ù½Ã ºÒ·¯¿À´Â °úÁ¤À» »ý·«ÇÒ ¼ö ÀÖ´Ù. ÀÌ °úÁ¤¿¡¼­ ¹èĪ(batching) ±â¼úµµ »ç¿ëµÇ¸ç, À̸¦ ÅëÇØ Ã³¸® ¼Óµµ¸¦ ³ôÀÌ°í ºñ¿ëÀ» Àý°¨ÇÒ ¼ö ÀÖ´Ù¡±°í ¼³¸íÇß´Ù.

¶ÇÇÑ, ±×´Â ¡°ÀÌ ±â¼úÀº ¼­¿ï´ëÇб³ Àüº´°ï ±³¼ö´Ô(ÇÁ·»µé¸®AI ´ëÇ¥)ÀÌ Ã³À½ ³í¹®À¸·Î Á¦½ÃÇß°í, ¿¬¼Ó ¹èĪ(Iteration Batching) ±â¼úÀ» È°¿ëÇÑ ¼Ö·ç¼Çµµ Ãâ½ÃµÆ´Ù¡±°í µ¡ºÙ¿´´Ù. ÀÌ ±â¼úÀº Ŭ¶ó¿ìµå¿Í °°Àº ½Ã½ºÅÛ ÀÎÇÁ¶ó°¡ ´õ¿í È¿À²ÀûÀ¸·Î AI ÀÛ¾÷À» ¼öÇàÇÒ ¼ö ÀÖµµ·Ï ÃÖÀûÈ­µÈ ¼ÒÇÁÆ®¿þ¾î ±â¼úÀ̸ç, ´Ù¼öÀÇ ÀÌ¿ëÀÚ°¡ AI ¸ðµ¨¿¡ ¿äûÀ» º¸³ÂÀ» ¶§ À̸¦ È¿À²ÀûÀ¸·Î ¹­¾î ó¸®ÇÑ´Ù.

¸®º§¸®¿ÂÀº ÀÌ·¯ÇÑ vLLM °³³äÀ» ¾÷½ºÅ×ÀÌÁöÀÇ ¸ðµ¨¿¡ Á¢¸ñÇØ ÀÚ°Ý °ËÁõ(PoC)À» ÁøÇàÇØ ¼º°øÇϱ⵵ Çß´Ù.

±èÈ«¼® CSA´Â ¡°¾÷½ºÅ×ÀÌÁöÀÇ LLM ¸ðµ¨¿¡ ÀûÀÀÇÏ¿© ÀÚ°Ý °ËÁõÀ» ¸¶Ä¡°í »ó¿ë ¼­ºñ½º¸¦ Áغñ Áß¡±À̶ó¸ç ¡°vLLMÀº ³×À̹ö¿¡¼­µµ ¿¬³» ¿ÀǼҽº·Î °ø°³ÇÒ ¿¹Á¤À̸ç, ÆÄÀÌÅäÄ¡ °³¹ß ÁÖ¿ªÀÌ ¼³¸³ÇÑ ÆÄÀ̾î¿÷½ºAI(Fireworks AI) ¿ª½Ã ÀÌ ±â¼úÀ» ¾²°í ÀÖ´Ù¡±°í ÀüÇß´Ù.

ÆÄÀ̾î¿÷½ºAI´Â ±â¾÷µéÀÌ »ý¼ºÇü AI ¸ðµ¨À» ¸ÂÃãÇüÀ¸·Î ¹èÄ¡Çϰųª ÆÄÀÎÆ©´×ÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÏ´Â AI ½ºÅ¸Æ®¾÷ÀÌ´Ù. ÀÌ È¸»ç´Â Áö³­ 7¿ù ¼¼ÄâÀ̾î ijÇÇÅÐ, ¿£ºñµð¾Æ, AMD, ¸ù°íDB µîÀ¸·ÎºÎÅÍ 5200¸¸ ´Þ·¯(ÇÑÈ­ ¾à 710¾ï ¿ø) ±Ô¸ðÀÇ ½Ã¸®Áî B ÅõÀÚ¸¦ À¯Ä¡ÇßÀ¸¸ç, ´ç½Ã ȸ»ç °¡Ä¡´Â ¾à 5¾ï 2200¸¸ ´Þ·¯(¾à 6857¾ï ¿ø)·Î Æò°¡¹Þ¾Ò´Ù.

[±èÈ«¼® ¸®º§¸®¿Â CSA ¾à·Â]¡âUniversity of Illinois, Urbana-Champaign(UIUC), Computer Science ¹Ú»ç - ¼­¿ï´ëÇб³ Àü±â°øÇкΠÇлç

¡âChief Software Architect (2024.05~) - Engineering Director & Google Korea Site Lead, Google - Software Engineer, Facebook - Software Engineer, Microsoft - Management Consultant, Bain & Company

© Á¾ÇÕ °æÁ¦Á¤º¸ ¹Ìµð¾î À̵¥Àϸ® - »ó¾÷Àû ¹«´ÜÀüÀç & Àç¹èÆ÷ ±ÝÁö

Æ÷·³»çÁø

ÁغñÁßÀÔ´Ï´Ù.

Æ÷·³¿µ»ó

ÁغñÁßÀÔ´Ï´Ù.