[À̵¥Àϸ® ±èÇö¾Æ ITÀü¹®±âÀÚ] ¡°¸®º§¸®¿Â ĨÀÌ ¡®ÆÄÀÌÅäÄ¡(PyTorch) 2.0¡¯À» Áö¿øÇÏ°Ô µÇ¸é, ¸¶Ä¡ ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®(MS)ÀÇ ´ÙÀÌ·ºÆ®¿¢½º(DirectX)°¡ PC ±×·¡ÇÈ ¼º´ÉÀ» ºñ¾àÀûÀ¸·Î Çâ»ó½ÃÄ×´ø °Íó·³, ¸®º§¸®¿ÂÀÇ AI ¹ÝµµÃ¼ »ýÅÂ°è ±¸Ãà¿¡ Å« µµ¿òÀÌ µÉ °ÍÀÔ´Ï´Ù.¡±
¡°MS ´ÙÀÌ·ºÆ®¿¢½º°¡ Å°¿î ¿£ºñµð¾Æ...ÆÄÀÌÅäÄ¡ 2.0°ú ¼ºÀåÇÒ ¸®º§¸®¿Â¡±
±èÈ«¼® ¸®º§¸®¿Â ÃÖ°í ¼ÒÇÁÆ®¿þ¾î ¾ÆÅ°ÅØÆ®(CSA¡¤Chief Software Architect)´Â Áö³ 7ÀÏ À̵¥Àϸ®¿ÍÀÇ ´Üµ¶ ÀÎÅͺ信¼ ÅäÁ¾ ½Å°æ¸Áó¸®ÀåÄ¡(NPU) °Àڷμ ¸®º§¸®¿ÂÀÇ ¹Ì·¡¿¡ ¡®ÆÄÀÌÅäÄ¡ 2.0¡¯ÀÌ °¡Áö´Â Àǹ̸¦ ÀÌ·¸°Ô ¼³¸íÇß´Ù.
¡®ÆÄÀÌÅäÄ¡¡¯´Â µö·¯´×À» ±¸ÇöÇϱâ À§ÇÑ ÆÄÀ̽㠱â¹Ý ¿ÀǼҽº ¸Ó½Å·¯´× ¶óÀ̺귯¸®·Î, Áö³ÇØ 3¿ù AI ÈÆ·Ã ¹× Ãß·Ð ¼º´ÉÀ» Å©°Ô Çâ»ó½ÃŲ 2.0 ¹öÀüÀÌ °ø°³µÆ´Ù.
ÀÌ ¶óÀ̺귯¸®¸¦ ÅëÇØ ÆÄÀÌÅäÄ¡ Ä¿¹Â´ÏƼÀÇ °³¹ßÀÚµéÀº ÀÚ¿¬½º·´°Ô ¸®º§¸®¿Â AI ¹ÝµµÃ¼¸¦ È°¿ëÇØ AI¸¦ °³¹ßÇÒ ¼ö ÀÖ°Ô µÈ´Ù.
ÀÌ´Â MS°¡ ±×·¡ÇȽº ÀÀ¿ëÇÁ·Î±×·¥ÀÎÅÍÆäÀ̽º(API)ÀÎ ´ÙÀÌ·ºÆ®¿¢½º¸¦ ³»³õ¾ÒÀ» ¶§, ¿£ºñµð¾Æ°¡ ÀÌ¿¡ ¸ÂÃç ±×·¡ÇÈó¸®ÀåÄ¡(GPU)¸¦ ¹ßÀü½ÃŲ °Í°ú À¯»çÇÑ °³³äÀÌ´Ù.
±è CSA´Â ¡°¾îÂî º¸¸é ¿£ºñµð¾ÆÀÇ GPU´Â MS°¡ À̲ô´Â ¹æÇâ¿¡ ¸ÂÃç ÇÔ²² ¼ºÀåÇÑ Ãø¸éÀÌ ÀÖ´Ù. ¸®º§¸®¿ÂÀÌ AI Ĩ¿¡ ¡®ÆÄÀÌÅäÄ¡ 2.0¡¯À» µµÀÔÇÏ·Á´Â °Íµµ °°Àº ÀÌÀ¯¡±¶ó°í ¼³¸íÇß´Ù.
 | [À̵¥Àϸ® ±èÅÂÇü ±âÀÚ] ±èÈ«¼® ¸®º§¸®¿Â ÃÖ°í ¼ÒÇÁÆ®¿þ¾î ¾ÆÅ°ÅØÆ®(CSA) |
|
¸®º§¸®¿ÂÀº ±¹³» ½Å°æ¸Áó¸®ÀåÄ¡(NPU) ¾÷ü Áß¿¡¼ °¡Àå ºü¸£°Ô Á¦Ç°À» Ãâ½ÃÇÏ°í »ó¿ëÈ¿¡ ¼º°øÇßÀ¸¸ç, ±â¾÷°¡Ä¡ 9000¾ï ¿øÀ» ÀÎÁ¤¹Þ´Â µî ³ôÀº Æò°¡¸¦ ¹Þ°í ÀÖ´Ù. ±×·¯³ª ±×µ¿¾È ÃÖÁ¾ °í°´ÀÎ ¡®AI ¿£Áö´Ï¾î¡¯ÀÇ °³¹ß ÆíÀǼºÀ» ³ôÀÌ´Â ³ë·ÂÀº »ó´ëÀûÀ¸·Î ´ú ¾Ë·ÁÁ® ÀÖ¾ú´Ù.
¸®º§¸®¿ÂÀº À̹ø ÁÖ SK±×·ìÀÇ »çÇÇ¿ÂÄÚ¸®¾Æ¿ÍÀÇ ÇÕº´À» °ø½Ä ¹ßÇ¥ÇÒ ¿¹Á¤À̸ç, ÇÕº´¹ýÀÎÀÇ ´ëÇ¥´Â ¹Ú¼ºÇö ¸®º§¸®¿Â ´ëÇ¥°¡ ¸Ã°Ô µÈ´Ù. ¶ÇÇÑ, °³¹ß Á¶Á÷Àº ¿ÀÁø¿í CTO¿Í ±èÈ«¼® CSA°¡ ÁÖµµÇÒ ¿¹Á¤ÀÌ´Ù. ÀÌ·Î ÀÎÇØ ¸®º§¸®¿ÂÀÇ AI ¹ÝµµÃ¼ ¼ÒÇÁÆ®¿þ¾î »ýÅ°è Àü·«¿¡ ´ëÇÑ °ü½ÉÀÌ ´õ¿í ÁýÁߵǰí ÀÖ´Ù.
¡°½ºÅ¸Æ®¾÷ ÇÕ·ù ÀÌÀ¯ Áß Çϳªµµ ÆÄÀÌÅäÄ¡ 2.0 ´öºÐ¡±
AI ¹ÝµµÃ¼¿¡¼ ¼ÒÇÁÆ®¿þ¾î »ýÅ°谡 Áß¿äÇÑ ÀÌÀ¯´Â ³×À̹ö, ÀÎÅÚ, KAIST°¡ Çù·ÂÇØ ¡®AI °øµ¿¿¬±¸¼¾ÅÍ¡¯¸¦ ¼³¸³ÇÏ°í AI ¹ÝµµÃ¼ÀÇ ÃÖÀû ±¸µ¿À» À§ÇÑ ¿ÀǼҽº ÷´Ü ¼ÒÇÁÆ®¿þ¾î¸¦ °³¹ß ÁßÀÎ »ç·Ê¸¸ ºÁµµ Àß ¾Ë ¼ö ÀÖ´Ù. ¾Æ¹«¸® ¶Ù¾î³ AI ĨÀÌ¶óµµ °³¹ßÀÚµéÀÌ »ç¿ëÇϱ⠺ÒÆíÇÏ´Ù¸é ´ëÁßȵDZ⠾î·Æ±â ¶§¹®ÀÌ´Ù.
¸®º§¸®¿ÂÀÌ ¡®ÆÄÀÌÅäÄ¡ 2.0¡¯ »ýÅ°è¿Í ÇÔ²²Çϸé, ¸®º§¸®¿Â AI ¹ÝµµÃ¼¸¦ »ç¿ëÇÏ´Â °³¹ßÀÚµéÀº Çϵå¿þ¾îÀÇ ¼¼ºÎ»çÇ×À» ¸ô¶óµµ ÆÄÀÌÅäÄ¡ 2.0ÀÇ ÀÎÅÍÆäÀ̽º¸¸ ÀÌÇØÇÏ¸é µÇ±â ¶§¹®¿¡ ÈξÀ ´õ Æí¸®ÇØÁø´Ù. ÀÌ´Â ¼º´É ÁÁÀº AI ¼ºñ½º¸¦ ´õ¿í ½±°í È¿À²ÀûÀ¸·Î °³¹ßÇÒ ¼ö ÀÖ°Ô ÇÑ´Ù´Â Àǹ̴Ù.
±èÈ«¼® ¸®º§¸®¿Â CSA´Â ¡°ÆÄÀÌÅäÄ¡´Â ¸ÞŸ(¿¾ ÆäÀ̽ººÏ)°¡ °³¹ßÇÑ ¶óÀ̺귯¸®Àε¥, 2.0 ¹öÀüÀÌ µÇ¸é¼ ÆÄÀÌÅäÄ¡·Î ÀÛ¼ºµÈ ¸Ó½Å·¯´× ¸ðµ¨À» ½ÇÁ¦ ¹ÝµµÃ¼¿¡¼ ÃÖÀûÈµÈ ¼º´ÉÀ¸·Î ±¸µ¿ÇÒ ¼ö ÀÖ°Ô µÆ´Ù¡±¸é¼ ¡°¿£ºñµð¾Æ, AMD µî ºòÅ×Å© ±â¾÷µéµµ ÀÚ»ç Ĩ¿¡ À̸¦ Áö¿øÇÏ·Á ÇÑ´Ù¡±°í ¸»Çß´Ù.
±èÈ«¼® CSA°¡ ½ºÅ¸Æ®¾÷ ¸®º§¸®¿Â¿¡ ÇÕ·ùÇÑ °Íµµ ¡®ÆÄÀÌÅäÄ¡ 2.0¡¯ ´öºÐÀ̾ú´Ù°í ÇÑ´Ù. ±×´Â ¡°ÆÄÀÌÅäÄ¡ 2.0ÀÌ ³ª¿À¸é¼, ÀÌÁ¦ ½ºÅ¸Æ®¾÷¿¡¼ ´Ù½Ã ½ÃÀÛÇصµ µÇ°Ú´Ù´Â »ý°¢ÀÌ µé¾ú´Ù¡±°í ¹àÇû´Ù.
¹Ì±¹ ÃâÀå ÁßÀÎ ¹Ú¼ºÇö ¸®º§¸®¿Â ´ëÇ¥µµ ¡°¹Ì±¹¿¡¼´Â ÀÌÁ¦ ÆÄÀÌÅäÄ¡ 2.0ÀÌ ÁÖ¿ä ȵÎÀε¥, Çѱ¹Àº ¿©ÀüÈ÷ Äí´Ù(CUDA) À̾߱⸸ ÇÏ°í ÀÖ¾î¼ ¾Æ½±´Ù¡±°í ÀüÇß´Ù.
 | [À̵¥Àϸ® ¹®½Â¿ë ±âÀÚ] |
|
ÀÌ´Þ Áß¼ø ù °á°ú¹°¡¦¡°ÆÄÀÌÅäÄ¡ »ýÅ°è¿Í ¿Ïº® ÅëÇÕµÉ °Í¡±
±èÈ«¼® CSA´Â ¡°ÆÄÀÌÅäÄ¡ 2.0À» Àû¿ëÇÑ Ã¹ °á°ú¹°ÀÌ 8¿ù Áß¼ø ¹ßÇ¥µÉ ¿¹Á¤¡±À̶ó¸ç, ¼¼ °¡Áö ´Ü°è·Î ¼³¸íÇß´Ù.
ù¹ø ° ´Ü°è´Â ¸®º§¸®¿Â ¹ÝµµÃ¼¿¡¼ ÃÖÀûÈµÈ ¸ðµ¨À» ¡®ÅäÄ¡ÄÄÆÄÀÏ(torch compile)¡¯À̶ó´Â API·Î ÀüȯÇØ ¹èÆ÷ÇÏ´Â °ÍÀÌ´Ù. µÎ¹ø °´Â ÆÄÀÌÅäÄ¡ 2.0 À§¿¡ °Å´ë¾ð¾î¸ðµ¨(LLM) Ãß·Ð ÃÖÀûÈ ¼Ö·ç¼ÇÀ» ¸¸µé¾î Á¦°øÇÏ´Â °ÍÀ̸ç, ¼Â¹ø °´Â Àü ¼¼°è ¸ðµç »ç¿ëÀÚ°¡ ÆÄÀÌÅäÄ¡ 2.0À» ¼³Ä¡ÇÏ¸é ¸®º§¸®¿ÂÀÇ AI ¹ÝµµÃ¼°¡ ±âº»ÀûÀ¸·Î Áö¿øµÇµµ·Ï ÇÏ´Â °ÍÀ̶ó°í Çß´Ù. ±è CSA´Â ¡°ÀÌ ¸ñÇ¥µéÀÌ ´Þ¼ºµÇ¸é ¸®º§¸®¿ÂÀº ÆÄÀÌÅäÄ¡ »ýÅ°迡 ¿Ïº®È÷ ÅëÇÕµÉ °Í¡±À̶ó°í ¾ð±ÞÇß´Ù.
À̸® µÇ¸é ¸®º§¸®¿ÂÀº ¿£ºñµð¾Æ°¡ MS ¡®´ÙÀÌ·ºÆ®¿¢½º¡¯¿Í ÇÔ²² ±Û·Î¹ú ±×·¡ÇÈó¸®ÀåÄ¡(GPU)ÀÇ °ÀÚ°¡ µÆµíÀÌ, ÆÄÀÌÅäÄ¡¿Í ÇÔ²² Ãß·Ð¿ë ½Å°æ¸Áó¸®ÀåÄ¡(NPU)ÀÇ ±Û·Î¹ú °ÀÚ°¡ µÉ ¼ö ÀÖ´Ù´Â ±â´ë´Ù.
 | [À̵¥Àϸ® ±èÅÂÇü ±âÀÚ] ±èÈ«¼® ¸®º§¸®¿Â ÃÖ°í ¼ÒÇÁÆ®¿þ¾î ¾ÆÅ°ÅØÆ®(CSA) |
|
AI ÀÎÇÁ¶ó Çõ½ÅÀ» À̲ô´Â vLLM¡¦¾÷½ºÅ×ÀÌÁö¿Í ¼º°ø
±èÈ«¼® ¸®º§¸®¿Â ÃÖ°í ¼ÒÇÁÆ®¿þ¾î ¾ÆÅ°ÅØÆ®(CSA)°¡ ÁÖ¸ñÇÏ´Â ¶Ç ´Ù¸¥ ±â¼úÀº ¡®´ÙÀç´Ù´ÉÇÑ °Å´ë¾ð¾î¸ðµ¨(vLLM, Versatile Large Language Models)¡¯ÀÌ´Ù. ÇöÀç ±Û·Î¹ú AI »ýÅ°è´Â AI ÀÎÇÁ¶ó ºñ¿ë(Ĩ, Ŭ¶ó¿ìµå, µ¥ÀÌÅͼ¾ÅÍ µî)À¸·Î ÀÎÇØ Å« ºÎ´ãÀ» °Þ°í ÀÖ´Ù.
ÀÌ·¯ÇÑ »óȲ¿¡¼ vLLMÀº È¿À²ÀûÀÎ Ã߷аú ¼ºñ½º¸¦ À§ÇØ ¼³°èµÈ ¶óÀ̺귯¸®·Î, ¸®º§¸®¿ÂÀÌ °³¹ß ÁßÀÎ Ã߷пë AI Ĩ¿¡ »õ·Î¿î °¡´É¼ºÀ» Á¦½ÃÇÏ°í ÀÖ´Ù.
vLLMÀÇ ÀÛµ¿ ¿ø¸®¸¦ »ìÆ캸¸é, »ý¼ºÇü AI´Â ¸í·É¾î ÀÔ·Â ½Ã ÃÖÁ¾ ´äº¯À» »ý¼ºÇϱâ À§ÇØ ¸ðµ¨À» ¹Ýº¹ÀûÀ¸·Î Æ÷¿öµù(ÇнÀ)ÇÏ´Â °úÁ¤¿¡¼ KV(Key-Value) ij½Ã¸¦ »ý¼ºÇÑ´Ù. ±×·¯³ª vLLMÀ» »ç¿ëÇÏ¸é ¸Å¹ø »õ·Î¿î KV ij½Ã¸¦ ¸¸µéÁö ¾Ê¾Æµµ µÈ´Ù.
±×´Â¡°¸ðµç µ¥ÀÌÅ͸¦ óÀ½ºÎÅÍ º¹±ÍÇÏ°í ¹Ýº¹ÇÏ´Â °ÍÀº ¸¹Àº ºñ¿ë°ú ½Ã°£ÀÌ ¼Ò¸ðµÈ´Ù. ÇÏÁö¸¸ KV °ªÀ» °è»êÇØ À̸¦ ÀçÈ°¿ëÇÏ¸é ¼Óµµ°¡ Å©°Ô Çâ»óµÈ´Ù. À̸¦ ÅëÇØ »õ·Î¿î ÅäÅ«À» »ý¼ºÇÒ ¶§¸¶´Ù ¸Þ¸ð¸®¿¡¼ µ¥ÀÌÅ͸¦ ´Ù½Ã ºÒ·¯¿À´Â °úÁ¤À» »ý·«ÇÒ ¼ö ÀÖ´Ù. ÀÌ °úÁ¤¿¡¼ ¹èĪ(batching) ±â¼úµµ »ç¿ëµÇ¸ç, À̸¦ ÅëÇØ Ã³¸® ¼Óµµ¸¦ ³ôÀÌ°í ºñ¿ëÀ» Àý°¨ÇÒ ¼ö ÀÖ´Ù¡±°í ¼³¸íÇß´Ù.
¶ÇÇÑ, ±×´Â ¡°ÀÌ ±â¼úÀº ¼¿ï´ëÇб³ Àüº´°ï ±³¼ö´Ô(ÇÁ·»µé¸®AI ´ëÇ¥)ÀÌ Ã³À½ ³í¹®À¸·Î Á¦½ÃÇß°í, ¿¬¼Ó ¹èĪ(Iteration Batching) ±â¼úÀ» È°¿ëÇÑ ¼Ö·ç¼Çµµ Ãâ½ÃµÆ´Ù¡±°í µ¡ºÙ¿´´Ù. ÀÌ ±â¼úÀº Ŭ¶ó¿ìµå¿Í °°Àº ½Ã½ºÅÛ ÀÎÇÁ¶ó°¡ ´õ¿í È¿À²ÀûÀ¸·Î AI ÀÛ¾÷À» ¼öÇàÇÒ ¼ö ÀÖµµ·Ï ÃÖÀûÈµÈ ¼ÒÇÁÆ®¿þ¾î ±â¼úÀ̸ç, ´Ù¼öÀÇ ÀÌ¿ëÀÚ°¡ AI ¸ðµ¨¿¡ ¿äûÀ» º¸³ÂÀ» ¶§ À̸¦ È¿À²ÀûÀ¸·Î ¹¾î ó¸®ÇÑ´Ù.
¸®º§¸®¿ÂÀº ÀÌ·¯ÇÑ vLLM °³³äÀ» ¾÷½ºÅ×ÀÌÁöÀÇ ¸ðµ¨¿¡ Á¢¸ñÇØ ÀÚ°Ý °ËÁõ(PoC)À» ÁøÇàÇØ ¼º°øÇϱ⵵ Çß´Ù.
±èÈ«¼® CSA´Â ¡°¾÷½ºÅ×ÀÌÁöÀÇ LLM ¸ðµ¨¿¡ ÀûÀÀÇÏ¿© ÀÚ°Ý °ËÁõÀ» ¸¶Ä¡°í »ó¿ë ¼ºñ½º¸¦ Áغñ Áß¡±À̶ó¸ç ¡°vLLMÀº ³×À̹ö¿¡¼µµ ¿¬³» ¿ÀǼҽº·Î °ø°³ÇÒ ¿¹Á¤À̸ç, ÆÄÀÌÅäÄ¡ °³¹ß ÁÖ¿ªÀÌ ¼³¸³ÇÑ ÆÄÀ̾î¿÷½ºAI(Fireworks AI) ¿ª½Ã ÀÌ ±â¼úÀ» ¾²°í ÀÖ´Ù¡±°í ÀüÇß´Ù.
ÆÄÀ̾î¿÷½ºAI´Â ±â¾÷µéÀÌ »ý¼ºÇü AI ¸ðµ¨À» ¸ÂÃãÇüÀ¸·Î ¹èÄ¡Çϰųª ÆÄÀÎÆ©´×ÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÏ´Â AI ½ºÅ¸Æ®¾÷ÀÌ´Ù. ÀÌ È¸»ç´Â Áö³ 7¿ù ¼¼ÄâÀ̾î ijÇÇÅÐ, ¿£ºñµð¾Æ, AMD, ¸ù°íDB µîÀ¸·ÎºÎÅÍ 5200¸¸ ´Þ·¯(ÇÑÈ ¾à 710¾ï ¿ø) ±Ô¸ðÀÇ ½Ã¸®Áî B ÅõÀÚ¸¦ À¯Ä¡ÇßÀ¸¸ç, ´ç½Ã ȸ»ç °¡Ä¡´Â ¾à 5¾ï 2200¸¸ ´Þ·¯(¾à 6857¾ï ¿ø)·Î Æò°¡¹Þ¾Ò´Ù.
[±èÈ«¼® ¸®º§¸®¿Â CSA ¾à·Â]¡âUniversity of Illinois, Urbana-Champaign(UIUC), Computer Science ¹Ú»ç - ¼¿ï´ëÇб³ Àü±â°øÇкΠÇлç
¡âChief Software Architect (2024.05~) - Engineering Director & Google Korea Site Lead, Google - Software Engineer, Facebook - Software Engineer, Microsoft - Management Consultant, Bain & Company
© Á¾ÇÕ °æÁ¦Á¤º¸ ¹Ìµð¾î À̵¥Àϸ® - »ó¾÷Àû ¹«´ÜÀüÀç & Àç¹èÆ÷ ±ÝÁö