½Ç½Ã°£À¸·Î ±âħ ¼Ò¸®¿Í ±âħ Ƚ¼ö, ȯÀÚÀÇ À§Ä¡¿Í ±â·ÏÀÌ °¡´ÉÇÑ Á¤È®µµ 87%
KAIST ¹Ú¿ëÈ ±³¼ö ¿¬±¸ÆÀ, Äڷγª19 µî ¼¼°èÀû À¯ÇິÀÇ Á¶±â °¨Áö ȯÀÚÄ¡·á
(ÁÂÃøºÎÅÍ) ¹Ú¿ëÈ ±³¼ö (KAIST), ±è¿µ±â ´ëÇ¥ (¿¡½º¿¥ÀνºÆ®·ç¸ÕÆ®), ÀÌ°æÅ ¹Ú»ç°úÁ¤, ±è¼ºÈÄ ¹Ú»ç°úÁ¤, ³²Çö¿í ¹Ú»ç°úÁ¤ (KAIST) |
¼¼°èÀû À¯Ç༺ Àü¿°º´ÀÎ Äڷγª19°¡ ÃÖ±Ù ¹Ì±¹·Áß±¹·À¯·´ µî ¼¼°è °¢±¹¿¡¼ ÀçÈ®»êµÇ´Â Ãß¼¼·Î Á¢¾îµé¸é¼ ºñÁ¢Ã˹æ½ÄÀ¸·Î Àü¿°º´À» °¨ÁöÇÏ´Â ±â¼ú¿¡ ´ëÇÑ ¼ö¿ä°¡ Áõ°¡ÇÏ°í ÀÖ´Ù. Áõ»óÀÌ ¹ß¿°ú ±âħÀε¥, ÇöÀç ¹ß¿Àº ¿È»ó Ä«¸Þ¶ó¸¦ ÀÌ¿ëÇØ Á÷Á¢ Á¢ÃËÀ» ÇÏÁö ¾Ê°íµµ ü¿ÂÀ» ½±°Ô ÆǺ°ÇÒ ¼ö ÀÖ´Â ½Ã½ºÅÛ ¿¬±¸°¡ È°¹ßÇÏ°Ô ÁøÇàµÇ°í ÀÖ´Ù.
KAIST(Çѱ¹°úÇбâ¼ú¿ø) ±â°è°øÇаú ¹Ú¿ëÈ ±³¼ö ¿¬±¸ÆÀÀº ¢ß¿¡½º¿¥ ÀνºÆ®·ç¸ÕÆ®¿Í °øµ¿À¸·Î ½Ç½Ã°£À¸·Î ±âħ ¼Ò¸®¸¦ ÀνÄÇÏ°í ±âħÇÏ´Â »ç¶÷ÀÇ À§Ä¡¸¦ À̹ÌÁö·Î Ç¥½ÃÇØÁÖ´Â `±âħ ÀÎ½Ä Ä«¸Þ¶ó'¸¦ °³¹ßÇß´Ù°í 3ÀÏ ¹àÇû´Ù.
Äڷγª19ÀÇ ´ëÇ¥ÀûÀÎ Áõ»óÀÌ ¹ß¿°ú ±âħÀε¥, ÇöÀç ¹ß¿Àº ¿È»ó Ä«¸Þ¶ó¸¦ ÀÌ¿ëÇØ Á÷Á¢ Á¢ÃËÀ» ÇÏÁö ¾Ê°íµµ ü¿ÂÀ» ½±°Ô ÆǺ°ÇÒ ¼ö ÀÖ´Ù. ¹®Á¦´Â ºñÁ¢Ã˹æ½ÄÀ¸·Î´Â ±âħÇÏ´Â »ç¶÷ÀÇ Áõ»óÀ» ½±»ç¸® ÆľÇÇϱ⠾î·Æ´Ù´Â Á¡ÀÌ´Ù. ¹Ú ±³¼ö ¿¬±¸ÆÀÀº ÀÌ·± ¹®Á¦¸¦ ÇØ°áÇϱâ À§ÇØ ±âħ ¼Ò¸®¸¦ ½Ç½Ã°£À¸·Î ÀνÄÇÏ´Â µö·¯´× ±â¹ÝÀÇ ±âħ ÀÎ½Ä ¸ðµ¨À» °³¹ßÇß´Ù.
ÇÕ¼º°ö ½Å°æ¸Á ±â¹ÝÀÇ ±âħ ÀÎ½Ä ¸ðµ¨ ±¸Á¶ |
±âħ ÀÎ½Ä ¸ðµ¨ÀÇ ÇнÀÀ» À§ÇØ »ç¿ëµÈ À½Çâ Ư¡ÀÇ ¿¹½Ã |
¿¬±¸ÆÀÀº ¶Ç ¿È»ó Ä«¸Þ¶ó¿Í °°Àº ¿ø¸®·Î ±âħ ¼Ò¸®¿Í ±âħÇÏ´Â »ç¶÷ÀÇ ½Ã°¢È¸¦ À§ÇØ ±âħ ÀÎ½Ä ¸ðµ¨À» À½Çâ Ä«¸Þ¶ó¿¡ Àû¿ë, ±âħ ¼Ò¸®¿Í ±âħÇÏ´Â »ç¶÷ÀÇ À§Ä¡, ½ÉÁö¾î ±âħ Ƚ¼ö±îÁö¸¦ ½Ç½Ã°£À¸·Î ÃßÀûÇÏ°í ±â·ÏÀÌ °¡´ÉÇÑ `±âħ ÀÎ½Ä Ä«¸Þ¶ó'¸¦ °³¹ßÇß´Ù.
¿¬±¸ÆÀÀº ±âħ ÀÎ½Ä Ä«¸Þ¶ó°¡ »ç¶÷ÀÌ ¹ÐÁýÇÑ °ø°øÀå¼Ò¿¡¼ Àü¿°º´ÀÇ À¯ÇàÀ» °¨ÁöÇϰųª º´¿ø¿¡¼ ȯÀÚÀÇ »óŸ¦ »ó½Ã ¸ð´ÏÅ͸µ °¡´ÉÇÑ ÀÇ·á¿ë Àåºñ·Î È°¿ëµÉ °ÍÀ¸·Î ±â´ëÇÏ°í ÀÖ´Ù.
¿¬±¸ÁøÀº ±âħ ÀÎ½Ä ¸ðµ¨ °³¹ßÀ» À§ÇØ *ÇÕ¼º °ö ½Å°æ¸Á(convolutional neural network, CNN)À» ±â¹ÝÀ¸·Î *ÁöµµÇнÀ(supervised learning)À» Àû¿ëÇß´Ù. 1ÃÊ ±æÀÌ À½Çâ½ÅÈ£ÀÇ Æ¯Â¡(feature)À» ÀÔ·Â ½ÅÈ£·Î ¹Þ¾Æ, 1(±âħ) ¶Ç´Â 0(±× ¿Ü)ÀÇ 2Áø ½ÅÈ£¸¦ Ãâ·ÂÇÏ°í ÇнÀ·üÀÇ ÃÖÀûȸ¦ À§ÇØ ÀÏÁ¤ ±â°£ ÇнÀ·üÀÌ Á¤Ã¼µÇ¸é ÇнÀ·ü °ªÀ» ³·Ãßµµ·Ï ¼³Á¤Çß´Ù.
¿¬±¸ÁøÀº ±âħ ÀÎ½Ä ¸ðµ¨ÀÇ ÈÆ·Ã ¹× Æò°¡¸¦ À§ÇØ ±¸±Û°ú À¯Æ©ºê µî¿¡¼ ¿¬±¸¿ëÀ¸·Î È°¹ßÈ÷ »ç¿ë ÁßÀÎ °ø°³ À½¼ºµ¥ÀÌÅÍ ¼¼Æ®ÀÎ `¿Àµð¿À¼¼Æ®(Audioset)'¸¦ ºñ·ÔÇØ `µð¸Çµå(DEMAND)'¿Í `ÀÌƼ¿¡½º¾ÆÀÌ(ETSI)', `Ƽ¹ÌÆ®(TIMIT)' µî¿¡¼ µ¥ÀÌÅÍ ¼¼Æ®¸¦ ¼öÁýÇß´Ù. ÀÌ Áß `¿Àµð¿À¼¼Æ®'´Â ÈÆ·Ã ¹× Æò°¡ µ¥ÀÌÅÍ ¼¼Æ® ±¸¼ºÀ» À§ÇØ »ç¿ëÇß°í ´Ù¸¥ µ¥ÀÌÅÍ ¼¼Æ®ÀÇ °æ¿ì ±âħ ÀÎ½Ä ¸ðµ¨ÀÌ ´Ù¾çÇÑ ¹è°æ ¼ÒÀ½À» ÇнÀÇÒ ¼ö ÀÖµµ·Ï µ¥ÀÌÅÍ Áõ°(data augmentation)À» À§ÇÑ ¹è°æ ¼ÒÀ½À¸·Î »ç¿ëÇß´Ù.
¢Ñ ÇÕ¼º °ö ½Å°æ¸Á(convolutional neural network): ½Ã°¢Àû À̹ÌÁö¸¦ ºÐ¼®ÇÏ´Â µ¥ »ç¿ëµÇ´Â Àΰø½Å°æ¸Á(»ý¹°ÇÐÀÇ ½Å°æ¸Á¿¡¼ ¿µ°¨À» ¾òÀº Åë°èÇÐÀû ÇнÀ ¾Ë°í¸®Áò)ÀÇ ÇÑ Á¾·ù
¢Ñ ÁöµµÇнÀ(Supervised Learning): ÈÆ·Ã µ¥ÀÌÅÍ(Training Data)·ÎºÎÅÍ ÇϳªÀÇ ÇÔ¼ö¸¦ À¯ÃßÇس»±â À§ÇÑ ±â°è ÇнÀ(Machine Learning)ÀÇ ÇÑ ¹æ¹ý
±âħ ÀÎ½Ä Ä«¸Þ¶óÀÇ ¿ÜÇü ¹× ½Åȣó¸® ºí·Ï¼±µµ |
±âħ ÀÎ½Ä Ä«¸Þ¶óÀÇ ¿ÜÇü ¹× ½Åȣó¸® ºí·Ï¼±µµ |
µ¥ÀÌÅÍ Áõ°À» À§ÇØ ¹è°æ ¼ÒÀ½À» 15%~75%ÀÇ ºñÀ²·Î `¿Àµð¿À¼¼Æ®'¿¡ ¼¯Àº ÈÄ, ´Ù¾çÇÑ °Å¸®¿¡ ÀûÀÀÇÒ ¼ö ÀÖ°Ô À½·®À» 0.25~1.0¹è·Î Á¶Á¤Çß´Ù. ÈÆ·Ã ¹× Æò°¡ µ¥ÀÌÅÍ ¼¼Æ®´Â Áõ°µÈ µ¥ÀÌÅÍ ¼¼Æ®¸¦ 9:1 ºñÀ²·Î ³ª´² ±¸¼ºÇßÀ¸¸ç, ½ÃÇè µ¥ÀÌÅÍ ¼¼Æ®´Â µû·Î »ç¹«½Ç¿¡¼ ³ìÀ½ÇÑ °ÍÀ» »ç¿ëÇß´Ù.
¸ðµ¨ ÃÖÀûȸ¦ À§Çؼ´Â `½ºÆåÆ®·Î±×·¥(spectrogram)' µî 5°³ÀÇ À½Çâ Ư¡°ú 7°³ÀÇ ÃÖÀûÈ ±â±â(optimizer)¸¦ »ç¿ëÇØ ÇнÀÀ» ÁøÇàÇÏ°í ½ÃÇè µ¥ÀÌÅÍ ¼¼Æ®ÀÇ Á¤È®µµ¸¦ ÃøÁ¤, ¼º´ÉÀ» È®ÀÎÇÑ °á°ú 87.4%ÀÇ ½ÃÇè Á¤È®µµ¸¦ ¾òÀ» ¼ö ÀÖ¾ú´Ù.
¿¬±¸ÁøÀº À̾î ÇнÀµÈ ±âħ ÀÎ½Ä ¸ðµ¨À» ¼Ò¸®¸¦ ¼öÁýÇÏ´Â ¸¶ÀÌÅ©·ÎÆù ¾î·¹ÀÌ¿Í Ä«¸Þ¶ó ¸ðµâ·Î ±¸¼ºµÇ´Â À½Çâ Ä«¸Þ¶ó¿¡ Àû¿ëÇß´Ù. ±× °á°ú ¼öÁýµÈ µ¥ÀÌÅÍ´Â À½¿øÀÇ À§Ä¡¸¦ °è»êÇÏ´Â ºö Çü¼º °úÁ¤À» °ÅÃÄ ±âħ ÀÎ½Ä ¸ðµ¨ÀÌ ±âħ ¼Ò¸®·Î ÀνÄÇÒ °æ¿ì ±âħ ¼Ò¸®°¡ ³ À§Ä¡¿¡ ±âħ ¼Ò¸®ÀÓÀ» ³ªÅ¸³»´Â µî°í¼±°ú ¶óº§ÀÌ °¢°¢ Ç¥½ÃµÈ´Ù.
¹Ú ±³¼öÆÀÀº ¸¶Áö¸· ´Ü°è·Î ±âħ ÀÎ½Ä Ä«¸Þ¶óÀÇ ¿¹ºñ Å×½ºÆ®¸¦ ÁøÇàÇÑ °á°ú, ¿©·¯ ÀâÀ½ ȯ°æ¿¡¼µµ ±âħ ¼Ò¸®¿Í ±× ÀÌ¿ÜÀÇ ¼Ò¸®·Î ±¸ºÐÀÌ °¡´ÉÇÏ¸ç ±âħÇÏ´Â »ç¶÷°ú ±× »ç¶÷ÀÇ À§Ä¡, Ƚ¼ö µîÀ» ½Ç½Ã°£À¸·Î ÃßÀûÇØ ÇöÀå¿¡¼ÀÇ Àû¿ë °¡´É¼ºÀ» È®ÀÎÇß´Ù. ¿¬±¸ÆÀÀº ÃßÈÄ º´¿ø µî ½Ç»ç¿ë ȯ°æ¿¡¼ Ãß°¡ ÇнÀÀÌ ÀÌ·ïÁø´Ù¸é Á¤È®µµ´Â 87.4%º¸´Ù ´õ ³ô¾ÆÁú °ÍÀ¸·Î ±â´ëÇÏ°í ÀÖ´Ù.
¹Ú¿ëÈ ±³¼ö´Â "Äڷγª19°¡ Áö¼ÓÀûÀ¸·Î ÀüÆĵǰí ÀÖ´Â »óȲ¿¡¼ °ø°øÀå¼Ò¿Í ´Ù¼ö ¹ÐÁý ½Ã¼³¿¡ ±âħ ÀÎ½Ä Ä«¸Þ¶ó¸¦ È°¿ëÇϸé Àü¿°º´ÀÇ ¹æ¿ª ¹× Á¶±â °¨Áö¿¡ Å« µµ¿òÀÌ µÉ °ÍˮÀ̶ó°í ¸»Çß´Ù. ¹Ú ±³¼ö´Â À̾î "ƯÈ÷ º´½Ç¿¡ Àû¿ëÇϸé ȯÀÚÀÇ »óŸ¦ 24½Ã°£ ±â·ÏÇØ Ä¡·á¿¡ È°¿ëÇÒ ¼ö Àֱ⠶§¹®¿¡ ÀÇ·áÁøÀÇ ¼ö°í¸¦ ÁÙÀÌ°í ȯÀÚ »óŸ¦ ´õ Á¤¹ÐÇÏ°Ô ÆľÇÇÒ ¼ö ÀÖÀ» °Íˮ À̶ó°í °Á¶Çß´Ù.
ÇÑÆí, À̹ø ¿¬±¸´Â ¿¡³ÊÁö±â¼úÆò°¡¿ø(»ê¾÷Åë»óÀÚ¿øºÎ)ÀÇ Áö¿øÀ» ¹Þ¾Æ ¼öÇàµÆ´Ù.
KAIST È«º¸½Ç Á¦°ø
³ëº§»çÀ̾𽺠science@nobelscience.co.kr
<ÀúÀÛ±ÇÀÚ © ³ëº§»çÀ̾ð½º, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö>