강화학습 기초 및 6G 응용 강좌

시간	주제	요약	발표자
1일차 (7/22, 목요일)
09:00~12:30	좌장 : 주창희 교수(고려대)
09:00~10:30	강화학습기초(1)	본 강연에서는 강화학습의 개념과 프레임워크를 이해하고 관련된 기 초 개념을 소개하고자한다. 가장 기본이 되는 모델인 multi-armed bandit과 Markov decision process를 중심으로 그 수학적인 정의 와, 강화학습의 실제응용에서는 모델이 어떻게 응용될 수 있는지 그 원리를 소개한다. 더불어 강화학습의 planning과 learning에 기본이 되는 알고리즘과 작동원리를 설명하고, 이 과정에서 exploration과 exploitation 사이의 최적 균형과 같은 원로적인 수학개념들을 다양 한 예제와 함께 쉽게 풀어보고자 한다.	옥정슬 교수(포항공대) - 포항공과대학교 컴퓨터공학과/인공지능대학원 조 교수 (2019-현재) - University of Washington 박사후 연구원 (2018-2019) - KTH Royal Institute of Technology 박사후연구원 (2017-2018) - KAIST 전기및전자공학과 박사 (2016) - KAIST 전기및전자공학과 학사 (2011)
10:30~11:00	휴식
11:00~12:30	강화학습기초 (2)
12:30~13:30	휴식
13:30~17:00	좌장 : 옥정슬 교수(포항공대)
13:30~15:00	심층강화학습 (1)	본 강연에서 심층강화학습의 개념과 관련된 기초를 소개하고자 한다. 강화학습의 feedback 특성에 따라 value 함수근사화를 위해 뉴럴네트워크가 도입되었고, 이를 활용하여 강화학습을 효과적으로 진행하기 위해 개발된 기초적인 방법들을 소개한다. 더불어 Policy 학습을 위해 사용되는 기법들을 설명하고, 이 과정에서 도입된 기술들을 살펴본다.	주창희 교수(고려대) - 고려대학교 컴퓨터학과 교수 (2019-현재) - 울산과학기술원 전기컴퓨터공학과 부교수 (2011-2019) - 한국기술교육대학교 조교수 (2010-2011) - 미국 오하이오주립대학교 Research Scientist (2007-2010) - 미국 퍼듀대학교 박사후 연구원 (2005-2007) - 서울대학교 전기공학부 박사 (2005)
15:00~15:30	휴식
15:30~17:00	심층강화학습 (2)
2일차 (7/23, 금요일)
09:00~12:30	좌장 : 주창희 교수(고려대)
09:00~10:30	공중망에서의 강화학습 연구동향	본 강의에서는 UAV등과 같은 자율 비지상망에서의 다양한 강화학습 알고리즘의 적용과 응용에 대해서 알아본다. UAV등과 같은 자율 비지 상망은 특정 인프라를 사용하는 경우와 그렇지 않은 경우로 나뉘게 되 며 각각 강화학습이 활용되는 양상이, single-agent와 multi-agent 혹은 centralized와 distributed등 다양하게 나뉘게 되고 그 목적도 다 양하다. 따라서 이러한 상황에서 강화학습이 적용되는 다양한 사례에 대해서 알아보고 향후 발전 방향에 대해서 논한다.	김중헌 교수 (고려대) - 고려대학교 전기전자공학부 부교수 (2019-현재) - 중앙대학교 소프트웨어대학 조교수 (2016-2019) - 인텔 실리콘밸리 본사연구소, Systems Engineer (2013-2016) - University of Southern California, Computer Science, 박사 (2013) - LG전자 CTO부문 멀티미디어연구소 주임연구원 (2006-2009) - 고려대학교 컴퓨터학과 이학석사 (2006) - 고려대학교 컴퓨터학과 이학사 (2004)
10:30~11:00	휴식
11:00~12:30	위성기반 비지상망에서의 강화학습 연구동향	본 강의에서는 UAV등과 더불어 대표적으로 최근 많이 논의되는 비지 상망 네트워크인 LEO위성망에서의 Satellite-Air-Ground Integrated Networks (SAGIN)에서 강화학습의 활용에 대한 현재 기술동향에 대 해서 알아본다. 해당 기술은 완전 분산형 기술부터 다양한 알고리즘이 사용되고 있으며 그 목적 또한 다양한다. 더불어 위성, UAV, 그리고 지 상망등 다양한 네트워크 구성 요소에서 강화학습이 이용되는 동향에 대해서 알아보고 향후 발전 방향에 대해서도 함께 논의한다.
12:30~13:30	휴식
13:30~17:00	좌장 : 김중헌 교수(고려대)
13:30~15:00	모바일 에지 네트워크에서의 심층 강화 학습 응용기술	모바일 에지 네트워크의 대표적인 기술인 에지 컴퓨팅과 무선 캐싱에서 심층 강화학습이 어떻게 활용되는 지에 대해 설명한다. 심층강화학습을활용한에지컴퓨팅과무선캐싱의최신기술 동향을 소개한다.	최민석 교수 (제주대) - 한국과학기술원 (KAIST) 학사, 석사 (2007- 2013) - 한국과학기술원 (KAIST) 박사 (2013-2019) - University of Southern California 박사후연구원 (2019-2020) - 제주대학교 통신공학과 조교수 (2020-현재)
15:00~15:30	휴식
15:30~17:00	Precise Control of 5G/6G Multi-IoT Devices Based on Distributed Reinforcement Learning	본 강의는 우선 On-policy RL의 대표적 알고리즘인 PPO (Proxi- mal Policy Optimization)의 보수적 정책 업데이트(Conservative Policy Iteration)에 관한 기본 원리 및 실용적 관점에서의 구현/활 용 방법을 알아보고, 학습 속도 가속화를 위한 RL의 분산화(Dis- tribution) 및 연합화(Federation) 관련 기술을 소개한 뒤, 5G/6G URLLC 응용으로서 Multiple IoT Devices 정밀 제어를 위하여 분 산 및 연합 강화학습을 접목하고 응용하는 방법에 대하여 살펴본다.	한연희 교수 (한국기술교육대) - 한국기술교육대학교 교수 (2006-현재) - 한국정보통신기술협회(TTA) ICT 국제 표준화 전문가 (2006-현재) - State University of New York, Dept. of Computer Science, Visiting Professor (2013-2014) - 삼성종합기술원 책임연구원 (2002-2006) - 고려대학교 컴퓨터학과 이학석사/박사 (1998/2002) - 고려대학교 수학과 학사 (1996)